/
Автор: Халил Х.К.
Теги: общая механика механика твердых и жидких тел механика математика динамика дифференциальные уравнения нелинейные системы
ISBN: 978-5-93972-724-2
Год: 2009
Текст
Nonlinear Systems
Third Edition
HASSAN K. KHALIL
Department of Electrical and Computer Engineering
Michigan State University
Prentice
Hall
PRENTICE HALL
Upper Saddle River, New Jersey 07458
Χ. Κ. Халил
Нелинейные системы
Издание третье
Перевод с английского
И. А. Макарова
Под редакцией
А. Л. Фрадкова
R&C
Dynamics
Москва • Ижевск
2009
УДК 531
ББК 22.236
Х172
Издание осуществлено при финансовой поддержке Российского
фонда фундаментальных исследований по проекту No07-08 -07001.
Халил X. К.
Нелинейные системы. —
М.-Ижевск: НИЦ «Регулярная и хаотическая динами
ка», Институт компьютерных исследований, 2009. — 832 с.
В книге дано мастерское изложение основных разделов теории нелинейных систем
управления на основе идей устойчивости, функций Ляпунова, усреднения, теории воз
мущений. Ясно и компактно представлены новые области, сложившиеся в последние 10
лет, такие, как управление на основе пассивности, теория устойчивости по «входу-со
стоянию» и «входу-выходу», интегральное управление, бэкстеппинг (обход интегратора),
нелинейные наблюдатели с большим коэффициентом усиления, синтез робастных нели
нейных систем. Книга заслужила признание и в качестве справочного руководства по
современной теории управления, являясь одним из наиболее цитируемых в мире текстов
по нелинейным системам. Много поучительного материала найдут в ней как новички,
так и специалисты в области нелинейной динамики. От читателя требуется знакомство
с математическим анализом, дифференциальными уравнениями и теорией матриц в объ
еме вузовских курсов, а также знание основных понятий теории линейных систем.
Книга будет полезна всем, желающим глубоко и систематически ознакомится как
с основами теории нелинейных систем, так и с ее новейшими достижениями.
ISBN 978-5-93972-724-2
ББК 22.236
Authorized translation from the English language edition, entitled NONLINEAR SYSTEMS, 3
rd
Edition,
ISBN 0130673897, by KHALIL, HASSAN K., published by Pearson Education, Inc, publishing as
Prentice Hall, © 2002, 1996 by Prentice Hall Prentice-Hall, Inc. Upper Saddle River, NJ 07458.
All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means,
electronic or mechanical, including photocopying, recording or by any information storage retrieval
system, without permission from Pearson Education, Inc. RUSSIAN language edition published by
Izhevsk Institute of Computer Science (IICS), © 2009.
Перевод оригинального англоязычного издания под названием NONLINEAR SYSTEMS, 3
rd
Edition,
KHALIL, HASSAN K., ISBN 0130673897, опубликованного издательством Prentice Hall (Pearson
Education, Inc) © 2002, 1996 Prentice Hall Prentice-Hall, Upper Saddle River, NJ 07458.
Все права защищены. Ни одна часть этой книги не может быть воспроизведена или быть передана
в какой бы то ни было форме или какими бы то ни было средствами, электронными или механиче
скими, включая фотокопирование, запись на магнитный носитель или при помощи любой другой
обрабатывающей системы хранения информации, если на то нет разрешения издательства Pearson
Education. Русскоязычное издание опубликовано Ижевским Институтом компьютерных исследова
ний (ИИКИ) © 2009.
http://shop.rcd.ru
http://ics.org.ru
Оглавление
Предисловие редактора перевода
х
Предисловие профессора П. В. Кокотовича
xii
Предисловие автора к русскому изданию
xiv
Предисловие
xvi
ГЛАВА 1. Введение
1
1.1. Нелинейные модели и нелинейность
1
1.2. Примеры
5
1.2.1. Уравнения маятника
5
1.2.2. Цепь с туннельным диодом
7
1.2.3. Система «груз-пружина»
9
1.2.4. Генератор с отрицательным сопротивлением
12
1.2.5. Искусственные нейронные сети
14
1.2.6. Адаптивное управление
17
1.2.7. Типовые нелинейности
19
1.3. Упражнения
24
ГЛАВА 2. Системы второго порядка
37
2.1. Качественное поведение линейных систем
39
2.2. Множественные точки равновесия
48
2.3. Качественное поведение в окрестности точек равновесия
52
2.4. Предельные циклы
57
2.5. Численное построение фазовых портретов
62
2.6. Существование периодических орбит
64
2.7. Бифуркации
72
2.8. Упражнения
80
ГЛАВА 3. Фундаментальные свойства
89
3.1. Существование и единственность
90
3.2. Непрерывная зависимость решения от начальных данных и пара
метров
98
3.3. Дифференцируемость решений и уравнения чувствительности . . 102
3.4. Принцип сравнения
105
3.5. Упражнения
108
vi
ОГЛАВЛЕНИЕ
ГЛАВА 4. Устойчивость по Ляпунову
114
4.1. Автономные системы
115
4.2. Принцип инвариантности
131
4.3. Линейные системы и линеаризация
139
4.4. Функции сравнения
151
4.5. Неавтономные системы
154
4.6. Линейные, зависящие от времени системы и линеаризация
165
4.7. Обратные теоремы Ляпунова
171
4.8. Ограниченность и предельная ограниченность
178
4.9. Устойчивость систем по входу-состоянию
184
4.10. Упражнения
191
ГЛАВА 5. Устойчивость в терминах «вход-выход»
205
5.1.
L-устойчивость
205
5.2. L-устойчивость моделей состояния
212
5.3. L2-коэффициент усиления
220
5.4. Системы с обратной связью: теорема о малом коэффициенте уси
ления
229
5.5. Упражнения
234
ГЛАВА 6. Пассивность
240
6.1. Функции без памяти
241
6.2. Модели состояния
247
6.3. Положительно вещественные передаточные функции
251
6.4. L2-устойчивость и устойчивость по Ляпунову
256
6.5. Системы с обратной связью: теоремы о пассивности
260
6.6. Упражнения
274
ГЛАВА 7. Частотный анализ систем с обратной связью
279
7.1. Абсолютная устойчивость
280
7.1.1. Круговой критерий
281
7.1.2. Критерий Попова
292
7.2. Метод описывающей функции
297
7.3. Упражнения
314
ГЛАВА 8. Устойчивость систем
321
8.1. Теорема о центральном многообразии
321
8.2. Область притяжения
331
8.3. Теоремы инвариантности
342
8.4. Устойчивость периодических решений
349
8.5. Упражнения
354
ОГЛАВЛЕНИЕ
vii
ГЛАВА 9. Устойчивость возмущенных систем
360
9.1. Возмущение, исчезающее в начале координат
361
9.2. Возмущения, не исчезающие в начале координат
368
9.3. Метод сравнения
372
9.4. Непрерывность решений на бесконечном интервале
378
9.5. Взаимосвязанные системы
381
9.6. Медленно меняющиеся системы
388
9.7. Упражнения
396
ГЛАВА 10. Теория возмущений и усреднение
404
10.1. Метод возмущений
405
10.2. Метод возмущений на бесконечном интервале времени
417
10.3. Периодические возмущения автономных систем
422
10.4. Метод усреднения
426
10.5. Осцилляторы второго порядка со слабой нелинейностью
436
10.6. Метод усреднения для общего случая
439
10.7. Упражнения
444
ГЛАВА 11. Сингулярные возмущения
448
11.1. Стандартная форма модели с сингулярными возмущениями .... 449
11.2. Временные свойства стандартной модели
456
11.3. Сингулярные возмущения на бесконечном интервале времени . . . 465
11.4. Медленные и быстрые многообразия
470
11.5. Анализ устойчивости
476
11.6. Упражнения
488
ГЛАВА 12. Управление с обратной связью
497
12.1. Задача управления
497
12.2. Стабилизация посредством линеаризации
505
12.3. Интегральное управление
508
12.4. Построение интегрального управления с использованием линеа
ризации
511
12.5. Метод настройки обратной связи
515
12.6. Упражнения
531
ГЛАВА 13. Линеаризация обратной связью
538
13.1. Мотивация
538
13.2. Линеаризация по входу-выходу
543
13.3. Линеаризация по всем переменным состояния
556
13.4. Управление с обратной связью по состоянию
566
13.4.1. Стабилизация
566
13.4.2. Задача слежения
577
13.5. Упражнения
581
viii
ОГЛАВЛЕНИЕ
ГЛАВА 14. Нелинейные законы управления
589
14.1. Управление в скользящем режиме
591
14.1.1. Мотивирующий пример
591
14.1.2. Стабилизация
602
14.1.3. Слежение
612
14.1.4. Интегральное управление
616
14.2. Ляпуновский синтез закона управления
620
14.2.1. Задача стабилизации
620
14.2.2. Нелинейное демпфирование
631
14.3. Бэкстеппинг
632
14.4. Управление на основе пассивности
648
14.5. Наблюдатели с сильной обратной связью
655
14.5.1. Мотивирующий пример
657
14.5.2. Стабилизация
666
14.5.3. Интегральное управление
670
14.6. Упражнения
673
ПРИЛОЖЕНИЕ А. Математический обзор
697
ПРИЛОЖЕНИЕ В. Сжимающее отображение
704
ПРИЛОЖЕНИЕ С. Доказательства
708
С.1. Доказательства теорем 3.1 и 3.2
708
С.2. Доказательство леммы 3.4
710
С.З. Доказательство леммы 4.1
712
С.4. Доказательство леммы 4.3
713
С.5. Доказательство леммы 4.4
714
С.6. Доказательство леммы 4.5
715
С.7. Доказательство теоремы 4.16
717
С.8. Доказательство теоремы 4.17
720
С.9. Доказательство теоремы 4.18
727
С.10. Доказательство теоремы 5.4
728
С.11. Доказательство леммы 6.1
729
С.12. Доказательство леммы 6.2
732
С.13. Доказательство леммы 7.1
737
С.14. Доказательство теоремы 7.4
741
С.15. Доказательство теорем 8.1 и 8.3
743
С.16. Доказательство леммы 8.1
753
С. 17. Доказательство теоремы 11.1
754
С.18. Доказательство теоремы 11.2
761
С.19. Доказательство теоремы 12.1
763
С.20. Доказательство теоремы 12.2
764
С.21. Доказательство теоремы 13.1
765
С.22. Доказательство теоремы 13.2
767
С.23. Доказательство теоремы 14.6
768
ОГЛАВЛЕНИЕ
ix
Библиографические комментарии
774
Список литературы
778
Дополнение. Обзор работ по нелинейным системам
790
Дополнительный список литературы
796
Условные обозначения
803
Предметный указатель
805
Предисловие редактора перевода
Книга профессора электротехники университета штата Мичиган в Ист-
Лэнсинге, США, Хассана Халила заслужила мировое признание как один из луч
ших трактатов по теории нелинейных систем для инженеров. В книге дано ма
стерское изложение основных разделов теории нелинейных систем управления,
включая те из них, которые сложились лишь в последние 15-20 лет. Поэтому она
может также использоваться инженерами и исследователями для самообразова
ния и в качестве справочного руководства по современной теории управления.
Теория нелинейных систем — это область, в которой отечественные науч
ные школы традиционно были сильны. Достаточно вспомнить первую в мире
монографию по нелинейным системам А. И. Лурье, вышедшую в 1951 году. Фун
даментальные результаты А.М.Ляпунова и А.А.Андронова, Л.С.Понтрягина
и А.А.Фельдбаума, А.И.Лурье и В.А.Якубовича, Я.З.Цыпкина, Н.Н.Красов-
ского, Е. П. Попова и других составляют основу теоретического аппарата и ме
тодов расчета не только в теории управления, но и в более широкой области —
теории систем. Среди учебников, содержащих серьезное изложение теории нели
нейных систем продолжают пользоваться успехом классические книги А. А. Во
ронова, А. А. Первозванского, Е. П. Попова. Да и в последние годы выпущен це
лый ряд монографий и учебных пособий, например серия «Анализ и синтез
нелинейных систем», издаваемая Санкт-Петербургским издательским комплек
сом «Наука», серии под редакцией С.В.Емельянова, В.М.Матросова и др. Ка
залось бы, нет необходимости обращаться к иностранным источникам. Однако
книга X. Халила заслуживает особого отношения. Кроме доступного и в то же
время серьезного изложения основ теории, пронизанного идеями устойчивости,
функций Ляпунова, усреднения, теории возмущений, российского читателя на
верняка заинтересует ясное и компактное изложение новых областей, таких как
управление на основе пассивности, теория устойчивости по «входу-состоянию»
и «входу-выходу», интегральное управление, бэкстеппинг (обход интегратора),
нелинейные наблюдатели с большим коэффициентом усиления, синтез робаст-
ных нелинейных систем. Специалистов привлечет изложение теории устойчиво
сти на языке калибровочных функций классов /С, /СС, /Соо — удобного аппарата
для работы с открытыми системами. Книга содержит много полезных лемм, оце
нок и вспомогательных неравенств. Изучение их доказательств позволяет чита
телю овладеть большинством математических приемов, используемых в совре
менной теории систем. В то же время в книге много поучительного материала
и для специалистов смежных наук: физики, химии, прикладной математики.
Анализ многочисленных ссылок на книгу X. Халила в международных жур
налах и трудах конференций (а она, по данным Google Scholar, входит в тройку
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА
XI
наиболее цитируемых в мире книг по теории управления) показывает, что книга
активно используется зарубежными инженерами и исследователями и при под
готовке аспирантов в зарубежных университетах. В то же время в России ее
материал еще мало знаком не только аспирантам, но порой и профессорам. Не
секрет, что в последние годы, в связи с трудностями доступа к «свежей» научной
информации на русском языке, наметилась тенденция к изоляции отечественной
науки. Предлагаемая к переводу книга может способствовать перелому опасной
тенденции, послужить развитию научной интеграции и сохранению конкуренто
способности отечественных специалистов, как молодых, так и зрелых.
Для понимания книги требуются знания в области математического анали
за, дифференциальных уравнений и теории матриц на уровне студентов старших
курсов университетов, а также знание теории линейных систем на уровне ос
новных понятий: «состояние», «передаточная функция», «переходная матрица
состояний». Вопросы, требующие более высокого уровня подготовки, а также
некоторые вспомогательные математические результаты и доказательства выне
сены в приложение. Третье издание было переработано с целью сделать кни
гу доступной для более широкого круга читателей. Наличие большого числа
упражнений (только в 3-е издание добавлено более 170 упражнений!), автор
ского и предметного указателя делает книгу полезной и как справочник, и как
пособие для самообразования. Книга будет полезна всем, желающим глубоко
и систематически ознакомиться как с основами теории нелинейных систем, так
и с ее новейшими достижениями. Книгу сопровождают предисловие признан
ного мэтра теории нелинейных систем П.В.Кокотовича и предисловие автора,
специально написанные для русского издания, а также написанное редактором
перевода дополнение — библиографический обзор некоторых работ последних
лет, не нашедших отражения в книге, прежде всего, отечественных работ.
Александр Фрадков
Санкт-Петербург, сентябрь 2008 г.
Предисловие профессора П. В. Кокотовича
Для меня очень приятно разделить с российскими читателями свое мнение
об этой отличной книге. Я использовал ее для подготовки аспирантов по нели
нейным системам еще в 1990 и 1991 годах, когда она была еще в состоянии
растущей рукописи. С тех пор эта книга помогала многим поколениям моих сту
дентов, которые называли ее «самым дружественным» учебником. Им нравился
ясный стиль доказательств большинства теорем и то, что физические примеры
обогащали их интуицию. Благодаря педагогическому мастерству автора стиль
изложения, сохраняя математическую строгость, делает книгу доступной студен
там с различной подготовкой.
Кроме моего личного мнения о книге, есть много объективных критериев,
показывающих, что она является одним из лучших текстов для специалистов
в области систем управления. За 16 лет многие тысячи экземпляров книги ис
пользовались студентами ведущих американских и европейских университетов.
Число продаж каждый год продолжает расти, что говорит о том, что лишь немно
гие из проданных копий попадают к букинистам. А это показывает, что владель
цы хранят книгу, пользуясь ею как справочником. И действительно, многие из
недавно опубликованных научных статей в журналах и в трудах конференций
цитируют эту книгу, обращаясь и к хорошо известным результатам, и к де
талям их доказательств. Книга достигла статуса «стандартного справочника»,
и ее автор уже получил две престижнейшие награды. В 2000 году профессор
Халил получил премию имени Дж. Рагаззини в области образования от аме
риканского Совета по автоматическому управлению (ААСС), представляющему
несколько инженерных сообществ. В 2002 году книга была награждена премией
за лучший учебник Международной федерацией по автоматическому управле
нию (ИФАК).
Те, кто следят за новейшими достижениями в нелинейной теории управле
ния, знакомы с такими новыми методами синтеза, как линеаризация обратной
связью и бэкстеппинг, получившими известность в 1990-х годах. Содержание
книги, меняясь, отразило эти достижения. Ее первое издание в 1992 году концен
трировалось вокруг вопросов нелинейного анализа, в ее третьем издании 2002
года целых четыре последние главы посвящены вопросам синтеза. Другой ас
пект полноты этой книги, на который, конечно же, обратят внимание российские
читатели, — то, что она существенно опирается на фундаментальные результаты
российских научных школ, как классических, так и современных, от Ляпунова,
Четаева и Тихонова до Лурье, Красовского, Зубова, Якубовича и многих других.
ПРЕДИСЛОВИЕ ПРОФЕССОРА П. В. КОКОТОВИЧА
xiii
Перевод книги как бы заново представляет российским читателям их богатое
научное наследие.
Петар Кокотович,
Профессор-исследователь
Факультета электротехники и вычислительной техники
Университета Калифорнии в Санта-Барбаре, США
Предисловие автора к русскому изданию
Мне очень приятно видеть русский перевод моей книги «Нелинейные си
стемы» и я благодарен российским ученым, выполнившим эту трудную работу.
Для меня лучшая награда за работу над книгой — знание того, что многие кол
леги и студенты использовали ее и нашли полезной. Это чувство еще усилилось,
когда я узнал, что книга станет доступна российскому научному сообществу.
Я не являюсь российским ученым и, более того, со смущением должен при
знать, что до сих пор не побывал в России, однако я считаю себя в определен
ной мере продуктом российской научной школы. Одной из основных и наиболее
очевидных причин этого является тот факт, что результаты российских ученых
оказали основополагающее влияние на теорию, представленную в книге. Дру
гая, менее очевидная причина, заключается в том, что мой научный наставник
и руководитель моей работы над докторской диссертацией Петар В. Кокотович,
получивший образование в России, познакомил меня с наиболее важными рабо
тами Ляпунова и других российских ученых во время моей учебы в аспирантуре
университета Иллинойса осенью 1975 года.
Хассан Халил
Посвящается моему учителю Петару В. Кокотовичу
и моей семье
Амине, Мухаммеду, Омару, Юсуфу и Сюзане
Предисловие
Эта книга посвящена управлению нелинейными системами и предназначена
для студентов первого курса аспирантуры. Она может также использоваться для
самообразования и в качестве справочного руководства для инженеров и специ
алистов в области прикладной математики. Эта книга стала естественным ре
зультатом моего опыта преподавания курса теории нелинейных систем в универ
ситете штата Мичиган (Ист-Лансинг). Для понимания книги необходимы знания
основ электротехники, машиностроения и прикладной математики. Первоначаль
ным источником этого курса, стали книги Антсаклиса и Мишела [9], Чена [35],
Кайлата [94] и Руса [158]. Поскольку предполагалось знание основ линейной тео
рии систем, я не вводил заново понятие «состояния системы» и свободно исполь
зовал термины «передаточная функция», «переходная матрица» и другие концеп
ции линейной теории. Математической основой книги являются знания в области
математического анализа, дифференциальных уравнений и теории матриц, кото
рыми должны обладать студенты последнего курса обучения по специальностям
прикладной и высшей математики. В приложении приведены некоторые матема
тические результаты, которые могут понадобиться при чтении этой книги.
Текст написан таким образом, чтобы уровень его математической сложно
сти возрастал от главы к главе. Поэтому вторая глава написана на элементарном
уровне. В действительности эта глава может служить основой для преподава
ния основ рассматриваемого предмета на средних или даже на младших курсах.
Это стало также причиной того, что я разделил изложение теории устойчиво
сти Ляпунова на две части. В разделах 4.1-4.3 введены понятия устойчивости
по Ляпунову для автономных систем без использования таких технических де
талей, как понятия равномерности, функции класса /С и т. п. В разделах 4.4-4.6
я представил теорию Ляпунова в более общем виде, что позволило рассмотреть
неавтономные системы и более глубокие аспекты теории устойчивости. Уровень
математической сложности, который достигается при прочтении первых четы
рех глав, — это именно тот уровень, который будет необходим студентам для
того, чтобы ознакомиться с последующими главами книги.
Для понимания представленных в приложении доказательств основных ре
зультатов требуется еще более высокий уровень математической подготовки, но
они не предназначены для изучения в условиях аудитории. Эти доказательства
включены в книгу, с одной стороны, для ее полноты и, с другой — для того, что
бы удовлетворить нуждам или желаниям тех студентов, которые хотели бы озна
комиться с ними в целях выполнения исследований в рамках подготовки канди
датской диссертации на тему управления нелинейными системами. Эти студенты
могут продолжить чтение книги до конца, включая приложения, самостоятельно.
Предисловие
XVll
Третье издание было написано с учетом следующих целей:
1) Сделать книгу (особенно ее первые главы) более доступной для студентов
первого курса аспирантуры. В качестве примера изменений, преследующих
эту цель, можно указать на сделанные изменения в изложении главы 3:
весь материал, касающийся математических основ — теорема о сжимаю-
щем отображении и доказательство теоремы о существовании и единствен-
ности, — был вынесен в приложения. Некоторые части книги были перепи-
саны с целью повысить удобочитаемость.
2) Реорганизовать книгу таким образом, чтобы обеспечить более легкое пони-
мание структуры курсов нелинейных систем и управления. Новое издание
книги состоит из четырех частей (см. рисунок ниже). Курс анализа нели-
нейных систем изложен в частях 1, 2 и 3, а курс нелинейного управления —
в частях 1, 2 и 4.
Часть 1
Основы теории
Главы 1-4
Часть 2
Системы с обратной связью
Главы 5-7
Часть 3
Развитие терии
Главы 8-11
Часть 4
Нелинейное управление
с обратной связью
Главы 12-14
3) Обновить содержание книги для того, чтобы представить те результаты и те-
мы, которые доказали в последнее время свою полезность для теории нели-
нейного управления. В третьем издании рассмотрены следующие новые те-
мы: расширенное изложение понятия пассивности и его использование в за-
XV111
ПРЕДИСЛОВИЕ
дачах управления, интегрального управления, скользящих режимов и наблю
дателей с сильной обратной связью. Кроме того, рассмотрены бифуркации
в дифференциальных уравнениях в контексте исследования систем второго
порядка. С технической точки зрения рассмотрены версия Курцвейля об
ратной теоремы Ляпунова, нелокальные результаты в главах 10 и 11, новые
результаты в области интегрального управления и настройки коэффициента
усиления.
4) Обновить упражнения. Было включено более 170 новых упражнений.
Я признателен моим коллегам, студентам и читателям, помогавшим мне при
написании этой книги в ходе плодотворных дискуссий, за их предложения, уточ
нения и конструктивные замечания. Я хотел бы упомянуть в этой связи более
сотни имен, но я боюсь нечаянно упустить какое-нибудь имя. Поэтому я выска
зываю свою огромную благодарность всем вам.
Я благодарен университету штата Мичиган за предоставление условий, ко
торые помогли мне написать эту книгу, и Национальному Научному Фонду США
за поддержку моих исследований в области нелинейного управления с обратной
связью.
Книга была сверстана с использованием LaTeX. Все численные экспери
менты, включая численное решение дифференциальных уравнений, были сдела
ны с использованием пакетов MATLAB и SIMULINK. Рисунки были получены
в MATLAB или набраны с использованием графических средств LaTeX.
Я хотел бы, чтобы книга не содержала ошибок, но я знаю, что этого не
случится. Поэтому я прошу присылать сообщения об этом на мой электронный
адрес
khalil@msu.edu
Обновленный список ошибок может быть найден на сайте
www.egr.msu.edu/~khalil/NonlinearSystems
На этом сайте также может быть найден список изменений по сравнению со
вторым изданием, дополнительные упражнения и другой полезный материал.
Хассан Халил
Ист-Лансинг, Мичиган
ГЛАВА 1
Введение
Когда инженеры анализируют и строят динамические модели для электри
ческих сетей, механических систем, систем управления и других инженерных
систем, им необходимо понимать и глубоко осознавать те средства нелинейно
го анализа, которые они намерены использовать в своей работе. В этой книге
мы предложим некоторые из этих средств. В частности, мы предложим методы
анализа устойчивости для нелинейных систем, сделав акцент на методах Ляпу
нова. Мы уделим специальное внимание задаче устойчивости для нелинейных
систем и рассмотрим ее на основе двух подходов: входа-выхода и пассивности.
Мы предложим средства для обнаружения и анализа «свободных» колебаний,
включая метод описывающей функции
1
(«describing function method»). Мы вве
дем в рассмотрение асимптотические методы теории возмущений, включая мето
ды усреднения и сингулярных возмущений. В заключение мы рассмотрим мето
ды нелинейного управления с обратной связью, включая методы линеаризации,
настройки коэффициента усиления (gain scheduling), интегрального управления,
линеаризации с помощью обратной связи, управления в скользящем режиме,
а также обратный метод Ляпунова построения закона обратной связи, методы
бэкстеппинга или попятного управления (backstepping) и пассивного управления,
и, наконец, будут рассмотрены наблюдатели с сильной обратной связью (high
gain observers).
1.1. Нелинейные модели и нелинейность
Мы будем иметь дело с динамическими системами, которые допускают мо
дель в виде системы из конечного числа обыкновенных дифференциальных урав
нений
#1 = /l(*,3i,...
,Xn»Ui,...,ltp),
£2 = /2(*}Ei,...,a:n,ui,...,tip),
Xn = JnV">^1?····>^ri)^1)···>^pj>
где ±i обозначает производную х\ по времени iHWi,U2,...,Wp- входные пере
менные системы. Будем называть x\,x*i, · · • ,#п переменными состояния систе
мы. В них заложена информация о прошлом динамической системы. Для ком
пактной записи таких систем будем использовать соответствующие векторные
1
В отечественной литературе принят термин «метод гармонического баланса».
— Прим. ред.
перев.
2
ГЛАВА 1
обозначения. Для этого определим
f(t,x,u) =
fi(t,x,u)'
f2(t,x,u)
Vfn(t,X,u)
и перепишем п обыкновенных дифференциальных уравнений в виде одного век
торного дифференциального уравнения размерности п:
х = f(t,x,u).
(1.1)
Будем называть уравнение (1.1) уравнением состояния, вектор х — состоянием
и вектор и — входом. Иногда будет рассматриваться уравнение
y = h(t,x,u),
(1.2)
которое определяет вектор выхода у размерности q с компонентами, представля
ющими специфический интерес при анализе динамической системы (например,
переменные, которые могут быть измерены на физическом уровне, или пере
менные, для которых требуется обеспечить нужное поведение). Будем называть
уравнение (1.2) уравнением выхода, а систему уравнений (1.1), (1.2) — моде
лью пространства-состояния или более просто — моделью состояния. Матема
тические модели конечномерных физических систем не обязательно имеют вид
модели состояния. Однако в большинстве случаев мы можем построить модель
физической системы именно в такой форме благодаря надлежащему выбору пе
ременных состояния. Примеры и упражнения, которые будут приведены ниже,
продемонстрируют универсальность модели состояния.
Большая часть нашей книги посвящена анализу уравнения состояния, в ко
торое вектор входа и явным образом не входит. Такое уравнение называется сво
бодным (free) и имеет следующий вид:
f(t,x).
(1.3)
Рассмотрение свободного уравнения состояния не обязательно предполагает, что
вход системы равен нулю. Это может означать, что вход системы явным образом
задан в виде функции времени и — 7(^)> или в виде функции обратной связи
и = 7(ж)>
иливви
Де
зависящей от времени функции обратной связи и = j(t, x).
Подстановка и = η в (1.1) исключает и и приводит к свободному уравнению
состояния.
В случае когда функция / не зависит явным образом от времени t, уравне
ние (1.3) принимает вид
х-/(х)
(1.4)
1.1. НЕЛИНЕЙНЫЕ МОДЕЛИ и НЕЛИНЕЙНОСТЬ
3
и система будет называться автономной или инвариантной по времени (time
invariant). Поведение автономной системы инвариантно относительно сдвига по
оси времени, поскольку замена переменной времени t на t — а не приводит к из
менению правой части уравнения состояния. Если система не является инвари
антной по времени, она называется неавтономной или зависящей от времени
(time varying).
При рассмотрении уравнения состояния важным понятием является понятие
положения равновесия. Точка х = х* в пространстве состояния называется со
стоянием (положением) равновесия уравнения (1.3), если в процессе эволюции
системы ее состояние остается неизменным х* во все будущие моменты време
ни. В случае автономных систем (1.4) состояниями равновесия являются корни
уравнения
f(x) = 0.
Точка равновесия может быть изолированной, т. е. в ее окрестности отсутствуют
другие точки равновесия или же имеется континуум точек равновесия.
Для линейных систем модель состояния (1.1)—(1.2) принимает специальный
вид
х = A(t)x + B{t)u,
у = C(t)x + D(t)u.
Мы предполагаем, что читатель знаком с мощными средствами анализа линей
ных систем, основанных на принципе суперпозиции. Поскольку мы переходим от
рассмотрения линейных систем к рассмотрению нелинейных систем, мы столк
немся с более сложной ситуацией; когда принцип суперпозиции не выполняется
и средства анализа будут использовать более сложные математические концеп
ции. Поскольку мощные средства анализа линейных систем известны, первым
шагом анализа нелинейной системы обычно является ее линеаризация (если это
возможно) в окрестности некоторой заданной точки и анализ полученной ли
нейной системы. Этот подход признан весьма полезным в инженерной практике.
Несомненно, нам следует использовать подход линеаризации для того, чтобы
узнать как можно больше о поведении нелинейной системы. Однако этот подход
не является достаточным для полного анализа системы, и возникает необходи
мость в разработке средств анализа исходной нелинейной системы. Имеют место
два ограничения, накладываемых подходом линеаризации. Во-первых, поскольку
линеаризация в окрестности заданной точки является лишь приближенным опи
санием поведения системы в этой окрестности, этот подход может предсказать
лишь «локальное» поведение исходной нелинейной системы в окрестности этой
точки: нелокальное поведение системы вне этой окрестности и тем более — «гло
бальное» поведение на всем пространстве состояний не может быть предсказано
в рамках этого подхода. Во-вторых, динамика нелинейной системы существен
но более богата, чем динамика линейной системы. Имеют место «существенно
нелинейные явления», проявляющиеся только при наличии нелинейности и ко
торые соответственно не могут быть описаны линейной моделью. Примерами
таких существенно нелинейных явлений могут служить:
4
ГЛАВА 1
• Конечное время ухода решения на бесконечность. Состояние неустойчивой
линейной системы уходит на бесконечность по мере того, как время при
ближается к бесконечности; состояние нелинейной системы может уйти на
бесконечность за конечный промежуток времени.
• Мноэюественность состояний равновесия. Линейная система может иметь
только одну изолированную точку равновесия и, следовательно, она может
иметь только одну устойчивую точку притяжения для всех начальных состо
яний системы. Нелинейная система может иметь более одной изолирован
ной точки равновесия. Состояния могут притягиваться к одной из несколь
ких точек притяжения, в зависимости от начального состояния системы.
• Предельные циклы. Для колебания линейной инвариантной по времени си
стемы необходимо, чтобы она имела пару собственных значений на мнимой
оси. Это условие не является робастным и почти всегда не может быть вы
полнено при наличии возмущений. Даже в случае его выполнения ампли
туда колебаний будет зависеть от начального состояния. В реальных усло
виях устойчивое колебание может быть продемонстрировано только нели
нейной системой. Существуют нелинейные системы, которые могут коле
баться с фиксированной амплитудой и частотой вне зависимости от началь
ных состояний этих систем. Этот тип колебаний известен как предельный
цикл.
• Субгармонические, гармонические и почти периодичные колебания. Устой
чивая линейная система с периодическим входом имеет на выходе сигнал,
имеющий ту же частоту. Нелинейная система с периодическим возбуждени
ем может колебаться с частотами, кратными частоте входа. Эти системы мо
гут демонстрировать даже почти-периодические колебания: примером таких
колебаний может служить сумма двух периодических колебаний с некратны
ми частотами.
• Хаос. Нелинейная система может иметь более сложное устойчивое пове
дение, чем простое положение равновесия, периодическое колебание или
почти-периодическое колебание. Такое поведение обычно называют хаосом.
Некоторые из этих хаотических движений демонстрируют случайный ха
рактер, несмотря на то что сама система имеет сугубо детерминистическую
природу.
• Мноэюественность реэюимов поведения. Нередко одна и та же нелинейная
система может продемонстрировать два или более режима поведения. Сво
бодная система может иметь более чем один предельный цикл. Управляемая
система с периодическим возбуждением может продемонстрировать гармо
ническое, субгармоническое или более сложное устойчивое поведение в за
висимости от амплитуды и частоты входа. Она может продемонстрировать
даже скачок режима поведения при гладком изменении амплитуды и частоты
возбуждения.
В этой книге мы рассмотрим только первые три явления из вышеперечис
ленных
2
.
Множественные положения равновесия и конечные циклы будут рас
смотрены в следующей главе при рассмотрении автономных систем второго по
рядка, явление конечного времени ухода решения на бесконечность будет рас
смотрено в главе 5.
1.2. Примеры
1.2.1. Уравнения маятника
Рассмотрим изображенный на рис. 1.1 простой маятник, где I — длина стерж
ня и т — масса груза. Предположим, что стержень абсолютно твердый и имеет
нулевую массу. Пусть θ — угол отклонения стержня от вертикальной оси, про
ходящей через точку подвеса. Маятник свободно качается в вертикальной плос
кости, и груз маятника совершает круговое движение с радиусом I. Для того
чтобы записать уравнение движения маятника, определим силы, действующие
на маятник. Имеется сила гравитации, которая равна тд, где д — гравитацион
ная постоянная. Имеется также сила трения, препятствующая движению, которая
предполагается пропорциональной с коэффициентом к скорости вращения. Ис
пользуя второй закон Ньютона, мы можем получить уравнение движения для
продольного движения:
τηΙΘ= —тдsinθ—kW.
Рис. 1.1. Маятник
Запись этого уравнения для продольного движения имеет то преимущество,
что сила растяжения стержня, действующая ортогонально, не входит в это урав
нение. Мы могли бы получить это уравнение и при записи уравнения для момен
тов относительно точки подвеса. Для того чтобы получить уравнение состояния
для маятника, выберем в качестве переменных состояния х\ = θ и х2 = Θ. Тогда
уравнения состояния могут быть записаны в следующем виде:
±1=#2,
(1.5)
д
L·
х2=-уsinxi-—х2.
(1.6)
2
Вынужденные колебания, хаос, бифуркации и другие важные темы рассмотрены в [70], [74],
[187] и [207].
6
ГЛАВА 1
Для того чтобы найти точки равновесия, положим х\ — ±2 = 0 и решим
относительно х\ и Х2 систему уравнений
9
к
0 = -ysinxi -
—
х2.
Точки равновесия расположены в (ηπ, 0), η = 0, ±1, ±2,
С физической точ
ки зрения маятник имеет только два положения равновесия, соответствующих
значениям вектора состояния (0,0) и (π,0). Другие положения равновесия пред
ставляют собой повторения этих двух положений при нескольких полных обо
ротах маятника вокруг точки подвеса, прежде чем он остановится в одном из
этих двух положений равновесия. Например, если маятник совершил га пол
ных оборотов на 360 градусов, прежде чем он остановился в нижнем положении
равновесия, то с математической точки зрения мы можем сказать, что маятник
достиг положения равновесия (2τηπ,0). В нашем исследовании мы ограничим
ся рассмотрением только двух «нетривиальных» положений равновесия: (0,0)
и (π, 0). С физической точки зрения эти два положения существенно отличаются
друг от друга. В то время как маятник может легко установиться в нижнем по
ложении равновесия (0,0), он тем не менее не сможет удерживаться в верхнем
положении равновесия (π,0), поскольку малое возмущение выведет его из это
го состояния. Отличие этих двух состояний заключается в различных свойствах
устойчивости, присущих этим состояниям. Этот вопрос будет более подробно
рассмотрен в последующем.
Иногда оказывается полезным рассмотреть уравнения маятника, в которых
силы трения не учитываются, т. е. к = 0. В этом случае система имеет вид
±1=х2,
(1.7)
а
Х2 = —у sinx\
(1.8)
и является консервативной в том смысле, что, если маятнику сообщено началь
ное ускорение, он продолжит бесконечные колебания с недиссипативным обме
ном энергии между кинетической и потенциальной энергиями. Это, разумеется,
нереалистично, но позволяет рассмотреть некоторые аспекты поведения маятни
ка. Использование этих уравнений позволяет также найти приближенные реше
ния уравнений движения маятника для малого коэффициента к. Другую версию
уравнений движения маятника можно получить, если приложить вращающий
момент Т. Этот момент может рассматриваться как управляющее воздействие
в системе
XI=Х2,
(1.9)
Х2= -f sinai - ^Х2 + -\Т.
(1.10)
*
гаг
1.2. ПРИМЕРЫ
7
Следует отметить, что поведение некоторых не связанных непосредствен
ным образом с маятником физических систем может моделироваться с исполь
зованием математической модели, похожей на уравнения маятника. Примера
ми таких систем могут служить модель синхронного генератора, соединенно
го с бесконечной шиной (упражнение 1.8), модель джозефсоновского перехода
(Josephson junction) линии передачи (transition line) (упражнение 1.9) и модель
контура фазовой синхронизации (phase lock loop) (упражнение 1.11). Таким об
разом, уравнения маятника имеют важное практическое значение.
1.2.2. Цепь с туннельным диодом
©
+v.
-
R
Я===
+
vc^pC ΣΖνΗ
О
1 υ,V
0.5
(а)
(Ъ)
Рис. 1.2. (а) Цепь с туннельным диодом; (Ь) диаграмма VR — IR для диода
Рассмотрим показанную на рис 1.2
3
цепь с туннельным диодом, который ха
рактеризуется значением IR = 1I(VR). Энергонакопительными элементами в этой
цепи являются конденсатор С и катушка индуктивности L. Предполагая, что эти
величины имеют линейные характеристики и не зависят от времени, мы можем
записать уравнения цепи в следующем виде:
1С
„dvc
diL
'
dt'
где г и ν — сила тока и напряжение в элементе, нижний индекс указывает на соот
ветствующий элемент. Для того чтобы записать модель состояния этой системы,
выберем х\ — vc и хч — %L В качестве переменных состояния и и = Ε — в каче
стве управляющего воздействия. Для того чтобы выписать уравнение состояния
для xi, нам необходимо представить %с в виде функции переменных состояния
и входа и. Используя закон Кирхгофа, мы можем получить следующее уравнение
(сумма всех токов, исходящих из узла ©, равна нулю):
ic +iR-iL =0.
Этот рисунок, а также рисунки 1.3 и 1.7 взяты из [39].
8
ГЛАВА 1
Тогда
гс = -h{x\) +x2.
Аналогично нам необходимо представить VL В виде функции переменных со
стояния и входа и. Используя закон Кирхгофа, мы можем получить следующее
уравнение (сумма напряжений на всех элементах в левой цепи равна нулю):
Следовательно:
vc - Ε+RiL+vL=0.
VL= —x\—R%2+ u.
Таким образом, мы можем представить модель состояния цепи в следующем
виде:
Xl = -Q[-KXI)
+ X2]i
ir>
°R
1.2
1
0.8
0.6
0.4
0.2
0
X2=
^4
TQT*
J[—XI
-
Rx2 + u]-
"4.
1
\
^
/
\^
"^
/
\\ "-J
\^^
/
^
\
^^^
/
"^
\
^(&
"'
1
1^s
(1.11)
(1.12)
0.5
Рис. 1.З. Точки равновесия в цепи с туннельным диодом
Точки равновесия системы можно определить, полагая в этих уравнениях ±\ =
= ±2 = 0 и решая относительно х\ и х2 систему уравнений
0= -h{xi) + х2,
0= —х\—Rx2+и.
Легко видеть, что положения равновесия соответствуют корням уравнения
Из рисунка 1.3 видно, что для определенных значений Ε и R это уравнение
имеет три изолированных корня, соответствующих трем изолированным точкам
равновесия системы. Например, если мы увеличиваем Е9 фиксируя некоторое
1.2 . ПРИМЕРЫ
9
значение R, мы достигнем точки, выше которой расположена только точка (Эз·
С другой стороны, если мы уменьшаем Е, фиксируя некоторое заданное зна
чение R, мы приходим в точку Qi9 становящуюся единственным положением
равновесия. Рассмотрим ситуацию, когда существует несколько точек равнове
сия. В какой из точек равновесия будет находиться экспериментальная система?
Ответ на этот вопрос зависит от свойств устойчивости точек равновесия. Мы вер
немся к рассмотрению этого примера в главе 2 и получим ответ на этот вопрос.
1.2.3. Система «груз-пружина»
Изображенная на рис. 1.4 механическая система «груз-пружина» представ
ляет собой груз массой га, скользящий по горизонтальной поверхности и соеди
ненный с вертикальной поверхностью пружиной. Груз подвергается воздействию
внешней силы F. Обозначим через у смещение груза относительно некоторого
исходного положения и запишем второй закон Ньютона для движения такой си
стемы:
ту+Ff+Fsp =F,
где Ff — сила трения и Fsp — сила упругости, обусловленная наличием пружины.
Мы будем предполагать, что сила трения является функцией только смещения у,
т.е. Fsp = д(у), и исходное положение выбрано таким образом, что #(0) = 0.
Внешняя сила находится в нашем распоряжении. В зависимости от того, какой
вид имеют F, Ff и д, мы получим различные автономные и неавтономные мо
дели второго порядка.
Рис. 1.4. Механическая система «груз-пружина»
В случае относительно малого смещения сила упругости может быть пред
ставлена в виде линейной функции д(у) = ку, где к — коэффициент упругости.
Для больших смещений сила упругости может зависеть от у нелинейно. Напри
мер, функция
д(у)=к(1- а
2
у2)у, \ау\ < 1
может служить моделью так называемой мягкой пружины, которая характеризу
ется тем, что при увеличении смещения более некоторой величины сила упруго
сти возрастает незначительно. С другой стороны, функция упругости
д{у)=fc(l+ а
2
у2)у
10
ГЛАВА 1
соответствует так называемой жесткой пружине, которая характеризуется тем,
что при увеличении смещения более некоторой величины сила упругости значи
тельно возрастает.
Сила трения Ff может иметь компоненты, соответствующие трению по
коя, сухому и вязкому трению. Когда груз находится в состоянии покоя, на него
действует сила статического трения FS9 направленная параллельно поверхности
и ограниченная величинами ±μ8τηρ, где 0 < μ8 < 1 — коэффициент трения
покоя. Эта сила принимает различные значения в обозначенных выше пределах
и удерживает груз в состоянии покоя. Для того чтобы возникло движение груза,
необходимо приложить некоторую силу для преодоления силы трения покоя. При
отсутствии внешней силы F = 0 сила трения покоя компенсируется силой упру
гости пружины и система находится в положении равновесия \д(у)\ < μδ'^9-
Как только движение началось, сила трения, действующая в противоположном
движению направлении, может быть промоделирована как функция скорости
скольжения ν = у. Сила трения вследствие наличия сухого трения Fc имеет
постоянную по модулю величину μ^τη*?, где μ& — коэффициент кинетического
трения, т. е.
F = 1~μ}ςΤη9 при
^
<0;
Ιμ\ςτη9приν>0.
Если груз движется в вязкой среде (воздухе или масле), то возникает сила вязкого
трения. Эта сила обычно моделируется нелинейной функцией скорости движе
ния, т.е. Fv — h(v), где h(0) = 0. Для малых скоростей мы можем положить
Fv = cv. На рис. 1.5(a) и (Ь) приведены примеры моделей сухого трения и су
хого трения при линейном вязком трении соответственно. На рис. 1.5(b) показан
пример модели, в которой трение покоя больше сухого трения, а на рис. 1.5(d) —
пример похожей ситуации, но с силой, уменьшающейся непрерывно при увели
чении скорости (эффект Страйбека (Stribeck)).
Комбинация жесткой пружины, линейного вязкого трения и периодической
внешней силы F = Acosut приводит к рассмотрению уравнения Дуффинга
(Duffing)
ту+су+ky+ka
2
ys
= A coso;i,
(1-13)
которое является классическим примером при изучении периодического возбуж
дения нелинейной системы.
Комбинация линейной модели пружины, трения покоя, сухого трения, ли
нейного вязкого трения и нулевой внешней силы приводит к рассмотрению сле
дующего уравнения:
ту +ку+су+7/(у,у)=0,
где
{ μkmg sign(y) при \у\ > 0;
-ку
приу =0 и \у\^ μ8τηρ/&,
-μ8ηηρ sign(y) при у = 0 и |у| > μsmg/k.
(a)
A
(b)
(c)
(d)
Рис. 1.5. Примеры моделей трения: (а) сухое трение; (Ь) сухое трение при линейном
вязком трении; (с) статическое, сухое и линейное вязкое трение; (d) статическое, сухое
и линейное вязкое трение — эффект Страйбека
Значение г)(у,у) при у — О и \у\ < μsmg/k может быть получено из условия
равновесия у — у = 0. Выбор х\ — у и х2 = у приводит к модели состояния
XI=Х2,
Х2
т
XI
т
2- ^(xi,x2).
(1.14)
(1.15)
Отметим две особенности этой модели. Во-первых, она имеет не изолированные
положения равновесия, а целое устойчивое множество положений равновесия.
Во-вторых, правая часть уравнения является разрывной функцией переменных
состояния. Наличие разрыва обусловлено предположением о линейности моде
ли силы трения. Естественно было бы ожидать с физической точки зрения, что
сила трения переходит из режима покоя в скользящий режим гладким образом,
а не так резко, как в нашей идеализированной модели
4
.
Однако такая разрывная
идеализация модели упрощает задачу анализа. Например, при х2 > 0 мы можем
моделировать поведение системы с использованием линейной модели
±1=Х2,
Х2 = -jfi^i
~
щ%2 ~ μ)*9-
Гладкий переход от режима покоя к скользящему режиму может быть реализован в рамках
динамической модели трения (см., например, [12] и [144]).
12
ГЛАВА 1
Аналогично при х<± > О модель системы может быть представлена в следующем
виде:
Таким образом, в каждой из областей мы можем предсказать поведение системы
с использованием средств анализа линейных систем. Это может служить при
мером так называемого кусочно-линейного анализа, при котором система пред
ставляется в различных областях пространства состояния линейными моделями,
отличающимися друг от друга определенными коэффициентами.
1.2.4. Генератор с отрицательным сопротивлением
а)
'
-С
'*<?
г
\L
'h
+
ν
я
л
е
м
е
н
т
о
т
и
в
л
е
н
Осх
а
о
о
Рис. 1.6. (а) Структурная схема цепи генератора; (Ь) типичная нелинейная характеристи
ка в рабочей точке
На рис. 1.6 показана структурная схема цепи, представляющей важный класс
электронных генераторов (oscillators). Модели катушки индуктивности и конден
сатора предполагаются линейными, не зависящими от времени и пассивными,
т. е. L > О и С > 0. Резистивный элемент представляет собой активную цепь,
характеризующуюся показанной на рисунке вольт-амперной характеристикой г =
= h(v). Функция h(-) удовлетворяет условиям
/i(0) = 0, /i'(0) < 0,
h(v) —> оо при w-xx) и h(v) —•
—ооприν—•
—о о,
где h! — первая производная h{v) по v. Подобная ν—г -характеристика может быть
реализована, например, показанной на рис. 1.7 цепью с двумя туннельными ди
одами с характеристикой, изображенной на рис. 1.2. Используя закон Кирхгофа,
мы можем записать
Ю+*L+г=0.
Тогда
с
л
+
1/V
^
ds+h
^
=
°"
1.2. ПРИМЕРЫ
13
Дифференцируя по t и умножая на L, получаем
+
~~i
=z0.3B
=^0.3 В
I
Рис. 1.7. Цепь с двумя туннельными диодами с отрицательным сопротивлением
Вышеприведенное уравнение может быть записано в виде некоторого хорошо
известного в теории нелинейных систем уравнения. Для этого сделаем замену
переменной времени г = t/y/CL· Тогда производные ν по t и τ будут связаны
следующими соотношениями:
—
= \fCL-
и^
2у
dr
dt
ητα2ν
Обозначая производную ν по τ через υ, мы можем переписать уравнение цепи
в виде
ν+eh'{v)v +υ=0,
где ε = л/ZJC. ЭТО уравнение является специальным случаем уравнения Лъена-
ра (Lienard)
ν+f{v)v + g(v) =0.
(1.16)
При
h(v)= -V+τ:^
3
уравнение цепи принимает вид уравнения Ван дер Поля (van der Pol)
ν—ε(1—ν
2
)ν+г;=0.
(1.17)
Это уравнение, использованное Ван дер Полем для исследования колебаний
в ламповых электронных цепях, является фундаментальным примером из нели
нейной теории колебаний и имеет периодическое решение, являющееся аттрак
тором для всех решений, за исключением нулевого в единственной точке рав
новесия ν = ν = 0. Для того чтобы записать модель состояния цепи, выберем
х\ =νиХ2=v.Тогда
xi=х2,
±2 = -х\ - eh'(xi)x2.
(1.18)
(1.19)
14
ГЛАВА 1
Заметим, что альтернативная модель состояния может быть получена при выбо
ре в качестве переменных состояния напряжения на конденсаторе и силы тока,
проходящего через катушку индуктивности. Обозначая переменные состояния
z\ — i>L и z2 = vc, мы получаем модель состояния вида
dz\
~dt
dz2
dt
\Z2,
-±[Zl + h(z2)].
Поскольку первая модель состояния записана в терминах переменной вре
мени τ = t/y/CL, запишем вторую модель также в терминах т:
У
1
У
Z\ — £^2,
z2 = -e[zi + h(z2)].
(1.20)
(1.21)
Легко видеть, что модели в х- и ^-координатах различны, но тем не менее они
являются эквивалентными представлениями системы. Эквивалентность может
быть установлена, если заметить, что эти модели могут быть получены одна
из другой при помощи замены координат
z = Т{х).
Поскольку мы выбирали координаты х и z исходя из физических соображений,
нам не составит труда найти отображение Т(·). Действительно,
Хг=у=22,
*2 =f =V^lf =J%HL - h(vc)}=ε[-Ζ1 - h(z2)}.
Таким образом,
z=Т(х) =
и обратное отображение имеет вид
x = T-\z)
1.2.5. Искусственные нейронные сети
-h(xi) - (1/е)х2
XI
Z2
-ez\ - eh(z2)
Искусственные нейронные сети, аналогично биологическим структурам,
перспективны для распределенной обработки информации и могут использо
ваться для параллельных вычислений. На рис. 1.8 показана электрическая цепь,
которая реализует одну из моделей нейронной сети, известной как модель Хоп-
филда (Hopfield). Цепь основана на использовании сети соединенных между
1.2 . ПРИМЕРЫ
15
Рис. 1.8. Модель Хопфилда нейронной сети
#(«)
Ун
.
J
и
-Ум
Рис. 1.9. Типичная характеристика вход-выход усилителей в модели Хопфилда
собой усилителей с резистивно-емкостной связью. Характеристика вход-выход
усилителей задается равенством υ% = д%{щ)9 где щ и ν% — входное и выходное
напряжения на г-м усилителе. Функция &(·) : J? —> (—VM, VM) — сигмоидальная
функция с асимптотами —VM И VM (СМ. рис. 1.9).
Эта функция является непрерывно дифференцируемой, нечетной, монотон
но возрастающей и д{(щ) = О, если и только если щ = 0. Примерами таких
функций могут служить следующие:
ft(t4)
= 2^ard*(^), A>0,
И
pAUi
ρ лЧ1%
9%(щ) =
V
M-j^.
Гд^т = УмМХщ), λ>0,
где λ определяет угол наклона дъ(щ) в щ = 0. Такая сигмоидальная вход-выход
ная характеристика может быть реализована с использованием операционных
усилителей. Для каждого усилителя в сети, существует инвертирующий усили
тель с выходом (выходным напряжением) — Vi, что позволяет выбрать знак вы
хода усилителя, соединенного с определенной входной линией сети. Выходы v%
и — Vi обычно обеспечиваются двумя выходными терминалами той же цепи опе
рационного усилителя. Описанную выше пару нелинейных усилителей называют
«нейроном». Цепь содержит также резистивно-емкостный элемент на входе каж
дого усилителя. Емкость С% > 0 и сопротивление pi > 0 представляют собой
16
ГЛАВА 1
совокупные шунтирующую емкость и шунтирующее сопротивление входа г-го
усилителя. Применяя закон Кирхгофа для входного узла г-го усилителя, получа
ем следующее равенство:
Ci
~M =Σ R7.(
±V
>"
Ui)
"h
Ui
+
Ii=
Στ^' • ]ъ
щ+Iu
3
υ
3
где
RiРг2^R
3
J
В этих равенствах Тц — проводимость, ограниченная по модулю значением l/Rij
и имеющая знак, определяемый выбором положительного или отрицательного
выхода j-ro усилителя, li — постоянная сила тока на входе. Функционирование
цепи, состоящей из η усилителей, описывается системой из η дифференциаль
ных уравнений первого порядка. Для того чтобы выписать модель состояния та
кой системы, выберем в качестве переменных состояния Xi—v^ г — 1,2,..., п.
Тогда
*=S
x ui=
ёых
к(ΣΓ<^- i
ui+h
Обозначая
йи
г
\Ui=g-±{xi)
мы можем переписать уравнения состояния в следующем виде
5
:
%г — s~i *Ч.\рЬг)
3
, i = 1,2,...,η.
(1.22)
Заметим, что с учетом сигмойдальности характеристики д%{-) функция h{·) удо
влетворяет неравенству
/ц(ж<)>0, V^G(-VM,VM).
Точками равновесия системы являются корни системы из η уравнений
0=
ΣΤ^^-^Τ^
1
(^)+^, < = 1,2,...,η.
з
Эти точки определяются сигмоидальными характеристиками, линейной рези-
стивной связью и входными токами. Альтернативную модель состояния мы мо
жем получить, выбрав в качестве переменных состояния щ, г = 1,2,..., п.
Анализ свойств устойчивости такой нейронной сети существенным образом
связан с выполнением условия симметрии Тц = Т^. Анализу случая Тц = Tji
посвящен параграф 4.2, а случай Тц ^ Tji рассмотрен в параграфе 9.5.
5
Через д~
х
(х) здесь и далее обозначается обратная функция к д(х): д~
1
(д(х) = х.
—
Прим.
ред. перев.
1.2.6. Адаптивное управление
Рассмотрим линейную систему первого порядка
Ур — &рУр ~Г fcpU)
где и — управляющее воздействие и ур — измеряемый выход. Мы будем на
зывать эту модель объектом управления. Предположим, что требуется получить
замкнутую систему, вход-выходное поведение которой определяется эталонной
моделью
Ут
=
0"тУт Н~ К-тТ)
где г — эталонное управляющее воздействие, а сама модель построена таким
образом, что она обеспечивает желаемый выход замкнутой системы. Эта цель
может быть достигнута с использованием линейного управления с обратной свя
зью
u(t) = 0ir(t) + e*2yp(t)
при условии, что параметры объекта (Хр И Κηρ известны, кр φ 0 и параметры
регулятора θ\ и θ2 выбраны в соответствии со следующими равенствами:
л* кт
д* а>т—ctp
ГЬр
ГЬр
В случае когда ар и кр неизвестны, мы можем рассмотреть регулятор вида
u(t) = e1(t)r(t) + e2(t)yp(t),
где зависящие от времени коэффициенты θ\{€) и 02(t) подстраиваются в режи
ме реального времени на основе анализа доступных данных: г(т), ym{r), ур(т)
и и(т), г <t. Процесс адаптации должен обеспечивать стремление 0i(£) и 02(t)
к соответствующим номинальным значениям θ\ и θ\. Закон адаптации выби
рается исходя из требований устойчивости процесса. Одним из таких законов
является градиентный алгоритм
6
01 = -7(%> ~ Ут)г,
#2 = ~1{Ур ~ Ут)Ур,
где 7 — положительная константа, определяющая скорость сходимости процесса
адаптации. Такой адаптивный закон управления предполагает, что знак кр изве
стен, т. е., не умаляя общности, мы можем считать, что эта величина положитель
на. Для того чтобы выписать модель состояния системы, замкнутой адаптивным
6
Этот закон будет обоснован в параграфе 8.3.
Прим. ред. перевода: этот закон управления является градиентным по отношению к функ
ции Q, являющейся скоростью изменения целевой функции Q = (уР — Ут)
2
в силу уравнений
объекта с регулятором и эталонной модели, т. е . закон относится к классу алгоритмов скоростного
градиента. См. дополнение.
18
ГЛАВА 1
законом управления, удобно ввести выходную ошибку (output error) e0 и пара
метрические ошибки ф\ и ф2:
е0 = Ур-Ут,
01=01-01, ^2 = 02-02-
Тогда эталонная модель может быть переписана в следующем виде:
Ут = арут + кр(в1г + в2ут).
С другой стороны, выход объекта ур удовлетворяет уравнению
УР = аРУр + kp(6ir + в2ур).
Вычитая из последнего равенства предыдущее, получаем уравнение ошибки
ё0 = аре0 + fcp(0i - в\)г + £р(02г/р - в%ут) =
= аре0+fcp(0i-0J>+кр(в2ур - 0\уш +02%>~ЩУр)=
= (ар + крв\)е0 + кр(вг - в\)г + fcp(02 - в()ур.
Таким образом, замкнутая система описывается нелинейной, неавтономной мо
делью состояния третьего порядка
е0 = ате0 + kp</>ir(t) + крф2[е0 + ym(t)],
(1.23)
Фг = -7e0r(t),
(1.24)
ф2 = -7е0[е0 + ym(t)],
(1.25)
где 0i(t) = 0i(t) и для функций r(t) и 2/m(t) явно указана их зависимость от
времени для того, чтобы подчеркнуть неавтономность системы. Сигналы r(t)
и ym(t) представляют собой внешние входы для замкнутой системы.
Простейшая версия этой модели может быть получена, когда кр известен.
В этом случае мы можем положить θ\ = θ\ и требуется подстраивать только 02.
Модель замкнутой системы сводится к следующей:
ё0 = ате0 + крф[е0 + ym(t)],
(1.26)
4> = --Ye0[e0 + ym(t)],
(1.27)
где нижний индекс ф2 опущен для простоты записи. Если цель управления —
устремить выход ур к нулю, мы можем положить r(i) = 0 (следовательно,
ym(t) Ξ 0) и замкнутая модель сводится к автономной модели второго поряд
ка
во = (а>т + крф)ео,
Φ=
- lei-
Полагая ё0 = φ = 0 в вышеприведенной системе уравнений, мы можем опреде
лить точки равновесия системы из следующих уравнений:
0 = (ат-\ - крф)ео,
0 = -7е*.
1.2 . ПРИМЕРЫ
19
Система имеет точку равновесия в е0 = 0 для всех значений ф, т. е. она име
ет притягивающее множество е0 = 0. Изолированные точки равновесия отсут
ствуют.
Описанная выше схема адаптивного управления носит название прямого
адаптивного управления с эталонной моделью. Использование термина «эталон
ная модель» обусловлено тем, что регулятор обеспечивает соответствие реально
го поведения системы заданному эталонному закону, а термин «прямое» связан
с тем, что параметры регулятора адаптируются непосредственным образом, в от
личие, например, от схемы адаптивного управления, в которой параметры объек
та ар и кр оцениваются в режиме реального времени, и эти оценки используются
для вычисления параметров регулятора
7
.
При исследовании задач адаптивного
управления возникают интересные нелинейные модели, которые могут быть ис
пользованы для иллюстрации рассмотренных в этой книге методов из теории
устойчивости и теории возмущений.
1.2.7. Типовые нелинейности
В рассмотренных выше примерах мы имели дело с некоторыми нелинейно-
стями стандартного типа, которые возникают при моделировании физических си
стем: нелинейное трение и сигмоидальные нелинейности. В этом параграфе мы
исследуем другие типичные нелинейности. На рис. 1.10 показаны четыре типа
безынерционных нелинейностей. Они называются безынерционными, с нулевой
памятью, или статическими, поскольку выход таких нелинейностей в каждый
момент времени однозначно определяется их входом в этот момент, т. е. зависи
мость от предыстории входа отсутствует.
На рис. 1.10(a) показано идеальное реле, описываемое сигнум-функцией
sign(ix) = <
1, если и>0,
0, если и=0,
(1.28)
-1, если и <0.
Подобная нелинейная характеристика может моделировать электромеханические
реле, цепи тиристоров и другие переключающие устройства.
На рис. 1.10(b) показана нелинейность насыщения. Подобная нелинейная
характеристика свойственна функционированию усилителей (электронных, маг
нитных, пневматических или гидравлических), моторов и других устройств. Эта
нелинейность используется также для того, чтобы ограничивать абсолютную ве
личину переменной. Определим функцию насыщения
14
\sig
«*(«>=г:,.
если
Iй!*;·
(1.29)
iign{u), если \и\ < 1,
7
Подробное изложение теории адаптивного управления может быть найдено в работах [5], [15],
[87], [139] и [168]. -
Прим. ред. перев. -
См. также дополнение, [Д4], [Д44], [Д48].
20
ГЛАВА 1
Рис. 1.10. Типичные безынерционные нелинейности: а) реле; Ь) насыщение; с) зона
нечувствительности; d) квантование
представляющую собой нормализованную нелинейность насыщения. На
рис. 1.10(b) изображен график для ks&t(u/S).
На рис. 1.10(c) показана идеальная нелинейность с зоной нечувствительно
сти. Такая характеристика типична для клапанов и некоторых усилителей при ма
лых входных сигналах. Кусочно-линейные функции, показанные на рис. 1.10(b)
и (с) и представляющие собой характеристики насыщения и зоны нечувстви
тельности, являются аппроксимацией более реалистичных гладких функций (см.
рис. 1.11).
Ъ)
Рис. 1.11. Реальные характеристики (пунктирная линия) нелинейностей с а) насыщением
(saturation) и b) с зоной нечувствительности (dead zone), являющиеся аппроксимацией
кусочно-линейных характеристик (сплошная линия)
На рис. 1.10(d) показана нелинейность квантования (quantization), которая
характерна для аналого-цифровых преобразователей сигналов.
1.2. ПРИМЕРЫ
21
Часто мы будем сталкиваться с нелинейными элементами, вход-выходная ха
рактеристика которых имеет память, т. е. выход таких нелинейностей в каждый
момент времени может зависеть от всей предыстории входа. На рис. 1.12, 1.15(b)
и 1.16 показаны три TaKHt характеристики гистерезисного типа (hysteresis). Пер
вый из этих трех элементов (рис. 1.12) представляет собой реле с гистерезисом.
Для больших отрицательных значений входа выходной сигнал будет находиться
S.'
У
г
К
к
L_
и
Рис. 1.12. Реле с гистерезисом
на нижнем уровне L_. При повышении уровня входного сигнала уровень выхода
остается равным L_ до тех пор, пока уровень входа не достигнет S+. При даль
нейшем повышении уровня сигнала больше S+, уровень выхода переключается
на верхний уровень и остается на нем при еще большем повышении уровня вход
ного сигнала. При понижении уровня входного сигнала уровень выхода остается
на верхнем уровне L+ до тех пор, пока уровень входа не достигнет 5_, и в этот
момент выходной сигнал переходит на нижний уровень L_ и остается на нем
при меньшем уровне входного сигнала. Такая вход-выходная характеристика мо
жет быть реализована, например, цепью операционного усилителя, показанной
на рис. 1.138
. Эта цепь характеризует идеальный операционный усилитель и иде
альные диоды. В идеальном операционном усилителе напряжение на инвертиру
ющем (-) входе равно напряжению на не инвертирующем (+) входе и входные
токи на обоих входах нулевые. Идеальный диод имеет вольт-амперную харак
теристику, изображенную на рис. 1.14. Когда входное напряжение сильно отри
цательное, диоды D\ и Ds будут открыты, а диоды D<i и D^ будут закрыты
9
.
Поскольку инвертирующие входы обоих усилителей реализуются заземлением,
токи в i?5 и £>з будут нулевыми и выход Ds будет получаться на заземлении.
8
Этот рисунок взят из [204].
9
Для того чтобы убедится в том, что Z)3 открыт, когда D\ закрыт, заметим, что, когда D\
открыт, напряжение на выходе А\ будет равно напряжению смещения нуля Vd. Это приводит
к тому, что ток Vd/Rb проходит через R$ на вход Аъ. Поскольку входной ток Аг равен нулю,
ток в #5 должен протекать через £>з. При моделировании диодов мы не учитываем ток смещения
нуля Vd. Поэтому токи в Яь и £>з также не учитываются.
22
ГЛАВА 1
-Ε
-Λ Λ/V
Рис. 1.13. Цепь с операционным усилителем, реализующая характеристику реле с гисте
резисом, показанную на рис. 1.12
off
on
Рис. 1.14. Вольт-амперная характеристика идеального диода
Поэтому выход у будет равен у — —(R^/R^E. Этот режим работы сохраняется
до тех пор, пока ток через D\ положителен, т. е.
*Di
U
R%E
R^Rrj RQ
>0^w<
R4R7
При повышении входного напряжения и выход у останется на уровне
— (R^/R^E
до тех пор, пока входное напряжение не увеличится до R^RrE/R^R^-
Выше это
го уровня диоды D\ и Ds будут закрыты, а £>2 и D± — открыты. Далее, поскольку
инвертирующие входы обоих усилителей реализованы в виде заземления, токи
в i?5 и £>4 будут нулевыми и входом диода D^ будет заземление. Следовательно,
выход будет определяться равенством у — (R2/Ri)E. Этот режим будет сохра
няться до тех пор, пока ток в £>2 будет положительным, т. е.
1>D2
и.R2E
RQ R\RJ
>ООи>-
R2R§E
R\R*i
1.2 . ПРИМЕРЫ
25
Таким образом, мы получили вход-выходную характеристику, изображенную на
рис 1.12, где
_
R$E
_
R2E c
_
R2R^E
C_
R^RQE
ь
-
—
—^ —5
ь
+—~ъ—>^-
—
Б~Б—'
^+ ""
i?4
Ri
R\Rj
R4R7
В примере 2.1 мы покажем, что цепь с туннельным диодом, описанная в парагра
фе 1.2.2, реализует похожую характеристику в случае, когда изменение входного
напряжения значительно медленнее, чем процессы в цепи.
а)
Ведущая
шестерня
U
II Ведомая
шестерня
С/—
С
/
У
Ь)
/
/~
й
у7
^
"7^
в/
/
/
R/L
а/
/Л.
УА
У>
и
Рис. 1.15. Нелинейность люфта
Другим типом нелинейности с гистерезисом является характеристика люфта
(backlash), показанная на рис. 1.15(b). Такая характеристика присуща редукторам.
Рисунок 1.15(a) иллюстрирует эффект люфта между двумя шестернями (gear),
зубья которых разделены небольшим зазором. Предположим, что ведомая ше
стерня характеризуется большим отношением трения к инерционности так, что,
когда вращение ведущей шестерни начинает замедляться, поверхности зубьев со
храняют контакт в точке L. На вход-выходной характеристике, изображенной на
рис. 1.15(b), показано, как соотносится угол поворота ведущей шестерни у с уг
лом поворота ведомой шестерни и. Когда ведущая шестерня начинает вращаться
из положения, изображенного на рис. 1.15(a), и поворачивается на угол меньший,
чем а, ведомая шестерня не вращается. При повороте на угол больший, чем а,
обеспечивается контакт зубьев в точке L и ведомая шестерня начинает вращаться
вслед за ведомой, что соответствует участку А0А вход-выходной характеристики.
Когда ведущая шестерня начинает вращаться в обратном направлении, она долж
на повернуться на угол 2а, прежде чем возникнет контакт в точке U. Во время
этого движения угол у остается постоянным, что соответствует участку АВ вход-
выходной характеристики. После того как контакт в точке U обеспечен, ведомая
шестерня следует в своем вращении за ведущей шестерней, что соответствует
участку ВС. Последующее изменение направления вращения ведущей шестерни
24
ГЛАВА 1
приводит к появлению участка CD А на вход-выходной характеристике систе
мы. Таким образом, периодическое входное воздействие с амплитудой большей,
чем а, приводит к возникновению гистерезисного цикла ABCD, изображенного
на рис. 1.15(b). Заметим, что в случае большей амплитуды гистерезисным циклом
будет A'B'C'D', и это показывает важное отличие рассматриваемого типа гисте-
резисной характеристики от характеристики реле с гистерезисом (см. рис. 1.12),
для которой характерно отсутствие зависимости гистерезисного цикла от ампли
туды входа.
Рис. 1.16. Нелинейность с гистерезисом
Изображенная на рис. 1.16 гистерезисная характеристика похожа на характе
ристику люфта, но присуща процессам намагничивания в магнитных материалах.
Эта характеристика также зависит от амплитуды входного воздействия
10
.
1.3. Упражнения
1.1. Математической моделью широкого класса физических нелинейных систем
является дифференциальное уравнение п-го порядка
где и и у — скалярные величины. Выписать модель состояния такой системы,
предполагая, что и — ее вход и у — ее выход.
1.2. Рассмотрим систему с одним входом и одним выходом, которая описывается
дифференциальным уравнением η-го порядка
y(n)
=9i(t,y,y,...J
n
-
1
\u)+g2(t,y,y,...,y
(
-
n
-
2
'>)u,
где #2 — дифференцируемая функция своих аргументов. Выписать модель состо
яния такой системы, предполагая, что и — ее вход и у — ее выход.
Указание: положить хп = y(n_1
) — g2(t, у, г/,..., у^
п
~
2
^)и.
1.3. Рассмотрим систему с одним входом и одним выходом, которая описывается
дифференциальным уравнением η-го порядка
»
(n)
=S(i,y,y,...,»
(n_1)
^,...,«
(TO)
),
rn<n,
10
Моделирование гистерезисных характеристик, изображенных на рис. 1.15(b) и 1.16, является
сложной проблемой. Различные подходы к ее решению могут быть найдены в [106], [126] и [203].
См. также [Д21] — Прим. ред. перев.
1.3 . УПРАЖНЕНИЯ
25
где z — вход и у — выход. Расширить динамику системы путем добавления после
довательности га интеграторов на входе и рассмотреть и = z^ в качестве входа
расширенной системы (см. рис. 1.17). Используя у,... , t/71-1
) и z,...
,z^
m_1
)
в качестве переменных состояния, выписать модель состояния расширенной си
стемы.
и—z
!
τη интеграторов
/
Ζ
Система
У
Рис. 1.17. К упражнению 1.3
1.4. Нелинейные уравнения динамики манипулятора с га звеньями [171,185] име
ют следующий вид:
M(q)q+C(q,q)q+Dq+g(q)=щ
где q — га-вектор обобщенных координат, которыми являются положения соот
ветствующих звеньев, и — га-вектор управляющих моментов и Μ(q) — симмет
ричная матрица инерции, которая является положительно определенной для всех
qΕRm
.
Член C(q,q)q соответствует вкладу центробежных (centrifugal) сил и сил
Кориолиса. Матрица С обладает тем свойством, что матрица Μ — 2С является
кососимметрической для всех q, q e R
m
,
M — полная производная M(q) по вре
мени. Член Dq соответствует вкладу вязкого демпфирования, D — положительно
полуопределенная и симметричная матрица. Член g(q), соответствующий вкла
ду гравитационных сил, определяется в виде g(q) = [dP(q)/dq]T
,
где P(q) —
полная потенциальная энергия звеньев. Выберите подходящие переменные со
стояния и выпишите соответствующую модель состояния.
1.5. Нелинейные уравнения динамики однозвенного манипулятора с упругими
шарнирами [185] имеют следующий вид:
Iqi +M^Lsin^i +k(qi - q2) =О,
Jq2-k{qi-q2)=щ
где qi и q2 — угловые положения, I и J — моменты инерции, к — константа,
характеризующая упругость шарнира, Μ — масса манипулятора, L — расстояние
между шарнирами и и — управляющий момент. Выберите переменные состояния
и выпишите соответствующую модель состояния.
1.6. Нелинейные уравнения динамики манипулятора с га звеньями и с упругими
шарнирами [185] имеют следующий вид:
M(qi)qi + h(quqi) + K(q1 - q2) = О,
Jq2-K(q1-q2)=щ
где q\ и q2 — га-векторы обобщенных координат, M{q\) и J — симметричные
невырожденные матрицы инерции и и — га-вектор управляющих воздействий.
26
ГЛАВА 1
Выберите переменные состояния и выпишите соответствующую модель состоя
ния. Член h(q, q) соответствует вкладу центробежных сил, сил Кориолиса и си
лы гравитации и К — постоянная диагональная матрица, характеризующая упру
гость шарниров. Выберите переменные состояния и выпишите соответствующую
модель состояния.
1.7. На рис. 1.18 показана схема управления с обратной связью для линейной ин
вариантной по времени системы, задаваемой передаточной функцией G(s) и име
ющей в своем составе нелинейный, зависящий от времени элемент, который за
дается равенством z = ф(Ь,у). Переменные г, и, у и z — векторы одинаковой
размерности. Выписать модель состояния такой системы, предполагая, что г —
еевходиу—еевыход.
+
о- G(s)- --C(sI-AylB[ У
ШУ)
Рис. 1.18. К упражнению 1.7
1.8. Модель синхронного генератора, соединенного с бесконечной электрической
шиной, может быть представлена [148] в следующем виде:
Μδ
=P-D6-^EqsmS,
rEq = -щЕя +77зcosδ+ EFD,
где δ — угол, выраженный в радианах, Eq — напряжение, Ρ — механическая вход
ная мощность, EFD — напряжение возбуждения (вход), D — коэффициент демп
фирования, Μ — коэффициент инерции, τ — постоянная времени и 771,7725^3
—
постоянные параметры.
(a) Используя 5, δ и Eq в качестве переменных состояния, выписать модель
состояния.
(b)Пусть Ρ =0.815, EFD = 1.22, 771 = 2.0,772 = 2.7,773= 1.7, г = б.б,
Μ — 0.0147 и D/M = 4. Найти точки равновесия.
(c) Предположим, что τ относительно велика, так что Eq « 0. Показать, что,
в случае когда Eq — константа, модель состояния сводится к уравнениям
маятника.
1.9. Цепь, показанная на рис. 1.19, содержит катушку индуктивности с нели
нейной характеристикой и управляется источником тока с изменяющимся во
времени напряжением. Предположим, что нелинейная характеристика катушки
представлена функцией Джозефсона (Josephson) [39] %L = /о si
n
кфь, где фь —
магнитный поток катушки, 1$ и к — константы.
1.3. УПРАЖНЕНИЯ
ΔΙ
(a) Используя фъ и vc в качестве переменных состояния, выписать уравнения
состояния.
(b) Удобно ли выбрать в качестве переменных состояния %L И г>с?
Рис. 1.19. К упражнениям 1.9 и 1.10
1.10. Цепь, показанная на рис. 1.19, содержит катушку индуктивности с нели
нейной характеристикой и управляется источником тока с изменяющимся во
времени напряжением. Предположим, что нелинейная характеристика катушки
представлена функцией %L = £</>L + μφ\, где фь — магнитный поток катушки, L
и μ — константы.
(a) Используя фь и vc в качестве переменных состояния, выписать уравнения
состояния.
(b) Найти все точки равновесия системы при is = 0.
1.11. Схема фазовой синхронизации [64] может быть представлена блок-диа
граммой, показанной на рис. 1.20. Пусть {А, В, С} — минимальная реализация
скалярной строго собственной передаточной функции G(s). Предположим, что
все собственные значения А имеют отрицательные вещественные части, G(0) φ
Φ 0 и вг = const. Пусть z — состояние реализации {А, В, С}.
(a) Показать, что замкнутая система может быть представлена уравнениями со
стояния
z=Az+Вsinе, е= —Се.
(b) Найти все точки равновесия системы.
(c) Показать, что, в случае когда G(s) = l/(rs + 1), модель замкнутой системы
совпадает с моделью состояния маятника.
*,+
О-
sin(·)
G(s)
У
I
Рис. 1.20. К упражнению 1.11
28
ГЛАВА 1
1.12. Рассмотрим систему «груз-пружина», изображенную на рис. 1.21. Предпо
ложим, что пружина характеризуется линейной жесткостью и нелинейным вяз
ким демпфированием, т. е. модель содержит член вида с\у 4- С2у/\у\. Найти урав
нение состояния и описать движение системы.
•</
Рис. 1.21. К упражнению 1.12
1.13. Примером механической системы, в которой трение может быть от
рицательным в некоторой области, может служить модель, изображенная на
рис. 1.22 [7]. На движущемся с равномерной скоростью VQ ремне лежит груз
Я">II*>I
ш ——'—'——
ш
1Q_S_D|
i
Рис. 1.22. К упражнению 1.13
массой га, удерживаемый двумя пружинами с линейной упругостью, характери
зуемой коэффициентами к\ и &2. Действующая на груз сила трения h(v) является
функцией относительной скорости ν = νο — у. Предположим, что h(v) является
гладкой функцией для \v\ > 0. Предположим также, что наряду с силой трения
на груз действует линейное вязкое трение, пропорциональное у.
(a) Выписать уравнения движения груза.
(b) Ограничив рассмотрение областью |у| <С г>о, мы можем использовать раз
ложение в ряд Тейлора для аппроксимации h(v) величиной h(vo) — yh!(vo).
Используя такую аппроксимацию, упростить модель движения системы.
(c) С учетом рассмотренной в параграфе 1.2.3 модели трения описать характе
ристику трения h(v), которая привела бы к возникновению отрицательного
трения в системе.
1.14. На рис. 1.23 изображено транспортное средство массой М, движущееся со
скоростью ν по дороге с углом наклона Θ. F
—
тяговое усилие, которое обеспечи
вается двигателем. Предположим, что сила трения имеет компоненты сухого тре
ния и линейного вязкого трения, а также включает в себя член, соответствующий
1.3 . УПРАЖНЕНИЯ
29
Рис. 1.23. К упражнению 1.14
силе лобового сопротивления, пропорциональный ν2
.
Рассматривая F в качестве
входного воздействия, а θ — в качестве возмущения, выписать модель состояния
системы.
1.15. Рассмотрим обратный маятник, изображенный на рис. 1.24 [ПО]. Точка
подвеса (pivot) маятника находится на тележке, которая может двигаться в го
ризонтальной плоскости. Тележка управляется мотором, который обеспечивает
тяговое усилие F. На рисунке показаны также силы, действующие на маятник:
сила гравитации тд, приложенная к центру тяжести, горизонтальная Η и верти
кальная V составляющие силы реакции в опорной точке. Применяя закон Нью
тона относительно центра тяжести маятника, мы можем получить следующие
уравнения:
т^(у + Ь8шв) = Н, m-^(Lcose)
=V
dt
2
•тд,
Маятник
Рис. 1.24. К упражнению 1.15
где т — масса маятника, L — расстояние между центром тяжести и опорной
точкой, у — смещение опорной точки, θ — измеренный по часовой стрелке угол
наклона маятника ид — ускорение свободного падения. Приравнивая моменты
вокруг центра масс, получаем
ie=
VLsme-HLcos6,
30
ГЛАВА 1
где / — момент инерции маятника относительно центра тяжести. Приведенный
выше закон Ньютона для горизонтальней составляющей сил может быть пере
писан в следующем виде:
My=F-Η
-
ky,
где Μ — масса тележки, к — коэффициент трения.
(a) Выполнив указанные дифференцирования и исключая V и Н, показать, что
уравнения движения сводятся к следующим:
ΙΘ= mgL sinθ—mL
2
9 —mLy cos0,
My=F- m(y+L0cos0-L02
sin0) - ky.
(b) Решая вышеприведенные уравнения относительно θ и г/, показать, что
1
Α(θ)
т+М —mLcosθ
—mLcosθΙ+mL
2
mgL sin θ
F+mLQ2
sinθ- ky
где
Δ(<9)=(J+ raL
2
)(ra +Af)- m
2
L2
cos
2
θ^(J+ raL
2
)M+ra/>0.
(с) Используя xi = 0, X2 = 0, хз = У, ΧΑ = у в качестве переменных состо
яния и it = F в качестве управляющего воздействия, выписать уравнения
состояния.
1.16. На рис. 1.25 показана схема трансляционного осциллятора с ротационным
актуатором (Translational Oscillator with Rotating Actuator —TORA) [25]. Система
включает в себя платформу массы М, соединенную с неподвижной вертикаль
ной поверхностью пружиной с линейной жесткостью, характеризуемой коэффи
циентом к. Платформа может двигаться только в горизонтальной плоскости, па
раллельной оси пружины. На платформе установлен эксцентрик массы га, при
водимый в движение электродвигателем постоянного тока и имеющий момент
инерции / относительно своего центра масс, расположенного на расстоянии L
от оси вращения. Обозначим управляющий момент, приложенный к эксцентри
ку, через и. Вращающийся эксцентрик создает управляющую силу, используе
мую для демпфирования поступательного движения платформы. Получим мате
матическую модель системы в предположении, что сила трения отсутствует. Из
рисунка 1.25 видно, что на эксцентрик действуют силы Fx, Fy и момент и. При
меняя закон Ньютона к центру масс и вычисляя момент относительно центра
масс, получаем следующие уравнения:
d2
га—-(xc + Lsinθ)= Fx,
dt
z
m-^(Lcos0) = Fy,
ΙΘ=u+FyL sinθ—FXLcos0,
1.3. УПРАЖНЕНИЯ
31
Рис. 1.25. Трансляционный осциллятор с ротационным актуатором (TORA-система)
где θ — угол поворота эксцентрика (измеренный против часовой стрелки). На
платформу действуют силы Fx и Fy, направленные в противоположном направ
лении, а также восстанавливающая сила, обусловленная упругостью пружины.
Закон Ньютона для платформы может быть записан в следующем виде:
Мхс =—Fx—kxc,
где хс — положение платформы.
(а) Выполнив дифференцирование и исключение Fx и Fy, покажите, что урав
нения движения сводятся к следующим:
D(9)
U
mLO2
sinθ—кхс
, где D(9)
I+mL
2
mL cosθ
mLcosθΜ+m
(b) Решая вышеприведенные уравнения относительно θ и хс, показать, что
1
Δ(0)
т+М —mLcosθ
-mLcosθI+mL
2
mLO2
sinθ— кхг
где
Δ(0)=(/+mL
2
)(m +Μ)-m
z
L2
cos
2
θ^(Ι+mL
2
)M+ml>0.
(c) Используя x\ = 0, X2 — 0, xs = xc-> X4 = xc ъ качестве переменных
состояния и и в качестве управляющего воздействия, выписать уравнения
состояния.
(d) Найти все точки равновесия системы.
1.17. Динамика электродвигателя постоянного тока [178] может быть описана
системой
,.
v
f =Rfif + Lf—i
di
va
= ciifw + La-^
+ Raia,
rduj
•·
J-77
= C2tfla
~С3Ш.
32
ГЛАВА 1
Первое уравнение соответствует цепи обмотки статора (обмотки возбуждения,
field circuit) с г;/, г/, Rf и Lj — напряжение, сила тока, сопротивление и индук
тивность соответственно. Второе уравнение соответствует цепи обмотки якоря
и va, ia, Ra и La — соответствующие переменные. Третье уравнение представ
ляет собой уравнение для момента, где J — момент инерции ротора и сз — демп
фирующий коэффициент. Член c\ijia представляет собой обратную ЭДС, инду
цируемую цепью якоря, и C2ifia — момент, возникающий при взаимодействии
тока якоря в обмотке статора с магнитным потоком в обмотке возбуждения.
(a) Для независимо возбуждаемого электродвигателя постоянного тока напря
жения va и Vf являются независимыми управляющими воздействиями. Вы
берите подходящие переменные состояния и выпишите уравнение состоя
ния.
(b) Выпишите уравнения состояния для электродвигателя постоянного тока,
управляемого напряжением в обмотке возбуждения, т. е. когда Vf является
управляющим воздействием, a va — постоянно (полюсное управление, field
control).
(c) Выпишите уравнения состояния для электродвигателя постоянного тока,
управляемого напряжением в обмотке якоря, т. е. когда va является управ
ляющим воздействием, a Vf — постоянно (якорное управление, armature
control). Можно ли понизить порядок модели в этом случае?
(d) В электродвигателе с параллельными (шунтовыми) обмотками обмотки ста
тора и ротора соединены параллельно и внешнее сопротивление Rx соеди
нено последовательно с обмоткой возбуждения для того, чтобы уменьшить
магнитный поток в ней, т.е. ν = va = Vf + Rxif. Выпишите уравнения
состояния, рассматривая υ в качестве управляющего воздействия.
1.18. На рис. 1.26 показана схема системы магнитной подвески: изготовленный
из магнитного материала шар подвешен в воздухе с использованием электромаг
нита и управляется изменением силы тока в катушке с учетом положения шара,
измеряемого оптическими средствами [211, стр. 192-200]. Эта система представ
ляет собой макет для исследования эффекта левитации, который используется
в гироскопах, акселерометрах и скоростных поездах. Уравнения движения шара
имеют вид
ту = -ку +тд+F(y,i),
где т — масса шара, у > 0 — вертикальное положение шара (у = 0, если положе
ние шара совпадает с первым витком катушки), к — коэффициент вязкого трения,
д — ускорение свободного падения, F(y, г) — сила, обусловленная работой элек
тромагнита и г — сила тока в катушке. Индуктивность электромагнита зависит от
положения шара и может быть промоделирована с использованием следующей
функции:
L(y)=L1+ -^T,
1+У/а
1.3. УПРАЖНЕНИЯ
33
где Li, 1/2 и а — некоторые положительные константы. Эта модель соответствует
случаю, когда индуктивность принимает свое наибольшее значение при поло
жении шара, совпадающем с первым витком катушки, и уменьшается до посто
янной величины при у = оо. Энергия, заключенная в электромагните, может
быть вычислена по формуле E(y,i) — ^L(y)i2
.
Тогда сила F(y,i) может быть
получена в соответствии с равенством
(У,)
ду
2а(1 + у/а)
2
·
В случае когда электрическая цепь катушки управляется источником тока с на
пряжением υ, закон Кирхгофа может быть записан в виде ν — φ
-\-Ri9гдеR—
добавочное сопротивление цепи и φ = L(y)i — магнитное потокосцепление.
(a) Используя х\ = у, Х2 = у и хз = г в качестве переменных состояния
и и = ν — в качестве управляющего воздействия, выписать уравнения со
стояния.
(b) Предположим, что необходимо стабилизировать определенное положение
шара г > 0. Найти величины силы тока и напряжения Iss,
Vss, соответ
ствующие такому устойчивому состоянию.
Следующие три упражнения представляют собой примеры гидравлических
систем [41].
Регулятор
d
Θхэ
Источник
света
Рис. 1.26. К упражнению 1.18: система магнитной подвески
1.19. На рис. 1.27 показана гидравлическая система, в которой бак заполняется
жидкостью. Площадь поперечного сечения бака A(h) является функцией уровня
жидкости h, отсчитываемого от дна бака. Объем жидкости может быть вычислен
по формуле ν = J0 A(\)d\. Для жидкости с плотностью ρ абсолютное давление
определяется равенством ρ — pgh+pa,
где ра — атмосферное давление (постоян
ное по предположению) и g — ускорение свободного падения. Бак наполняется
со скоростью Wi\ жидкость вытекает через клапан со скоростью, определяемой
соотношением между потоком и давлением wQ = к л/Ар. В рассматриваемом
34
ГЛАВА 1
случае Ар = р — ра- Пусть u = wi— управляющее воздействие иу = h — выход
системы.
+Ар- Ρα
Рис. 1.27. К упражнению 1.19
(a) Используя h в качестве переменной состояния, выписать уравнение состоя
ния системы.
(b) Используя ρ — ра в качестве переменной состояния, выписать уравнение
состояния системы.
(c) Найти uss, которое обеспечивает постоянное значение выхода г.
1.20. Гидравлическая система, изображенная на рис. 1.28, включает в себя цен
тробежный насос постоянной скорости, который наполняет бак жидкостью. Эта
жидкость вытекает через трубу с клапаном, который характеризуется соотноше
нием w0 — кл/р — ра. Характеристика насоса для определенной скорости работы
показана на рис. 1.29. Обозначим эту характеристику через Ар = ф{гпг) и опре
делим соответствующую обратную функцию W{ = ф~
1
{Ар). В рассматриваемом
случае Ар = ρ — ра. Площадь поперечного сечения бака является постоянной
функцией, поэтому ν = Ah и ρ = ра + pgv/A (переменные определены в преды
дущем упражнении).
+Ар- Ра
-Δ ρ+
Рис. 1.28. К упражнению 1.20
(a) Используя (р — ра) в качестве переменной состояния, выписать уравнение
состояния системы.
(b) Найти все положения равновесия системы.
1.21. Клапаны в гидравлической системе, изображенной на рис. 1.30, характери
зуются соотношениями w\ — k^Jp\ — рч и w<i = kyjpi — ра- Насос имеет харак
теристику (pi — Р2) — Wp> изображенную на рис. 1.29. Компоненты и переменные
определены в предыдущих упражнениях.
1.3 . УПРАЖНЕНИЯ
35
Ар\
Рис. 1.29. Типичная характеристика центробежного насоса
β-σ"
Ра
РХ
Ра
Р2
Их.
Рис. 1.30. К упражнению 1.21
(a) Используя {р\ — ра) и (р2 — Ра)
в
качестве переменных состояния, выписать
уравнения состояния системы.
(b) Найти все положения равновесия системы.
1.22. Рассмотрим биохимический реактор (см. рис. 1.31) с двумя компонентами —
биомассой и субстратом, — в котором клетки биомассы поглощают субстрат [23].
F
1
V
04
F
•
хх
Рис. 1.31. К упражнению 1.22: биохимический реактор
Предположим, что в реакторе обеспечивается надлежащее перемешивание ком
понентов, объем которых V остается постоянным. Пусть х\ и Х2 — концентрации
(масса/ объем) клеток биомассы и субстрата и x\f и #2/ — соответствующие кон
центрации на входе реактора. Пусть т\ — скорость размножения клеток биомассы
(масса/объем/время), r<i — скорость поглощения субстрата и F — скорость по
тока (объем/время). Динамическая модель такой системы имеет вид уравнений
баланса биомассы и субстрата:
скорость накопления биомассы =
= поток на входе — поток на выходе 4- размножение,
скорость накопления субстрата =
= поток на входе — поток на выходе + поглощение.
36
ГЛАВА 1
Скорость размножения т\ определяется моделью г\ = μΧ\, где μ — некоторая за
данная функция £2· Предположим, что во входном потоке биомасса отсутствует,
т.е. x\f = О, коэффициент разбавления d = F/V и выход продукта Υ = г\/г2
постоянны.
(a) Используя х\ и #2 в качестве переменных состояния, выписать уравнения
состояния системы.
(b) Найти все положения равновесия системы при μ = /хт#2/(&т + #2)> где
Mm? &m — некоторые положительные константы. Предположить, что d < дт.
(c) Найти все положения равновесия системы при μ = дт#2/(&т + Х2 + kix^),
где дт, кт и к\ — некоторые положительные константы. Предположить, что
d < τη3ΧΧ2^ο{μ{Χ2)}'
ГЛАВА 2
Системы второго порядка
Автономные системы второго порядка играют важную роль при изучении
нелинейных систем, т.к. соответствующие решения могут быть представлены
в виде траекторий на плоскости. Это позволяет легко визуализировать качествен
ное поведение системы. Цель этой главы заключается в том, чтобы с использова
нием систем второго порядка в качестве примера ввести некоторые элементарные
понятия и дать представление об основных идеях, лежащих в основах теории
нелинейных систем. В частности, мы рассмотрим поведение нелинейных систем
в окрестности точек равновесия, явления нелинейных колебаний и бифуркаций.
Автономная система второго порядка представляется в виде двух скалярных
дифференциальных уравнений:
xi = /i(si,a;2),
(2.1)
*2 = /2(*1,Χ2).
(2
·
2
)
Пусть x(t) = (xi(t),X2{t)) — решение
1
системы (2.1)-(2.2), соответствующее
определенному начальному значению XQ — (xio,#2o)>
те
*
X
W=х
°- Геометри
ческим местом точек x(t) для всех t ^ 0 на плоскости х\ — Х2 является кривая,
проходящая через точку х$. Эта кривая называется траекторией или орбитой
системы (2.1)-(2.2), исходящей из хо. Плоскость х\ — Х2 называется плоскостью
состояний или фазовой плоскостью. Правая часть системы (2.1)—(2.2) представ
ляет собой касательный вектор x(i) = (xi(t),X2(t)) кривой. Используя вектор
ные обозначения, мы можем переписать систему (2.1)-(2.2) в следующем виде:
ж = /(ж),
где f{x) — вектор (fi(x),f2(%))- Мы будем рассматривать f(x) в качестве век
торного поля на фазовой плоскости, т. е каждой точке х на плоскости мы будем
сопоставлять вектор /(ж). Для простоты визуализации мы будем сопоставлять
каждой точке х направленный отрезок, направленный из х в х + f(x). Напри
мер, если f(x) = (2х^,Х2)9 то при х = (1,1) мы будем рисовать стрелку из
точки (1,1) в точку (1,1) -f (2,1) = (3,2) (см. рис. 2.1). Повторяя эту процедуру
в каждой точке пересечения линий координатной сетки на фазовой плоскости,
мы можем получить диаграмму векторного поля (поле направлений). На рис. 2.2
изображена такая диаграмма для уравнений маятника без учета трения:
XI=Х2,
±2= —10sin#1.
1
Единственность решений предполагается.
38
ГЛАВА 2
Ъ
*+Д*)=(3,2)
Рис. 2.1. Векторное поле
Длина изображенной на рисунке стрелки, исходящей из точки х, пропорциональ
на длине f(x) и равна y/ff(x) + /!(#)· Иногда для удобства мы будем рисовать
стрелки равной длины во всех точках. Поскольку векторное поле в точке каса
тельно к траектории в этой точке, мы можем построить траектории с исполь
зованием диаграммы векторного поля. Начав траекторию в некоторой заданной
начальной точке хо> мы можем построить траекторию, исходящую из этой точки,
двигаясь вдоль направления векторного поля в точке #о· Это движение приведет
нас в точку ха, из которой мы можем продолжить траекторию, двигаясь вдоль
направления векторного поля в точке ха. Если этот процесс продолжить и по
следовательно выбранные таким образом точки достаточно близки, мы сможем
получить достаточно точную аппроксимацию траектории, проходящей через точ
ку хо· Например, на рис. 2.2 показана реализация вышеописанной процедуры для
получения траектории, исходящей из точки (2,0), и можно заметить, что эта тра
ектория представляет собой замкнутую кривую.
Рис. 2.2. Диаграмма векторного поля для уравнений маятника без учета трения
Семейство всех траекторий или кривых, соответствующих решениям, на
зывается фазовым портретом системы (2.1)-(2.2). Фазовый портрет (прибли-
2.1. КАЧЕСТВЕННОЕ ПОВЕДЕНИЕ ЛИНЕЙНЫХ СИСТЕМ
39
зительный) может быть получен путем прорисовки траекторий, исходящих из
большого числа начальных состояний, накрывающих всю (xi — ^ -плоскость.
Поскольку имеется большое количество численных процедур для нахождения
решений нелинейных дифференциальных уравнений, мы можем легко постро
ить фазовый портрет системы с использованием компьютерного моделирования
(см. параграф 2.5). Заметим, что по траектории на фазовом портрете невозможно
восстановить соответствующее решение (xi(t), X2(t)), поскольку сам рисунок не
содержит информации о моментах времени t. Следовательно, траектория предо
ставляет лишь качественное, но не количественное поведение соответствующего
решения. Например, замкнутая траектория показывает, что существует периоди
ческое решение, т. е. системе свойственно непрерывно колебаться, а стягивающа
яся спираль показывает, что системе свойственны затухающие колебания. В этой
главе мы представим качественный анализ поведения систем второго порядка
с использованием фазовых портретов.
2.1. Качественное поведение линейных систем
Рассмотрим линейную, не зависящую от времени систему
х=Ах,
(2.3)
где А — 2 х 2-вещественная матрица. Решение системы (2.3) для заданного на
чального состояния XQ определяется равенством
x(t) = Mexp(Jrt)M~
l
x0,
где Jr — вещественная жорданова форма и Μ — вещественная невырожденная
матрица, такая что M~
l
AM = Jr. В зависимости от собственных чисел матри
цы А, вещественная Жорданова форма может принимать одну из трех форм:
"Ai 0"
0А2
5
'Хк
0А
и
'α-β
βα
где к может принимать два значения: 0 или 1. Первая форма соответствует слу
чаю, когда собственные числа Ai и А2 вещественны и различны, вторая соответ
ствует двум равным вещественным собственным числам и третья форма соответ
ствует двум комплексным собственным числам Ai}2 = a±jp. В нашем исследо
вании мы должны различать эти три случая. Более того, в случае вещественных
собственных чисел мы должны особо выделить случай, когда по крайней мере
одно собственное число является нулевым. В этой ситуации начало координат не
является изолированной точкой равновесия и качественное поведение системы
существенно отличается от поведения в других случаях.
Случай 1: два вещественных собственных числа \\ф\ъф 0.
В этом случае Μ = [г>1,г>2], где ν\ и V2 — вещественные собственные векторы,
соответствующие Ai и Аг- Замена координат z = M~
l
x приводит систему к двум
40
ГЛАВА 2
разделенным дифференциальным уравнениям
h=Ai^i, Z2= X2Z2,
решения которых при заданных начальных значениях (гдо, ^20 имеют следующий
вид:
zi{t) = z10e
Xlt
,
z2(t)=z20e
X2t
.
Исключая из этих равенств t, мы получаем
z2=cz
)
»
/x
\
(2.4)
где с = Z2o/(zio)
Xl
^
Xl
-
Фазовый портрет системы представляет собой семейство
кривых, полученных при варьировании в (2.4) константы с на всей числовой
оси R. Вид фазового портрета зависит от знаков Ai и \2.
Рассмотрим первый случай, когда оба собственных числа отрицательны. Не
умаляя общности, можно считать, что Х2 < Х\ < 0. Тогда обе экспоненты e
Xlt
иe
X2t
стремятся к нулю при t —> оо. Более того, поскольку \2 < \\ < 0, член e
X2t
стремится к нулю быстрее, чем член e
Ali
, и мы можем называть собственное чис
ло А2 быстрым, a Ai — медленным. Аналогично собственный вектор v2 мы будем
называть быстрым, a v\ — медленным. Траектория системы стремится к началу
координат на (z\ — z2)-плоскости вдоль кривой (2.4). Заметим, что угол наклона
этой кривой определяется равенством
^£2 =сА2г[(Аа/А1)-1]в
dz\ \\l
Поскольку [(\2/\\) — 1] — положительная величина, угол наклона кривой стре
мится к нулю при |^11 —> 0 и стремится к бесконечности при \z\\ —> оо. Сле
довательно, при приближении траектории к началу координат она становится
параллельной оси zi, при приближении траектории к бесконечности она стано
вится параллельной оси z2. Эти результаты позволяют нам нарисовать фазовый
портрет системы (см. рис. 2.3). При переходе к исходным ж-координатам фазовый
портрет системы приобретает вид, который изображен на рис. 2.4(a). Заметим,
что на (#i — ^-плоскости траектории становятся касательными к медленному
собственному вектору щ при их приближении к началу координат и параллель
ными быстрому собственному вектору v2 при удалении от начала координат.
В рассматриваемом случае точка равновесия х = 0 называется устойчивым уз
лом.
В случае когда оба собственных числа Ai и А2 положительны, фазовый порт
рет системы имеет похожий вид, но направление движения вдоль траекторий
изменяется на противоположное, поскольку экспоненциальные члены e
Xlt
ие
Х2
возрастают экспоненциально при t —• оо. На рис. 2.4(b) показан фазовый портрет
системы, когда \2 > \\ > 0. В этом случае точка равновесия х = 0 называется
неустойчивым узлом.
2.1. КАЧЕСТВЕННОЕ ПОВЕДЕНИЕ ЛИНЕЙНЫХ СИСТЕМ
41
Рис. 2.3. Фазовый портрет устойчивого узла в модальных координатах
Рис. 2.4. Фазовый портрет устойчивого узла (а) и неустойчивого узла (Ь)
Предположим, что собственные значения имеют различные знаки. В част
ности, пусть λ2 < 0 < Ai. В этом случае e
Xlt
—>ооиe
Xlt
—>0приt—•оо.Мы
будем называть собственное значение А2 устойчивым, a Ai — неустойчивым. Со
ответственно собственные векторы v<i и v\ называются устойчивым и неустойчи
вым. В равенстве (2.4) отношение (Аг/Ах) будет отрицательным и, следователь
но, семейство траекторий на [z\ — z<i)-плоскости будет иметь вид, изображенный
на рис. 2.5(a). Траектории имеют гиперболическую форму: они становятся каса
тельными к zi-оси при \z\\ —> оо и касательными к Z2-OCH при \z\\ —> 0. Кро
ме того, имеются четыре траектории, которые отличаются от гиперболических:
две траектории вдоль 22-оси называются устойчивыми траекториями, т.к. они
приближаются к началу координат при t —> оо, а две траектории вдоль zi-оси
называются неустойчивыми траекториями, т. к. они стремятся к бесконечности
при t —• оо. Фазовый портрет на (х\ — Х2)-плоскости показан на рис. 2.5(b).
На этом рисунке видно, что устойчивые траектории проходят вдоль устойчиво
го собственного вектора V2, а неустойчивые траектории — вдоль неустойчивого
собственного вектора v\. В рассматриваемом случае точка равновесия х = 0
называется седловой точкой.
Случай 2: комплексные собственные числа Ai,2 =
a±jp.
Замена координат z = M~
l
x приводит систему (2.3) к следующей форме:
Z\=OLZ\—βΖ2, Ζ2—βΖ\ +QiZ2.
42
ГЛАВА 2
h
Рис. 2.5. Фазовый портрет седловой точки в модальных (а) и в исходных координатах (Ь)
Решения этой системы носят колебательный характер. Система может быть пред
ставлена в полярных координатах
в виде двух разделенных дифференциальных уравнений первого порядка
г=аг, θ=β.
Решение этой системы с начальными данными (т*о, #о) имеет вид
r(t) = r0e
at
,
e(t)=e0+Pt.
Эти равенства определяют логарифмическую спираль на (z\ — ^ -плоскости.
В зависимости от значений а, эта траектория может принимать три различные
формы, изображенные на рис. 2.6. В случае когда а < 0, спираль сходится к на
чалу координат; в случае когда а > О, спираль расходится от начала координат;
в случае когда а = 0, траектория представляет собой окружность радиуса го. На
рис. 2.7 показаны траектории на (х\ — #2)-плоскости. Точка равновесия х = О
называется устойчивым фокусомФокус\устойчивый если а < 0, неустойчивым
фокусомФокус\неустойчивый если а > 0 и центромЦептр если а = 0.
Рис. 2.6. Типичные траектории в случае комплексных собственных чисел: (а) а < 0;
(Ь)а>0;(с)а=0
Случай 3: кратные ненулевые собственные числа Ai = λ2 = λ ^ 0.
Замена координат z = M~
l
x приводит систему (2.3) к следующей форме:
Z\=\Z\+kZ2, Z<i=\Z2-
2.1. КАЧЕСТВЕННОЕ ПОВЕДЕНИЕ ЛИНЕЙНЫХ СИСТЕМ
43
(Ь) ^
Рис. 2.7. Фазовые портреты для (а) устойчивого фокуса; (Ь) неустойчивого фокуса;
(с) центра
Решения этой системы с начальными данными (гю, z2o) имеют вид
zi(t) = e
xt
{z10 + kzwt),
z2{t) = e
Xt
z20.
Исключая t, мы получаем
Z\=Z2
zio,кi/z2
На рисунках 2.8 и 2.9 показаны траектории для случаев к = 0 и к = 1 соответ
ственно. Фазовый портрет имеет сходство с фазовым портретом узла. Поэтому
состояние равновесия х = 0 обычно называют устойчивым узлом при λ < О
и неустойчивым узлом при Λ > 0. Заметим, однако, что изображенные на рис. 2.8
и 2.9 фазовые портреты не характеризуются тем асимптотическим поведением,
которое мы наблюдали на рис. 2.3 и 2.4.
Рис. 2.8. Фазовые портреты в случае ненулевых равных собственных значений при к = 0
дляслучая(а)λ<0и(Ь)λ>0
Прежде чем перейти к обсуждению вырожденного случая, когда одно или
оба собственных значения являются нулевыми, суммируем наши результаты от
носительно качественного поведения системы в случае изолированной точки рав
новесия х = 0. Мы увидели, что система может демонстрировать шесть ка
чественно различных фазовых портретов, которые соответствуют различным ти
пам состояния равновесия: устойчивый узел, неустойчивый узел, седловая точка,
44
ГЛАВА 2
Рис. 2.9. Фазовые портреты в случае ненулевых равных собственных значений при к — 1
дляслучая(а)λ<0и(Ь)λ>О
устойчивый фокус, неустойчивый фокус и центр. Тип точки равновесия полно
стью определяется собственными значениями матрицы А Заметим, что глобаль
ное качественное поведение на фазовой плоскости определяется типом точки
равновесия и этот тип является характеристикой линейной системы. При иссле
довании качественного поведения нелинейных систем (см. следующий параграф)
мы увидим, что тип точки равновесия может определять качественное поведение
траекторий таких систем лишь в окрестности этой точки.
Случай 4: одно или оба собственных числа равны нулю.
В случае когда одно или оба собственных числа матрицы А равны нулю,
соответствующие фазовые портреты в некотором смысле вырождаются. В рас
сматриваемом случае матрица А имеет нетривиальное нулевое подпространство.
Каждый вектор из нулевого подпространства матрицы А является точкой равно
весия системы, т. е. система имеет не единственную точку равновесия, а целое
подпространство таких точек (подпространство равновесий). Размерность нуле
вого подпространства может быть равна 1 или 2. В последнем случае матрица А
является нулевой. Этот случай является тривиальным, поскольку каждая точка
на плоскости является точкой равновесия. В случае когда размерность нулевого
подпространства равна 1, вид жордановой формы матрицы А будет зависеть от
кратности нулевого собственного значения. Если Ai =0, Х2 φ 0, то матрица Μ
имеет вид [^i,^], где v\ и v2 — соответствующие собственные векторы. Заме
тим, что нулевое подпространство натянуто на v\. Замена координат z — M~
l
x
приводит систему к следующему виду:
Z\ =0, Z2 = λ2^2·
Решением такой системы является
*i(t) = *io, Z2(t) = z20e
X2t
.
Экспоненциальный член либо возрастает, либо убывает, в зависимости от зна
ка λ2· На рис. 2.10 показан фазовый портрет на (х\ — ^-плоскости. Все траек
тории сходятся к подпространству равновесий в случае \2 < 0 и расходятся от
подпространства равновесий в случае Х2 > 0.
2.1 . КАЧЕСТВЕННОЕ ПОВЕДЕНИЕ ЛИНЕЙНЫХ СИСТЕМ
45
Рис.2.10.Фазовые портретыдля случая (a)Ai=0, Х2 <0и(Ь)λΧ = 0, Х2 > 0
В случае когда оба собственных значения нулевые, замена координат z =
=М~
г
х приводит систему к виду
Zl=22,Z2=0
и решением такой системы является
Zi(t) = ZIQ + Z20t, Z2(t) = ^20-
Член Z2$t увеличивается или убывает в зависимости от знака 2:20, а ось z\ яв
ляется подпространством равновесий. На рис. 2.11 показан фазовый портрет на
(х\ — #2)-плоскости; пунктирная линия соответствует подпространству равно
весий. Легко видеть, что фазовый портрет на рис. 2.11 отличается от фазового
портрета, изображенного на рис. 2.10. Траектории, начинающиеся вне подпро
странства равновесий, продолжаются параллельно ему.
Рис. 2.11. Фазовый портрет для случая Х\ = Аг = 0
Исследование поведения линейных систем в окрестности состояния равно
весия имеет важное значение, т. к. во многих случаях локальное поведение нели
нейных систем вблизи точки равновесия может быть изучено с использованием
линеаризованной в окрестности этой точки исходной нелинейной системы путем
46
ГЛАВА 2
анализа поведения полученной в ходе линеаризации линейной системы. Адек
ватность подхода линеаризации зависит в большой степени от того, насколь
ко фазовые портреты линейной системы подвержены возмущениям. Мы можем
проанализировать поведение линейной системы под воздействием возмущений
путем рассмотрения специального случая линейных возмущений. Предположим,
что матрица А имеет различные собственные значения, и рассмотрим сумму А -Ь
+ Δ А, где А А — матрица размерности 2 х 2 с произвольно малыми амплитудами
изменения элементов. Из теории возмущений матриц
2
известно, что собственные
значения матрицы непрерывно зависят от ее параметров. Это означает, что для
заданного положительного числа ε существует соответствующее положительное
число δ такое, что если амплитуда возмущения каждого из элементов матри
цы А меньше, чем 5, то собственные значения возмущенной матрицы А + АА
будут принадлежать открытым дискам с радиусом ε и центром в соответству
ющих собственных значениях матрицы А. Следовательно, каждое собственное
значение матрицы А, которое принадлежит открытой правой полуплоскости (т. е.
имеет положительную вещественную часть) или открытой левой полуплоскости
(т. е. имеет отрицательную вещественную часть), останется в соответствующей
полуплоскости при произвольно малых возмущениях. С другой стороны, соб
ственные значения, лежащие на мнимой оси, могут при возмущении сместиться
либо в левую, либо в правую полуплоскость, т. к. диск с центром на мнимой оси
имеет непустое пересечение с обеими полуплоскостями вне зависимости от того,
насколько мало ε. Следовательно, мы можем заключить, что если точка равно
весия х = О системы х = Ах является узлом, фокусом или седловой точкой, то
точка равновесия х = О системы х = (А + АА)х сохранит свой характеристиче
ский тип при достаточно малых возмущениях. В случае когда точка равновесия
является центром, ситуация совершенно другая: рассмотрим возмущение веще
ственной жордановой формы
Гм 1]
где μ — параметр, соответствующий возмущению. В случае когда μ положителен,
точкой равновесия возмущенной системы является неустойчивый фокус, а ко
гда μ отрицателен — устойчивый фокус. Это остается верным вне зависимости от
того, насколько мал μ, поскольку этот параметр отличен от нуля. Поскольку фа
зовые портреты устойчивого фокуса и неустойчивого фокуса качественно отли
чаются от фазового портрета центра, мы можем заключить, что точка равновесия
типа центр не сможет противостоять возмущениям. Узел, фокус и седловая точка
называются структурно-устойчивыми точками равновесия, поскольку эти точки
сохраняют свои характеристические свойства при бесконечно малых возмуще
ниях
3
.
Центр не является структурно-устойчивой точкой равновесия. Различие
между этими двумя случаями полностью определяется расположением собствен
ных значений матрицы А, и собственные значения, расположенные на мнимой
2
См. [67, глава 7].
3
Более строгое и общее определение структурной устойчивости см. [81, глава 16].
2.1 . КАЧЕСТВЕННОЕ ПОВЕДЕНИЕ ЛИНЕИНЫЛ ^
оси, наиболее уязвимы при возмущениях. Это обстоятельство побуждает ввести
понятие гиперболической точки равновесия. Начало координат называется гипер
болической точкой равновесия системы х = Ах, если А не имеет собственных
значений с нулевой вещественной частью
4
.
В случае когда матрица А имеет кратные вещественные собственные зна
чения, бесконечно малые возмущения могут привести к возникновению пары
комплексных собственных значений. Следовательно, устойчивый (соответствен
но неустойчивый) узел останется либо устойчивым (соответственно неустой
чивым) узлом, либо станет устойчивым (соответственно неустойчивым) фо
кусом.
В случае когда матрица А имеет нулевые собственные значения, разумно
предположить, что при возмущении эти собственные значения отклонятся от ну
ля, что приведет к существенному изменению фазового портрета системы. Тем
не менее оказывается, что имеется существенное различие между случаем, ко
гда только одно собственное значение является нулевым, и случаем, когда оба
собственных значения были нулевыми (Α ψ 0). В первом случае возмущение
нулевого собственного значения приводит к возникновению вещественного соб
ственного значения Ai = μ, где μ может быть как положительным, так и от
рицательным. Поскольку другое собственное значение λ2 отлично от нуля, воз
мущение оставит его ненулевым. Более того, поскольку мы рассматриваем про
извольно малые возмущения, |Ai| = |μ| будет существенно меньше, чем |A^l-
Таким образом, при возмущении мы получим два различных вещественных соб
ственных значения, т.е. точка равновесия возмущенной системы будет узлом
или седловой точкой в зависимости от знаков А2 и μ и это приведет к суще
ственному изменению фазового портрета системы. Однако тщательное исследо
вание фазового портрета приводит к получению дополнительной информации
о качественном поведении системы. Поскольку |Ai| <C | A^U экспоненциальный
член e
X2t
будет изменятся со временем t значительно быстрее, чем экспонен
циальный член e
Xlt
, т.е. при Аг < 0 фазовый портрет будет соответствовать
случаю узла или седловой точки (см. рис. 2.12). Сравнивая эти фазовые порт
реты с рисунком 2.10(a), мы можем увидеть их сходство. В частности, как и на
рис 2.10, траектории, начинающиеся вне линии, соответствующей собственному
вектору vi, сходятся к этому вектору вдоль линий, которые почти параллель
ны собственному вектору г>2. При их приближении к вектору щ они становят
ся касательными к нему и продолжаются вдоль него. При μ < 0 траектории
вдоль vi сходятся к началу координат (устойчивый узел), а при μ > 0 траек
тории вдоль ν\ стремятся к бесконечности (седловая точка). Это качественное
поведение характерно для сингулярно-возмущенных систем, которые будут рас
смотрены в главе 11.
В случае когда оба собственных значения матрицы А нулевые, результат
воздействия возмущений еще более драматичен. Рассмотрим четыре возможных
4
Это определение гиперболической точки равновесия может быть обобщено на случай систем
с большой размерностью. Оно может быть также перенесено на случай нелинейных систем, путем
использования соответствующего определения для линеаризованной системы.
48
ГЛАВА 2
(а)
(Ь)
Рис. 2.12. Фазовые портреты возмущенной системы при Ai = 0, \2 < 0: (а) μ < 0;
(b)μ>0
случая возмущений жордановой формы:
"01"
-μ
2
05
'мi"
-μ
2
μ>
Ml"
ΟμЭ
μΙ
Ο-μ
где μ — положительный или отрицательный параметр, характеризующий возму
щение. Легко видеть, что точками равновесия для этих случаев являются соот
ветственно центр, фокус, узел и седловая точка. Другими словами, воздействие
возмущений может привести к появлению всех возможных фазовых портретов
изолированной точки равновесия.
2.2. Множественные точки равновесия
Линейная система х = Ах имеет изолированную точку равновесия х = 0,
если матрица А не имеет нулевых собственных чисел, т. е. если det А φ 0. Если
det A = 0, система имеет континуум точек равновесия. Для линейной системы
имеется определенное число типов точек равновесия. Нелинейная система может
иметь множество изолированных точек равновесия. В рассмотренных ниже двух
примерах мы исследуем качественное поведение цепи с туннельным диодом (см.
параграф 1.2.2) и уравнение маятника (см. параграф 1.2.1). В обеих системах
наблюдаются множественные изолированные точки равновесия.
Пример 2.1. Модель состояния цепи с туннельным диодом представлена
следующей системой дифференциальных уравнений:
х\ = ^[-hixi) + х2],
±2=γ[—Χ1-Rx2+и]-
Предположим, что параметрами цепи являются
5
и—1.2V,R =1.5кОм=1.5х
103Ом,С =2pF=2х10_12
FиL=5μΗ=5х10"
6
#. Предположим, что
5
Численные значения параметров заимствованы из [39].
2.2. МНОЖЕСТВЕННЫЕ точки РАВНОВЕСИЯ
ЧУ
время измеряется в наносекундах, а токи #2? h(xi) — B
миллиамперах. Тогда мы
можем переписать уравнение модели в следующем виде:
х\ = 0.5[—h(xi) + X2],
±2 = 0.2[-xi - 1.5х2 + 1.2].
Предположим, что /i() определяется равенством
h{xi) = 17.76^1 - 103.79х? + 229.62xf - 226.31х? + 83.72xf.
Полагая х\ = х^ = О, найдем из полученной системы все точки равновесия. Лег
ко проверить, что этими точками равновесия являются следующие: (0.063,0.758),
(0.285,0.61) и (0.884,0.21). Фазовый портрет системы, полученный в ходе ком
пьютерного моделирования, показан на рис. 2.13. На этом рисунке три точки
равновесия обозначены соответственно Qi,Q2,Q3- Из фазового портрета видно,
что за исключением двух особых траекторий, стремящихся к Q2, все траекто
рии стремятся либо к Qi, либо к Q%. В окрестностях точек равновесия фазовые
портреты соответствуют седловой точке для Q2 и устойчивым узлам для Q\
и <2з· Две особые траектории, сходящиеся к Q2, являются устойчивыми траек
ториями седловой точки. Они разделяют фазовую плоскость на две части. Все
траектории, начинающиеся в левой части, сходятся к Q\, и все траектории, на
чинающиеся в правой части, сходятся к фз- Эта разделяющая линия называется
сепаратрисой, т. к. она разделяет фазовую плоскость на две области, для которых
характерно различное качественное поведение траекторий
6
. В эксперименте мы
будем наблюдать одну из двух точек устойчивого состояния Q\ или <3з в зави
симости от начального напряжения на конденсаторе и тока в катушке индуктив
ности. Точка равновесия Q2 никогда не наблюдается на практике, т. к. постоянно
присутствующий шум в цепи отклонит траектории от Q2, даже если изначально
выставить точные значения начального состояния, соответствующего точке Q2·
На рис. 2.13 изображен фазовый портрет глобального поведения цепи с тун
нельным диодом. Промежутки изменения х\ и X2 были выбраны таким обра
зом, чтобы были видны все существенные качественные особенности фазового
портрета. За пределами показанной области никаких существенных качествен
ных особенностей не наблюдается.
Цепь с туннельным диодом, имеющая множественные точки равновесия,
называется бистабильной цепью, т. к. она имеет две устойчивые рабочие точки.
Эта схема использовалась в качестве ячейки компьютерной памяти, в которой
точка Qi ассоциировалась с двоичным значением «0», а точка Q$ — с двоичным
значением «1». Переключение из состояния Q\ в фз и наоборот осуществлялось
сигналом с достаточно большими амплитудой и длительностью, что приводило
к переводу траектории через сепаратрису. Например, если система находилась
6
В общем случае фазовая плоскость может разделяться на несколько областей, внутри каждой
из которых траектории могут демонстрировать различное качественное поведение. Линии, разде
ляющие эти области, называются сепаратрисами.
50
ГЛАВА 2
1б
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0.2
ηл
1
-
-
Η
гЛ%
г
^^^XY
f^Q
*
S
\s. ^V
^
1
1
1 ^^^1
1
1
1
1
-0.4
-0.200.20.40.60.811.21.41.6
Рис. 2.13. Фазовый портрет цепи с туннельным диодом из примера 2.1
в начальном состоянии Qi, то положительный импульс напряжения и перево
дил траекторию в правую по отношению к сепаратрисе область. Этот импульс
должен быть достаточно сильным по амплитуде, чтобы поднять нагрузочную
прямую выше пунктирной линии на рис. 2.14, и достаточно продолжительным,
для того чтобы позволить траектории достигнуть и пересечь сепаратрису.
Рис. 2.14. Подстройка нагрузочной линии цепи с туннельным диодом при переключении
Можно заметить и другую важную особенность этой цепи, если рассмотреть
ее как систему с входом и и выходом у = VR. Предположим, что мы начинаем
наше исследование при достаточно малом значении и и система находится в об
ласти, где лежит точка равновесия Q\. После завершения переходных процессов
2.2. МНОЖЕСТВЕННЫЕ точки РАВНОВЕСИЯ
51
система устанавливается в состояние, соответствующее Q\. Начнем постепенно
увеличивать и, позволяя системе устанавливаться в состояние Q\ после каждо
го шага увеличения и. В некоторых пределах изменения и система будет иметь
только одно состояние равновесия Q\. На вход-выходной характеристике систе
мы, изображенной на рис. 2.15, этот промежуток соответствует сегменту Ε А.
уL2
1
0.8
0.6
0.4
0.2
0
0
1
2
3и
Рис. 2.15. Гистерезисная характеристика цепи с туннельным диодом
При дальнейшем увеличении напряжения система будет иметь две устойчивые
рабочие точки: на сегменте АВ — Qi, а на сегменте CD — Q3· Поскольку мы по
вышаем напряжение постепенно, то начальное состояние цепи будет находиться
вблизи Qi и система будет устанавливаться после каждого шага увеличения на
пряжения именно в это состояние. Следовательно, выходные значения будут со
ответствовать сегменту АВ. При дальнейшем увеличении напряжения мы дости
гаем точки, после которой единственным устойчивым состоянием цепи будет Q^,
и после завершения переходного процесса система будет устанавливаться имен
но в это состояние Q%. На вход-выходной характеристике это будет соответство
вать скачку из Б в С Для больших значений напряжения выход системы будет
оставаться на сегменте CF. Предположим, что мы начали постепенно снижать
напряжение. Сначала единственной точкой равновесия системы будет <3з и вы
ход системы будет двигаться вдоль сегмента FC. После того как напряжение до
стигнет некоторого значения, соответствующего точке С, система будет обладать
двумя устойчивыми рабочими точками, соответствующими состояниям Q\ и <2з,
но после завершения переходного процесса она будет устанавливаться в состо
яние (Зз> т.к. это состояние ближе в этот момент времени к Q%. Следовательно,
выход системы будет двигаться вдоль сегмента CD. При дальнейшем умень
шении напряжения система достигнет состояния, соответствующего точке D на
вход-выходной характеристике, и ее единственной точкой равновесия станет Qi,
что приведет к скачку из D в А. Таким образом, вход-выходная характеристи
ка цепи демонстрирует гистерезисное поведение. Заметим, что при получении
изображенной на рис. 2.15 вход-выходной характеристики мы игнорировали ди
намику системы. Такой подход адекватен лишь в случае, когда вход системы
изменяется медленно по сравнению с динамикой системы, т.к. это позволяет
52
ГЛАВА 2
пренебречь временем переходного процесса, необходимого для переключения из
одной устойчивой рабочей точки в другую
7
.
Δ
Пример 2.2. Рассмотрим уравнение маятника с трением:
XI=Х2,
±2 = —lOsinxi — Χ2·
Фазовый портрет этой системы, полученный с помощью компьютерного моде
лирования, изображен на рис. 2.16 и демонстрирует периодичность по xi с пе
риодом 2π. Следовательно, все характерные особенности качественного поведе
ния рассматриваемой системы могут быть представлены на вертикальной поло
се —π ^ х\ < π. Как было отмечено выше, точки равновесия (0,0), (2π, 0),
(—2π, 0) и т. д. соответствуют нижней точке равновесия маятника (0,0). Траекто
рии в окрестности этой точки равновесия демонстрируют качественное поведе
ние, характерное для траекторий в окрестности устойчивого фокуса. С другой
стороны, точки равновесия (π,0),(—π,0) и т.д. соответствуют верхней точке
равновесия маятника (0,0). Траектории в окрестности этой точки равновесия
демонстрируют качественное поведение, характерное для траекторий в окрест
ности седловой точки. Устойчивые траектории седловых точек в (π,0) и (—π,0)
образуют сепаратрисы, которые отделяют области, характеризующиеся тем, что
все траектории, начинающиеся внутри этих областей, стремятся к точке равно
весия (0,0). Эта картина периодически повторяется. Тот факт, что траектории
могут стремиться к различным точкам равновесия, объясняется тем, что маят
ник может совершить несколько полных оборотов, прежде чем он установится
в нижнем положении равновесия. Например, траектории, начинающиеся в точ
ках А и В, имеют одно и то же начальное состояние, но разные скорости. Тра
ектория, начинающаяся в А, осциллирует с убывающей амплитудой, до тех пор
пока не установится в нижнем положении равновесия. Траектория, начинающа
яся в В, имеет большую начальную кинетическую энергию и совершает полный
оборот, прежде чем начать осциллировать с убывающей амплитудой. Заметим,
что «неустойчивое» состояние равновесия (π, 0) не может поддерживаться на
практике, т. к. любое возмущение заставляет систему уклониться от этого поло
жения.
Δ
2.3. Качественное поведение в окрестности точек равновесия
Фазовые портреты, полученные в примерах 2.1 и 2.2, показывают, что ка
чественное поведение в окрестности каждой точки равновесия похоже на ка
чественное поведение, которое мы наблюдали при исследовании линейных си
стем в параграфе 2.1. В частности, из рис. 2.13 видно, что траектории вблизи
Qi, Q2 и (5з похожи на фазовые портреты устойчивого фокуса, седловой точки
7
Это утверждение будет обосновано с использованием теории сингулярных возмущений, кото
рая будет рассмотрена в главе 11.
2.3 . КАЧЕСТВЕННОЕ ПОВЕДЕНИЕ В ОКРЕСТНОСТИ ТОЧЕК РАВНОВЕСИЯ
53
-6-4-2
0
2
4
6
8
10
Рис. 2.16. Фазовый портрет уравнения маятника из примера 2.2
и устойчивого узла соответственно. Аналогично на рис. 2.16 показаны траек
тории вблизи (0,0) и (π, 0), которые похожи на фазовые портреты устойчивого
фокуса и седловой точки соответственно. В этом параграфе мы покажем, что та
кое поведение вблизи точек равновесия может быть обнаружено без построения
фазовых портретов исследуемой нелинейной системы. За исключением некото
рых особых случаев качественное поведение нелинейной системы может быть
определено посредством ее линеаризации в окрестности точки равновесия.
Пусть ρ = (рьрг)
—
точка равновесия нелинейной системы (2.1)—(2.2).
Предположим, что функции Д и /2 непрерывно дифференцируемы. Разлагая
правую часть уравнений (2.1)-(2.2) в ряд Тейлора в точке (pi,P2)> мы получа
ем
*i = /i(PbP2) + anOi - Pi)+ «12(^2 ~Ρ2) + ΗΟΤ,
#2 = /гСРъРг) + a2i(ffi -Pi) + «22(^2 -Р2) + НОТ,
где
an
<9/lOl,X2)
«21 =
dxi
0/2(^1,^2)
дх\
, ai2
^/1(^1,^2)
Xl=Pl,X2=P2
,«22=
9x2
a?i=pi,aj2=P2
9x2
Ж1=Р1,Ж2=Р2
Ж1=Р1,Ж2=Р2
54
ГЛАВА 2
и НОТ — члены высших порядков (high order terms), т.е. члены разложения
вида (xi -pi)2
9 (х2 -Р2)2
, (xi ~Pi) х (#2 -Ρ2) и т.д. Поскольку (pi,P2) — точка
равновесия,
/l(Pl,P2) = /2(Pl,P2) =0.
Поскольку мы интересуемся видом траекторий вблизи (ръРг), удобно ввести
следующие величины:
У\=Х\-РЪ
И 2/2 = #2-P2
и переписать уравнение состояния в виде
у1=±1
= ацуг + ai2y2 + НОТ,
у2 =х2 =а21У14-а22У2+ НОТ.
Если ограничиться рассмотрением поведения только в достаточно малой окрест
ности точки равновесия, то членами высокого порядка можно пренебречь и ап
проксимировать исходные нелинейные уравнения линейными уравнениями со
стояния
у1=±1
= anyi + ai22/2,
У2 = Х2 = «212/1 + «222/2,
которые в векторной форме записи имеют следующий вид:
У= Ау,
где
А=
an ai2
&21 «22
Γβ/i 5/i]
<9#i дХ2
df2df2
_дх\ дх2_
EL
дх х=р
х=р
Матрица [df /дх] называется якобианом {матрицей Якоби) функции f(x) и А —
матрицей Якоби, вычисленной в точке р.
Разумно предположить, что траектории нелинейной системы в малой
окрестности точки равновесия должны быть «близки» к траекториям линеари
зованной системы в точке равновесия. Действительно, если нулевое решение
линеаризованной системы является устойчивым (неустойчивым) узлом с раз
личными собственными значениями, устойчивым (неустойчивым) фокусом или
седловой точкой, то в малой окрестности начала координат нулевое решение
нелинейных уравнений состояния является устойчивым (неустойчивым) узлом,
устойчивым (неустойчивым) фокусом или седловой точкой* соответственно.
8
Доказательство этого утверждения может быть найдено в [76]. Оно верно в предположении,
что /i(xi, X2) и /2(^1, X2) имеют непрерывные частные производные первого порядка в окрестно
сти точки равновесия (pi,P2). В главе 4 будет доказан другой (но похожий) результат, связанный
с линеаризацией систем высокого порядка (см. теорему 4.7).
2.3. КАЧЕСТВЕННОЕ ПОВЕДЕНИЕ В ОКРЕСТНОСТИ ТОЧЕК РАВНОВЕСИЯ
УЭ
Следовательно, мы можем называть точку равновесия нелинейных уравнений
состояния (2.1)-(2.2) устойчивым (неустойчивым) узлом, устойчивым (неустой
чивым) фокусом или седловой точкой, если тем же свойством обладают линеа
ризованные в точке равновесия уравнения состояния. Таким образом, тип точки
равновесия в примерах 2.1 и 2.2 может быть определен с использованием со
ответствующей линеаризованной модели и без построения глобальных фазовых
портретов.
Пример 2.3. Матрица Якоби функции f(x) для цепи с туннельным диодом
из примера 2.1 имеет следующий вид:
д£
дх
-0.5h'(xi) 0.5
-0.2
-0.3
где
dh
h'(x{\ = -£2- = 17.76 - 207.58zi + 688.86x? - 905.24r? + 418.6ж?.
дх\
Вычисляя якобиан в точках равновесия Q\ = (0.063,0.758), Q2 = (0.285,0.61)
и С?з = (0.884,0.21), мы получаем три матрицы:
А3=
-3.598 0.5 "
-0.2
-0.3_
..82 0.5 "
-0.2
-0.3 >
-1.427 0.5
-0.2
-0.3
,
собственные числа: — 3.57, —0.33,
собственные числа: 1.77,-0.25,
,
собственные числа: - 1.33, -0.4.
Таким образом, Q\— устойчивый узел, Qi — седловая точка, Q% — устойчивый
узел.
Δ
Пример 2.4. Матрица Якоби функции f(x) для уравнений маятника из
примера 2.2 имеет следующий вид:
дх
0
1
—
lOcos^i —1
Вычисляя якобиан в точках равновесия (0,0) и (π, 0), мы получаем две матрицы:
А\ — _1П __-. L собственные числа: — 0.5 ± J3/12,
Аъ—
п
1,
собственные числа: — 3.7,2.7.
Таким образом, точка равновесия (0,0) — устойчивый фокус и (π, 0) — седловая
точка.
Δ
56
ГЛАВА 2
Заметим, что изложенный подход линеаризации можно применять только
в случае, когда матрица линеаризованных уравнений состояния не имеет соб
ственных чисел на мнимой оси, т. е. когда начало координат является гипербо
лической точкой равновесия линейной системы. Обобщением понятия гипербо
лической точки равновесия для нелинейных систем может служить следующее
определение: точка равновесия является гиперболической, если матрица Якоби,
вычисленная в этой точке, не имеет собственных чисел на мнимой оси. Если мат
рица Якоби имеет собственные числа на мнимой оси, то качественное поведение
нелинейных уравнений состояния вблизи точки равновесия может существенно
отличаться от качественного поведения линеаризованных уравнений состояния.
Это обстоятельство не вызывает удивления в свете проведенного выше исследо
вания воздействия линейных возмущений на качественное поведение линейной
системы в случае, когда начало координат не является гиперболической точкой.
В нижеследующем примере мы рассмотрим случай, когда нулевое решение ли
неаризованных уравнений состояния является центром.
Пример 2.5. Система
±i= -х2 - Noi(x\ +#i)>
±2=Х\-μ£2(#1+ ж|)
имеет точку равновесия в начале координат. Матрица линеаризованных уравне
ний состояния в начале координат имеет собственные значения ±j, т.е. точка
равновесия линеаризованной системы является центром. Мы можем определить
качественное поведение нелинейной системы с использованием ее представле
ния в полярных координатах
х\ =гcosθиХ2=rsin0.
В этих координатах исходная система имеет следующий вид:
г= -μΓ
3
и θ=1.
С использованием этого представления легко показать, что точка равновесия
нелинейной системы является устойчивым фокусом при μ > 0 и неустойчивым
фокусом при μ < 0.
Δ
Предыдущий пример показывает, что характерное для точки равновесия ти
па центр качественное поведение линеаризованной системы не сохраняется при
рассмотрении исходной нелинейной системы.
Представленный выше анализ исключает случай, когда линеаризованные
уравнения состояния имеют точку равновесия типа узел с кратными собствен
ными значениями. В примере 2.5 рассматривается случай, когда линеаризован
ная система имеет точку равновесия типа устойчивый узел, но исходная нели
нейная система имеет точку равновесия типа устойчивого фокуса. Однако сле
дует отметить, что, в случае когда функция f(x) более гладкая, этого эффекта
2.4. ПРЕДЕЛЬНЫЕ циклы
не наблюдается. В частности, если /i(#i,£2) и /2(^1,^2) являются аналитиче
скими функциями
9
в окрестности точки равновесия, то верно следующее утвер
ждение
10
. Если нулевое решение линеаризованных уравнений состояния является
устойчивым {неустойчивым) узлом, то в малой окрестности точки равновесия
нулевое решение нелинейных уравнений состояния также является устойчивым
{неустойчивым) узлом вне зависимости от того, различны или равны собствен
ные значения матрицы линеаризованной системы.
Определение типа точек равновесия с использованием метода линеаризации
чрезвычайно полезно при аналитическом и численном построении глобального
фазового портрета системы второго порядка. На практике первым шагом при
построении фазового портрета должно быть нахождение всех точек равновесия
и определение их качественного типа с использованием линеаризованной систе
мы, которая предоставляет необходимую информацию об ожидаемом фазовом
портрете системы в окрестности точек равновесия.
2.4. Предельные циклы
Колебания являются важным явлением, свойственным динамическим систе
мам. Система демонстрирует колебания в случае, когда она имеет нетривиальное
периодическое решение
x(t+T)=x{t), Vt^0,
для некоторого Τ > 0. Термин «нетривиальное» используется для того, чтобы
исключить из рассмотрения постоянное решение, которое соответствует точке
равновесия. Постоянное решение удовлетворяет предыдущему равенству, но не
представляет для нас интереса в случае, когда мы говорим о колебаниях или
периодических решениях. Далее, говоря о периодическом решении, мы будем
иметь в виду нетривиальное решение, за исключением специально оговоренных
ситуаций. Траектория периодического решения на фазовом портрете представ
ляет собой замкнутую кривую, которая обычно называется периодической или
замкнутой орбитой.
Мы уже рассматривали в параграфе 2.1 пример, в котором наблюдались ко
лебания: система второго порядка с собственными значениями ±jP. Нулевое
решение этой системы представляет собой центр, а другие траектории — замкну
тые орбиты. Если преобразовать эту систему к жордановой форме, то решениями
соответствующей системы будут следующие:
21= гоcos{pt +θο), z2 = г0sin(/?t+ во),
где
г0=Jz\ +z\, θ0=arctg
9
T.e. fi(x\,X2) и /2(^1,0:2) имеют сходящиеся разложения в ряд Тейлора.
10
См. [115], теорема 3.4, стр. 188
£2(0)
*i(0)
58
ГЛАВА 2
Таким образом, система имеет решение, колеблющееся с амплитудой го. В этом
случае она называется гармонический осциллятор. Если рассматривать гармо
нический осциллятор как модель линейной индуктивно-емкостной цепи, изоб
раженной на рис. 2.17, то можно заметить, что физическим механизмом, при
водящим к этим колебаниям, является периодический обмен (без диссипации)
энергией, запасенной в электрическом поле конденсатора, с энергией, запасенной
в магнитном поле катушки индуктивности. Однако имеются две фундаменталь-
Сф
Рис. 2.17. Линейная индуктивно-емкостная цепь как гармонический осциллятор
ные проблемы, связанные с исследованием этого линейного осциллятора. Первая
проблема заключается в робастности. Мы видели, что бесконечно малые (линей
ные или нелинейные) возмущения, введенные в правую часть модели, нарушают
колебания. Т. е. линейный осциллятор не является структурно-устойчивым. На
практике невозможно построить индуктивно-емкостную цепь, которая смогла бы
реализовать гармонический осциллятор, т. к. сопротивление электрических про
водов цепи приводит к рассеиванию энергии, запасенной в конденсаторе и ка
тушке индуктивности. Даже если мы построим идеальный гармонический ос
циллятор, мы столкнемся со второй проблемой: амплитуда колебаний зависит
от начальных условий.
Эти две фундаментальные проблемы, связанные с линейным осциллятором,
могут быть решены, если рассмотреть нелинейный осциллятор. Можно постро
ить физически реализуемый нелинейный осциллятор, такой что:
• Нелинейный осциллятор является структурно-устойчивым.
• Амплитуда колебаний (в установившемся режиме) не зависит от начальных
условий.
Генератор с отрицательным сопротивлением, рассмотренный в параграфе 1.2.4,
представляет собой пример такого нелинейного осциллятора. Уравнения состоя
ния системы имеют вид
±1=Х2,
Х2 = —xi - eh'(xi)x2,
где функция h удовлетворяет некоторым свойствам, сформулированным в пара
графе 1.2.4. Система имеет только одну точку равновесия хг = х2 = 0. Матрица
Якоби в этой точке определяется следующим равенством:
дх
0
1
-1
-eh'(0)
2.4. ПРЕДЕЛЬНЫЕ циклы
59
Поскольку /i'(0) < 0, нулевое решение является либо неустойчивым узлом, ли
бо неустойчивым фокусом, в зависимости от значения eh'(0). В обоих случа
ях все траектории, начинающиеся вблизи начала координат, расходятся от него
и устремляются в бесконечность. Эта особенность обусловлена отрицательно
стью сопротивления резистивного элемента вблизи начала координат; этот эле
мент является «активным» и обеспечивает систему энергией. Это обстоятель
ство находит аналитическое обоснование, если найти выражение для скорости
изменения энергии. Суммарная энергия, запасенная в конденсаторе и катушке
индуктивности, в каждый момент времени определяется равенством
Ε=\Cv%+ \Li\.
В параграфе 1.2.4 было показано, что
vc=х\ и гь= -h(x\)- -х2.
Таким образом, учитывая ε = yjL/C, мы можем переписать выражение для
энергии в следующем виде:
E = \C{x\ + [eh{xl) + x2]
2
}.
Скорость изменения энергии определяется равенством
Ё = C{xi±i + [eh(x\) + X2[[eh! (x\)x\ + ±2]} =
= С{х\Х2 + \eh{xi) + X2][eh!{x\)x2 - х\ - eh!{xi)xj[} =
= С\х\Х2 — ex\h{x\) — Ж1Ж2] —
=
— eCx\h{x\).
Из этого равенства видно, что вблизи начала координат траектория получа
ет энергию, т.к. при малых |xi| член x\h{x\) отрицателен. Кроме того, легко
заметить, что если траектория проходит внутри (соответственно вне) полосы
—а ^ х\ ^ Ь, то система получает (соответственно теряет) энергию. Границы
полосы —а и Ь представляют собой корни уравнения h(x\) = 0 (см. рис. 2.18).
Таким образом, происходит внутрисистемный обмен энергией: при прохожде
нии траектории внутри полосы система получает энергию, а при прохождении
траектории вне полосы — теряет. В системе могут наблюдаться стационарные
колебания, если суммарное изменение энергии за один цикл равно нулю и соот
ветствующая траектория будет замкнутой орбитой. Оказывается, что осциллятор
с отрицательным сопротивлением имеет изолированную замкнутую орбиту. Этот
факт может быть проиллюстрирован следующим примером осциллятора Ван дер
Поля.
Пример 2.6. На рисунках 2.19(a), 2.19(b) и 2.20(a) показаны фазовые порт
реты уравнения Ван дер Поля
XI=ж2,
(2.5)
Х2= -х\ +ε(1- х\)х2
(2.6)
60
ГЛАВА 2
/If
Ι/
/j-a
/Ι
/Ι
//
//
/Ι
//
•Ν
\\
0\
^-'"Ν /
\
\
\
\
\
\
ΧΧ
Рис. 2.18. Графики h(x\) (сплошная линия) и — x\h{x\) (пунктирная линия), которые
показывают, что Ε положительна при — а ^ х\ ^Ь
для трех различных значений параметра ε: 0.2,1.0 и 5.0. Во всех трех случаях из
фазовых портретов видно, что эта система имеет единственную замкнутую ор
биту, которая притягивает все траектории, начинающиеся не на этой орбите. При
ε = 0.2 замкнутая орбита представляет собой гладкую кривую, близкую к кругу
с радиусом 2. Такое поведение типично для малых значений ε (скажем, ε < 0.3).
При среднем значении параметра ε = 1.0 круговая форма орбиты несколько ис
кажается (см. рис. 2.19(b)). Для большого значения ε = 5.0 замкнутая орбита еще
более искажена (см. рис. 2.20(a)). Более показательный фазовый портрет для это
го случая может быть получен, если выбрать в качестве переменных состояния
z\ — ib и Z2 = vc· Тогда уравнения состояния принимают следующий вид:
у-
1
У
Z\—£
z
2,
z2 = -ε(>1 -г2 + |4)·
3
2
1
0
-1 l·
-2
-3
х2
УiiJJJ ,
о
Рис. 2.19. Фазовые портреты осциллятора Ван дер Поля: (а) ε = 0.2; (b) ε = 1.0
Фазовый портрет на {z\ — ^-плоскости при ε = 5.0 показан на рис. 2.20(b).
Замкнутая орбита очень близка к кривой z\ = z<i — (1/3)^2? за исключением
мест с резким изгибом, в которых траектории становятся почти вертикальными.
2.4. ПРЕДЕЛЬНЫЕ циклы
61
Вертикальные участки замкнутой орбиты могут рассматриваться как скачки за
мкнутой орбиты с одной ветки кривой на другую при достижении мест резкого
изгиба. Колебания, при которых имеет место явление скачка обычно называются
релаксационными колебаниями. Такие фазовые портреты характерны для боль
ших значений ε (скажем, ε > 3.0).
Δ
10
5
0
-5
•\
А!
/"
Х
1
3
2
1
0
-1
-2
-3
.
^
\
ч
V
\
*-^
-5
0
5
(а)
10
о
(Ъ)
Рис. 2.20. Фазовые портреты осциллятора Ван дер Поля при ε = 5.0: (а) на (х\ —
—
Х2)-плоскости; (Ь) на (zi — ^ -плоскости
Замкнутая орбита, которую мы получили в примере 2.6, отличается от за
мкнутой орбиты гармонического осциллятора. В случае гармонического осцил
лятора имеется континуум замкнутых орбит, а в примере системы Ван дер По
ля имеется только одна изолированная периодическая орбита. Изолированные
периодические орбиты называются предельными циклами. Предельный цикл ос
циллятора Ван дер Поля обладает тем свойством, что все траектории в окрест
ности предельного цикла стремятся к этому предельному циклу при t —> оо.
Предельный цикл с таким свойством известен как устойчивый предельный цикл.
В дальнейшем мы увидим, что могут существовать и неустойчивые предель
ные циклы, которые обладают тем свойством, что все траектории, начинающиеся
в произвольно малой окрестности предельного цикла, будут отклоняться от этого
предельного цикла при t —» оо (см. рис. 2.21). Примером такого неустойчивого
предельного цикла может служить уравнение Ван дер Поля в обратном времени,
т.е.
XI
-Х2,
х2 = х\— ε(1 - х\)х2-
Фазовый портрет этой системы похож на фазовый портрет осциллятора Ван дер
Поля, но направление движения вдоль траекторий изменяется на противополож
ное. Следовательно, такой предельный цикл является неустойчивым.
Интересно рассмотреть предельный цикл осциллятора Ван дер Поля из при
мера 2.6 в предельных случаях, когда значение ε очень мало или очень велико.
Такие специальные случаи могут исследоваться аналитически с использовани
ем асимптотических методов. В главе 10 мы используем метод усреднения для
62
ГЛАВА 2
(а)
(Ь)
Рис. 2.21. (а) Устойчивый предельный цикл; (Ь) неустойчивый предельный цикл
исследования предельного случая ε —> 0, а в главе 11 мы используем метод
сингулярных возмущений для исследования предельного случая ε —> оо.
2.5. Численное построение фазовых портретов
Для нахождения численных решений обыкновенных дифференциальных
уравнений используются специальные компьютерные программы, которые могут
быть использованы и для построения фазовых портретов систем второго поряд
ка. В этом параграфе мы дадим указания, которые могут оказаться полезными
для читателя, незнакомого с этими аспектами
11
.
Первым шагом при построении фазового портрета является нахождение всех
точек равновесия исследуемой системы и определение с использованием лине
аризованной модели типов качественного поведения в окрестности найденных
изолированных точек равновесия.
Для того чтобы построить фазовый портрет, необходимо выполнить три за
дачи:
12
• Выбрать границы области в пространстве состояния, внутри которой должен
быть построен фазовый портрет:
%lmin ^ #1 ^ ^lmacc? %2тгп ^ ^2 ^ %2тах-
• Выбрать начальные точки (значения) внутри границы области.
• Найти соответствующие траектории.
Рассмотрим сначала задачу нахождения траекторий. Для того чтобы постро
ить траекторию, проходящую через точку хо, необходимо решить уравнение
х= /(ж), х(0)=хо
11
Более подробные инструкции к построению информативных фазовых портретов приведены
в [149, глава 10].
12
Мы не упомянули здесь четвертую задачу: нанесение на рисунок стрелок направления дви
жения вдоль траекторий, т. к. для целей этой книги вполне достаточно выполнить эту процедуру
вручную.
2.5. ЧИСЛЕННОЕ ПОСТРОЕНИЕ ФАЗОВЫХ ПОРТРЕТОВ
63
в прямом (при положительном t) и обратном времени (при отрицательном £). Ре
шение в обратном времени эквивалентно решению в прямом времени уравнения
х = -/(ж), х(0) = XQ,
т. к. замена независимой переменной г = — t изменяет знак правой части этого
уравнения на противоположный. Стрелка, указывающая направление движения
вдоль траектории, направлена от хо в случае решения в прямом времени, и на
правлена к хо в случае решения в обратном времени. Заметим, что построение
решения в обратном времени является единственным путем получения фазового
портрета в окрестности неустойчивого фокуса, неустойчивого узла или неустой
чивого предельного цикла. Траектории продолжаются до тех пор, пока они не
достигнут границы выбранной области в пространстве состояния. В случае ко
гда траектории сходятся к точке равновесия, следует ввести критерий останова
процедуры вычисления.
Граница области должна быть выбрана таким образом, чтобы можно было
отобразить все существенные особенности фазового портрета. Поскольку неко
торые из этих особенностей не могут быть известны априори, необходимо преду
смотреть возможность интерактивного переопределения границ области, но пер
воначальный выбор этой области должен учитывать всю доступную на момент
начала моделирования информацию. Например, область должна включать все
найденные точки равновесия. Необходимо быть внимательным, если траектория
выходит за границы выбранной области, т. к это свидетельствует, что эта траек
тория либо не ограничена, либо стремится к устойчивому предельному циклу.
Простейшим методом выбора начальных значений является равномерное
распределение этих точек в узлах некоторой сетки, покрывающей область моде
лирования в местах пересечения координатной сетки. Однако равномерное рас
пределение начальных точек по области не означает в общем случае равномер
ное распределение траекторий по этой области. Целесообразнее выбирать эти
начальные точки интерактивно после того, как уже вычисленные траектории на
несены на фазовый портрет системы, т. к. большинство компьютерных программ
имеет развитые и удобные в использовании средства для рисования графиков.
В случае когда точка равновесия является седловой точкой, можно использо
вать метод линеаризации исследуемой системы для того, чтобы получить устой
чивые и неустойчивые траектории. Это представляется полезным, т. к. в приме
рах 2.1 и 2.2 мы видели, что устойчивые траектории седловой точки определя
ют сепаратрису. Пусть собственные значения матрицы линеаризованной системы
удовлетворяют неравенству Ai > 0 > λ2 и соответствующие собственные векто
ры обозначены через ν\ и г>2. Устойчивые и неустойчивые траектории седловой
точки нелинейной системы будут касательны к устойчивому собственному век
тору г>2 и неустойчивому собственному вектору υ\ соответственно при прибли
жении к точке равновесия р. Следовательно, две неустойчивые траектории могут
быть получены при задании начальных значений вида XQ = ρ ± αυ\, где а —
малый положительный параметр. Аналогично две устойчивые траектории могут
быть получены при задании начальных значений вида XQ = ρ ± otvi· Основная
64
ГЛАВА 2
часть неустойчивых траекторий будет получена при решении системы в прямом
времени, и основная часть устойчивых траекторий будет получена при решении
системы в обратном времени.
2.6. Существование периодических орбит
Периодические орбиты на плоскости обладают тем свойством, что они раз
деляют плоскость на две области: внутри орбиты и вне ее. Это позволяет полу
чить критерии наличия или отсутствия периодических орбит для систем второго
порядка. Следует отметить, однако, что эти критерии не могут быть обобщены
на случай систем большей размерности. Наиболее известными критериями явля
ются теорема Пуанкаре-Бендиксона, критерий Бендиксона и метод индексов.
Рассмотрим автономную систему второго порядка
х = f(x),
(2.7)
где f(x) — непрерывно дифференцируемая функция. В теореме Пуанкаре-
Бендиксона даются условия существования периодических орбит (2.7). Мы не
будем приводить полную формулировку этой теоремы,
13
но сформулируем ее
следствие, которое позволяет непосредственно использовать основной результат
теоремы. Мы будем называть это следствие критерием Пуанкаре-Бендиксона.
Лемма 2.1 (критерий Пуанкаре-Бендиксона). Рассмотрим систему (2.7),
и пусть Μ — замкнутое ограниченное подмножество на плоскости, такое что
•
Μ не содержит точек равновесия или содержит только одну точку рав
новесия, такую что собственные значения матрицы Якоби [df/dx] в этой
точке имеют положительные вещественные части. {Следовательно, точ
ка равновесия является неустойчивым фокусом или неустойчивым узлом.)
• Каждая траектория, начинающаяся в М, остается в Μ для всех будущих
моментов времени.
Тогда Μ содержит периодическую орбиту системы (2.7).
С интуитивной точки зрения в этой лемме утверждается, что ограниченные
траектории на плоскости будут стремиться к периодической орбите или точкам
равновесия при стремлении времени к бесконечности. Если Μ не содержит то
чек равновесия, то она должна содержать периодическую орбиту. Если Μ со
держит только одну точку равновесия, удовлетворяющую указанным условиям,
то в окрестности этой точки все траектории будут расходиться от нее. Таким
образом, мы можем выбрать простую замкнутую кривую
14
в окрестности точки
13
Формулировка и доказательство теоремы Пуанкаре-Бендиксона приведены в [135] или во вто
ром издании этой книги.
14
Простая замкнутая кривая разделяет плоскость на ограниченную область внутри этой кривой
и неограниченную область вне этой кривой (примерами таких кривых могут служить окружности,
эллипсы и многоугольники).
2.6 . СУЩЕСТВОВАНИЕ ПЕРИОДИЧЕСКИХ ОРБИТ
оэ
равновесия, такую что векторное поле в точках этой кривой будет направлено
наружу . Заменяя множество Μ так, чтобы исключить ограниченную кривой
область (см. рис. 2.22), мы получаем множество, которое не содержит точек рав
новесия и все траектории проходят внутри него.
Рис. 2.22. Замена множества Μ на множество, исключающее окрестность неустойчивого
фокуса или узла
Для того чтобы установить, лежат ли все траектории внутри множества М,
следует использовать следующий метод. Рассмотрим простую замкнутую кри
вую, которая определяется уравнением V(x) = с, где V(x) — непрерывно диф
ференцируемая функция. Тогда векторное поле f(x) в точке х на кривой направ
лено внутрь множества, если скалярное произведение f(x) на вектор-градиент
W(x) отрицательно, т. е.
/(*) • W(x) = f^aO/iW + Ц^Ш*) < °·
Векторное поле f(x) направлено наружу, если f(x) · W(x) > 0, и по касатель
ной к кривой, если f(x) · W(x) = 0. Траектории могут выйти из множества,
только если векторное поле направлено наружу в точке пересечения с границей
множества. Таким образом, для множества Μ = {V(x) ^ с}, где с — некоторая
положительная константа, траектории лежат внутри М, если f(x) · W(x) ^ 0
на границе V(x) = с. Для области в виде кольца Μ = {W(x) > c\ и V(x) ^ C2},
гдес\ >0иС2>0,траектории лежатвнутриМ, если f(x) ·W(x) ^ 0при
V(x) =с2и f(x) ·VW(x) >0приW(x) =сь
Следующие два примера иллюстрируют критерий Пуанкаре-Бендиксона,
а третий пример представляет собой нетривиальное применение этого критерия
к случаю осциллятора с отрицательным сопротивлением, рассмотренного в па
раграфе 1.2.4.
Пример 2.7. Рассмотрим гармонический осциллятор
XI=Х2,
Х2=
-Х\
15
См. упражнение 4.33.
66
ГЛАВА 2
иобластьввидекольцаΜ={с\^V(x) =ξС2},гдеV(x)=х\+х|
ис
2>ci>0.
Множество Μ замкнуто, ограничено и не содержит точек равновесия, т. к. един
ственная точка равновесия находится в начале координат (0,0). Траектории ле
жат внутри М, поскольку равенство f(x) · VV(x) = 0 выполнено при всех х.
Следовательно, по критерию Пуанкаре-Бендиксона, в множестве Μ существует
периодическая орбита.
Δ
Предыдущий пример показывает, что критерий Пуанкаре-Бендиксона гаран
тирует существование периодической орбиты, но не ее единственность. Прове
денные выше исследования гармонического осциллятора показывают, что эта си
стема обладает континуумом периодических орбит в М.
Пример 2.8. Система
Xl=х\+Х2—х\{х\ +а?!),
х2= -2х2+Х2- Х2(х\+ xi)
имеет единственную точку равновесия в начале координат. Матрица Якоби
Ё1
дх х=0
оХл
Хо
-2
-
2ххх2 1
2xiX2
ОХо
п
11
-2
1
имеет собственные значения l±jy/2. Пусть Μ = {V(x) ^ с, где V(x) = х\ + х\
и с > 0. Легко видеть, что Μ замкнуто, ограничено и содержит только одну точку
равновесия, в которой якобиан имеет собственные значения с положительными
вещественными частями. На поверхности V(x) = с мы имеем
£Л + |£А-*.!* + * Х\(х\ + х\)\ + 2X2[-2^1 + Х2 - Ж2(^1 + xf)]
= 2{х\+х\)-2{х\+xlf -2xix2
^2{х\ +х\)-2{х\+xlf +(ж?+ х\)
= 3с-2с
2
.
При получении этой оценки мы использовали неравенство |2xiX2| ^ х\+х\. Вы
бор с ^ 1.5 гарантирует то, что все траектории будут лежать в М. Следовательно,
по критерию Пуанкаре-Бендиксона, в множестве Μ существует периодическая
орбита.
Δ
Пример 2.9. Модель рассмотренного в параграфе 1.2.4 генератора с отри
цательным сопротивлением может быть представлена в виде дифференциального
уравнения второго порядка
ν+eh'(v)v +v=0,
где ε — некоторая положительная константа и h удовлетворяет условиям
h(0)=0,ft'(0)<0, limh(v)=оо, lim h[y)= -оо.
2.6. СУЩЕСТВОВАНИЕ ПЕРИОДИЧЕСКИХ ОРБИТ
67
Для того чтобы упростить анализ этой системы, наложим дополнительные тре
бования:
h(v)= —h(—v),h(v)<0при0<υ<аиh(v)>0приν>а.
Эти требования выполнены для функции, изображенной на рис. 1.6(b), а также
для функции h(v) — —υ + (l/3)f3
, используемой в осцилляторе Ван дер Поля.
Выберем переменные состояния:
х\ =νиХ2=ν+ eh(y).
Тогда модель состояния будет иметь следующий вид:
xi =X2-sh{xi),
.
2g.
Х2=
-XV
Эта система имеет единственную точку равновесия в начале координат. Пока
жем, что каждое неравновесное решение представляет собой траекторию, кото
рая закручивается вокруг точки равновесия по часовой стрелке. Для этой цели
разделим пространство состояния на четыре области, которые определяются пе
ресечением двух кривых (см. рис. 2.23):
Х2- eh(x\)=0их\=0.
На рисунке показаны также направления векторного поля f(x) для системы (2.8)
в полученных четырех областях и на границах между ними. Легко заметить,
что решение, начинающееся в точке А = (0,р), принадлежащей верхней поло
вине £2-оси, представляет собой орбиту, отрезок которой показан на рис. 2.24.
Положение точки Е, в которой отрезок орбиты пересекает нижнюю половину Х2-
оси, зависит от начальной точки А. Обозначим точку Ε через (0, — а(р)). Пока
жем, что если значение ρ выбрать достаточно большим, то а(р) < р. Рассмотрим
функцию
V{x) = \{x\ + xl).
Для выполнения неравенства а(р) <р необходимо обеспечить выполнение нера
венства V(E) - V(A) < 0, т. к.
V{E)-V{A) = \[a\p)-p
2
]^5{p).
Производная V(x) определяется равенством
V(x) = x\Xi + #2^2 = #i#2 — exih(xi) — х\Х2 — —ex\h{x\).
Таким образом, V положительна при х\ < а и отрицательна при х\ > а. Далее,
%) = V(E) - V(A) = f V(x(t))dt,
JAE
68
ГЛАВА 2
где интеграл берется по кривой АЕ. Если ρ мало, то вся кривая АЕ лежит внутри
полосы 0 < xi < а и, следовательно, δ(ρ) будет положительно. При увеличении ρ
часть кривой окажется вне полосы: сегмент BCD на рис. 2.24. В этом случае
вычислять интеграл следует с учетом того, что часть кривой лежит вне полосы
О<х\<а,т.е.
i(p) = ai(p) + <fc(p) + i3(p),
где
Ш=
[ V{x(t))dt,
δ2(ρ)= [
V(x(t))dt,
«i(p)=/
V(x(t))dt.
JAB
JBCD
JDE
Рассмотрим первый интеграл:
Slip) ——l ex\h{xi)dt = — /
ех\Мх\)-— dx\.
JAB
JAB
<&I
x2=eh(x1)
Рис. 2.23. Диаграмма векторного поля из Рис. 2.24. Орбита ABCDE из приме-
примера 2.9
ра 2.9.
Подставляя dx\/dt из (2.8), получаем
*I(P) = -
/ e#iMzi)
Г7—\
dx
^
JAB
X2-eh[xi)
где Х2 представляет собой известную функцию от х\ вдоль кривой А В. Очевид
но, что Si(p) положительно. Заметим, что при увеличении ρ значение х2 — eh{x\)
также увеличивается вдоль кривой АВ. Следовательно, δ\{ρ) уменьшается при
ρ —• оо. Аналогично можно показать, что третий интеграл Ss(t) положителен
и убывает при ρ —> оо. Рассмотрим теперь второй интеграл:
<fe(p)= — I
ex\h(xi)dt = — /
ex\h{x\)- —dx2-
JBCD
JBCD
UX2
Подставляя dx2/dt из (2.8), мы получаем
δ2{ρ) = /
eh(xi)dx2,
JBCD
2.6. СУЩЕСТВОВАНИЕ ПЕРИОДИЧЕСКИХ ОРБИТ
69
где х\ представляет собой известную функцию от Х2 вдоль кривой ВСВ. Инте
грал в правой части этого равенства отрицателен, т.к. h(x\) > 0 и dx2 < 0. При
увеличении ρ область, по которой осуществляется интегрирование, увеличивает
ся и, следовательно, (feCp) уменьшается при увеличении р, т.е. \imp^0002(p) —
= — оо. Суммируя полученные результаты, мы получаем, что
• $(р)>0>
если
Ρ<
г
Для некоторого г > 0;
• δ(ρ) монотонно уменьшается до — оо при ρ —> οο, р^ г.
График функции δ(ρ) изображен на рис. 2.25. Очевидно, что, выбирая ρ до
статочно большим, мы можем обеспечить отрицательность δ(ρ); следовательно,
а(р) < р.
Заметим, что благодаря симметрии, обусловленной нечетностью функ
ции h{·), мы можем заключить, что если (xi(t),X2(t)) является решением (2.8),
то (—xi(t),—X2{t)) также является решением этого уравнения. Следовательно,
если траектория ABCDE существует, то траектория, являющаяся образом при
отображении центральной симметрии относительно начала координат, также яв
ляется решением. Рассмотрим А = (0,р) и Ε — (0, — а(р)), а{р) < р. Сфор
мируем замкнутую кривую, которая составлена из траектории ABCDE, ее цен
трально-симметричного образа и отрезков на #2-оси, замыкающих эти две кри
вые (см. рис. 2.26). Пусть Μ — область, замкнутая этой кривой. Каждая тра
ектория, начинающаяся в Μ при t = 0, будет лежать внутри этой области для
всех t ^ 0. Это обусловлено направлением векторных полей на Х2~оси, а также
тем, что траектории не пересекаются друг с другом вследствие единственности
решений дифференциального уравнения. Таким образом, мы имеем замкнутое,
ограниченное множество, которое содержит точку равновесия в начале коорди
нат. Матрица Якоби, вычисленная в начале координат, имеет следующий вид:
о
11
-1
- ек'Щ
Ее собственные значения имеют положительные вещественные части, т.к.
h'(0) < 0. Следовательно, по критерию Пуанкаре-Бендиксона, в множестве Μ
существует периодическая орбита.
Используя аналогичный подход, мы можем показать, что эта замкнутая ор
бита является единственной. Заметим, что следствием установленного выше
свойства симметрии является то, что система может иметь замкнутую орбиту
только и только если а(р) = р. Из рис. 2.25 видно, что имеется только одно зна
чение р, для которого это условие выполнено. Следовательно, существует только
одна замкнутая орбита. Далее, можно показать, что каждое неравновесное ре
шение сходится по спирали к единственной замкнутой орбите. Для того чтобы
аргументировать это утверждение, предположим, что ро > 0 — это то самое
значение, при котором выполнено а(р) = р. Рассмотрим точку (0,р), ρ > Ро
на Х2-оси. Как было отмечено выше, проходящая через точку (0,р) траектория
пересекает нижнюю половину Я2-оси в точке (0, —а(р)), а(р) < р. Вследствие
Ё1
дх х=0
70
ГЛАВА 2
Рис. 2.25. График функции δ(ρ) из приме-
Рис. 2.26. Замкнутая кривая из примера 2.9
ра2.9
симметрии, проходящая через точку (0, — а(р)) траектория пересечет верхнюю
половину Х2-оси в точке (0, σ(ρ)), ρο ^ σ(ρ) < р. Верхняя граница этого огра
ничения обусловлена свойством симметрии, а нижняя — тем, что если σ(ρ) < ро,
то траектория должна пересечь замкнутую орбиту. Отображение ρ —• σ(ρ)
непрерывно вследствие непрерывной зависимости решений дифференциально
го уравнения от начальных значений
16
.
Таким образом, начинающаяся в точке
(0, σ(ρ)) траектория вернется на верхнюю половину Х2-оси и пересечет ее в точ
ке (0,σ
2
(ρ)),ро<&
2
(р) < σ(ρ). По индукции мы можем получить последова
тельность ση(ρ), элементы которой удовлетворяет следующим неравенствам:
РО < ση+1
(ρ) < ση(ρ), η = 1,2,...
Последовательность ση(ρ) имеет предел р\ ^ ро· Заметим, что вследствие непре
рывности σ(·) предел р\ удовлетворяет равенству
<r(pi)-Pi= Umσ(ση(ρ)) -pi =pi -pi =0.
п—юо
Из единственности замкнутой орбиты следует, что р\ — ро, т. е. траектория, соот
ветствующая значению р, сходится по спирали к единственной замкнутой орбите
при t —> оо. Аналогичное утверждение можно получить и для случая ρ < ρο· Δ
Следующий результат, известный как критерий Бендиксона, может исполь
зоваться в некоторых случаях для установления существования периодических
орбит.
Лемма 2.2 (критерий Бендиксона). Если выражение dfi/dxi + dj\jdxi
не равно тождественно нулю и не изменяет знак на односвязной области^
1
D
16
См. теорему 3.4.
17
Область D называется односвязной (simply connected), если для каждой простой замкнутой
кривой С на D ее внутренность является подмножеством D. Внутренность любой окружности
односвязна, но кольцеобразная область 0 < с\ ^ х\+Х2 ^ сч не является односвязной. Выражаясь
неформально, односвязность означает отсутствие «дыр».
2.6. СУЩЕСТВОВАНИЕ ПЕРИОДИЧЕСКИХ ОРБИТ
71
на плоскости, то система (2.7) не имеет периодических орбит, полностью ле
жащих в D.
ДОКАЗАТЕЛЬСТВО. ДЛЯ любой орбиты (2.7) мы имеем dx^jdxx = /2//1.
Следовательно, для каждой замкнутой орбиты 7 справедливо равенство
f2(xiiX2)dxl
~
fl(Bl,X2)dX2 = 0.
Тогда, используя теорему Грина, мы получаем
где S — внутренность η. Если df\/dx\ + д/2/дх2 > 0 (ил
и<0)наD,то
невозможно найти такую область S С D, что выполнено предыдущее равенство.
Следовательно, не существует замкнутых орбит, целиком принадлежащих D. Π
Пример 2.10. Рассмотрим систему
xi = Л(жъж2) =а;2,
#2 = /2(^1^2) =
а
^1+ЬХ2- х\х2 ~ хЬ
и пусть D — вся плоскость. Тогда мы имеем
dfi/dxi + df2/dx2 = b-xj.
Следовательно, при 6 < 0 не существует периодических орбит.
Δ
В заключение этого параграфа мы сформулируем важный результат, который
связывает существование периодических орбит с точками равновесия. В этом ре
зультате используется индекс (число вращения), введенный Пуанкаре. Рассмот
рим систему второго порядка (2.7), и пусть С — простая замкнутая кривая, не
проходящая через точку равновесия системы (2.7). Рассмотрим ориентацию век
торного поля f(x) в точке ρ G С. При движении точки ρ вдоль кривой С против
часовой стрелки вектор f(x) вращается непрерывно и после возвращения в свое
начальное положение должен совершить оборот на угол 2пк, где к — некото
рое целое число (угол измеряется против часовой стрелки). Целое число к на
зывается индексом замкнутой кривой С. Если замкнутая кривая окружает одну
изолированную точку равновесия х, то к называется индексом точки х. Читатель
может доказать в качестве упражнения (см. упражнение 2.25) следующую лемму.
Лемма 2.3.
(a) Индекс узла, фокуса или центра равен +1.
(b) Индекс (гиперболической) седловой точки равен —1.
(c) Индекс замкнутой орбиты равен +1.
L
72
ГЛАВА 2
(d) Индекс замкнутой кривой, которая не окружает ни одной точки равнове
сия, равен +1.
(e) Индекс замкнутой кривой равен сумме индексов точек равновесия, которые
окружены этой кривой.
Следствием этой леммы является
Следствие 2.1. Внутри любой периодической орбиты η должна находить
ся по крайней мере одна точка равновесия. Предположим, что точки равновесия
внутри орбиты являются гиперболическими. Тогда если N — число узлов и фо
кусовиS —числоседловых точек,тоN —S =1.
Напомним, что точка равновесия является гиперболической, если якобиан
в этой точке не имеет чисто мнимых собственных значений. Если точка равно
весия не является гиперболической, то ее индекс может отличаться от ±1. (См.
упражнение 2.26.)
Метод индексов обычно является полезным при установлении существова
ния периодических орбит в определенных областях на плоскости.
Пример 2.11. Система
±1 = -Xi +X1X2,
#2=XI+#2-2xiX2
имеет две точки равновесия в (0,0) и (1,1). Матрицы Якоби в этих точках имеют
вид
Ж
дх (0,0)
-10'
11?Ж
дх (1Д)
"0 1"
-1
-1
Следовательно, (0,0) — седловая точка и (1,1) — устойчивый фокус. Единствен
ная комбинация точек равновесия, которые могут быть окружены периодической
орбитой, — одиночный фокус. Другие варианты периодических орбит, например
периодическая орбита, окружающая обе точки равновесия, исключены.
Δ
2.7. Бифуркации
Качественное поведение систем второго порядка определяется типом ее то
чек равновесия и периодическими орбитами, а также другими ее свойствами
устойчивости. Один из важных практических вопросов заключается в сохране
нии системой своих характеристик качественного поведения при бесконечно ма
лых возмущениях. Если система сохраняет эти свои свойства, то она называется
структурно-устойчивой. В этом параграфе мы займемся проблемой структурной
устойчивости. В частности, мы будем рассматривать возмущения, которые бу
дут изменять точки равновесия системы или ее периодические орбиты и другие
характеристики устойчивого поведения. Рассмотрим, например, систему
xi=μ-х\,
%2=
- Х2,
2.7. БИФУРКАЦИИ
которая зависит от параметра μ. При μ > О система имеет две точки равновесия
(y/fi,0) и (—y/fi,0). Матрица Якоби линеаризованной системы в точке (у^О)
имеет следующий вид:
[-2V/I 0 1
L°
-1
_Г
т. е. (y/μ, 0) — устойчивый узел. Аналогично матрица Якоби линеаризованной
системы в точке (—>/μ, 0) имеет следующий вид:
L°
~Ч
т.е. (—д/Д,0) — седловая точка. При уменьшении μ седловая точка и узел при
ближаются друг у другу, сталкиваются друг с другом при μ = 0 и исчезают
при μ < 0. При прохождении μ через нулевое значение мы можем наблю
дать существенное изменение фазового портрета системы. На рис. 2.27 показаны
фазовые портреты при положительном, нулевом и отрицательном значениях μ.
При положительном и сколь угодно малом значении μ все траектории в обла-
Рис. 2.27. Фазовый портрет системы из примера с бифуркацией «седло-узел» при μ > 0
(слева), μ = 0 (в центре), μ < 0 (справа)
сти {х\ > —^/μ} достигают устойчивого состояния в седловой точке, при от
рицательном μ все траектории стремятся к бесконечности. Такое изменение ка
чественного поведения называется бифуркацией. Более строго, бифуркацией на
зывается изменение точек равновесия или периодических орбит или изменение
свойств устойчивости при изменении параметра. Этот параметр называется па
раметром бифуркации, а значения параметра, при которых происходят эти изме
нения, — точками бифуркации. В предыдущем примере параметром бифуркации
является μ, а точкой бифуркации — μ = 0.
Бифуркация, которую мы наблюдали в предыдущем примере, может быть
изображена в виде бифуркационной диаграммы, которая показана на рис. 2.28(a).
На диаграмме показана мера амплитуды (или норма) точек равновесия по отно
шению к параметру бифуркации. Устойчивый узел представлен сплошной ли
нией, а седловая точка — пунктирной. Ординатой бифуркационной диаграммы
является мера амплитуды точек равновесия или периодических орбит; сплош
ные линии представляют устойчивые узлы, устойчивые фокусы и устойчивые
74
ГЛАВА 2
(а) Бифуркация седло—узел
(Ь) Транскритическая бифуркация
μ
t*
(с) Суперкритическая бифуркация вилка
(d) Субкритическая бифуркация вилка
_1
1
^
\\
μ
β
(е) Суперкритическая бифуркация Хопфа (f) Субкритическая бифуркация Хопфа
Рис. 2.28. Бифуркацонные диаграммы
предельные циклы, а пунктирные линии — неустойчивые узлы, неустойчи
вые фокусы и неустойчивые предельные циклы. Бифуркация, изображенная на
рис. 2.28(a), называется бифуркацией «седло-узел», поскольку она возникает при
столкновении седловой точки и узла. Заметим, что матрица Якоби имеет нулевое
собственное значение в точке бифуркации. Эта особенность свойственна всем
бифуркациям, изображенным на рис. 2.28(a)-(d), которые являются примерами
бифуркаций с нулевым собственным значением. На рис. 2.28(b) показана тран
скритическая бифуркация, которая характеризуется тем, что при ее прохождении
точки равновесия остаются неизменными, но их свойства устойчивости изменя
ются. Например, рассмотрим систему
х\=μΧ\—хъ
±2 = —Х2·
Эта система имеет две точки равновесия (0,0) и (μ, 0). Матрица Якоби в (0,0)
имеет вид:
\μ 0]
[θ -l}
т. е. точка (0,0) является устойчивым узлом при μ < 0 и седловой точкой при
μ > 0. С другой стороны, матрица Якоби в (μ, 0) имеет вид:
-μ 0"
0-1
2.7. БИФУРКАЦИИ
75
т. е. точка (μ, 0) является седловой точкой при μ < 0 и устойчивым узлом при
μ > 0. Таким образом, точки равновесия сохраняются при прохождении через
точку бифуркации μ = 0, но (0,0) изменяется из устойчивого узла в седловую
точку, а (μ, 0) — из седловой точки в устойчивый узел.
Прежде чем перейти к описанию других типов бифуркаций, диаграммы ко
торых изображены на рис. 2.28, отметим важное различие между предыдущими
двумя примерами. Во втором примере прохождение через точку бифуркации при
водит к тому, что точка равновесия в начале координат изменяется из устойчиво
го узла в седловую точку, но одновременно возникает устойчивый узел в (μ, 0),
который при малом μ будет близок к началу координат. Это означает, что воздей
ствие бифуркации на систему не столь драматично. Предположим, например, что
значение параметра μ в исходной системе отрицательно, т. е. начало координат
представляет собой устойчивый узел. Из фазового портрета такой системы вид
но, что все траектории в множестве {х\ > μ} сходятся к началу координат при
стремлении времени к бесконечности. Предположим, что исходное значение μ
настолько мало, что малые возмущения этого параметра могут привести к тому,
что он станет положительным. Тогда начало координат станет седловой точкой,
а (μ, 0) — устойчивым узлом. Тогда из фазового портрета системы видно, что все
траектории в множестве {xi > 0} сходятся к устойчивому узлу (μ, 0) при стрем
лении времени к бесконечности. При малых значениях μ устойчивая рабочая точ
ка системы будет близка к началу координат. Таким образом, хотя возмущенная
система и не имеет желаемого устойчивого поведения, она тем не менее близка
к нему. В примере бифуркации «седло-узел» ситуация совершенно иная. Пред
положим, что значение параметра μ в исходной системе положительно, т. е. все
траектории в множестве {х\ > —y/μ} сходятся к устойчивому узлу (д/Д, 0) при
стремлении времени к бесконечности. Если исходное значение μ мало и малые
возмущения этого параметра приводят к тому, что он становится отрицатель
ным, то устойчивый узел исчезает и траектории должны будут отклоняться от
желаемой устойчивой рабочей точки или даже стремиться к бесконечности, как
в этом конкретном примере. Вследствие указанных различий в воздействии на
устойчивое поведение, бифуркация в примере с транскритической бифуркаци
ей называется безопасной или мягкой, а бифуркация в примере с бифуркацией
«седло-узел» — опасной или жесткой.
Безопасные и опасные бифуркации можно видеть и на диаграммах, изобра
женных на рис. 2.28(c) и (d), на которых показаны суперкритическая бифуркация
«вилка» и субкритическая бифуркация «вилка» соответственно. Бифуркация пер
вого типа возникает, например, в следующей системе:
х\ —μΧ\—х\,
#2 = —Х2·
При μ < 0 имеется единственная точка равновесия в начале координат. Вы
числив матрицу Якоби, можно показать, что эта точка является седловой. При
μ > 0 существует три точки равновесия (0,0), (^/μ, 0) и (—>/μ? 0)· Первая из них
76
ГЛАВА 2
является седловой точкой, а оставшиеся две — устойчивыми узлами. При про
хождении μ через точку бифуркации μ = 0 устойчивый узел в начале координат
превращается в седловую точку и одновременно возникают еще два устойчивых
узла в (±y/fi, 0). Амплитуда возникших устойчивых узлов возрастает при увели
чении μ и, следовательно, она мала при малом μ. Субкритическая бифуркация
«вилка» возникает, например, в следующей системе:
±\ = μΧ\ +х?,
#2 = —Х2-
При μ < 0 существует три точки равновесия: устойчивый узел в (0,0) и две
седловых точки (i^/^/i, 0). При μ > 0 имеется единственная точка равнове
сия в начале координат и она является седловой точкой. При прохождении μ
через точку бифуркации μ = 0 устойчивый узел в начале координат сталкива
ется с седловыми точками (±y/^ji, 0) и превращается в седловую точку. Срав
нивая суперкритическую и субкритическую бифуркации, можно заметить, что
суперкритическая является безопасной, а субкритическая — опасной. В частно
сти, если система имеет номинальную рабочую точку в устойчивом узле (0,0)
при μ < 0, то при суперкритической бифуркации «вилка» обеспечивается устой
чивое поведение при малом положительном возмущении параметра μ, а после
субкритической бифуркации «вилка» траектории начинают отклоняться от но
минальной рабочей точки.
В рассмотренных простых примерах бифуркаций с нулевыми собственными
значениями траектории стремились к бесконечности в опасных случаях. В более
сложных примерах система может иметь другие точки равновесия или перио
дические орбиты, которые не изменяются при рассматриваемых бифуркациях.
Траектории, отклоняющиеся от подвергающейся бифуркации точки равновесия,
могут не уходить на бесконечность, но притягиваться другой точкой равнове
сия или периодической орбитой. Такая ситуация может быть проиллюстрирована
следующим примером.
Пример 2.12. Рассмотрим цепь с туннельным диодом из параграфа 1.2.2:
х\ = ^[-Л(ж1)+ж2],
Х2= γ[—Χ\ —R%2+ μ]·
Вольт-амперная характеристика диода h(-) изображена на рис. 1.2 и μ пред
ставляет собой постоянный вход системы. Исследуем бифуркации при измене
нии μ. Точки равновесия системы представляют собой пересечения кривой #2 —
= h(x\) с нагрузочной прямой х^ = (μ — x\)/R. В примерах 2.1 и 2.3 (см.
также рис. 2.29(a)) мы показали, что при μ < А имеется устойчивый узел на
левой ветке; при А < μ < В имеется три точки равновесия — седловая точка
на средней ветке и два устойчивых узла на двух других ветках; при μ > В име
ется устойчивый узел на правой ветке. Бифуркационная диаграмма изображена
2.7. БИФУРКАЦИИ
77
Вхх
Вμ
(a)
(b)
Рис. 2.29. К примеру 2.12: (а) нахождение точек равновесия; (Ь) диаграмма бифуркации
на рис. 2.29(b). Имеется две бифуркации «седло-узел» при μ = А и μ = В. За
метим, что при исчезновении устойчивого узла после столкновения с седловой
точкой уходящие на бесконечность траектории начинают притягиваться другим
устойчивым узлом, который не изменился при бифуркации.
Δ
Когда устойчивый узел теряет устойчивость после прохождения точки би
фуркации, собственное значение якобиана проходит через нулевое значение. Те
ряет ли устойчивость в подобной ситуации устойчивый фокус? В этом случае два
комплексно-сопряженных собственных числа должны пройти через мнимую ось.
На рисунках 2.28(e) и (f) показаны эти ситуации: на первом рисунке изображена
суперкритическая бифуркация Хопфа, а на втором — субкритическая бифуркация
Хопфа
х%
.
Суперкритическая бифуркация Хопфа возникает, например, в системе
xi =xi^-x\-x\)
- x2,
х2=Χ2(μ-х\-х\)+хи
которая может быть представлена в полярных координатах
х\=т cosθ и Х2=гsinθ
и 0=1.
в следующем виде:
г—μτ
—
г
3
Система имеет единственную точку равновесия в начале координат. Фазовые
портреты для двух случаев, соответствующих μ с различными знаками, пока
заны на рис. 2.30. При μ < 0 начало координат является устойчивым фокусом
и все траектории притягиваются к нему, а при μ > 0 начало координат является
неустойчивым фокусом, но имеется устойчивый предельный цикл, который при
тягивает все траектории за исключением нулевого решения. Предельный цикл
18
Используются также термины «бифуркация Андронова-Хопфа» и «бифуркация Пуанкаре-
Андронова-Хопфа», чтобы подчеркнуть наличие более ранних работ Андронова и Пуанкаре.
78
ГЛАВА 2
Рис. 2.30. Фазовый портрет суперкритической бифуркации Хопфа при μ < 0 (слева)
иμ >0(справа)
задается уравнением г = y/μ, т. е амплитуда колебаний возрастает с увеличе
нием μ и мала при малом μ. Рассматриваемая бифуркация является безопасной,
т. к. при исчезновении устойчивого фокуса вследствие малого возмущения систе
ма будет порождать устойчивое колебание с малой амплитудой. Для того чтобы
изучить поведение собственных значений при бифуркации, заметим, что якобиан
в начале координат
[μ-il
имеет собственные значения μ ± j, которые пересекают мнимую ось слева на
право при увеличении μ из области отрицательных значений в область положи
тельных значений.
Субкритическая бифуркация Хопфа возникает в системе
xi=xi[μ+(х\+х\)-{х\+xl)2)-Х2,
х2=Χ2[μ+{xl+xl)-(х\+xl)2]+xu
которая в полярных координат имеет следующий вид:
г= μΓ+τ·
3
-г
5
и 0=1.
Эта система имеет единственную точку равновесия в начале координат, которая
является устойчивым фокусом при μ < 0 и неустойчивым фокусом при μ > 0.
Предельный цикл системы может быть определен из следующего уравнения:
0=μ+г
2
-
г
4
.
При μ < 0 имеется два предельных цикла, определяемых равенствами г
2
=
= (1± у/1+4μ)/2. Из графика функции г(г) —г(μ+ г
2
—
г
4
) (см. рис. 2.31)
можно видеть, что предельный цикл г
2
= (1 + у/1 + 4μ)/2 является устойчивым,
2.7. БИФУРКАЦИИ
Рис. 2.31. График гμ + г
3
—
г
5
приμ <0(слева) иμ > О(справа)
аг
2
= (1 — у/1 + 4μ)/2 — неустойчивым. При малом |μ| неустойчивый предель
ный цикл может быть аппроксимирован уравнением г
2
= —μ.Приμ > 0имеется
только один устойчивый предельный цикл г
2
= (1 + у/1 + 4μ)/2. Таким образом,
при увеличении μ из области отрицательных значений в область положительных
значений устойчивый фокус в начале координат сливается с неустойчивым пре
дельным циклом и превращается в неустойчивый фокус (см. бифуркационную
диаграмму 2.28(f)). Заметим, что устойчивый предельный цикл не показан на
бифуркационной диаграмме, т. к. изменение μ приводит лишь к изменению его
амплитуды. Субкритическая бифуркация Хопфа является опасной, т. к. малое воз
мущение номинального устойчивого фокуса в начале координат может привести
к тому, что траектории начнут отклоняться от начала координат и притягиваться
к устойчивому предельному циклу.
Все показанные на рис. 2.28 бифуркации происходили в окрестности точки
равновесия. Поэтому они называются локальными. Существуют также глобаль
ные бифуркации, которые происходят на больших областях пространства состо
яния и не могут быть описаны в окрестности какой-либо точки равновесия. Мы
рассмотрим лишь один пример глобальной бифуркации
19
.
Рассмотрим систему
XI=Х2,
±2=μ#2+Х\- х\+#1#2·
Имеются две точки равновесия в (0,0) и (1,0). С использованием линеариза
ции системы мы можем установить, что (0,0) всегда является седловой точкой,
а (1,0) — неустойчивым фокусом при — 1 < μ < 1. Ограничимся рассмотрением
системы при — 1 < μ < 1. На рис. 2.32 показан фазовый портрет для четырех
различных значений μ. Фазовые портреты при μ = —0.95 и —0.88 типичны для
случаяμ<μ0 « —0.8645,априμ = —0.8 —типичныдляслучаяμ>μ0. При
μ < μ0 имеется устойчивый предельный цикл, который окружает неустойчивый
фокус. При приближении значения μ κ μα предельный цикл расширяется до тех
пор, пока не коснется седловой точки при μ = μα. При этом возникает траек
тория, которая начинается и заканчивается в седловой точке. Такая траектория
Другие примеры могут быть найдены в [187].
80
ГЛАВА 2
Рис. 2.32. Гомоклинические бифуркации
называется гомоклинической орбитой. При μ > μ0 предельный цикл исчезает.
Заметим, что эта бифуркация не приводит к изменениям точек равновесия (0,0)
и (1,0). Такой тип бифуркации называется гомоклинической бифуркацией (saddle-
connection, homoclinic bifurcation).
2.8. Упражнения
2.1. Для каждой из нижеследующих систем найти все точки равновесия и опре
делить тип каждого изолированного состояния равновесия:
(l)*i
(2)±i
(3)ii
(4)*i
(5)±i
(β) ii
= -xi +2xf+x2,
= Xi +XiX2,
= [1 — x\ — 2h(x)]xi,
= a?2,
= (xi -»2)(1 -x\ ~
= -x\ +a?2>
^2)5
X2——Xl—X2\
±2= —ЯГ2+^2+
x
lx2 - X?;
x2 = [2 - h{x)]x2\
X2= —xi+2:2(1- X?+O.lx
X2 = (X1+X2XI-X1-X2);
X2=Xl—X2·
В четвертой системе h{x) = хг/(1 + #i)·
2.2. Для каждой из нижеследующих систем найти все точки равновесия и опре
делить тип каждого изолированного состояния равновесия:
(1)Xi=Х2,
Х2= -Xl+jzx\ -Х2\
2.8 . УПРАЖНЕНИЯ
(2)Xi=2xi-ХхХ2,
Х2=2х\ - Х2\
(3)±i=х2,
х2=-Х2-Ф(хг-жг)·
В третьей системе φ (у) = у
3
+ 0.5?/, если |?/| ^ 1, и ?/>(?/) = 2?/ - 0.5 sign(?/), если
Ivl>1.
2.3. Для каждой системы из упражнения 2.1 построить фазовый портрет и обсу
дить качественное поведение системы.
2.4. Фазовые портреты нижеследующих систем изображены на рис. 2.33.
4
2
0
-2
-4
-4
-2
2
1
0
-1
\\
V
/~Л^
\
Cf)/
Х
1
о
(1)
1ь
уJJь
-2
-I
0
(3)
Рис. 2.33. Фазовые портреты систем из упражнения 2.4
(1)xi =х2,
±2 = х\ + 2arctg(xx + х2);
(2)±i=2х\ -Х\Х2,
Х2=2х\ - Х2;
(3)xi =х2,
#2= -#1+жг(1-3xf -2х|);
(4)хх= -(хх - х$)+/i(x), х2 = -(х2- х2)+ h(x).
В четвертой системе h(x) = 1 — х\ — х2
.
Укажите стрелками направления дви
жения вдоль траекторий и обсудите качественное поведение систем.
2.5. Система
Х2
^_
_
,
Хх
XX
-XX
-
#2
Inу/х\ + х|
имеет точку равновесия в начале координат.
-Х2 +
Inу/х\ + х\
82
ГЛАВА 2
(a) Линеаризовать систему в окрестности начала координат и показать, что на
чало координат является устойчивым узлом линейной системы.
(b) Построить фазовый портрет нелинейной системы вблизи начала координат
и показать, что этот портрет имеет сходство с фазовым портретом устойчи
вого фокуса. (Указание: представьте уравнения системы в полярных коорди
натах.)
(c) Объясните различие результатов (а) и (Ь).
2.6. Рассмотрим систему
±2= -{а+Ь)х\+Ьх\- х\Х2,
Х\= —Х\+аХ2—Ьх\Х2+£2>
гдеа>0иbΦ0.
(a) Найти все точки равновесия системы.
(b) Определить тип каждой изолированной точки равновесия для всех значений
а>0иЬφ0.
(c) Для каждого из нижеследующих случаев построить фазовый портрет и об
судить качественное поведение системы:
i. а=Ъ=1;
ii. a= 1,b= -i;
iii. α=1,b= —2.
2.7. Рассмотрим генератор с отрицательным сопротивлением из параграфа 1.2.4
при
Λ(ν) = -1; + ν3-Ιν5 + _1_1;7
и ε = 1. Построить фазовый портрет в х-координатах и обсудить качественное
поведение системы.
2.8. Рассмотрим систему
1*>
XI=Х2, Х2= -Xl+Jg#l-#2·
(a) Найти точки равновесия и определить тип каждой изолированной точки рав
новесия.
(b) Без использования компьютерного моделирования нарисовать фазовый
портрет системы.
2.9. В задаче управления скоростью движения автомобиля по плоскому шос
се (круиз-контроль, cruise-control) динамика продольной скорости может быть
промоделирована с использованием второго закона Ньютона дифференциальным
уравнением первого порядка
mv=и—Ксsign(v)—KfV—Kav
2
,
2.8. УПРАЖНЕНИЯ
83
где т — масса автомобиля, ν — его скорость, и — тяговое усилие двигателя,
Кс sign(f) — сила сухого трения, KfV — сила вязкого трения и Kav
2
—
аэродина
мическое сопротивление воздуха. Коэффициенты Кс, Kf и Ка неотрицательны.
Используется пропорционально-интегральное управление и = Kja + Kp(vd — v),
где Vd — желаемая скорость движения, σ — переменная состояния интегратора
σ — Vd — ν и Ki, Кρ — положительные константы. Далее будет рассматриваться
случай ν ^ 0.
(a) Используя х\ = σ и Х2 = ν в качестве переменных состояния, построить
модель состояния системы.
(b) Пусть Vd — положительная константа. Найти точки равновесия и определить
тип каждой изолированной точки равновесия.
(c) Построить фазовый портрет системы и обсудить качественное поведение
системыприт = 1500кг,Кс = 110Н,Kf —2.5Н/м/с, Ка
=
= 1Н/м
2
/с
2
, Х7=15,Кρ=500иvd=30м/с.
(d) Выполнить задание (с) при Kj = 150 и сравнить с предыдущим результатом.
(e) Выполнить задание (с) с введением насыщения в канале управления, т.е.
ограничить значения и\ 0 < и ^ 1800 Н. Сравнить с результатом задания (с).
2.10. Рассмотрим цепь с туннельным диодом из параграфа 1.2.2 при численных
значениях, указанных в примере 2.1 за исключением R и Е9 которые в этом
упражнении должны быть следующими: Ε = 0.2 В и R = 0.2 кОм.
(a) Найти точки равновесия и определить тип каждой изолированной точки рав
новесия.
(b) Построить фазовый портрет системы и обсудить качественное поведение
системы.
2.11. Решить предыдущее упражнение при Ε = 0.4 В и R = 0.2 кОм.
2.12. Рассмотрим модель нейронной сети Хопфилда из параграфа 1.2.5 при η =
= 2,VM=1ИТ21=Т\2—1.Приг=1,2положитьЦ=0,Сг= 1,р%—
= 1, Т« = 0 и дг(и) = (2/тг) arctg(A7m/2).
(a) Найти точки равновесия и определить тип каждой изолированной точки рав
новесия.
(b) При λ = 5 построить фазовый портрет системы и обсудить качественное
поведение системы.
2.13. Эквивалентная цепь осциллятора Вена-Бриджа (Wien-Bridge) показана на
рис. 2.34 [40], где gfa) — нелинейный управляемый источник напряжения.
(а) Используя х\ = v\ и Х2 = V2 в качестве переменных состояния, показать,
что модель состояния определяется уравнениями
84
ГЛАВА 2
(b)ПустьCi=С2=Ri=ii2=1иg{v)=3.234u-2.195υ3
+ О.бббг;
5
.
Построить фазовый портрет системы и обсудить качественное поведение
системы.
+
υ2
Рис. 2.34. К упражнению 2.13
2.14. Рассмотрим систему «груз-пружина» с учетом силы сухого трения
ту+ку+су+т/О/,у)=О,
где величина η определена в параграфе 1.2.3. Используя метод кусочной линеари
зации, построить фазовый портрет системы и обсудить качественное поведение
системы.
2.15. Рассмотрим систему
XI=Х2, Х2=Uy
где управляющее воздействие и может принимать значения ±1.
(a) Построить фазовый портрет системы при и = 1.
(b) Построить фазовый портрет системы при и = — 1.
(c) Сравнивая эти два фазовых портрета, разработать стратегию переключения
управления между значениями ±1 так, чтобы каждая точка пространства
состояния могла быть перемещена в начало координат за конечное время.
2.16. Система «хищник-жертва» может быть промоделирована следующей си
стемой [202]:
xi=xi(l- xi-охг)» ^2=bx2{xi-Х2),
где xi и Х2 — безразмерные переменные, которые пропорциональны численно-
стям популяций жертв и хищников соответственно; а и Ъ — положительные кон
станты.
(a) Найти точки равновесия и определить тип каждой изолированной точки рав
новесия.
(b) Построить фазовый портрет системы в первом квадранте (xi ^ 0, Х2 ^ 0)
при а — 1, Ь — 0.5 и обсудить качественное поведение системы.
2.8. УПРАЖНЕНИЯ
85
2.17. Для каждой из нижеследующих систем показать, используя критерий
Пуанкаре-Бендиксона, что система имеет периодическую орбиту:
{1)у + у = еу(1-у
2
-у
2
);
(2) ±i
= х2,
±2= -xi +#2(2-Зх?- 2х\)\
(3)Х\ =Х2,
Х2= —Х\+ Х2—2(Ж1+ 2X2)^2?
(4) х\
= х\ + Х2—X\h{x),
±2= —2xi +Х2—X2h(x).
В четвертой системе h{x) = max{|xi, |x2|}.
2.18 (консервативная система). Рассмотрим систему второго порядка
xi=х2, Х2=
- д{х\),
где д — непрерывно дифференцируемая функция и zg(z) > 0 при z Φ 0, zG
(—α, α). Рассмотрим функцию энергии
V{x) = \xl + p g(z)dz.
(a) Показать, что V(x) остается постоянной вдоль решений системы.
(b) Показать, что для достаточно малого значения ||х(0)|| каждое решение пе
риодично.
(c) Предположим, что zg(z) > О при z φ О, z £ (—оо, оо) и
У
g(z)dz —• оо при у —> оо.
Показать, что каждое решение является периодическим.
(d) Предположим, что g(z) = — </(—z), и положим G(y) = f£ g{z)dz. Показать,
что траектория, проходящая через точку (А, 0), определяется равенством
x2=
±y/2[G{A)-G{x1)).
(e) Используя результат (d), показать, что период колебаний замкнутой траекто
рии, проходящей через точку (Л, 0), определяется равенством
Т(А)=2^2/
^
-.
Уо [G(^)-G(xi)]1/2
(f) Обсудить, как можно использовать результат (d) при построении фазового
портрета системы.
2.19. Построить фазовый портрет и исследовать периодические решения системы
из предыдущего упражнения при:
(1) д(хг) = sinxb (2) д(хг) = хх + х?, (3) д{х\) = х\.
L
86
ГЛАВА 2
Для каждого случая определить период колебаний периодической орбиты, про
ходящей через точку (1,0).
2.20. Для каждой из нижеследующих систем показать, что система не имеет пре
дельных циклов:
(1)±i= -xi +х2,
±2=g(xi)+а>Х2, α^1;
(2)±i= -Х\+х\+Х\х\,
Х2=-Х2+х\+ х\х2\
(3)Х\—1
—
Х\х\,
±2=Х\',
(4) Xi = Х\Х2,
Х2=%2\
(5) х\ = £2Cos(xi),
±2 = sin(xi).
2.21. Рассмотрим систему
х\ = -xi+X2(#i+а)-6, Х2= -cxi(xi+а),
где а, 6 и с — положительные константы и 6 > а. Пусть
D={xeR
2
\x1<-aux2<^±^Y
(a) Показать, что каждая траектория, начинающаяся в D, остается в D для всех
будущих моментов времени.
(b) Показать, что не существует периодических орбит, проходящих через какую-
либо точку х G D.
2.22. Рассмотрим систему
XI= аХ\+XlX2, X2=Ьх\ —СХ2,
гдеа,6ис—положительныеконстантыис>а.ПустьD={хеД
2
|Х2^0}.
(a) Показать, что каждая траектория, начинающаяся в D, остается в D для всех
будущих моментов времени.
(b) Показать, что не существует периодических орбит, проходящих через какую-
либо точку х е D.
2.23 ([85]). Рассмотрим систему
xi = Х2, Х2= -[26- g(xi)]ax2 - а
2
х\,
где а и 6 — положительные константы и
xi|>1,
|xi|<i.
(a) Используя критерий Бендиксона, показать, что не существует периодиче
ских орбит при к < 26.
(b) Используя критерий Пуанкаре-Бендиксона, показать, что существует пери
одическая орбита при к > 26.
2.8 . УПРАЖНЕНИЯ
87
2.24. Рассмотрим систему второго порядка и предположим, что множество Μ =
={xf+x|^а
2
} обладает тем свойством, что каждая траектория, начинающаяся
в М, остается в Μ для всех будущих моментов времени. Показать, что Μ содер
жит точку равновесия.
2.25. Доказать лемму 2.3, исследуя векторные поля.
2.26 ([70]). Для каждой из нижеследующих систем показать, что начало коорди
нат не является гиперболической точкой равновесия, найти индекс начала коор
динат и доказать, что этот индекс не равен ±1:
(1)Xi=х\,
Х2=
- Х2\
(2)Х\=х\ —х\,
±2 = 2xi#2·
2.27. Для каждой из нижеследующих систем определить и классифицировать
бифуркации, которые возникают при изменении μ:
(1)Xi=Х2,
Х2=μ(^1+
х
2)—
х
2—х\ -Зх?Х2;
(2)±i= -х\ +Х2, #2= -(1+μ
2
)#1+2μΧ2- дх?+2(х2- MXi)3;
(3)±i=х2,
±2 = μ-Χ2~
х\~ Ъх\Х2',
(4)х\ =Х2,
±2= -(1+Ц
2
)х\ + 2μ£2 + V>x\ - x\xi\
(5)x\ =X2,
X2—μ{Χ\+X2)—X2- x\ +3x?X2;
(6)±i=X2,
±2=μ(#1+жг)-X2- x\- 2xix2.
2.28. Следующая модель используется при анализе взаимодействия между тор
мозящим и возбуждающим нейронами в биологической системе [195]. В своей
простейшей форме эта модель описывает взаимодействие двух нейронов. Пере
менными состояния являются х\ — выход возбуждающего нейрона их2~ выход
тормозящего нейрона. Уравнения эволюции системы имеют вид
х\ = ~jX\ + th(Axi) - th(Ax2),
±2 = -jXi + th(Axi) + th(Ax2),
где τ > 0 — постоянная времени и А — коэффициент усиления.
(a) Используя критерий Пуанкаре-Бендиксона, показать, что система имеет пе
риодическую орбиту при Хт > 1.
(b) Построить фазовый портрет системы при г = 1, А = 2 и обсудить каче
ственное поведение системы.
(c) Выполнить задание (Ь) при τ = 1, А = 1/2.
(d) Определить и классифицировать бифуркации, которые возникают при изме
нении μ = Аг.
2.29. Модель химического осциллятора [187] имеет вид
4xiX2
·
и
(л
Х2\
xi=а-xi
-,
Х2=bxi\1-
14- х(
V*+
х
1
88
ГЛАВА 2
где х\ и х2 — безразмерные концентрации химических реагентов и а, Ь — поло
жительные константы.
(a) Используя критерий Пуанкаре-Бендиксона, показать, что система имеет пе
риодическую орбиту при Ь < За/5 — 25/а.
(b) Построить фазовый портрет системы в первом квадранте при а = 10, Ь = 2
и обсудить качественное поведение системы.
(c) Выполнить задание (Ь) при а = 10, 6 = 4.
(d) Определить и классифицировать бифуркации, которые возникают при изме
нении b и фиксированном а.
2.30. Биохимический реактор может быть представлен моделью
xi=[к
-
aJxi, х2 = d(x2f - х2)
УтХ\Х2
Y(km + х2)'
где переменные состояния и неотрицательные константы d, дт, кт, Υ и ^2/ опре
делены в упражнении 1.22. Пусть μπ1 — 0.5, кт — 0.1, У = 0.4 и #2/ = 4.
(a) Найти все точки равновесия при d > 0 и определить тип каждой из них.
(b) Исследовать бифуркации при изменении d.
(c) Построить фазовый портрет системы и обсудить качественное поведение
системы при d = 0.4.
2.31. Биохимический реактор может быть представлен моделью
(
ЦтХ2
,\
.
,,
ч
Mm^l^2
xi=
—-
- d]xi,
x2=d{x2f -х2) -
km+x2+kiX2 J
Y(km + x2 + kixZ)
где переменные состояния и неотрицательные константы rf,/xm,fcm, &1,У и #2/
определены в упражнении 1.22. Пусть /хт = 0.5, кт = 0.1, fci = 0.5, Υ = 0.4
их2/=4.
(a) Найти все точки равновесия при d > 0 и определить тип каждой из них.
(b) Исследовать бифуркации при изменении d.
(c) Построить фазовый портрет системы и обсудить качественное поведение
системы при d = 0.1.
(d) Выполнить задание (с) при d = 0.25.
(e) Выполнить задание (с) при d = 0.5.
ГЛАВА 3
Фундаментальные свойства
В этой главе формулируются некоторые основные свойства решений обык
новенных дифференциальных уравнений — их существование, единственность,
непрерывная зависимость от начальных данных и параметров. Эти свойства име
ют важное значение при исследовании математической модели состояния х =
= f(t,x) физических систем. При проведении экспериментов с физической си
стемой, например с маятником, мы предполагаем, что, находясь в момент време
ни to в некотором заданном состоянии, система начнет двигаться и ее состояние
может быть определено во все будущие моменты времени t > to (или, по край
ней мере, в момент начала движения). Более того, в случае детерминированной
системы мы предполагаем, что, если мы проведем повторный полностью ана
логичный эксперимент, мы получим аналогичную эволюцию системы и то же
состояние в момент времени t > to, которым характеризовалась система при
проведении первого эксперимента. Для достоверного предсказания будущего со
стояния системы на основании информации о ее текущем состоянии в момент
времени to необходимо, чтобы задача с начальными данными
x = f(t,x),
x(t0) = xo
(3.1)
имела единственное решение. Эта проблема связана с вопросом о существова
нии и единственности решений, который будет рассматриваться в параграфе 3.1.
Будет показано, что существование и единственность могут быть обеспечены
в предположении, что функция f(t,x) в правой части этого уравнения удовле
творяет некоторым условиям. Ключевым ограничением, используемым в пара
графе 3.1, является условие Липшица, заключающееся в том, что f(t,x) удовле
творяет неравенству
1
\\f(t,x)-f(t,y)\\^L\\x-y\\
(3.2)
для всех (t,x) и (t,y) в некоторой окрестности to,xo)·
Одним из важнейших факторов, свидетельствующих о достоверности мате
матической модели, представленной в виде дифференциального уравнения, явля
ется непрерывная зависимость этого уравнения от начальных данных. По край
ней мере, мы ожидаем от этой математической модели, что произвольные малые
отклонения начальных данных не приведут к большим отклонениям ее решений.
1
1| · || обозначает любую р-норму (см. приложение А).
90
ГЛАВА 3
Задача с начальными данными (3.1) характеризуется начальным состоянием жо,
начальным моментом времени to
и
функцией /(£,ж) в правой части этого ра
венства. Свойство непрерывной зависимости от начальных данных (£о5#о) и от
параметров функции / исследуется в параграфе 3.2. Если функция / дифферен
цируема по параметрам, то решения этого уравнения также дифференцируемы
по этим параметрам. Это свойство устанавливается в параграфе 3.3 и использу
ется при получении уравнения чувствительности, описывающего влияние малой
вариации параметров на эволюцию системы. Полученные в параграфах 3.2 и 3.3
результаты о непрерывности и дифференцируемости верны лишь на конечном
промежутке времени. Результаты о непрерывности решений на бесконечном вре
менном интервале будут представлены после того, как будет введено понятие
устойчивости
2
.
В заключение главы приведено краткое изложение принципа сравнения, ко
торый позволяет связать свойства решения скалярного дифференциального нера
венства ν ^ fit-, v) со свойствами решения дифференциального уравнения й =
=
f(t,u).
3.1. Существование и единственность
В этом параграфе мы получим достаточные условия существования и един
ственности решения задачи с начальными данными (3.1). Под решением уравне
ния (3.1) на интервале [io? *i] мы
понимаем непрерывную функцию х : [to,ti] —>
i?n
, такую что функция x(t) определена и x(t) = f(t,x(i)) для всех t G [to>*i]·
Если / непрерывна по t и ж, решение ж(£) будет непрерывно дифференциру
емо. Мы будем предполагать, что f(t,x) непрерывна по ж, но лишь кусочно-
непрерывна по t. Тогда решение x(t) будет кусочно-непрерывным и дифферен
цируемым. Предположение о кусочной непрерывности /(£, ж) по t позволяет рас
смотреть случай, когда f(t,x) зависит от функции входа, которая с течением
времени может испытывать скачкообразные изменения.
Дифференциальное уравнение с заданным начальным условием может
иметь несколько решений. Например, скалярное уравнение
ж=ж
1/3
,
ж(0)=0
(3.3)
имеет решение x(t) = (2£/3)3/
2
. Это решение не единственно, поскольку x(i) =
= 0 также является решением. С учетом того что правая часть (3.3) является
непрерывной функцией от ж, легко видеть, что непрерывность функции /(£, ж) по
ее аргументам не является достаточным условием для того, чтобы решение соот
ветствующего уравнения было единственным. На функцию / необходимо нало
жить дополнительные условия. В этом смысле проблема существования решения
менее ограничительна. Действительно, непрерывность f{t,x) по ее аргументам
гарантирует, что существует по крайней мере одно решение. Мы не будем при
водить здесь строгое доказательство
3
.
Вместо этого мы докажем более простое
2
См. параграф 9.4.
3
См. [135, теорема 2.3].
3.1. СУЩЕСТВОВАНИЕ и ЕДИНСТВЕННОСТЬ
91
утверждение о существовании и единственности решения дифференциального
уравнения, основанное на предположении о выполнении условия Липшица.
Теорема 3.1 (локальное существование и единственность). Пусть f(t,x)
кусочно-непрерывна по t и удовлетворяет условию Липшица
\\f(t,x)-f(t,y)\\^L\\x-y\\
Vx,y€В={хеR
n
\ \\х — хо\\ ^ г}, Vi G [io^i]· Тогда существует констан
та δ > О, такая что уравнение состояния х = f(t,x) при x(to) = хо имеет
единственное решение на интервале [to>^o + <4·
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.1.
Π
Ключевым предположением в теореме 3.1 является условие Липшица (3.2).
Функция, удовлетворяющая условию (3.2), называется липшицевой по х9 а по
ложительная константа L — постоянной Липшица. Далее мы будем использовать
словосочетания локально липшицева функция и глобально липшицева функция для
указания области, на которой выполнено условие Липшица для этой функции.
Введем некоторые термины для случая, когда функция / зависит только от х.
Функция f(x) называется локально липшицевой в области (открытое и связное
множество) D С Rn
,
если каждая точка в D имеет окрестность Д), такую что
функция / удовлетворяет условию Липшица (3.2) для всех точек BDOC неко
торой константой Ζ/ο· Мы будем говорить, что / липшицева на множестве W,
если она удовлетворяет условию (3.2) для всех точек из W с одной и той же кон
стантой L. Локально липшицева функция в области D не обязательно является
липшицевой на D, т. к. условие Липшица может не выполняться равномерно (т. е.
с одной и той же константой L) для всех точек из D. Однако локально липшицева
функция в области D является липшицевой на каждом компактном (замкнутом
и ограниченном) подмножестве D (упражнение 3.19). Функция f(x) называется
глобально липшицевой, если она липшицева на R
n
.
Аналогичная терминология
может быть применена и к функции f(t,x) при условии, что условие Липшица
выполнено равномерно по t для всех t из некоторого заданного интервала време
ни. Например, /(£, х) является локально липшицевой по х на [а, Ъ) х D с R x R
n
,
если каждая точка х G D имеет окрестность Do, такую что / удовлетворяет (3.2)
на [а, Ь] х Д) с некоторой константой Липшица LQ. МЫ будем говорить, что /(£, х)
локально липшицева по х на [to, oo) x D, если эта функция является локально
липшицевой по х на [a, b] x D для каждого компактного интервала [а, Ь] С [to, oo).
Функция /(£, х) является липшицевой по х на [a, b] x W, если она удовлетворяет
условию (3.2) для всех t € [α, Ь] и всех точек из W с одной и той же константой
Липшица L.
В скалярном случае / : R —> R условие Липшица может быть представлено
в виде следующего неравенства:
92
ГЛАВА 3
из которого следует, что абсолютное значение тангенса угла наклона прямой ли
нии, соединяющей на графике функции f(x) любые две точки этой кривой, не
превышает L. Поэтому любая функция f(x), имеющая бесконечное значение тан
генса угла наклона касательной в некоторой точке, не является локально липши-
цевой в этой точке. Например, любая разрывная функция не является локально
липшицевой в точке разрыва. В качестве другого примера можно привести функ
цию/(я)=х
1
/3
в задаче (3.3), которая также не является локально липшицевой
в точке х = 0, поскольку f(x) = (1/3)х
-2
/3
—> оо при х —> 0. С другой сторо
ны, если |/'(ж)| ограничена некоторой константой к на некотором интервале, то
f(x) является локально липшицевой на том же интервале с той же константой
Липшица L = к. Нижеследующая лемма представляет собой обобщение этого
утверждения на случай векторных функций.
Лемма3.1.Пустьf :[α,6]хD —>R
m
непрерывна в некоторой области
DСRn
.
Предположим, что матрица Якоби [df/dx] существует и непрерывна
на [а, Ь) х D. Если для некоторого выпуклого подмножества W С D существует
некоторая константа L ^ 0, такая что неравенство
£(«·*> ^L
выполнено на [a, b] x W, то
\\f(t,x)-f(t,y)\\^L\\x-y\\
длявсехtΕ[а,6]GWиуΕW.
ДОКАЗАТЕЛЬСТВО. Пусть || · \\р — р-норма при заданном ρ е [1,оо]. Опре
делим q Ε [l.oo] из соотношения 1/р + l/q = 1. Зафиксируем t Ε [α, 6], х Ε W
иуЕW.Определим7(5)=(1—s)x+syдлявсехsΕi?,такихчто7(5)ED.
ПосколькуWСDвыпукло,7(5)EWпри0<s^ 1.ВыберемzERm
,
такое
что
4
И,=1иz
T
[f(t,y)-f(t,x)]
=
\\f(t,y)~f(t,x)\\p.
Положим g(s) = z
T
f(t^(s)).
Поскольку g(s) — вещественная функция, явля
ющаяся непрерывно дифференцируемой на открытом интервале, содержащем
[0,1], из теоремы о среднем значении следует, что существует s\ E (0,1), та
кая что
g(l)-g(0)=g'(Sl).
Вычислив g(s) в точках 5 = 0, s = 1 и определив g'(s) с использованием цепного
правила, получаем
z
T
[f(t,y) - f(t,x)} = *
r
g(t,7(*i))(v " »),
4
Такое z всегда существует. (См. упражнение 3.21.)
3.1. СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ
93
\\f(t,y)-f(t,x)
<1Ы1 д£
dx (*,7(*0) ||2/-х||р ^L\\y-x\\p,
применив неравенство Гёльдера \z
T
w\ ^ \\z\\q\\w\\p.
Π
Эта лемма предлагает метод вычисления константы Липшица на основании
информации о [df/dx].
Требование липшицевости функции более сильное, нежели свойство ее
непрерывности. Можно показать, что если f(x) липшицева на W, то она рав
номерно непрерывна на W (упражнение 3.20). Обратное утверждение неверно:
например, функция f(x) = я
1
/3
является непрерывной, но не является локально
липшицевой в х = 0. С другой стороны, условие Липшица слабее условия непре
рывной дифференцируемости, и это утверждение формулируется ниже в виде
следующей леммы.
Лемма 3.2. Если f(t,x) и [df/dx](t,x)
непрерывны на [а, 6] х D для неко
торой области D, то функция f является локально липшицевой в х на [а, Ъ] х D.
ДОКАЗАТЕЛЬСТВО. Рассмотрим точку хо£ D и положим г настолько малым,
что шар Do = {x G Rn \ \\х — хо\\ ^ г} содержится в D. Множество Do является
выпуклым и компактным. По непрерывности [df/dx] ограничена на [а, 6] х Do.
Пусть Lo — верхняя граница для \\df/dx\\ на [a, b] x Д)· Тогда по лемме 3.1
функция / является липшицевой на [a, b] x Do с константой Липшица Lo.
•
Читателю предлагается (упражнение 3.22) доказать в качестве обобщения
предыдущего результата следующую лемму.
Лемма 3.3. Пусть f{t,x) и [df/dx](t,x)
непрерывны на [a,ft]x R
n
.
Тогда
функция f является глобально липшицевой в х на [a,ft]x R
n
, если и только если
[df/dx] равномерно ограничена на [а, 6] х R
n
.
Пример 3.1. Функция
No
-Х\ +Х\Х2
Х2 - Х\Х2
является непрерывно дифференцируемой на R
2
.
Следовательно, она локально
липшицева на R
2
.
Однако она не является глобально липшицевой, поскольку
[df/dx] не является однородно ограниченной на Д
2
.
На любом компактном под
множестве R
2
функция / липшицева. Предположим, что нам необходимо вы
числить константу Липшица на выпуклом множестве W — {х G R2 \\х\\ ^ аь
1^21 ^ &2}· Матрица Якоби для / имеет вид
df__Г
-1+Х2 х\
dxL
ж
2
1— xi
Используя норму || · ||оо Для векторов вй
2
и индуцированную матричную норму
для матриц, получаем
df
dx
= max{|-1+х2|+N|,|#2|+I
1_x
i|}·
94
ГЛАВА 3
Все точки в W удовлетворяют неравенствам
|-1+х2\+\х\\^1+а2+аг и \х2\+|1-х\\^а2+1+аь
Следовательно,
llflf II
<1+ai+a2
5/
<9х
и в качестве константы Липшица может быть взята величина L = 1 + а\ + а2.
Δ
Пример 3.2. Функция
/(*) =
Х2
—
sat(xi + х2) J
не является непрерывно дифференцируемой на R
2
.
Проверим, является ли она
липшицевой, анализируя величину f(x) — f(y). Используя ||·||οο Β качестве нормы
векторов в R
2
и учитывая тот факт, что функция насыщения sat() удовлетворяет
|sat(7j)-sat(£)| ^ \η - ξ\,
получаем
\\f(x) - f(y)\\ ^ (X2 - у2? + (хг +Х2-У1~ У2)
2
=
= (xi-yi)2
+2(хг - уг)(х2 - у2)+2{х2- у2)
2
.
а
_
Ъ
τ'1
1
1'
2
а
Ь
шш
Используя неравенство
а
2
+2аЬ+2Ь2
= |7IIГ1ΙΙΤΙ^λη
получаем
II/(х) - f(y)h < л/2Ш8||х - у\\2,
Чх9уеR
2
.
При получении предыдущего неравенства мы использовали свойство положи
тельной полуопределенности симметричных матриц, т.е. х
т
Рх ^ Атах(^)#т#,
длявсехх GДп
, где Атах(·)
—
максимальное собственное значение матрицы.
Более консервативная (большая) константа Липшица может быть получена при
использовании более консервативного неравенства
а
2
+2аЬ+262
<2а
2
+ 362
< 3(а
2
+Ъ
2
).
В этом случае константа Липшица равна L = у/3.
Δ
В этих двух примерах мы использовали нормы ||-||оои||-||2. Вследствие
эквивалентности этих норм выбор нормы на R
n
не влияет на выполнение усло
вия Липшица для исследуемой функции, но от этого выбора зависит величина
3.1. СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ
95
соответствующей константы Липшица (упражнение 3.5). Упражнение 3.2 иллю
стрирует тот факт, что условие Липшица (3.2) не определяет однозначным обра
зом константу Липшица L. Если условие (3.2) выполняется для некоторой поло
жительной константы L, то оно выполняется и для любой константы, большей
чем L. Эта неоднозначность может быть устранена путем определения L как
минимальной константы, при которой выполнено (3.2), но такой подход будет
применяться редко.
Теорема 3.1 является локальной теоремой, поскольку она гарантирует суще
ствование и единственность решения только на интервале [to, to + δ], где констан
та δ может быть очень мала. Другими словами, мы не можем определять выбор 5,
и, следовательно, мы не можем гарантировать существование и единственность
решения на заданном интервале [io^i]· Однако можно попытаться расширить
интервал, на котором существует решение, путем последовательных применений
локальной теоремы на последовательно выбранных интервалах. Действительно,
применив теорему 3.1 при to и начальном состоянии x(to) = хо, мы получаем,
что существует положительная константа δ (зависящая от хо), такая что уравне
ние состояния (3.1) имеет единственное решение на интервале времени [to, £о+#]·
Рассматривая to + δ в качестве нового начального момента времени, a x(to + δ)
в качестве нового начального состояния, можно попытаться применить теоре
му 3.1 для установления существования решения после момента времени to + δ.
Если условия теоремы выполнены в точке (to,xo(to + δ)), существует #2 > О,
такая что уравнение имеет единственное решение на интервале [to 4- δ, to + δ +
+ #2], проходящее через точку (to+<^ x(to + 5)). Соединив решения на интервалах
[to-, to+δ]и[to+δ,to+δ+<У>
мы
получаем решение, которое существует и един
ственно на интервале [to, to + δ + ^]. Описанная процедура может быть продол
жена и далее, но в общем случае интервал существования решения не может
быть продолжен до бесконечности, т.к. условия теоремы 3.1 могут прекратить
выполняться. Существует максимальный интервал [to,T)9 на котором начавше
еся в (to,xo) решение существует
5
.
В общем случае Τ может быть меньше t\
и тогда при t —> Τ решение покидает любое компактное множество, на котором
функция / локально липшицева по х (упражнение 3.26).
Пример 3.3. Рассмотрим скалярное уравнение
х=—х
2
,
х(0)= —1.
Функция f(x) = —х
2
является локально липшицевой для всех х Ε R. Следо
вательно, она является липшицевой на любом компактном подмножестве R. На
интервале [0,1) существует единственное решение
При t —> 1 траектория x(t) покидает любое компактное множество.
Δ
5
Доказательство этого утверждения приведено в [81, параграф 8.5] или [135, параграф 2.3].
96
ГЛАВА 3
Фраза «конечное время ухода на бесконечность» («finite escape time») ис
пользуется при описании феномена ухода траектории системы на бесконечность
на конечном промежутке времени ее эволюции. Например, мы можем сказать,
что в примере 3.3 траектория имеет конечное время ухода на бесконечность при
t=l.
В контексте обсуждения, предшествующего примеру 3.3, можно задаться
следующим вопросом: когда можно гарантировать, что решение может быть про
должено на бесконечный интервал времени? Одним из путей ответа на этот во
прос является наложение дополнительных условий, обеспечивающих постоянное
нахождение решения x(t) в множестве, где f(t,x) равномерно липшицева по х.
Если потребовать, чтобы функция / удовлетворяла глобальному условию Лип
шица, мы получим следующий результат.
Теорема 3.2 (глобальное существование и единственность решения).
Предположим, что f(t,x) кусочно-непрерывна по t и удовлетворяет
\\f(t,x)-f(t,y)\\^L\\x-y\\
Vx,y G i?n
, Vt G [t(h*i]· Тогда уравнение состояния х = f(t,x),
x(to) = xo
имеет единственное решение на интервале [to> *i]·
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.1.
Π
Пример 3.4. Рассмотрим линейную систему
x = A(t)x + g(t) = f(t,x),
где A(t) и g(t) — кусочно-непрерывные функции времени. На любом конечном
интервале времени [to,ti] элементы A(t) ограничены. Следовательно, ||.A(t)||^ α,
где || А|| — любая индуцированная матричная норма. Условия теоремы 3.2 выпол
нены, т. к.
\\f(t,x) - /(*, у)|| = \\A(t)(x - у)\\ < ||A(i)|| ||x - у\\ ^ а\\х - у\\
для всех х,у G Rn
nt G [io>*i]· Тогда из теоремы 3.2 следует, что линейная си
стема имеет единственное решение на [to^i]· Поскольку момент времени t\ мо
жет быть выбран произвольно большим, мы можем также заключить, что, если
A(t) и g(t) кусочно-непрерывны \/t > to, система имеет единственное решение
Vt ^ to. Следовательно, система не может иметь конечное время ухода на беско
нечность.
Δ
Для линейной системы из примера 3.4 выполнение условия глобальной лип-
шицевости теоремы 3.2 является вполне разумным требованием. Однако в общем
случае для нелинейных систем это условие может быть слишком ограничитель
ным. Следует различать локальное условие Липшица из теоремы 3.1 и глобаль
ное условие Липшица из теоремы 3.2. Свойство локальной липшицевости функ
ции, по существу, является условием ее гладкости. Оно следует из непрерывной
3.1. СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ
97
дифференцируемости. За исключением случаев разрывных неравенств, которые
могут служить в качестве идеализированной модели физических явлений, ра
зумно предполагать, что функции, стоящие в правой части моделей физических
систем, локально липшицевы. Примеры непрерывных функций, не являющихся
локально липшицевыми, существуют, но они очень редко используются в каче
стве моделей реальных систем. С другой стороны, свойство глобальной липши-
цевости весьма ограничительно. Модели многих физических систем не удовле
творяют этому требованию. Можно легко предложить имеющие вполне опреде
ленный смысл примеры систем, не удовлетворяющих условию глобальной лип-
шицевости, но имеющих тем не менее единственные и глобально определенные
решения. Из этого следует, что теорема 3.2 имеет консервативную природу.
Пример 3.5. Рассмотрим скалярную систему
х= -х
г
=
f(x).
Функция f(x) не удовлетворяет глобальному условию Липшица, поскольку яко
биан df/dx = —Зх
2
не ограничен глобально. Тем не менее для любого началь
ного состояния x(to) = #о это уравнение имеет единственное решение
x(t) = sign(x0)^
г
2
х
о
^l + 2sjj(t-<o)'
которое определено для всех t ^ to·
Δ
В свете консервативной природы глобального условия Липшица было бы
желательно сформулировать и доказать теорему о глобальном существовании
и единственности решения, в которой на функцию / накладывается лишь усло
вие локальной липшицевости. Следующая теорема решает поставленную задачу,
но это достигается с использованием дополнительной информации о решении
системы.
Теорема 3.3. Пусть f(t,x) кусочно-непрерывна по t и локально липшицева
по х для всех t ^ to и всех х, принадлежащих области D С i?n
.
Пусть W —
компактное подмножество D, XQ £ D и предположим, что любое решение си
стемы
x = f(t,x),
x(t0) = хо
целиком содержится в W. Тогда существует единственное решение, определен
ноедлявсехt^to.
ДОКАЗАТЕЛЬСТВО. Обратимся снова к обсуждению процедуры расширения
решения, предшествующему примеру 3.3. По теореме 3.1 существует единствен
ное локальное решение на [to,to + δ]. Пусть [to, T) — максимальный интервал,
на котором существует решение. Мы хотим показать, что Τ = оо. Напомним
(упражнение 3.26), что если Τ конечно, то решение должно покинуть любое
компактное подмножество D. Поскольку по условию теоремы решение никогда
не покидает компактное множество W, мы заключаем, что Τ = оо.
Π
98
ГЛАВА 3
Применение теоремы 3.3 основано на установлении факта, что любое ре
шение лежит в компактном множестве, причем это должно быть сделано без
фактического решения дифференциального уравнения. В главе 4 будет показано,
что метод Ляпунова для изучения устойчивости решений дифференциального
уравнения может быть очень полезен при решении этой задачи. Здесь мы проил
люстрируем применение этой теоремы простым примером.
Пример 3.6. Рассмотрим скалярную систему (см. пример 3.5)
х=-х
3
=
f{x).
Функция f(x) удовлетворяет локальному условию Липшица на R. Если в каж
дый момент времени величина x(t) положительна, производная x(t) будет отри
цательной. Аналогично, если в каждый момент времени величина x(t) отрица
тельна, производная x(t) будет положительной. Поэтому решение, начинающее
ся в любой начальной точке х(0) — а, никогда не сможет покинуть компактное
множество {х £ R \ \х\ ^ \а\}. Таким образом, без вычисления решения рас
сматриваемого дифференциального уравнения и с использованием теоремы 3.3
мы можем заключить, что это уравнение имеет единственное решение для всех
t>0.
Δ
3.2. Непрерывная зависимость решения от начальных данных
и параметров
Для того чтобы решение уравнения состояния (3.1) представляло интерес,
оно должно непрерывно зависеть от начального состояния хо, начального мо
мента времени to, а также от функции f(t,x) в правой части этого уравнения.
Непрерывная зависимость от начального времени следует из равенства
x(t)=x0
+
f(s,x(s))ds,
Jt0
и поэтому мы предлагаем читателю доказать это утверждение в качестве упраж
нения (см. упражнение 3.28). Далее мы сконцентрируем наше внимание на во
просе о непрерывной зависимости от начального состояния хо и функции /.
Пусть y(t) — решение (3.1), начинающееся в у (to) = уо и определенное на ком
пактном интервале [to, ti]. Решение называется непрерывно зависящим от уо,
если решения, начинающиеся в окрестности этой точки, определены на том же
интервале времени и остаются близкими друг к другу на этом интервале. Эта
формулировка допускает более строгое представление на языке ε — δ. Для любой
константыε >0существует δ>О,такаячтодлявсехzoизшара{х€Rn \\\х—
—
УоII < £} уравнение х — f(t,x) имеет определенное на [to^i] единствен
ное решение z(t), z(to) = zo, удовлетворяющее неравенству \\z(t) — y(t)\\ < ε
для всех t E [to, ti]. Непрерывная зависимость от функции / в правой части
уравнения определяется аналогичным образом, но, для того чтобы дать матема
тически строгое определение этого понятия, мы должны определить возмуще
ние функции /. В качестве одного из возможных способов представления такого
3.2. НЕПРЕРЫВНАЯ ЗАВИСИМОСТЬ РЕШЕНИЯ
99
возмущения может служить последовательность функций /т, которая равномер
но сходится к / при т —» оо. Для каждой функции fm решение уравнения
х = fm(t,%), x(to) = хо обозначается xm(t). Решение называется непрерыв
но зависящим от функции в правой части уравнения, если xm(t) —> x(t) при
т —> оо. Этот подход применяется редко и здесь не будет рассматриваться
6
.
Более ограничительное, но одновременно более простое математическое пред
ставление возмущения функции в правой части уравнения заключается в пред
положении о том, что / непрерывно зависит от множества постоянных парамет
ров, т.е. / = /(t,#,A), гдеλGRp
.
В качестве постоянных параметров могут
рассматриваться физические параметры системы, и возмущения этих парамет
ров могут интерпретироваться как ошибки модели или как изменение значений
этих параметров с течением времени. Пусть x(t, Хо) — решение системы х =
= /(t, х, λο), x(to, λο) = хо, определенное на [to, t\]. Решение называется непре
рывно зависящим от λ, если для любой константы ε > 0 существует δ > О, такая
чтодля всех λ из шара{λGRP\\\Х—Хо\\<δ}уравнение х = /(t,x, λ)имеет
определенное на [to,ti] единственное решение x(t, λ), x(to, A) — хо, удовлетво
ряющее неравенству \\x(t, λ) — #(t, λο)|| < ε для всех t G [to, ti].
Непрерывная зависимость от начальных состояний и непрерывная зависи
мость от параметров могут исследоваться с единой точки зрения. Мы начнем
с формулировки простого результата, в котором не рассматривается вопрос о су
ществовании и единственности решения, но делается акцент на исследовании
близости решений.
Теорема 3.4. Пусть f(t,x) кусочно-непрерывна по t и липшицева по х на
[to,ti] х W с константой Липшица L, где W С Rn
—
открытое связное мно
жество. Пусть y(t) и z(t) —решения систем
У = f(t,y),
y(t0) = уо
и
z=/(t,z)+g{t,z), z(t0) = z0,
такие что y(t), z(t) G W для всех t G [to, ti]. Предположим, что
\\g{t,x)\\ <μ, V(t,x)G[t0,ti]x W
для некоторой константы μ > 0. Тогда
\\y(t) - z(t)\\ < ||No - *d|| exp[L(t - t0)] + ^{exp[L(t - t0)] - 1}
для всех t G [to,ti].
6
Непрерывная зависимость от параметров, рассматриваемая с использованием этого подхода,
исследована в работах [43, параграф 1.3],[75, параграф 1.3] и [135, параграф 2.5].
100
ГЛАВА 3
ДОКАЗАТЕЛЬСТВО. Решения y(t) и z(t) имеют вид
2/(*) =Уо+ /
f(s,y(s))ds,
Jto
z(t) = z0+ [ [/(5, z(s)) + g(s, z(s))]ds.
Jto
Вычитая второе уравнение из первого и вычисляя нормы, получаем
\\y(t) - Z(t)\\ ^ ||2/0 " Zo\\ + f \\f(sMs))
~
f(8,z(8))\\d8
+
Jto
+/
\\g(8,z(8))\\d8K:
Jto
^7 + μ(*-*ο)+ / L\\y(s) - z(s)\\ds,
JtQ
где 7 = ||yo — zo||. Применение неравенства Гронуолла-Беллмана (лемма A.I)
к функции \\y(t) — z(t)\\ приводит к оценке
\\y(t)- z(t)\\^7+μ(*- to)+/ Ь[7+μ(3-t0)}exp[L{t- s)]ds.
Jto
Интегрируя по частям правую часть, получаем
\\y(t)-z(t)\\<7+μ(1-t0) -7 "μ(*- *o)+7exp[L(t-t0)]+
+ / μβΧρ[Ζ/(£ — s)]ds =
Jto
= 7exp[L(i - *<,)] + £{exp[L(t - t0)] - 1},
что и требовалось доказать.
D
С использованием теоремы 3.4 мы можем доказать следующую теорему
о непрерывности решений, определенной в терминах начальных состояний и па
раметров.
Теорема 3.5. Пусть /(£,£, λ) непрерывна в точке (£,ж, λ) и локально лип-
шицева по х (равномерно notuX) на [to, t\]x D х {||λ — λο|| ^ с}, где D С Rn
—
некоторое открытое связное мноэюество. Пусть y(t, λο) — решение системы
х = /(£,£, λο)> 2/(^0) λο) = 2/о £ D. Предположим, что функция y(t,\o) опреде
лена и содерэюится в D для всех t Ε [io>^i]· Тогда для любой константы ε > 0
существует δ > 0 такая, что если
\\zo-yo\\<6
и ||λ-λ0||<5,
3.2. НЕПРЕРЫВНАЯ ЗАВИСИМОСТЬ РЕШЕНИЯ
101
то существует единственное решение z(t, λ) системы х = /(t,x,A) с началь
ным состоянием z(to,X) = ZQ, определенное на [to» *i] и удовлетворяющее нера
венству
||*(*,А)-у(*,Ао)|Ю Vte[to,ti].
у(*А) ----.-
с/
<0
«1
Рис. 3.1. Трубка как окрестность решения y(t, λο)
ДОКАЗАТЕЛЬСТВО. ИЗ непрерывности функции 2/(t,Ao) по t и из компакт
ности [to, ii] следует, что y(t, Ао) ограничена на [to, ti]. Определим «трубку» U
как окрестность решения y(t, λο) (см. рисунок 3.1):
U ={(*,*) G[t0,ti] хД
п
| \\х - y(t,Ao)|| < ε}.
Предположим, что С/ С [to, ti] x D; если это предположение не выполнено, всегда
можно сделать замену ε на меньшую величину ε\ < ε, гарантирующую выполне
ние U С [to, ti] x D, и продолжить доказательство с переопределенной констан
той £ь Поскольку множество U компактно, функция /(t,#,A) липшицева по ж
на U; обозначим соответствующую константу Липшица через L. Из непрерыв
ности / по λ следует, что для любой а > 0 существует β > 0 (β < с), такая
что
||/(*,яг, А) - /(*,яг, Ао)|| < «,
W(t,x)eU, V ||λ - λ0|| < β.
Положим а < ε и \\ZQ — уо\\ < а. Из локальной теоремы о существовании и един
ственности решения следует, что на некотором интервале to, to + Δ] существует
единственное решение z(t, А). Решение начинается в трубке U, и, поскольку оно
остается в этой трубке, оно может быть продолжено. Мы покажем, что при вы
боре достаточно малой константы а можно гарантировать то, что это решение
останется в U при всех t Ε [to, ti]. Пусть τ — первый момент времени, когда
решение покинуло трубку. Докажем, что мы можем обеспечить г > t\. На интер
вале [to, г] условия теоремы 3.4 выполнены при μ = α. Следовательно,
\\z(t,\) - y(t,A0)|| < aexp[L(t - t0)] + |{exp[L(t - t0)] - 1} <
<afl + ^Jexp[L(t-t0)].
102
ГЛАВА 3
Выбор а < eLexp[—L(ti — to)]/(l + L) гарантирует то, что решение z(t,\) не
может покинуть трубку на интервале времени to? ^i]· Поэтому z(t, λ) определено
на [to^ti] и удовлетворяет \\z(t, λ) — y(t, λο)|| < ε. Полагая δ = min{a,/?}, мы
доказываем утверждение теоремы.
Π
3.3. Дифференцируемость решений и уравнения чувствительности
Предположим, что /(£, х, λ) непрерывна в точке (t, х, λ) и имеет непрерыв
ные первые частные производные по х и λ для всех (t, х, X) Ε [to, h] x R
n
xД
р
.
Обозначим через λο некоторое номинальное значение параметра λ и предполо
жим, что номинальное уравнение состояния
х = /(£,Χ,λ0), x(t0) = хо
имеет единственное решение х(£, λο) на [io»*i]· Из теоремы 3.5 следует, что для
всех λ достаточно близких к λο, т.е. при достаточно малой величине ||λ — λο||,
уравнение состояния
х = f(t,x,X),
x(t0) = х0
имеет единственное решение x(t,X) на [io^i]? которое достаточно близко к но
минальному решению х(£, λο). Поскольку функция / непрерывно дифференци
руема по х и λ, решение х(£, λ) дифференцируемо по λ вблизи λο· Для того
чтобы убедится в этом, рассмотрим
x(t,\) = хо+ / f(s,x(s,X),X)ds.
Вычисляя частные производные по λ, получаем
/ /(5,Ж(5,А),,
Jto
f,A)= f
x\(t,X)= J i—(s,x(s,X),X)xx(s,X) + -^(s,x(s,X),X) ds,
где x\(t, X) = [dx(t, Х)/дХ] и [дхо/дХ] = 0, т. к. хо не зависит от λ. Дифференци
руя по t, можно убедиться в том, что x\(t, X) удовлетворяет дифференциальному
уравнению
£Xx(t, L) = A(t, X)xx(t, λ) + B(t, λ), ΧΑ (to, λ) - 0,
(3.4)
где
ла,х) =
ШхЛ)
дх
Β^Χ)-TM*·*·»
дХ
x=x(t,X)
x=x(t,X)
Для λ, достаточно близких к λο, матрицы A(t, λ) и B(t, λ) определены на [to, h].
Следовательно, x\(t, λ) определена на том же интервале. В точке λ = λο правая
3.3. ДИФФЕРЕНЦИРУЕМОСТЬ РЕШЕНИЙ И УРАВНЕНИЯ ЧУВСТВИТЕЛЬНОСТИ 103
часть равенства (3.4) зависит только от номинального решения x(t,Xo). Пусть
S(t) = x\(t> λο), тогда S(t) является единственным решением уравнения
S(t) = A(t, Ao)S(t) + B(t, λο), S(t0) = 0.
(3.5)
Фикция 5(t) называется функцией чувствительности, а уравнение (3.5) —
уравнением чувствительности. Функции чувствительности представляют собой
оценки первого порядка влияния вариаций параметров на решения. Они также
могут использоваться для аппроксимации решения при значениях λ достаточно
близких к их номинальной величине λο. При малых ||λ — λο|| решение x(t, λ) мо
жет быть разложено в ряд Тейлора в окрестности номинального решения ж(£, До):
x(t, Λ) = x(t, λο) + S(t)(X — λο) + члены более высокого порядка.
Пренебрегая членами более высокого порядка, можно получить аппроксимацию
решения:
x(t, λ) « x(t, λ0) + S(t)(X - λ0).
(3.6)
Обоснование этой аппроксимации будет предложено в главе 10 при исследова
нии теории возмущений. Представление (3.6) имеет важное значение, поскольку
оно позволяет с использованием информации о номинальном решении и о функ
ции чувствительности получить аппроксимацию решения для всех значений λ
в (малом) шаре с центром в λο.
Суммируя все вышесказанное, мы можем предложить процедуру определе
ния функции чувствительности, состоящую из следующих шагов:
• Решить номинальное уравнение состояния для получения номинального ре
шения x(t,Xo).
Вычислить матрицы Якоби
A(t,X0)
B(t,X0)
df(t,x,X)
дх
df(t,x,X)
x=x(t,\o,X=\o)
д\ I ж=ж(£,Ао),А=Ао
• Решить уравнение чувствительности (3.5) относительно S(t).
Следуя этой процедуре, нужно решить нелинейное номинальное уравнение
состояния и линейное уравнение чувствительности, зависящее от времени. За ис
ключением нескольких тривиальных случаев, приходится использовать числен
ное решение этих уравнений. В качестве альтернативного подхода для вычисле
ния S(t) можно использовать одновременное решение номинального уравнения
и уравнения чувствительности. Это может быть выполнено путем совместного
104
ГЛАВА 3
решения вариационного уравнения (3.4) и первоначального уравнения состоя
ния, в котором следует положить λ = λο· В результате получим расширенную
систему из (п + пр) уравнений
х = /(£,х,А0),
"Э/(*,ж,А)"
дх
S+
J λ=λ0
дfjt, x, λ)
дХ
я(*о) = ^0
S(t0) = 0,
(3.7)
-Ιλ=λ0
которую следует решать численными методами. Заметим, что если первоначаль
ное уравнение состояния автономно, т. е. f(t, х, X) = /(х, λ), расширенное урав
нение (3.7) будет также автономным. Применение предложенной процедуры про
иллюстрируем следующим примером.
Пример 3.7. Рассмотрим модель фазовой подстройки частоты с обратной
связью
Xl=X2
=/l(^l,X2),
±2 = —csinxi — (α + bcosxi)x2 = /2(^1^2)
и предположим, что параметры а, Ь и с имеют номинальные параметры ао =
= 1? &о = 0 и со = 1. Тогда номинальная система имеет вид:
Х\=Х2,
Х2= —sinxi х2.
Матрицы Якоби [df /дх] и [df/dX] определяются равенствами
а/
9х
0
1
1
-с cos xi + bx2sinxi —(α + bcosxi) J'
а/[9/а/а/-|го
0
0
дХ [да db дс\
|
_
—хч
—X2COSX1 — sinxi
Значения этих матриц при номинальных параметрах имеют вид
0
1
COSXi —]
df
дх
df
д\
nominal
nominal
0
.
~
х
2
о
-X2COSX1
Положим
s=
ХЗ#5%7
Х4Хб#8
дх\
да
дх2
Lда
дх\
~дЬ
дх2
дЪ
0
•sinxi
дх\
дх2
дс J nominal
3.4. ПРИНЦИП СРАВНЕНИЯ
105
Тогда уравнения (3.7) в рассматриваемом случае имеют следующий вид:
*1=Ж2,
a?i(0)=xio,
±2=
-
SinXi — Х2,
^2(0) = Х20>
#з=Ж4,
жз(0) = 0,
Х4=
—X3COSX1 —Х4 — #2>
^4(0) — 0?
Х5=#6,
^б(О) = О,
Хб=
—Х5COSXi —Хб—Х2COSXi, Хб(0) = 0,
Х7=Х8,
#7(0) = 0,
Х8=
—X7COSX1 — Х8 — sin xi,
хв(О) — 0.
0.5
0
0.5
-1
Ч
//
—г
щ
5
(а)
10
Рис. 3.2. Функция чувствительности для примера 3.7
Решение этого уравнения было получено при начальном состоянии хю = #20 =
= 1. На рисунке 3.2(a) показаны графики величин хз, х$ и Χγ, представляющих
собой чувствительности х\ по параметрам а, Ьис соответственно. На рисун
ке 3.2(b) показаны графики соответствующих величин для Х2. Из этих рисунков
видно, что чувствительность решения к вариациям параметра с больше его чув
ствительности к вариациям параметров а и Ъ. Аналогичный вывод можно сделать
и на основании анализа решений для других начальных состояний.
Δ
3.4. Принцип сравнения
Часто при исследовании уравнения состояния х = /(£, х) необходимо вы
числить оценки для решения x{t) без нахождения самого решения. Одним из
средств для достижения этой цели является неравенство Гронуолла-Беллмана
(лемма АЛ). Другим подходом является использование леммы сравнения. Ее
применяют в ситуациях, когда производная скалярной дифференцируемой функ
ции v(t) удовлетворяет неравенству вида v(t) < f{t,v(t)) для всех t из неко
торого определенного интервала времени. Это неравенство называется диффе
ренциальным неравенством, а функция v(t)9 удовлетворяющая этому неравен
ству, называется решением дифференциального неравенства. В лемме сравне
ния анализируется результат сравнения решения дифференциального неравен
ства v(t) ^ f(t,v(t)) с решением дифференциального уравнения й = f(t,u).
106
ГЛАВА 3
Лемма применима даже в тех случаях, когда v(t) не дифференцируема, но име
ет правую верхнюю производную D+v(t), удовлетворяющую дифференциально
му неравенству Правая верхняя производная D
+
v(t) определяется в приложе
нии С.2. Для наших целей достаточно знать два факта:
• Если v(t) дифференцируема в t, то D+v(t) = v(t).
• Если
^\v(t + h)-v(t)\^g(t,h),
V/ie(0,6]
и
lim g(t,h) = go(t),
то D+v{t) < g0(t).
Под пределом h —> 0
+
подразумевается, что ft, приближается к нулю справа.
Лемма 3.4 (лемма сравнения). Рассмотрим скалярное дифференциальное
уравнение
u = f(t,u),
u(to) = uo,
где f(t,u) непрерывна по t и локально липшицева по и для всех t ^ 0 и всех
и G J С R. Пусть [to,T) (T моэюет быть бесконечностью) —максимальный
интервал, на котором существует решение u(t), и предположим, что u(t) G
[to, Τ). Пусть v(t) — непрерывная функция, правая верхняя производная D
+
v{t)
которой удовлетворяет дифференциальному неравенству
D+V(t) ^ f(t,v(t))> T7(t0)<t«b
где v(t) GJдлявсехt G[to,Τ). Тогдаv(t) ^ u(t) для всехt G[to, T).
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.2.
Π
Пример 3.8. Скалярное дифференциальное уравнение
х=f(x) =—(1+х
2
)х,
х(0)=а
имеет единственное решение на [0,ii) при некотором t\ > 0, поскольку f(x)
локально липшицева по х. Пусть v(t) = x
2
(t). Функция v(t) дифференцируема
и ее производная определяется равенством
v(t) = 2x(t)x(t) = -2x
2
(t) -2x
A
{t) ^
-2x
2
{t).
Следовательно, v(t) удовлетворяет дифференциальному неравенству
v(t) ^ -2v(t),
v(0)=a
2
.
Пусть u(t) — решение дифференциального уравнения
й= -2и,
и(0) =а
2
=> u(t)=a
2
e~
2t
.
3.4. ПРИНЦИП СРАВНЕНИЯ
107
Тогда из леммы сравнения следует, что решение x(t) определено для всех t ^ 0
и удовлетворяет оценке
Δ
\x(t)\ = у/Щ <: е~
г
\а\, Vt^0.
Пример 3.9. Скалярное дифференциальное уравнение
х=f(x) =-(1+х
2
)х+е*, ж(0)=а
имеет единственное решение на [0, t\) при некотором t\ > 0, поскольку /(ж) ло
кально липшицева по х. Нам необходимо найти верхнюю границу \x(t) с исполь
зованием методов, аналогичных тем, что использовались в предыдущем примере.
Пусть так же, как и в примере 3.8, v(t) = x
2
{t). Производная функции ν имеет
вид
v(t) = 2x(t)x(t) = -2x
2
(t) -2x
4
(t) + 2x{t)eb
< -2v(t) + 2у/уЩеК
К этому дифференциальному неравенству можно применить лемму сравнения,
но в результате получается дифференциальное уравнение, решение которого
представляет непростую задачу. Поэтому рассмотрим другую функцию v(t): по
ложим v(t) = \x(t)\. При х φ 0 функция v(t) дифференцируема и ее производная
определяется равенством
d
m = ftVW)
x(t)x(t)
|x(t)|[l + z
2
(t)] +
*(*) л
\x{t)\
e.
Поскольку l+x
2
(t) ^ 1, мы имеем -|x(i)|[l+x
2
(i)] < —|a:(t)| nv(i) < — ь(Ь)+е
ь
.
С другой стороны, при x(t) = 0 имеем
И' + Ц-М! _ W£±M _ i \f f{TMT))dT
<
л
ft-ыг
/М) + Ц [/(т>!В(т))-/(«,*(*))]<*
|/(i,0)| + i £+h
\f(r,x(r))
-
f(t,x(t))\dr.
Поскольку f(t,x(t)) — непрерывная функция от t, для любой константы ε > 0
существует δ > 0, такая что для всех \т — t\ < δ справедливо \f(r,x(r)) —
—
f(t,x(t))\ < ε. Тогда для всех h < δ выполнено неравенство
ijf
|/(r,x(r))-/(i,x(i))|d·τ < ε,
108
ГЛАВА 3
из которого следует, что
lim i / |/(r,x(r)) - f(t,x(t))\dr = 0.
Таким образом, D+v(t) < |/(t,0)| = e* при x(t) = 0, и, следовательно, для всех
t e [0,£i) мы имеем
D+
v{t) =ξ -v{t) + е*, v(0) = \а\.
Рассматривая функцию u(t) в качестве решения линейного дифференциального
уравнения
й= —и+е*, г^(0)=|а|,
мы можем с использованием леммы сравнения заключить, что
v(t)^u(t)=е~
г
\а\ + \[е
ь
-
е~% Vt G [0,*i).
Верхняя граница функции v(i) конечна для всех конечных t\ и стремится к бес
конечности лишь при ti —> оо. Поэтому решение x(t) определено при всех t ^ 0
и удовлетворяет оценке
|х(*)| < е"*|а| + |[е* - е~*], \/t> 0.
3.5. Упражнения
3.1. Для каждой из нижеследующих функций f(x) установить, является ли она
(а) непрерывно дифференцируемой; (Ь) локально липшицевой; (с) непрерывной;
(d) глобально липшицевой:
(1)/(х)=х
2
+ |х|.
(3) f(x) = sin(x)sign(x).
(5)/(х) = -х + 2|х|.
ах\ + th(6xi) — th(bx2)
[ ax2 + th(bx\) + th() J
-x\ +а|ж2|
-(α+6)xi +bxf — x\x<i \
(2) /(x) = x + sign(x).
(4) /(x) = — x + asin(x).
(6) /и = tg(*).
(7) /(*) =
(8) fix)
3.2. Пусть Dr = {x G i?n | ||x|| < г}. Каждую из нижеследующих систем пред
ставить в виде х = /(£,х) и установить, является ли функция / (а) локально
липшицевой по х на Dr для достаточно малой г; (Ь) локально липшицевой по х
на £>г для любой конечной г > 0; (с) глобально липшицевой по х:
3.5 . УПРАЖНЕНИЯ
109
(1) Уравнение маятника с трением при постоянном входном моменте вращения
(параграф 1.2.1).
(2) Цепь с туннельным диодом (пример 2.1).
(3) Уравнения массы на пружине с линейной моделью пружины, линейным
вязким демпфированием, сухим трением и нулевой внешней силой (пара
граф 1.2.3).
(4) Осциллятор Ван дер Поля (пример 2.6).
(5) Замкнутое уравнение адаптивной системы управления третьего порядка (па
раграф 1.2.6).
(6) Система х = Ах — Вф(Сх), где А, В и С — соответственно (п х π)-, (η х 1)-
и (1 х п)-матрицы и ф(-) — нелинейная функция нечувствительности (dead
zone), график которой изображен на рисунке 1.10(c).
3.3. Покажите, что если fi:R—*Rnf2:R—>R
локально липшицевы, то
/i + /г? /1/2 и /i о /2 локально липшицевы.
3.4. Пусть функция / : R
n
—>R
m
определяется следующим образом:
{—L -Kx, если д(х)\\Кх\\ > μ > 0
9
-^Кх,
если
9{Χ)\\ΚΧ\\<μ,
гдед:R
n
—• R — локально липшицева и неотрицательная функция, К — посто
янная матрица. Показать, что f(x) липшицева на любом компактном подмноже
стве R
n
.
3.5. Пусть |Н|аи||-||/з — две различные р-нормы на R
n
.
Показать, что / : R
n
—>
—>R
m
липшицева по норме || · ||а, если и только если она липшицева по нор
ме||·\\β.
3.6. Пусть f(t,x) кусочно-непрерывна по t, локально липшицева по х и
Н/МН <fci+ fe2||x||, V(i,x) G [to,00) x R
n
.
(a) Показать, что решение (3.1) удовлетворяет оценке
||х(*)|| < ||х0|| exp[k2(t - t0)} 4- ^{exp[fc2(* - to)] - 1}
для всех t ^ to, при которых решение существует.
(b) Уходит ли решение на бесконечность за конечное время?
3.7.Пустьд:R
n
—>R
n
непрерывно дифференцируема для всех х Ε Rn
.
Опре
делим /(ж) равенством
/(ж) =
-й
д{х).
JK}
1+д
т
(х)д(х)
УК}
110
ГЛАВА 3
Показать, что х = /(х), х(0) = XQ имеет единственное решение, определенное
длявсехt>0.
3.8. Показать, что уравнение состояния
2х2
1+ ^'
±i=-xi+„,
2
2,
xi(0)
Х2= -Х2+
Xl
9,
Х2(0)=Ь
1+xf
имеет единственное решение, определенное для всех £ ^ 0.
3.9. Предположим, что система второго порядка х = /(х) с локально липши-
цевой правой частью имеет предельный цикл. Показать, что никакое решение,
начинающееся в области, ограниченной предельным циклом, не может уйти на
бесконечность за конечное время.
3.10. Вывести уравнения чувствительности для цепи туннельного диода из при
мера 2.1 при отклонении L и С от номинальных значений.
3.11. Вывести уравнения чувствительности для осциллятора Ван дер Поля из
примера 2.6 при отклонении ε от номинального значения, используя уравнение
состояния в х-координатах.
3.12. Выполните предыдущее упражнение, используя уравнение состояния в z-
координатах.
3.13. Вывести уравнения чувствительности для системы
#1 = tg_1
(aXi) —Х1Х2, Х2 = Ьх\ —СХ2
при отклонении параметров а,Ь,с от номинальных значений ао = 1, Ьо = 0>
с0=1.
3.14. Рассмотрим систему
xi = -ψΧΙ + th(Axi) - th(Ax2),
Х2 = -ψΧ2 + th(Axi) + th(Ax2),
где А и τ — положительные константы.
(a) Вывести уравнения чувствительности при отклонении λ и τ от номиналь
ных значений λο и то.
(b) Показать, что г = у/х\ + х\ удовлетворяет дифференциальному неравен
ству
г^-^г + 2\/2.
(c) Используя лемму сравнения, показать, что решение уравнения состояния
удовлетворяет неравенству
|И«)||2 «S е-*/
т
||х(0)||2 + 2V2T(1 - е~Ч
т
).
3.5. УПРАЖНЕНИЯ
111
3.15. Используя лемму сравнения, показать, что решение уравнения состояния
.
2х2
.
.
2х\
хг=-xi+
-, х2=-Х2+
\+х\
1+ж!
удовлетворяет неравенству
||х(«)||2<е-*||х(0)||2 + У2(1-е -
(
).
3.16. Используя лемму сравнения, найти верхнюю границу решения скалярного
уравнения
i=_x+ -Sint
x(0) = 2.
3.17. Рассмотрим задачу с начальными данными (3.1) и пусть D с R
n
—
откры
тая область, содержащая х = 0. Предположим, что решение x(t) уравнения (3.1)
принадлежит D при всех t ^ to и ||/(£,ж)||2 ^ ^INh на [to,oo) x D. Показать,
что
(а)
\ft[x
T
(t)x(t)}^2L\\x(t)\\l
(b)
||«o||2exp[-L(i - i0)] < ||ж(*)||2 < ||«0||2exp[L(i - to)]·
3.18. Пусть y(t) — неотрицательная скалярная функция, удовлетворяющая нера
венству
y(t) < fcie-"^-*
0
)+/е-
а
^-^[к2у(т) + ks]dr,
Jto
где hi, кг и к$ — неотрицательные константы и а — положительная константа,
удовлетворяющая а > к2. Используя лемму Гронуолла-Беллмана, покажите, что
y(t) ^ ^е-^-^'-'о) + -\-{1 - β
- (°-*»)(*-*ο)].
ОС
гь2
Указание: рассмотрите функцию z(t) = y(i)e
a
^
_i
°) и выведите соответствующее
неравенство для z.
3.19. Пусть / : R
n
—>R
n
локально липшицева в области D С Rn
.
Предполо
жим, что S С D — некоторое компактное множество. Показать, что существует
положительная константа L, такая что для всех х,у Ε S
\\f{x)-f{y)\\<L\\x-y\\.
Указание: множество 5 имеет конечное покрытие, т. е.
S С N(aun) U N{a2,r2) U · · · N(ak,rk).
112
ГЛАВА 3
Рассмотрите по отдельности два случая:
• х,у Ε S Π N(ai, ri) для некоторого г.
• х,у 0 S Π-ΛΓ(α*, г^) для любого г; в этом случае ||х — у\\ ^ mini г%-
Во втором случае используйте свойство равномерной ограниченности f(x) на 5.
3.20. Показать, что если / : R
n
—> i?
n
липшицева на W С Дп
, то /(ж) равномер
но непрерывна на W.
3.21. Для любой точки ж Ε i?n
—
{0} и любого ρ Ε [1,οο) определим у е R
n
равенством
Показать, что у
т
ж = ||х||р и ||у||д = 1, где q Ε (1,οο] удовлетворяет равенству
1/р+Ι/q =1.Приρ = оонайтивектору,такойчтоу
т
х = ||х||оо и ||y||i = 1.
3.22. Доказать лемму 3.3.
3.23. Пусть /(х) — непрерывно дифференцируемая функция, отображающая вы
пуклую открытую область D с R
n
вR
n
.
Предположим, что D содержит начало
координат х = 0 и /(0) = 0. Показать, что
f(x)= [
-^-{ax)da x, Vx E D.
Jo dx
Указание: положите g(a) = /(ax), 0 ^ σ ^ 1 и используйте равенство д{\) —
-g(0) = tig'(a)da.
3.24.ПустьV :RxR
n
— • i? — непрерывно дифференцируемая функция. Пред
положим,чтоV(£,0)=0длявсехt^0и
y(i,x)^ci||x||
£<'•*>
< с4||х||, V(i,x) Ε [0,οο) х Д
где ci и С4 — положительные константы и D С Rn
—
выпуклая открытая область,
содержащая начало координат х = 0.
(a) Показать, что V(t,x) < ^С4||х||
2
длявсеххΕD.
Указание: используйте представление V(t,x) = fQ ^-(t,ax)da
x.
(b) Доказать, что константы с\ и с4 должны удовлетворять неравенству 2с\ ^ с±.
(c) Показать, что W(t,x) = y/V(tyx) удовлетворяет условию Липшица
\W(t,x2) - W(t,xi)\ < ^=||X2 - xi||, Vt > 0, Vxbx2 Ε Ζ).
3.25. Пусть /(£,ж) — кусочно-непрерывна not и локально липшицева по х на
[to, t\] x £), где D — некоторая открытая область D С Rn
.
Пусть W — компактное
подмножество Dux— решение ж = /(£, ж), ж (to) = жо Ε W. Предположим, что
x(t) определено и x(t) Ε W для всех t Ε [£о>^0> Τ < t\.
3.5 . УПРАЖНЕНИЯ
ИЗ
(a) Показать, что x(t) равномерно непрерывна на [to,T).
(b) Показать, что х(Т) определено, принадлежит W и x(t) — решение на [to, Τ].
(c) Показать, что существует δ > 0, такая что решение может быть продолжено
на[t0,T+5].
3.26. Пусть /(t,x) — кусочно-непрерывна по t и локально липшицева по х на
[to,ti] x D, где D — некоторая открытая область D С Rn
.
Пусть y(t) — ре
шение (3.1) на максимальном открытом интервале [to,T) С [to,ti], Τ < оо.
Пусть W — компактное подмножество D. Показать, что существует t Ε [to, T),
такое что y(t) £'W.
Указание: используйте результаты предыдущего упражнения.
3.27 ([43]). Пусть х\ : R —> R
n
их<±:R—•R
n
—
дифференцируемые функции,
удовлетворяющие неравенствам
||xi(a) -X2WII <7> Il^(t)-/(t,Xi(t))|| <&>
i=Χ
>
2
>
при а ^ t ^ 6. Показать, что если / удовлетворяет условию Липшица (3.2), то
1*1W - *2(*)Н < 7e
L(<
"
a)
+ (Mi+μ2)
eL(t-a) _ 1
a<t<6.
3.28. В условиях теоремы 3.5 показать, что решение системы (3.1) непрерывно
зависит от начального момента времени to.
3.29. Пусть функция f(t,x) и ее частная производная по х непрерывны в (t,x)
для всех (t,x) € [to, ^1] х R
n
·
Пусть x(t,7y) — решение (3.1), начинающееся
в а:(to) = V- Предположим, что x(t^) определено на [to,ti]. Показать, что x(t,r/)
непрерывно дифференцируема по η; найти вариационное уравнение, которому
удовлетворяет [дх/θη].
Указание: сделав замену у = х — η, преобразуйте (3.1) к виду
У=/(t,2/+?7), у(*о)=0,
где η рассматривается в качестве параметра.
3.30. Пусть функция f(t,x) и ее частная производная по х непрерывны в (t,x)
для всех (t, х) G RxR
n
.
Пусть x(t, а,77) — решение (3.1), начинающееся ъх(а) —
= т?. Предположим, что x(t,a,ry) определено на [a,ti]. Показать, что x(t,a,rf
непрерывно дифференцируема по α и т/. Обозначим через xa(t) и x^t) соответ
ственно [<9х/<9а] и [Зх/дту]. Показать, что xa(t) и x^t) удовлетворяют тождеству
*a(*) +xv(t)ffav)
=°>
v
*^Mil·
3.31. Пусть функция f : Rx R—> R — непрерывная функция. Предположим, что
/(£, х) локально липшицева и не убывающая по х функция для любого фиксиро
ванного значения t. Пусть x(t) — решение х = /(t,x) на интервале [а, Ь]. Пока
зать, что если непрерывная функция y(t) удовлетворяет интегральному неравен
ству
y(t) < х(а) + / f(s,y(s))ds
Ja
при всех а < t ^ 6, то y(t) ^ x(t) на указанном интервале.
ГЛАВА 4
Устойчивость по Ляпунову
Теория устойчивости играет ключевую роль в теории систем и инженерных
науках. Можно сформулировать несколько различных задач устойчивости, кото
рые возникают при исследовании динамических систем. Центральным вопро
сом этой главы является устойчивость точек равновесия. В последующих гла
вах будут рассмотрены другие типы задач устойчивости, такие как устойчивость
в терминах «вход-выход» (input-output stabiblity) и устойчивость периодических
орбит. Устойчивость точек равновесия обычно рассматривается в рамках теории
устойчивости, разработанной русским математиком и инженером Ляпуновым, за
ложившим ее основы и давшим ей имя. Точка равновесия устойчива, если все
решения, начинающиеся вблизи этой точки, остаются в ее окрестности; в против
ном случае эта точка неустойчива. Точка равновесия асимптотически устойчива,
если все решения, начинающиеся в близких к ней точках, не только остаются
вблизи нее, но и стремятся к этой точке равновесия при стремлении времени
к бесконечности. Более строгие определения этих понятий будут даны в пара
графе 4.1, в котором будут приведены также основные теоремы метода Ляпунова
для случая автономных систем. Предложенное Ла-Саллем (LaSalle) обобщение
этой основной теории рассмотрено в параграфе 4.2. В случае линейной стаци
онарной системы х = Ax(t) устойчивость точки равновесия х = О может быть
полностью охарактеризована на основании информации о местоположении соб
ственных чисел матрицы А. Этот метод анализа рассматривается в параграфе 4.3,
в котором также исследуется вопрос о том, когда и как может быть установлен
факт устойчивости точки равновесия с использованием линеаризации системы
в окрестности этой точки. В параграфе 4.5 будут введены классы функций /С
и /СС, которые будут часто использоваться в оставшейся части главы и в даль
нейшем изложении. В параграфах 4.5 и 4.6 метод Ляпунова будет обобщен на
случай неавтономных систем. В параграфе 4.5 мы введем понятия равномерной
устойчивости, равномерной асимптотической устойчивости и экспоненциальной
устойчивости и предложим для неавтономных систем соответствующий метод
Ляпунова для установления этих свойств. В параграфе 4.6 будут исследованы
линейная стационарная система и ее линеаризация.
Теоремы устойчивости Ляпунова позволяют получить достаточные условия
для устойчивости, асимптотической устойчивости и других типов устойчивости.
Однако они не дают необходимых критериев устойчивости. Существуют теоре
мы, в которых утверждается (по крайней мере на концептуальной основе), что
условия многих теорем устойчивости Ляпунова являются также и необходимыми
4.1. АВТОНОМНЫЕ СИСТЕМЫ
115
условиями. Подобные теоремы обычно называются обратными теоремами Ляпу
нова. В параграфе 4.7 будут представлены три такие теоремы. Кроме того, мы
используем обратную теорему о экспоненциальной устойчивости для доказатель
ства того, что точка равновесия нелинейной системы является экспоненциально
устойчивой, если и только если линеаризация этой системы в окрестности этой
точки имеет экспоненциально устойчивое состояние равновесия в начале коор
динат.
Методы анализа, используемые в теории устойчивости Ляпунова, могут при
меняться для доказательства факта ограниченности решения даже в случаях, ко
гда рассматриваемая система не имеет точек равновесия. Этот вопрос обсужда
ется в параграфе 4.8, в котором вводятся понятия равномерной ограниченности
и предельной ограниченности. Наконец, в параграфе 4.9 рассматривается задача
устойчивости в терминах «вход-состояние» (input-to-state (ISS) stabiblity), пред
ставляющая собой естественное обобщение стандартных задач теории Ляпунова
на случай систем с входными воздействиями.
4.1. Автономные системы
Рассмотрим автономную систему
х = f{x),
(4.1)
где/:D—•R
n
—
локально липшицевое отображение области D с R
n
вR
n
.
Предположим, что х е D — точка равновесия системы (4.1), т. е. f(x) = 0. Наша
цель — исследовать свойства устойчивости этой точки. Для простоты изложения
сформулируем все определения и теоремы для случая, когда в качестве точки рав
новесия рассматривается начало координат х = 0 в R
n
.
Этот выбор не умаляет
общности, поскольку любая точка равновесия может быть перемещена в начало
координат с использованием соответствующей замены координат. Предположим,
что х φ 0, и рассмотрим замену координат у = х — х. Тогда производная у
определяется равенством
y = x-f(x)
= f(y+x)
d
^g(y), g(0) = 0.
Система, представленная в новых координатах, имеет состояние равновесия в на
чале координат. Таким образом, не умаляя общности, мы всегда можем предпо
лагать, что f(x) удовлетворяет /(0) = 0, и исследовать свойства устойчивости
начала координат х = 0.
Определение 4.1. Точка равновесия х = 0 системы (4.1) является
• устойчивой, если для каждой константы ε > 0 существует δ(ε) > 0, такая
что
\\х(0)\\ < δ ^ \\x(t)\\ < ε, Vt^O;
• неустойчивой, если она не является устойчивой;
116
ГЛАВА 4
• асимптотически устойчивой, если она устойчива и константа δ может
быть выбрана таким образом, что
\\х(0)\\ <δ=> lims(t) = 0.
t—>оо
Формулировка задачи устойчивости на языке ε — δ предполагает, что для
установления свойства устойчивости начала координат необходимо назначенно
му значению ε сопоставить некоторую константу δ, возможно, зависящую от ε,
такую что любая траектория, начинающаяся в 5-окрестности начала координат,
никогда не покинет его ε-окрестность. Представленные три типа устойчивости
могут быть проиллюстрированы на примере маятника из параграфа 1.2.1. Урав
нения маятника
XI=Х2,
±2= —asinxi—Ьх2
имеют две точки равновесия (xi = 0, £2 = 0) и (х\ = π,£2 = 0). Как мы видели
в главе 2 (рисунок 2.2), при отсутствии трения траектории в окрестности пер
вой точки равновесия представляют собой замкнутые орбиты. Поэтому можно
гарантировать, что траектории, начинающиеся достаточно близко от этой точки
равновесия, останутся в заданном шаре с центром в точке равновесия. Таким
образом, требования на устойчивость в терминах ε — δ в этом случае выполняют
ся. Однако указанная точка равновесия не является асимптотически устойчивой,
т. к. траектории, начинающиеся в этой точке, не стремятся к ней с течением вре
мени. Вместо этого они остаются на своих замкнутых орбитах. В случае когда
в системе присутствует трение (Ь > 0), точка равновесия в начале координат
становится устойчивым фокусом. Анализ фазового портрета устойчивого фоку
са показывает, что требования на устойчивость в терминах ε — δ в этом случае
выполняются. Более того, траектории, начинающиеся вблизи точки равновесия,
стремятся к ней при t9 стремящемся к бесконечности. Вторая точка равновесия
в х\ = π является седловой точкой. Очевидно, что требования на устойчивость
в терминах ε — δ в этом случае не выполняются, поскольку для любой ε > 0
всегда найдется траектория, которая покидает шар {х Ε Rn \ \\х — х\\ ^ ε} даже
в том случае, когда х(0) расположено сколь угодно близко к точке равновесия х.
В определении 4.1 подразумевается, что решения (4.1) определены при всех
t^О
1
. Известно, что глобальное существование решения не гарантируется ло
кальной липшицевостью правой части /. Тем не менее далее будет показано, что
некоторые дополнительные условия, введенные в теорему Ляпунова, позволяют
гарантировать глобальное существование решения. Этот результат будет получен
с применением теоремы 3.3.
1
Это определение можно модифицировать таким образом, чтобы смягчить требование глобаль
ного существования решения. В работе [154] устойчивость определяется на максимальном интер
вале [0, £i) существования решения в условиях, когда требование t\ = оо отсутствует.
4.1. АВТОНОМНЫЕ СИСТЕМЫ
117
Определив свойства устойчивости и асимптотической устойчивости точек
равновесия, мы должны найти методы, которые позволяют установить факт на
личия этих свойств. Подход, который использовался при анализе примера ма
ятника, связан с исследованием фазовых портретов уравнений его динамики.
Попытки обобщить этот подход на случай системы общего вида (4.1) связаны
с большими трудностями и во многих случаях будут безуспешны, т. к. требуют
нахождения решений этой системы. Однако заключения, которые были сделаны
выше в отношении устойчивой точки равновесия маятника, могут быть получе
ны с использованием энергетических концепций. Обозначим энергию маятника,
представляющую собой сумму его кинетической и потенциальной энергий, че
рез Е(х) и предположим, что потенциальная энергия определена таким образом,
что Е(0) = 0. Тогда
fXl
1
1
Е(х) = / αsinуdy+-F>x\ —α(1—cosxi)+ -x\.
При отсутствии трения (b = 0) система консервативна, т. е. в системе нет дисси
пации энергии. Тогда при движении системы Ε = const или, другими словами,
вдоль решений системы dE/dt = 0. Поскольку при Е(х) = с, где с — малая
величина, вокруг х = 0 образуется замкнутый контур, мы опять приходим к за
ключению, что х = 0 является устойчивой точкой равновесия. В случае когда
в системе имеет место трение (Ь > 0), во время ее движения энергия рассе
ивается, т.е. вдоль решений системы dE/dt ^ 0. Вследствие наличия трения
энергия Ε не может при движении системы оставаться постоянной неопределен
но долгое время, и поэтому она продолжает уменьшаться до тех пор, пока не
достигнет нулевого значения, что соответствует стремлению траектории к точке
х = 0 при t —> оо. Таким образом, анализ производной функции Ε вдоль траек
торий системы позволяет исследовать свойства устойчивости точки равновесия.
В 1892 году Ляпунов показал, что для установления свойств устойчивости со
стояния равновесия вместо функции энергии могут использоваться некоторые
другие функции. Пусть V : D —> R — непрерывно дифференцируемая функция,
определенная в области D с R
n
, содержащей начало координат. Производная V
вдоль траекторий системы (4.1), обозначаемая через V(x)9 имеет следующий вид:
г=1
г=1
dV_ dV_ dV_
дх\' дх2'
' дхп
f2(x)
:fn(x)
- £'<»>·
Производная V вдоль траекторий системы зависит от уравнений этой системы.
Следовательно, представление V(х) будет различно для различных систем. Если
118
ГЛАВА 4
0(£; х) — решение (4.1), начинающееся в точке х в момент времени t = О, то
У(х)=±У(ф&х))
t=o
Легко видеть, что если V(x) отрицательна, то V убывает вдоль решений систе
мы (4.1). Теорема Ляпунова может быть сформулирована следующим образом.
Теорема 4.1. Пусть х = О — точка равновесия системы (4.1) и D С Rn
—
открытая область, содержащая х — 0. Пусть V : D —• R — непрерывно
дифференцируемая функция, такая что
У(0)=0 и V(x)>0 в D-{0},
(4.2)
V(x)<0вD.
(4.3)
Тогда х = 0 устойчива. Более того, если
V(x) <0 в D- {0},
(4.4)
то х = 0 асимптотически устойчива.
Рис. 4 .1 . Геометрическое представление множеств, фигурирующих в доказательстве тео
ремы 4.1
ДОКАЗАТЕЛЬСТВО. Выберем ε > 0. Пусть г е (0,ε], такая что
Бг={хеR
n
| ||х||
^r}cD.
Положим а = min||x||=r V(x). Тогда из (4.2) следует, что а > 0. Положим /? G
(0,а)и
Ω^= {хGВг|У(х)^/3}.
Тогда Ωβ принадлежит внутренности шара Вг? (См. рисунок 4.1.) Любая траек
тория, начинающаяся в момент времени t ^ 0 в множестве Ω^, остается в этом
2
Это утверждение может быть доказано от противного. Предположим, Ω^ не содержится во
внутренности Вг. Тогда существует точка р€ Ω^ лежащая на границе Вг. В этой точке V(p) ^
а > /3, но для всех х G О.β выполнено V(x) ^ β, что противоречит предыдущему неравенству.
4.1 . АВТОНОМНЫЕ СИСТЕМЫ
119
множестве при всех t ^ 0. Это утверждение следует из (4.3), поскольку
V(x(t)) ^ 0=ФV(x{t)) <V(x(0)) </?, Vi^0.
Поскольку Ω/з является компактным множеством,
3
из теоремы 3.3. следует,
что (4.1) имеет единственное решение, определенное для всех t ^ 0 при условии,
что х(0) е Ωβ. Поскольку V(x) — непрерывная функция и V(0) = 0, существует
δ>0,такая что
||х|| <$=>||ж(*)|| <Γ^ε, V t> 0.
Тогда
ΒδсΩ/зСБг
и
s(0) GB^ Х(0) ΕΩ^ x(i) Gfi^ a;(t) £ Br.
Таким образом,
||x(0)||<δ=>\\x(t)\\<г<ε, V*^ 0.
Из этих неравенств следует, что точка равновесия х = 0 устойчива. Далее, пред
положим, что также выполнено дополнительное условие (4.4). Для доказатель
ства асимптотической устойчивости следует показать, что x(t) —> 0 при t —• оо,
т.е. для любой α > 0 существует Τ > 0, такое что ||ж(£)|| < а для всех t > Т.
Повторяя вышеприведенные рассуждения, можно показать, что для любой а > 0
мы можем найти Ь > 0, такое что Ω^ с Ва. Поэтому нам остается показать, что
V(x(t)) —> 0 при t —> оо. Поскольку У(ж(£)) — монотонно убывающая и неотри
цательная функция,
V(x(t)) —>с^0 при £—>оо.
Для того чтобы убедиться в том, что с = 0, проведем доказательство от про
тивного. Предположим, с > 0. Из непрерывности V(x) следует, что существует
d > 0, такое что £^ С Ω0. Из предела V(x(i)) —• с > 0 следует, что траек
тория х(£) лежит вне шара Д^ для всех t ^ 0. Пусть —7 = тах^^цжц^г У(х).
ЭТОТ максимум существует, т.к. непрерывная функция V(x) имеет максимум на
компактном множестве {d ^ ||х|| ^ г}.
4
Из (4.4) следует, что —η < 0. Тогда
V(x) = V(x(0)) + / V(X(T)) dr ^ V(x(0)) - it.
Jo
Поскольку правая часть при достаточно больших t становиться отрицательной,
это неравенство в конечном счете вступит в противоречие с предположением
с>0.
Π
Непрерывно дифференцируемая функция V(x), удовлетворяющая (4.2)
и (4.3), называется функцией Ляпунова. Поверхность V(x) = с называется по
верхностью Ляпунова или поверхностью уровня. С использованием рисунка 4.2
3
Ωβ замкнуто по построению и ограничено, т. к . оно содержится в Вг.
4
См. [10, теорема 4-20].
120
ГЛАВА 4
Рис. 4.2. Поверхности уровней функции Ляпунова
и понятия поверхностей Ляпунова мы можем дать интуитивное толкование тео
ремы 4.1. Действительно, на рисунке 4.2 показаны поверхности Ляпунова при
увеличивающихся значениях с. Из условия V ^ 0 следует, что, когда траектория
пересекает поверхность Ляпунова V(x) = с, она входит во внутренность множе
стваΩ0={хеR
n
| V{x) < с} и никогда уже не сможет выйти из него. При
V < 0 траектория движется с одной поверхности Ляпунова на внутреннюю по
верхность Ляпунова, соответствующую меньшему значению с. При дальнейшем
уменьшении с поверхность Ляпунова вырождается в точку — начало координат,
т. е. с течением времени траектория приближается к началу координат. Если нам
известно лишь V ^ 0, мы не можем быть уверены в том, что траектория будет
приближаться к началу координат,
5
но мы можем заключить, что начало коорди
нат является устойчивой точкой равновесия, поскольку траектория содержится во
внутренности любого шара Ве при условии, что начальное состояние системы
х(0) принадлежит внутренности поверхности Ляпунова, содержащейся в этом
шаре.
Функция V(x), удовлетворяющая условию (4.2), т. е. V(0) = 0 и V(х) > 0
при х φ 0, называется положительно определенной. Если функция V(x) удовле
творяет более слабому условию V(x) > 0 при х φ 0, она называется положи
тельно полуопределенной. Функция V(x), называется отрицательно определен
ной или отрицательно полуопределенной, если —V(x) является соответственно
положительно определенной или положительно полуопределенной. Если V(x)
не имеет определенного знака в смысле приведенных выше определений, она на
зывается знаконеопределенной. С учетом введенных терминов можно перефор
мулировать теорему Ляпунова: начало координат устойчиво (асимптотически
устойчиво), если существует непрерывно дифференцируемая положительно
определенная функция V(x), такая что функция V(x) отрицательно полуопре
делена (отрицательно определена).
Одним из классов скалярных функций, для которых может быть легко опре
делена и знакоопределенность, является класс функций, представляющих собой
5
См., однако, теорему Ла-Салля в параграфе 4.2.
4.1 . АВТОНОМНЫЕ СИСТЕМЫ
121
квадратичные формы
ηη
V(x)=х
т
Рх=
ΣΣρνΧ*Χ1>
г=1 j=l
где Ρ — вещественная симметричная матрица. В этом случае V(x) является поло
жительно определенной (положительно полуопределенной), если и только если
собственные значения матрицы Ρ положительны (неотрицательны) или, иными
словами, если и только если все ведущие главные миноры матрицы Ρ поло
жительны (все главные миноры матрицы Ρ неотрицательны)
6
.
Если функция
V(x)=x
T
Px положительно определена (положительно полуопределена), мы
будем говорить, что матрица Ρ положительно определена (положительно полу
определена), и писать Ρ > О (Р > 0).
Пример 4.1. Рассмотрим функцию
V(x) =ах\+2х\х%+<*>%2+4х2#з+&#з
=
=[Х\Х2ХЗ
а01
0α2
12а_
XI
Х2
_
яз_
=
х
т
Рх.
Ведущие главные миноры матрицы Ρ равны а, а
2
и а(а
2
—
5). Функция V{x) яв
ляется положительно определенной при а > у/Ъ. Для того чтобы эта функция бы
ла отрицательно определенной, необходима положительность ведущих главных
миноров —Р, т. е. ведущие главные миноры матрицы Ρ должны иметь последо
вательно изменяющиеся знаки: миноры с нечетными номерами должны быть от
рицательными, а с четными номерами — положительными. Следовательно, V(x)
отрицательно определена, если а < — >/5. Вычислив все главные миноры, можно
показать, что V(x) положительно полуопределена, если а ^ \/5, и отрицательно
полуопределена, если а ^ у/Ъ. При а £ (—\/5, л/5) функция V(x) знаконеопре-
делена.
Δ
Теорема Ляпунова может быть применена без непосредственного решения
дифференциального уравнения. Однако не существует систематического мето
да для нахождения функций Ляпунова. В некоторых случаях выбор функции
Ляпунова определяется естественными соображениями: например, в электриче
ских и механических системах в качестве кандидата на эту функцию выступает
функция энергии. В остальных случаях выбор функции Ляпунова — это пробле
ма, которую решают методом проб и ошибок. Однако ситуация складывается не
так плохо, как могло бы показаться на первый взгляд. По мере ознакомления
с большим количеством примеров и приложений рассматриваемой в этой книге
теории некоторые идеи и подходы к решению задачи выбора подходящей функ
ции Ляпунова будут проявляться более отчетливо.
6
Этот результат хорошо известен в теории матриц. Доказательство может быть найдено в [21]
и [63].
122
ГЛАВА 4
six)
V-α / /\-a \x
Рис. 4.3. Нелинейная функция в примере 4.2
Пример 4.2. Рассмотрим дифференциальное уравнение первого порядка
х=
-д(х),
где функция д(х) локально липшицева на (—а, а) и удовлетворяет
#(0) = 0; хд(х) > 0, Vx/Ο и хе(-а,а).
График функции, удовлетворяющей указанным требованиям, изображен на ри
сунке 4.3. Система имеет изолированную точку равновесия в начале координат.
В этом простом примере можно легко удостовериться в том, что начало коорди
нат асимптотически устойчиво, поскольку решения системы, начинающиеся по
любую сторону от начала координат, стремятся к нему. Для того чтобы убедить
ся в этом, достаточно принять во внимание знак производной х, определенный
рассматриваемым уравнением. К аналогичному заключению можно прийти с ис
пользованием теоремы Ляпунова. Рассмотрим функцию
V(x) = / д(у) dy.
Jo
В области D = (-а, а) функция V(x) непрерывно дифференцируема, V(0) = 0
и V(x) > 0 для всех х φ 0. Таким образом, функцию V(x) можно рассмот
реть в качестве кандидата на функцию Ляпунова. Для того чтобы установить,
является ли V(x) функцией Ляпунова или нет, вычислим ее производную вдоль
траектории системы:
V(x) = %[-9{х)] = -9
2
(х) <0, V*€D-{0}.
Следовательно, по теореме 4.1 начало координат асимптотически устойчиво. Δ
Пример 4.3. Рассмотрим уравнения маятника без трения
Xi=Х2,
Х2= —asinxi
и исследуем устойчивость точки равновесия в начале координат. Естественным
выбором функции Ляпунова является функция энергии:
V(x) = α(1 — cosxi) + \х\
4.1 . АВТОНОМНЫЕ СИСТЕМЫ
123
Очевидно, что V(0) = 0 и V(x) положительно определена в области — 2π<Χ\< 2π.
Производная V(x) вдоль траекторий системы имеет вид
V(x) —ах\ sinх\ + x<iX2—я#2sinх\ —ах2sinx\ =0.
Таким образом, условия (4.2) и (4.3) теоремы 4.1 выполнены, и мы можем заклю
чить, что начало координат устойчиво. Поскольку V(x) = 0, мы также можем
сказать, что начало координат не является асимптотически устойчивым. Траек
тории, начинающиеся на поверхности Ляпунова V(x) = с, остаются на этой
поверхности при всех будущих моментах времени.
Δ
Пример 4.4. Рассмотрим уравнения маятника с учетом трения
XI=Х2,
±2= —asinxi —6x2-
Рассмотрим в качестве функции Ляпунова ту же функцию энергии V(х) = а(1 —
—
cosxi) + κ#2· Тогда
V{x) = aii sinxi + X2X2 = —bx^.
Производная V(x) — отрицательно полуопределенная функция. Она не является
отрицательно определенной, т.к. V(x) = 0 при Х2 = 0 вне зависимости от зна
чения xi, т.е. V(x) = 0 вдоль xi-оси. Таким образом, мы можем заключить, что
начало координат устойчиво. Однако при анализе фазового портрета уравнения
маятника мы видели, что при Ъ > 0 начало координат асимптотически устой
чиво. Функция Ляпунова в виде функции энергии не позволяет выявить этот
факт. В параграфе 4.2 мы увидим, что теорема Ла-Салля позволяет получить
более адекватный результат. Здесь же мы попытаемся найти функцию Ляпуно
ва V(x), которая имела бы отрицательно определенную производную V(x). Для
этого рассмотрим снова функцию энергии и заменим член (1/2)^2 квадратичной
формой общего вида (1/2)х
т
Рх, где Ρ — некоторая положительно определенная
(2 х 2)-матрица:
V(x) = \х
т
Рх +а(1—cosxi)=
\[XI Х2}
Р11 Р\2
Р21 Р22
XI
Х2
+ а(1 — cosxi).
Для того чтобы квадратичная форма (1/2)х
т
Рх была положительно определен
ной, необходимо, чтобы элементы матрицы Ρ удовлетворяли условиям
Pll>0, РПР22~Рп >0·
Производная V(x) определяется равенством
V(x) = (pnxi +P12X2 + asinxi)x2 + (pi2#i +P22^2)(-«sinxi - bx2) =
= a(l -p22)^2sinxi — api2Xisinxi H- (pn — Pi2b)x\X2 +
+ (P12 ~P22b)x\
124
ГЛАВА 4
Выберем pn,pi2 и Р22 так, чтобы функция V(x) была отрицательно определен
ной. Члены X2sinxi и xi^2 знаконеопределенны, но мы можем избавиться от
них, положив р22 — 1, Рп = fypi2· В этом случае V(x) будет положительно
определенной, если р^ удовлетворяет 0 < р\2 < Ь. Пусть ри = 6/2. Тогда
V(x) — —-zobxi sinxi —
-^bx^.
Членxisinxi>0длявсех0<\х\\<π.ПустьD={хGRn\\х\\<π}.
Тогда V(x) положительно определена и V(x) отрицательно определена на D и,
следовательно, по теореме 4.1 начало координат асимптотически устойчиво. Δ
Этот пример выявляет важную особенность теоремы устойчивости Ляпу
нова: эта теорема дает лишь достаточные условия устойчивости. Невыполне
ние для выбранного кандидата на роль функции Ляпунова условий устойчивости
или асимптотической устойчивости не означает, что начало координат не являет
ся устойчивой или асимптотически устойчивой точкой равновесия системы. Это
означает лишь то, что эти свойства устойчивости не могут быть установлены
с использованием выбранного кандидата на роль функции Ляпунова. Является
ли точка равновесия устойчивой (асимптотически устойчивой) или же не явля
ется, может быть установлено только в ходе дополнительных исследований.
При нахождении функции Ляпунова в примере 4.4 мы осознанно подбирали
решение с учетом определенных свойств искомой функции. Мы анализировали
выражение для производной V(x) и возвращались к выбору параметров V(x) для
того, чтобы сделать V(x) отрицательно определенной функцией. Эта идея имеет
большое значение при выборе функции Ляпунова. Процедура, в которой исполь
зуется эта идея, известна как метод переменного градиента (variable gradient
method). Пусть V(x) — скалярная функция от х и д(х) = W
=
(dV/dx)
T
.
Производная V(x) вдоль траекторий (4.1) определяется равенством
V(x) = ^f(x)
=
9
T
(x)f(x).
Идея метода состоит в выборе д(х) таким образом, чтобы эта функция являлась
градиентом положительно определенной функции V(x) и при этом V(x) была бы
отрицательно определенной. Нетрудно удостовериться (упражнение 4.5) в том,
что д(х) является градиентом скалярной функции, если и только если матрица
Якоби [дд/dx] симметрична, т. е.
%
d
9jw..
Л
С учетом этого ограничения выберем д(х) таким образом, чтобы функция
дТ(х)/(х) была отрицательно определенной. Тогда функция V(x) может быть
вычислена следующим образом:
рх
рх
п
v
{x)=/9
Т
(У) dy=
У29г(у) dyi.
Jo
Jo i=1
4.1 . АВТОНОМНЫЕ СИСТЕМЫ
125
Интегрирование выполняется вдоль любой кривой, соединяющей начало коор
динат и х? Обычно это интегрирование выполняется вдоль осей:
ГХ\
РХ2
V(x)= / 0i(yi,O,...,O) dyi+ / р1(ж1,у2,...,0) dj/2 + ...
Jo
Jo
···+ /
9i(xuX2,.--,Xn-i,yn)dyn.
Jo
Оставляя некоторые параметры д(х) неопределенными, можно попытаться вы
брать остальные таким образом, чтобы функция V(x) была положительно опре
деленной. Метод переменного градиента мог бы быть использован для нахожде
ния функции Ляпунова в примере 4.4. Однако мы не будем этого делать и про
иллюстрируем метод на примере несколько более общей системы.
Пример 4.5. Рассмотрим систему второго порядка
Х\=Х2,
%2 = -h{x\) - ах2,
гдеа>О,h(-)
—
локально липшицева функция, Л(0) = 0 и yh(y) > О для всех
у Φ 0, у е (—6, с), где Ъ и с — некоторые положительные константы. Уравне
ние маятника является частным случаем этой системы. Чтобы применить метод
переменного градиента, мы должны найти вектор д(х) размерности 2, такой что
dgi = дд2_
Эх2 дх\'
V(x) = gi{x)x2 — 92(x)[h(xi) + ах2] < 0 при х φ О
и
гх
V(x) = / gT(y) dy>0 при х фО.
Jo
Рассмотрим следующий выбор:
а{х)х\ + Р{х)х2
L 1(Ф\ + S(x)x2
где скалярные функции а(ж), /?(#), j(x) и 6(х) подлежат определению. Для того
чтобы было выполнено требование симметричности, необходимо
Производная V(x) определяется равенством
V(x) = а(ж)ж1Ж2 + Р{х)х2 — а^{х)х\Х2 —
—а6(х)х2 — 5(x)x2h(x{) — ^{x)xih(xi).
7
Криволинейный интеграл вектора градиента не зависит от пути. (См. [10], теорема 10-37.)
126
ГЛАВА 4
Для того чтобы исключить перекрестные члены, положим
а{х)х\ — а^{х)х\ — 6(x)h(xi) = 0.
Тогда
V(x) = — [aS(x) — Р(х)]х2 — i(x)xih(xi).
Для простоты положим 6(х) = δ — const, η{Χ) = 7 = const и Р(х) = β = const.
Тогда а{х) зависит только от х\ и требование симметричности выполняется, если
β = 7· В этом случае выражение для д(х) сводится к следующему:
9(х)
αηΧ\ +Sh(xi) + 7^2
JXl + &2·
Интегрируя, получаем
PXl
ГХ2
V(x) = / [a72/i+Sh(y!)]dyx+ / {jxi +5y2)dy2 =
Jo
Jo
rx\
px\
= ^ajxl +δ h(y)dy+-yxix2 + \&x\ = ^x
T
Px +δ/ h(y)dy,
где
P=αη7
7δ
Заметим, что при 5>0и0<7<
а
<^ функции V(x) и V(x) соответственно
положительно и отрицательно определены. Например, при 7 = акб, 0 < к < 1
получаем функцию Ляпунова
V(x)
2Х
ка
2
ка
ка1
Χ+δ
rxi
/ НУ)
d
y,
Jo
удовлетворяющую условиям (4.2) и (4.4) теоремы 4.1 в области D = {х Ε R2 |
—Ь < х\ < с}. Следовательно, начало координат асимптотически устойчиво. Δ
В случае асимптотической устойчивости начала координат интересен во
прос о том, насколько далеко от начала координат может проходить траектория
системы, так чтобы при этом она стремилась к началу координат при t —> 00.
Этот вопрос связан с задачей определения области притяжения (domain of
attraction, basin), называемой также областью асимптотической устойчивости.
Пусть </>(£; х) — решение (4.1), начинающееся в начальном состоянии х в момент
времени t = 0. Тогда область притяжения определяется как множество всех то
чек х, таких что 4>(t\ х) определено для всех t ^ 0 и lim^oo <f>(t\ x) — 0. Опреде
ление области притяжения аналитическими методами может быть очень сложной
или даже невыполнимой задачей. Однако функции Ляпунова могут быть исполь
зованы для оценки этой области, т. е. для нахождения множеств, содержащихся
4.1. АВТОНОМНЫЕ СИСТЕМЫ
127
в области притяжения. Из доказательства теоремы 4.1 видно, что если существу
ет функция Ляпунова, удовлетворяющая условиям асимптотической устойчиво
стивобластиDиеслимножествоΩ0={хеR
n
| V(x) ^ с} ограничено
и содержится в D, то любая начинающаяся в Ω0 траектория остается в этом мно
жестве и стремится к началу координат при t —• оо. Таким образом, множество
flc может служить в качестве оценки области притяжения. Однако эта оценка
может быть консервативна, т.е. эта область может быть существенно меньше
действительной области притяжения. В параграфе 8.2 мы рассмотрим примеры
оценки области притяжения и познакомимся с некоторыми идеями, которые поз
воляют увеличить эти оценки. Здесь мы рассмотрим другой вопрос: при каких
условиях областью притяжения является все пространство R
n
l Иными слова
ми, какие должны выполняться условия, чтобы при любом начальном состоя
нии системы траектория </>(t; х) стремилась бы к началу координат при t —> оо
вне зависимости от того, насколько велико значение ||ж||. Если асимптотически
устойчивая точка равновесия обладает этим свойством, она называется глобально
асимптотически устойчивой*. Вспоминая доказательство теоремы 4.1, мы мо
жем заключить, что система глобально асимптотически устойчива, если любая
точках£Rn
принадлежит внутренности ограниченного множества Ω0. Очевид
но, что для выполнения этого условия необходимо, чтобы условия теоремы 4.1
выполнялись глобально, т. е. D = R
n
, но достаточно ли этого? Оказывается, для
того чтобы любая точка из R
n
могла содержаться в ограниченном множестве Ω0,
необходимо наложить дополнительные условия. Проблема заключается в том,
что при больших с множество Пс должно оставаться ограниченным. Рассмот
рим, например, функцию
V(X) =
-^-2+xl
1+х(
Рис. 4.4. Поверхности Ляпунова для функции V(x) = xf/(l + х\) + х\
На рисунке 4.4 показаны поверхности V(x) = с для различных положитель
ных значений с. При малых значениях с поверхность V(x) = с замкнута и,
8
В отечественной литературе принят термин «асимптотически устойчивая в целом». — Прим.
ред. перев.
128
ГЛАВА 4
следовательно, Ωβ ограничено, т.к. оно содержится в замкнутом шаре Вг для
некоторого г > 0. Этот факт является следствием непрерывности и положи
тельной определенности функции V(x). При достаточно большом с поверхность
V(x) = с становиться открытым множеством, а множество Пс — незамкнутым.
Для того чтобы Qc содержалось во внутренности шара Вг1 константа с должна
удовлетворять неравенству с < inf \\x\\^r V(x)· Если
I= lim inf V(x) <оо,
то Ωβ будет ограничено при с < /. В рассматриваемом случае
I—lim inf
г-»оо ||ж||=г 1+х?
2+^2
-
lim -—4 =1.
|ал|-юо 1 + xf
Таким образом, множество Ω0 замкнуто только при с < 1. Дополнительным усло
вием, гарантирующим ограниченность Ω0 при всех значениях с > 0, является
следующее:
У(х) —* оо при ||х|| —> оо.
Функция, удовлетворяющая этому требованию, называется радиально неограни
ченной.
Теорема 4.2. Пусть х = 0 — точка равновесия системы (4.1). Пусть V :
Rn
—> Д — непрерывно дифференцируемая функция, такая что
Vr(0)=0 и У(х)>0, Vx^O,
(4.5)
||х|| _> оо =» У(я) -• оо,
(4.6)
У(х)<0, Vrr^O.
(4.7)
Тогда х = 0 — глобально асимптотически устойчивая точка равновесия.
ДОКАЗАТЕЛЬСТВО. ДЛЯ любой точки ρ Ε Rn
положим с = V(p). Из усло
вия (4.6) следует, что для любой с > 0 существует г > 0, такая что V{x) > с
при ||ж|| > г. Тогда Ω0 С Бг и, следовательно, Пс ограничено. Дальнейшее до
казательство может быть проведено аналогично тому, как это было сделано при
доказательстве теоремы 4.1.
Π
Теорема 4.2 известна как теорема Барбашина-Красовского
9
.
В упражне
нии 4.8 дан контрпример, который показывает, что условие радиальной неогра
ниченности действительно необходимо.
9
На самом деле в работе Е. А. Барбашина и Η. Η. Красовского [Д12] получено более общее
утверждение, охватывающее случай нестрогого неравенства V(х) < 0. Именно оно обычно назы
вается теоремой Барбашина-Красовского (см. также примечание к параграфу 4.2). — Прим. ред.
перев.
4.1. АВТОНОМНЫЕ СИСТЕМЫ
129
Пример 4.6. Рассмотрим систему из примера 4.5, но на этот раз предполо
жим, что условие yh(y) > 0 выполнено при всех у φ 0. Функция Ляпунова
V{z) = |х
Гка
2
ка
ка1
x+δ/ Ну)dy
Jo
положительно определена для всех х Ε R2
и радиально неограниченна. Произ
водная
V(x) = —αδ(1— к)х
2
—
aSkx\h(xi)
отрицательно определена для всех х Ε i?2
, поскольку 0 < к < 1. Следовательно,
начало координат глобально асимптотически устойчиво.
Δ
Если начало координат х = 0 является глобально асимптотически устой
чивой точкой равновесия системы, оно представляет собой единственную точку
равновесия системы. Действительно, если существует другая точка равновесия х,
то любая траектория, начинающаяся в этой точке, не покидает ее при всех t ^ 0
и, следовательно, не стремится к началу координат, что противоречит предпо
ложению о том, что начало координат является глобально асимптотической точ
кой равновесия системы. Таким образом, вопрос о глобальной асимптотической
устойчивости не может стоять при исследовании систем с несколькими точками
равновесия, как в примере маятника.
В теоремах 4.1 и 4.2 устанавливаются условия устойчивости или асимпто
тической устойчивости точки равновесия. Существуют также теоремы, которые
устанавливают условия неустойчивости точки равновесия. Наиболее сильным
результатом в этой области является теорема Четаева, которая будет сформу
лирована ниже как теорема 4.3. Однако, для того чтобы сформулировать эту
теорему, нам необходимо ввести некоторые дополнительные термины. Пусть
V : D —> R — непрерывно дифференцируемая функция, определенная в обла
стиDсi?n
, содержащей начало координат х = 0. Предположим, что V(0) = 0
и что существует сколь угодно близкая к началу координат точка XQ, такая что
V(XQ)>0.Выберемг >0так,чтобышарВг = {хΕRn |||х||<г} содержался
вДи положим
U={хΕВг|V{x) >0}.
(4.8)
Множество U непустое и содержится в Вг. Его границу составляют поверхность
V(x) = 0 и сфера ||гс|| = г. Поскольку V(0) = 0, начало координат лежит на
границе U и внутри Вг. Заметим, что U может состоять из более чем одного
компонента. Например, на рисунке 4.5 изображено множество U для V(x) =
= (х\ — ж|)/2· Множество U может быть всегда построено при условии, что
V(0) = 0 и V(xo) > 0 для некоторой точки хо, произвольно близкой к началу
координат.
Теорема 4.3. Пусть х = 0 — точка равновесия системы (4.1). Пусть
V : D —• R — непрерывно дифференцируемая функция, такая что V(0) = 0
130
ГЛАВА 4
Рис. 4.5. Множество U для V(x) = (х\ - х%)/2
uV(xo) > 0 для некоторой точки XQ такой, что \\XQ\\ — произвольно малая вели
чина. Определим множество U отношением (4.8) и предположим, что V(x) > 0
в U. Тогда х = 0 — неустойчивая точка равновесия.
ДОКАЗАТЕЛЬСТВО. Точка XQ принадлежит внутренности U и V(xo) = а > 0.
Траектория x(t), начинающаяся в ж(0) = хо, должна покинуть множество U. Для
того чтобы убедиться в этом, заметим, что пока x(t) находится в С/, справедливо
V(x(t)) ^ а, поскольку V(x) > 0 в U. Пусть
7= mm{V(x) \xGUиV(x) ^ а}.
Эта константа действительно существует, т. к. непрерывная функция V(x) имеет
минимум на компактном множестве {хе U и V(x) ^ а} = {хе Вг и V(x) > α}.
10
Тогда7>0и
V(x(t)) =V(x0) +/ VO&($))ds^α+/ 7ds=α+jt.
Jo
Jo
Из этого неравенства видно, что x(i) не может навсегда остаться в U, т.к. V(x)
ограничена в U. Кроме того, x(t) не может покинуть U через поверхность
V(x) = 0, поскольку V(x(t)) ^ а. Следовательно, траектория ж(£) покидает
множество U через поверхность сферы ||х|| = г. Поскольку это может случиться
при произвольно малой ||хо||> начало координат неустойчиво.
Π
Существуют и другие теоремы о неустойчивости, которые были доказаны
ранее теоремы Четаева, но они являются следствиями этой теоремы (см. упраж
нения 4.11 и 4.12).
Пример 4.7. Рассмотрим систему второго порядка
XI = 31+010*0»
Х2= ~ 32+020*0»
где gi(x) и Q2{x) — локально липшицевы функции, удовлетворяющие в окрест
ности начала координат D неравенствам
Ых)\^к\\х\\Ъ
Ых)\^к\\х\\
2
2.
°См. [10, теорема 4-20].
4.2. Принцип инвариантности
131
Из этих неравенств следует, что #i(0) = #2(0) = 0, т.е. начало координат являет-
ся точкой равновесия. Рассмотрим функцию
V{x) = \{x\-xl).
На прямой Х2 = 0 в произвольно близких к началу координат точках выполнено
V(x) > 0. Множество U показано на рисунке 4.5. Производная функции V(x)
вдоль траекторий системы определяется равенством
V(x) = х\ + х\ + xi9i(x) - Х292(х)-
Абсолютная величина члена x\gi(x) — Х292(х) удовлетворяет неравенству
2
\xi9i(x) - Я2#2(я)| < Σ \Xi\' I^W ^ 2feNl2·
г=1
Следовательно,
V(x) > \\х\\1 - 2к\\х\\1 = \\х\Ц(1 - 2к\\х\\2).
При выборе г так, что Вг С D и г < l/(2fc), выполняются все условия теоре-
мы 4.3. Таким образом, начало координат неустойчиво. Δ
4.2. Принцип инвариантности
При анализе уравнения маятника с трением (см. пример 4.4) мы видели, что
функция энергии не удовлетворяет условиям теоремы 4.1 об асимптотической
устойчивости, поскольку ее производная V(x) = —Ьх\ отрицательно полуопре-
делена. Заметим, однако, что V(x) отрицательна везде, за исключением линии
Х2 = 0, где V(x) = 0. Для того чтобы для траектории рассматриваемой системы
было выполнено V(x) = 0, необходимо, чтобы эта траектория располагалась це-
ликом на линии Х2 = 0. За исключением точки начала координат это невозможно
обеспечить, т. к. из уравнений системы видно:
x2(t) ξΟ^^ξΟ^ sinxi(i) = 0.
Следовательно, на сегменте —π < х\ < π линии Х2 = 0 условие V(x) = 0
вдоль траекторий системы может быть выполнено лишь в начале координат х =
= 0. Таким образом, вдоль этих траекторий функция V(x(t)) должна убывать к 0
и, следовательно, x(t) —> 0 при t —> 00. Этот результат соотносится с тем, что
вследствие наличия трения энергия находящейся в движении системы не может
оставаться постоянной.
Приведенное выше рассуждение указывает на то, что если в области вблизи
начала координат определена функция Ляпунова, чья производная вдоль траек-
торий системы отрицательно полуопределена, и если установлено, что ни одна
132
ГЛАВА 4
из траекторий не может оставаться в точках, где V(x) = 0, за исключением
начала координат, то начало координат асимптотически устойчиво. Эта идея сле
дует из принципа инвариантности Ла-Салля, который будет рассмотрен в этом
параграфе
11
.
Для того чтобы сформулировать и доказать теорему Ла-Салля, нам
необходимо определить некоторые понятия. Пусть x(t) —решение системы (4.1).
Точка ρ называется положительной предельной точкой траектории x(t), если су
ществует последовательность {£n}, tn —> оо при η —> оо, такая что x(tn)
—>ρ
при η —• оо. Множество всех положительных предельных точек траектории x(t)
называется положительно предельным множеством. Множество Μ называется
инвариантным множеством по отношению к системе (4.1), если
х(0)еΜ =»x(t) еΜ, WGД,
т. е. если решение принадлежит Μ в некоторый момент времени, то оно принад
лежит этому множеству во все будущие и прошлые моменты времени. Множе
ство Μ называется положительно инвариантным множеством, если
х(0)еМ =>x(t)ЕМ, Vt^0.
Мы также будем говорить, что x(t) стремится к множеству Μ при t, стремя
щемся к бесконечности, если для любой константы ε > 0 существует момент
времени Τ > 0, такой что
dist(s(i),M) <ε, Vt > Τ,
где dist(p,M) — расстояние от точки ρ до множества М, т.е. наименьшее из
расстояний между ρ и точками множества М:
dist(p,M)= infЧ|р-ж||.
хем
Введенные выше понятия могут быть проиллюстрированы на примере асимпто
тически устойчивой точки равновесия и устойчивого предельного цикла на плос
кости. Асимптотически устойчивая точка равновесия представляет собой поло
жительное предельное множество любого решения, начинающегося в достаточ
но малой окрестности этой точки. Устойчивый предельный цикл представляет
собой положительное предельное множество любого решения, начинающегося
в достаточно малой окрестности этого предельного цикла. Решение стремится
к предельному циклу при t —> оо. Заметим, однако, что решение не стремится
к какой-либо отдельной точке на предельном цикле. Другим словами, утвержде
ние «x(t) стремится к Μ при t —*· оо» не означает, что существует Ит$_юо x(i).
Точка равновесия и предельный цикл представляют собой инвариантные мно
жества, поскольку любое решение, начинающееся в любом из этих множеств,
11
Эта идея впервые была высказана в работе [Д12] и часто называется принципом Барбашина-
Красовского. В работе Дж. Ла-Салля [112] она была распространена на задачи устойчивости мно
жеств. В последние годы теорему, называемую теоремой Ла-Салля в англоязычной литерату
ре, стали называть теоремой Красовского-Ла-Салля или (для нестационарного случая) теоремой
Красовского-Ла-Салля-Йосидзавы. — Прим. ред. перев.
4.2. Принцип инвариантности
133
остается в нем при всех t е R. Множество Ω0 = {х е Rn \ V{x) < с}, V"(x) < О
для всех х еО,с является положительным инвариантным множеством, поскольку
из теоремы 4.1 следует, что решение, начинающееся в Ω0, остается в Ω0 для всех
В следующей лемме, доказательство которой приведено в приложении С.З,
формулируется фундаментальное свойство предельных множеств.
Лемма 4.1. Если решение x(t) системы (4.1) ограничено и принадлежит D
при t ^ 0, то его положительное предельное множество L+ представляет со-
бой непустое, компактное, инвариантное множество. Более того, x(t) стре-
мится к 1/+ при t —> оо.
Мы готовы сформулировать теорему Ла-Салля.
Теорема 4.4. Пусть Ω с D — компактное множество, которое яв-
ляется положительно инвариантным мноэюеством для системы (4.1). Пусть
V : D —>· R — непрерывно дифференцируемая функция, такая что V(x) < О
в Ω. Предположим, что Ε — множество всех точек из Ω, в которых V(x) = О,
и Μ — наибольшее инвариантное множество, содержащееся в Е. Тогда каждое
решение, начинающееся в Ω, стремится к Μ при t —->· оо.
Доказательство. Пусть x(t) — решение (4.1), начинающееся в Ω. По-
скольку V(x) < 0 в Ω, функция V(x(t)) убывает с течением времени. Посколь-
ку V(x) непрерывна на компактном множестве Ω, она ограничена в Ω сверху
и, следовательно, V(x(t)) имеет предел а при t —► оо. Заметим также, что по-
ложительное предельное множество L4" содержится в Ω, т. к. Ω — замкнутое
множество. Для любой точки ρ £ L+ существует последовательность tn, такая
что tn —► оо и x(tn) —► ρ при η —► оо. Из непрерывности V(x) следует, что
V(p) = \imn-^OQV(x(tn)) = а. Тогда V(x) = а на L4". Поскольку по лемме 4.1
множество 1/+ является инвариантным, V(x) = 0 на L4". Таким образом,
L+ СМ СЕСП.
Поскольку x(t) ограничено, x(t) стремится к L4" при t —> оо (по лемме 4.1).
Следовательно, x(t) стремится к Μ при t —► оо. Π
В теореме 4.4, в отличие от теоремы Ляпунова, не требуется, чтобы функция
V(x) была положительно определена. Заметим также, что построение множества
Ω никак не связано с построением функции V(x). Однако во многих приложени-
ях нахождение V(x) гарантирует существование множества Ω. В частности, если
Ω0 = {х е Rn | V(x) < с} ограничено и V(x) < 0 в Ω, то мы можем положить
Ω = Ω0. Если V(x) положительно определена, множество Ω0 ограничено при
достаточно малом с > О12. Это утверждение не всегда справедливо, если V(x) не
является положительно определенной функцией. Например, если V(x) = (х\ —
— х\)2, множество Ω0 неограниченно при всех положительных значениях с.
l2Qc может иметь несколько компонент, и это утверждение касается ограниченной компоненты,
содержащей начало координат.
134
ГЛАВА 4
Если V(x) радиально неограниченна, т.е. V(x) —> оо при ||х|| —» оо, то мно
жество Пс ограничено при всех положительных значениях с. Это утверждение
справедливо вне зависимости от того, является ли функция V{x) положительно
определенной или нет.
Если задача состоит в том, чтобы показать, что x(t) —> О при ||#|| —> оо,
следует доказать, что наибольшим инвариантным множеством является начало
координат. Это можно сделать, если показать, что единственным решением, по
стоянно остающимся в множестве Е, является тривиальное решение x(t) = 0.
Применяя теорему 4.4 в этом случае и используя положительно определенную
функцию Ляпунова V(x)9 мы получаем следующие два следствия, которые явля
ются более общими результатами, по сравнению с теоремами 4.1. и 4.2
13
.
Следствие 4.1. Пусть х = 0 — точка равновесия (4.1). Пусть V : D —> R —
непрерывно дифференцируемая положительно определенная функция, опреде
ленная в области D, содержащей начало координат х = 0, и такая, что
V(x) ^0вD.Рассмотрим множество S ={хGD\V{x) =0}ипредпо
ложим, что единственным решением, постоянно остающимся в множестве S,
является тривиальное решение x(t) = 0. Тогда начало координат асимптоти
чески устойчиво.
Следствие 4.2. Пусть х = 0 — точка равновесия (4.1). Пусть V : R
n
—>
—> R — непрерывно дифференцируемая, радиально неограниченная, положитель
но определенная функция такая, что V(x) ^ 0 для всех х G Rn
.
Рассмотрим
множество S = {х G Rn | V(x) = 0} и предположим, что единственным реше
нием, постоянно остающимся в мноэюестве S, является тривиальное решение
x(t) = 0. Тогда начало координат глобально асимптотически устойчиво.
При отрицательно определенной производной функции Ляпунова V(x) мы
имеем S = {0} и следствия 4.1. и 4.2 сводятся соответственно к теоремам 4.1
и 4.2.
Пример 4.8. Рассмотрим систему
XI=Х2,
Х2 = -hi(xi)
-h2{x2),
где hi(-) и h,2(') — локально липшицевы функции, удовлетворяющие
/ц(0)=0,yhi(y) >0,Ууφ0иуG (-а,а).
Система имеет изолированную точку равновесия в начале координат. В общем
случае система может иметь и другие точки равновесия — это зависит от функций
hi(-) и /i2(·)· Рассматриваемые уравнения могут интерпретироваться как обоб
щенные уравнения маятника, где функция h2 играет роль трения. Поэтому в ка
честве кандидата на функцию Ляпунова удобно рассмотреть функцию с членом,
13
Следствия 4.1 и 4.2 известны как теоремы Барбашина-Красовского, полученные ранее прин
ципа инвариантности Ла-Салля. — Прим. ред. перев.
—
См. [Д12].
4.2 . ПРИНЦИП ИНВАРИАНТНОСТИ
135
соответствующим энергии системы:
У(х)= 1
Х1
кг(у)<1у+±х1
ПустьD={хеR
2
| — а < х\ < а}; функция V(x) положительно определена
наDи
V(x) = hi(xi)x2 + X2(-hi(xi) - h2(x2)) = -X2h<2(x2) < 0
отрицательно полуопределена. Для нахождения множества S = {х £ D \ V(x) —
—
0} заметим, что
V(x) =0 =>X2h2{x2)=0 =>Х2=0, поскольку -α<а?2<«·
Следовательно, 5 = {х £ D | #2 = 0}. Пусть x{t) — решение, постоянно остаю
щееся в 5:
x2(t) =0 ^ х2=0 ^ /ii(xi)=0 =>xi(t)=0.
Таким образом, единственным решением, постоянно остающимся в множестве S,
является тривиальное решение x(i) = 0, и, следовательно, начало координат
асимптотически устойчиво.
Δ
Пример 4.9. Рассмотрим систему из примера 4.8 и предположим, что а =
= оо и hi(-) удовлетворяет дополнительному условию
ГУ
/ h\(z) dz —• оо при |у|—> оо.
./о
Функция Ляпунова У (ж) = JQ1 h\{y) dy + (1/2)х
2
радиально неограниченна.
Аналогично тому, как это было сделано в предыдущем примере, можно показать,
чтоV(x) <0вR
2
и множество
5={х£Д2|У(ж)=0}={хеR
2
|х2=0}
не содержит решений, отличных от тривиального. Следовательно, начало коор
динат глобально асимптотически устойчиво.
Δ
Теорема Ла-Салля позволяет не только ослабить требования теоремы Ля
пунова относительно отрицательной определенности производной функции Ля
пунова, но также и получить три важных обобщения этой теоремы. Во-первых,
она позволяет получить оценку области притяжения, причем полученная таким
образом область может отличаться от стандартной Qc = {x е R
n
\V(x) <с}.
В качестве множества Ω, упомянутого в формулировке теоремы 4.4, может вы
ступать любое компактное положительно инвариантное множество. Мы исполь
зуем это обстоятельство в параграфе 8.2 при получении менее консервативных
оценок области притяжения. Во-вторых, теорема Ла-Салля может использоваться
136
ГЛАВА 4
в случаях, когда система имеет не только одну изолированную точку равновесия,
но и целое множество устойчивых состояний. Эта особенность будет проиллю
стрирована на простом примере адаптивной системы управления, рассмотренной
в параграфе 1.2.6. В-третьих, функция V(x) не обязательно должна быть поло
жительно определенной. Использование этого обстоятельства будет продемон
стрировано на примере анализа нейронной системы в параграфе 1.2.5.
Пример 4.10. Рассмотрим систему первого порядка
у=ау+и
и адаптивный закон управления
и=—fct/, к=7У
2
,
7>0·
Полагая х\ — у и х^ — /с, получаем замкнутую систему
х\ = -(х2 - a)xi,
#2 = 7#1·
Ось ординат х\ = 0 представляет собой множество состояний равновесия. Мы
покажем, что траектории стремятся к этому множеству при t —• оо, т. е. адаптив
ный регулятор обеспечивает стремление выхода системы у к нулю. Рассмотрим
функцию Ляпунова
V(x) = lxl + ±(x2-b)\
где b > а. Производная V вдоль траекторий системы определяется равенством
V(x) =X\Xi +7y(xf2-Ъ)±2= ~xl{x2 -θ)+3q(x2-Ь)=
= -х\(Ъ-а)
^0.
Таким образом, V(x) ^ 0. Поскольку V(x) радиально неограниченна, множество
Qc={хеR
2
| V(x) ^ с} компактно и является положительно инвариантным.
Полагая Ω = Qc, мы получаем, что все условия теоремы 4.4 выполнены. Мно
жество Ε задается отношением Ε = {х £ Ω0 | х\ = 0}. Поскольку каждая точка
на оси ординат х\ = 0 является точкой равновесия, Ε является инвариантным
множеством. Поэтому в рассматриваемом примере Μ = Ε. Из теоремы 4.4 сле
дует, что любая траектория, начинающаяся в Ω0, стремится к Ε при t —> оо, т. е.
xi(t) —> 0 при t —> оо. Более того, поскольку V(x) радиально неограниченна,
полученное утверждение выполнено глобально, т.е. оно справедливо для всех
начальных условий х(0), потому что для любого х(0) константа с может быть
выбрана настолько большой, что х(0) е Ω0.
Δ
Заметим, что функция Ляпунова в примере 4.10 зависит от константы 6,
которая должна удовлетворять требованию Ь > а. Поскольку в адаптивной за
даче управления константа а неизвестна, мы можем не знать точного значения
4.2 . ПРИНЦИП ИНВАРИАНТНОСТИ
137
константы 6, но тем не менее мы можем быть уверены, что такая константа
существует. Это обстоятельство позволяет высветить некоторое новое свойство
метода Ляпунова, которое мы еще не упоминали в процессе изложения. Имеется
в виду то, что в некоторых ситуациях мы можем декларировать существование
функции Ляпунова, удовлетворяющей условиям определенной теоремы, но при
этом мы даже можем не иметь ее точное выражение. В примере 4.10 мы можем
определить функцию Ляпунова, если нам известно ограничение на константу а.
Например, если мы знаем, что \а\ < а, где а — известная величина, мы можем
в выражении для функции Ляпунова выбрать Ь > а.
Пример 4.11. Нейронная сеть, рассмотренная в параграфе 1.2.5, описыва
ется системой
%i — sy *4\%i) Στ^ ^дГЧхг) + 1г
1,2,...,η,
где Ii — постоянные токи, рассматриваемые как входы системы, Ri > 0, С{ > 0
и в качестве переменных состояния Xi фигурируют напряжения на выходах уси
лителей. Эти величины могут принимать значения только из множества
H={xeR
n
\ -VM<Xi< VMY
Функции gi : i? —> (—Ум, VM) — сигмоидальные функции
hi{Xi)
=
^
Щ=9г
l
(Xi)
>0,
Vxie(-VM,VM).
Предположим, что выполнено условие симметричности Тц = Tji. Система мо
жет иметь несколько точек равновесия в Н. Мы будем предполагать, что все
точки равновесия в Η являются изолированными. Из условия симметричности
следует, что вектор с компонентами
у ^TjjXj 1g-\xi) + h
Ri
представляет собой градиент скалярной функции. Интегрируя аналогично тому,
как это было сделано при рассмотрении метода переменного градиента, можно
показать, что эта скалярная функция имеет следующий вид:
v
(*) =\ΣΣЪэХгх,+Σi:/
г
ar
1
(у) d
v-Σ
/
<
х
<·
Эта функция непрерывно дифференцируема, но в общем случае не является по
ложительно определенной. Перепишем уравнения состояния в виде
138
ГЛАВА 4
и применим теорему 4.4, используя V(x) в качестве функции Ляпунова. Произ
водная этой функции вдоль траекторий системы имеет следующий вид:
г=1
г=1
ч
'
Более того,
v4*)=o^g=o ±i=0, Уг.
Таким образом, V(x) = 0 только в точках равновесия. Для того чтобы применить
теорему 4.4 мы должны построить множество Ω. Положим
Ω(ε) = {xeR
n
\
- (VM-e)^Xi^
(VM - ε)},
где ε > 0 — произвольно малая константа. Множество Ω (ε) замкнуто и ограни
чено, V(x) ^ Ов Ω(ε). Осталось показать, что множество Ω (ε) является поло
жительно инвариантным, т. е. каждая траектория, начинающаяся в Ω (ε), остается
в Ω (ε). Для упрощения стоящей задачи предположим, что сигмоидальные функ
ции имеют следующий вид:
(Н(щ) = ШтЛе^У А>0.
Тогда
При\xi\^Ум—ε
^гМ
х
^ У JTijXj
2VM
XnRi
tg
Ш+
*
tg
2VM)
^tfi
K(VM - g)
2VM
ooприε0.
Поскольку Xi и li — ограниченные величины, ε может быть выбрана достаточно
малой для того, чтобы было выполнено неравенство
г У. *ijXj
3
XnRi
tg
Ш+
*
л<0приVM—ε^\xi\<VM-
Следовательно,
J^(xf)-2xi±i<0 при VM-ε<\xi\^VM,
Vi.
Таким образом, траектории, начинающиеся в Ω (ε), останутся в Ω (ε). Более того,
траектории, которые начались в Η — Ω (ε), стремятся к Ω (ε). Из этого следует, что
4.3. ЛИНЕЙНЫЕ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ
139
все точки равновесия лежат в компактном множестве Ω (ε). Следовательно, суще
ствует лишь конечное число изолированных точек равновесия. В Ω (ε) выполнено
Ε = Μ, где Μ — множество точек равновесия внутри Ω (ε). Из теоремы 4.4 сле
дует, что каждая траектория в Ω(ε) стремится к Μ при t —» оо. Поскольку Μ
состоит из изолированных точек равновесия, можно показать (упражнение 4.20),
что траектория, стремящаяся к М, должна стремиться к одной из этих точек рав
новесия. Следовательно, траектории системы не осциллируют.
Δ
4.3. Линейные системы и линеаризация
Линейная стационарная система
х=Ах
(4.9)
имеет точку равновесия в начале координат. Эта точка является изолированной,
если и только если det(^) φ 0. Если det(A) = 0, матрица А имеет нетривиаль
ное нуль-пространство. Каждая точка в нуль-пространстве матрицы А является
точкой равновесия системы (4.9). Другими словами, если det(A) = 0, система
имеет подпространство точек равновесия. Заметим, что линейная система не мо
жет иметь более одной изолированной точки равновесия. Действительно, если х\
и Х2 — две различные точки равновесия системы (4.9), то из линейности следу
ет, что любая точка на линии, соединяющей эти две точки, должна быть точкой
равновесия системы. Свойства устойчивости начала координат могут быть уста
новлены на основании информации о местоположении собственных чисел мат
рицы А. Из теории линейных систем известно,
14
что решение (4.9) с начальным
условием х(0) определяется равенством
x(t) = exp(At)x(0).
(4.10)
Кроме того, для любой матрицы А существует невырожденная матрица Ρ (воз
можно, комплексная), определяющая преобразование к форме Жордана:
P~
l
AP = J = diag[Jb J2,. ·., Jr],
где Ji — жорданова клетка, соответствующая собственному значению λ^ матри
цы А. Жордановы клетки порядка 1 и т > 1 имеют соответственно вид Ji = Xi
и
ГАг10
01
0Xi1
0
1
14
См., например, [9,35,81,94,158].
140
ГЛАВА 4
Тогда
Г ГПг
exp(At) = Рехр(Л)р-
г
= YJY^t
k
~
1
exp(Xit)Rik,
(4.11)
г=1 fc=l
где m^ — порядок клетки Жордана J^. Если η х η-матрица А имеет кратное
собственное значение Хг с алгебраической кратностью с^,
15
то клетки Жордана,
соответствующие Аг, имеют порядок 1, если и только если rank(A — λ^Ι) = n — qi.
В следующей теореме устанавливаются свойства устойчивости начала координат
для системы (4.9).
Теорема 4.5. Точка равновесия х = 0 системы х = Ах является устойчи
вой, если и только если все собственные значения А удовлетворяют Re λ^ ^ 0
и для каждого собственного значения А^, ReA^ = 0 алгебраической кратности
q%^2 выполнено rank(A — \il) — n
—
qi, где η —размерность х. Точка равнове
сия х = 0 является (глобально) асимптотически устойчивой, если и только если
все собственные значения А удовлетворяют ReXi < 0.
ДОКАЗАТЕЛЬСТВО. ИЗ (4.10) видно, что начало координат устойчиво, ес
ли и только если exp(At) является ограниченной функцией времени для всех
t ^ 0. Если одно из собственных значений А расположено в открытой правой по
луплоскости комплексной плоскости, соответствующий экспоненциальный член
ехр(А^) в (4.11) будет неограниченно возрастать при t —> оо. Поэтому мы долж
ны потребовать, чтобы собственные значения лежали в замкнутой правой по
луплоскости. Однако если порядок жордановых клеток, соответствующих соб
ственным значениям, лежащим на мнимой оси, более единицы, в выражении
для решения (4.11) могут возникнуть неограниченные члены, т.к. в этом случае
они будут содержать множитель t
k
~
l
.
Поэтому мы должны потребовать, чтобы
собственным значениям, лежащим на мнимой оси, соответствовали жордановы
блоки размерности 1, что эквивалентно условию на ранг гапк(Л — λ*/) = n — qi.
Таким образом, мы получили необходимые условия устойчивости. Очевидно, что
эти условия являются также и достаточными для того, чтобы функция exp(Ai)
была ограничена. Для доказательства асимптотической устойчивости начала ко
ординат следует показать, что exp(At) стремится к нулю при t —• сю. Из (4.11)
видно, что это условие равносильно требованию ReA^ < 0,Vi. Поскольку x(t)
линейно зависит от начального состояния х(0), асимптотическая устойчивость
начала координат является глобальным свойством.
Π
С математической точки зрения понятно, почему кратные собственные зна
чения на мнимой оси должны удовлетворять ранговому условию rank(A — A^J) =
= n — qi. Физический смысл этого требования может быть проиллюстрирован
следующим примером.
Пример 4.12. На рисунке 4.6 показаны последовательное и параллельное
соединения двух идентичных систем. Каждая из систем имеет математическую
15
Это означает, что qt — кратность корня λ* характеристического уравнения det(AJ — А) — 0.
4.3 . ЛИНЕЙНЫЕ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ
141
}
(а)
(Ь)
Рис. 4.6. (а) Последовательное соединение; (Ь) параллельное соединение
модель следующего вида:
У=[10]х,
где и и у — соответственно вход и выход системы. Обозначим через As и Ар
матрицы линейных систем с последовательным и параллельным соединениями:
01001
-10
00
00 Oil·
10-10J
Собственные значения ±j, j = >/—Τ матриц ApnAS9
расположенные на мнимой
оси, совпадают и имеют алгебраическую кратность qi = 2. Легко проверить, что
гапк(Лр—jl) =2 =η —qiигапк(А5—jl) =3φη—qi*Такимобразом,из
теоремы 4.5 следует, что начало координат для системы с параллельным соеди
нением подсистем устойчиво, а для системы с последовательным соединением
подсистем — неустойчиво. С физической точки зрения различие этих систем за
ключается в следующем. В системе с параллельным соединением и ненулевым
начальным состоянием возникают синусоидальные колебания с частотой 1 рад/с,
и это решение является ограниченной функцией времени. Сумма этих синусои
дальных сигналов остается ограниченной функцией. С другой стороны, в систе
ме с последовательным соединением и ненулевым начальным состоянием перво
го компонента возникают синусоидальные колебания этого компонента с часто
той 1 рад/с, которые играют роль управляющего входного воздействия для второ
го компонента. Поскольку второй компонент имеет незатухающую собственную
частоту 1 рад/с, входное воздействие от первого компонента приводит к возник
новению «резонанса» и выход системы неограниченно возрастает.
Δ
Если все собственные значения А удовлетворяют Re λ^ < 0, матрица А на
зывается гурвицевой или устойчивой матрицей. Начало координат (4.9) является
асимптотически устойчивым, если и только если матрица А гурвицева. Асимп
тотическая устойчивость также может исследоваться с использованием метода
и,
0100
-10
00
0001
0 0-10
142
ГЛАВА 4
Ляпунова. Рассмотрим квадратичную функцию Ляпунова вида
V(x)=x
T
Px,
где Ρ — вещественная симметричная положительно определенная матрица. Про
изводная V(x) вдоль траекторий линейной системы (4.9) определяется равен
ством
V(x) =х
т
Рх+х
т
Рх =х
т
(РА-А
т
Р)х =
-x
T
Qx,
где Q — симметричная матрица, определяемая соотношением
PA+A
T
P=-Q.
(4.12)
Если Q положительно определена, из теоремы 4.1 следует, что начало координат
асимптотически устойчиво, т. е. Re λ^ < 0 для всех собственных значений мат
рицы А. Здесь мы следуем стандартной процедуре метода Ляпунова, согласно
которой выбирается положительно определенная функция V, а затем проверя
ется отрицательная определенность ее производной V(x). В случае линейных
систем мы можем выполнить эту процедуру в обратном порядке. Предположим,
мы начинаем наш анализ с выбора симметричной положительно определенной
матрицы Q, а затем решаем уравнение (4.12) относительно Р. Если (4.12) имеет
положительно определенное решение, мы можем заключить, что начало коор
динат асимптотически устойчиво. Уравнение (4.12) называется уравнением Ля
пунова, В следующей теореме асимптотическая устойчивость характеризуется
в терминах решения уравнения Ляпунова.
Теорема 4.6. Матрица А является гурвицевой, т.е. Reλ^ < 0 для всех
собственных значений А, если и только если для заданной положительно опре
деленной симметричной матрицы Q существует положительно определенная
симметричная матрица Р, удовлетворяющая уравнению Ляпунова (4.12). Более
того, если А гурвицева, то Ρ — единственное решение (4.12).
ДОКАЗАТЕЛЬСТВО. Достаточность утверждений теоремы следует, как бы
ло показано выше, из теоремы 4.1 при выборе V(x) = x
T
Px в качестве функ
ции Ляпунова. Для доказательства необходимости условий предположим, что все
собственные значения А удовлетворяют ReA^ < 0, и рассмотрим матрицу Р,
определенную равенством
/»оо
Р=
exp{AT
t)Qexp(At)
at.
(4.13)
Jo
Подынтегральная функция представляет собой сумму членов вида t
k
~
l
exp(A^),
где Re λ^ < 0. Поэтому рассматриваемый интеграл существует. Матрица Ρ яв
ляется симметричной и положительно определенной. Тот факт, что она поло
жительно определена, может быть обоснован от противного. Предположим, что
существует вектор х ^ 0, такой что х
т
Рх = 0. Тогда
/»оо
х
т
Рх=0=>/х
т
exp(AT
t)Qexp(At)x
dt=0
Jo
=> exp{At)x ΞΞ0,\/t ^ 0 =>x = 0,
4.3 . ЛИНЕЙНЫЕ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ
143
поскольку exp(At) невырожденна для всех t. Из полученного противоречия
следует, что Ρ положительно определена. Далее, подставляя (4.13) в левую
часть (4.12), получаем
/»оо
/*оо
РА+А
Т
Р= / exp(ATt)Q exp(At)A dt+ I AT
exp(ATt)Q exp(At) dt =
Jo
Jo
= / 4exp(ATt)Qexp(At) dt = exp(ATt)Qexp(At)\TM = -Q.
Jo dt
Это равенство показывает, что матрица Ρ действительно является решени
ем (4.12). Для доказательства его единственности предположим, что существует
другое решение Ρ φ Р. Тогда
(Р-Р)А+А
Т
(Р-Р)=0.
Умножая это равенство на exp(AT
t) и exp(At) соответственно слева и справа,
получаем
0 = exp(ATt)[{P - Ρ)А + А
Т
(Р - Р)] exp(At) =
=
ftS[exp(AT
t)(P-P)exp(At)Y
Следовательно,
exp(AT
t)(P - Ρ) ехр(Л^) = const Vt.
В частности, поскольку ехр(АО) = I, имеем
(Р-Р)=exp(AT
t)(P - Ρ)exp(At) ->0приt ->оо.
Таким образом, Ρ = Р.
Π
Требование положительной определенности матрицы Q может быть ослаб
лено. Читателю предлагается самостоятельно (упражнение 4.22) доказать, что Q
может быть выбрана в форме положительно полуопределенной матрицы вида
Q=С
Т
С, где пара (А, С) наблюдаемая.
Уравнение (4.12) представляет собой линейное алгебраическое уравнение,
которое может быть решено с использованием его представления Мх = у, где х
и у — векторы, составленные из элементов матриц Ρ и Q. Этот подход будет
использован в нижеследующем примере, но существуют и другие численные
методы решения этих уравнений
16
.
16
Численные методы решения линейных алгебраических уравнений рассмотрены в [67]. Урав
нение Ляпунова является частным случаем уравнения Сильвестра РА + ВР + С = Ои может
быть решено с использованием соответствующих методов, также описанных в работе [67]. Почти
все коммерческие программные средства исследования задач управления содержат процедуры для
решения уравнения Ляпунова.
144
ГЛАВА 4
Пример 4.13. Пусть
А--
0-1
1-1
,Q
1О
О1
,Ρ
Рп Рп
Рп Р22
где в силу симметричности pi2 = Р21· В этом случае уравнение Ляпунова (4.12)
может быть переписано в виде
0
1
0
2
-1
-2
0"
1
-2
_
Рп
Р12
.
Р22 .
=
"-1
0
_
-1
Рп
Р12
.
Р22 .
=
1.5 1
-0.5
1.0 J
Единственное решение этого уравнения определяется равенством
1.5
-0.5
-0.5 1.0
Матрица Ρ является положительно определенной, поскольку ведущие главные
миноры, равные 1.5 и 1.25, положительны. Следовательно, все собственные зна
чения А расположены в открытой левой полуплоскости комплексной плоскости.
Δ
Уравнение Ляпунова может быть использовано в качестве средства установ
ления гурвицевости матрицы А, что представляет собой альтернативу непосред
ственному вычислению собственных чисел А. С этой целью выберем положи
тельно определенную матрицу Q (например, Q = I) и решим уравнение Ляпу
нова (4.12) относительно Р. Тогда тот факт, что матрица А является гурвицевой,
эквивалентен тому, что полученное решение является положительно определен
ной матрицей. Однако с вычислительной точки зрения этот метод установления
гурвицевости матриц не имеет преимуществ перед стандартным методом вычис
ления собственных значений
17
. Кроме того, знание собственных значений позво
ляет непосредственно получить информацию о выходе линейной системы. Урав
нение Ляпунова интересно не тем, что оно может использоваться при установ-
лении устойчивости линейной системы
10
, а тем, что оно определяет процедуру
нахождения функции Ляпунова для любой линейной системы х = Ах, где А —
Типичная процедура решения уравнения Ляпунова, известная как алгоритм Бартелса-
Стьюарта (Bartels-Stewart) [67], предполагает в качестве первого шага преобразование А в ве
щественную форму Шура (Schur), в ходе которого вычисляются собственные значения этой мат
рицы. Таким образом, с вычислительной точки зрения процедура решения уравнения Ляпунова —
это более трудоемкая операция, нежели вычисление собственных значений А. Другие алгорит
мы решения уравнения Ляпунова имеют трудоемкость, сравнимую с трудоемкостью алгоритма
Бартелса-Стьюарта.
18
Тем не менее представляется интересным тот факт, что уравнение Ляпунова может использо
ваться для вывода классического критерия Рауса-Гурвица. (См. [35, стр. 417-419].)
4.3. ЛИНЕЙНЫЕ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ
145
гурвицева матрица. Только тот факт, что функция Ляпунова существует, позволя
ет нам сделать определенные заключения о поведении системы в случаях, когда
ее правая часть Ах содержит возмущения, причем природа возмущений не игра
ет большого значения — это могут быть линейные возмущения коэффициентов
матрицы А или какие-либо нелинейные возмущения другого рода. Это обсто
ятельство раскроет всю свою силу по мере того, как мы будем продвигаться
в изучении метода Ляпунова.
Вернемся к рассмотрению нелинейной системы
х = /(ж),
(4.14)
где/ :D—»R
n
—
непрерывно .дифференцируемое отображение области D с
Rn
вR
n
.
Предположим, что D содержит начало координат х — О, являющееся
точкой равновесия системы, т. е. /(0) = 0. По теореме о среднем значении
Λ(*) = Λ(0)+ ^(*)*,
где Zi — точка на отрезке, соединяющем х с началом координат. Это равенство
справедливо для любой точки х е D, такой что отрезок, соединяющий эту точку
с началом координат, целиком содержится в D. Поскольку /(0) = 0, мы можем
записать
/<(*) = ^(*)* = ^;(0)* +
дх
Тогда
где
*-&·>
дх
f(x) =Ax+g(x)
dfi
^
}-^
(0)
и gi(x) =
Функция gi(x) удовлетворяет неравенству
Из непрерывности [df /дх] следует, что
ах<
г
'»-Й<
0
»
dfi( , dfi
Ν
ΙΝΙ 0 при ||ж|| —> 0.
Из всего вышесказанного следует, что в малой окрестности начала координат мы
можем аппроксимировать нелинейную систему (4.14) ее линеаризацией в окрест
ности начала координат:
х=Ах, где
*-&•»·
146
ГЛАВА 4
В следующей теореме устанавливаются условия, при выполнении которых мы
можем сделать заключение об устойчивости начала координат, являющегося точ
кой равновесия нелинейной системы, на основании результатов анализа свойств
устойчивости точки равновесия ее линеаризации. Эта теорема представляет со
бой методологическую основу первого метода Ляпунова.
Теорема 4.7. Пусть х = 0 является точкой равновесия нелинейной систе
мы
х = /(ж),
гдеf:D—>R
n
—
непрерывно дифференцируемая функция и D — окрестность
нуля. Пусть
А
=
д
М•
UX
\х=0
Тогда
1. Начало координат асимптотически устойчиво, если Re λ^ < 0 для всех
собственных значений матрицы А.
2. Начало координат неустойчиво, если ReA^ > 0 по крайней мере для
одного собственного значения матрицы А.
ДОКАЗАТЕЛЬСТВО. Для доказательства первого утверждения предположим,
что А — гурвицева матрица. Тогда из теоремы 4.6 следует, что для любой поло
жительно определенной симметричной матрицы Q решение Ρ уравнения Ляпу
нова (4.12) является положительно определенной матрицей. Рассмотрим V(х) =
=х
Т
Рх в качестве функции Ляпунова для нелинейной системы. Тогда произ
водная V(x) вдоль траекторий системы определяется равенством
V(x) =х
т
Рх+f
T
{x)Px =
=х
т
Р[Ах + д(х)] + [х
т
Ат
+д
т
(х)]Рх =
=х
т
(РА+А
т
Р)х+2х
т
Рд(х) =
=-x
T
Qx+2x
T
Pg(x).
Первый член в правой части этого равенства отрицательный, а второй — в общем
случае неопределеннозначный. Функция д(х) удовлетворяет
М*^0приМ2^0.
\\Щ2
Поэтому для любой 7 > 0 существует константа г > 0, такая что
||р(х)||2 <7lWh, V ||ж||2<г.
Следовательно,
V(x) < -x
T
Qx + 27||Ρ||2|ΜΙ!, V ||х||2 < г.
4.3. ЛИНЕЙНЫЕ СИСТЕМЫ И ЛИНЕАРИЗАЦИЯ
147
Заметим, что
x
T
Qx>\min(Q)\\x\\l
где Amin() — минимальное собственное число матрицы. Поскольку Q положи
тельно определена и симметрична, Amin(Q) вещественно и положительно. Тогда
V{x) < -[Amin(Q) - 27ЦРЦ2] Nil, V ||х||2 < г.
Выбор 7 < (l/2)Amin(Q)/||P||2 обеспечивает то, что V(x) отрицательно опреде
лена. Следовательно, по теореме 4.1 начало координат асимптотически устойчи
во. Для доказательства второго утверждения теоремы рассмотрим сначала част
ный случай, когда матрица А не имеет собственных чисел на мнимой оси. Если
собственные значения А разделены на две группы, находящиеся по разные сто
роны от мнимой оси, то существует невырожденная матрица Т, такая что
19
ТАТ'
1
=
где А\ и А2 — гурвицевы матрицы. Положим
z=Tx=
ΑλΟ
ОА2
Z2
где размерности двух векторных компонентов вектора z соответствуют размер
ностям матриц А\ и А2. При замене координат z = Тх система
х=Ах+д(х)
преобразуется к виду
ii=
- Aizi+gi(z),
z2=
A2z2+g2{z),
где функции д%{х) характеризуются тем, что для любой η > 0 существует г > О,
такая что
HftOO||2<7lNl2,
V
1No<г, г = 1,2.
Начало координат z = 0 является точкой равновесия для системы в z-коорди-
натах. Очевидно, что любое заключение о свойствах устойчивости z = 0 авто
матически переносится на свойства устойчивости точки равновесия х = 0 си
стемы в х-координатах, поскольку матрица Τ невырожденна
20
. Для того чтобы
показать, что начало координат неустойчиво, применим теорему 4.3. Построение
19
Для нахождения матрицы Τ существует несколько методов и одним из них является преобра
зование матрицы А в вещественную жорданову форму [67].
20
Обсуждение вопроса об отображениях, сохраняющих свойства устойчивости, предлагается
выполнить в качестве упражнения 4.26.
148
ГЛАВА 4
функции V{z) выполняется аналогично тому, как это было выполнено в приме
ре 4.7, но с учетом того, что рассматривается векторный случай. Пусть Qi и Q<i —
положительно определенные и симметричные матрицы, размерности которых со
ответствуют размерностям матриц А\ и А2. Поскольку А\ и А2 — гурвицевы
матрицы, из теоремы 4.6 следует, что уравнения Ляпунова
имеют единственные положительно определенные решения Pi и Р2· Пусть
V(z) = zfPlZl - z%P2Z2 = z
TPi
0
0
-P2 z.
В подпространстве z<i — 0 неравенство V (z) > 0 выполнено в точках, произволь
но близких к началу координат. Положим
U={zeR
n
\ \\z\\2<гиV(z) >0}.
Для z G U справедлива оценка
V(z) = -zl{PlAl + Ai>i)*i + 2zfPl9l(z)
-
-z%(P2A2 + j4jP2)*2 " 2^Р2й(^) =
-
*iQl*l+*2$2*2+2Z ^_^й(г) J
^ A^nCQi)^!!!! 4- Amin(02)||^2||2 -
-2|kll2^/||Pi|lill^iWlli + ||P2|lilb2(^
>(a-2V2/37)||2;||i,
>
112 >
где
a = min{Amin((5i),Amin(Q2)} и β = max{||Pi||2, ||P2||2}·
Тогда при 7 < α/(2\/2β) выполнено V(z) > 0 для г € 17 и по теореме 4.3 на
чало координат неустойчиво. Заметим, что мы могли бы применить теорему 4.3
и к системе, представленной в первоначальных координатах. Для этого опреде
лим матрицы
Р=Т
удовлетворяющие уравнению
Pi
0
0
-Pi
Τ; Q=T
2Qi
0
0
Q2J
PA +A
T
P=Q.
Матица Q положительно определена и V(x) = x
T
Px положительна в точках,
произвольно близких к началу координат х = 0. Рассмотрим теперь общий слу
чай, когда матица А может иметь собственные числа не только в открытых левой
4.3 . ЛИНЕЙНЫЕ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ
149
и правой полуплоскостях комплексной плоскости, но и на мнимой оси. Этот
случай можно свести к рассмотренному выше частному случаю путем смеще
ния мнимой оси. Предположим, что А имеет т собственных чисел, таких что
ReXi > δ > 0. Тогда матрица [А — (δ/2)1] имеет т собственных чисел в от
крытой правой полуплоскости и не имеет собственных чисел на мнимой оси.
Используя полученные выше результаты для этого случая, можно заключить, что
существуют матрицы Ρ = Р
Т
иQ=Q
T
> 0, такие что
А
-Ь+
Л
-Р
P=Q,
иV(x)=х
т
Рх — положительно определенная функция в точках произвольно
близких к началу координат. Производная V(x) вдоль траекторий системы опре
деляется равенством
V(x) =х
т
(РА +А
т
Р)х+2х
т
Рд(х) =
τ
= X P\A-ilUU-\l х + 6х
т
Рх +2х
т
Рд(х) =
x
T
Qx +6V(x)+2х
т
Рд(х).
В множестве
{х€Rn |||ж||2<ги V(x) >0},
где константа г выбрана так, что ||<7(а;)||2 ^ 7IMI2 при ||а;||2 < г, производ
ная V(x) удовлетворяет оценке
V(x) > Αη Ш\х\\1 ~ 2||P||2||x||2||ff(x)||2 ^ (Amin(Q) - 27||Ρ||2)ΝΙ|.
Заметим, что при η < (l/2)Amin(Q)/||P||2 правая часть этого неравенства поло
жительна. Применение теоремы 4.3 завершает доказательство.
Π
Теорема 4.7 предлагает простую процедуру для определения свойств устой
чивости точки равновесия в начале координат, которая сводится к вычислению
матрицы Якоби
дх
\х=0
и анализу ее собственных значений. Если Re λ^ < 0 для всех г или Re \i > 0 для
некоторого г, то начало координат асимптотически устойчиво или неустойчиво
соответственно. Более того, из доказательства теоремы видно, что если Re А^ < 0
для всех г, то мы всегда можем найти для системы функцию Ляпунова, опреде
ленную локально в некоторой окрестности начала координат. Эта функция Ля
пунова имеет вид квадратичной формы V(x) = х
Т
Рх, где Ρ — решение уравне
ния Ляпунова (4.12) для некоторой положительно определенной симметричной
матрицы Q. Заметим, что теорема 4.7 не позволяет установить свойства устой
чивости в случае ReA^ ^ 0 для всех г с ReA^ = 0 при некотором г. В этом
150
ГЛАВА 4
случае метод линеаризации не может быть использован для определения свойств
устойчивости точки равновесия
21
.
Пример 4.14. Рассмотрим скалярную систему
х=ах
3
.
Линеаризуя систему в окрестности начала координат х = 0, получаем
0/
дх
Ъах
А
х=0
Таким образом, существует одно собственное значение, которое лежит на мни
мой оси и, следовательно, с использованием линеаризации установить свойства
устойчивости начала координат невозможно. Этого следовало ожидать, посколь
ку для рассматриваемой системы свойства устойчивости начала координат — его
асимптотическая устойчивость, устойчивость или неустойчивость — зависят от
значения параметра а. Если а < 0, начало координат асимптотически устойчиво
и это может быть установлено с использованием функции Ляпунова V(x) = х
4
,
производная которой удовлетворяет V(x) = 4ах
6
<0прихφ0.Еслиа=0,
система линейна и начало координат устойчиво по теореме 4.5. Если а > 0,
начало координат неустойчиво по теореме 4.3 и это может быть установлено
с использованием функции Ляпунова V(x)
творяет V(x) = 4ах
6
>0прихφ0.
Пример 4.15. Уравнение маятника
производная которой удовле-
Δ
Х\=Х2,
±2 = —αSillIE1—6X2
имеет две точки равновесия (xi = 0,Х2 = 0) и (xi = π, Х2 = 0). Попытаем
ся исследовать свойства устойчивости этих точек равновесия с использованием
метода линеаризации. Матрица Якоби
0
1
-a
cos xi —Ь
df
дх
dh
дх\
dh
дх\
dh
дХ2
dh
дХ2
вычисленная в начале координат х = 0, имеет вид
А=
д
-1дх ж=0
01
-Ь
21
См. параграф 8.1, в котором исследуется критический случай, когда линеаризация не позволяет
сделать определенное заключение об устойчивости системы.
4.4. ФУНКЦИИ СРАВНЕНИЯ
151
Собственные значения матрицы А:
А1)2 =
- ±Ь±^6
2
-4а.
Для всех а, Ъ > О собственные значения удовлетворяют Re λ^ < 0 и, следова
тельно, точка равновесия в начале координат асимптотически устойчива. При
отсутствии трения (Ь = 0) оба собственных значения расположены на мнимой
оси. Таким образом, мы не можем определить свойства устойчивости начала ко
ординат с использованием метода линеаризации. В примере 4.3 мы видели, что
в этом случае начало координат является устойчивой точкой равновесия и это
может быть установлено с использованием функции Ляпунова в виде функции
энергии. Для того чтобы определить свойства устойчивости точки равновесия
(х\ = 7г,Х2 = 0), вычислим якобиан в этой точке. Это эквивалентно замене
координат z\ = х\ — π, z<i = #2, которая представляет собой сдвиг точки равно
весия в начало координат, и последующему вычислению якобиана [df/dz] в точ
кеz=0:
"01
А=д_1
дх
\Χ\=Ε,Χ2=§
Собственные значения матрицы А:
а—Ъ
A1)2 = -ife±iv/b
2
+ 4a.
Для всех а > 0 и b ^ 0 имеем одно собственное значение, расположенное
в открытой правой полуплоскости, и, следовательно, точка равновесия (х\ = π,
Х2 = 0) неустойчива.
Δ
4.4. Функции сравнения
До сих пор мы рассматривали автономные системы. При переходе к изуче
нию неавтономным систем возникают дополнительные трудности, и одна из них
заключается в том, что решение неавтономной системы х = f(t,x),
начинаю
щееся в x(to) = хо, зависит одновременно от t и to- Для того чтобы иметь воз
можность проводить анализ подобных систем, необходимо ввести новые опреде
ления устойчивости и асимптотической устойчивости, которые выполнялись бы
равномерно по начальному моменту времени. Разумеется, мы можем переформу
лировать определение 4.1 так, чтобы учесть эту равномерность по to, но оказыва
ется, что существуют более удобные определения, которые делаются в терминах
специальных функций сравнения, известных как функции класса /С и класса 1С С.
Определение 4.2. Непрерывная функция а : [0, а) —• [0, оо) принадлежит
классу /С, если она является строго возрастающей и а(0) = 0. Эта функция
принадлежит классу /CQO, если а = оо и а(г) -^ оо при г —^ оо.
Определение 4.3. Непрерывная функция β : [0, a) x [0, оо) —> [0, оо) при
надлежит классу КС, если для каждого фиксированного s отображение /?(r, s)
152
ГЛАВА 4
принадлежит классу К по г и для каэюдого фиксированного г отобраэюение
/?(r, s) является убывающим по s и /3(r, s) —• 0 при s —> оо.
Пример 4.16.
• a(r) = arctg(r) — строго возрастающая функция, поскольку а'{г) = 1/(1 +
+г
2
) > 0. Она принадлежит классу /С, но не принадлежит классу КС, т.к.
linv-юо а(г) = π/2 < оо.
•а(г)=г
с
—
строго возрастающая функция для любого положительно
го вещественного числа с, поскольку а
1
{г)=сг
с
~
1
> 0. Более того,
limr_,oo a(r) = оо, и, следовательно, эта функция принадлежит классу /Соо.
• a(r)
=
min{r,r
2
} — непрерывная строго возрастающая функция, и
Ηπν_>οο а(г) = оо. Следовательно, эта функция принадлежит классу /Соо. За
метим, что а(г) не является непрерывно дифференцируемой в г = 1. Непре
рывная дифференцируемость функции не является необходимым условием
ее принадлежности к классу /С.
• /3(r, s) = r/(ksr 4-1) — для любого положительного вещественного числа к
строго возрастающая по г функция, поскольку
д
Л=1
>0
дг (ksr + I)2
и строго убывающая по s, поскольку
Οβ-кг
2
ds (ksr + l)2 <0.
Более того, /?(r, s) —> 0 при s—• оо, и, следовательно, эта функция принад
лежит классу КС.
• /?(г,5)= r
c
e~
s
—
для любого положительного вещественного числа с функ
ция принадлежит классу КС.
Δ
В следующей лемме формулируются некоторые важные свойства функций
классов К и КС. Доказательство этой леммы предлагается выполнить читателю
в качестве упражнения (упражнение 4.34).
Лемма 4.2. Пусть а\ и а.2
—
К-фунщии на [0, а), а^и а.\
—
Коо-функции,
и β — КС-функция. Обозначим через а~
1
обратную функцию функции щ. Тогда
•а±
1
определена на [0,ai(a)) и принадлежит классу К.
•а^
1
определена на [0, оо) и принадлежит классу /Соо.
•
а\ о а2 принадлежит классу К.
4.4. ФУНКЦИИ СРАВНЕНИЯ
153
• аз о а\ принадлежит классу /Соо-
• a(r, s) = ai(/?(a2(r),s)) принадлежит классу КС.
Следующие две леммы вскрывают связь между К- и /СХ-функциями и ана
лизом систем с использованием методов Ляпунова.
Лемма 4.3. Пусть V : D —> R — непрерывная положительно определен
ная функция, определенная в области D С Rn
,
содержащей начало координат.
Пусть Вг С D для некоторого г. Тогда существуют К-функции а\ и с*2, опре
деленные на [0, г], такие что
ax{\\x\\)^V(x)<a2{\\x\\)
длявсеххGВг. ЕслиD=R
n
и V(x) радиально не ограничена, то существуют
функции ai и а<1 класса К^, такие что предыдущие неравенства выполнены при
всеххGRn
.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.4.
Π
В случае использования квадратичной положительно определенной функции
V(x)=x
T
Px утверждение леммы следует из неравенств
Атт(Р)1МЦ ^ х
Т
Рх < Атах(Р)||х|||.
Лемма 4.4. Рассмотрим скалярное автономное дифференциальное уравне
ние
У = -<*(у), y(t0) = j/o,
где α — локально липшицева К-функция, определенная на [О, а). Для всех О <
^ Уо ^ а> это уравнение имеет единственное решение y(t), определенное для
всех t ^ £о· Более того,
y(t) =
a(y0,t-to),
где σ — КС-функция, определенная на [0, а) х [0, оо).
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.5.
Π
Проиллюстрируем утверждение этой леммы на примерах, в которых реше
ние скалярного уравнения может быть найдено в явном виде. В качестве первого
такого примера рассмотрим у = —fcy,к > 0. Решение этого уравнения имеет
вид
y(t) = yoexp[-k(t - to)} =Ф σ(τ,β) =
rexp(-ks).
Решение уравнения у = —ку
2
, к > 0 имеет следующий вид:
V{t)
= -kyj-t0) +l *σΜ
= Ш+1'
Использование функций классов К и КС при анализе систем с использова
нием метода Ляпунова может быть продемонстрировано на примере их примене
ния для доказательства теоремы 4.1. В ходе этого доказательства мы выбирали β
154
ГЛАВА 4
и δ такими, чтобы В§ С Ω^ С Вг. С учетом того что положительно определенная
функция V(x) удовлетворяет
а1(\\х\\)^У(х)^а2(\\х\\),
мыможемвыбратьβ ^ ai(r) иδ^ а^"
1
(у9). Это действительно можно сделать,
поскольку
V(x)^P
=> ai(||a:||)<ai(r) ^ ||х|| < г
и
||х||<сδ => V{x) <a2(i)^/3.
Далее, следуя доказательству, мы должны показать, что если V(x) отрица
тельно определена, то решение x(t) стремится к нулю при £, стремящемся
к бесконечности. Из леммы 4.3 следует, что существует /С-функция аз, такая
что V(x) ^ — аз(||ж||). Следовательно, V(x) удовлетворяет дифференциальному
неравенству
V^
- a3(a^(V)).
Из леммы сравнения (лемма 3.4) следует, что V{x(t)) ограничена решением ска
лярного дифференциального уравнения
у= -азК
1
Ы), y(0) = V(x(0)).
По лемме 4.2 функция а% о а^
1
принадлежит классу /С. Кроме того, из лем
мы 4.3 следует, что решение этого скалярного уравнения имеет вид y(t) =
—
/?(y(0),t), где β — /С£-функция. Поскольку V(x(t)) удовлетворяет неравен
ству V(x(t)) ^ P(V(x(0)),i), можно заключить, что V(x(t)) стремится к нулю
при £—• оо. В действительности мы можем выйти за рамки теоремы 4.1 и по
лучить более сильный результат — оценку нормы решения ||х||. Из неравенства
V(x(t)) < V(x(0)) следует, что
«i(ll*(t)ID < V(x(t)) < V(x{0)) < a2(||x(0)||).
Тогда \\x{t)\\ < aj"
1
(a2(||x(0)||)), где aj"
1
о a2 — функция класса /С. Аналогично
из неравенства V(x(i)) ^ /3(У(х(0)),£) следует, что
"i(N*)ID < V(x(t)) < β(ν(Χ(0))^) ^ /3(а2(||х(0)||),<).
Таким образом, \\x(t)\\ ^ a^
1
(/3(a2(||x(0)||),i)), где α^
1
(β(α2(ν)^))
—
функция
класса 1СС.
4.5. Неавтономные системы
Рассмотрим неавтономную систему
* = /(*,*),
(4.15)
4.5. НЕАВТОНОМНЫЕ СИСТЕМЫ
155
где/ :[0,оо)хD—>R
n
—
кусочно-непрерывная по t и локально липшицевая
похна[0,оо)хDфункция,DСRn
—
открытая область, содержащая начало
координат х = 0. Начало координат является точкой равновесия системы (4.15)
вмоментt=0,если
/(*,0)=0, Vt^O.
Точка равновесия в начале координат может являться результатом переноса нену
левой точки равновесия или, в более общем случае, результатом переноса нену
левого решения системы. Для того чтобы убедиться в справедливости этого
утверждения, предположим, что у(т) — определенное при всех τ ^ а решение
системы
Тогда замена координат
х=у-у{т)\ t= r-a
приводит систему к виду
*=#(г
>У)~И
т
)=g(t+a,x+y(t+а))-y(t+α)=/(t,x).
Поскольку
y(t+о)=g(t+α,y(t+α)), Vt^0,
начало координат ж = 0 является точкой равновесия преобразованной системы
при t = 0. Таким образом, исследовав свойства устойчивости начала координат,
являющегося точкой равновесия преобразованной системы, мы определим свой
ства устойчивости решения у (г) исходной системы. Заметим, что, если у (г) не
является константой, преобразованная система будет неавтономной даже в слу
чае, когда первоначальная система была автономной, т.е. когда д(т,у) = д(у)·
Это обстоятельство служит объяснением того факта, что исследование устойчи
вости в смысле Ляпунова может быть проведено лишь в контексте исследования
устойчивости точек равновесия неавтономных систем.
Понятия устойчивости и асимптотической устойчивости для точек равнове
сия неавтономных систем аналогичны тем, что были введены в определении 4.1
для автономных систем. Единственное отличие заключается в том, что решение
автономной системы зависит только от (t — to), а решение неавтономной системы
может зависеть как от t, так и от to- Поэтому свойства устойчивости точки рав
новесия будут в общем случае зависеть от to. Начало координат х = 0 является
устойчивой точкой равновесия системы (4.15), если для любой константы ε > 0
и любого момента to ^ 0 существует константа δ = δ(ε, to) > 0, такая что
||*(*о)||<* =» ΙΙ*(*)ΙΙ<ε, vt.
Константа δ в общем случае может зависеть от начального момента времени Со
существование этой константы для каждого to не обязательно служит гарантией
того, что существует единая константа δ, зависящая лишь от ε, которая может
быть использована при всех возможных to. Это обстоятельство может быть про
иллюстрировано следующим примером.
156
ГЛАВА 4
Пример 4.17. Линейная система первого порядка
х = (6tsint—2t)x
имеет решение
rt
x(t) = x(to) exp 1/(6-r sin r — 2r) dr
= x(to)exp[6sint—6tcost—t
—
6sinto+6£ocosto+ ^ol·
Для любого to член — t
2
с течением времени становится доминирующим и, сле
довательно, экспоненциальный член ограничен для всех t ^ to некоторой кон
стантой c(to), которая зависит от to:
|ж(*)| < |ж(*о)|с(*о),
Vt^t0.
Таким образом, для доказательства устойчивости начала координат можно для
любой ε > 0 использовать в качестве δ величину δ = e/c(to). С другой сторо
ны, предположим, что to принимает последовательные значения to = 2ηπ, η =
= 1,2,
Тогда в каждом из этих последовательных случаев x(t) вычисляется
на π секунд позднее по отношению к предыдущему случаю. Таким образом,
x(to + π) = x(t0) exp[(4n + 1)(6 - π)π],
и, следовательно, для x(to) ^0 выполнено
xfo+π)
x(t0)
oo при η—> oo.
Легко видеть, что при заданной ε > О невозможно определить константу δ, ко
торая не зависела бы от to и удовлетворяла бы равномерно по to требованию,
накладываемому определением устойчивости.
Δ
Неоднородность по to может возникать также и при исследовании асимпто
тической устойчивости начала координат. Этот случай рассмотрен в следующем
примере.
Пример 4.18. Линейная система первого порядка
х=—
1+«
имеет решение
x(t) — х (to) exp Г_^1
Jtol +τ
dr = x(to)1+to
1+*"
4.5. НЕАВТОНОМНЫЕ СИСТЕМЫ
157
Поскольку \x(t)\ ^ |х(*о)|> Vi ^ to, начало координат устойчиво. В действитель
ности для любой заданной ε > 0 можно найти константу 5, которая не зависит
от to. Кроме того, легко показать, что
x(t) —> 0 при t—• оо.
Следовательно, в соответствии с определением 4.1 начало координат асимпто
тически устойчиво. Заметим, однако, что стремление x(t) к началу координат
неравномерно относительно начального момента времени to. Напомним, что
стремление x(t) к началу координат эквивалентно тому, что для любой ε > О
существует константа Τ = Τ(ε, to) > 0, такая что \x(t)\ < ε для всех t ^ to + Τ;
несмотря на то что это утверждение справедливо для всех to, константа Τ не
может быть выбрана так, чтобы она не зависела от to-
Δ
С учетом всего вышесказанного нам следует модифицировать определе
ние 4.1 так, чтобы принять во внимание зависимость свойств устойчивости нача
ла координат от начального момента времени to. Мы заинтересованы в том, что
бы эта модификация позволила бы определить свойства устойчивости и асимп
тотической устойчивости начала координат как равномерные по начальному вре
мени свойства
22
.
Определение 4.4. Точка равновесия х = 0 системы (4.15) является
• устойчивой, если для каждой константы ε > 0 существует δ (ε, to) > О,
такая что
\\x{t0)\\ < δ => ||x(t)|| < ε, Vt^t0>
0;
(4.16)
• равномерно устойчивой, если для каждой константы ε > 0 существует
δ = δ (ε) > 0, независимая от to, такая что выполнено (4.16);
• неустойчивой, если она не является устойчивой;
• асимптотически устойчивой, если она устойчива и существует положи
тельная константа с — c(to), такая что x(t) —> 0 при t —• оо для всех
\\x(to)\\<c;
• равномерно асимптотически устойчивой, если она является равномерно
устойчивой и существует положительная константа с, независимая от to,
такая что для всех \\x(to)\\ < с, x(t) —» 0 при t—> оо равномерно по to, т. е.
для каждой η > 0 существует Τ = Τ(η) > 0, такая что
\\x(t)\\ <η, \/t^t0
+ Τ(η), V ||я(*о)|| < с;
(4.17)
22
См. работы [72] и [95], в которых даны другие модификации определения 4.1. Следует от
метить, что в случае автономных систем приведенное здесь определение глобальной однородной
асимптотической устойчивости эквивалентно определению глобальной асимптотической устойчи
вости, представленному в параграфе 4.1. В частности, δ (ε) всегда может быть выбрана так, что
lime_>oo δ(ε) = оо. Справедливость этого утверждения доказывается в теореме 4.17. В лемме С.2
показано, что для автономных систем в случае глобальной асимптотической устойчивости начала
координат решение x(t) этой системы удовлетворяет ||z(i)|| < /?(||ж(£о)||,0) для всех x(to), где
/3(т,0) — /Соо-функция. Функция δ(ε) может быть выбрана в виде δ(ε) = /3
_1
(ε, 0).
158
ГЛАВА 4
• глобально равномерно асимптотически устойчивой, если она является рав
номерно устойчивой, δ (ε) может быть выбрана так, чтобы было выпол
нено \\ναε-^00δ{ε) = оо и для каждой пары положительных чисел η и с
существует Τ = Τ (η, с) > 0, такое что
\\x(t)\\ <q, У«^*о + Т(ч,с), V||x(t0)|| < с.
(4.18)
В следующей лемме даются эквивалентные и более понятные определения
понятий равномерной устойчивости и равномерной асимптотической устойчиво
сти в терминах /С- и /С£-функций.
Лемма 4.5. Точка равновесия х = 0 системы (4.15) является
• равномерно устойчивой, если и только если существует функция а класса /С
и положительная константа с, независимая от to, такая что
\\x(t0)\\ < α(||*(*ο)||), V^ t0 > О, V \\x(t0)\\ < с;
(4.19)
• равномерно асимптотически устойчивой, если и только если существует
функция β класса JCC и положительная константа с, независимая от to,
такая что
\\x(to)\\ < /?(||ж(*о)||,* -*о), Vt^t0>
0, V||x(t0)|| < с;
(4.20)
• глобально равномерно асимптотически устойчивой, если и только если
неравенство (4.20) выполнено для всех начальных состояний x(to).
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.6.
Π
Из этой леммы следует, что в случае автономных систем из устойчивости
и асимптотической устойчивости, введенных в соответствии с определением 4.1,
следует существование /С- и /С£-функций, удовлетворяющих неравенствам (4.19)
и (4.20). Справедливость этого факта обусловлена тем, что в случае автономных
систем свойства устойчивости и асимптотической устойчивости начала коорди
нат выполняются равномерно по начальному моменту времени to.
Специальный случай равномерной асимптотической устойчивости, когда
/С£-функция β в (4.20) имеет специальный вид β(τ,8) = kre~
Xs
,
имеет важ
ное значение и будет рассматриваться ниже как особое свойство устойчивости
точек равновесия.
Определение 4.5. Точка равновесия х = 0 системы (4.15) называется экс
поненциально устойчивой, если существуют положительные константы с, к
и \, такие что
\\x(t)\\ < *Ц*(*о)||е-
А(
«-Ч V ||«(*ο)|| < с,
(4.21)
4.5 . НЕАВТОНОМНЫЕ СИСТЕМЫ
159
и глобально экспоненциально устойчивой, если неравенство (4.21) выполнено для
любого начального состояния x(to).
Теория Ляпунова для автономных систем может быть обобщена на случай
неавтономных систем. Для каждой из теорем 4.1-4.4 можно предложить соот
ветствующие обобщения. Мы не будем приводить здесь формулировки этих ре
зультатов
23
.
Вместо этого мы сосредоточим внимание на исследовании свойств
равномерной устойчивости и равномерной асимптотической устойчивости, по
скольку эти свойства наиболее часто анализируются с использованием обобще
ний метода Ляпунова на случай неавтономных систем.
Теорема 4.8. Пусть х = 0 является точкой равновесия системы (4.15)
иDСRn
—
открытая область, содержащая начало координат х = 0. Пусть
V : [0, оо) х D —• R — непрерывно дифференцируемая функция, такая что
Wi(x)^V(t,x)^W2(x),
(4.22)
§ + f/(t,*)<0,
(4.23)
Vt ^ 0 uVx Ε D, где W\{x) и W2(x) — непрерывные положительно определен-
ные функции на D. Тогда х = 0 — равномерно устойчивая точка равновесия.
ДОКАЗАТЕЛЬСТВО. Производная V вдоль траекторий (4.15) определяется ра
венством
Выберемг>0ис>0так,чтобыВг с Dис<ттцж||=гW\(x). Тогда
{х Ε Вг | W\(x) < с} — внутренность Вг. Определим зависящее от времени
множество Г^)С:
ntyC = {xeBr \V(t,x) ^с}.
Множество Qt,c содержит {х Ε Вг | И^(ж) ^ с}, поскольку
W2(a;) ^c =» V(t,x) ^ с.
С другой стороны, Ω^0 является подмножеством {х Ε ВТ \ W\{x) ^ с}, посколь
ку
V(t,x) ^с =* Wx(x) <с.
Таким образом,
{хΕВг|W2(«)^ с}СQtjCС{жΕ£г|Wi(x)<с}СБгСD
для всех t ^ 0. Эти пять содержащихся друг в друге множеств изображены на
рисунке 4.7, аналогичном рисунку 4.1, но в рассматриваемом здесь случае по
верхность V(t,x) = с зависит от времени и ограничена зависящими от времени
поверхностями W\{x) = с и И^(ж) = с.
23
Литература по теории Ляпунова для неавтономных систем достаточно обширна. Всеобъемлю
щими работами в этой области являются [72] и [154], в качестве введения в эту тематику можно
порекомендовать [201] и [135].
160
ГЛАВА 4
4»Μ
Рис. 4.7. Геометрическое представление множеств, используемых при доказательстве
теоремы 4.8
Поскольку V(t,x) ^ 0 на D для всех to > 0 и любых хо £ £ЧС, решение,
начинающееся в (£о>#о)> остается в CttyC при всех t ^ to. Поэтому любое ре
шение, начинающееся в {х е Br \ И^(ж) ^ с}, остается fttyc и, следовательно,
в {х е Вг | Wi(x) < с} при всех £ ^ £о· Таким образом, решение ограничено
и определено при всех t ^ to· Более того, поскольку Т^ ^ 0,
У(*,ж(*)) < У(*о,*(*о)), Vi ^ to-
Из леммы 4.3 следует, что существует /С-функции а\ и с*2, определенные на
[0, г], такие что
ai(|N) < W^x) < V(t,x) < ТВД < a2(||x||).
Из последних двух неравенств следует, что
||х(*)|| < a^(V(t,x(t))) < αΓ
1
^*).*^)))) < огГ
1
(«2(||я:(*о)Ц))-
Поскольку по лемме 4.2 функция а^
1
оа2 принадлежит классу /С, из неравенства
||ж(£)|| ^ ajf1(a2(||a;(io)||)) следует равномерная устойчивость начала координат.
Π
Теорема 4.9. Предположим, что условия теоремы 4.8 выполнены с усилен
ным неравенством (4.23)
f + f/('.*)<-w»(*)
(4.24)
для всех t ^ 0 и любых х Ε D, где W%(x) — непрерывная положительно опре
деленная функция на D. Тогда х = 0 равномерно асимптотически устойчивая
4.5 . НЕАВТОНОМНЫЕ СИСТЕМЫ
161
точка равновесия. Более того, если константы г и с выбраны таким образом,
что ВТ = {\\х\\ ^ г} С D и с < пип||ж||=г W\(x), то каждая траектория,
начинающаяся β {х £ Br \ W2(x) ^ с}, удовлетворяет
\\x(t)\\^p(\\x(t0)lt-t0),
Vt^to^O,
где β — некоторая КС-функция. Наконец, если D = R
n
и W\{x) радиально
неограниченна, то х = 0 — глобально равномерно асимптотически устойчивая
точка равновесия.
ДОКАЗАТЕЛЬСТВО. При доказательстве теоремы 4.8 было показано, что тра
ектории, начинающиеся в {xeBr \ W2{x)^c}, остаются в {xeBr \ Wi(x)^c}
при всех t ^ £о· Из леммы 4.3 следует, что существует /С-функция аз, опреде
ленная на [0, г], такая что
V(t,x) = Щ- + %f{t,x) ^ -W3(x) < -«3(11*11).
Из неравенства
V < ^(ЦхЦ) & ciiHV) < ||х|| # a3(oq
x
(V)) < o3(||x||)
видно, что V удовлетворяет дифференциальному неравенству
V < -az{a^{V)) ^
-a(V),
где а = одоа^
1
—
/С-функция, определенная на [0, г]. (См. лемму 4.2.) Предполо
жим, не умаляя общности,
24
что а — локально липшицевая функция. Пусть y(t)
удовлетворяет автономному дифференциальному уравнению первого порядка
у = -а(у), y(to) = V(t0,x(t0)) > 0.
Из леммы сравнения 3.4 следует, что
V(t,x)^y(t),
Vt^t0.
По лемме 4.3, существует /СС-функция a(r, s), определенная на [0, г] х [0,оо),
такая что
V(t,x(t)) ^ a(V(t0,x{to)),t-t0),
\fV(t0yx(t0)) e [0,с].
24
Если а не является локально липшицевой, мы можем выбрать локально липшицевую функ
цию β класса /С, такую что α (г) ^ β (г) в рассматриваемой области. Тогда У < -/?(У) и мы
можем продолжить доказательство, используя вместо а функцию β. Например, предположим, что
a(r) = у/г. Функция у/г принадлежит классу /С, но не является локально липшицевой в г = 0.
Определим β(τ) = г при г < 1 и β(τ) = у/г при г ^ 1. Функция β принадлежит классу /С
и локально липшицева. Более того, а(г) ^ β(τ) при всех г > 0.
162
ГЛАВА 4
Тогда любое решение, начинающееся в {х Ε Br \ W2(x) ^ с}, удовлетворяет
неравенству
\\x(t)\\^a^(V(t,x(t)))^a^(a(V(t0,x(to)),t-to))
<
^ a^(a(a2(\\x(t0)\\),t
-
t0)) ^ No(to)||,* ~*o).
Из леммы 4.2 следует, что β принадлежит классу КС. Тогда неравенство (4.20)
выполнено и, следовательно, х = 0 — равномерно асимптотически устойчивая
точка равновесия. Если D = R
n
, функции ai, а2 и аз определены на [0, оо).
Тогда а и, следовательно, β не зависят от с, поскольку W\ (x) радиально неогра
ниченна, константа с может быть выбрана произвольно большой так, чтобы лю
бое начальное состояние принадлежало множеству {W2(x) ^ с}. Таким образом,
неравенство (4.20) выполнено для всех начальных состояний, и, следовательно,
начало координат является глобально равномерно асимптотически устойчивой
точкой равновесия.
Π
Функция V(t,x)
называется положительно полуопределенной, если
V(t,x) ^ 0. Она называется положительно определенной, если V(t,x) ^ W\(x),
где Wi(x) — некоторая положительно определенная функция,радиально неогра
ниченной, если Wi(x) обладает этим же свойством, к убывающей, если V(t,x) ^
W2(x). Функция V(t,x) называется отрицательно определенной (полуопределен
ной), если — V(t,x) — положительно определенная (полуопределенная) функция.
Таким образом, в теоремах 4.8 и 4.9 утверждается, что начало координат рав
номерно устойчиво, если существует непрерывно дифференцируемая, положи
тельно определенная, убывающая функция V(t,x), производная которой вдоль
траекторий системы отрицательно определена. Кроме того, начало коорди
нат равномерно асимптотически устойчиво, если эта производная отрицатель
но определена, и глобально равномерно асимптотически устойчиво, если функ
ция V(t, x) радиально неограниченна и условия равномерной асимптотической
устойчивости выполнены для нее глобально.
Теорема 4.10. Пусть х = 0 является точкой равновесия системы (4.15)
иDСRn
—
открытая область, содержащая начало координат х = 0. Пусть
V : [0, оо) хВ->й- непрерывно дифференцируемая функция, такая что
k1\\x\\
a
^V{t,x)^k2\\x\\
a
,
(4.25)
^
+ %No,х)^Ы\х\\\
(4.26)
Vi ^ 0 и\/х 6 D, где &i, k2l k% и а — положительные константы. Тогда х =
= 0 — экспоненциально устойчивая точка равновесия. Если эти предположения
выполнены глобально, то х = 0 — глобально экспоненциально устойчивая точка
равновесия.
ДОКАЗАТЕЛЬСТВО. ИЗ рисунка 4.7 видно, что траектории, начинающиеся
в {fc2||x||
a
< с} с достаточно малой с, остаются ограниченными для всех £ > εο·
4.5. НЕАВТОНОМНЫЕ СИСТЕМЫ
163
Из неравенств (4.25) и (4.26) следует, что V удовлетворяет дифференциальному
неравенству
Из леммы сравнения 3.4 получаем
V(t,x(t)) ^ ^(i0,x(io))e-
(fc3/fc2)(i
-
to)
·
Тогда
1x11 <
^
v(t,x{t))
l/a
^
V(i,a;(io))e-(
fe3
/fc2
)(i
-
to
)
h
l/a
<
Jt2||a;(io)||a
e-
(fc3/
'
S2)(i
-
to) l/a
Μ ° ИяМИе-Са/^Х'-Ч
Таким образом, начало координат экспоненциально устойчиво. Если все пред
положения выполнены глобально, с может быть выбрана произвольно большой
и предыдущее неравенство выполнено для всех x(to) Ε Rn
.
Π
Пример 4.19. Рассмотрим скалярную систему
X=-[l+g(t)]x
3
,
где g(t) — непрерывная функция, g(t) > 0 для всех t ^ 0. Используя функцию
Ляпунова V(x) = х
2
/2, получаем
V{t,x) = -[l + g{t)]x
4
^-х
4
,
Ухе Д, Vt^O.
Условия теоремы 4.9 при W\{x) = И^Оя) = У(ж) и И^з(х) = х
4
выполнены гло
бально. Следовательно, начало координат глобально равномерно асимптотически
устойчиво.
Δ
Пример 4.20. Рассмотрим систему
±i = -х\ - g(t)x2,
где g(t) — непрерывно дифференцируемая функция, удовлетворяющая
0^g(t)^k
и g{t)^g(t),
Vt^0.
Используя функцию Ляпунова V(x) = х\ + [1 + g(t)]x
2
9 получаем
х\+х\<V(t,x) <х\+(1+к)х\, \/хе R
2
.
164
ГЛАВА 4
Следовательно, V(t, x) — положительно определенная, убывающая и радиально
неограниченная функция. Производная V вдоль траекторий системы определя
ется равенством
-2x1 + 2xiX2 - [2 - 2g(t) - g{t)]x\.
V(t,x)
2+2g(t)- g(t) >2 +2g(t)- g(t) >2
Из неравенства
следует, что
V(t,x) < -2хг + 2ххх2 - 2^2
xi
#2
ηΓ
2
-1
Xl
^2
def
def
-x
T
Qx,
где (5 — положительно определенная матрица. Таким образом, V(t, x) — отрица
тельно определенная функция и условия теоремы 4.9 при положительно опреде
ленных квадратичных функциях Wi(x), И^(ж) и Ws(x) выполнены глобально.
С учетом того что положительно определенная квадратичная функция х
т
Рх удо
влетворяет
Лшп(/)хх^ х Рх ^ Amax(i^)x х,
заключаем, что условия теоремы 4.10 при а — 2 выполнены глобально. Следова
тельно, начало координат глобально экспоненциально устойчиво.
Δ
Пример 4.21. Линейная, зависящая от времени система
х = A(t)x
(4.27)
имеет точку равновесия в х = 0. Пусть A(t) является непрерывной для всех
t ^ 0, Предположим, что существует непрерывно дифференцируемая, симмет
ричная, ограниченная, положительно определенная матрица P(t), удовлетворяю
щая неравенствам
0<сг1<P(t)<c2/, V*^0,
и матричному дифференциальному уравнению
-P(t) = P(t)A(t) + A
T
(t)P{t) + Q(t),
(4.28)
где Q(i) — непрерывная, симметричная и положительно определенная матрица,
такая что
Q(t)^c3I>0,
Vt>0.
Функция Ляпунова
V(t,x) = x
T
Px
удовлетворяет неравенствам
ci\\x\\
2
2^V(t,x)^c2\\x\\l
4.6 . ЛИНЕЙНЫЕ, ЗАВИСЯЩИЕ от ВРЕМЕНИ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ 165
и ее производная вдоль траекторий системы (4.27) определяется равенством
V(t,х)=х
т
Рх+x
T
P(t)x + x
T
P(t)x =
=x
T
[P{i) + P(t)A(t) + A
T
(t)P(t)}x = -x
T
Q(t)x ^ -сз||я|||.
Таким образом, условия теоремы 4.10 при а = 2 выполнены глобально, и, следо
вательно, начало координат глобально экспоненциально устойчиво.
Δ
4.6. Линейные, зависящие от времени системы и линеаризация
Свойства устойчивости начала координат, являющегося точкой равновесия
линейной, зависящей от времени системы
x(t) = A(t)x,
(4.29)
могут быть охарактеризованы в терминах переходной матрицы системы. Из ли
нейной теории
25
известно, что решение (4.29) имеет вид
x(t) = Φ(Μο)*(<ο)>
где Φ (Mo) — переходная матрица. В следующей теореме равномерная асимпто
тическая устойчивость охарактеризована в терминах Ф(£,£о).
Теорема 4.11. Точка равновесия х = 0 системы (4.29) (глобально) равно
мерно асимптотически устойчива, если и только если передаточная матрица
удовлетворяет неравенству
||Ф(Мо)|| < ke-
x
^-
tQ
\ Vt^t0>
0,
(4.30)
где к и λ — некоторые положительные константы.
ДОКАЗАТЕЛЬСТВО. ЕСЛИ начало координат равномерно асимптотически
устойчиво, то это свойство выполняется глобально, поскольку x(t) линейно за
висит от x(to). Достаточность (4.30) следует из неравенства
||x(i)|| < ||Ф(*,*о)|| 1К«о)|| < fc||*(<o)l|e-
A(i
-4
Для доказательства необходимости предположим, что начало координат равно
мерно асимптотически устойчиво. Тогда существует /С£-функция β, такая что
||x(*)||<i9(||x(to)||,t-to), V*^o, Vx(*0)e Я*.
Из определения индуцированной матричной нормы (см. приложение А) следует,
что
||Ф(Мо)|| = max ||Ф(Мо)*|| < max /?(||x||,t - to) = /?(М - to).
\\x\\=l
||*||=1
25
См. например, [9], [35], [94] и [158].
166
ГЛАВА 4
Поскольку
/3(1, s) —> 0 при s—• оо,
существует Τ > О, такая что /3(1, Т) < 1/е. Предположим, что для всех t ^ to
константа 7V является наименьшим числом, таким что t ^ to + Λ/Τ. Разделим ин
тервал [to, to + (iV — 1)Т] на (Ν — 1) равных подынтервалов длиной Т. Используя
свойства переходной матрицы <3>(t,to), можем записать
Ф(*,t0) - Ф(*,t0 +(N- 1)Г)Ф(*+ (N- 1)Г,to+(N- 2)Г)···х
хФ(*о + Т,*о).
Тогда
Jfe=iV—1
|^(t,t0)||<|^(t,to + (iV-l)r)|| Π |^(to + fcT,t0 + (fc-l)T)||<
fc=JV-l
< 0(1,0) Π | = e/3(l,0)e-
N
^
fc=l
<е/3(1,0)е-(^°)/т
= А;е-
л
^
0
),
где/с = е/3(1,0) иА = 1/Г.
Π
Теорема 4.11 показывает, что для линейных систем равномерная асимпто
тическая устойчивость начала координат эквивалентна экспоненциальной устой
чивости. Несмотря на то что неравенство (4.30) позволяет установить свойство
равномерной асимптотической устойчивости начала координат без использова
ния функции Ляпунова, оно не столь же полезно, как критерий устойчивости
линейных, не зависящих от времени систем, в котором используется информа
ция о расположении собственных значений матрицы этих систем, поскольку для
получения переходной матрицы <£(t,to) необходимо решить уравнение состоя
ния (4.29). Заметим, что для линейных, зависящих от времени систем равномер
ная асимптотическая устойчивость не может быть охарактеризована с использо
ванием информации о расположении собственных значений матрицы А
26
Это
утверждение может быть проиллюстрировано следующим примером.
Пример 4.22. Рассмотрим линейную систему второго порядка с матрицей
л/.\_\
—1+1.5cos
2
1 1—1.5sintcost1
^' ~~
|
_
- 1- 1.5sintcost
l + 1.5sin
2
tJ
Для каждого t собственными значениями матрицы A(t) являются величины
—0.25 ± 0.25\/7^. Таким образом, собственные значения не зависят от t и лежат
26
Существуют специальные случаи, в которых равномерная асимптотическая устойчивость
начала координат, являющегося точкой равновесия системы (4.29), эквивалентна упомянутым
условиям на собственные значения. Одним из таких случаев являются периодические системы.
(См. примеры 4.40 и 10.8.) Другим подобным случаем являются медленно изменяющиеся систе
мы. (См. пример 9.9.)
4.6 . ЛИНЕЙНЫЕ, ЗАВИСЯЩИЕ ОТ ВРЕМЕНИ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ
167
в открытой левой полуплоскости комплексной плоскости. Тем не менее начало
координат неустойчиво. Действительно, из
Ф(*,0) =
e°*
5i
cosi
e ^sint
—e
0M
sint e
_i
cos£
видно, что существуют начальные состояния я(0), произвольно близкие к началу
координат, для которых решение неограниченно и уходит на бесконечность. Δ
Как мы увидим позднее, несмотря на то что теорема 4.11 не может быть
непосредственно использована в качестве критерия устойчивости, она гаранти
рует существование функции Ляпунова для линейной системы (4.29). В приме
ре 4.21 мы видели, что если найдена положительно определенная, ограничен
ная матрица P(t), удовлетворяющая для некоторой положительно определенной
матрицы Q(t) дифференциальному уравнению (4.28), то V(t,x) = x
T
P(t)x —
функция Ляпунова для этой системы. Если матрица Q(i) выбрана не только по
ложительно определенной, но и ограниченной, т. е.
0<c3I^Q(t)
<c4/, W>0,
и если A(t) непрерывна и ограничена, то можно показать, что в случае экспонен
циальной устойчивости начала координат существует решение уравнения (4.28),
обладающее желаемыми свойствами.
Теорема 4.12. Пусть х = 0 — экспоненциально устойчивая точка равно
весия (4.29). Предположим, что A(t) непрерывна и ограничена. Пусть Q(t) —
непрерывная, ограниченная, положительно определенная, симметричная мат
рица. Тогда существует непрерывно дифференцируемая, ограниченная, положи
тельно определенная, симметричная матрица P(t), удовлетворяющая (4.28).
Следовательно, V(t, х) — x
T
P(t)x — функция Ляпунова для системы, удовле
творяющая условиям теоремы 4.10.
ДОКАЗАТЕЛЬСТВО. Пусть
/
оо
ΦΓ(τ,*No(τ)Φ(τ,*)<*τ,
и ф(т\Ь,х) — решение (4.29), начинающееся в (£,ж). Вследствие линейности си
стемы ф(т]Ь,х) = Φ (г, i)x. По определению P{t):
/
оо
4>
T
(r;t,x)Q(r)(f)(T]t,x) dr.
Используя (4.30), получаем
/
оо
с4||Ф(т,«)||!||*|Ц*-<
^fee-^-
t
Urc4\\x\\i
= ^\\
k C4η ц2def
иц2
t
168
ГЛАВА 4
С другой стороны, поскольку
||A(*)||2<L, Vt^O,
решение ф(т; t, x) удовлетворяет оценке снизу
27
\\ф(т^х)\\1>\\х\$е-^
т
-*\
Тогда
/
оо
cz\\<t>{r;t,x)\\l dr >
e-^ -t) dTCUXtf2 = 2LM2 « Cl|W|2
Таким образом,
cilklll ^ x
T
P(t)x ^ c2||x||2·
Из этих неравенств видно, что P(t) является положительно определенной и огра
ниченной матрицей. Из определения P(t) следует, что она является, кроме то
го, симметричной и непрерывно дифференцируемой. То, что P(t) удовлетворя
ет (4.28), может быть доказано путем непосредственного дифференцирования
P(t) и с последующим использованием
|φ(τ,*) = -φ(τ,*μ(*)·
В частности,
/»СЮ
dt
P{t) = jT\T{T,t)Q{T)^{T,t) dr +
-г
Q(r)®{r,t) dr - Q{t)
Φτ(τ,*)<2(τ)Φ(τ,*) dr A(t)
-svf
OO
bT{T,t)Q{T)b{r,t)dT-Q(t)
= -P(t)A(t) - A
T
(t)P(t) - Q(t).
Тот факт, что V(t, x) — x
T
P(t)x — функция Ляпунова, было показано в приме
ре 4.21.
Π
В случае если линейная система (4.29) не зависит от времени, т. е. когда А —
постоянная матрица, функция Ляпунова V(t,x) в теореме 4.12 может быть вы
брана независимой от t. Напомним, что для линейной, не зависящей от времени
системы
Ф(т,*)=ехр[(т-*)А],
27
См. упражнение 3.17.
4.6 . ЛИНЕЙНЫЕ, ЗАВИСЯЩИЕ ОТ ВРЕМЕНИ СИСТЕМЫ и ЛИНЕАРИЗАЦИЯ 169
и эта передаточная матрица удовлетворяет (4.30), если А гурвицева. Выбрав по
ложительно определенную, симметричную (постоянную) матрицу Q, мы можем
определить P(t) равенством
/
оо
ехр[(т - t)AT]Qexp[(r - t)A] dr =
ехр[Ат
s]Q exp[As] ds.
i;
Заметим, что эта матрица не зависит от t. Сравнивая это представление для P(t)
с (4.13), можно заключить, что Ρ — единственное решение уравнения Ляпуно
ва (4.12). Таким образом, функция Ляпунова из теоремы 4.12 сводится к функции
Ляпунова, используемой в параграфе 4.3.
Факт существования функций Ляпунова для линейных систем, гарантируе
мый теоремой 4.12, может быть теперь использован для доказательства резуль
тата для линеаризованных систем, обобщающего теорему 4.7 на неавтономный
случай. Рассмотрим нелинейную неавтономную систему
*=/(*,я),
(4.31)
где/ :[0,оо)хD —>R
n
—
непрерывно дифференцируемая функция и D =
= {#ЕДп|||х||2<г}. Предположим, что начало координат х = 0 является
точкой равновесия для системы при t = 0, т. е. /(£, 0) = 0 для всех t ^ 0. Кроме
того, предположим, что матрица Якоби [df/dx] ограничена и липшицева на D
равномерно по t:
!£<«·«•>-§§<«·*»> ^LJzi-xslh, Vsi,x2€ Д Vi^O
для всех 1 ^ г ^ п. По теореме о среднем значении
где Zi — точка на отрезке, соединяющем х и начало координат. Поскольку
/(£, 0) = 0, мы можем записать
No,x) = ^(t,z,)x=
S
Ji(t,0)x
+
&«.«>-gft<» Χ.
Следовательно,
f(t,x) = A(t)x + g(t,x),
где
df,
A
(t) = -^(t,0) и 9i(t,x) = f^-f^
170
ГЛАВА 4
Функция g{t,x) удовлетворяет
uttx)h < (Σ
ц2\ V2
\x\\2 <L||x|||,
где L = y/nLi. Таким образом, в малой окрестности начала координат мы мо
жем аппроксимировать нелинейную систему (4.31) ее локальной линеаризацией.
Следующая теорема представляет собой формулировку первого метода Ляпуно
ва, используемого для установления свойства экспоненциальной устойчивости
начала координат для неавтономных систем.
Теорема 4.13. Пусть х = 0 — точка равновесия для нелинейной системы
x = f(t,x),
гдеf :[0,оо)хD —>R
n
—
непрерывно дифференцируемая функция, D =
= {х £ Rn | ||х||2 < г}, матрица Якоби [df/dx] ограничена и липшицева на D
равномерно по L Пусть
A(t)=
d
/x(t,X)\
Тогда начало координат является экспоненциально устойчивой точкой равно
весия для нелинейной системы, если она является экспоненциально устойчивой
точкой равновесия для линейной системы
х = A(t)x.
ДОКАЗАТЕЛЬСТВО. Поскольку линейная система имеет экспоненциально
устойчивую точку равновесия в начале координат и A(t) является непрерыв
ной и ограниченной, из теоремы 4.12 следует, что существует непрерывно диф
ференцируемая, ограниченная, положительно определенна симметричная матри
ца P(t), удовлетворяющая (4.28) с непрерывной, положительно определенной
и симметричной матрицей Q(t). Рассмотрим V(t,x) = x
T
P(t)x в качестве функ
ции Ляпунова для нелинейной системы. Производная этой функции вдоль реше
ний системы определяется равенством
V(t,х)=x
T
P(t)f(t, х) + f
T
(t, x)P(t)x + x
T
P(t)x =
=x
T
[P(t)A(t) + A
T
(t)P(t) + P(t)]x + 2x
T
P(t)g(t,x) =
=-x
T
Q(t)x + 2x
T
P(t)g(t,x) ^
<:-c3\\x\\l + 2c2L\\x\\l^
^-(c3-2c2Lp)\\x\\l
V||z||2<p.
Выбор ρ < min{r, C2/(2c2L)} обеспечивает отрицательную определенность
V(t,x) при ||х||2 < p. Таким образом, условия теоремы 4.10 выполнены для
||х||2 < р, и, следовательно, начало координат экспоненциально устойчиво.
Π
4.7. ОБРАТНЫЕ ТЕОРЕМЫ ЛЯПУНОВА
171
4.7. Обратные теоремы Ляпунова
В теоремах 4.9. и 4.10 устанавливаются условия равномерной асимптотиче
ской и экспоненциальной устойчивости начала координат, основанные на требо
вании существования функции Ляпунова V(t,x)9 удовлетворяющей определен
ным условиям. Это требование существования дополнительной функции V(t,x)9
удовлетворяющей определенным требованиям, является типичным для большин
ства теорем из теории Ляпунова. Условия этих теорем не могут быть провере
ны непосредственно с использованием данных исследуемой задачи. Вместо это
го необходимо найти дополнительную функцию — функцию Ляпунова. В свя
зи с проблемой нахождения этой функции возникает два вопроса. Во-первых,
существует ли такая функция, удовлетворяющая условиям теорем? Во-вторых,
какова методология поиска этой функции? Во многих случаях теория Ляпунова
позволяет получить утвердительный ответ на первый вопрос. Этот ответ дается
в форме обратных теорем Ляпунова (converse Lyapunov theorems), являющихся
обращением соответствующих теорем Ляпунова. Например, в обратной теоре
ме для равномерной асимптотической устойчивости утверждается, что если на
чало координат равномерно асимптотически устойчиво, то существует функция
Ляпунова, удовлетворяющая условиям теоремы 4.9. Большинство из этих об
ратных теорем обычно доказываются путем непосредственного построения до
полнительных функций, удовлетворяющих условиям соответствующих теорем.
К сожалению, нахождение этих функций почти всегда предполагает знание ре
шения дифференциального уравнения. Поэтому эти теоремы не могут помочь
при практическом нахождении функций Ляпунова. Однако гарантия существо
вания этих функций — это лучше, чем полное отсутствие какой-либо информа
ции. По крайней мере мы будем уверены, что наши поиски могут увенчаться
успехом. Обратные теоремы полезны также при использовании теории Ляпунова
для получения концептуальных заключений о поведении динамических систем.
Приведенная ниже теорема 4.15 принадлежит именно к этому классу результа
тов. Другие примеры подобного использования обратных теорем Ляпунова будут
приведены в последующих главах. В этом параграфе мы приведем три обрат
ные теоремы Ляпунова
28
.
Первая теорема представляет собой обращение тео
ремы об экспоненциальной устойчивости начала координат, а вторая — теоремы
о равномерной асимптотической устойчивости начала координат. Третья теорема
применима к автономным системам и определяет конверсную функцию Ляпуно
ва (converse Lyapunov function)
29
для всей области притяжения асимптотически
устойчивой точки равновесия.
Задача построения конверсной функции Ляпунова для нас не нова. Мы ре
шили ее для случая линейных систем при доказательстве теоремы 4.12. При
28
Всеобъемлющий обзор обратных теорем Ляпунова приведен в работах [72] и [107], последние
результаты в этой области изложены в [193].
29
Термин «converse Lyapunov function», обозначающий функцию Ляпунова, определяемую при
доказательстве обратной (converse) теоремы Ляпуновского типа переведен как «конверсная функ
ция Ляпунова», чтобы избежать смешения с термином «обратная функция». — Прим. ред. перев.
172
ГЛАВА 4
внимательном чтении этого доказательства можно убедиться в том, что для его
проведения линейность системы не является критическим требованием и ис
пользуется лишь при установлении квадратичности функции V(t,x) по х. Это
наблюдение приводит к формулировке первой из трех упомянутых обратных тео
рем Ляпунова, доказательство которой представляет собой простое обобщение
доказательства теоремы 4.12
30
.
Теорема 4.14. Пусть х = О — точка равновесия нелинейной системы
i = /(i,x),
гдеf :[О,оо)хD—>R
n
—
непрерывно дифференцируемая функция, D = {х Ε
Rn | ||ж|| < г}, и матрица Якоби [df/dx] ограничена в D равномерно по L
Пусть к, λ и го — положительные константы, т*о < τ/к. Пусть D$ = {х Ε
Rn I ||ж|| < го}. Предположим, что решения системы удовлетворяют
ЬШ < к\\х(Ь0)\\е-
х
^°\
Vx(io) e Аь Vt>to>
0.
Тогда существует функция V : [0, оо) х Do —> R, удовлетворяющая неравен
ствам
с\\\х\\
2
^ V(t,x) ^ с2||х||
2
,
dV
дх
< с4||х||
2
,
где ci, C2, сз и C4 — некоторые положительные константы. Более того, если
г = оо и начало координат глобально экспоненциально устойчиво, то V(i, x)
определена и удовлетворяет на R
n
вышеприведенным неравенствам. Кроме то
го, если система автономна, V может быть выбрана независимой от t
ДОКАЗАТЕЛЬСТВО. Вследствие эквивалентности норм достаточно доказать
утверждения этой теоремы для 2-нормы. Пусть ф{т\ £, х) — решение системы,
начинающееся в (t,x), т.е. (/>(£;£,#) = х. Для любого х Ε Do, </>(т;£,х) E D для
всех τ ^ t. Пусть
rt+δ
V(t,x)= / фт(т^,х)ф(т^1х) dr,
где 5 — положительная константа, подлежащая определению. Вследствие экспо
ненциального убывания решений имеем
rt+δ
V(t,x) = J
||0(r;t,aO||!dT<
fc2e-2A(T-t)dT||x||2
=
|_(1_e
-2 A,)||a;||2_
30
Теорема 4.14 впервые была получена Η. Η. Красовским [107] и в отечественной литературе
называется теоремой Красовского. Участвующие в ее формулировке неравенства называют, вслед
за Н. Н. Красовским, неравенствами квадратичного типа. — Прим. ред. перев.
4.7 . ОБРАТНЫЕ ТЕОРЕМЫ ЛЯПУНОВА
173
С другой стороны, матрица Якоби [df/dx] ограничена на D. Пусть
дх
(t,x) <L,
\/xGD.
Тогда ||/(£,ж)||2 ^ Ц\ХЪ
и
<t>(j]t">x) удовлетворяет оценке снизу
31
Щт;Ь,х)\\1>\\х\\1е-
2
^-*\
Следовательно,
/
t+δ
1
Таким образом, V(t,x) удовлетворяет первому неравенству из формулировки до
казываемой теоремы с константами
с\=
(1- e~
2LO
)
2L
ИС2=
jfe2(i_e-
2A
*)
2λ
Для вычисления производной V вдоль траекторий системы определим функции
чувствительности
фг{т\ t, х) = ^Ф{т\ *, ж); </>ж(т; f, х) = ^</>Сп *, ж).
Тогда
dV,<9^
+^-/(t,ж)=^ (т+i;*,ж)0(г+5;t,х)-ф
1
(*; t, x)0(t; i, х) +
eft дх
2фт{т]г,х)фь{т^х) dr +
rt+δ
+/2</>
т
(т; t, х)фх{т\ t, x) dr f(t, x) =
=ф
т
(Ь+δ;t,x)0(t+δ;t,ж)- \\x\\l+
+/
20г(г;е,х)[^(г;«,х)+0ж(г;«,х)/(^х)]бгт.
Легко показать, что
32
0t(r;i,x) + <£x(r;i,x)/(t,x) Ξ 0, Vr ^ i.
31
См. упражнение 3.17.
32
См. упражнение 3.30.
174
ГЛАВА 4
Поэтому
dV,dV
+ ^-f{t, x) =ф
1
(Ь+5;t,x)0(t+5;t,x)- No <
dt dx
,2
-2λ<5\
<-(l-^e-^)||x||j|.
Выбор δ = 1η(2&2)/(2λ) обеспечивает выполнение второго неравенства в форму
лировке теоремы при с2 — 1/2. Для того чтобы показать справедливость третьего
неравенства, заметим, что фх(т; £, х) удовлетворяет уравнению чувствительности
я
df
-т^Фх = -т^(т,ф(т\1,х))фх, фх{Ь\Ь,х) = J.
Поскольку на D выполнено
S"·*»
<L,
фх удовлетворяет оценке.33
\\фх(т;г,х)\\2^е^
т
-
г
\
Поэтому
дх2 ИЛ
\ 2фт (т',Ь,х)фх(т\1,х) dr\
ΙΙΛ
I
rt+δ
J 2\\ф{т'^х)\\2 \\фх(т'1,х)\\2 dr ^
rt+δ
£/ 2ке~
х{
-
т
-^е
ь{
-
т
~^dr\*2=
2k
(X-L)
[1_е-(
А
-^]||х||2.
Таким образом, последнее неравенство в формулировке теоремы выполнено
с константой
2к
с4
(X-L)
[1_е
-(А-^].
Если все предположения выполнены глобально, то VQ может быть выбрана произ
вольно большой. Если система автономна, то ф(т\ t, х) зависит только от (г — t),
т.е.
ф(т\t,х) =ψ(τ—t;x).
См. упражнение 3.17.
4.7 . ОБРАТНЫЕ ТЕОРЕМЫ ЛЯПУНОВА
175
/
t+δ
ρδ
ψτ(τ — Р,х)ф(т — t\x) dr = / tlF(s\x)il)(s\x) ds
и это представление не зависит от t.
Π
Из теоремы 4.13 следует, что если линеаризация нелинейной системы
в окрестности начала координат имеет экспоненциально устойчивую точку рав
новесия, то начало координат является экспоненциально устойчивой точкой рав
новесия этой нелинейной системы. Ниже мы используем теорему 4.14 для дока
зательства того факта, что экспоненциальная устойчивость линеаризации являет
ся необходимым и достаточным условием для экспоненциальной устойчивости
начала координат.
Теорема 4.15. Пусть х = О — точка равновесия нелинейной системы
x = f(t,x),
гдеf :[0,оо)хD —>R
n
—
непрерывно дифференцируемая функция, D
=
= {х G Rn | ||#||2 < ^} и матрица Якоби [df/дх] ограничена и липшицева
на D равномерно по t Пусть
\Х=\)
Тогда х = 0 — экспоненциально устойчивая точка равновесия нелинейной си
стемы, если и только если она является экспоненциально устойчивой точкой
равновесия линейной системы
х = A(t)x.
ДОКАЗАТЕЛЬСТВО. Необходимость следует из теоремы 4.13. Для доказа
тельства достаточности запишем линейную систему в следующем виде:
х=/(*,x) -[/(t,x) -A(t)x)]=f(t, x) -g(t, x).
С учетом рассуждений, предшествующих теореме 4.13, можно утверждать, что
\\g(t,x)\\2^L\\x\\l
VxGAV^O.
Поскольку начало координат является экспоненциально устойчивой точкой рав
новесия нелинейной системы, существуют положительные константы к, λ и с,
такие что
\\x(t)h < k\\x(t0)he-
x{t
-
to
\
Vt^t0>
О, V||*(*o)||2 < с.
Выбор го < min{c, r/к} обеспечивает выполнение условий теоремы 4.14.
Пусть V(t,x) — функция, существование которой гарантируется теоремой 4.14.
176
ГЛАВА 4
Используем ее в качестве функции Ляпунова для линейной системы. Тогда
^-c3\\x\\l + c4L\\x\\l<
< -(c3-c4Lp)||x||^ V||x|||2 < p.
Выбор ρ < пип{го,сз/(с41/) гарантирует отрицательную определенность V(t,x)
при ||х||2 < р. Следовательно, все условия теоремы 4.10 выполнены при \\х\\2 <
р, и мы можем заключить, что начало координат является экспоненциально
устойчивой точкой равновесия линейной системы.
Π
Следствие 4.3. Пусть х = 0 — точка равновесия нелинейной системы х =
= f(x)j где f(x) — непрерывно дифференцируемая в некоторой окрестности
х = 0 функция. Пусть A(t) = [df/dx](0). Тогда х = 0 — экспоненциально устой
чивая точка равновесия нелинейной системы, если и только если А гурвицева.
Пример 4.23. Рассмотрим скалярное уравнение х = —х
3
. В примере 4.14
мы показали, что начало координат асимптотически устойчиво, но соответствую
щая линеаризованная система в окрестности начала координат имеет вид х = 0.
Легко видеть, что матрица А не является гурвицевой. Используя следствие 4.3,
можно заключить, что начало координат не является экспоненциально устойчи
вым.
Δ
Приведенные ниже обратные теоремы Ляпунова (теоремы 4.16 и 4.17) пред
ставляют собой обобщения теоремы 4.14 в двух различных направлениях, одна
ко их доказательства более сложны. Теорема 4.16 применяется в более общем
случае равномерной асимптотической устойчивости
34
. Теорема 4.16 применима
в случае автономных систем и гарантирует существование функции Ляпунова,
которая определена на всей области притяжения.
Теорема 4.16. Пусть х = 0 — точка равновесия нелинейной системы
£=/(*,ж),
гдеf:[0,оо)хD —• R
n
—
непрерывно дифференцируемая функция, D =
= {х £ Rn | ||а:|| <г} и матрица Якоби [df/dx] ограничена на D равномерно
по L Пусть β — КС-функция и г$ — полоэюительная константа, такая что
/3(го,0) < г. Пусть Do = {х Ε Rn \ \\х\\ < го}. Предположим, что решения
системы удовлетворяют
1И*)И < Noft>)||,t - *о), Va(to) Ε D0, Vt>to> 0.
34
Теорема 4.16 может быть сформулирована лишь для локально липшицевой, а не для непре
рывно дифференцируемой функции /(£, х) [125, теорема 14]. Также можно сформулировать соот
ветствующий результат для случая глобальной равномерной асимптотической устойчивости [125,
теорема 23].
4.7 . ОБРАТНЫЕ ТЕОРЕМЫ ЛЯПУНОВА
177
Тогда существует непрерывно дифференцируемая функция V : [0, оо) х Do —• R,
удовлетворяющая неравенствам
a1(\\x\\)^V(t,x)^a2(\\x\\),
%+
^f(t,x)^-a3(\\x\\),
dv
дх < MINI).
где ai, с*2, аз и а^ — JC-функции, определенные на [0,т*о]. £слм система авто
номна, V может быть выбрана независимой от t
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.7.
Π
Теорема 4.17. Пусть х = 0 — асимптотически устойчивая точка равнове
сия нелинейной системы
х = /(ж),
гдеf :D—»R
n
—
локально липшицевая функция, D С Rn
—
область, со
держащая начало координат. Пусть RA С D — область притяжения точки
х = 0. Тогда существуют гладкая, положительно определенная функция V(x)
и непрерывная, положительно определенная функция W(x), определенные для
всех х Ε RA, такие что
У(х)—> оо при х —» сМ?л,
f^/(s) < -W(x), \/x£RA,
и для любой константы с > 0 множество {V(x) < с} является компактным
подмножеством RA> В случае если RA = R
n
, функция V(x) является радиально
неограниченной.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.8.
Π
Анализируя теорему 4.17, интересно отметить, что любое ограниченное под
множество S области притяжения может быть включено в компактное множество
вида {V(x) ^ с}, где с > 0 — некоторая константа. Это обстоятельство представ
ляется важным, поскольку очень часто нам приходится ограничивать свой ана
лиз рассмотрением положительно инвариантного, компактного множества вида
{V(x) ^ с}. В этом случае, если S С {V(x) ^ с}, полученные нами результаты
будут верны для всего множества S. Если, с другой стороны, все, что нам из
вестно, это факт существования на 5 функции Ляпунова Vi(x), то мы должны
выбрать константу с\9 такую что множество {V\(x) ^ с\} является компактным
и содержится в S. Тогда наш анализ будет ограничен рассмотрением множества
{V\(x) ^ ci}, являющегося лишь подмножеством S.
178
ГЛАВА 4
4.8. Ограниченность и предельная ограниченность
Теория Ляпунова может быть использована для доказательства ограниченно
сти решения уравнения состояния даже в случае, когда начало координат не явля
ется точкой равновесия. Мотивировка рассматриваемого в этом параграфе вопро
са может быть получена при анализе следующего примера. Скалярное уравнение
х= —х+5sin£, x(to) =α, α>δ>0,
не имеет точек равновесия, и его решение определяется равенством
rt
x(t) = e-
{t
-
to)
a +δ[e-
(i
~
T
)sinr dr.
Jt0
Это решение удовлетворяет оценке
\x(t)\ ^ е-<'-*°>а + δ [ е~(*-
г
) dr = е'^'^а
+δ\l- e'^^]
<
Jto
L
J
^a,
Vi^to»
которая показывает, что решение ограничено для всех t ^ to равномерно по to,
т. е. эта верхняя оценка не зависит от t$. Несмотря на то что эта оценка верна для
всех t ^ to, она становится по мере течения времени все более консервативной
оценкой решения, поскольку не учитывает экспоненциально убывающего члена.
Если, с другой стороны, мы выберем любое число 6, удовлетворяющее δ < Ь < а,
то можно показать, что
Новая верхняя граница решения Ь, также являющаяся независимой от to, пред
ставляется лучшей оценкой решения после завершения в системе переходного
процесса. В этом случае решение называется равномерно предельно ограничен
ным, а константа Ъ — предельной границей. Доказательство того факта, что ре
шение уравнения х = — х + 5sin£ обладает свойствами равномерной ограни
ченности и равномерной предельной ограниченности, может быть выполнено
с использованием теории Ляпунова без явного вычисления решения уравнения
состояния. Рассмотрим функцию V(x) = х
2
/2 и вычислим ее производную вдоль
решений исследуемого уравнения:
V=хх=—х
2
+x6smt ^ —х
2
+ 6\х\.
Правая часть этого неравенства неотрицательна, поскольку вблизи начала коор
динат положительный линейный член 6\х\ доминирует над отрицательным квад
ратичным членом —х
2
.
Однако V отрицательна вне множества {|х| ^ δ}. При
4.8 . ОГРАНИЧЕННОСТЬ и ПРЕДЕЛЬНАЯ ОГРАНИЧЕННОСТЬ
179
с>δ
2
/2 решения, начинающиеся в множестве {V^#) ^ с}, остаются в этом
множестве во все будущие моменты времени, т. к. V отрицательна на границе
этого множества V = с. Таким образом, решения равномерно ограничены. Кроме
того, если мы выберем любое число ε, такое что (δ2/2) < ε < с, то V будет отри
цательной в множестве {ε ^ V < с} и, следовательно, в этом множестве V будет
монотонно убывать до тех пор, пока решение не войдет в множество {V ^ ε}.
Начиная с этого момента, решение не сможет покинуть множество {V ^ ε},
поскольку V отрицательна на его границе V = ε. Таким образом, мы можем за
ключить, что решение равномерно предельно ограничено с предельной границей
\х\ < \/2ε.
Цель, которую мы преследуем в этом параграфе, заключается в том, чтобы
показать, как теория Ляпунова может быть использована для получения анало
гичных заключений в отношении системы
* = /(*,*),
(4.32)
где/ :[0,оо)хD—>R
n
—
кусочно-непрерывная по t и локально липшицевая
похна[0,оо)хDфункция,DСRn
—
открытая область, содержащая начало
координат.
Определение 4.6. Решения (4.32) являются
• равномерно ограниченными, если существует положительная константа с,
независимая от to ^ 0, и для каждой а Е (0,с) существует β =β(а) > О,
независимая от to, такая что
\\x(t0)\\ < а => ||x(t)|| < /J, Vt ^ t0;
(4.33)
• глобально равномерно ограниченными, если (4.33) выполнено для произволь
но большой константы а;
• равномерно предельно ограниченными с предельной границей Ъ, если суще-
ствуют положительные константы Ь и с, независимые от to ^ 0, и для
каждой a Ε (0, с) существует Τ = Т(а, Ь) > 0, независимая от to, такая
что
ЫШ <а=» ||x(t)||О, Vi>t0+Τ;
(4.34)
• глобально равномерно предельно ограниченными, если (4.34) выполнено для
произвольно большой константы а.
В случае когда рассматривается автономная система, мы можем опустить слово
«равномерно», поскольку решение зависит только от t - to.
Для того чтобы продемонстрировать использование теории Ляпунова при
установлении свойств ограниченности и предельной ограниченности, рас
смотрим непрерывно дифференцируемую, положительно определенную функ
цию V(x) и предположим, что множество {V < с} компактно, где с > 0 —
180
ГЛАВА 4
некоторая константа. Пусть
Λ={ε<V(x) ^ с},
где ε < с — некоторая положительная константа. Предположим, что производ
ная V вдоль траекторий системы х = f(t,x) удовлетворяет неравенству
V(t,x)^-Ws(x)
Ухе A, Vt^to,
(4.35)
где Ws{x) — непрерывная, положительно определенная функция. Из неравен
ства (4.35) следует, что множества Qc = {V(x) ^ с} и Ωε = {V{x) ^ ε} положи
тельно инвариантны, поскольку на границах сЮс и ΘΩε производная V отрица
тельна. На рисунке 4.8 изображены множества Λ, dilc и ΘΩε. Поскольку V отри
цательна в Λ, траектории, начинающиеся в Λ, должны двигаться в направлении
убывания V(x(t)). При нахождении траекторий в Λ функция V удовлетворяет
неравенствам (4.22) и (4.24) из формулировки теоремы 4.9. Поэтому поведение
траекторий соответствует ситуации, когда начало координат равномерно асимп
тотически устойчиво; кроме того, выполнено неравенство
\\x(t)\\^p(\\x(to)lt-t0),
где β — некоторая /СХ-функция. Функция V(x(t)) продолжает убывать до тех
пор, пока траектория не достигнет за конечное время множества Ω0; после этого
траектория останется в этом множестве во все будущие моменты времени. Тот
факт, что траектория достигнет множества flc за конечное время, доказывается
следующим образом. Пусть к = mmxeAWs(x) > 0. Этот минимум существует,
т.к. Ws(x) непрерывна и Λ компактно. Кроме того, этот минимум является по
ложительной величиной, поскольку Ws(x) является положительно определенной
функцией. Следовательно,
W3(x) >k, Ухе Λ.
(4.36)
Из неравенств (4.35) и (4.36) следует, что
V{t,x) <-fc, VxеΛ,Vt^t0.
Поэтому справедлива оценка
V(x(t)) < V(x(t0)) - k(t -t0)<c-
k(t - t0),
из которой следует, что V(x(t)) убывает до величины ε на интервале времени
[to,to + (c-e)/k].
При решении многих задач неравенство V < — Ws получают с использова
нием неравенств для норм. В этих случаях при анализе часто приходят к нера
венству
V(t,x) < -W3(x), Vμ < ||х|| < г, Vt S* t0.
(4.37)
4.8. ОГРАНИЧЕННОСТЬ и ПРЕДЕЛЬНАЯ ОГРАНИЧЕННОСТЬ
181
Рис. 4.8. Множества Λ, 0Ωο и ΘΩε
Если г превосходит μ и достаточно велико, мы можем выбрать сие так, чтобы
множество Л было непустым и содержалось в {μ < ||х|| < г}. В частности,
предположим, что а\ и «2 — /С -функции, такие что
35
ai(|M|) < V(x) < a2(||*||).
(4.38)
Из левого неравенства (4.38) следует, что
V(x) ^ с =» ai(||x||) < с 4Ф ||х|| ^ aj;1
^).
Поэтому выбор с = ai(r) обеспечивает ftc С J5r. С другой стороны, из правого
неравенства (4.38) следует, что
||х|| < μ =» У(ж) < α2(μ).
Следовательно, выбор ε = аг(д) обеспечивает Βμ с Ωε. Для того чтобы полу
чить ε < с, мы должны обеспечить μ < a^"
1
(ai(r)). На рисунке 4.9 изображены
множества Ω0, Ωε, Вг и Βμ.
Из всего вышесказанного следует, что все траектории, начинающиеся в Ω0,
достигают за конечное время Τ множества Ωε.
36
Для вычисления предельной
границы для x(t) используем левое неравенство (4.38):
V(x) ^ ε => ai(||x||)^£ <^ ||ж|| < ajf1
^).
Поскольку ε = α2(μ), имеем
хе Ωε =Φ ||х|| ^а^^агЫ).
Поэтому в качестве предельной границы можно принять Ь = α^
1
(α2(μ)).
Представленная теория для непрерывно дифференцируемой функции V(x)
может быть обобщена на случай непрерывно дифференцируемой функции
V(t,x), если V(t,x) удовлетворяет неравенству (4.38). В следующей теореме
формулируются условия равномерной и предельной ограниченности для этого
случая.
35
Такие /С-функции всегда существуют по лемме 4.3.
36
Т = 0, если траектория начинается в Ωε.
182
ГЛАВА 4
Рис. 4.9. Множества Ωε, Ω€, (непрерывные линии) и Βμ, Вг (пунктирные линии)
Теорема 4.18. Пусть D С Rn
—
открытая область, содержащая начало
координат, V : [0, оо) х D —> R — непрерывно дифференцируемая функция,
такая что
a1(\\x\\)^V(t,x)^a2(\\x\\),
(4.39)
2£ + u¥-f(t,x)<-W3(x), ν||*||>μ^0,
(4.40)
\/£^0и\/х£Д где о>\ и 0L2 ~ IC-функции и \¥%(х) — непрерывная, положи
тельно определенная функция. Пусть г > 0, такая что Вг С D, и предположим,
что
μ<α^(α1(Γ)).
(4.41)
Тогда существует КС-функция β и для любого начального состояния x(to), удо
влетворяющего \\x(to)\\ ^ a^"
x
(ai(r)), существует Τ ^ 0 (зависящая от x(to)
и μ), такие что решение (4.32) удовлетворяет неравенствам
\\x(t)\\ ^ 0(\\x(tQ)\\,t
-
to), V*o<*<t0+Τ,
(4.42)
\\x(t)\\ < аГ^агЫ), V* ^ t0 + Т.
(4.43)
Более того, если D = R
n
и а\ принадлеэюит классу JCQQ, то (4.42) и (4.43)
выполнены для любого начального состояния ж (in) вне зависимости от того,
насколько велико μ.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.9.
Π
Из неравенств (4.42) и (4.43) следует, что x(t) равномерно ограничено
для всех t > to и равномерно предельно ограничено с предельной границей
<^Г
1
(а2(м))· Предельная граница является функцией от μ класса /С, и, следова
тельно, чем меньше значение μ, тем меньше предельная граница. При μ —» 0
предельная граница стремится к нулю.
Наиболее важным приложением теоремы 4.18 является ее использование
при исследовании устойчивости возмущенных систем
37
. Следующий пример ил
люстрирует основные идеи, лежащие в основе этого применения.
37
См. параграф 9.2.
4.8 . ОГРАНИЧЕННОСТЬ и ПРЕДЕЛЬНАЯ ОГРАНИЧЕННОСТЬ
183
Пример 4.24. В параграфе 1.2.3 было показано, что система «масса на пру
жине» с жесткой пружиной, линейным вязким демпфированием и периодической
внешней силой может быть представлена уравнением Дуффинга
ту+су+ку+ка
2
у3
= Acosut.
Пусть х\ = у, Х2 = у. Предположим, что константы в этом уравнении выбраны
таким образом, что модель состояния имеет вид
XI=Х2,
±2 = —(1+ х\)х\ — Х2+ Mcosut,
где константа Μ ^ О пропорциональна амплитуде периодической внешней си
лы. При Μ = О система имеет точку равновесия в начале координат. В приме
ре 4.6 было показано, что начало координат глобально асимптотически устойчиво
и в качестве функции Ляпунова можно использовать
38
V(x)
Г1
2
1
L2
С
О
2
1
L2
1
2
1
1
2
1
ГХ1
Х+2
(у
Jo
+у
3
)dy- х
1
X~гХ\~г 7)Х\
ЫШхТрх+±хЬ
¥
Используя эту функцию Ляпунова, мы можем применить теорему 4.18 при
Μ > 0. Функция V(x) положительно определена и радиально неограниченна.
Следовательно, по лемме 4.3 существуют /С-функции а\ и а.2, удовлетворяю
щие (4.39) глобально. Производная V(x) вдоль траекторий системы определяется
равенством
V = -х\ -xi-xl
+ (xi + 2x2)Mcoscjt < -\\х\\1 -х* + Му/5\\х\\2.
При получении этого неравенства мы записали (xi+2^2) как у
т
х и использовали
неравенство у
т
х < ||ж||2||2/||2· Для того чтобы обеспечить выполнение (4.40),
нам следует сделать так, чтобы при больших ||х|| член — ||х||2 доминировал над
М\/5||ж||2· Для этого перепишем предыдущее неравенство
V < -(1 - в)\\х\\1 -xj-
в\\х\\1 + Му/5\\х\\2,
где0<θ<1.Тогда
Му/Ъ
У^-{\-в)\\х\\1-х\,
V||x||2>
θ
38
3начения констант δ и к из примера 4.6 выбраны следующими: δ = 2 и к = 1/2.
184
ГЛАВА 4
Эта оценка показывает, что неравенство (4.40) выполнено глобально при μ =
= My/E/Θ. Таким образом, мы приходим к заключению, что решения глобально
равномерно предельно ограничены. Для того чтобы вычислить предельную гра
ницу, мы должны найти функции а\ и α2· Из неравенств
V(x) >х
т
Рх^
\шш(Р)\\х\\1
V(x)<х
т
Рх + \\\х\\\ < Атах(Р)||хЩ + Ι||*|β
видно, что в качестве функций ai и с*2 могут быть выбраны
ai(r) = Amin(P)r
2
и а - 2(r)Amax(P)r
2
+ \т\
Таким образом, предельная граница определяется равенством
Amax(F)M2
+M
4
/2
^min(^)
>i
Amin(P)
Δ
4.9. Устойчивость систем по входу-состоянию
Рассмотрим систему
х = /(*,*, и),
(4.44)
где/ :[0,оо)xR
n
xR
m
—>R
n
—
кусочно-непрерывная по t и локально липшице-
вая похии функция. Вход системы u(t) — кусочно-непрерывная и ограниченная
функция времени t для всех t > 0. Предположим, что свободная система (система
с нулевым входом)
± = /(*,*,0)
(4.45)
имеет глобально равномерно асимптотически устойчивую точку равновесия в на
чале координат х = 0. Что можно сказать о поведении системы (4.44) при нали
чии ограниченного внешнего воздействия u(t)l В случае линейной системы, не
зависящей от времени:
х=Ах+Ви
с гурвицевой матрицей А, можно выписать решение в явном виде
x(t) = e^-^
A
x(t0)
+/е^-^
А
Ви{т) dr
Jto
и с учетом ограниченности первого члена ||е*~*°^|| ^ ke~
x
^~
to
^ получить оцен
ку решения
\\x(t)\\ < А:е-
А
<'-*
0
>||а;(*о)|| + Г*е-
А
<*-
т
>||В||||и(т)|| dr ^
Jto
^ке-^ -^\\хЦ0)\\
+^Щ
sup ||u(r)||.
4.9. Устойчивость СИСТЕМ по входу-состоянию
185
Эта оценка показывает, что состояние системы при нулевом входе (zero-input
response) экспоненциально убывает до нуля. Кроме того, из этой оценки так
же следует, что состояние системы при нулевом начальном состоянии (zero-state
response) ограничено при любом ограниченном входе. Более того, из этой оцен
ки следует нечто большее, нежели свойство системы, заключающееся в том, что
при ограниченном входе ее состояние будет также ограничено (bounded-input-
bounde-state property). Полученная оценка показывает, что состояние системы
при нулевом начальном состоянии пропорционально ограничению на норму вхо
да. Можем ли мы ожидать, что подобное поведение будет наблюдаться и в случае
нелинейной системы? Нет ничего удивительного в том, что в общем случае эти
свойства не будут иметь место, даже если начало координат свободной систе
мы является глобально равномерно асимптотически устойчивым. Рассмотрим,
например, скалярное уравнение
х= -Зх+(1+2х
2
)и,
имеющее при и = О глобально экспоненциально устойчивую точку равновесия
в нуле. Тем не менее при х(0) =2и u(t) =1решение x(t) =(3— е*)/(3—2е
£
)
неограниченно и даже уходит на бесконечность за конечное время.
Рассмотрим систему (4.44) как возмущение свободной системы (4.45). Пред
положим, что V(t, x) — функция Ляпунова для свободной системы. Вычислим ее
производную при наличии входа и. Вследствие ограниченности и весьма веро
ятно, что в некоторых случаях можно будет доказать отрицательность V вне
некоторого шара радиуса μ, где μ будет зависеть от sup ||м||. Одной из подобных
ситуаций будет случай, когда функция f(t,x,u) удовлетворяет условию Липшица
\\f(t,x,u)-f(t,xM<I*M-
(4.46)
Если V отрицательна вне шара радиуса μ, можно применить теорему 4.18
из предыдущего параграфа и показать, что x(t) удовлетворяет (4.42) и (4.43).
Эти неравенства показывают, что величина ||ж(£)|| ограничена /С£-функцией
/?(||ж(£о)1М "~ *о)
на
интервале [to, to + Т]9 а также /С-функцией α^α^μ)) при
t^to + T. Следовательно, оценка
||х(*)|| < P(\\x(t0)lt - t0) -Ι- α^(α2(μ))
верна для всех t ^ to и мотивирует следующее определение устойчивости по
«входу-состоянию» (input-to-state stability, ISS).
Определение 4.7. Система (4.44) называется устойчивой по входу-
состоянию, если существуют КС-функция β и К-функция η, такие что для
любого начального состояния x(to) и любого ограниченного входа u{t) решение
x(t) существует для всех t ^ to и удовлетворяет оценке
||*(t)ll <No(Ш*-*о) + 7( sup ||«(r)||\
(4.47)
186
ГЛАВА 4
Неравенство (4.47) гарантирует, что для любого ограниченного входа u(t)
состояние x(t) будет также ограниченным. Более того, при увеличении t со
стояние x(t) становится предельно ограниченным /С-функцией sup^io ||w(t)||.
Читателю предлагается показать (упражнение 4.58) с использованием неравен
ства (4.47), что если u(t) стремится к нулю при £—> оо, то x(t) также стремится
к нулю
39
. Поскольку при u(t) = О неравенство (4.47) сводится к
\\x(t)\\<P(\\x(to)lt-to),
из устойчивости по входу-состоянию следует, что начало координат свобод
ной системы (4.45) глобально равномерно асимптотически устойчиво. Понятие
устойчивости по входу-состоянию дано в глобальной постановке, когда началь
ное состояние и вход системы могут быть произвольно большими. Локальная
версия определения этого свойства системы представлена в упражнении 4.60.
В следующих теоремах приведены достаточные условия устойчивости по
входу-состоянию
40
.
Теорема 4.19. Пусть V : [0, oo)xR
n
—> R — непрерывно дифференцируемая
функция, такая что
a1(\\x\\)^V{t,x)^a2(\\x\\),
(4.48)
ЯГ + |£/β*'«) < -ИЪО*), VIMI > р(|М|) > 0,
(4.49)
V(i,x,w) Ε [0,оо) х R
n
хR
m
,
где ai, а2 — lCoo-функции, ρ — К-функция
и Wz(x) — непрерывная положительно определенная функция на R
n
.
Тогда си
стема (4.44) устойчива по входу-состоянию при η = а^
1
оа2°р.
ДОКАЗАТЕЛЬСТВО. Используя глобальную версию теоремы 4.18, можно за
ключить, что решение x(t) существует и удовлетворяет оценке
\\x(t)\\ ^ P(\\x(to)lt - t0)+i(8uj>\\u(T)\\) , Vt^t0.
(4.50)
\r^to
J
Поскольку x(t) зависит лишь от и(т) при to ^ τ ^ t, супремум в правой части
неравенства (4.50) может вычисляться на интервале [to,t] и, следовательно, вы
полнена оценка (4.47)41
.
Π
Следующая лемма представляет собой прямое следствие обратной теоремы
Ляпунова для случая глобальной экспоненциальной устойчивости (теорема 4.14).
39
Другое интересное использование неравенства (4.47) будет вскоре приведено в лемме 4.7.
40
В [183] показано, что для автономных систем условия теоремы 4.19 являются также и необхо
димыми. В литературе для устойчивости по входу-состоянию принято использовать аббревиатуру
ISS и называть функцию V в теореме 4.19 ISS-функцией Ляпунова.
41
В частности, можно повторить эти рассуждения для отрезка времени [0, Т] и показать, что
справедливо неравенство
\\Χ(σ)\\^β(\\Χ&0)\\,σ-Ιο)+Ι(
sup Ητ)||Υ V*0<σ^Τ.
Тогда можно положить σ = Τ = t.
4.9. Устойчивость СИСТЕМ по входу-состоянию
187
Лемма 4.6. Предположим, что f(t,x,u)
—
некоторая функция, являющая
ся непрерывно дифференцируемой и глобально липшицевой по (ж, и) равномерно
по t Если свободная система (4.45) имеет глобально экспоненциально устой
чивую точку равновесия в начале координат, то система (4.44) устойчива по
входу-состоянию.
ДОКАЗАТЕЛЬСТВО. Рассмотрим систему (4.44) как возмущение свободной
системы (4.45). Из обратной теоремы Ляпунова 4.14 следует, что для свободной
системы (4.45) существует функция Ляпунова V(t,x), глобально удовлетворяю
щая неравенствам из теоремы. Поскольку функция / имеет свойство равномер
ной глобальной липшицевости, член возмущения удовлетворяет (4.46) для всех
t ^ to и (х,и). Производная V вдоль решений системы (4.44) удовлетворяет
оценке
V=^
+ ^f(t,x,u)
+
^[f(t,x,u)-f(t,x,0)}<
^-с3\\х\\
2
+ c4\\x\\L\\u\\.
Для того чтобы обеспечить доминирование члена —сз||ж||
2
над членом C4||x||L||u||
при больших \\х\\, перепишем предыдущее неравенство в следующем виде:
ν ^ -с3(1 - 0)|N|2
-
сз0|М|2
+ CHIMIN!,
где0<θ<1.Тогда
с4Ц\и\\
У^-с3(1-в)\\х\\^
V||x||>
с3е
для всех (t,x,u). Следовательно, условия теоремы 4.19 выполнены с ai(r) =
= с\г
2
,
с*2(г) = С2Г2 и p(r) = (c^L/c^r,
и мы можем заключить, что система
устойчива по входу-состоянию с η(τ) = yJoijc\ (c^L/c^r.
Π
Согласно лемме 4.6 для устойчивости по входу-состоянию требуется гло
бальная липшицевость функции / и экспоненциальная устойчивость начала
координат свободной системы. Легко построить примеры, показывающие, что
утверждение леммы не выполняется в условиях отсутствия одного из этих усло
вий. Рассмотренное ранее уравнение х = —За: + (1 -Ь х
2
)и не удовлетворяет
условию глобальной липшицевости. В системе
+и= f(x,u)
1+х
2
функция / является глобально липшицевой, т. к. частные производные / по х и и
глобально ограничены. Начало координат х = —х/(1 + х
2
) глобально асимпто
тически устойчиво, и это может быть доказано с использованием функции Ля
пунова V(x) = х
2
/2, производная которой v(x) = —х
2
/(1+ж
2
) является отри
цательно определенной функцией для всех х. Начало координат этой системы
188
ГЛАВА 4
локально экспоненциально устойчиво, поскольку ее линеаризация в окрестности
начала координат имеет вид х = —х. Однако она не является глобально экспо
ненциально устойчивой. Справедливость последнего утверждения легко доказать
с учетом того, что эта система не является устойчивой по входу-состоянию. За
метим, что /(х,п) ^ 1/2 при u(t) = 1. Следовательно, x(t) ^ x(to) 4-t/2 для
всех t ^ 0, т. е решение не ограничено.
Тем не менее при отсутствии свойств экспоненциальной устойчивости на
чала координат и глобальной липшицевости правой части системы оказывается
возможным доказать устойчивость системы по входу-состоянию в случаях, когда
применима теорема 4.19. Рассмотрим три примера, которые иллюстрируют это
утверждение.
Пример 4.25. Система
х=—х
3
+и
имеет глобально асимптотически устойчивое начало координат при и = 0. Пусть
V=х
2
/2. Тогда производная этой функции вдоль решений уравнения определя
ется равенством
(\ |\1/3
V=-х
4
+хи=-(1-в)х
4
-
вх
4
+хи^ -(1-0)х
4
,
У|ж| > (γ)
,
где 0 < θ < 1. Таким образом, система устойчива по входу-состоянию с η(τ) =
= (Г /0)Х/3.
Д
Пример 4.26. Система
х=/(ж,и)=-х- 2х
3
+(1+х
2
)и
2
имеет глобально экспоненциально устойчивое начало координат при и = 0, но
лемма 4.6 неприменима, т.к. / не является глобально липшицевой. Пусть V =
=х
2
/2. Тогда
V=-х
2
-
2х
4
+х(1+х
2
)и
2
^-х
4
,
V\х\^ и
2
.
Таким образом, система устойчива по входу-состоянию с η(ν) = г
2
.
Δ
В примерах 4.25 и 4.26 функция V(x) = х
2
/2 удовлетворяет (4.48) с а\(г) =
=®2(г)=г
2
/2. Следовательно, (х[
1
(а2(г)) = г и 7(f) сводится к р(г). В систе
мах большой размерности вычисление 7 представляет определенные трудности.
Пример 4.27. Рассмотрим систему
Х\= —Х\+ х\,
#2= -#2+г*.
Положим W = 0H докажем глобальную асимптотическую устойчивость начала
координат свободной системы. Используя
V(x) =hi +\ах
4
2, а>0
4.9. Устойчивость СИСТЕМ по входу-состоянию
189
в качестве функции Ляпунова, получаем
V=-х\ +х\х\-ах\=-{xi - ^xf)2
-
(α - ±)я2.
При а > 1/4 начало координат глобально асимптотически устойчиво. Предпо
ложим, что и ^ 0, и используем функцию V(x) с а = 1 в качестве функции
Ляпунова для теоремы 4.19. Производная V определяется равенством
V= -|(xi - х\? - \{х\ +xi)+х%и< -\{х{ +xi)+ \x2f\u\-
Для того чтобы обеспечить доминирование члена —{х\ + #2)/2 над членом
|х2|
3
|гл|, перепишем предыдущее неравенство в следующем виде:
V<-1(1-в){х\+х\)-\в{х\ +х\)+|*2|
3
М,
где0<θ<1.Член
-i0(x? + 4) + |x2|
3
H
будет ^ 0, если |х2| ^ 2\и\/в или |х2| ^ 2|и|/0 и |a?i| ^ (2|it|/0)2
. Это требование
будет выполнено, если
г.IIn
f2М
(*Н\2
max{|xi|,\х2\}>max<—, I — I
Используя норму ||ж||оо — max{|a:i|, |x2|} и определив /С-функцию ρ равенством
p[r)=maxIу
•(1)Т
получаем, что неравенство (4.49) выполнено, поскольку
У^ -1(1- в){х\ +х\), VЦхЦоо^ р(Н).
Выполнение неравенства (4.48) следует из леммы 4.3, т. к. V(х) является поло
жительно определенной и радиально неограниченной. Следовательно, система
устойчива по входу-состоянию. Предположим, что нам необходимо найти /С-
функцию 7· В этом случае нам следует определить а\ и а2. Легко показать,
что
V{x)^\x\ + \xi^\\\x\\l0 + \\\x\L·
л·> лл. i51Ж1
12=
5W~'
если
Ы<Ы,
ПХ)=И +И>
,,4πΠ4
li'
X2
'
illxlloo'
если
F2| ^ Fi|.
190
ГЛАВА 4
Неравенство (4.48) выполнено с /Соо-функциями
ai(r) = min{ir
2
,|г
4
} и а2(г) =|г
2
+\г
4
.
Таким образом, η(ν) = a^
1
(a2(p(r))), где
ajf1(«)= \ (45
^'
если
s
^^
если 5>1.
Функция 7 зависит от выбора ||ж||. Если мы выберем другую р-норму, мы полу
чим другую 7·
Δ
Интересным применением концепции устойчивости по входу-состоянию яв
ляется анализ устойчивости каскадной системы
х\ = /1(*,Ж1,ж2),
(4.51)
*2 = /2(*,Я2),
(4.52)
где/i :[0,оо)хR
ni
хR
n2
-> i?
ni
и/2:[0,оо)хR
n2
->Д
П2
-
кусочно-
Ж1
непрерывные по t и локально липшицевые по х =
жим, что системы
*i = /i(*5a?i,0)
#2
функции. Предполо-
и (4.52) имеют глобально равномерно асимптотически устойчивые точки рав
новесия в их началах координат. При каких условиях начало координат х = 0
каскадной системы обладает тем же свойством? В следующей лемме показано,
что это будет иметь место, если система (4.51) с вектором х2, рассматриваемым
как ее вход, является устойчивой по входу-состоянию.
Лемма 4.7. В условиях принятых предположений, если система (4.51)
с вектором х2, рассматриваемым как ее вход, является устойчивой по входу-
состоянию и начало координат (4.52) глобально равномерно асимптотически
устойчиво, то начало координат каскадной системы (4.51) и (4.52) глобально
равномерно асимптотически устойчиво.
ДОКАЗАТЕЛЬСТВО. Пусть to > 0 — начальный момент времени. Реше
ния (4.51) и (4.52) глобально удовлетворяют неравенствам
IMOII <&(||*i(«)||,t-e)+7l ( s"P Ν(τ)||Υ
(4.53)
||*2(*)||</%(||*2(«)||,«-а),
(4-54)
4.10. УПРАЖНЕНИЯ
191
где t ^ s ^ £о> /?ъ fe — /С£ -функции и 71 — /С-функция. Неравенство (4.52) при
s = (t + to)/2 принимает следующий вид:
/
1Ы*Ж/?1 XI
t+t0
t-to
+7i
\
sup ||ж2(т)||
t+*o
<т<(
(4.55)
/
Для получения оценки xi((t + <о)/2) положим в (4.53) s = to и заменим t на
(* + *о)/2:
/
Ж1
i+io
<А(||х1(<о)||,Ц^)+71
\
SUp ||Ж2(т)
t0<r<
t+to
(4.56)
Используя (4.54), получаем
sup ||Χ2(τ)Κ/?2(ΙΜ*ο)||,0),
t0^T^ t+t0
sup ||x2(r)||<^f||x2(io)||,L*^\
(4.57)
(4.58)
Подставляя (4.56)-(4.58) в (4.55) и используя неравенства
N(*o)ii < iix(*o)ii, iix2(*o)ii *s ||»(*о)н, 1и*)н < \ыт\ + \ыт,
получаем
\x(t)\\^p(\\x(t0)\\,t-t0),
где
/?(г,«) = β! U (г, §) +7lO%(r,0)), §) +71 (β* (г, £)) +/%(г,в).
Легко проверить, что β принадлежит классу /С£ для всех г ^ 0. Следовательно,
начало координат (4.51) и (4.52) глобально равномерно асимптотически устойчи
во.
Π
4.10. Упражнения
4.1. Рассмотрим автономную систему второго порядка. Для каждого из следую
щих типов точек равновесия определите, является ли она устойчивой, неустой
чивой или асимптотически устойчивой:
192
ГЛАВА 4
(1) устойчивый узел; (2) неустойчивый узел;
(3) устойчивый фокус; (4) неустойчивый фокус;
(5) центр;
(6) седло.
4.2. Рассмотрим скалярное уравнение х = ах
р
+ #(х), где ρ — положительное
число и д(х) удовлетворяет \д(х)\ < fc|x|
p+1
в некоторой окрестности начала
координат х = 0. Покажите, что начало координат асимптотически устойчиво,
если ρ нечетно и а < 0, и неустойчиво, если ρ нечетно и а > 0 или если ρ четно
иа^О.
4.3. Для каждой из следующих систем с использованием квадратичной функции
Ляпунова покажите, что начало координат асимптотически устойчиво:
(1)
Х\= -Х\ +Х\Х2У
Х2=
- %2\
(2) х\=-Х2+xi(l—х\—#!)>
±2=х\- #2(1-х\-#1);
(3) xi=х2(1- х\),
±2 = -(х\ + а?2)(1 - х\)\
(4)
±i = —Х\—Х2>
%2=2^1—х\.
Исследуйте систему на предмет глобальной асимптотической устойчивости.
4.4 ([151]). Уравнения Эйлера вращающегося твердого тела (космического кораб
ля) имеют вид
J\CJ\ = (J2 - *7з)^2^з + wi,
J2U2 = (J3 - Jl)^S^l
+ V>2,
^з^з = («/1 - «/2)^1^2 + ^з,
где a;i, α;2,с^з — проекции вектора угловой скорости ω на главные оси эллипсоида
вращения, ui,U2,us — входные моменты относительно этих осей, Ji, J2, J3 —
главные моменты инерции.
(a) Покажите, что при щ = U2 = щ = 0 начало координат ω = 0 устойчиво.
Является ли оно асимптотически устойчивым?
(b) Предположим, что входные моменты реализуют управляющие обратные свя
зи щ — —kiUi, гдеfci,/θ2, &з — положительные константы. Покажите, что на
чало координат замкнутой системы управления глобально асимптотически
устойчиво.
4.5. Пусть д(х) — отображение из R
n
вR
n
.
Покажите, что д(х) является вектором
градиента скалярной функции V : R
n
—> i?n
, если и только если
4.6. Рассмотрим систему
xi=Х2, Х2= —{х\+хг)-Л(ж1+#2),
где /г — непрерывно дифференцируемая функция и 2/1(2) > 0 для всех z Φ 0.
Используя метод переменного градиента, найдите функцию Ляпунова, с помо
щью которой можно показать, что начало координат глобально асимптотически
устойчиво.
4.10. УПРАЖНЕНИЯ
193
4.7. Рассмотрим систему х — —С2ф(х)9 где Q — симметричная положительно
определенная матрица и ф(х) — непрерывно дифференцируемая функция, г-й
компонент которой зависит только от х^, т.е. ф%(х) = ф%(х%). Предположим, что
фг(0)=0иуфг(у)>0внекоторойокрестностиу=0длявсех1^ г^ п.
(a) Используя метод переменного градиента, найдите функцию Ляпунова, с по
мощью которой можно показать, что начало координат асимптотически
устойчиво.
(b) При каких условиях оно будет глобально асимптотически устойчиво?
(c) Примените полученные результаты к частному случаю
η=2,фг(х1)=xi- х\, Ф2Ы)=Х2+xh Q=
4.8 ([72]). Рассмотрим систему второго порядка
-
6xi
XI
+ 2х2,
Х2
2(xi+x2)
No
U
гдеи=1+х\.ПустьV(x) =Xi/(1+х\)+ х\.
(a)Покажите,чтоV(x) >0иУ(х)<0длявсеххGR2
-
{0}.
(b) Рассмотрим гиперболу х2 = 2/(xi — у/2). Исследовав векторное поле на
границе этой гиперболы, покажите, что траектории справа от ветки этой
гиперболы в первом квадранте не могут пересечь эту ветку.
(c) Покажите, что начало координат не является глобально асимптотически
устойчивым.
Указание: в (Ь) покажите, что на линии гиперболы выполнено Х2/Х1 = —1/(1 +
+ 2\/2xi + 2x\), и сравните эту величину с тангенсом угла наклона касательных
к этой гиперболе.
4.9. При проверке условия радиальной неограниченности положительно опре
деленной функции V(x) может показаться, что достаточно выполнить соответ
ствующий анализ при ||х|| —• оо вдоль координатных осей. Однако этот подход
ошибочный, и это можно доказать на примере функции
(xi + х2)
2
v(x) =
у
;' "λ2+(xi-Χ*?.
1+(xi4-Х2)
0.
(a) Покажите, что V{x)-+ 00 при ||ж||—> оо вдоль осей х\ = 0 и Х2
(b) Покажите, что V(x) не является радиально неограниченной.
4.10 (метод Красовского). Рассмотрим систему х = /(х), /(0) = 0. Предполо
жим, что /(х) непрерывно дифференцируема и ее якобиан удовлетворяет нера
венству
лТ
Тх
{х) + дх~
{х) P^-I,
\/x£Rn
,
гдеР=Р
т
>0.
194
ГЛАВА 4
(a) Используя представление f(x) = J0 -^-(ах)х da, покажите, что
x
T
Pf(x) + f
T
(x)Px ^ -x
T
x,
VzеR
n
.
(b) Покажите, что функция V(x) = f
T
(x)Pf(x)
положительно определена для
всеххеR
n
и радиально неограниченна.
(c) Покажите, что начало координат глобально асимптотически устойчиво.
4.11. С использованием теоремы 4.3 докажите первую теорему Ляпунова
о неустойчивости.
Рассмотрим систему (4.1). Если может быть найдена непрерывно дифферен
цируемая функция Vi(x), определенная в окрестности начала координат и такая,
что V\ (0) = 0 и функция V\ положительно определена вдоль траекторий систе
мы, но сама функция V\ не является отрицательно определенной или отрица
тельно полуопределенной в произвольно малой окрестности начала координат,
то начало координат неустойчиво.
4.12. С использованием теоремы 4.3 докажите вторую теорему Ляпунова о не
устойчивости.
Рассмотрим систему (4.1). Если в окрестности D начала координат су
ществует непрерывно дифференцируемая функция V\(x), такая что Vi(0) = 0
и вдоль траекторий системы функция V\ представима в виде V\ = XVi + W(x),
где λ > 0 и W(x) ^ 0 в D, и если функция V\ не является отрицательно опреде
ленной или отрицательно полуопределенной в произвольно малой окрестности
начала координат, то начало координат неустойчиво.
4.13. Для каждой из следующих систем покажите, что начало координат неустой
чиво:
(1)
Xi=x\ + Х\Х2,
#2= —Х2+
х
\+
X
lX2 ~
Х
Ь
(2)
Х\= -х\ +Х2,
±2=х\-
х\.
Указание: в примере (2) покажите, что Г = {0<Х1^1}П {х2 > х\} П {х2 <
^
х
\} ~~ непустое положительно инвариантное множество, и исследуйте поведе
ние траекторий внутри Г.
4.14. Рассмотрим систему
xi = х2, ^2 = -g(xi)(xi + я2),
где д — локально липшицева и д(у) ^ 1 для всех у G R. Проверьте, что функция
V(x) = JQ1 yg(y) dy + x\X2 + х\ положительно определена для всех х £ R2
и радиально неограниченна. Используйте эту функцию для доказательства гло
бальной асимптотической устойчивости начала координат.
4.15. Рассмотрим систему
xi = х2, ±2 = -hi(xi) -Х2- h2(xs), х3 = Х2~ #з>
где h\ и /i2 — локально липшицевые функции, такие что Ы(0) = 0 и yhi(y) > 0
длявсехуφ0.
4.10. УПРАЖНЕНИЯ
195
(a) Покажите, что система имеет единственную точку равновесия в начале ко
ординат.
(b) Покажите, что V(x) = J^
1
hi(y) dy + x\/2 + f£3 /12(2/) dy положительно
определена для всех х £ Д3
.
(c) Покажите, что начало координат асимптотически устойчиво.
(d) При каких условиях на h\ и h2 начало координат глобально асимптотически
устойчиво.
4.16. Покажите, что начало координат системы
Х\=Х2,
Х2= —х\
—х\
глобально асимптотически устойчиво.
4.17 ([77]). Рассмотрим уравнение Льенара
У+h(y)y+д(у)=0,
где д и h — непрерывно дифференцируемые функции.
(a) Используя обозначения х\ = у и х2 = у, выпишите уравнения состояния
и найдите условия на д и h, гарантирующие то, что начало координат явля
ется изолированной точкой равновесия.
(b) Используя функцию Ляпунова V(x) = /Q
Xl
g(y) dy + (1/2)а?2, найдите усло
вия на д и /г, гарантирующие то, что начало координат является асимптоти
чески устойчивым.
(c) Решите задачу (Ь) при V{x) = (1/2)[х2 + f*
1
h(y) dy]2
+J*
1
g(y) dy.
4.18. Модель системы «груз-пружина» из упражнения 1.12 имеет вид
Му = Мд-ку-
с\у - с2у\у\.
Покажите, что система имеет глобально асимптотически устойчивую точку рав
новесия.
4.19. Рассмотрим уравнения движения m-звенного манипулятора, описанного
в упражнении 1.4. Предположим, что P(q) — положительно определенная функ
ция от q и g(q) = 0 имеет изолированный корень в q = 0.
(a) В случае и = 0, используя полную энергию V(q,q) = ~q
T
M(q)q + P(q)
в качестве функции Ляпунова, покажите, что начало координат (q = 0, q =
= 0) устойчиво.
(b) В случае и = —К^ где К^ — положительная диагональная матрица, пока
жите, что начало координат асимптотически устойчиво.
(c) В случае и = g(q) — Kp(q — q*) — K^q, где Кр и Kd — положительные диа
гональные матрицы и q* — желаемое расположение корней в R
m
, покажите,
что точка (q = g*, q = 0) — асимптотически устойчивая точка равновесия.
196
ГЛАВА 4
4.20. Предположим, что множество Μ в теореме Ла-Салля состоит из конечно
го числа изолированных точек. Покажите, что lim^oo x(t) существует и равен
одной из этих точек.
4.21 ([81]). Градиентной системой является динамическая система вида х —
= -VV(aj), где VV(ar) = [dV/dx]
T
nV:DcR
n
^R
—
дважды непрерывно
дифференцируемая функция.
(a)Покажите,чтоV(x) ^0длявсехх £DиV(x) =0,еслиитолькоеслих
является точкой равновесия.
(b)ПустьD=R
n
и предположим, что множество Ω0 = {х £ Rn \ V(x) ^ с}
компактно для любой с £ R. Покажите, что все решения системы определе
ныдлявсехt^0.
(c) В условиях предположений пункта (Ь) и при W(x) φ 0 за исключени
ем конечного числа точек р\,...,
рг покажите, что для любого решения
lim^oo x(t) существует и совпадает с одной из точек pi,... ,рг-
4.22. Рассмотрим уравнение Ляпунова РА + А
Т
Р=—С
Т
С, где пара (Л, С)
наблюдаемая. Покажите, что матрица А является гурвицевой, если и только ес
ли существует Ρ = Р
т
> 0, удовлетворяющая этому уравнению. Кроме того,
покажите, что если А гурвицева, то уравнение Ляпунова имеет единственное
решение.
Указание: примените теорему Ла-Салля и примите во внимание, что для
наблюдаемой пары (А, С) вектор Cexp(At)x = 0, Vi, если и только если х = 0.
4.23. Рассмотрим линейную систему х = (А — BR~
1
BTP)x, гдеΡ=Р
т
>0
удовлетворяет уравнению Риккати
РА+А
Т
Р+Q-PBR~
1
BTP =0,
гдеR=R
T
>0иQ=Q
T
^ 0. Используя функцию Ляпунова V(x) = x
T
Px,
покажите, что начало координат глобально асимптотически устойчиво в случаях
(1)Q>0.
(2)Q=С
Т
С и (А, С) наблюдаема; см. указание в упражнении 4.22.
4.24. Рассмотрим систему
42
х = /(ж) - kG(x)R-
1
(x)GT(x)
где V(x) — непрерывно дифференцируемая, положительно определенная функ
ция, удовлетворяющая уравнению Гамильтона-Якоби-Беллмана
f/м
+
«м-If"Μ*"
1
w°
T
w(f)' -°·
42
Это уравнение представляет собой замкнутую систему оптимального стабилизирующего
управления. См. [172].
dvX
дх
4.10. УПРАЖНЕНИЯ
197
где q(x) положительно полуопределенная функция, R(x) — положительно опре
деленная матрица и к — положительная константа. Используя V(x) в качестве
функции Ляпунова, докажите асимптотическую устойчивость начала координат
в случаях:
(1) q(x) — положительно определена и к > 1/4;
(2) q(x) — положительно определена, к ^ 1/4, и единственное решение урав
нения х = f(x), постоянно находящееся в множестве {q(x) = 0}, является
тривиальным решением x(t) = 0.
При каких условиях начало координат будет глобально асимптотически устойчи
вым?
4.25. Рассмотрим линейную систему х = Ах 4- Ви, где пара (А, В) управляе
ма.ПустьW=/0
r
е~
м
ВВт
е~
А
г
dt для некоторого τ > 0. Покажите, что W
положительно определена. Пусть К = B
T
W~
l
.
Используя для анализа системы
х = (А — ВК)х функцию Ляпунова V(x) — x
T
W~
1
x9 докажите гурвицевость
матрицы (А — В К).
4.26. Пустьх = f(x), где/ :R
n
—>R
n
.
Рассмотрим замену координат z = Т(х),
гдеГ(0)=0иΤ :R
n
—>R
n
—
диффеоморфизм в окрестности начала коорди
нат (т.е. существует обратное отображение Т
_1
()иТ(), Т
_1
() — непрерывно
дифференцируемы). Преобразованная система имеет вид
i = /(*), где
f(z)=2gf(x)
(a) Докажите, что точка х — 0 является изолированной точкой равновесия х =
=
/(ж), если и только если z = 0 является изолированной точкой равновесия
z = f(z).
(b) Докажите, что точка равновесия х — 0 является устойчивой (асимптоти
чески устойчивой или неустойчивой), если и только если z = 0 является
устойчивой (асимптотически устойчивой или неустойчивой) точкой равно
весия.
4.27. Рассмотрим систему
Х\= -Ж2#3+1, #2=Я1#3-Х2) #3=Хг(1~
Ж
з)·
(a) Покажите, что система имеет единственную точку равновесия.
(b) Используя метод линеаризации, покажите, что точка равновесия асимптоти
чески устойчива. Является ли она глобально асимптотически устойчивой?
4.28. Рассмотрим систему
Х\—
-Xi, X2=(Х\Х2-1)#2+(siE2-1+ х\)х2-
(a) Покажите, что х = 0 — единственная точка равновесия системы.
(b) Используя метод линеаризации, покажите, что х = 0 асимптотически устой
чива.
198
ГЛАВА 4
(c) Покажите, что Г = {х G В? \ х\Х2 ^ 2} — положительно инвариантное
множество.
(d) Является ли точка х = 0 глобально асимптотически устойчивой?
4.29. Рассмотрим систему
Х\= Х\— х\+ #2, Х2=3X1—#2·
(a) Найдите все точки равновесия системы.
(b) Используя метод линеаризации, исследуйте свойства устойчивости всех то
чек равновесия.
(c) Используя квадратичные функции Ляпунова, оцените область притяжения
каждой асимптотически устойчивой точки равновесия. Попытайтесь полу
чить как можно большие оценки.
(d) Постройте фазовый портрет системы и укажите на нем области притяжения,
а также их оценки.
4.30. Повторите предыдущее упражнение для системы
1. (кхЛ
,
·
1, /тпг2
XI= -- tgI— 1+Ж2,
Ж2=Я1-2tg( —
4.31. Применяя метод линеаризации к каждой из систем упражнения 4.3, дока
жите асимптотическую устойчивость начала координат.
4.32. Для каждой из нижеследующих систем исследуйте свойства устойчивости
начала координат:
(1)±i= -xi +х\,
(2)xi=х2,
#2= —Х2+х%
±2 = — sinx3 + xi[-2x3 - sat(y)]2
,
хз = хз~х\,
хз = -2хз - sat(у),
гдеу= -2xi -5x2+2х3,
(3)xi= -2xi+х\,
(4) xi = -xi,
Х2= —Х2+ Х\,
Х2 = —Х\ — Х2- ХЪ~ Х\ХЪ->
хъ = -хз,
хз = (xi +1)^2-
4.33. Рассмотрим систему второго порядка х = /(х), где /(0) =0и f(x) — два
жды непрерывно дифференцируемая в некоторой окрестности начала координат.
Предположим [df/dx](0) = — В, где В — гурвицева матрица. Пусть Р — положи
тельно определенное решение уравнения Ляпунова РВ + В
Т
Р=—IиV(x)=
=х
т
Рх. Покажите, что существует с* > 0, такая что для каждой 0 < с < с*
поверхность V(x) = с замкнута и [dV/dx]f(x) > 0 для всех х Ε {V(x) = с}.
4.34. Докажите лемму 4.2.
4.35. Предположим, что функция а принадлежит классу /С и задана на [0, а).
Покажите, что
α(η +г2) < α(2η) + а(2г2), Угъг2 € [0,а/2).
4.10. УПРАЖНЕНИЯ
199
4.36. Является ли нуль равномерно асимптотически устойчивой точкой равнове
сия скалярного уравнения х = —х/(1 + t), t > 0.
4.37. С использованием квадратичных функций Ляпунова покажите для каждой
из нижеследующих систем, что начало координат экспоненциально устойчиво:
(1) х
(3) х
-1
«(*)
0
-1
<*(*)!
-2J
1
-<*(*) J
х, \a{t)\ ^ 1,
x,a(t)^2,
(2)i =
(4)i =
Γ-1
a(t)
[ <*(<) -2
Γ-1 0
L«(*) -
2x.
Во всех случаях a(t) — непрерывная и ограниченная для всех t ^ 0 функция.
4.38 ([95]). Модель RLC-цепи с элементами, характеристики которых зависят от
времени, имеет следующий вид:
1
.
1
R(t)
xi=
m
X2
'
Х2=
~сщ
Х1
~т
Х2
-
Предположим, что L(£), C(t) и R(t) — непрерывно дифференцируемы и удо
влетворяют неравенствам к\ ^ L(t) ^ &2, k% ^ C(t) ^ /^4 и /05 ^ R(t) ^ &б,
где fci, /сз и &5 — положительные константы. Рассмотрим кандидата на функцию
Ляпунова
V(t9x) = R(t) +
2L(t)
x\ + 2xix2 + ^7-rxl.
K(t)
R(t)C(t)
(a) Покажите, что V(t, ж) — положительно определенная и убывающая функция.
(b) Определите условия на L(t), C(t) и R(t), гарантирующие экспоненциаль
ную устойчивость начала координат.
4.39 ([154]). Уравнения маятника с зависящим от времени трением имеют следу
ющий вид:
±1=Х2у
±2 = - sinxi - g(t)x2>
Предположим, что g(t) непрерывно дифференцируема и удовлетворяет неравен
ствам
0<а<а<g(t)<β<оо и g(t)^7^
2
для всех t > 0. Рассмотрим кандидата на функцию Ляпунова
V(t,x) = ^(asinxi +X2)2
+[1+o,g(t)—a
2
](l — cosxi).
(a) Покажите, что V(t,x)— положительно определенная и убывающая функция.
(b) Покажите, что V < -(a-a)x2-a(2-^)(l-cosxi)-\ -0(\\x\\
3
),
где 0(||х||
3
)—
член, ограниченный в некоторой окрестности начала координат величиной
к\\х\\\
(c) Покажите, что начало координат равномерно асимптотически устойчиво.
200
ГЛАВА 4
4.40 (теория Флоке). Рассмотрим линейную систему х = A(t)x, где A(t) =
= A(t+Τ).
43
Пусть Ф(·,·)
—
передаточная матрица. Определим постоянную
матрицу В уравнением ехр(ВТ) = Ф(Т,0) и положим P(t) = ехр(Б£)Ф(0,£).
Покажите, что
(a) P(t+T)= P(t).
(b) Ф(*,т) = p-HOexpKt - т)В]Р(т).
(c) Начало координат х = A(t)x экспоненциально устойчиво, если и только
если В — гурвицева матрица.
4.41. Рассмотрим систему
Х\—Х2У
Х2=2Х\Х2+St+2—3^1—2(£+1)Ж2-
(а) Покажите, что x\(t) = t, X2(i) = 1 — решение системы.
0
(Ь) Покажите, что если х(0) достаточно близко к
, то x(t) стремится
при £—> оо.
4.42. Рассмотрим систему
х = —a[In4-S(x) + хх
т
]х,
где а — положительная константа, 1п — η х η-единичная матрица и S(x) — ко-
сосимметричная матрица, зависящая от х. Докажите, что начало координат гло
бально экспоненциально устойчиво.
4.43. Рассмотрим систему х = f(x) + G(x)u. Предположим, что существует по
ложительно определенная симметричная матрица Р, положительно полуопреде
ленная функция W(x) и положительные константы j и σ, такие что
2x
T
Pf(x) + ΙΧΤΡΧ + W(x) - 2ax
T
PG(x)GT(x)Px < 0, Ухе R
n
.
Покажите, что при и = —aG
T
(x)Px замкнутая система имеет глобально экспо
ненциально устойчивую точку равновесия в начале координат.
4.44. Рассмотрим систему
Х\= —Х\+Х2+{х\+Х2)Sin£, ±2= —Х\—Х2+{х\+х|)cos
*·
Покажите, что начало координат экспоненциально устойчиво, и оцените область
притяжения.
4.45. Рассмотрим систему
XI = h(t)x2 - g(i)x\, ±2 = -h(t)xi - g(t)xl,
где h{t) и g(t) — ограниченные, непрерывно дифференцируемые функции
иg(t)^к>Одлявсехt^0.
(а) Является ли точка равновесия ж = 0 равномерно асимптотически устойчи
вой?
3
Всеобъемлющее изложение теории Флоке (Floquet) приведено в [158].
4.10. УПРАЖНЕНИЯ
201
(b) Является ли она экспоненциально устойчивой?
(c) Является ли она глобально равномерно асимптотически устойчивой?
(d) Является ли она глобально экспоненциально устойчивой?
4.46. Покажите, что начало координат системы
Х\= —Х2—#l(l—х\—ж!)?
Х2=%\—#2(1—
х
\-
x
i)
асимптотически устойчиво. Является ли оно экспоненциально устойчивым?
4.47. Рассмотрим систему
xi = —ф(Ь)х1 + a(j)(t)x2, X2 = b(t)(t)x\ - ab4>{t)x2 — сф(Ь)х%,
где α, бис — положительные константы, ф{€) и ψ({) — неотрицательные, непре
рывные, ограниченные функции, удовлетворяющие
Ф(г)>фо>о, i>(t)^Vo>о, vt^о.
Покажите, что начало координат глобально равномерно асимптотически устой
чиво. Является ли оно экспоненциально устойчивым?
4.48. Рассмотрим две системы х = f(x) и х = h(x)f(x), где / : R
n
—>R
n
и где
h:R
n
—•R
n
—
непрерывно дифференцируемые функции, такие что /(0) = 0
и h(0) > 0. Покажите, что начало координат первой системы экспоненциально
устойчиво, если и только если начало координат второй системы экспоненциаль
но устойчиво.
4.49. Покажите, что система
х\ = -ах\ +6,
±2 = -сх2 + хг(а - /Заяжг),
где все коэффициенты положительны, имеет глобально экспоненциально устой
чивую точку равновесия.
Указание: используя замену координат, сместите точку равновесия в начало
координат и используйте V = к\у\+fc22/2+
fc
32/i> где (2/1,2/2) — новые координаты.
4.50. Рассмотрим систему
x = f(t,x), /М)=0,
где функция [df/dx] является ограниченной и липшицевой по х в окрестности
начала координат равномерно по t для всех t > to ^ 0. Предположим, что начало
координат х = 0 линеаризованной системы экспоненциально устойчиво и реше
ния системы удовлетворяют
Mt)\\^P(\\x(to)lt-to), V^to^O, V||a;(io)|| <c
(4.59)
для некоторой /С£-функции β и некоторой положительной константы с.
(а) Покажите, что существуют /С-функция а и положительная константа 7, та
кая что
||*(*)|| < а(|И*о)||)ехр[-7(*-*о)], V* > *,, V||x(i0)|| < с.
202
ГЛАВА 4
(b) Покажите, что существует положительная константа М, возможно, завися
щая от с, такая что
\\x(t)\\^M\\x(t0)\\exp[->Y(t-to)],
V^*o, V||x(t0)|| < с.
(4.60)
(c) Если неравенство (4.59) выполняется глобально, можно ли обеспечить гло
бальное выполнение неравенства (4.60)?
4.51. Предположим, что условия теоремы 4.18 выполнены с ai(r) = kir
a
,
0i2(r) = &2Γα и W(x) ^ &з||х||
а
, где &ъ&2,&з и а — некоторые положитель
ные константы. Покажите, что (4.42) и (4.43) выполнены с /?(r, s) = кг exp(-^s)
иα^
1
(α2(μ)) = Ημ9 где к = {k2/ki)l/a
и 7 = кз/(к2а).
4.52. Рассмотрим теорему 4.18 при V(t,x) = V{x) и предположим, что неравен
ство (4.40) заменено на следующее:
§£/(*,*) < -И^з(ж), VW4(x) ^ μ > 0,
где 1Уз(#) и И^4(#) — некоторые положительно определенные, непрерывные
функции. Покажите, что (4.42) и (4.43) выполнены для любого начального со
стояния x(to) Ε {V(x) ^ с} С D при условии, что множество {V(x) ^ с}
компактно и т&хуу^^ V(x) < с.
4.53 ([72]). Рассмотрим систему х = f(t,x) и предположим, что существует
функция V(t,x), удовлетворяющая
а£
+
|£/(
''
ж)<0
'
v
NI>
r
i>
r
>
где W\(x) и И^О^) — положительно определенные, непрерывные функции. По
кажите, что решения системы равномерно ограничены.
Указание: заметим, что функция V(t, x) может не быть положительно опре
деленной.
4.54. Для каждой из нижеследующих скалярных систем выполните исследование
свойств устойчивости по входу-состоянию:
(1) х=-(1+и)ж
3
,
(2) х=-(1+и)х
3
-х
5
,
(3) х= —х+х
2
и,
(4) х—х
—
х
3
+и.
4.55. Для каждой из нижеследующих систем выполните исследование свойств
устойчивости по входу-состоянию:
(1) Xi = -Х\ -\-х\х2,
Х2 = -х\-Х2
+и,
(2) Х\—
-Xi + Ж2,
Х2= —х\ - X2+U,
(3) Х\=Х2,
±2 = ~х\-X2
+U,
(4) ±i=(xi-Х2+гх)(х?-1), ±2=(х\+Х2+и){х\ -1),
4.10. УПРАЖНЕНИЯ
203
(5) Х\= —Х\+Х\Х2,
Х2= —#2+Ж1+П,
(6) Х\= -Х\-Х2+Щ, ±2=Х\-х\+U2,
(7) Х\= -Х\+Х2>
Х2= -Х\-&{Х\)-Х2+U,
где σ — локально липшицевая функция, σ(0) — 0 и уа(у) > 0 для всех у φ 0.
4.56. Используя лемму 4.7, покажите, что начало координат системы
Х\= -х\ +Х2, Х2= —х\
глобально асимптотически устойчиво.
4.57. Докажите версию теоремы 4.19, отличающуюся от оригинальной теоремы
тем, что неравенство (4.19) заменено на
^ + ^/(i,x,„)^-a3(|N|) + V(«),
где функция аз принадлежит классу /Соо и φ (и) — непрерывная функция от и,
такая что -0(0) = 0.
4.58. Используя неравенство (4.47), покажите, что если u(t) сходится к нулю при
£-> оо, то x(t) обладает тем же свойством.
4.59. Рассмотрим скалярное уравнение х= — х
3
+ е~*. Покажите, что x(t) —> О
при £—> оо.
4.60. Предположим, что условия теоремы 4.19 выполнены для ||ж||<ги||гб||<ги
с /С-функциями ai и а2, которые не обязательно должны принадлежать клас
су /Соо- Покажите, что существуют положительные константы к\ и &2, такие что
неравенство (4.47) выполнено при ||ж(£о)|| <М supt^io ||гл(£)|| < &2- В этом
случае система называется локально устойчивой по входу-состоянию.
4.61. Рассмотрим систему
х\= х\{ sin(—^-)\ -1>,
±2= -Х2+и.
(a) При и = О покажите, что начало координат глобально асимптотически
устойчиво.
(b) Покажите, что при любом ограниченном входе u(t)9 состояние x(t) ограни
чено.
(c) При u(t) = 1, х\(0) = α и ^(0) = 1 покажите, что решение имеет вид
xi(t) = a, X2(t) = 1.
(d) Является ли эта система устойчивой по входу-состоянию?
В следующих семи упражнениях рассматриваются дискретные по времени
44
динамические системы^
x(k + l) = f(x(k)), /(0) = 0.
(4.61)
Скорость изменения скалярной функции V(х) вдоль траектории (4.61) определя
ется равенством
AV(x) = V(f(x))-V(x).
^Теория устойчивости Ляпунова для дискретных по времени динамических систем детально
изложена в работе [95].
204
ГЛАВА 4
4.62. Переформулируйте определение 4.1 для дискретной системы (4.61).
4.63. Покажите, что начало координат (4.61) устойчиво, если в окрестности на
чала координат существует непрерывная положительно определенная функция
V(x), такая что AV(x) отрицательно полуопределена. Покажите, что эта система
асимптотически устойчива, если эта функция AV(x) отрицательно определена.
Наконец, покажите, что начало координат глобально асимптотически устойчи
во, если условия асимптотической устойчивости выполняются глобально и V(x)
радиально неограниченна.
4.64. Покажите, что начало координат (4.61) экспоненциально устойчиво, если
в окрестности начала координат существует непрерывная положительно опреде
ленная функция V(x), такая что
cilMI2
^ V(x) < с2||х||
2
,
AV(x) ^ -с3||*||
2
,
где с\, С2 и сз — некоторые положительные константы.
Указание: для дискретных по времени систем свойство экспоненциальной
устойчивости определяется выполнением неравенства ||х(£)|| ^ a||#(0)||7fe
для
всех к ^ 0, где а^1и0<7<1·
4.65. Покажите, что начало координат (4.61) асимптотически устойчиво, если
в окрестности начала координат существует непрерывная положительно опреде
ленная функция V(x)9 такая что AV(x) отрицательно полуопределена и AV(x)
не равна тождественно нулю для всех х φ 0.
4.66. Рассмотрим линейную систему x(k+l) = Ax(k). Покажите, что следующие
утверждения эквивалентны:
(1) Точка х = 0 асимптотически устойчива.
(2) |Ai| < 1 для всех собственных значений А.
(3)ДлялюбойQ=Q
T
существует Ρ = Р
т
> 0, являющаяся единственным
решением линейного уравнения А
Т
РА —Ρ
—
—Q.
4.67. Пусть А — матрица линеаризованной в окрестности начала координат си
стемы для (4.61), т. е. А = [df/dx](0). Покажите, что начало координат асимпто
тически устойчиво, если модуль всех собственных значений А меньше единицы.
4.68. Пусть х — 0
—
точка равновесия нелинейной дискретной по времени си
стемых(к+1)=f(x(k)), где/ :D—>R
n
—
непрерывно дифференцируемая
функция иD ={хΕRn |||а:|| < г}.Пусть С,7 < 1иго—положительные
константы и го < г/С. Пусть Do = {х Ε Rn | ||х|| < го}. Предположим, что
решения системы удовлетворяют
||x(fc)|| ^ С||х(0)||т*, Vx(0) Ε D0, Vfc ^ 0.
Покажите, что существует функция V : Do —* R, удовлетворяющая
C1\\X\\2
<!V(X)4:C2\\X\\2
,
AV(x) =
V(f(x))-V(x)^-c3\\xf,
\V(x)-V(y)\^c4\\x-y\\(\\x\\
+ \\y\\)
для всех х, у Ε DQ и некоторых положительных констант ci, C2, сз и с±.
ГЛАВА 5
Устойчивость в терминах «вход-выход»
В этой книге мы в основном используем подход пространства-состояния
для моделирования нелинейных динамических систем и уделяем большое вни
мание исследованию поведения переменных состояния. Однако существует аль
тернативный подход к математическому моделированию динамических систем —
подход «вход-выход»
1
. Модель «вход-выход» связывает вход системы непосред
ственно с ее выходом? и это реализуется без явного знания внутренней струк
туры системы, определяемой уравнением состояния. Система рассматривается
как «черный ящик», доступ к которому осуществляется только через входные
и выходные терминалы (порты). В параграфе 5.1 вводятся математические мо
дели «вход-выход» и определено понятие /^-устойчивости нелинейной системы,
лежащее в основе концепции устойчивости в терминах «вход-выход». В парагра
фе 5.2 исследуется /^-устойчивость нелинейных систем, представленных в виде
модели пространства-состояния. В параграфе 5.3 обсуждается задача вычисле
ния /^-коэффициента усиления для класса систем, не зависящих от времени.
Наконец, в параграфе 5.4 представлена одна из формулировок теоремы о малом
коэффициенте усиления (small-gain theorem).
5.1. /^-устойчивость
Рассмотрим систему, в которой связь входов и выходов представлена равен
ством
у=Ни,
где Η — некоторый оператор или некоторое отображение, которые определяют у
в терминах и. Вход и принадлежит пространству сигналов и отображает времен
ной интервал [0, оо) в евклидово пространство R
m
, т.е.и:[О,оо)—>R
m
.
В качес
тве примеров подобных пространств можно указать пространство кусочно-не
прерывных, ограниченных функций, т. е. supt^0 \\u(t) \\ < оо, или пространство ку
сочно-непрерывных, интегрируемых с квадратом функций, т. е. /0°° u
T
(t)u(t) dt <
1
В этой главе мы дадим лишь беглый обзор подхода «вход-выход» для того, чтобы дать воз
можность читателю понять связь теории устойчивости Ляпунова с устойчивостью от входа к вы
ходу, а также введем термины, необходимые для того, чтобы сформулировать теорему о малом
коэффициенте усиления (small-gain theorem). Всеобъемлющее изложение подхода «вход-выход»
приведено в [53], [208] и [162]. Основы этого подхода в приложении к нелинейным системам да
ны в работах Сандберга и Зеймса, опубликованных в 1960-х годах. (См., например, [164], [217]
и [218].)
206
ГЛАВА 5
< оо. Для измерения интенсивности сигнала введем норму функций ||гх||, удовле
творяющую трем свойствам:
• Норма сигнала равна нулю, если и только если сигнал тождественно равен
нулю, в противном случае норма принимает строго положительные значе
ния.
• Масштабирование сигнала приводит к соответствующему масштабирова
нию его нормы, т.е. \\аи\\ — а\\и\\ для любой положительной константы
и любого сигнала.
• Норма удовлетворяет неравенству треугольника ||щ -\-U21| ^ ||wi|| + ||w2|| для
любых двух сигналов щ и г^·
Например, в случае пространства кусочно-непрерывных, ограниченных функций
норма определяется равенством
IMkoo =sup||u(t)|| <оо,
и это пространство обозначается £TM. В случае пространства кусочно-непрерыв
ных, интегрируемых с квадратом функций, норма определяется равенством
Jj"uT(t)u{t)
IHka = \ / UT(i)u(t) dt < ОО,
и это пространство обозначается £ψ. В общем случае пространство £TM, 1 <
< ρ ^ оо определяется как множество всех кусочно-непрерывных функций и :
[0,оо)
Μ£Ρ = (/°°ΙΚ*)ΙΙΡΛ)
\1/Р
< оо.
Нижний индекс ρ в СTM соответствует типу р-нормы, используемой для определе
ния пространства, а верхний индекс соответствует размерности сигнала и. Если
из контекста ясно, какой индекс имеется в виду, мы будем его опускать и обо
значать соответствующее пространство Ср, С
т
или С. Для того чтобы отличать
норму вектора и в пространстве С от нормы вектора u(t) в пространстве i?m
,мы
будем записывать первую в виде || · \\с?
Если с нашей точки зрения вход и £ С
т
характеризуется «удовлетворитель
ным поведением», возникает вопрос, характеризуется ли с нашей точки зрения
2
3аметим, что в качестве нормы || · ||, используемой для определения || · \\ср для ρ € [1,оо],
может выступать любая р-норма в R
m
.
В упомянутых в тексте двух нормах число ρ не обяза
тельно должно быть одинаковым. Например, мы можем определить пространство £оо с нормой
IHUeo = supt^0 ||u(t)||i, ML*, = supt^0 |K*)||2 или \\u\\Loo = supt^0 ||ti(i)||oo. Однако обыч
но определяют пространство £2 с использованием 2-нормы в R
m
.
5.1. ^-УСТОЙЧИВОСТЬ
207
выход столь же «удовлетворительным поведением» в том смысле, что у £ Cq
,
где С
д
—
пространство, аналогичное пространству Ст
, но в общем случае чис
ло выходных переменных q может отличаться от числа входных переменных га.
Система, обладающая тем свойством, что при «удовлетворительном поведении»
входного воздействия она генерирует выходной сигнал с «удовлетворительным
поведением», будет характеризоваться как устойчивая система. Однако мы не
можем определить Η как отображение из С
т
вC
q
, поскольку мы можем иметь
дело с неустойчивыми системами, в которых вход и Ε Ст
может генерировать
выход у, который не принадлежит C
q
.
Поэтому Η обычно определяется как отоб
ражение из расширенного пространства LTM в расширенное пространство £<?, где
СTM = {и\иТе£
т
,
Vre[0,oo)}
и иТ — функция усечения (truncation function):
^
rW
"
\0,
t>r.
Расширенное пространство СTM является линейным пространством, содержащим
нерасширенное пространство С
т
.
Это позволяет нам иметь дело с неограничен
ными сигналами. Например, сигнал u(t) = t не принадлежит пространству CQQ,
но его усечение
принадлежит С^ для любого конечного т. Следовательно, u(t) = t принадле
жит расширенному пространству Соое- Отображение Я : £TM —> С% называется
каузальным (causal) или неупреждающим, если значение выхода (Hu)(t) в лю
бой момент времени t зависит только от значений входа в прошедшие моменты
времени, включая t. Иными словами,
(Ни)Т = {Нит)т.
Каузальность — это свойство, присущее динамическим системам, представлен
ным в виде модели пространства-состояния.
Определив пространства входных и выходных сигналов, мы можем дать
определение устойчивости «вход-выход».
Определение 5.1. Отображение Η : СTM —• С% называется С-устойчивым,
если существуют К-функция а, определенная на [0, оо), и неотрицательная кон
станта β, такие что
\\(Ηη)τ\\ε^α{\\ητ\\ε)
+β
(5.1)
для всех и £ LTM и τ £ [0, оо). Это отображение называется С-устойчивым
с конечным коэффициентом усиления, если существуют неотрицательные кон
станты η и β, такие что
||(Я«)т||£<7||«гк + /?
(5-2)
длявсехи€СTMиг€[0,оо).
208
ГЛАВА 5
Константа β в (5.1) и (5.2) называется членом смещения. Этот член присут
ствует в определении, поскольку необходимо учесть ситуации, когда в системе
выходНинеравеннулюприи=О
3
. Если неравенство (5.2) справедливо, нам
обычно интересно получить наименьшее значение у, при котором существует β,
с которым выполнено (5.2). В ситуациях, когда это значение 7 может быть опре
делено, мы будем называть эту величину коэффициентом усиления системы. Ес
ли неравенство (5.2) выполняется с некоторой η ^ 0, мы будем говорить, что
система имеет /^-коэффициент усиления меньший либо равный 7·
Для каузальной, ^-устойчивой системы можно легко показать, что
иеС
т
=> HueC
q
\\Ни\\с^а(\\и\\с)
+0,
Vue£
m
.
Для каузальной, ^-устойчивой с конечным коэффициентом усиления системы
предыдущее неравенство принимает следующий вид:
\\Ни\\с<-уЫс + Р, VueC
m
.
Определение £оо-устойчивости совпадает с определением устойчивости системы
типа «ограниченный вход - ограниченный выход» (bounded-input-bounded-output
(BIBO) stability): если система £оо-устойчива, то для любого ограниченного вхо
да u(t) выход Hu(t) также ограничен.
Пример 5.1. Функция без памяти возможно зависящая от времени,
h : [0, оо) х R —> R может рассматриваться как оператор Я, сопоставляющий
входному сигналу u(t) выходной сигнал y(t) = h(t,u(t)). Мы используем
этот простой оператор для того, чтобы проиллюстрировать определение £-
устойчивости. Положим
h{u) =α+bthcu =α+b-
e
где α, b и с — некоторые неотрицательные константы. С учетом того что
h\u) =
^—-
^be, МиеЯ,
имеем
\h(u)\ ^ а + bc\u\, VwEi?.
Следовательно, оператор Η является Соо -устойчивым с конечным коэффициен
томусиленияи7=be,β =α.Крометого,еслиа=0,тодлялюбогоρ£[1,оо)
/»оо
/»оо
/ \h(u(t))\p dt ^ (Ьс)
р
/
\u(t)\pdt.
Jo
Jo
Этот член может играть в системе и другие роли (см. упражнение 5.3).
5.1. £-УСТОЙЧИВОСТЬ
209
Таким образом, для любого ρ G [1,оо] оператор Η является /^-устойчивым
с конечным коэффициентом усиления, j = Ьси смещение равно нулю. Пусть h —
зависящая от времени функция, удовлетворяющая
\h(t,u)\ < a\u\, \/t ^ 0,УuGД,
где а — некоторая положительная константа. Для любого ρ G [1, оо] оператор Η
является £р-устойчивым с конечным коэффициентом усиления, j = а и смеще
ние равно нулю. Наконец, положим
h(u)=и
2
.
Поскольку
sup\h(u(t))\ ^ (sup|ifc(i)|
t^o
\i^o
оператор Η является С^-устойчивым, а(г) = г
2
и смещение равно нулю. Этот
оператор не является С^-устойчивым с конечным коэффициентом усиления, т. к.
на функцию h(u) = u
2
не может быть наложено ограничение вида \h(u)\ ^ 7М +
+βдлявсехиGR.
Δ
Пример 5.2. Рассмотрим систему с одним входом и одним выходом, опре
деляемую каузальным оператором свертки
y(t) = / h(t — а)и(а) da,
Jo
гдеh(t) = 0 приt <0.Предположим, что hG£ie, т.е.для всех τ G[0,оо)
poo
рт
HMLci = / \Κ(σ)\ασ = / \h{a)\<kr
Jo
Jo
< oo.
ЕСЛИUG£ooeИΤ^t,TO
\v(t)\< f
\h(t-a)\\u(a)\da
Jo
€
< / \h(t — a)\ da sup |гх(сг)| = / \h(s)\ ds sup |ti(a)|.
Jo
Ο^σ^τ
Jo
Ο^σ^τ
Следовательно,
WyAc^^WhrWc.hrUoo, Vre[o,oo).
Это неравенство подобно неравенству (5.2), но не идентично ему, поскольку кон
станта 7
в
(5.2) не зависит от г и в рассматриваемом случае это условие не
выполнено. Несмотря на то что величина ||/iT|Ui конечна для всех конечных т,
210
ГЛАВА 5
она не является равномерно ограниченной по т. Например, при h(t) = е
г
мы
имеем Ц/irlUi
=
(еТ
—
1) и эта величина действительно конечна для всех конеч
ных г G [0, оо), но не является равномерно ограниченной по т. Неравенство (5.2)
выполнено, если h G £i, т. е.
/»оо
\\4ci = / \h(a)\ da ^оо.
Jo
Тогда из неравенства
Ыко^МЫЫк», Vr6[o,oo),
следует, что система является С^-устойчивой с конечным коэффициентом уси
ления. Более того, условие \\h\\d ^ оо гарантирует ^-устойчивость с конеч
ным коэффициентом усиления при ρ G [1,оо]. Рассмотрим случай ρ = 1. При
t^г<ооимеем
/ \y(t)\dt = / / /i(t- a)u(a)da\dt^ / / |ft(f-σ)|Κσ)|dadt.
Jo
Jo \Jo
Ι JoJo
Меняя порядок интегрирования, получаем
Г \y(t)\dt^ Г \и(а)\Г \h(t- а)\dtda^ Г \и(а)\\\h\\Cl da)\<
Jo
Jo
Jo
Jo
< 1МЫКНА.
Таким образом,
hAd^WhWcAKWc,, VTG [o,oo).
Рассмотрим теперь случай ρ G (1, оо) и предположим, что константа q G (1, оо)
определяется равенством l/p-\-l/q — 1. При t ^ г < оо имеем
М*)К / |Λ(«-")|Κσ)|Ατ =
./о
=/
\h(t - c)\x
'
4
\h(t - σ)\ΧΙ*\υ.(σ)\ da ^
Jo
< (/"|h(t- σ)\da) (f \h(t- a)\\u(a)\pda
^Noт\\С1)
1/9
(1*\Ч1-а)\\и(а)\*>аа^
\
5.1. ^-УСТОЙЧИВОСТЬ
211
где второе неравенство было получено с использованием неравенства Гельдера
4
.
Тогда
(Ы|£Р)
Р
=
iT\y(t)\*dt<
Jo
< £(\\кг\кг)
р/ч
(j[* No ~ σ)\ \η(σ)\Ρ da^ dt =
= (ΙΙΜΑ)Ρ/9 Γ Γ \h(t - σ)| |η(σ)|" da dt.
Jo Jo
Меняя порядок интегрирования, получаем
(1Ы|£Р)
Р
< (||Лг1Ыр/в
Г\Ф)\РГIM*- ")ldtda<
Jo
Jo
< (IIM^IMACIKIIAJ = (НМЫр(1К1|£р)
р
.
Следовательно,
\\VT\\CP < ll^lkill^rlkp.
Таким образом, если ЦЛЦ^ < оо, то для любой константы ρ € [1, оо] каузальный
оператор свертки £р-устойчив с конечным коэффициентом усиления и неравен
ство (5.2) выполнено С7= 11^11 £iH/3 = 0.
Δ
Одним из недостатков определения 5.1 является то, что в нем явным образом
накладывается условие выполнения неравенств (5.1) и (5.2) при любых входных
сигналах из пространства С
т
.
Эти требования исключают из рассмотрения си
стемы, в которых вход-выходные соотношения определены лишь на подмноже
стве пространства входных сигналов. В следующем примере рассматривается по
добная ситуация и мотивируется необходимость определения нового понятия —
/^-устойчивости при малом входном сигнале.
Пример 5.3. Рассмотрим систему с одним входом и одним выходом, опре
деляемую нелинейностью
y= tgu.
Выход y(t) определен лишь при входных сигналах, удовлетворяющих неравен
ству
|u(t)l<|, vi^o.
Таким образом, система не является £оо-устойчивой в смысле определе
ния 5.1. Однако если мы ограничимся рассмотрением входных сигналов u(t),
4
Если / G Сре ире £Яе, где ρ G (1, оо) и 1/р + Ι/q = 1, то неравенство Гельдера имеет вид
/
τ
/ /»т
\1/р//*т
\ 1/<7
|/(%(i)| dt < Ц \f(t)\" dt) Ц \g(t)\q dt)
для всех τ € [0, оо). (См. [14].)
212
ГЛАВА 5
удовлетворяющих
то
Μ<(ψ) Μ
и система будет удовлетворять неравенству
\\у\\сР < (-Р) Nta
длялюбыхиеСр,такихчто\u(t)|<гдлявсехt ^ О,гдере [1,оо].Впростран
стве £оо из неравенства |w(t)| < г следует ||гх||,с00 < г, т.е. приведенное выше
неравенство выполнено только для входных сигналов с малой нормой. Однако
в случае рассмотрения других пространств £р, ρ < оо, мгновенная ограничен
ность величины \u(t)\ не влечет ограниченность соответствующей нормы этого
входного сигнала. Например, сигнал
u(t) = re~
rt/a
,
a>О,
принадлежит Ср для всех ρ е [1,оо] и имеет мгновенную границу \u(t)\ ^ г,
однако его £р-норма
\\и\\£Р =
r
(fip) > 1<р<оо,
может принимать произвольно большие значения.
Δ
Определение 5.2. Отображение Η : СTM —> £1 называется С-устойчивым
при малом входном сигнале {соответственно С-устойчивым при малом входном
сигнале с конечным коэффициентом усиления), если существует положительная
константа г, такая что неравенство (5.1) {соответственно неравенство (5.2))
выполнено для всех и Ε СTM, sup0<t<r ||w(£)ll ^ г.
5.2. /^-устойчивость моделей состояния
Свойство устойчивости от входа к выходу интуитивно понятно. Это, воз
можно, объясняет то, что большинство из нас знакомятся с теорией устойчивости
динамических систем на примере концепции устойчивости систем с ограничен
ным входом и ограниченным выходом. В рамках теории Ляпунова мы уделяем
особое внимание исследованию точек равновесия и асимптотическому поведе
нию переменных состояния и в связи с этим возникает вопрос: какую инфор
мацию об устойчивости от входа к выходу мы можем получить с использовани
ем формализма теории устойчивости Ляпунова? В этом параграфе мы покажем,
как предлагаемые теорией Ляпунова средства установления устойчивости мо
гут быть использованы для доказательства /^-устойчивости нелинейных систем,
представленных моделями состояния.
5.2. /^-УСТОЙЧИВОСТЬ МОДЕЛЕЙ состояния
213
Рассмотрим систему
х=/(*,х,и), х(0)=ж0,
(5.3)
y = h(t,x,u),
(5.4)
гдехGi?
n
, гхGДт
,у=i?
9
, / :[0,оо)хDxDu —>Д
п
—
кусочно-непрерывная
по t и локально липшицевая по (ж, и) функция, ft, : [0, оо) х D x Du -+ R
q
—
кусочно-непрерывная по t и непрерывная по (ж, м) функция, D с R
n
—
открытая
область, содержащая начало координат х = О, и £)п С Дт
—
область, содержа
щая и = 0. Для каждого фиксированного хо G D модель состояния (5.3)-(5.4)
определяет оператор Я, сопоставляющий каждому входному сигналу u(t) соот
ветствующий выходной сигнал y(t). Предположим, что х = 0 является точкой
равновесия свободной системы
± = /(*,а:,0).
(5.5)
В этом параграфе будет показано, что при определенных условиях на / и h из
равномерной асимптотической устойчивости (или экспоненциальной устойчиво
сти) начала координат (5.5) следует /^-устойчивость или /^-устойчивость при ма
лом входном сигнале системы (5.3)-(5.4), где С — определенное пространство
входных сигналов. Этот результат будет доказан сначала для случая экспоненци
альной устойчивости, а затем для случая равномерной асимптотической устой
чивости.
Теорема 5.1. Рассмотрим систему (5.3)-(5.4) и выберем г > 0 и ти > 0,
такие что {\\х\\ ^ г} С D и {\\и\\ ^ ги} С Du. Предположим, что
•х—0
—
экспоненциально устойчивая точка равновесия (5.5) и существует
функция Ляпунова V(t,x), удовлетворяющая неравенствам
c1\\x\\
2
^V(t,x)^c2\\x\\
2
,
(5.6)
^
+ ^/(i,x,0)^-c3|N|2
,
(5.7)
dV
дх
^ С4||х||
(5.8)
для всех (t,x) G [0, оо) х D и некоторых положительных констант ci, с2 сз
и С4.
•
/ и h удовлетворяют неравенствам
||/(i,x,ti)-/(i,x,0)||<L||u||,
(5.9)
\\h(t,x,u)\\^m\\x\\+m\\u\\
(5.10)
для всех (t, х, и) G [0, оо) xDxDu
и некоторых неотрицательных констант
L,щит/2.
214
ГЛАВА 5
Тогда для каэюдого хо, такого что \\хо\\ ^ Ту/с\/с2, система (5.3)-(5.4)
Су-устойчива при малом входном сигнале с конечным коэффициентом усиле
ния для всех ρ G [1,оо]. В частности, для каэюдого и G Сре, такого что
sup0^£^T ||гб(£)|| < min{rw,ciC3r/(c2C4i/)}, выход системы у(t) удовлетворяет
оценке
\\Уг\\сР^7\\игир+Р
(5.11)
для всех τ G [0, оо), где
mc2c4L
Ι=η2+
/? = тЫу§Р,
где
Р=
если ρ=оо,
если ρ G [1,оо).
Кроме того, если начало координат глобально экспоненциально устойчиво и все
предполоэюения выполнены глобально (при D = R
n
иDu=R
m
), то для каэюдого
хо€Rn
система (5.3)-(5.4) Ср-устойчива с конечным коэффициентом усиления
для всех ρ G [1,оо].
ДОКАЗАТЕЛЬСТВО. Производная V вдоль решений системы (5.3) удовлетво
ряет
V(t,x,u) = ^
+ f£/(i,s,0) + |£[Ж*,«) - f(t,x,0)} <
<-c3||ar||
2
+ C4L||x|| ||«||.
Пусть W(t) = y/V(t,x(t))·
П
РИ V(t,x(t)) φ О имеет место W = V/(2y/V).
С учетом (5.6) получаем
^-ΗΙΚ+^τΜΟ»·
При V(t,x(i)) = 0 можно показать, что
D+W(t)^0^\\u(t)\\.
(5.12)
Тогда
для всех значений V(t,x(t)). Используя лемму сравнения 3.4, можно показать,
что W(t) удовлетворяет неравенству
W(t) < e-
tc
*/
2c2
W(0) + -^
/ е-(*-
т
)Сз
/2с2
||гх(т)|| dr.
2\М Jo
5
См. упражнение 5.6.
5.2.
^-УСТОЙЧИВОСТЬ МОДЕЛЕЙ СОСТОЯНИЯ
215
Используя (5.6), получаем
W*)ll < ^\Ы\е-*
сфС2
+^/
е_(
'~
т)сз/2С2
1К^)11 *·
Легко показать, что из неравенств
Ы^гМ
и sup
\\u(a)\\^^-
следует, что ||x(t)|| ^ г, т. е. x(t) остается в области, в которой выполнены сде
ланные предположения. Используя (5.10), получаем
Ы*)Н Oie-
at
+ fc2 Ге-
в(
*-
т)
||«(т)|| dr + k3\\u(t)l
(5.13)
./о
где
Гс2и
II
7
c
4Lr
Jl
J
СЗ
Положим
kl=
усг11
х
°11^ь
/c
2= -^-
i
,fe=^2,α
=§·
Vi(t) = kie~
a
\ y2(t)=k3[е-
а
^)||^(г)|| dr, No(t) = *а|М*)Н·
./o
Предположим, что и G CTMe при некотором ρ G [1, oo]. С использованием резуль
татов, полученных в примере 5.2, легко показать, что
\\У2т\\ср <
-аЬт^.
Непосредственной проверкой можно доказать, что
НЫкР ^к3\\ит\\Ср·
Далее, можно показать, что первый член в оценке вектора выхода удовлетворяет
оценке
{1,
если ρ=оо,
(ар) >
если
Ρ€[1,οο).
Таким образом, из неравенства треугольника следует, что (5.11) выполнено с кон
стантами
7= ^3+-^-,
P=kip.
В случае если все предположения выполнены глобально, нет необходимости на
кладывать ограничения на хо и мгновенные значения ||w(i)||. Поэтому (5.11) вы
полнено для всех хо £ Rn
ииGСре.
Π
С использованием обратной теоремы Ляпунова 4.14 можно показать, что
существует функция Ляпунова, удовлетворяющая (5.6)-(5.8). Тогда можно сфор
мулировать следующее следствие.
216
ГЛАВА 5
Следствие 5.1. Предположим, что в некоторой окрестности точки (х =
= О, и = 0) функция /(£, х,гх) является непрерывно дифференцируемой, мат
рицы Якоби [df/dx] и [df/du] ограничены равномерно по t и h(t,x,u) удовле
творяет (5.10). Если начало координат х = О является экспоненциально устой
чивой точкой равновесия (5.5), то существует константа го > О, такая что
для любого хо, ||#о|| <
г
о система (5.3)-(5.4) является Ср-устойчивой при ма
лом входном сигнале с конечным коэффициентом усиления для всех ρ G [1, оо].
Кроме того, если все предположения выполнены глобально и начало координат
является глобально экспоненциально устойчивой точкой равновесия (5.5), то
для любого хо € Rn
система (5.3)-(5.4) является Ср-устойчивой с конечным
коэффициентом усиления для всех ρ G [l.oo].
В случае линейной, не зависящей от времени системы
х=Ах+Ви,
(5.14)
y=Cx+Du,
(5.15)
условия глобальной экспоненциальной устойчивости, сформулированные в тео
реме 5.1, эквивалентны условию гурвицевости матрицы А. Таким образом, для
линейных систем мы имеем следующий результат.
Следствие 5.2. Линейная, не зависящая от времени система (5.14)-(5.15)
Ср-устойчива с конечным коэффициентом усиления для всех ρ Ε [1, оо], если А —
гурвицева матрица. Более того, (5.11) выполнено с
|п||
, 2ALx(P)ll*ll2l|C||2 Й ,|г|| .,
„
/WP)
l^lb +
i ГБ\
> Ρ = P\\ch\\x
o\\\
τ ТБТ>
где
Р=
1,
если ρ=оо,
'2Атаос(р)У/Р
ΡJ'
если ρ G [l,oo)
и Ρ является решением уравнения Ляпунова РА + А
Т
Р=—I.
Читателю предлагается вывести приведенные выше выражения, определяю
щие константы "у и β.
Пример 5.4. Рассмотрим скалярную систему с одним входом и одним вы
ходом:
х= —х
—
х
3
+и, х(0)=хо,
у=thx+и.
Начало координат х = — х
—
х
3
глобально экспоненциально устойчиво, и это
может быть установлено с использованием функции Ляпунова V(x) = x
2
/2.
Функция V удовлетворяет (5.6)-(5.8) глобально с с\ = с^ = 1/2, сз = с± — 1.
5.2. £-УСТОЙЧИВОСТЬ МОДЕЛЕЙ СОСТОЯНИЯ
217
Функции / и h удовлетворяют (5.9) и (5.10) глобально с L = щ — щ
—
1.
Следовательно, для всех XQ G R и ρ G [1, оо] система £р-устойчива с конечным
коэффициентом усиления.
Δ
Пример 5.5. Рассмотрим систему второго порядка с одним входом и одним
выходом:
±i=ж2,
±2= —х\—Х2—athxi + и,
У= хи
где а — некоторая неотрицательная константа. Используем
V(x) =Х
Т
Рх = р\\х\ + 2pi2XlX2 +P22#2
в качестве функции Ляпунова для свободной системы:
V = -2pi2{x\ + axithsi) + 2(рц -pi2 -£22)^1X2 -
-2ap22^2 thxi - 2(^22 - Pi2)si·
Для того чтобы избавиться от перекрестного члена Х1Х2, положим ри = р\2 +
+ Р22· Тогда при р22 = 2рп = 1 матрица Ρ будет положительно определена
и
V= —х\—х\ —axithxi —2ax2thxi.
С учетом того что х\ th^i ^ 0 для всех х\ G Я, получаем
У ^ -||ж||§ + 2a|xi| |я2| < -(1 - о)\\х\\1
Таким образом, для всех a < 1 фикция V удовлетворяет (5.6)-(5.8) глобально
с ci = Amin(P), c2 = Атах(Р), с3 = 1 - α и с4 = 2||Р||2 = 2Атах(Р). Функции /
и h удовлетворяют (5.9) и (5.10) глобально с L = щ = 1, 772 = 0. Следовательно,
длявсехxo GR2
и ρ G [1,оо] система является £р-устойчивой с конечным
коэффициентом усиления.
Δ
Далее рассматривается более общий случай, когда начало координат (5.5)
равномерно асимптотически устойчиво и исследуется задача £оо-устойчивости.
В следующих двух теоремах даются соответственно условия £оо-устойчивости
и £оо-устойчивости при малом входном сигнале.
Теорема 5.2. Рассмотрим систему (5.3)-(5.4) и выберем г > 0 так, чтобы
{\\х\\ ^ г} С D. Предположим, что
• х = 0 — равномерно асимптотически устойчивая точка равновесия (5.5)
и существует функция Ляпунова V(t,x), удовлетворяющая неравенствам
а1{\\х\\)^У(Ь,х)^а2{\\х\\),
(5.16)
218
ГЛАВА 5
^
+ ^/(*,х,0)<-аз(|И),
(5.17)
f£|^MIMI)
(5-18)
для всех (£, x) G [0, оо) х D и некоторых К-функций а*, г = 1,2,3,4;
•
/ wft-удовлетворяют неравенствам
||/(i,x,tx)-/(t,x,0)||<a5(|H|),
(5.19)
||Л(«,х^)|| <а6(||х||)+а7(И|) + ч
(5.20)
Эля всех (£,ж,гх) G [0, оо) х D х Д^ некоторых К-функций а^ i = 5,6,7,
w некоторой неотрицательной константе η.
Тогда для всех XQ : ||хо|| ^
a
2^(
a
i(r)) система (5.3)-(5.4) С^-устойчива при
малом входном сигнале.
ДОКАЗАТЕЛЬСТВО. Производная V вдоль траекторий (5.3) удовлетворяет
оценке
V(t,x,u) = ^
+ ^-f(t,x,0) + |£ [/(t,*, u) - f(t,x,0)} <
<-аз(||х||) + а4(||х||)а5(|Н|)<
< -(1 - 0)a3(|W|) - ва3(\\х\\) + а4(г)аь ( sup \\u(t)\\] ,
где0<θ<1.Положим
fa4(r)a5 (sup0<t^T ||u(t)||) \
M=a3 ^
-
e
j
и выберем ru > 0 достаточно малой, чтобы {||гг|| ^ rw} С Du и μ < a^"
1
(ai(r))
при sup0<t<T ||u(i)|| ^ ?v Тогда
у<-(1-в)аз(||х||), V||X||>M.
Применяя теорему 4.18, заключаем с использованием (4.42) и (4.43), что ||х(£)||
удовлетворяет неравенству
||x(t)ll <)9(||xo||,0+7f sup КОН)
(5.21)
для всех 0 < t < τ, где /3 и 7 — соответственно /СС- и /С-функции. Исполь
зуя (5.20), получаем с использованием свойства /С-функций
6
а(а+Ъ)<а(2о)+а(2Ь)
См. упражнение 4.35.
5.2. /^-УСТОЙЧИВОСТЬ МОДЕЛЕЙ СОСТОЯНИЯ
219
оценку
\\y(t)\\ ^ од (β{\\ΧοΙ$ +7 ( sup \\u(t)\\)) + a7(Ht)||) +ry <
< a6(2/3(||x0||,*)) + a6 (27 ( sup \\u(t)\\\)
+a7(\\u(t)\\)+η.
Таким образом,
11»г||£оо<ть(К1|£оо) + А)»
(5-22)
где
70 = Oi6o 2η + α7 и /30 = аб(2/?(||хо||>0)) + η-
Π
С использованием обратной теоремы Ляпунова 4.16 можно показать, что
существует функция Ляпунова, удовлетворяющая (5.16)—(5.18). Таким образом,
можно сформулировать следствие.
Следствие 5.3. Предположим, что в некоторой окрестности точки (х =
= 0, и = 0) функция f(t,x,u)
непрерывно дифференцируема, матрицы Якоби
[df/dx] и df/ди] ограничены равномерно по t и h(t, x, и) удовлетворяет (5.20).
Если свободная система (5.5) имеет в начале координат равномерно асимп
тотически устойчивую точку равновесия х = 0, то система (5.3)-(5.4) CQQ-
устойчива при малом входном сигнале.
Для того чтобы обобщить теорему 5.2 на случай доказательства £оо-
устойчивости, нам необходимо показать, что (5.21) выполняется для всех на
чальных состояний хо Ε Rn
и любого ограниченного входного сигнала. В па
раграфе 4.9 было отмечено, что это неравенство необязательно справедливо,
если условия теоремы 5.2 выполнены глобально даже в случае, когда начало
координат (5.5) является глобально асимптотически устойчивым. Однако спра
ведливость этого неравенства может быть доказана, если система (5.3) обладает
свойством устойчивости по входу-состоянию, которое может быть установлено
с использованием теоремы 4.19.
Теорема 5.3. Рассмотрим систему (5.3)-(5.4) с D = R
n
иDu =
Rm
.
Предположим, что
• система (5.3) устойчива по входу-состоянию;
h удовлетворяет неравенству
•
\\Н(г,х,и)\\^а1{\\х\\)
+ а2(\\х\\) + Л
(5.23)
для всех (t,x,u) £ [0, оо) х R
n
xR
m
,
некоторых К-функций ai,a2
u
неко
торой неотрицательной константы η.
Тогда для всех XQ Ε Rn
система (5.3)-(5.4) Ч^-устойчива.
220
ГЛАВА 5
ДОКАЗАТЕЛЬСТВО. ИЗ свойства устойчивости по входу-состоянию следует,
чтодлявсеххоеR
n
и и е £оое выполнено неравенство, аналогичное (5.21).
Оставшаяся часть доказательства этой теоремы аналогична доказательству тео
ремы 5.2.
Π
Пример 5.6. Рассмотрим систему первого порядка с одним входом и одним
выходом:
х=-х
-
2х
3
+(1+х
2
)и
2
у=х
2
+и.
В примере 4.26 было показано, что это уравнение состояния является устой
чивым по входу-состоянию. Функция выхода h удовлетворяет (5.23) глобально
са\(г) =г
2
, а2(г) = г и η = 0. Таким образом, система С^-устойчива.
Δ
Пример 5.7. Рассмотрим систему второго порядка с одним входом и одним
выходом:
xi = -xl + g(t)x2,
Х2= -g(t)xi - х\+щ
у=х\ +х2,
где g(t) — непрерывная и ограниченная для всех t ^ 0 функция. Полагая V =
=(х
2
+х
2
), получаем
V= -2х\ -2х\+2х2^·
С учетом того что
получаем
V < -\\х\\% + 2||г||2Н = -(1 - 0)\\х\\% - в\\х\\% + 2||х||2Н <
<-(1-в)\\х\\1
V||x||2>
где 0 < θ < 1. Таким образом, V удовлетворяет неравенствам (4.48) и (4.49)
в формулировке теоремы 4.19 с а\(г) = #2(г) = г
2
, Ws(x) = (1 — #)||#||2
и р(г) = (2г/в)
1
/г
.
Следовательно, уравнение состояния устойчиво по входу-
состоянию. Кроме того, функция h = х\ + Х2 удовлетворяет (5.23) глобально
с а\(г) — у/2г, а.2 — 0 и η = 0. Таким образом, система С^-устойчива.
Δ
5.3. £2-коэффициент усиления
Свойство £2 -устойчивости играет особую роль при анализе систем, в ходе
которого естественно рассматривать случай интегрируемых с квадратом сигна-
5.3 . ^-КОЭФФИЦИЕНТ УСИЛЕНИЯ
221
лов, поскольку они являются сигналами с конечной энергией
7
. Во многих зада
чах управления
8
система представлена в виде отображения, связывающего вход
с выходом — возмущающий входной сигнал и с управляемым выходом у. При
этом требуется, чтобы величина этого выхода была малой. Система управления
с входными сигналами, являющимися £2 -функциями, разрабатывается таким об
разом, чтобы отображение вход-выход было /^-устойчивым с конечным коэффи
циентом усиления и так, чтобы этот коэффициент принимал минимальные значе
ния. В таких задачах важно не только установить факт /^-устойчивости системы
с конечным коэффициентом усиления, но также и вычислить £2-коэффициент
усиления или верхнюю границу его возможных значений. В этом параграфе мы
покажем, как вычислить этот /^-коэффициент усиления, если система не зависит
от времени. Начнем с линейных систем.
Теорема 5.4. Рассмотрим линейную, не зависящую от времени систему
х=Ах+Ви,
(5.24)
у=Сх+Вщ
(5.25)
где А — гурвицева матрица. Пусть G(s) = С (si — A)~
l
B +D.Тогда/V
коэффициент усиления равен sup^^ ||G((ja;)||2.
9
ДОКАЗАТЕЛЬСТВО. Поскольку система линейна, мы можем положить х(0) =
= 0. Из теории преобразования Фурье известно
10
, что преобразование Фурье
Y(ju) для каузального сигнала у £ £2 определяется равенством
/»оо
У(М = / y(t)e-
ju,t
dt
Jo
и
Y(jw) = G{ju>)U<ju).
Используя теорему Парсеваля
11
, можно записать
/»оо
1 /*оо
IMIL = I yT(t)y(t) dt = ±J ^ Υ*(3ω)Υ^ω) <L·
/»00
= ^j_ U*{jw)GT{-iu>)G{ju)U{juj) dw =
7
Если в качестве u(t) рассмотреть силу тока или его напряжение, то величина u
T
(t)u(t) бу
дет пропорциональна мгновенной мощности сигнала и интеграл этой величины, взятый по всему
промежутку времени, представляет собой меру энергии этого входного сигнала.
8
См. литературу по Яоо-управлению, например, [20], [54], [61], [90], [199] и [219]. —
Прим.
ред. перев. — См. также [Д56].
9
Эта норма является индуцированной 2-нормой комплексной матрицы G(ju;) и равна
величина известна как Яоо-норма матрицы G(ju>),
если G(JUJ) рассматривается как элемент пространства Харди Яоо· (См. [61].)
,0
См. [53].
П
В теореме Парсеваля [53] утверждается, что для каузального сигнала у G £2 выполнено
/»оо
/»оо
/ yT(t)y(t)dt=
y»y(jw)(b».
JO
./-00
222
ГЛАВА 5
=
supHGCHIh
\u>eR
sup||G(jo;)||2
weR
)2
rj: ir(ju;)U(ju>) duj
N|2£2·
Из этой оценки видно, что £2 -коэффициент усиления меньше либо равен
sup ||G(jf'u;)||2. Доказательство того, что этот коэффициент равен sup ||G(jcc;)||2,
ueR
useR
может быть выполнено от противного (см. приложение С. 10).
Π
Рассмотренный случай линейной, не зависящей от времени системы явля
ется единственной ситуацией, в которой возможно определить точное значение
/^-коэффициента усиления. В общем случае можно определить лишь верхнюю
границу значений этого коэффициента.
Теорема 5.5. Рассмотрим нелинейную, не зависящую от времени систему
х = f(x) + G[x)u,
x(0) = ж0,
(5.26)
У = Л(х),
(5.27)
где f(x) —локально липшицевая функция и G(x), h(x) — непрерывные функции
наR
n
.
Матрица G(x) имеет размерность η х т и h : R
n
—*R
q
.
Функции f
и h обращаются в начале координат в ноль /(0) = 0, /i(0) = 0. Пусть η —
некоторое полоэюителъное число, и предполоэюим, что существует непрерывно
дифференцируемая, положительно полуопределенная функция V(x), удовлетво
ряющая неравенству
τ
+
1 dV,
n(v,f,G,k,-r) * f/(х) + ^f ВД^М v Bx)
(&S
+±hT(x)h(x)
<0
(5.28)
длявсехх€Rn
.
Тогда для любого XQ € Я" система (5.26)-(5.27) С^-устойчива
с конечным коэффициентом усиления, значение которого меньше либо равно η.
ДОКАЗАТЕЛЬСТВО. МОЖНО показать, что
dV
^f{x) + dvG{x)u
=
_i,
дх
дх
-уTM{%) + £'М
+
+
^f
G
w
Gr
w(f)r+
b2Hi?·
Подставляя (5.28), получаем
%TM+% в(х)и < h'Ml \\\y\\l
.I72
27 l»-^wri
\dx J
5.3 . ^ -КОЭФФИЦИЕНТ УСИЛЕНИЯ
223
Следовательно,
!£/(*) + %G{X)U < i7
2
iHii - \ы\1
(5.29)
Заметим, что левая часть (5.29) представляет собой производную V вдоль реше
ний системы (5.26). Интегрируя (5.29), получаем
V(X(T)) - V(xo) < \l2 jT \\u(t)f2 dt~l£ \\y(t)g dt,
где x(t) — решение (5.26) при заданном и Ε £2е- С учетом того что V(x) ^ О,
получаем
Г ||у(*)|И dt < 7
2
Г ||«(t)ll2 dt + 2V(x0).
Jo
Jo
Вычисляя квадратные корни от левой и правой частей этого неравенства и ис
пользуя неравенство л/α2
+Ь
2
^ а + Ь, где α и 6 — неотрицательные числа, полу
чаем окончательную оценку
\\Уг\\с2 < 7lkL + л/2Пхо).
(5.30)
Π
Неравенство (5.28) известно как неравенство Гамилътона-Якоби (или урав
нение Гамилыпона-Якобщ если вместо ^ имеет место равенство). Для того чтобы
найти функцию V(x)> удовлетворяющую (5.28), необходимо решить дифферен
циальное уравнение в частных производных, что может быть непросто. Если
функция V(x) определена, мы можем установить свойство £2-устойчивости си
стемы с конечным коэффициентом усиления. Отметим, что этот результат не
требует наложения дополнительного условия экспоненциальной устойчивости
начала координат свободной системы, что отличает его от результата, сформу
лированного в теореме 5.1. Этот факт иллюстрируется следующим примером.
Пример 5.8. Рассмотрим систему с одним входом и одним выходом:
±1 =Х2,
±2= —ах\—кх2+и,
где а и к — положительные константы. Свободная система представляет со
бой специальный случай класса систем, рассмотренного в примере 4.9. Выберем
функцию Ляпунова в виде функции энергии V(x) = axf/4 + х%/2 и покажем,
что начало координат глобально асимптотически устойчиво. Используя функцию
V(x) = а(ах\/4+Ж2/2), где а > 0, в качестве кандидата на решение неравенства
Гамильтона-Якоби (5.28), можно показать, что
H = (V,/,G,ft,7)= (-ak + ^ + Uxl
224
ГЛАВА 5
Для выполнения (5.28) необходимо выбрать α > 0 и η > О так, чтобы
а
2
,1
-afc+^ + ^0.
(5.31)
Можно показать, что это неравенство можно переписать в следующем виде:
12
>
а
"
2ак-1'
Поскольку мы заинтересованы в получении наименьшего коэффициента 7> мы
выберем а так, чтобы минимизировать правую часть вышеприведенного нера
венства. Минимальное значение 1/к
2
достигается при а = 1/к. Таким образом,
выбрав 7 = 1/&, мы можем заключить, что система ^-устойчива с конечным
коэффициентом усиления, значение которого меньше либо равно 1/к. Заметим,
что условия теоремы 6.1 в рассматриваемом примере не выполняются, поскольку
начало координат свободной системы не является экспоненциально устойчивым.
Линеаризация системы в окрестности начала координат приводит к линейной
системе с матрицей
"1
1
О-к
которая не является гурвицевой.
Δ
Следующий пример представляет собой обобщение вышеприведенного ре
зультата.
Пример 5.9. Рассмотрим нелинейную систему (5.26)-(5.27) с т = q
и предположим, что существует непрерывно дифференцируемая, положительно
полуопределенная функция W(x), удовлетворяющая
12
ψ-fix)
^ -kh
T
(x)h(x),
k> 0,
(5.32)
dKG(x) = h
T
(x)
(5.33)
длявсех х GRn
.
Используя V(x) = aW(x), a > 0, в качестве кандидата на
решение неравенства Гамильтона-Якоби (5.28), можно показать, что
Н - (V,/,G,b,7) = \-ак+ ^ + U hT(x)h(x).
Для выполнения (5.28) необходимо выбрать а > 0 и 7 > 0 так, чтобы
12
Система, удовлетворяющая (5.32) и (5.33), будет определена в следующей главе как строго
пассивная по выходу система.
5.3 . £2-КОЭФФИЦИЕНТ УСИЛЕНИЯ
225
Это неравенство совпадает с (5.31). Повторив рассуждения предыдущего при
мера, можно показать, что система ^-устойчива с конечным коэффициентом
усиления, значение которого меньше либо равно 1/к.
Δ
Пример 5.10. Рассмотрим нелинейную систему (5.26)-(5.27) с т = q
и предположим, что существует непрерывно дифференцируемая, положительно
полуопределенная функция W(x), удовлетворяющая
13
^/(*К0,
(5.34)
9KG{x) = h
T
{x)
(5.35)
длявсехх€Rn
.
Замыкая систему обратной связью
и= —ку+г>, к>0,
получаем
Т
х=/Or)-kG
T
{x)G(x) (^)
+ G(x)v =' Мх) + G(x)v,
Легко показать, что для замкнутой системы функция W(x) удовлетворяет усло
виям (5.32) и (5.33) из предыдущего примера. Следовательно, отображение вход-
выход от ν к у является /^-устойчивым с конечным коэффициентом усиления,
значение которого меньше либо равно 1/к. Более того, этот коэффициент может
быть сделан произвольно малым путем выбора достаточно большого коэффици
ента усиления в обратной связи.
Δ
Пример 5.11. Рассмотрим линейную, не зависящую от времени систему
х=Ах+Ви,
у= Сх.
Предположим, что существует положительно полуопределенное решение Ρ
уравнения Риккати
РА+А
Т
Р + \РВВТР
+С
Т
С =0,
(5.36)
Τ
где 7 > 0 — некоторая константа. Полагая V(x) = (l/2)x
T
Px и с учетом
[dV/дх] = х
т
Р, можно легко показать, что V(x) удовлетворяет уравнению
Гамильтона-Якоби
И(У,Ах, В,Сх) = х
т
Рх+-^х
т
РВтВРх
+\х
т
СтСх = 0.
27
2
13
Система, удовлетворяющая (5.34) и (5.35), будет определена в следующей главе как пассивная
система. В параграфе 6.5 мы исследуем ее как соединение двух пассивных систем, осуществленное
посредством обратной связи.
226
ГЛАВА 5
Следовательно, система /^-устойчива с конечным коэффициентом усиления, зна
чение которого меньше либо равно η. Этот результат представляет собой другой
метод вычисления верхней границы L<i -коэффициента усиления, отличный от
частотного метода, предложенного в теореме 5.4. Интересно отметить, что суще
ствование положительно полуопределенного решения (5.36) является необходи
мым и достаточным условием того, что Сч -коэффициент усиления меньше либо
равен 7
14
·
Δ
В теореме 5.5 мы предположили, что условия выполнены глобально. Из
доказательства этой теоремы очевидно, что если условия выполнены лишь на
конечной области D, то неравенство (5.30) выполнено до тех пор, пока реше
ние (5.26) остается в D.
Следствие 5.4. Предположим, что условия теоремы 5.5 выполнены в обла
стиDСRn
, содержащей начало координат. Тогда для любого XQ Ε D и любого
и € £*2е> при котором решение (5.26) удовлетворяет x(t) £ D для всех t Ε [0, г],
справедлива оценка
\\УТ\\С2**Ч\Ы\С2
+
У/2УЫ·
Тот факт, что решение x(t) уравнения (5.26) остается при достаточно ма
лых ||хо|| и supo^t^r ||tfc(t)|| в некоторой окрестности начала координат, сле
дует из асимптотической устойчивости начала координат системы х = f(x).
Этот результат используется в следующей лемме для установления свойства Сч-
устойчивости при малом входном сигнале.
Лемма 5.1. Предположим, что условия теоремы 5.5 выполнены в области
DСRn
, содержащей начало координат, f(x) — непрерывно дифференцируемая
функция и х = 0 — асимптотически устойчивая точка равновесия системы х =
= f(x). Тогда существует константа к\ > 0, такая что для любого #ο? ||#о|| <
к\, система (5.26)-(5.27) является ^-устойчивой при малом входном сигнале
с конечным коэффициентом усиления, значение которого меньше либо равно η.
ДОКАЗАТЕЛЬСТВО. Выберем г > 0 так, чтобы {||х|| ^ г} с D. Из обратной
теоремы Ляпунова 4.16 следует, что существует константа го > 0 и непрерывно
дифференцируемая функция Ляпунова W(x)9 удовлетворяющая
ai(||x||) < W(x) < a2(||*||),
Ш-Пх) < -аз(||*||)
для всех ||х|| < го, где ai,c*2 и аз — некоторые /С-функции. Производная W(x)
вдоль траекторий (5.26) удовлетворяет
w(x) = т^/(*.о) + fjr
[/(x
'
u)
"
/(ж
'
0)]
^"
аз(||ж||) + kLM
^
14
Необходимость доказана в [54].
5.3. £2-КОЭФФИЦИЕНТ УСИЛЕНИЯ
227
^ -(1 - 0)а3(|М|) - ваг(\\х\\) + kL sup ||u(t)|| ^
<-(1-в)аз(1И), VM^a^f вир ||«(*)ΙΙ/Λ
где к — верхняя граница для ||<9W/dx||, L — константа Липшица для функ
ции /погАиО<0<1. Аналогично тому, как это было сделано в тео
реме 5.2, мы можем применить теорему 4.18 и показать, что существует К,С-
функция /3, /С-функция 7о
и
положительные константы к\ и &2> такие что
для любого начального состояния #о> ||#о|| ^ &ъ
и
любого входного сигнала
и(£), supo^^r ||^(011 ^ к2, решение x(t) удовлетворяет оценке
\\x(t)\\<P(\\xolt)+^o(
snp \\u(t)\\)
для всех 0 ^ t ^ т. Таким образом, выбирая константы к\ и к2 достаточно
малыми, мы можем обеспечить \\x(t)\\ < г для всех 0 ^ t < т. Тогда утверждение
леммы следует из следствия 5.4.
Π
При использовании леммы 5.1 необходимо проверять наличие свойства
асимптотической устойчивости начала координат системы х — f{x). Это может
быть выполнено с использованием метода линеаризации или путем нахождения
подходящей функции Ляпунова. В следующей лемме показано, что при выполне
нии определенных условий в качестве такой функции Ляпунова можно использо
вать ту же функцию V, что удовлетворяет неравенству Гамильтона-Якоби (5.28).
Лемма 5.2. Предположим, что условия теоремы 5.5 выполнены в области
DСRn
, содержащей начало координат, f(x) — непрерывно дифференцируе
мая функция и не существует решения, отличного от тривиального x(t) = 0,
которое постоянно остается в S = {х € D \ h{x) = 0}. Тогда начало коорди
нат системы х = f(x) асимптотически устойчиво и существует константа
к\ > 0, такая что для любого а?о, ||жо|| < к\, система (5.2б)-(5.27) является
С^-устойчивой при малом входном сигнале с конечным коэффициентом усиления,
значение которого меньше либо равно η.
ДОКАЗАТЕЛЬСТВО. Пусть u{t) ΞΞ 0. С учетом (5.28) имеем
V{x) = |£/(я) < -\hT(x)h{x),
Мх€D.
(5.37)
Пусть константа г > 0 такова, что ВТ — {\\х\\ < г} С D. Мы покажем, что
V(x) положительно определена на Вг. Предположим, что <j>(t\ х) — решение х —
—
f(x), начинающееся в ф(0;х) — х Е Br. Из теоремы 3.1 (о существовании
и единственности решения) и теоремы 3.4 (о непрерывной зависимости решения
от начальных данных) следует, что существует δ > 0, такое что для любого
х Ε Вг решение ф(Ь;х) остается в D для всех t Ε [0,5]. Интегрируя (5.37)
228
ГЛАВА 5
на [0,г], г ^ δ, получаем
У(ф(т;х)) - V(x) < -\ f \\hNo;x))\\l dt.
С учетом У(ф(Р, х)) ^ 0 можно записать
V(x) > ± f \\h(<f>(t;x))\\l dt.
Предположим, что существует х φ О, такое что V(x) — 0. Из предыдущего
неравенства следует, что
\\h((f>(t;x))\\ldt = 0, Vr£ [0,5] =» к{ф{Ь,х)) = О, Vi £ [0,<5].
Поскольку на этом интервале времени решение остается в S и по предположе
нию единственным решением, остающимся в S, является тривиальное решение,
мы можем заключить, что ф{Ь\х) = 0 => я = 0. Таким образом, V(x) поло
жительно определена на Вг. Используя V(x) в качестве функции Ляпунова для
х = /(#), можно показать с использованием (5.37) и принципа инвариантности
Ла-Салля (следствие 4.1), что начало координат системы х = f(x) асимптотиче
ски устойчиво. Применяя лемму 5.1, завершаем доказательство.
Π
Пример 5.12. Продолжая анализ, начатый в примерах 5.8 и 5.9, рассмотрим
несколько модифицированную систему
±1=Х2,
±2= -a(xi -7)#i)- кх2+и,
где а и к — положительные константы. Функция V(x) = а[а{х\/2 — х\/12) +
+ Ж2/2], OL > 0, является положительно полуопределенной на множестве {\xi\ <
< v6}. Используя функцию V(x) в качестве кандидата на решение неравенства
Гамильтона-Якоби (5.28), можно показать, что
n^(V,f,G,h,l)=(-ak+^
+ Uxl
Повторяя рассуждения примера 5.8, можно легко показать, что выбор а = η =
= 1/к обеспечивает выполнение неравенства (5.28) для всех х £ В?. Поскольку
условия теоремы 5.5 глобально не выполняются, мы исследуем, используя лем
му 5.1, вопрос об устойчивости при малом входном сигнале с конечным коэффи
циентом усиления. Нам необходимо показать, что начало координат свободной
системы асимптотически устойчиво. Это может быть сделано методом линеари-
5.4. ТЕОРЕМА О МАЛОМ КОЭФФИЦИЕНТЕ УСИЛЕНИЯ
229
зации в окрестности начала координат, что приводит к линейной системе с гур-
вицевой матрицей. Альтернативно мы можем применить лемму 5.2, условия ко
торой выполнены в области D = {\х\\ < л/3}, поскольку
x2(t) Ξ0=> xi(t)[3 - xl(t)] = О => xi(t) = 0.
Таким образом, система является /^-устойчивой при малом входном сигнале
с конечным коэффициентом усиления меньшим либо равным 1/к.
Δ
5.4. Системы с обратной связью: теорема о малом коэффициенте
усиления
Формализм устойчивости по «входу-выходу» играет важную роль при ис
следовании устойчивости соединения систем, поскольку коэффициент усиления
системы позволяет нам увеличивать или уменьшать норму сигнала, проходящего
через эту систему В частности, это имеет место в изображенном на рисунке 5.1
соединении двух систем при помощи обратных связей. Система имеет две под
системы Н\ : СTM —> С% и #2 · £>е —> £TM· Предположим, что обе системы
^-устойчивы с конечным коэффициентом усиления,
15
т.е.
ЫЛс^ъЫс
+ Ри Veie/£\ Vr e [0,oo),
(5.38)
WttorWc^-nlMc + fo, Ve2eCl Vre[0,oo).
(5.39)
Предположим также, что система с обратной связью корректно определена (well
defined) в том смысле, что для любой пары входных сигналов щ Ε СTM и щ Ε С%
существуют единственные выходы ей у2 Ε £TM и e2,yi Ε С%}6 Определим
61
1
е
2J'
Нас интересует вопрос о /^-устойчивости с конечным коэффициентом усиления
замкнутой системы, обратная связь в которой рассматривается как отображение
от входа и к выходу е или как отображение от входа и к выходу у.
11
Нетруд
но проверить (см. упражнение 5.17), что отображение от и к е является £-
устойчивым с конечным коэффициентом усиления, если и только если отображе
ние от и к у является ^-устойчивым с конечным коэффициентом усиления. Сле
довательно, мы можем говорить, что обратная связь ^-устойчива с конечным ко
эффициентом усиления, если одно из этих отображений является ^-устойчивым
15
В этом параграфе мы представим вариант классической теоремы о малом коэффициенте уси
ления (small gain theorem) для случая /^-устойчивости с конечным коэффициентом усиления. Более
общие теоремы для случая /^-устойчивости приведены в работах [93] и [123].
16
Достаточные условия существования и единственности решений могут быть найдены в ли
тературе. Общепринятым методом установления этих свойств является использование принципа
сжимающего отображения. (См., например, [53, теорема III.3.1].) Другой подход, использующий
факт существования и единственности решений уравнений состояния, изложен в [93].
17
См. упражнение 5.20, в котором рассматривается вопрос: почему при исследовании устойчи
вости связанных обратной связью систем следует рассматривать как входы, так и выходы.
щ
и2
JУ=
УУ
У2
>
е
=
230
ГЛАВА 5
с конечным коэффициентом усиления. В следующей теореме сформулированы
достаточные условия для того, чтобы система с обратными связями являлась С-
устойчивой с конечным коэффициентом усиления.
Щ
Ф-^
в,
Ух
&#о
Ч fS+^
Рис. 5.1. Соединение систем с обратной связью
Теорема 5.6. В условиях вышеприведенных предположений система явля
ется С-устойчивой с конечным коэффициентом усиления, если 7172 < 1·
ДОКАЗАТЕЛЬСТВО. Предполагая, что решение существует, можно записать
е1т = uir - (#2е2)т,
е2т=и2т-
(Н\е\)т.
Тогда
leirlk < ||tiir||£ + ll(#2e2)r||£ < INrk +72||e2r|k + & <
< lltiirk + I2(\\u2r\\c + 7i||eir||r + Pi) + fo =
= 7i72||eir||£ + (||wir ||£ + 72||^2r||/: + fo + 72A).
Поскольку 7i72 < 1,
HeirlU <
1
1_ 7l72
для всех τ € [0, оо). Аналогично
1
\е2т\\с <
'7П2
||«1т||£ + 72||«2r||£ + 02 + 72/3l)
l|«2r \\c + 71 \\uir\\c + Pi+ 7i&)
(5.40)
(5.41)
для всех г G [0,оо). Тогда утверждение теоремы следует из неравенства тре
угольника \\е\\с < \\ei\\c + ||е2||£.
•
Изображенная на рисунке 5.1 система представляет собой удобную модель
для исследования робастности динамических систем. Очень часто динамические
системы, имеющие некоторые неопределенности в своей модели, могут быть
представлены в виде соединения систем, в которых подсистема Н\ выступает
5.4 . ТЕОРЕМА О МАЛОМ КОЭФФИЦИЕНТЕ УСИЛЕНИЯ
231
в роли устойчивой номинальной системы, а подсистема Н2 — в роли устой
чивого возмущения. В этом случае условие 7172 < 1 будет выполнено при
достаточно малом значении 72» Таким образом, теорема о малом коэффициен
те обратной связи представляет собой концептуальную основу для понимания
множества результатов в теории робастности динамических систем, и это спра
ведливо особенно в тех случаях, когда в этих системах присутствует обратная
связь.
Пример 5.13. Рассмотрим систему с обратной связью, изображенную на
рисунке 5.1. Пусть в качестве #i выступает линейная, не зависящая от времени
система с гурвицевой квадратной передаточной матрицей G(s) = C(sI — A)~
1
B.
Пусть #2 — функция без памяти y2 = 4>(t,y2), удовлетворяющая
И*,у)1|2<тй11»112, vt^o, v»€ir.
Из теоремы 5.4 следует, что Hi является /^-устойчивой с конечной обратной
связью, £2 -коэффициент которой определяется равенством
71 = sup||G(jw)||2.
u>eR
В примере 5.1 мы видели, что Н2 является ^2-устойчивой с конечной обрат
ной связью, £2 -коэффициент которой меньше либо равен 72· В предположении,
что система с обратной связью является корректно определенной, мы можем за
ключить с использованием теоремы о малом коэффициенте усиления, что эта
система /^-устойчива с конечным коэффициентом усиления, если 7172 < 1. Δ
Пример 5.14. Рассмотрим систему
i = /(t,a;,v + di(*)),
ez =Az +В[и+d2{t)\,
ν=Cz,
где / — гладкая функция своих аргументов, А — гурвицева матрица, —СА~
1
В=
= J, ε — малый положительный параметр и di, cfe — возмущения. Линейная часть
этой модели описывает динамику исполнительного устройства, которая обычно
является более быстрой по сравнению с динамикой объекта управления, пред
ставленной в нашем примере нелинейным уравнением х = /. Возмущения di
и б?2 входят в систему соответственно через вход объекта управления и через
вход исполнительного устройства. Предположим, что возмущения принадлежат
классу сигналов £, в качестве которого может выступать любое £р-пространство,
и цель управления заключается в том, чтобы уменьшить результат воздействия
этих возмущений на состояние системы х. Эта цель может быть достигнута,
если обратная связь построена таким образом, чтобы отображение вход-выход
замкнутой системы, сопоставляющее вектор возмущений (d^efe) вектору состо
яния х, являлось ^-устойчивым с конечным коэффициентом усиления, значение
232
ГЛАВА 5
которого меньше некоторой заданной величины δ > 0. Для упрощения задачи
построения подобной обратной связи обычно пренебрегают динамикой испол
нительного устройства, полагая ε — 0 и подставляя υ — —СА~
г
В(и+d2)—и+
+ d2 в уравнение объекта управления. В результате исследуемая модель сводится
к следующей:
х — f(t,x,u + d),
где d = d\ 4- d2. Предполагая, что переменные состояния могут быть измерены,
мы используем эту модель для синтеза обратной связи и = j(t,x)9 обеспечива
ющей достижение цели управления. Предположим, что мы успешно построили
такую гладкую обратную связь, обеспечивающую выполнение неравенства
INLc<7NU + /?
(5.42)
при 7 < 5. Обеспечивает ли это управление выполнение цели управления, если
применить его к исходной системе, в которой присутствует динамика исполни
тельного устройства? Этот вопрос составляет существо проблемы робастности
алгоритма управления по отношению к немоделируемой динамике исполнитель
ного устройства
18
. Уравнение исходной системы, замкнутой найденным законом
управления, имеет следующий вид:
x^f^x^Cz
+ d^t)),
ez = Az + B[y(t,x) + d2(t)].
Предположим, что d2(t) дифференцируема и d2 € С. Замена переменных
η=Ζ+Α-
1
Β[η(1,Χ) + α2(1)]
приводит замкнутую систему к виду
x = /(t,a,7(*,aO + d(t) + Cq),
εη=Αη+εΑ~
1
Β[η + d2(t)],
где
7 = ^ + |£/(*,а,7(*,з) + d(t) + Οη).
Легко видеть, что замкнутая система может быть представлена изображенной на
рисунке 5.1 схемой, где Н\ определена системой
i = /(t,ar,7(^a:) + ei),
2/1=7 =η£+^j:/(*>
х
>7(*5ж)+ei),
В примере 11.14 мы исследуем с использованием теории возмущений аналогичную задачу
робастности.
5.4 . ТЕОРЕМА О МАЛОМ КОЭФФИЦИЕНТЕ УСИЛЕНИЯ
233
#2 определена системой
η=±Αη+Α~
1
Ββ2,
У2 = -Сг)
и
Щ—d\+б?2=d,
и2—d2.
В этом представлении система Н\ является номинальной редуцированной за
мкнутой системой, а Н2 представляет собой эффект воздействия на поведение
системы немоделируемой динамики. Заметим, что при ε = 0 замкнутая систе
ма сводится к номинальной системе. Предположим, что функция обратной связи
удовлетворяет неравенству
^
+ !^/(M>7(*,*)+ei) <ci||s||+C2||ei||
(5.43)
для всех (£,x,ei), где с\ и с2 — неотрицательные константы. С использовани
ем (5.42) и (5.43) можно показать, что
\\yi\\c <7i||ei||£ + /3i,
где
71 =ci7 + c2, /?i
=cip.
Поскольку Н2 — линейная, не зависящая от времени система и А — гурвицева
матрица, мы можем применить следствие 5.2 и показать, что Н2 является Cv-
устойчивой с конечным коэффициентом усиления для любого ρ 6 [1, оо] и
\\У2\\с < 72||е2||£ + /?2 = ^7/||е2||£ + β2,
где
2A^(Q)P-
1
5||2|1C1|2
/AmaxCQ)
если ρ=оо,
если ρ б [1,οο)
и Q — решение уравнения Ляпунова QA + A
T
Q=—I.
19
Таким образом, в пред
положении, что система с обратной связью корректно определена, заключаем
с использованием теоремы о малом коэффициенте усиления, что отображение
вход-выход от и к е является ^-устойчивым. Используя (5.40), получаем
No <η_* ^ОЫк+ЫЫ\с +&rffa+β2].
19
Матрица Ρ из следствия 5.2 в рассматриваемом случае равна eQ и, следовательно,
(sQ)(A/e) + (A/e)
T
(eQ) =
-I.
234
ГЛАВА 5
Из (5.42) следует, что
\\x\\c^i\\ei\\c + P.
Тогда по определению щ и ич
WA\L<!_I [Hie+ЫШк +£7/ft+ft]+β- (5-44)
Интересно отметить, что правая часть (5.44) стремится при ε —> 0 к
7|И|£+/?+7&.
Из этого следует, что при достаточно малом ε значение верхней границы С-
коэффициента усиления отображения от d к х для исходной замкнутой системы
будет достаточно близко к соответствующей величине для номинальной замкну
той системы.
Δ
5.5. Упражнения
5.1. Покажите, что последовательное соединение двух ^-устойчивых (соответ
ственно ^-устойчивых с конечным коэффициентом усиления) систем является
^-устойчивой (соответственно ^-устойчивой с конечным коэффициентом усиле
ния) системой.
5.2. Покажите, что параллельное соединение двух ^-устойчивых (соответствен
но ^-устойчивых с конечным коэффициентом усиления) систем является £-
устойчивой (соответственно ^-устойчивой с конечным коэффициентом усиле
ния) системой.
5.3. Рассмотрим систему, определенную функцией без памяти у = и
1
^.
(a) Покажите, что система £оо-устойчива с нулевым смещением.
(b) Покажите, что для любой положительной константы а система является С^-
устойчивой с конечным коэффициентом усиления при η = а и β = 1/α)1/
2
.
(c) Сравните эти два результата.
5.4. Рассмотрим систему, определенную функцией без памяти у = h(u)9 где h :
Rm
—>R
q
—
глобально липшицевая функция. Исследуйте систему на предмет ее
^-устойчивости для каждого ре [1, сю] в следующих случаях:
(1)МО)=0;
(2) /i(0) φ 0.
5.5. Исследуйте реле с характеристиками, изображенными на рисунке 5.2, на
предмет их £оо- и ^-устойчивости.
5.6. Проверьте, что D
+
W(t) удовлетворяет (5.12) при V(t,x(t)) = 0.
Указание: используя упражнение 3.24, покажите, что V(t + ft, x(t + h)) <
^ C4h2L
2
\\u\\
2
/2 + ho(h), где o(h)/h —> 0 при h —> 0. После этого используйте
неравенство с\ ^ 2с\.
5.5. УПРАЖНЕНИЯ
235
(а)
У\
(Ь)
У\
» '—^-
(с)
(d)
Рис. 5.2. Характеристики реле: (а) реле с гистерезисом, (Ь) реле с зоной нечувствитель
ности и гистерезисом, (с) идеальное реле, (d) реле с зоной нечувствительности
5.7. Предположим, что все условия теоремы 5.1 выполнены за исключением
неравенства (5.10). Покажите, что если это неравенство заменить на
||Л(*,Ж,7х)|| ^7/i||x|| +%|H| +7/3, 7/3 > 0,
то система является Соо-устойчивой при малом входном сигнале с конечным ко
эффициентом усиления (или Соо-устойчивой с конечным коэффициентом усиле
ния, если условия выполнены глобально). Определите константы η и β в (5.11).
5.8. Предположим, что все условия теоремы 5.1 выполнены за исключением
неравенства (5.10). Покажите, что если это неравенство заменить на (5.20), то си
стема является Соо -устойчивой при малом входном сигнале (или Соо -устойчивой,
если условия выполнены глобально).
5.9. Получите результат, аналогичный следствию 5.2 для линейной, зависящей от
времени системы.
5.10. Для каждой из следующих систем выполните исследование на предмет их
Соо -устойчивости и Соо -устойчивости с конечным коэффициентом усиления:
х= -(1+и)х
3
,
, νх=-(1+и)х
г
-
х
5
,
у=ж;
^
у=х+щ
х=—х/{1+х
2
) +w,
у=х/(1+х
2
)]
5.11. Для каждой из следующих систем выполните исследование на предмет их
£<х> -устойчивости и Соо -устойчивости с конечным коэффициентом усиления:
(1)
(3)
/л\
X—
X
X
| XLL%
(4)
v
'
у = xsmu.
(1) xi = -х\ +х\х<2,, Х2
-х\-Х2 + и,
у=хг;
236
ГЛАВА 5
(2)Х\= —Xi+Х2,
±2= —х\-Х2+U, у —Х2\
(3)±i=(xi+u)(||a:|||- 1), х2 =ж2(||ж||2- 1), У = яг,
(4)xi= -xi- х24-г*1,
х2=х\-
х\+и2,
у = ^i(x2 + tti);
(5)±i= —Xi+Х^,
Х2=#1-Х2+Щ
у= Xi+Щ
(6)Xi=Х2,
Х2= ~х\ -X2+U, у=Х2\
(7)xi= -xi - х2,
Х2=xi-Х2+щ
y{t) = x\{t - Τ),
Т>0.
5.12. Рассмотрим систему
Х1=Х2,
Х2 = -У -Ку)+Щ
У = Х\+Х2,
где /i — непрерывно дифференцируемая функция, h(0) = 0 и z/i(z) > az
2
для
всех г е R и некоторой константы α > 0. Покажите, что система является Lp-
устойчивой с конечным коэффициентом усиления для всех ρ € [1, оо].
5.13 [192]. Рассмотрим зависящую от времени систему
х = /(ж,гг),
у = h(x,u),
где / — локально липшицева функция, h — непрерывная функция, /(0,0) = 0
и /i(0,0) = 0. Предположим, что существует непрерывно дифференцируемая,
положительно определенная и радиально неограниченная функция V(x)9 такая
что
^f(x,u)^-W(x)
+ il>(u), V(x,u),
где W(x) — непрерывная, положительно определенная и радиально неограничен
ная функция, φ (и) — непрерывная функция и ^(0) = 0. Покажите, что система
является £оо-устойчивой.
5.14. Пусть H(s) — гурвицева, строго собственная передаточная функция
иh(t)=£
_1
{iir(s)} — соответствующая импульсная характеристика. Покажи
те, что
/•оо
sup|tf(ju;)| ^ / \h(t)\dt.
о;€Я
J0
5.15. Докажите, что следующие системы являются С2 -устойчивыми с конеч
ным коэффициентом усиления (или /^-устойчивыми при малом входном сиг
нале с конечным коэффициентом усиления), и определите верхнюю границу С2-
коэффициента усиления:
XI=Х2,
XI = —Х2,
/+\Х2= —&sinх\—кх2+щ
,9ч х2=xi—х2sat(x|—ж§)+
х
^
и
->
У=»2,
ХЗ = X3Sat(x2 - Х3) - #3^,
α>0,к>0;
у —х\- х\\
Х\=Х2,
#1=%2,
(3)Х2=xi-sat(2xi+х2)+и,
(4) Х2= -(1+ х\)х2 —х\ + xiu,
У =Xl\
У =Х\Х2-
5.5 . УПРАЖНЕНИЯ
237
5.16. Рассмотрим систему
Х\= -Х\+Х2, Х2= -Х\-σ{Χ\)-Х2+U, у=£2,
где σ — локально липшицева функция, σ(0) = 0 и za(z) > 0 для всех z e R.
(a) Является ли эта система £оо-устойчивой?
(b) Является ли эта система ^-устойчивой с конечным коэффициентом усиле
ния? Если да, найдите верхнюю границу £2-коэффициента усиления.
5.17 ([77]). Рассмотрим систему
х=f(x) +G(x)u, у =h(x)+ J(x)u,
где /, G, h и J — гладкие функции от х. Предположим, что существует положи
тельная константа 7> такая что η
2
Ι—J
T
(x)J(x) > 0 и
<H-dVf.l
hTJ+^-G
ox
tfi-^j)-
1
OX
+
+\h
T
h<0
для всех х. Покажите, что система /^-устойчива с конечным коэффициентом
усиления, значение которого меньше либо равно η.
Указание: пусть
7
2
/-J
T
(x)J(x) = W
T
{x)W(x),
L(x) =
-[WT(x)) -1
hT(x)J{x) + ^G(x)
iT
Покажите, что для любого и выполнено следующее неравенство
g/ +^Gu = -\[L +Wuf[L +Wu]+\u
T
u -\yTy+H.
5.18 ([199]). Рассмотрим систему:
x = f(x) + G(x)u + K(x)w,
у = ft(x),
где и — управление и w — возмущение. Функции f,GyKnh
—
гладкие, /(0) =
= 0, h(0) = 0. Пусть 7 > 0. Предположим, что существует гладкая, положитель
но полуопределенная функция V(x), удовлетворяющая при всех х неравенству
&'<»+*£ \к{х)Кт(х)
-
G(x)GT(x) {%)T
+lh
T
(x)h(x)^0.
238
ГЛАВА 5
той системы отображение от w к
является С,2 -устойчивым с конечным
Покажите, что если управление имеет вид и — —G
T
(x)(dV/dx)
T
,
то для замкну-
У
и
коэффициентом усиления, значение которого меньше либо равно η.
5.19 ([200]). В этом упражнении показывается, что £2-коэффициент усиления ли
нейной, не зависящей от времени системы (5.24)-(5.25) с гурвицевой матрицей А
не зависит от того, на каком промежутке определено пространство функций —
на R+ = [0, сю) или на R = (—оо,оо). Пусть £2 — пространство интегрируе
мых с квадратом функций на Д+ с нормой ||w||£2 = f£°u
T
(t)u(t) dt и L<iR —
пространство интегрируемых с квадратом функций на R с нормой ||w||£
=
—
J^QO u
T
(t)u(t) dt. Пусть 72 и 72# — /^-коэффициенты усиления для £2 и £2я
соответственно. Поскольку £2 является подмножеством £2д, можно заключить,
что 72 ^ 72Д· Мы докажем, что 72 = 72Я> показав, что для любой ε > 0 суще
ствует сигнал и € £2, такой что у е С2и \\у\\с2 ^ (1 ~ е)72я1М|£2·
(а) Покажите, что для заданной константы ε > 0 можно всегда найти константу
0<δ<1,такуючто
1-ε/2-y/δ
VT^d
>\-ε.
(b) Покажите, что всегда можно найти и € C2R и момент времени t\ < 00,
такие что
Ыья
=1- IMk*>(i-|),f_
X
u
T
(t)u(t) dt = δ.
(c) Пусть u(t) = u\(t) + U2(t), где и\ равно нулю при t < t\ и U2 равно нулю
при t > t\. Пусть yi(t) — выход, соответствующий входу u\(t). Покажите,
что
\Ы\с2Н . 1 -ε/2 -y/δ
й—Π
>
/===—72й >{1-
ehzR-
(d) Для всех t ^ 0 определим вход и выход равенствами u(t) = u\{t + t\)
и y(t) = yi(t +1\). Покажите, что и и у принадлежат £2, у — выход, соот
ветствующий u(t)9 и \\у\\с2 > (1 - е)ч2п\\и\\с2.
5.20. Рассмотрим соединение систем, изображенное на рисунке 5.1, где Hi
и #2 — линейные, не зависящие от времени системы, представленные переда
точными функциями Hi(s) = (s — l)/(s — 1) и #2(s) = 1/(5 —
1)· Найдите
передаточные функции замкнутой системы от {u\,U2) к (2/1,2/2) и от (t/i,^)
к (ei, в2). Используйте эти передаточные функции для ответа на вопрос: почему
при исследовании систем с обратной связью следует рассматривать как входы
(ui,u2), так и выходы (еье2) (или (2/1,2/2)).
5.21. Рассмотрим систему с обратной связью, изображенную на рисунке 5.1. По
кажите, что отображение от (щ, г^) к (2/1,2/2) является £-устойчивым с конечным
5.5 . УПРАЖНЕНИЯ
239
коэффициентом усиления, если и только если отображение от (щ^щ) к (ei,e2)
является ^-устойчивым с конечным коэффициентом усиления.
5.22. Пусть в примере 5.14 o^W = a sinut, где а и ω — положительные констан
ты.
(a) Покажите, что при достаточно малом ε состояние замкнутой системы рав
номерно ограничено.
(b) Исследуйте эффект увеличения ω.
5.23. Рассмотрим систему с обратной связью, изображенную на рисунке 5.1,
где Hi и #2 заданы равенствами
(XI = -Х\ +Х2,
±2= —х\—Х2+ei, и #2:
2/1 =^2
Пусть162=0,w =wi—входиу =г/1—выходсистемы.
(a) Используя х = [жьЖ2>#з]
тв
качестве вектора состояния, постройте модель
состояния системы.
(b) Является ли эта система £2-устойчивой?
хз=-х\ +е2,
у2 = (l/2)*g.
ГЛАВА 6
Пассивность
Понятие пассивности представляет собой удобное средство для анализа
нелинейных систем и тесно связано с теорией устойчивости Ляпунова и поняти
ем ^2-устойчивости. В параграфе 6Л мы дадим определение пассивности нели-
нейностей, представленных функцией без памяти
1
. В параграфе 6.2 это опреде
ление будет обобщено на случай динамических систем, представленных в форме
модели состояния. В обоих случаях в качестве мотивирующих примеров будут
служить различные электрические цепи. В параграфе 6.3 будут рассмотрены по
ложительно вещественные и строго положительно вещественные передаточные
функции, а также показано, что эти функции определяют соответственно пас
сивные и строго пассивные системы. Связь между теорией пассивности и тео
риями Ляпунова и L<i -устойчивости исследуется в параграфе 6.4. Эти первые
четыре параграфа являются методологической основой для формулировки основ
ных результатов этой главы — теорем о пассивности, представленных в парагра
фе 6.5. В основной теореме о пассивности утверждается, что соединение систем
с {отрицательной) обратной связью, состоящее из двух пассивных систем, яв
ляется пассивным. При выполнении дополнительного условия наблюдаемости
этого соединения систем оно является асимптотически устойчивым. Теоремы
о пассивности, представленные в параграфе 6.5, а также теорема о малом ко
эффициенте усиления, сформулированная в параграфе 5.4, позволяют получить
концептуально важное обобщение того факта, что соединение систем с обратной
связью, состоящее из двух устойчивых линейных систем, будет устойчиво, если
контурный коэффициент усиления меньше единицы или если контурный сдвиг
по фазе меньше 180 градусов. Связь между пассивностью и фазой передаточ
ной функции может быть выявлена с использованием частотной характеризации
положительно вещественных передаточных функций, данной в параграфе 6.3.
В этом же параграфе утверждается, что фаза положительно вещественной пе
редаточной функции не может превышать 90 градусов и, следовательно, общий
фазовый сдвиг не может превышать 180 градусов. Если одна из двух переда
точных функций является строго положительно вещественной, фаза обратной
связи будет строго меньше 180 градусов. В параграфе 6.5 исследуются замены
обратной связи, которые позволяют в некоторых случаях преобразовать систему
с обратной связью, состоящих из двух подсистем и не являющуюся пассивной
1
В аналогичных случаях часто используются термины «статическая нелинейность», «безынер
ционная нелинейность». При переводе был оставлен авторский вариант. — Прим. ред. перев.
6.1. ФУНКЦИИ БЕЗ ПАМЯТИ
241
системой, в соединение систем с обратной связью, состоящее из двух пассивных
подсистем. Этот результат усиливает теоретическую ценность теорем о пассив
ности.
6.1. Функции без памяти
В этом параграфе мы дадим определение пассивности статической системы,
описываемой функцией у = h(tyu), где h : [0,оо) х В? —• RP. Мотивирующим
примером будет служить электрическая цепь, изображенная на рисунке 6.1(a).
Эта цепь состоит из резистора, через который течет ток у и на котором падает
напряжение и. Резистор пассивен, если поступающая в систему мощность всегда
неотрицательна, т. е. если иу ^ 0 для всех точек (щ у) на у — ^ -характеристике.
Это означает, что кривая и — у должна лежать в первом и третьем квадранте (см.
рисунок 6.1(b)). Простейшим резистором, удовлетворяющим этим требованиям,
является линейный резистор, ток в котором удовлетворяет закону Ома и = Ry
или у = Gu, где R — сопротивление резистора и G = 1/R — его проводимость.
Если величина сопротивления положительна, и — у -характеристика представляет
собой прямую линию с тангенсом углом наклона G и произведение иу = Gu
2
всегда неотрицательно. На самом деле эта величина почти всегда положительна,
за исключением точки начала координат (0,0). Нелинейные пассивные резисто
ры имеют нелинейные и — ^ -характеристики, и эти кривые также лежат в пер
вом и третьем квадрантах (см. рисунки 6.2(a) и 6.2(b)). Заметим, что характери
стика туннельного диода, изображенная на рисунке 6.2(b), остается пассивной,
несмотря на то что ее кривая имеет в некоторых областях отрицательный тангенс
угла наклона касательной. В качестве примера элемента, не являющегося пас
сивным, можно использовать отрицательный резистор с и — ^-характеристикой,
изображенной на рисунке 6.2(c). Этот элемент был рассмотрен в параграфе 1.2.4
в качестве генератора с отрицательным сопротивлением. Чтобы реализовать по
добную характеристику, необходимо применять активные устройства, например
цепь с двумя туннельными диодами, изображенную на рисунке 1.7. В много
полюсных цепях (с несколькими портами), для описания которых используются
векторные значения и и у, поступление мощности в систему равно скалярно
му произведению и
т
у = Y%=iUiVi = ΣΧ=1 щЫ(и). Эта сеть пассивна, если
и
т
у > 0 для всех и. Далее мы абстрагируемся от рассмотренной выше физиче
ской природы концепции пассивности и введем это понятие для любой функции
у = h(t,u). Мы будем рассматривать величину и
т
у как поток мощности, по
ступающей в систему, и будем говорить, что система пассивна, если и
т
у^0
для всех и. В скалярном случае график соотношения вход-выход должен лежать
в первом и третьем квадранте. Мы также будем говорить, что график принад
лежит сектору [0, оо], где нуль и бесконечность — это тангенсы углов наклона
границ первого и третьего квадрантов. Это графическое представление остается
верным, если h зависит от времени. В этом случае и — ^ -характеристика зависит
от времени, но всегда принадлежит сектору [0, оо]. Для векторных функций мы
можем дать аналогичное графическое представление в специальном случае, когда
242
ГЛАВА 6
компоненты функции h(t,u) развязаны (decoupled) в том смысле, что hi(t,u) за
висит только от щ:
h(t,u)
h2(t,u2)
(6.1)
hp(t,up)
В этом случае график каждого компонента этого вектора принадлежит сектору
[О, оо]. В общей ситуации подобное графическое представление отсутствует, но
мы будем продолжать использовать термин «сектор», говоря, что h принадлежит
сектору [0,оо], если u
T
h(tyu) ^ 0 для всех (t,u).
+
и
—
У
^>
<г"
(а)
у\
1
(Ь)
и
Рис. 6.1. (а) Пассивный резистор; (Ь) и — ^-характеристика лежит в первом и третьем
квадрантах
KJ
(а)
(Ъ)
Рис. 6.2. (а) и (Ь) — примеры нелинейных характеристик пассивного резистора; (с) —
пример не пассивного резистора
В некотором смысле вырожденный случай пассивности возникает при
и
т
у — 0. В подобных ситуациях мы будем говорить, что система не имеет потерь.
В качестве примера такой системы можно использовать идеальный трансформа
тор, схема которого изображена на рисунке 6.3,
Имеем у = Su, где
VI
V2
У
Ч
V2
0-N
N0
Матрица S является кососимметрической, т. е. S+S
T
= 0. Следовательно, и
т
у=
=u
T
Su = (l/2)u
T
(S +S
T
)u=и.
6.1. ФУНКЦИИ БЕЗ ПАМЯТИ
243
+
+
ν2=Ννλ
Рис. 6.3. Идеальный трансформатор
Рассмотрим функцию h, удовлетворяющую и
т
у ^ 4Τφ{ν), где <р{и) — неко
торая функция. Если и
Т
(р(и) > 0 для всех и ψ О, то h называется строго пассив
ной по входу, поскольку свойство пассивности выполняется строго, т. е. и
Т
у =О,
только если и = 0. Для скалярного случая это эквивалентно тому, что график
и — ^-характеристики не касается и-оси в точках, отличных от начала координат.
Величина ητφ(η) представляет собой «избыток» пассивности. С другой стороны,
если u
T
ip(u) принимает при некоторых и отрицательное значение, то функция h
не обязательно является пассивной и в этом случае величина и
т
<р(и) представ
ляет собой «недостаток» пассивности. Сущность понятий избытка и недостатка
пассивности можно легко понять, если рассмотреть ситуацию, когда h является
скалярной и ψ{ν) = ей. В этом случае h принадлежит сектору [ε, οο] (см. ри
сунок 6.4) и избыток пассивности имеет место при ε > 0, а недостаток — при
ε < 0. Избыток или недостаток пассивности могут быть устранены путем вве
дения в систему прямой связи по входу (input feedforward) (см. рисунок 6.4(c)).
Тогда, определив новый выход равенством у = у — <р(и)9 получаем
и
т
у=и
т
[у—φ(ν)\ ^ и
Т
(р(и) — и
Т
(р(и) = 0.
φ% ·)
-Щ Ир-^
\
(Ь)
(с)
Рис. 6.4. Графическое представление для случая и
т
у^еи
т
и при (а) ε > 0 (избыток пас
сивности); (Ь) ε < 0 (недостаток пассивности); (с) устранение избытка или недостатка
пассивности путем использования в системе прямой связи по входу
Таким образом, любая функция, удовлетворяющая и
т
у ^ ητφ{ν), может быть
преобразована в функцию, принадлежащую сектору [0, оо], путем использова
ния в системе прямой связи по входу. Эта функция называется пассивной при
прямой связи по входу {input-feedforward passive function). С другой стороны,
предположим, что и
т
у^у
т
р(у), где р(у) — некоторая функция. Повторяя
244
ГЛАВА 6
вышеизложенные рассуждения, можно заключить, что избыток пассивности име
ет место при у
т
р(у) > 0 для всех у φ О, а недостаток пассивности — если вели
чина у
т
р(у) принимает отрицательные значения при некоторых у. Графическое
представление этой ситуации для скалярного случая при р(у) = ду представлено
на рисунке 6.5. Избыток пассивности имеет место при δ > О, а недостаток — при
δ < 0. Избыток или недостаток пассивности могут быть устранены путем замы
кания системы обратной связью по выходу (см. рисунок 6.5(c)). Тогда, определив
новый вход равенством и — и
—
р(у), получаем
йту =[и- р(у)]ту ^ у
Т
р{у)-у
Т
р(у) = 0.
kL
—О*
4
+
pi·)
(а)
(Ъ)
(с)
Рис. 6.5. Графическое представление для случая и
т
у ^ δyτy при(а)δ>0(избытокпас
сивности); (Ь) δ < 0 (недостаток пассивности); (с) устранение избытка или недостатка
пассивности путем использования в системе обратной связи по выходу
Таким образом, любая функция, удовлетворяющая и
т
у^у
т
р(у), может быть
преобразована в функцию, принадлежащую сектору [0, оо], путем использования
в системе обратной связи по выходу. Эта функция называется пассивной при
обратной связи по выходу (output-feedback passive function)
2
.
При у
Т
р(у) >0для
всех у φ 0 функция называется строго пассивной по выходу, поскольку свойство
пассивности выполняется строго в том смысле, что и
Т
у=0,толькоеслиу=0.
Для скалярного случая это эквивалентно тому, что график и — ^-характеристики
не касается у-оси в точках, отличных от начала координат. Вышеприведенные
различные варианты пассивности объединены в следующем определении.
Определение 6.1. Система у = h(t, и) называется
• пассивной, если и
Т
у^0;
• системой без потерь, если и
Т
у=0;
• пассивной при прямой связи по входу (input-feedforward passive), если и
т
у^
^и
т
<р(и), где φ — некоторая функция;
• строго пассивной по входу, если и
Т
у>и
Т
(р(и) и и
т
<р(и)>0,VwΦ0;
2
Используются также термины «пассифицируемая» (passifiable) или «пассивируемая» система.
Операция превращения системы в пассивную путем введения прямой или обратной связи — пас-
сификация — играет важную роль при синтезе нелинейных систем, см. [Д55, Д49]. — Прим. ред.
перев.
6.1. ФУНКЦИИ БЕЗ ПАМЯТИ
• пассивной при обратной связи по выходу, {output-feedback passive), если
и
Т
у^У
Т
р(у), где ρ — некоторая функция;
• строго пассивной по выходу если и
Т
у^у
т
р(у) иу
т
р(у) >О,VуφО.
Во всех случаях неравенство должно быть выполнено для всех (t,u).
Рассмотрим скалярную функцию у = h(t,u), удовлетворяющую неравен
ству
аи
2
^ uh(t,и)<βη
2
(6.2)
для всех (£, и), где а и β — вещественные числа и β ^ а. График этой функ
ции принадлежит сектору, границами которого служат линии у — аи и у = βη.
В этом случае мы будем говорить, что h принадлежит сектору [а,/3]. На рисун
ке 6.6 показан сектор [α, β] при β > 0 и а с различными знаками. Если в (6.2)
имеют место строгие неравенства, мы будем говорить, что h принадлежит сек
тору (α,/3], [а,/3) или (α, β). Сравнив секторы, изображенные на рисунке 6.6,
с секторами, изображенными на рисунках 6.4 и 6.5, можно заключить, что функ
ция в секторе [α, β] обладает свойством пассивности при прямой связи по входу
и свойством строгой пассивности по выходу, т. к. сектор [α, β] является пересече
нием секторов [а, оо] и [0, β]. Действительно, можно показать, что эта функция
может быть преобразована в функцию, принадлежащую сектору [0, оо], путем
последовательного применения в системе прямой связи по входу и обратной свя
зи по выходу. Прежде чем воспользоваться этим методом, обобщим определение
сектора на векторный случай. Заметим, что неравенства (6.2) эквивалентны нера
венству
[h(t,и)- аи][h(t,и)-βη]^0
(6.3)
для всех (t,u). Обратимся к векторному случаю. Рассмотрим сначала ситуацию,
когда компоненты функции h(t,u) развязаны, т.е. функция представима в ви
де (6.1), и предположим, что каждый компонент hi удовлетворяет секторному
условию (6.2) с константами а\ и Д > а^. Положим
Κλ = diag(ab а2,..., ар),
К2 = diag(/3b /fe, · · ·, βρ).
Тогда легко показать, что
[h(t, и) - Kiu]
T
[h{t,и)-К2и]^О
(6.4)
для всех (t,u). Заметим, что матрица К = К2 — К\ является положительно
определенной и симметричной (диагональной). Неравенство (6.4) может быть
выполнено для векторных функций более общего вида. Например, предположим,
что h(t,u) удовлетворяет неравенству
\\h(t9u)-Lu\\^^\\u\\2
длявсех(£,и).ПолагаяК\ =L —ηΙ иК2 =L+ηΙ9 можнозаписать
[h(t,u) - Kmflhfau)
-
К2и] = \\h(tyu) - Lu\\l - J
2
\\u\\l < 0.
246
ГЛАВА 6
У
/
У=Ри
νy=au
( ν=βη
(a) α>0
(b) α<0
Рис.6.6.Сектор[α,β]приβ>Ои(а)а>0;(b)a<О
Заметим, что матрица К = К2 — К\ также является положительно определенной
и симметричной (диагональной). Таким образом, неравенство (6.4) с положитель
но определенной симметричной матрицей К = К2 — К\ определяет в векторном
случае сектор [Ki,K2]. Следующее определение объединяет введенную терми
нологию.
Определение 6.2. Функция без памяти h : [0, оо) х RP —> ЕР принадлежит
сектору
• [0, оо], если u
T
h(t,и)^0;
• [ifi,oo], если u
T
[h(t,u) — К\и\ ^ 0;
• [0,К2]сК2=Щ >0,еслиh
T
(t,u)[h(tyu)
-
К2и] < 0;
• [КЪК2]сК=К2-Кг=К
Т
> 0, если
[h(t, и) - Kiu}
T
[h(t, и)-К2и]<0.
(6.5)
Во всех случаях неравенство должно выполняться для всех (t,u). Если в какой-
либо из вышеприведенных ситуаций соответствующее неравенство выполня
ется строго, сектор записывается как (0, оо), (1£Ι,οο), (0,K2) или {К\,К2).
В скалярном случае мы будем писать (а,/3], [се,/?) или (а,/?), указывая на то,
что левая, правая или обе части неравенства (6.2) выполняются строго.
Сектор [0, оо] соответствует наличию в системе пассивности. Сектор
[JKI,OO] соответствует пассивности с прямой связью по входу с φ{μ) = К\и.
Сектор [0, .Кг] £ К2 = (1/5)/ > 0 соответствует строгой пассивности по выходу
с р(у) = 6у. Читателю предлагается (упражнение 6.1) проверить, что функция
из сектора [Ki,K2] может быть преобразована в функцию из сектора [0,оо] пу
тем последовательного применения в системе прямой связи по входу и обратной
связи по выходу (см. рисунок 6.7).
6.2. МОДЕЛИ состояния
+
α/г
1
+
у = h(t,u)
К,
+
О
Рис. 6.7. Функция из сектора [К\,К2]9 где К = К2 — К\ = К
т
> О, может быть преоб
разована в функцию из сектора [0, оо] путем последовательного применения в системе
прямой связи по входу и обратной связи по выходу
6.2. Модели состояния
В этом параграфе мы определим пассивность для динамической системы,
представленной в виде модели состояния
ж = /(ж,и),
(6.6)
y = h(x1u),
(6.7)
где/ :R
n
xRP—>R
n
—
локально липшицева функция, h : RP —> RP — непре
рывная функция и /(О,0) = 0, /г(0,0) = 0. Система имеет столько же входов,
сколько и выходов. Следующая RLC-цепь мотивирует приведенное ниже опре
деление.
Пример 6.1. RLC-цепь, схема которой изображена на рисунке 6.8, содер
жит источник электрического тока, линейные катушку индуктивности и конден
сатор, а также нелинейные резисторы. Резисторы 1 и 3 имеют и — у -характери-
стики i\ = h\(vi) и гз = /&з(^з)> aw — ^-характеристика резистора 2 имеет вид
Щ = ^2(^2)· В качестве входа выступает напряжение и, а в качестве выхода —
сила тока у. Произведение иу представляет собой поток мощности (power flow),
поступающей в систему. Рассматривая ток х\ через катушку индуктивности и на
пряжение #2 на конденсаторе в качестве переменных состояния, можно записать
модель состояния
Lx —U —/l2(xi)—#2>
Сх2 = х\- Лз(яг),
y=xi +fti(tO.
По сравнению с простой цепью с сопротивлениями, электрическая RLC-цепь
имеет новые особенности, связанные с наличием элементов L и С, которые слу
жат в качестве накопителей энергии. Система является пассивной, если энергия,
поглощенная цепью за период времени [0,£], больше, либо равна увеличению
запаса энергии в цепи за тот же период времени, т. е.
Jo
u{s)y(s) ds > V(x(t)) - V(x{0)),
(6.8)
248
ГЛАВА 6
+
uQч
ъ=*к(ч)
Рис. 6.8. RLC-цепь из примера 6.1
ч=ЫМ
где V(x) — {l/2)Lx\ + (l/2)Cx\ — энергия, запасенная в цепи. Если вместо (6.8)
выполняется строгое неравенство, разность между значением поглощенной в си
стеме энергии и увеличением запаса энергии в системе должна быть равна коли
честву энергии, рассеянной в резисторах. Поскольку (6.8) должно выполняться
в любой момент времени t > О, мгновенное неравенство для мощности
u{t)y{t)>V(x{t),u{t))
(6.9)
должно выполняться для всех t, т. е. мощность, поступающая в систему, должна
быть больше либо равна скорости изменения запаса энергии в системе. Иссле
дуем выполнение неравенства (6.9), вычислив производную функции V вдоль
траекторий системы:
V =Lx\x\ +Сх^хч =xi[u - h,2{xi)- £2]+#2[#i- ^3(^2)]=
= xi[u- h2(xi)] - #2^3(^2) =
= [xi + hi(u)]u - uhi(u) - x\h2{x\) - Ж2Л3О&2) =
= uy - uhi(u) - xih2(xi) - £2^3(^2)-
Таким образом,
uy = V + uhi(u) + x\h2{x\) + xzhzfa)·
Если h\, \i2 и hs пассивны, то uy ^ V и система пассивна. Другие возможные
конфигурации рассматриваемой цепи описаны ниже.
Случай1:если h\ =/12—^з = 0, иу —V идиссипация энергиивцепи
отсутствует, то цепь является системой без потерь.
Случай 2: если /i2 и hs принадлежат сектору [0, оо], то
Щ^V+ uh\(u).
Член uh\(u) представляет собой либо избыток, либо недостаток пассивности.
Если uh\{u) > 0 для всех и φ О, имеет место избыток пассивности, поскольку
количество энергии, поглощенной цепью за период времени [0,i], больше уве
личения запаса энергии, за исключением случая, когда u(t) тождественно равна
6.2 . МОДЕЛИ СОСТОЯНИЯ
249
нулю. Этот случай соответствует строгой пассивности по входу. С другой сто
роны, если uh\{u) принимает отрицательное значение при некоторых и, имеет
место недостаток пассивности. Как мы видели при рассмотрении функций без
памяти, указанные типы избытка или недостатка пассивности могут быть устра
нены путем использования в системе прямой связи по входу (см. рисунок 6.4(c)).
Случай3:еслиhi=0иh$Ε[0,оо],то
иу^V+yh2(y).
Избыток или недостаток пассивности функции h2 обуславливает наличие анало
гичного свойства для всей цепи. Как и в случае функций без памяти, избыток или
недостаток пассивности могут быть устранены путем использования в системе
обратной связи по выходу (см. рисунок 6.5(c)). Если yh2(y) > 0 для всех у Φ О,
имеет место строгая пассивность по выходу, поскольку количество энергии, по
глощенной цепью за период времени [0, t]9 больше увеличения запаса энергии, за
исключением случая, когда y(t) тождественно равна нулю.
Случай4:если hi е[0,оо],h2Ε(0,оо) иhs£(0,оо),то
иу ^ V + xih2(xi) + х2Ы(х2),
где xih2(xi)-\ -x2hs(x2)
—
положительно определенная функция от х. Этот случай
соответствует строгой пассивности по состоянию, поскольку количество энергии,
поглощенной цепью за период времени [0, t], больше увеличения запаса энергии,
за исключением случая, когда x(i) тождественно равно нулю. Система, облада
ющая этим свойством, называется строго пассивной по состоянию или просто
строго пассивной. Очевидно, невозможно привести соответствующую аналогию
с функциями без памяти, т. к. для них состояние не определено.
Δ
Определение 6.3. Система (6.6)-(6.7) называется пассивной, если суще
ствует непрерывно дифференцируемая положительно полуопределенная функ
ция V(x) (называемая функцией запаса (storage function)), такая что
иту>у=
%f(x
'
u
)i
V
(x
>u)eR
n
xR
p
.
(6.10)
Более того, эта система называется
• системой без потерь, если и
Т
у=V;
• пассивной при прямой связи по входу, если и
т
у ^ V + ητφ(η) для некоторой
функции φ;
• строго пассивной по входу, если и
Т
у ^V+ητφ(υ) иητφ(ν) >0,\/иΦ0;
• пассивной при обратной связи по выходу если и
Т
у^V+у
т
р(у) для неко
торой функции р;
• строго пассивной по выходу, если и
Т
у^V+у
Т
р(у) иу
т
р(у) >0,УуΦ0;
250
ГЛАВА 6
• строго пассивной, если и
Т
у > V + ф(х) для некоторой положительно опре
деленной функции ψ.
Во всех случаях неравенство должно быть выполнено для всех (х,и).
Формулировка определения 6.3 аналогична формулировке определения 6.1
для функций без памяти, за исключением того, что определение 6.3 дано в тер
минах функции запаса V(x). Если рассматривать V(x) = 0 для случая функций
без памяти, определение 6.3 может применяться для описания как моделей со
стояния, так и функций без памяти.
Пример 6.2. Интегратор, изображенный на рисунке 6.9(a) и представимый
в виде системы
х=и, у=ж,
представляет собой систему без потерь, поскольку, используя V(x) — (1/2)х2
в качестве функции запаса, получаем иу = V. В случае если функция без памяти
образует с интегратором параллельное соединение (см. рисунок 6.9(b)), система
принимает вид
х=и, y=x+h(u).
Легко видеть, что система является пассивной при прямой связи по входу, по
скольку сигнал с параллельной цепи h(u) может быть погашен сигналом с входа
системы. Используя V(x) = (1/2)х2 в качестве функции запаса, получаем иу =
= V + uh(u). Если h е [0, оо], система является пассивной. Если uh(u) > 0 для
всех и^О, система является строго пассивной по входу. Если обратная связь
по выходу с функцией без памяти охватывает интегратор так, как изображено на
рисунке 6.9(c), система принимает вид
х= —h(x)+it, у=х.
В этом случае система является пассивной при обратной связи по выходу, по
скольку сигнал в цепи обратной связи может быть погашен сигналом с выхода
системы. Используя V(x) = (1/2)х2 в качестве функции запаса, получаем иу =
= V + yh(y). Если h G [0, оо], система является пассивной. Если yh(y) > 0 для
всех у Φ 0, система является строго пассивной по входу.
Δ
Пример 6.3. Каскадное соединение интегратора и пассивной функции без
памяти, изображенное на рисунке 6.10(a), представимо в виде системы
х=и, у—h(x).
Из пассивности h следует, что f£ h(a)da ^ 0 для всех х. Используя V(x) =
—
Jo Ησ)ασ в качестве функции запаса, получаем V = h(x)x — уи. Следова
тельно, система является системой без потерь. Предположим теперь, что в систе
ме интегратор заменен на передаточную функцию \/{as + 1) с а > 0 (см. рису
нок 6.10(b)). Тогда система может быть представлена в виде модели состояния
ах=—х+гх, у—h(x).
6.3. ПОЛОЖИТЕЛЬНО ВЕЩЕСТВЕННЫЕ ПЕРЕДАТОЧНЫЕ ФУНКЦИИ
251
х=у
и
К-)
I
х
.г
L
«Ην
1
/
Λ(·)
Х=
•«
1
(а)
(Ъ)
Рис. 6.9. К примеру 6.2
(с)
/
К:
as-\ -l
К-)
(а)
(Ь)
Рис. 6.10. К примеру 6.3
Используя V(х) = CLJQ h(a)da в качестве функции запаса, получаем
V — h(x)(—x
-\-u) —yu — xh(x) < уи.
Следовательно, система пассивна. Если xh(x) > 0 для всех х Φ 0, система явля
ется строго пассивной.
Δ
6.3. Положительно вещественные передаточные функции
Определение 6.4. Рациональная матричная передаточная функция G(s)
размерности ρ х ρ называется полоэюительно вещественной, если
• полюса всех элементов матрицы G(s) расположены в Re[s] ^ 0,
• для любой вещественной ω, для которой jcu не является полюсом какого-
либо из элементов матрицы G(s), матрица G(ju) + G
T
(—jou) является
полоэюительно полуопределенной и
• любой чисто мнимый полюс ju любого из элементов матрицы G(s) явля
ется простым полюсом и матрица вычетов lim5_,<7a;(s — ju>)G(s) является
полоэюительно полуопределенной и эрмитовой.
Передаточная функция G(s) называется строго полоэюительно вещественной
3
,
если G(s — ε) является полоэюительно вещественной для некоторой ε > 0.
При ρ — 1 второе условие определения 6.4 сводится к неравенству
Bje[G(ju)] > 0, У ω Ε R, которое выполнено в случае, если диаграмма Найквиста
3
Существуют различные определения строго положительно вещественной передаточной функ
ции. Эти определения, а также взаимосвязи между ними приведены в работе [206].
252
ГЛАВА 6
для G{ju) лежит внутри замкнутой правой половины комплексной плоскости.
Это условие, в свою очередь, может быть выполнено? только если относитель
ная степень передаточной функции равна нулю или единице
4
.
В следующей лемме дается альтернативная характеристика строго позитив
но вещественных передаточных функций.
Лемма 6.1. Пусть G(s) —рациональная собственная передаточная \р хр\-
матрица. Предположим, что det[G(s)-\ -G
T
(—s)] неравен тождественно нулю
5
.
Тогда G(s) является строго положительно вещественной, если и только если
•
G(s) — гурвицева матрица, т. е. полюса всех ее элементов имеют отрица
тельные вещественные части;
• G(ju) +G
T
(—ju) — положительно определенная матрица для всех ω Ε R,
и
• G(oo)+G
T
(oo) либо положительно определена,
6
либо положительно полу
определена и Ит^^сю^
2
Мт[С(,7С1;) + G
T
(—ju>)]M положительно определе
на для всех [р х (р — (^[-матриц Μ полного ранга, таких что M
T
[G(оо) +
+G
T
(oo)]M = 0, где q = rank[G(oo) + G
T
(oo)].
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. И
7
.
Π
Если G(oo) 4- 6^(00) = 0, мы можем положить Μ = I. В скалярном случае
(р — 1) частотное условие леммы сводится к неравенству Re[G(ju)] > 0 для
всехωеRилибоG(oo)>0,либоG(oo)=0иlim^^ooω
2
He[G(ju)] > 0.
Пример 6.4. Передаточная функция G(s) = 1/s является положительно
вещественной, поскольку она не имеет полюсов в Re[s] > 0, имеет простой
полюс в s = 0, вычет которого равен 1, и
Re[G(Ju)] = Re
_1_
1ω.
0,VCJφ0.
Эта функция не является строго положительно вещественной, поскольку 1/(5—ε)
имеет полюс в Re[s] > 0 для всех ε > 0. Передаточная функция G(s) = l/(s + a)
4
Относительная степень рациональной передаточной функции G(s) = n(s)/d(s) равна degd-
—
deg п. Для собственной передаточной функции относительная степень равна неотрицательному
целому числу
5
Аналогично G(s) + G
T
{—s) имеет нормальный ранг ρ над полем рациональных функций от s.
6
3начение G(oo) понимается здесь и далее как предел: G(oo) = 1ш1|в|_юо G(s). Легко пока
зать, что предел существует, поскольку матрица G(s) собственная (proper). Матрица рациональных
функций называется собственной (proper), если степени числителей ее элементов не превосходят
степеней соответствующих знаменателей. — Прим. ред. перев.
7
Автор любезно сообщил о неточности в лемме 6.1, обнаруженной в работе Корлесса и Шор-
тена (М. Corless and R. Shorten): условие «\[τηω-*οο (^
2
MT[G(ju) + G
T
(—ju)\M положительно
определена» из третьего пункта является при ρ > 1 лишь необходимым, но не достаточным.
Уточненную формулировку можно извлечь из теоремы 4 статьи В.А.Якубовича [Д75], см. допол
нение. — Прим. ред. перев.
6.3 . ПОЛОЖИТЕЛЬНО ВЕЩЕСТВЕННЫЕ ПЕРЕДАТОЧНЫЕ ФУНКЦИИ
253
с а > О является положительно вещественной, поскольку она не имеет полюсов
вRe[s]^0и
Re[G(ju;)] =
ω2 Λ-а
2>О,Vu;eR.
Поскольку это равенство выполняется для всех а > 0, можно заключить, что для
любой € G (0, а) передаточная функция G(s — ε) = 1/(5 + а — ε) будет положи
тельно вещественной. Следовательно, G(s) = l/(s + α) — строго положительно
вещественная. Аналогичные заключения могут быть получены с использованием
леммы 6.1, если заметить, что
lim u;
2
Re{G(juj)} = lim !? α
0
α>0.
Передаточная функция
G(s) =
s
l
+s+1
не является положительно вещественной, т. к. ее относительная степень равна
двум. Убедиться в этом можно, если вычислить
Re[G(jo>)]
1-ω
2
(1-ωη
2
+
<0, V|w|>l.
Рассмотрим передаточную (2 х 2)-матрицу
1
ад=s+1
11
11
В этом случае мы не можем применить лемму 6.1, т.к. det[G(s) + G
T
(—s)} =
= О V s. Однако, проверив условия в определении 6.4, можно заключить, что G(s)
является строго положительно вещественной. Заметим, что при ε < 1 полюсы
элементов матрицы G(s — е) расположены в Re[s] < 0 и матрица
G(jw -ε) +G
T
(-ju - ε) 2(1-ε)
ω2
+(1-ε)2L11
11
является положительно полуопределенной для всех ω е R. Аналогично можно
показать, что 2 х 2-передаточная матрица
G(s)=1
s+1
5+1 1
-1
25+1
является строго положительно вещественной. Однако в этом случае det[G(s) +
+G
T
(—s)] не равен тождественно нулю. Поэтому мы можем применить лем
му 6.1 и прийти к тому же заключению, что и ранее, если принять во внимание
то, что матрица G(oo) + G
T
(oo) положительно определена, а также то, что
G(JW) + G
T
(-JO;) =
u/
2
+l
ω2
+1
-ju
ju 2ω2
+1
254
ГЛАВА 6
положительно определена для всех ω Ε R. Наконец, для передаточной (2 х 2)-
матрицы
" 5+2
G(s) =
s+1
-1
5+2 5+1
1
5+2
2
справедливо равенство
Легко проверить, что
G(oo) + G
T
(oo)
G(ju) + G
T
(-ju)
2(2+ω
2
)-2ju
1+α;2
2ju;
4+ω
2
4
4+ω
2
1+ω
2
является положительно определенной для всех ω Ε R. Полагая М
т
—
[0 1],
можно показать, что
lim UJ
2
MT[G(JUJ) + G
T
(-ju)]M = 4.
Следовательно, из леммы 6.1 можно заключить, что G(s) является строго поло
жительно вещественной.
Δ
Свойства пассивности положительно вещественных передаточных функций
могут быть охарактеризованы с использованием следующих двух лемм, извест
ных в литературе соответственно как лемма о полооюителънои вещественности
клемма Калмана-Якубовича-Попова*. Эти леммы позволяют получить для пере
даточных функций алгебраическое описание свойств положительной веществен
ности и строгой положительной вещественности.
Лемма 6.2 (о положительной вещественности). Пусть G(s) — С (si -
—
A)~
l
B+D — передаточная (рхр)-матрица, где пары (Л, В) и (Л, С) являют
ся соответственно управляемой и наблюдаемой. Тогда G(s) является положи
тельно вещественной, если и только если существуют матрицы Ρ = Р
Т
>О,L
и W, такие что
РА+А
Т
Р=-L
T
L,
РВ=С
Т
-
LTW,
WTW =D+D
T
.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. 12.
(6.11)
(6.12)
(6.13)
Π
8
Леммы 6.2 и 6.3 являются частными случаями более общих утверждений, доказанных для
систем со скалярным входом В. А. Якубовичем в 1962 г., а для систем с векторным входом незави
симо В.А.Якубовичем и В.М.Поповым в 1964г. Р.Калман уточнил эти утверждения в 1963 году.
Подробнее см. [Д26]. — Прим. ред. перев.
6.3 . ПОЛОЖИТЕЛЬНО ВЕЩЕСТВЕННЫЕ ПЕРЕДАТОЧНЫЕ ФУНКЦИИ
255
Лемма 6.3 (лемма Калмана-Якубовича-Попова). Пусть G(s) = С (si -
—
A)~
l
B + D — передаточная ρ х р-матрица, где пары (А, В) и (А, С) являют
ся соответственно управляемой и наблюдаемой. Тогда G(s) является строго
положительно вещественной, если и только если существуют матрицы Ρ =
—
РТ
> О, L uW, а также положительная константа ε, такие что
РА+А
Т
Р=-L
T
L-еР,
(6.14)
РВ=С
Т
-
LTWy
(6.15)
WTW =D+D
T
.
(6.16)
ДОКАЗАТЕЛЬСТВО. Предположим, что существуют Ρ — Р
т
>О,L,W
и б > 0, такие что выполнены равенства (6.14)—(6.16). Положим μ = ε/2. Тогда
сучетомтого,чтоG(s —μ)=С(si —μΙ
—
A)~
l
B + D, из (6.14) имеем
P(A+μΙ)+(A+μΙ)ΤΡ = -L
T
L.
(6.17)
Из леммы 6.2 следует, что G(s—μ) является положительно вещественной. Следо
вательно, G(s) — строго положительно вещественная. С другой стороны, пред
положим, что G(s) является строго положительно вещественной. Существует
μ > 0, такая что G(s — μ) является положительно вещественной. Из леммы 6.2
следует, что существуют матрицы Ρ — Р
т
> О, L и W, удовлетворяющие ра
венствам (6.15)—(6.17). Полагая ε = 2μ, можно показать, что Р, L, W и ε удо
влетворяют равенствам (6.14)—(6.16).
Π
Лемма 6.4. Минимальная реализация линейной, не зависящей от времени
системы
х=Ах+Ви,
у—Сх+ Du
сG(s) =С(si —A)~
l
B + D является
• пассивной, если G(s) является положительно вещественной;
• строго пассивной, если G(s) является строго положительно вещественной.
ДОКАЗАТЕЛЬСТВО. Используя V(x) = (l/2)x
T
Px
в качестве функции запа
са, получаем
и
т
у-ψ-(ΑΧ +Ви) =и
т
(Сх+Du)-х
т
Р(Ах +Ви)=
=и
т
Сх+\u
T
(D +D
T
)u-\х
т
(РА +А
т
Р)х-х
т
РВи
-
=и
т
(ВтР +W
T
L)x+±u
T
WTWu
+
+\x
T
LTLx
+±εΧΤΡΧ-x
T
PBu =
-
\(Lx + Wu)
T
(Lx +Wu)+\εΧΤΡΧ >±гх
т
Рх.
256
ГЛАВА 6
Используя лемму 6.2 и выбирая ε = 0, заключаем, что система пассивна. Ана
логично, используя лемму 6.3 и выбирая ε > 0, заключаем, что система строго
пассивна.
Π
6.4. /^-устойчивость и устойчивость по Ляпунову
В этом параграфе мы исследуем /^-устойчивость и устойчивость по Ляпу
нову пассивных систем вида
x = f{x,u),
(6.18)
y = h(x,u),
(6.19)
где/ :R
n
xRP—>R
n
—
локально липшицева функция, h : R
n
xRP—>RP—
непрерывная функция, /(0,0) = 0 и /i(0,0) = 0.
Лемма 6.5. Если система (6.18)—(6.19) является строго пассивной по вы
ходуси
Т
у ^ V + SyTy для некоторой δ > 0, то она является Неустойчивой
с конечным коэффициентом усиления, величина которого меньше либо равна Ι/δ.
ДОКАЗАТЕЛЬСТВО. Производная функции запаса V(x) удовлетворяет нера
венству
V<и
Т
у-дуту=-
— (и- 6у)т(и- Sy)+^и
т
и-^у
т
у<
1т
1
δτ
^γδη и-ψ у.
Интегрируя левую и правую части этого неравенства на промежутке [0,т], полу
чаем
JTy
T
(t)y(t)dt < ± JT
u
T
(t)u(t)dt - |[V(X(T)) - V(x(0))}.
Тогда
Ш\С2 < JlKlk + ^/^(xiO)),
т.к.V(x) ^0и\/а
2
+Ь
2
^ α + Ь для неотрицательных чисел α и 6.
Π
Лемма 6.6. £сли система (6.18)-(6.19) является пассивной с положитель
но определенной функцией запаса V(x), то начало координат системы х =
= f(x, 0) устойчиво.
ДОКАЗАТЕЛЬСТВО. Рассмотрим V в качестве кандидата на роль функции
Ляпунова для системы х = /(х, 0). Тогда V < 0.
Π
Для того чтобы установить свойство асимптотической устойчивости нача
ла координат системы х = /(х,0), мы должны либо показать, что функция V
является отрицательно определенной, либо воспользоваться принципом инвари
антности. В нижеследующей лемме будет применен принцип инвариантности
6.4. /^-УСТОЙЧИВОСТЬ и устойчивость по ЛЯПУНОВУ
257
в случае, когда V = 0 при у = 0, а также при дополнительном требовании на
решения (6.18) при и = 0:
y(t)=0=*x(t)=0.
(6.20)
Эквивалентным требованием может быть то, что ни одно из решений х = /(ж, 0),
за исключением тривиального решения x(t) = 0, не может постоянно оставаться
вS={хеR
n
| h(x, 0) = 0}. Свойство (6.20) может быть интерпретировано как
условие наблюдаемости. Напомним, что для линейной системы
х=Ах,
у=Сх
свойство наблюдаемости эквивалентно
y{t) = Ce
At
x{0) =0& х(0)=0Оx(t) =0.
В дальнейшем мы будем рассматривать требование (6.20) в качестве условия
наблюдаемости системы.
Определение 6.5. Система (6.18)—(6.19) называется наблюдаемой в нуле
вом состоянии (zero-state observable), если ни одно из решений х = /(ж,0), за
исключением тривиального решения x(t) = 0, не может постоянно оставаться
eS = {xeR
n
|Л(а;,0) = 0}.
Лемма 6.7. Рассмотрим систему (6.18)—(6.19). Начало координат систе
мы х = f(x, 0) является асимптотически устойчивым, если система является
• строго пассивной или
• строго пассивной по выходу и наблюдаемой в нулевом состоянии.
Кроме того, если функция запаса радиально неограниченна, то начало коорди
нат является глобально асимптотически устойчивым.
ДОКАЗАТЕЛЬСТВО. Предположим, что система является строго пассивной
и функция V(x) является ее функцией запаса. Тогда при и = 0 V удовлетворяет
неравенству V < —ф(х), где ip(x) — положительно определенная. Это неравен
ство может быть использовано для доказательства положительной определенно
сти функции V(x). В частности, для всех х б Rn уравнение х = /(х,0) имеет
решение ф(Ь\ х), начинающееся в точке х в момент времени t = 0 и определенное
на некотором интервале [0,5]. Интегрируя неравенство V ^ —ф(х), получаем
У(ф(т,х)) - V(x) < - Г ф(ф(Ъх))аЬ, Vr e [0,5].
Jo
С учетом того что У(ф(г,х)) ^ 0, имеем
V(x) ^ / ф(ф(г]х))(И.
Jo
258
ГЛАВА 6
Предположим теперь, что существует точка х φ О, такая что V{x) — 0. Из
предыдущего неравенства следует
/ ф(ф(Ь]х))(И = 0,Ут Ε [0,5] =>ф(ф(Ъх)) = 0=>ф(Ь]х) Е0^Ж = 0,
Jo
что противоречит исходному предположению х φ 0. Таким образом, V(x) > 0
для всех х φ 0. Следовательно, эта функция может рассматриваться в качестве
функции Ляпунова. Поскольку V{x) ^ —ф(х), начало координат асимптотически
устойчиво.
Предположим теперь, что система является строго пассивной по выходу,
и предположим, что V(x) — ее функция запаса. Тогда при и = 0V удовлетворяет
неравенству V ^ —у
т
р(у), где у
т
р(у) > 0 для всех у φ 0. Рассуждая аналогично
тому, как это было сделано выше, мы можем использовать это неравенство для
доказательства положительной определенности функции V{x). В частности, для
всехх ΕRn
имеем
V(x)^ J к
т
(ф(Р,х),0)р(к(ф(Ъх),0))(И.
Jo
Предположим теперь, что существует точка х Φ 0, такая что V(x) = 0. Из
предыдущего неравенства следует, что
/к
т
(ф(Ь]х),0)р(к(ф{г;х),0))(И = 0, Vr Ε [0,5] =» Л(0(*;ж),О) = 0,
JO
что в условиях наблюдаемости системы в нулевом состоянии влечет
Ф(г\х) ЕО^Х = О.
Следовательно, V{x) > 0 для всех х φ 0, т. е. V(x) может рассматриваться в ка
честве функции Ляпунова. Поскольку V{x) ^ —у
Т
р(у)иy(t) =0 =>x(t)Ξ0,
мы заключаем, с использованием принципа инвариантности, что начало коорди
нат асимптотически устойчиво. Наконец, если V(x) радиально неограниченна, то
начало координат глобально асимптотически устойчиво по теореме 4.2 и след
ствию 4.2.
Π
Пример 6.5. Рассмотрим систему с ρ входами и ρ выходами
9
х = f(x) + G(x)u,
У= Цх),
где / и G — локально липшицевы функции, h — непрерывная функция, /(0) =
= 0 и h(0) = 0. Предположим, что существует непрерывно дифференцируемая
положительно полуопределенная функция V(x), такая что
9
£2-устойчивость этой системы исследовалась в примерах 5.9. и 5.10.
6.4. ^-УСТОЙЧИВОСТЬ и УСТОЙЧИВОСТЬ по ЛЯПУНОВУ
259
Тогда справедливо равенство
и
Т
у-f£[/(s) +G(x)u]=u
T
h{x) - |£/(*) - h
T
(x)u = ~%f{x) > О,
из которого следует, что система пассивна. Если V(x) является положительно
определенной, то начало координат системы х = f(x) является устойчивым.
При выполнении для некоторого к > 0 более сильного условия
g/Or) ^ -kh
T
(x)h(x), 2gG{x) = h
T
(x)
получаем
u
T
y-^[f(x)
+ G{x)u}>kyTy
и система является строго пассивной по выходу с р(у) = ку. Из леммы 6.54 сле
дует, что система является /^-устойчивой с конечным коэффициентом усиления,
значение которого меньше либо равно 1/к. Если, кроме того, система является
наблюдаемой в нулевом начальном состоянии, то начало координат системы х —
= f(x) является асимптотически устойчивым. Более того, если V(x) радиально
неограниченна, начало координат является глобально асимптотически устойчи
вым.
Δ
Пример 6.6. Рассмотрим систему с одним входом и одним выходом
10
±2= —ах\—кх2+и,
где а и к — некоторые положительные константы. Рассмотрим также положи
тельно определенную и радиально неограниченную функцию V(x) = (l/4)axf +
+ (1/2)^2
в
качестве кандидата на роль функции запаса рассматриваемой систе
мы. Производная V определяется равенством
V=ах\х2+Х2{—сьх\—кх2+и)= —ку
2
+ уи.
Легко видеть, что система является строго пассивной по выходу с р(у) = ку.
Из леммы 6.5. следует, что система ^2-устойчива с конечным коэффициентом
усиления, значение которого меньше либо равно 1/к. Более того, при и = О
y(t) = 0=> x2(t) ΞΞ 0 =>> ax\(t) ΞΟ^ xi{t) = 0.
Следовательно, система является наблюдаемой в нулевом состоянии. Из лем
мы 6.7 следует, что свободная система глобально асимптотически устойчива.
Δ
10
Свойства £г -устойчивости и устойчивости по Ляпунову этой системы исследовались в при
мерах 5.8. и 4.9.
260
ГЛАВА 6
6.5. Системы с обратной связью: теоремы о пассивности
Рассмотрим соединение систем с обратной связью (см. рисунок 6.11), со
стоящее из двух подсистем Hi и #2, каждая из которых может быть либо не
зависящей от времени динамической системой, представленной в виде модели
состояния
%i —Jг\%i?е
г)?
Уг — ili\%ii £%)·>
(6.21)
(6.22)
Оβ1
Η, Уг
2/2
#2
е2 1+
О±щ
Рис. 6.11. Соединение систем с обратной связью
либо функцией без памяти (возможно, зависящей от времени)
Уг = hi(t,ei).
(6.23)
Заметим, что векторы щ, з/ъ ^и у^ могут иметь одинаковые размерности. Нас
интересует вопрос о том, как знание свойств пассивности этих двух компонент
Hi и #2 может быть использовано для анализа свойств устойчивости соединения
систем с обратной связью. Далее будут исследованы свойства £2 -устойчивости
и устойчивости по Ляпунову в предположении, что это соединение систем име
ет корректно определенную модель состояния. В случае когда компоненты Hi
и Hi представляют собой динамические системы, модель состояния замкнутой
системы принимает вид
х = f(x,u),
у = h{x,u),
(6.24)
(6.25)
где
ГXI '
1Х* \
,и=
"Щ
'
г/2
иу
У\
LУ2
Мы будем предполагать, что / — локально липшицевая функция, h — непрерыв
ная функция, /(0,0) = 0 и /i(0,0) = 0. Легко видеть, что соединение систем
6.5. СИСТЕМЫ С ОБРАТНОЙ связью: ТЕОРЕМЫ О ПАССИВНОСТИ
261
с обратной связью будет иметь корректно определенную модель состояния, если
уравнения
в1 =щ
-h2(x2le2),
(6.26)
е2=и2+hi(xi,ei)
(6.27)
имеют единственное решение (ei,e2) для всех (xi,x2,ui,u2).
Выполнение ра
венств /(О,0) = 0 и Л(0,0) = 0 следует из /*(0,0) = 0 и /ц(0,0) = 0. Очевидно,
что (6.26) и (6.27) всегда имеют единственное решение, если hi независима от е\
или если h2 независима от е2. В этих случаях функции f и h замкнутой модели
состояния наследуют свойства гладкости, присущие функциям fi и hi компонент
соединения систем с обратной связью. В частности, если fi и hi являются ло
кально липшицевыми, то этим свойством обладают и функции / и h. В случае
линейных систем требование независимости hi от е* эквивалентно тому, что пе
редаточная функция Щ является строго собственной
11
.
В случае если одна из компонент, скажем Н\9 является динамической систе
мой, а другая компонента — функцией без памяти, замкнутая модель состояния
принимает следующий вид:
x = f(t,x,u),
(6.28)
y = h(t,x,u),
(6.29)
где
г
щ
.
П
2.
иу=
.
У2т
Мы будем предполагать, что функция / является кусочно-непрерывной по t и ло
кально липшицевой по (х, и) и что h является кусочно-непрерывной по t и непре
рывной по (ж, и), /(£,0,0) = 0 и /i(i,0,0) — 0.
Соединение систем будет иметь корректно определенную модель состояния,
если уравнения
ei =MI -h2(t,e2),
(6.30)
62 = ^2 + /ii(xi, ei)
(6.31)
имеют единственное решение (ei, ег) для всех (xi, i,ui, W2). Это требование бу
дет выполнено, если hi независима от е\. Результаты для случая, когда оба ком
понента соединения систем являются функциями без памяти, следуют тривиаль
ным образом из случая отсутствия в системе состояния ж, т. е. когда соединение
систем представлено равенством у = h(t,u).
Нижеследующее фундаментальное свойство является стартовой точкой на
шего анализа рассматриваемой ситуации.
Теорема 6.1. Соединение двух пассивных подсистем пассивно.
11
Вопрос существования решений (6.26) и (6.27) будет рассмотрен в примере 6.12.
262
ГЛАВА 6
ДОКАЗАТЕЛЬСТВО. Пусть V\{x\) и V^a^) — функции запаса для Н\ и #2.
Если одна из компонент является функцией без памяти, положим Vi = 0. Тогда
Из рисунка 6.11 видно, что
ejyi + е2У2=Ы ~У2)ТУ1+ (и2 + У\)ТУ2= ujyi + и£у2.
Следовательно,
tiTy =ufуi+i4V2 ^ Vi+V2.
Рассматривая V(x) = V\{x\) + ^2(^2) в качестве функции запаса для соединения
систем, получаем
и
т
у>V.
Π
Используя теорему 6.1 и результаты из предыдущего параграфа о свойствах
устойчивости пассивных систем, мы можем непосредственно получить резуль
таты, касающиеся свойств устойчивости соединения систем. Начнем со случая
/^-устойчивости. Следующая лемма является прямым следствием леммы 6.5.
Лемма 6.8. Соединение систем, состоящее из двух строго пассивных по
выходу подсистем с
е[Уг ^Vi + Siyjyi, Si > 0,
является ^-устойчивым с конечным коэффициентом усиления, значение кото
рого меньше либо равно 1/ min{5i, 62}.
ДОКАЗАТЕЛЬСТВО. При V = V\ + V2 и δ = min{5b δ2} имеем
и
Т
у =ejyx +е$у2 >V\+ Ь\у\у\ +V2+62у1у2^
>V+6(у[уг +yly2)=V+SyTy.
U
Вспоминая доказательство леммы 6.5, можно заметить, что мы используем
неравенство
и
т
у^V+буут
(6.32)
для получения неравенства
V^^u
T
u-^y
T
y,
(6.33)
которое в свою очередь используется для доказательства /^-устойчивости рас
сматриваемой системы. В лемме 6.8 мы доказали справедливость (6.32) для со
единения систем и показали, что выполнено неравенство (6.33). Однако даже
если для соединения систем неравенство (6.32) несправедливо, тем не менее
оказывается возможным получить неравенство, по форме совпадающее с нера
венством (6.33). Эта идея используется в следующей теореме, в которой дока
зывается более общий результат, включающий результаты леммы 6.8 в качестве
частного случая.
6.5. СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ: ТЕОРЕМЫ О ПАССИВНОСТИ
263
Теорема 6.2. Рассмотрим соединение систем, изображенное на рисун
ке 6.11, и предположим, что каждая из ее подсистем удовлетворяет неравен
ству
efyi >Vi + c<efе< + uyfs/i, г = 1,2,
(6.34)
для некоторой функции запаса Vi{x%). Тогда отобраэюение и\-*у для замкнутой
системы является С2-устойчивым с конечным коэффициентом усиления, если
ε\+δ2>0 и е24-ii>0.
(6.35)
ДОКАЗАТЕЛЬСТВО. Суммируя неравенства (6.34) при г = 1,2 и учитывая
ejyi +4^2 = и[уг +и%у2
ejei = ujui - 2ujy2 + у2у2
е2е2 =и£и2 +2v%yi+yfуь
получаем
V<-y
T
Ly-/MwΗ-u
T
Afy,
где
L= (e2+ii)/
0
0
(ei + fe)/
Με!/Ο
0 ε2Ι
Ν=
I
2εΧ1
-2ε2Ι Ι
и V(x) = Vi(xi)-М^2(ж2). Положим α = min{s2 + 5i, £i+M>°> 6 = ||JV||2 ^ 0
ис= ||М||2 > 0. Тогда
^<-a||»lli + bNl2||tf||2 + c||u||l =
= -±(b\\u\\2
-
a\\y\\2f + g||u||l - §||y||i + с||и||| <
<£lMli-|IMI22,
где A;2
=6
2
+2ac. Интегрируя на промежутке [0, τ] и вычисляя квадратный корень
с учетом того, что V(x) ^ 0, получаем оценку
к
\\Ут\\с2 < %\\ит\\с2 +
у/ЩхЩа,
из которой следует утверждение теоремы.
Π
Теорема 6.2 сводится к лемме 6.8 в случае, если неравенство (6.34) выполне
но с константами е\ = е2 = 0, δ\ > 0 и δ2 > 0. Однако условия (6.35) могут быть
выполнены и в других случаях. Например, они выполняются, если обе подсисте
мы Н\ и Н2 являются строго пассивными по входу и е[yi ^ Vi + eiujui при
264
ГЛАВА 6
некоторой константе ε* > 0. Оно также справедливо, если одна из подсистем,
скажем Hi, является пассивной, а другая удовлетворяет (6.34) с положитель
ными константами ε2 и <$2. Более того, неравенства (6.35) могут выполняться,
даже если константы е% или Si отрицательны. Например, отрицательная констан
та Е\ может быть компенсирована положительной константой S2. В этом случае
недостаток пассивности (во входном контуре) подсистемы Н\ компенсируется
избытком пассивности (в выходном контуре) подсистемы #2. Аналогично от
рицательная <$2 может быть компенсирована положительной е\. В этом случае
недостаток пассивности (в выходном контуре) подсистемы #2 компенсируется
избытком пассивности (во входном контуре) подсистемы Н\.
Пример 6.7. Рассмотрим соединение систем с обратной связью с подси
стемами
:{* =
{Уг =
= f(x) + G(x)e1
h(x)
H
i:К,
_
i)J\
и Н2:у2 = ке2,
гдек>0ивг,уiΕRv
.
Предположим, что существует положительно определен
ная функция Vi(x), такая что
Ц/Ог) < 0, ^G{x)
=h
T
(x),Ух€Rn
.
Обе подсистемы пассивны. Более того, #2 удовлетворяет
(1 —7)
е%у2 = ке$е2 = *ук<%е2 + —^—у2у2,
0<η<1.
Таким образом, неравенство (6.34) выполнено с константами е\ = Si = 0, ε2 =
= 7&и
<Ь = (1 — 7) А· Из этого следует, что условия (6.35) выполнены, и мы
можем заключить, что для замкнутой системы отображение вход-выход u i-> у
является £2-устойчивым с конечным коэффициентом усиления.
Δ
Пример 6.8. Рассмотрим соединение систем с обратной связью для подси
стем
(±1 =Х2
±2= -ах\ - а(х2) +е\
и Н2 :У2= ке2,
2/1 =%2
гдеσ Ε[—а,оо], а > 0, а > 0иfc> 0.Еслиσ принадлежит сектору[0,оо],
можно показать, что Н\ пассивна с функцией запаса V\{x) = (a/4)xf -f (1/2)^2·
В случае если σ Ε [—α, 00], мы имеем
Vi = axfa?2 — aa;fx2 — #20"(#2) + #2^1 ^ OLX\ + X2^\ = &y\ + У\е>\-
Следовательно, неравенство (6.34) выполнено для подсистемы Н\ с константами
е\ =0иS\= —а.Поскольку
9
о
(1~7)9
е2у2=ке2=чке2+—; у2,
0<η<1,
6.5. СИСТЕМЫ С ОБРАТНОЙ связью: ТЕОРЕМЫ О ПАССИВНОСТИ
265
неравенство (6.34) выполнено для подсистемы H<i с константами 82 = ^к
и
^2=
= (1—η)/к. Еслик >а, можновыбратьηтак,чтобыjk >а. Тогдаε\+<Ь>О
и в2 + 5i > 0. Таким образом, можно заключить, что отображение вход-выход
и н-> у является /^-устойчивым с конечным коэффициентом усиления.
Δ
Обратимся к исследованию свойства устойчивости по Ляпунову для соеди
нения систем с обратной связью. Нас интересует вопрос устойчивости и асимп
тотической устойчивости начала координат замкнутой системы при нулевом вхо
де и = 0. Устойчивость начала координат непосредственно следует из теоре
мы 6.1 и леммы 6.6. Поэтому мы сосредоточим наше внимание на исследовании
асимптотической устойчивости. Следующая теорема представляет собой прямое
следствие теоремы 6.1 и леммы 6.7.
Теорема 6.3. Рассмотрим соединение систем, состоящее из двух не завися
щих от времени динамических подсистем вида (б.21)-(6.22). Начало координат
замкнутой системы (6.24) {при и = 0) является асимптотически устойчивым,
если
• обе подсистемы строго пассивны,
• обе подсистемы строго пассивны по выходу и наблюдаемы в нулевом со
стоянии или
• одна из подсистем строго пассивна, а другая — строго пассивна по выходу
и наблюдаема в нулевом состоянии.
Кроме того, если функции запаса обеих подсистем являются радиально неогра
ниченными, то начало координат глобально асимптотически устойчиво.
ДОКАЗАТЕЛЬСТВО. Пусть V\(x\) и Т^(ж2) — функции запаса для Н\ и Щ
соответственно. Как и при доказательстве леммы 6.7, мы можем показать, что
Vi(xi) и V2(#2) являются положительно определенными функциями. Рассмотрим
V(x) = Vi(xi) + V2(x2) B
качестве функции Ляпунова для замкнутой системы.
В первом случае производная V удовлетворяет
V 4:и
Т
у - ^i(xi) - V>2<>2) = -^i(zi) - ^2(^2),
поскольку и = 0. Следовательно, начало координат является асимптотически
устойчивым. Во втором случае
У ^ -ViPiiVi) ~ vZfbfa),
где ylpi(yi) > 0 для всех yi φ 0. В этом случае функция V является отри
цательно полуопределенной иУ = 0^у
= 0. Для того чтобы применить
принцип инвариантности, мы должны показать, что y(t) = 0 => x(t) = 0. Заме
тим, что 2/2Μ = 0 => ei(t) = 0. Тогда из наблюдаемости с нулевым начальным
состоянием подсистемы Н\ следует, что yi(t) = 0 => x\(t) = 0. Аналогично
266
ГЛАВА 6
yi(t) = О => e2(t) = О и из наблюдаемости с нулевым начальным состояни
ем подсистемы #2 следует, что У2(Ь) = 0 => X2(t) = 0. Таким образом, начало
координат асимптотически устойчиво. В третьем случае (со строго пассивной
подсистемой Н{) имеем
V ^ -ll>l{xi) ~У2Р2(У2)
иизV —0следует,что#i=0иу2=0.Заметим,чтоуъ{Ь)=0 =>ei(£)=0,
что с зачетом xi(t) = 0 влечет yi(i) = 0. Следовательно, β2(£) Ξ 0, и из на
блюдаемости с нулевым начальным состоянием подсистемы #2 следует, что
2/2 (t) = 0 => жгМ Ξ 0. Таким образом, начало координат асимптотически устой
чиво. Наконец, если Vi(x\) и ^(#2) являются радиально неограниченными, то
V(x) также обладает этим свойством и начало координат является глобально
асимптотически устойчивым.
Π
В представленном доказательстве используется простая идея, заключающа
яся в использовании суммы функций запаса для подсистем соединения систем
в качестве функции Ляпунова для этой системы. Оставшаяся часть доказатель
ства представляет собой стандартную процедуру анализа системы с использо
ванием методологии Ляпунова. В действительности выполненный анализ пред
ставляется слишком ограничительным, поскольку для доказательства выполне
ния неравенства V = V\ + V2 ^ Омы потребовали, чтобы V\ ^ 0 и V£ ^ 0.
Очевидно, что это требование чрезмерно жесткое, поскольку возможна ситуа
ция, когда один из членов этой суммы, скажем V\, является положительным на
некоторой области, но сумма этих двух членов остается отрицательной V < 0
на той же области. Это соотносится с идеей о том, что недостаток пассивности
одной из подсистем может быть компенсирован избытком пассивности другой
подсистемы. Эта идея используется в примерах 6.10 и 6.11, в то время как при
мер 6.9 представляет собой непосредственное применение теоремы 6.3.
Пример 6.9. Рассмотрим соединение подсистем
{Х\=Х2
(#3=#4
±2= -ах\ - кх2+ei
и Я2:<х±=-Ьхз-%1+е2,
У1=Х2
[У2= X*
где а, Ь и к — положительные константы. Используя Vi — (a/4)xf + (1/2)ж2
в качестве функции запаса для Щ, получаем
V\=ах\х2 —ах\х2 —кх^+x*ie\= —ку\1+ у\е\.
Следовательно, Н\ строго пассивна по выходу. Кроме того, при е\ = 0 имеем
j/i(i) Ξ0^ x2(t) Ξ04 xx(t) = 0,
т. е. Hi является наблюдаемой с нулевым начальным состоянием. Используя V2 =
= (Ь/2)х| + (1/2)#4 в качестве
функции запаса для Н2, получаем
Vi=ЬХ^ХА- ЬХЗХА—Х\+ХА^2 = —2/2+У2е2-
6.5. СИСТЕМЫ С ОБРАТНОЙ связью: ТЕОРЕМЫ О ПАССИВНОСТИ
267
Таким образом, Н2 строго пассивна по выходу. Кроме того, при е2 — О имеем
y2(t) =0& xA(t) =0 =»x3(t) =О,
т. е. #2 является наблюдаемой с нулевым начальным состоянием. Таким образом,
рассматриваемый пример соответствует второму случаю из теоремы 6.3, и, с уче
том того что функции Vi и V2 являются радиально неограниченными, мы можем
заключить, что начало координат глобально асимптотически устойчиво.
Δ
Пример 6.10. Рассмотрим соединение систем с обратной связью из преды
дущего примера, но в качестве выхода подсистемы Н\ выберем у\ = х2 + в\. Из
равенства
Vi= -кх\ +х2ег = -k(yi -ег)
2
-ej + ухех
видно, что #i пассивна, но сделать определенное заключение о строгой пассив
ности или нестрогой пассивности этой подсистемы невозможно. Поэтому мы не
можем применить теорему 6.3. Используя
V=V!+V2=\ах\ +\х\ +\Ьх\+ \х\
в качестве функции Ляпунова для замкнутой системы, получаем
V=—кх2+х2е\—х\4-х±е2=
= —кх2 —Х2Х4—х\ +Х±{Х2—ХА)=
—
—кх2—х\—х\^0.
Более того, из равенства V = 0 следует, что х2 = х± — 0 и
x2(t) Ξ0=^ ax\(t) - x4(t) = 0=>xi(t) = 0,
x4(t) = 0=> -bx3(t) + x2(t) Ξ0^ x3(t) = 0.
Таким образом, используя принцип инвариантности и учитывая тот факт, что
функция V радиально неограниченна, можно заключить, что начало координат
глобально асимптотически устойчиво.
Δ
Пример 6.11. Рассмотрим систему из примеров 4.8 и 4.9
XI=Х2,
#2 = -hi(xi)
- h2(x2),
где hi и h2 — локально липшицевы функции, принадлежащие сектору (0,оо).
Эта система может рассматриваться как модель состояния системы, изображен
ной на рисунке 6.12, где Hi представляет собой интегратор для х2 с отрица
тельной обратной связью h2, а Н2 является каскадным соединением интегратора
для xi и hi. В примере 6.2 мы видели, что Hi является строго пассивной по
выходу с функцией запаса V\ = {1/2)х'2\ в примере 6.3 было показано, что Н2
268
ГЛАВА 6
+.
αт
оi
Х2
Нг
МО
МО
XI
IЯ2
Рис. 6.12. К примеру 6.11
является подсистемой без потерь с функцией запаса V2 = JQ1 h\(a)da. В этом
случае мы не можем применить теорему 6.3, поскольку Щ не является строго
пассивной или нестрого пассивной по выходу. Однако, используя V = V\ 4- V2 =
= JQ1 hi(a)da + (1/2)#2 в качестве функции Ляпунова, мы можем исследовать
систему на предмет асимптотической устойчивости начала координат. Этот ана
лиз был выполнен в примерах 4.8 и 4.9, где было показано, что начало коорди
нат асимптотически устойчиво; глобальная асимптотическая устойчивость будет
иметь место, если f^f hi(z)dz —» 00 при \у\ —• оо. Мы не будем повторять этот
анализ, но заметим, что если h\(y) и /12(2/) принадлежат сектору (0,оо) только
при у е (—а, а), анализ может быть выполнен лишь в некоторой окрестности
начала координат, что приведет к получению результатов о локальной асимпто
тической устойчивости, как в примере 4.8. Это показывает, что свойство пассив
ности остается полезным в качестве средства для проведения анализа Ляпунова
даже в случае, если оно выполнено лишь на конечной области, но не на всем
пространстве.
Δ
Если одной из подсистем является динамическая система, а другая подси
стема представляет собой функцию без памяти, анализ Ляпунова можно выпол
нить с использованием в качестве функции Ляпунова функции запаса. Однако
важно различать случаи, когда эти функции без памяти зависят или не зависят
от времени, т. к. в первом случае замкнутая система будет неавтономной и, сле
довательно, в отличие от ситуации, рассмотренной в теореме 6.3, невозможно
применить принцип инвариантности. В следующих двух теоремах рассматрива
ются вышеупомянутые два случая.
Теорема 6.4. Рассмотрим соединение двух подсистем, первая из которых
является строго пассивной, не зависящей от времени динамической системой
вида (6.21)-(6.22), а вторая — пассивной {возможно, зависящей от времени)
6.5. СИСТЕМЫ С ОБРАТНОЙ связью: ТЕОРЕМЫ О ПАССИВНОСТИ
269
функцией без памяти вида (6.23). Тогда начало координат замкнутой систе
мы (6.28) {при и = 0) равномерно асимптотически устойчиво. Кроме того,
если функция запаса динамической системы радиально неограниченна, начало
координат глобально асимптотически устойчиво.
ДОКАЗАТЕЛЬСТВО. Аналогично тому, как это было сделано в лемме 6.7,
можно показать, что Vi{x{) является положительно определенной функцией. Ее
производная определяется равенством
VL = ^/i(a?i,ei) ^ ejyx -^i(xi) = -е%у2 -^i{x\) ^ -^i(rci).
Тогда утверждение теоремы следует из теоремы 4.9.
Π
Теорема 6·5. Рассмотрим соединение двух подсистем, первая из которых
является не зависящей от времени динамической системой Н\ вида (6.21)-
(6.22), а вторая — не зависящей от времени функцией без памяти Н2 ви
да (6.23). Предположим, что Н\ наблюдаема с нулевым начальным состоянием
и имеет положительно определенную функцию запаса, удовлетворяющую
ejyi ^U+i/i>i(yi).
(6.36)
Предположим также, что Н2 удовлетворяет
<%У2 > е!>2(е2).
(6.37)
Тогда начало координат замкнутой системы (6.28) {при и — 0) асимптотиче
ски устойчиво, если
v
T
[pi{v) + φ2{ν)] > 0, V^ 0.
(6.38)
Кроме того, если V\ радиально неограниченна, то начало координат глобально
асимптотически устойчиво.
ДОКАЗАТЕЛЬСТВО. Используя V\{x\) в качестве функции Ляпунова, полу
чаем
Vi = Q^rfi(xi,ei) ^ efs/i - yjpi{yi) =
= ~е2У2 ~ ViPiiyi) < -[yT<P2(yi) + ViPiiyi)]·
Из неравенства (6.38) следует, что V\ < 0 и Vi = 0 => у\ = 0. С учетом того
что у\{t) = 0 => e2{t) = 0 =>· e\{t) = 0, можно заключить, что из наблюдаемо
сти с нулевым начальным состоянием подсистемы Hi следует x\{t) = 0. Тогда
утверждение теоремы следует из принципа инвариантности.
Π
Пример 6.12. Рассмотрим соединение с обратной связью строго положи
тельно вещественной передаточной функции и пассивной, зависящей от времени
функции без памяти. Из леммы 6Л следует, что динамическая система является
270
ГЛАВА 6
строго пассивной с положительно определенной функцией запаса вида V(x) =
= (1/2)х
т
Рх. Используя теорему 6.4, заключаем, что начало координат замкну
той системы является глобально равномерно асимптотически устойчивым. Этот
результат представляет собой частный случай кругового критерия, рассмотрен
ного в параграфе 7.1.
Δ
Пример 6.13. Рассмотрим соединение подсистем
:{:
„
Iх =fix) +G(x)ei
rj
fч
#1={yi =
J
h\x\
и Н2:у2 = a(e2),
гдеσG(0,oo)иe*,yiGRp
.
Предположим, что существует радиально неограни
ченная положительно определенная функция Vi(x), такая что
f/W<0,
^LG(x) = h
T
(x), VxeR
n
.
Предположим также, что подсистема Hi является наблюдаемой с нулевым на
чальным состоянием. Обе подсистемы пассивны. Более того, #2 удовлетворяет
е%У2 = ^(ег).
Таким образом, неравенство (6.36) выполнено с р\ = О, и неравенство (6.37)
выполнено с φ<2 = σ. Поскольку σ G (0, оо), выполнено неравенство (6.38). Из
теоремы 6.5 следует, что начало координат замкнутой системы глобально асимп
тотически устойчиво.
Δ
Завершим этот параграф рассмотрением преобразований контура. Представ
ленные ниже результаты расширяют сферу применения теорем о пассивности.
Рассмотрим систему с обратной связью, в которой одна из подсистем не явля
ется пассивной или не удовлетворяет условию, необходимому для применения
одной из вышеприведенных теорем. В подобных ситуациях оказывается возмож
ным модифицировать контур в этой системе таким образом, чтобы полученный
эквивалентный контур обладал требуемым свойством. Эта процедура может быть
проиллюстрирована на примере преобразований с постоянным коэффициентом
усиления. Предположим, что Н\ представляет собой не зависящую от време
ни динамическую систему, а #2 — функцию без памяти (возможно, зависящую
от времени), принадлежащую сектору [Ki,K2], где К = К2 — К\ — положи
тельно определенная симметричная матрица. В параграфе 6.1 мы видели, что
принадлежащая сектору [ifi,if2] функция может быть преобразована в функ
цию, принадлежащую сектору [0, оо], путем применения прямой связи по входу
с последующим применением обратной связи по выходу (см. рисунок 6.7). Пря
мая связь по входу в подсистеме ii2 может быть полностью компенсирована
обратной связью по выходу в подсистеме iii (см. рисунок 6.13(b)), что приводит
к образованию эквивалентной системы с обратной связью, в отношении которого
можно рассматривать вопросы асимптотической устойчивости начала координат.
6.5. СИСТЕМЫ С ОБРАТНОЙ связью: ТЕОРЕМЫ О ПАССИВНОСТИ
271
Аналогично умножение слева модифицированной подсистемы Щ на К~
1
может
быть компенсировано путем умножения справа модифицированной подсистемы
#1 на К (см. рисунок 6.13(c)). Наконец, обратная связь по выходу в контуре об
ратной связи подсистемы может быть компенсирована прямой связью по входу
в контуре прямой связи подсистемы (см. рисунок 6.13(d)). Модифицированная
система с обратной связью имеет две подсистемы Я1 и Яг, где Η2 — функция
без памяти, принадлежащая сектору [0, оо]. Таким образом, мы можем применить
теоремы 6.4 или 6.5, если Н\ удовлетворяет условиям соответствующих теорем.
I
I
Нг
#2
+'+
О*
#1
Кг
#2
Кг
Л>- о-
-<?·
(а)
#1
tfiH
#2
К
Кг
]К~
(с)
-*н- К>
<>
(Ь)
Нх
ATiH
я2
К
tfiH
\к-
(d)
.*i
о^
»я2
Рис. 6.13. Преобразования контура с постоянными коэффициентами усиления. Функция
без памяти Яг, принадлежащая сектору [К^К^[9 преобразуется в функцию без памя
ти #2, принадлежащую сектору [0, оо]
Пример 6.14. Рассмотрим систему с обратной связью
Х\=Х2
Hi:{±2= -h{x\) +bx2+ei
и Я2 :У2= ^(ег),
2/1 =^2
272
ГЛАВА 6
гдеσе[α,/?],hG[ai,oo],i>>0,ai >0иA;=/?—α>0.Применяя
преобразование контура, изображенное на рисунке 6.13(d) (с К\ — а и К2 — /?),
получаем систему вида
Х\=Х2
Hi:{%2= —h(xi)-ах2+ё\
ух=&х2+ei
Н2:у2 = сг(ё2),
где σ G [0,оо] иа = о;-6. Если а > Ь, можно показать (см. упражнение 6.4),
что Hi строго пассивна с функцией запаса Vi = k J^
1
h(s)ds + х
т
Рх, гдеΡ =
=Р
т
> 0. Таким образом, из теоремы 6.4 следует, что начало координат системы
глобально асимптотически устойчиво.
Δ
Ч>+ tfi
#2
^<>^ m
W-^a)
Нг
Н2
W(s)
Н2
(Ь)
Рис. 6.14. Преобразования контура с динамическими множителями
Далее будут рассмотрены преобразования контура с динамическими множи
телями (dynamic multipliers), см. рисунок 6.14. Умножение подсистемы Щ слева
на передаточную функцию W(s) может быть компенсировано умножением под
системы Hi справа на W~
1
(s) при условии, что обратная функция существует.
Например, если в качестве Н2 выступает пассивная, не зависящая от времени
функция без памяти h, то, как мы видели в примере 6.3, умножение h слева на
передаточную функцию l/(as + 1) приводит к строго пассивной динамической
системе. Умножение подсистемы Hi справа на (as + 1) приводит к строго пас
сивной системе или к строго пассивной по выходу системе, являющейся наблю
даемой в нулевом состоянии. В этом случае мы можем применить теорему 6.3
и доказать асимптотическую устойчивость начала координат. Эта идея иллюстри
руется следующими двумя примерами соответственно с линейной и нелинейной
подсистемой Н\.
Пример 6.15. Пусть Hi — линейная, не зависящая от времени система,
представленная моделью состояния
х—Ах+Bei,yi=Сх
6.5. СИСТЕМЫ С ОБРАТНОЙ связью: ТЕОРЕМЫ О ПАССИВНОСТИ
273
где
А=
О1
-1
-1
,В=
и С=[1 0].
Ее передаточная функция l/(s
2
+ s + 1) имеет относительную степень два; сле
довательно, она не является положительно вещественной. Умножение #i справа
на (as + 1) приводит к системе Hi, представленной моделью состояния
х=Ах+Bei,yi=Сх,
где С = С + аСА = [1 а].Ее передаточная функция (as + l)/(s
2
+5+1)
удовлетворяет условиям
Re
1+ jua
1—ω
2
+ jo;
1+(a- 1)ω2
(1_α;2)2+α;:
> 0, Vo;ΕД,
limωRe
1+ja;a
1—ω
2
+ ja;
a- 1>0,
если a ^ 1. Таким образом, выбрав a > 1, мы можем применить леммы 6.1
и 6.4 и заключить, что /fi строго пассивна с функцией запаса (1/2)х
т
Рх, где Ρ
удовлетворяет уравнениям
РА+А
Т
Р=-L
T
L-εΡ,ΡΒ =С
т
для некоторых L и ε > 0. С другой стороны, пусть Н2 имеет вид i/2 = М
е
2)>
г
Де
ft G [0, оо]. В примере 6.3 было показано, что умножение ft слева на передаточ
ную функцию l/(as + l) приводит к строго пассивной системе с функцией запаса
α/0
62
h(s)ds. Из теоремы 6.3 следует, что начало координат преобразованной си
стемы, изображенной на рисунке 6.14(b) (с нулевым входом), асимптотически
устойчиво и функция Ляпунова имеет вид V — (1/2)х
т
Рх +aj^
2
h(s)ds. За
метим, однако, что преобразованная система, изображенная на рисунке 6.14(b),
имеет модель состояния размерности три, в то время как исходная система имеет
модель состояния размерности два; таким образом, для установления асимптоти
ческой устойчивости начала координат исходного соединения систем необходи
мо выполнить дополнительную работу. Количество этой дополнительной работы
можно уменьшить, если использовать преобразованное соединение систем лишь
для определения функции Ляпунова У, производную которой можно вычислить
вдоль решений исходной системы. Эта производная определяется равенством
V=\х
т
Рх +\х
т
Рх + aft(e2)e2 =
=\х
т
Р\Ах
-
Bh(e2)\ + \[Ax-
Bh(e2)]TPx + ah(e2)C[Ax - Bh(e2)\ =
= -\x
T
LTLx
-
(e/2)x
T
Px -x
T
CTh(e2) + ah(e2)CAx =
274
ГЛАВА 6
= -\x
T
LTLx
-
{е/2)х
т
Рх-х
т
[С + aCA]Th(e2) + ah(e2)CAx =
-
-\x
T
LTLx
-
(e/2)x
T
Px - e%h(e2) ^
-(e/2)x
T
Px,
из которого следует, что начало координат асимптотически устойчиво. В дей
ствительности, поскольку V радиально неограниченна, мы можем заключить,
что начало координат глобально асимптотически устойчиво.
Δ
Пример 6.16. Рассмотрим систему с обратной связью при
{±1 =Х2
х2=-Ъх\-kx2+ei
и Н2:у2 = Л(ег),
2/1 =Ж1
гдеЬ>О,к>ОиhΕ[0,оо].УмножениеHiсправана(as+1)приводиткси
стеме Hi, представленной тем же уравнением состояния, но с новым выходом
2/1 = #1 + α#2· Используя Vi = (l/4)bxf + (l/2)x
T
Px в качестве функции запаса
для системы Яь получаем
Vi = 6(1 - P22)XlX2 ~ Pubxi + (рцЖ1 +^12^2)^2 ~
~(P12X1 +P22%2)kX2 + (Pl2^1 +P22»2)ei.
Полагая рц = fc, pi2 = Р22 = 1, α = 1 и предполагая, что fc > 1, получаем
равенство
й = -^-(*-1)ж!+у1в1,
из которого следует, что система Н\ строго пассивна. С другой стороны, умно
жение h слева на передаточную функцию \/(s + 1) приводит к строго пассивной
системе с функцией запаса /0
62
h(s)ds. Используя функцию запаса преобразован
ной системы
V = (l/4)bxj + (1/2)х
т
Рх+/
2
h(s)ds
Jo
в качестве функции Ляпунова для исходной системы (при и = 0), получаем
соответствующую производную
V=Ьх\х2 +(кХ\+Х2)^2+(Xl+Х2)[—Ьх\ - кХ2- Н(в2)]+h(e2)X2—
—
— (fc — 1)х2 — Ъх\ — xih(xi),
являющуюся отрицательно определенной функцией. Поскольку V положительно
определена, можно заключить, что начало координат глобально асимптотически
устойчиво.
Δ
6.6. Упражнения
6.1. Покажите, что функция, принадлежащая сектору [Ki,K2], может быть пре
образована в функцию, принадлежащую сектору [0, оо], путем применения пря
мой связи по входу с последующей обратной связью по выходу (см. рисунок 6.7).
6.6. УПРАЖНЕНИЯ
275
6.2. Рассмотрим систему
ах=—х+т^{х)+и,у=ft(x),
к
где а и к — положительные константы и/iG [0,fc]. Покажите, что система пас
сивна с функцией запаса V(x) = а f£ h(a)da.
6.3. Рассмотрим систему
Х\—Х2>Х2= —h(xi) - аХ2+U,у =аХ\+#2,
где 0 < а < а и ft Ε (0, оо]. Покажите, что система строго пассивна.
Указание: используйте V(x) из примера 4.5 в качестве функции запаса.
6.4. Рассмотрим систему
х\ =Х2,Х2= —h(xi)—ах2+щу=кх2+щ
гдеа>О,А;>0,ftΕ[с*ъоо]иа\>0.ПустьУ(ж)=кf^
1
h(s)ds + х
т
Рх, где
Рп = api2> Р22 = к/2 и 0 < pi2 < min{2ai,afc/2}. Используя V(x) в качестве
функции запаса, покажите, что система строго пассивна.
6.5. Рассмотрим систему, представленную блок-диаграммой, изображенной на
рисунке 6.15, где и, у Ε Rp
, Μ и К — положительно определенные симметрич
ные матрицы, ft Ε [0, К] и f£ hT(a)Mda > 0 для всех х. Покажите, что система
строго пассивна по выходу.
и
(Ms + К)"
1
X
МО
У
Рис. 6.15. К упражнению 6.5
6.6. Покажите, что параллельное соединение двух пассивных (соответственно
строго пассивных по входу, строго пассивных по выходу, строго пассивных)
динамических систем является пассивной (соответственно строго пассивной по
входу, строго пассивной по выходу, строго пассивной) системой.
6.7. Покажите, что передаточная функция (bos 4- bi)/(s
2
+ a\s + аг) строго по
ложительно вещественная, если и только если все коэффициенты положительны
иbi<ai&o·
6.8. Рассмотрим уравнения (6Л4)—(6.16) и предположим, что матрица (D + D
T
)
невырожденна. Покажите, что Ρ удовлетворяет уравнению Риккати
РА0+AlP-РВ0Р+С0=0,
где А0 = -(e/2)I-A^B(D^D
T
)-
1
C,
В0 = B(D+D
T
)-
l
BT
иС0=
-C
T
(D+
+D
T
)-
1
C.
6.9. Покажите, что если система является строго пассивной по входу с φ(ν) — ей
и £2-устойчива с конечным коэффициентом усиления, то существуют функция
запаса V и положительные константы ε\ и δ\9 такие что
и
т
у^V+е\и
т
и + SiyTy.
276
ГЛАВА 6
6.10. Рассмотрим уравнения движения га-звенного манипулятора, рассмотрен
ного в упражнении 1.4. Предположим, что P(q) — положительно определенная
функция переменных q и g(q) = 0 имеет изолированный корень в q = 0.
(a) Покажите, используя полную энергию V = -q
T
M(q)q + P(q) в качестве
функции запаса, что отображение и ь-> q пассивно.
(b) Покажите для и = —K^q 4- υ, где К& — постоянная положительная диаго
нальная матрица, что отображение ν i-> q строго пассивно по выходу.
(c) Покажите, что и = —K^q, где Кд — постоянная положительная диагональ
ная матрица, обеспечивает асимптотическую устойчивость начала коорди
нат (q — 0, q = 0). При каком дополнительном условии начало координат
является глобально асимптотически устойчивым?
6.11 ([151]). Уравнения Эйлера для вращающегося твердого тела имеют вид
JicJi = (J2 - J3V2CJ3 + wi,
J2CJ2 = (J3 - Jl)usU\ + U2,
^3^3 = (Ji - ^2)^1^2 + щ,
где ω\, и>2 и ω% — компоненты вектора угловой скорости вдоль главных осей, щ,
u<i и us — моменты, приложенные вокруг главных осей, рассматриваемые как
входы системы, и Ji, J2 to J3 — главные моменты инерции.
(a) Покажите, что отображение и = [ui,U2,us]
T
·-» ω = [^1,^2»^з]
т
является
отображением без потерь.
(b) Пусть и = —Κω -h v9 где К — положительно определенная симметричная
матрица. Покажите, что отображение υ ·-> ω является С2 -устойчивым с ко
нечным коэффициентом усиления.
(c) Покажите, что если ν = 0, то начало координат ω = 0 глобально асимптоти
чески устойчиво.
6.12. Рассмотрим систему с обратной связью, изображенную на рисунке 6.11, где
Hi и #2 имеют модели состояния
Xi = Ji\Xi) 1 \jriyXi)Ci) yi :=:
tliyXi) -\ - JiyXiJSi^ % = 1?Z.
Покажите, что система с обратной связью имеет корректно определенную модель
состояния, если матрица / + J2(x2)Ji(xi) невырожденна для всех х\ и х2.
6.13. Рассмотрим уравнения (6.26)-(6.27) и (6.30)—(6.31). Предположим, что h\ =
= h±(xi) независима от е\. Покажите, что в каждом из рассматриваемых случаев
уравнения имеют единственное решение (ei,e2).
6.14. Рассмотрим изображенную на рисунке 6.11 систему при
(±1 =Х2
±2= —х\- h\(x2) + е\
и Я2:
2/1 =Х2
(хз=-жз+е2
\У2 =h2(x3)
6.6. УПРАЖНЕНИЯ
277
где hi и /i2 — локально липшицевые функции, удовлетворяющие hi Ε
(0,оо], /i2 £ (0, оо] и |/i2(2)| ^ N/(1 + ^
2
) для всех z.
(a) Покажите, что система пассивна.
(b) Покажите, что начало координат свободной системы глобально асимптоти
чески устойчиво.
6.15. Выполните предыдущее упражнение для системы с компонентами
(±1= -Xi +Х2
Х2= —Ж?-#2+Ci И#2'
У\ =Х2
6.16 ([78]). Рассмотрим изображенную на рисунке 6.11 систему с обратной свя
зью, где Hi и #2 — пассивные динамические системы вида (6.21)-(6.22). Пред
положим, что система имеет корректно определенную модель состояния и после
довательное соединение Н\{—Н2)9 с входом в2 и выходом yi, является наблю
даемым в нулевом состоянии. Покажите, что начало координат асимптотически
устойчиво, если Н2 является строго пассивной по входу или если Hi является
строго пассивной по выходу.
6.17 ([78]). Рассмотрим изображенную на рисунке 6.11 систему с обратной свя
зью, где Hi и Щ — пассивные динамические системы вида (6.21)-(6.22). Пред
положим, что система имеет корректно определенную модель состояния и после
довательное соединение #2#ь с входом ei и выходом у2, является наблюдаемым
в нулевом состоянии. Покажите, что начало координат асимптотически устойчи
во, если Hi является строго пассивной по входу или если Н2 является строго
пассивной по выходу.
6.18 ([78]). Обобщением концепции пассивности является понятие диссипатив-
ности. Динамическая система вида (6.6)-(6.7) называется диссипативной с функ
цией расхода (supply rate) w(u,y), если существует положительно определенная
функция запаса V(x)9 такая что V ^ w. Рассмотрим изображенную на рисун
ке 6.11 систему, где Hi и Н2 являются наблюдаемыми в нулевом состоянии дина
мическими системами вида (6.21)-(6.22). Предположим, что каждая из подсистем
Hi и Н2 является диссипативной с функцией запаса Vi(xi) и функцией расхода
щ(щ, Уг) = yjQiVi + ^
T
y%SiUi + ufRiUi, где Qi и Ri — вещественные симмет
ричные матрицы и Si — вещественная матрица. Покажите, что начало координат
устойчиво (соответственно асимптотически устойчиво), если матрица
Qi+aR2
-Si +aS%1
-Sf+aS2 Ri+aQ2J
является отрицательно полуопределенной (соответственно отрицательно опреде
ленной) для некоторой а > 0.
6.19. Рассмотрим систему с обратной связью, компоненты которой являют
ся не зависящими от времени динамическими системами вида (6.21)-(6.22).
*3= -Яз+
е
2
f*3 =
12/2 =
У2 =%з
Q=
278
ГЛАВА 6
Предположим, что обе подсистемы являются наблюдаемыми с нулевым началь
ным состоянием и существуют положительно определенные функции запаса,
удовлетворяющие
efyi ^Vi + e[<pi(ei) + yjРг(Уг), i = 1,2.
Покажите, что начало координат замкнутой системы (6.24) при и — 0 асимпто
тически устойчиво, если
v
T
[pi(v) +ψ2{ν)}>0 и v
T
[p2(v) - (pi(-v)] > О, \/v φ 0.
При каких дополнительных условиях начало координат является глобально
асимптотически устойчивым?
ГЛАВА 7
Частотный анализ систем с обратной связью
Большинство нелинейных физических систем могут быть представлены
в виде системы с обратной связью, состоящей из линейной динамической си
стемы и нелинейной подсистемы (см. рисунок 7.1)1
. Процедура преобразования
системы к этой форме представления зависит от ее исходного вида. Например,
если единственная нелинейность системы имеет вид реле или нелинейности при
вод/датчик, какие-либо трудности при представлении этой системы в форме си
стемы с обратной связью, изображенной на рисунке 7.1, отсутствуют. В других
G(s)
νκ·)Γ
Рис. 7.1. Система с обратной связью
случаях нахождение соответствующего преобразования может оказаться нетри
виальной задачей. Мы будем предполагать, что внешнее входное воздействие
отсутствует (г = 0), и выполним анализ поведения этой свободной системы.
Особенностью представленных в этой главе результатов является то, что при
их получении используются методы частотного анализа для линейных систем,
основанные на классических для теории управления средствах исследования —
диаграмме и критерии Найквиста. В параграфе 7.1 рассматриваются вопросы
абсолютной устойчивости. Система называется абсолютно устойчивой, если она
имеет глобально равномерно асимптотически устойчивую точку равновесия в на
чале координат для всех нелинейностей из заданного сектора. Круговой критерий
и критерий Попова являются достаточными условиями абсолютной устойчиво
сти в частотной области, представленными в форме требования строгой поло
жительной вещественности определенных передаточных функций. В случае си
стемы с одним входом и одним выходом оба критерия допускают графическое
1
Форма, представленная на рисунке 7.1, часто называется формой Лурье или системой Лурье
(Lurie system, Lur'e system) в честь выдающегося петербургско-ленинградского механика Анатолия
Исаковича Лурье (1901-1980), впервые изучившего устойчивость таких систем систематически
[Д43, Д44]. — Прим. ред. перев.
—о—•
280
ГЛАВА 7
представление. В параграфе 7.2 используется метод описывающей функции
2
для
доказательства существования периодических решений в системах с одним вхо
дом и одним выходом. Мы получим частотные условия, которые могут быть
проверены графически и позволяющие ответить на вопрос о существовании или
отсутствии в системе колебаний, а также получить оценки частоты и амплитуды
колебаний, если они имеют место.
7.1. Абсолютная устойчивость
Рассмотрим систему, изображенную на рисунке 7.1. Предположим, что
внешнее воздействие отсутствует (г = 0), и выполним анализ поведения сво
бодной системы, представленной в виде
х=Ах+Ви,
(7.1)
у=Сх+Du,
(7.2)
u = -1>(t,y),
(7.3)
где х GДп
, и, у £ ВР, {А, В) — управляемая пара, (А, С) — наблюдаемая пара
иφ:[0,оо)хВ
р
—» ВР — нелинейность без памяти (возможно, зависящая от
времени), являющаяся кусочно-непрерывной по t и локально липшицевой по у
функцией. Будем предполагать, что система имеет корректно определенную мо
дель состояния, что имеет место, если уравнение
и=-ф(г,Сх+Du)
(7.4)
имеет единственное решение и для всех (£, х) в исследуемой области. Это усло
вие всегда выполнено, если D = 0. Передаточная матрица линейной системы
G(s) = C(sl - А)'
1
В+D
(7.5)
является квадратной и собственной. Предположения об управляемости и наблю
даемости обеспечивают то, что {Л, В, С, D} представляет собой минимальную
реализацию для G(s). Из теории линейных систем известно, что для любой ра
циональной и собственной передаточной матрицы G(s) минимальная реализация
всегда существует. Мы также будем предполагать, что нелинейность ψ удовле
творяет секторному условию в соответствии с определением 6.2. Секторное усло
вие может быть выполнено глобально, т. е. для всех у £ ВР, или выполнено лишь
для у G Y, где Υ — подмножество ВР, внутренность которого связна и содержит
начало координат.
Для всех нелинейностей, удовлетворяющих секторному условию, начало ко
ординат х = 0 является точкой равновесия системы (7.1)—(7.3). Наша задача за
ключается в том, чтобы исследовать свойства устойчивости начала координат не
2
В отечественной литературе используется термин «метод гармонического баланса». Далее тер
мин будет переводиться в авторском варианте. — Прим. ред. перев.
7.1. АБСОЛЮТНАЯ унии^ш^.-
для конкретной нелинейности, а для некоторого класса нелинейностей, удовле
творяющих заданному секторному условию. Если мы докажем, что начало коор
динат равномерно асимптотически устойчиво для всех нелинейностей в секторе,
то исследуемая система будет называться абсолютно устойчивой. Эта проблема
была первоначально сформулирована Лурье
3
и иногда называется задачей Лурье.
Традиционно абсолютная устойчивость определяется для случая, когда начало
координат глобально равномерно асимптотически устойчиво. Следуя этой тради
ции, мы будем использовать фразу «абсолютная устойчивость» в случаях, когда
секторное условие выполнено глобально и начало координат глобально равно
мерно асимптотически устойчиво. В противном случае мы будем использовать
фразу «абсолютная устойчивость в конечной области».
Определение 7.1. Рассмотрим систему (7.1)-(7.3), где φ удовлетворяет
секторному условию в соответствии с определением 6.2. Эта система назы
вается абсолютно устойчивой, если начало координат глобально равномерно
асимптотически устойчиво для всех нелинейностей из заданного сектора. Эта
система называется абсолютно устойчивой в конечной области, если начало
координат равномерно асимптотически устойчиво.
Мы будем исследовать асимптотическую устойчивость начала координат
с использованием методов Ляпунова. Функция Ляпунова может быть найдена
с применением средств пассивности, рассмотренных в предыдущей главе. В част
ности, если замкнутая система может быть представлена в виде соединения с об
ратной связью, состоящего из двух пассивных систем, то сумма двух соответству
ющих функций запаса может быть использована в качестве функции Ляпунова
для всей замкнутой системы. Использование преобразований контура позволяет
выбирать для исследования различные секторы и различные функции Ляпунова,
что приводит нас к рассмотрению кругового критерия и критерия Попова.
7.1.1. Круговой критерий
Теорема 7.1. Система (7.1)-(7.3) является абсолютно устойчивой, если
• ψ £ [ifi,oo] и G(s)[I + KiG(s)]~
1
является строго положительно веще
ственной или
• φе[КиК2], сК=К2-Кх
=К
Т
> 0, и [J + K2G{s)][I + ifiG(s)]-
1
является строго положительно вещественной.
Если секторное условие выполнено лишь на множестве Υ С RP, вышеприве
денные условия обеспечивают абсолютную устойчивость системы в конечной
области.
Мы будем называть эту теорему многомерным круговым критерием, хотя
основание для такого наименования появится лишь тогда, когда мы рассмот
рим частный случай этого критерия для скалярной нелинейности. Необходимым
3
См. примечание на с. 279. — Прим. ред. перев.
282
ГЛАВА 7
условием единственности решения и уравнения (7.4) для всех φ Ε [1£Ι,οο] или
φ £ [К\,К2\ является невьфожденность матрицы (/ + K\D). Убедиться в этом
можно, если положить ψ = К\у в (7.4). Из этого следует, что передаточная мат
рица [/ + K\G{s)\~
x
является собственной.
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 7.1. Сначала выполним доказательство для
сектора [0, оо]; доказательство для остальных случаев будет получено с исполь
зованием преобразований контура. Если φ е [0, оо] и G(s) строго положительно
вещественна, мы имеем соединение систем с обратной связью, состоящее из
двух пассивных систем. Из леммы 6.4 известно, что функция запаса для линей
ной динамической системы имеет вид V(x) = (1/2)х
т
Рх, гдеΡ=Р
т
>О
удовлетворяет уравнениям Калмана-Якубовича-Попова
РА+А
Т
Р=-L
T
L-
еР,
(7.6)
РВ=С
Т
-
LTW,
(7.7)
WTW =D+D
T
(7.8)
и ε > 0. Используя V(x) в качестве функции Ляпунова, получаем
V=\х
т
Рх +\х
т
Рх =\х
т
{РА +А
т
Р)х+х
т
РВи.
Используя (7.6) и (7.7), имеем
V=-\x
T
LTLx
-
\ех
т
Рх +х
т
(Ст
-
LTW)u =
= -±x
T
LTLx
-
±ех
т
Рх+(Сх+Du)
T
u-u
T
Du-
x
T
LTWu.
Используя (7.8) и учитывая тот факт, что и
T
Du=\u
T
{D +D
T
) и, получаем
V=-\ех
т
Рх - \{Lx +Wu)
T
{Lx+Wu)-y
T
ip(t,y).
Поскольку утф(1, у) ^ 0, имеем оценку
V^-l
ex
T
Px,
из которой следует, что начало координат глобально экспоненциально устойчиво.
Если φ удовлетворяет секторному условию лишь для у Ε У, представленный вы
ше анализ справедлив в некоторой окрестности начала координат и позволяет за
ключить, что начало координат экспоненциально устойчиво. Случай φ Ε [К\, оо]
посредством преобразования контура, блок-схема которого изображена на рисун
ке 7.2, может быть сведен к случаю, когда нелинейность принадлежит сектору
[0, оо]. Следовательно, система является абсолютно устойчивой, если G(s)[I +
+ jftTiG(s)]-1
является строго положительно вещественной. Случай ψ G [К\,К*^
7.1 . АБСОЛЮТНАЯ УСТОЙЧИВОСТЬ
283
+
^
G(s)
+х1+/-
*(·)
1
1-
1
1
>—'
S
J-
:1
|1
1.
G(s)
Кг
ф(.)
Кг
-
τ
*
I
I
I
1
*
1
Ι φ(.)
_
—
_
J
Рис. 7.2. Нелинейность ψ Ε [Ki, оо] преобразована в ψ е [0, оо] посредством преобразо
вания контура
G(s)
Ф(')
-^СН" о-
G(s)
КгΜ
К
-о
*(·)
ATi
/С" К^
I ^(.)
Рис. 7.3. Нелинейность ^ е [ifi,^] преобразована в ψ е [0,оо] посредством преобра
зования контура
посредством преобразования контура, блок-схема которого изображена на рисун
ке 7.3, может быть сведен к случаю, когда нелинейность принадлежит сектору
[О, оо]. Следовательно, система является абсолютно устойчивой, если
/ + KG(s)[I + XiG(s)]-
1
= [I + K2G(s)][I + К1ОД]-
1
является строго положительно вещественной.
Π
Пример 7.1. Рассмотрим систему (7.1)—(7.3) и предположим, что G(s) гур-
вицева и строго собственная. Пусть
71 = supama*[G(>;)] = sup ||6?0'ω)||2,
где <ттах[·] обозначает максимальное сингулярное число комплексной матрицы.
Постоянная 71 конечна, поскольку G(s) гурвицева. Предположим, что φ удовле
творяет неравенству
\\ФЫ\\2^12\\у\\2,\/г^оууеВ?.
(7.9)
284
ГЛАВА 7
Тогда эта нелинейность принадлежит сектору [Ki, К2] с К\ = —η2Ι и^2 = 72 J·
Для того чтобы применить теорему 7.1, нам необходимо показать, что
Z(s) =[I+
l2G(s)}[I-l2G(s))-
1
является строго положительно вещественной. Заметим, что det[Z(s) + Z
T
(—s)]
не равен тождественно нулю, поскольку Z(oo) = I. Применим лемму 6.1. По
скольку G(s) гурвицева, Z(s) будет также гурвицевой, если [/ — 72G(s)]_1
гур-
вицева. Заметим, что
4
СГтт[1 ~ 12G(JUJ)] ^ 1 - 7172-
Тогда, если 7172 < 1, кривая det[/ — j2G(ju)] не проходит через начало ко
ординат и не очерчивает его. Следовательно, с использованием многомерного
критерия Найквиста можно заключить,
5
что [/ — 72^(5)]_1
—
гурвицева матрица
и, следовательно, Z(s) также гурвицева. Далее, покажем, что
Z(ju) + Z
T
(-ju) >0,\/ωеК
Левая часть этого неравенства определяется равенством
Z(ju>) + Ζτ{-3ω) = [Ι + i2G(ju)][I - l2G^)]~
l
+
+ [/ " l2GT(-ju)}-
1
[I +l2G
T
{-ju)] =
= [I~j2G
T
(-ju)}-
1
[2I - 2j*G
T
(-ju)G(ju;)} x
x[I-j2G(ju)}-\
Следовательно, Z(ju>) -f - Z
T
(—JUJ) положительно определена для всех ω, если
и только если
<W/ - llG
T
{-ju)G{ju>)\ > 0, Vu; 6 R.
В случае 7172 < 1 имеем
σTMη[Ι-ΙNoΤΗωNoω)}
^1-
^amax[GT(-ju))amax[G(ju)]
^l-7i272
2
>0.
Наконец, Z(oo) + Ζτ(οο) = 21. Таким образом, все условия леммы 6.1 выполне
ны, и мы можем заключить, что Z(s) является строго положительно веществен
ной и, следовательно, система является абсолютно устойчивой, если 7172 < 1·
4
3десь используются следующие свойства сингулярных чисел комплексной матрицы:
detG^0^amin[G] > О,
tfmax[G-1
] = 1/σ„πη[<3], если amln[G] > 0,
amin[/ + G] ^ l-amax[G],
"max [G1G2] ^ 0"тах[С?1]атах[С?2].
5
Формулировка многомерного критерия Найквиста приведена в работе [33, стр. 160-161].
7.1. АБСОЛЮТНАЯ устойчивость
285
Этот результат представляет собой свойство робастности, которое показывает,
что если гурвицеву передаточную матрицу замкнуть нелинейностью, удовлетво
ряющей (7.9) с достаточно малым коэффициентом 72? то это не нарушит устой-
Δ
чивости системы
В скалярном случае ρ = 1 условия теоремы 7.1 могут быть проверены гра
фически путем анализа кривой Найквиста для G(ju). При ψ € [α, β], β > а,
система абсолютно устойчива, если скалярная передаточная функция
Z(s)
1+/ЗОД
1 + aG(s)
строго положительно вещественна. Для того, чтобы проверить для Z(s) выполне
ние требования о строгой положительной вещественности, мы можем использо
вать лемму 6.1, в которой утверждается, что Z(s) является строго положительно
вещественной, если она является гурвицевой и
7
Re
1+βΟ(]ω)
1 + aG(ju)
> О, Vu; G [—00,00].
(7.10)
Для того чтобы установить связь между условием (7.10) и кривой Найквиста для
G(ju), необходимо различать три случая, соответствующих различным знакам
при а. Рассмотрим первый случай, когда β > а > 0. В этой ситуации усло
вие (7.10) может быть переписано в следующей форме:
Re
, Vω Ε [-00,00].
(7.11)
Каждой точке q на кривой Найквиста для G(ju) соответствуют два комплексных
числа (1//3) + G(jui) и (1/а) + G(ju), определяемых прямыми, соединяющими
точку q с точками —(Ι/β) + jO и — (1/α) + jO соответственно (см. рисунок 7.4).
Вещественная часть отношения этих двух комплексных чисел положительна, ес
ли угол между этими двумя числами на комплексной плоскости меньше π/2, τ. е.
если угол (#i — 02) на рисунке 7.4 меньше π/2. Обозначим через Ω(α,β) за
мкнутый круг на комплексной плоскости, диаметр которого представляет собой
отрезок, соединяющий точки —(1/α) + jO и — (Ι/β) +J0. Тогда легко видеть, что
угол (01—02) будет меньше π/2, если q расположена вне круга £>(α, β). Посколь
ку условие (7.11) должно выполняться для всех ω, все точки на кривой Найквиста
для G(ju) должны находиться строго вне круга D(a, β). С другой стороны, Z(s)
Неравенство 7172 < 1 может быть получено также с использованием теоремы о малом коэф
фициенте усиления (см. пример 5.13).
7
Частотные неравенства при ω = ±оо здесь и далее понимаются как неравенства для пределов
при ω —*• ±оо. — Прим. ред. перев.
286
ГЛАВА 7
Рис. 7.4. Графическое представление кругового критерия
является гурвицевой, если G(s)/[1 + aG(s)] гурвицева. Из критерия Найквиста
следует, что G(s)/[1 + aG(s)} является гурвицевой, если и только если кривая
Найквиста для G(ju) не проходит через точку — (1/а) + jO и обходит ее против
часовой стрелки ровно т раз, где т — число полюсов G(s) в открытой правой
полуплоскости комплексной плоскости
8
. Поэтому условия теоремы 7.1 выполне
ны, если кривая Найквиста для G(ju) не входит в круг £)(а,/3) и обходит его
против часовой стрелки га раз. Рассмотрим далее случай, когда β > 0 и а = 0.
В этой ситуации для использования теоремы 7.1 необходимо, чтобы 1 + /?G(s)
была строго положительно вещественной. Это требование будет выполнено, если
G(s) гурвицева и
Re[l + βθ^ω)] > 0, \/ω е [-оо,оо].
Это условие может быть переписано в следующей форме:
Re[G(jw)] > -i Vo; G [-00,00],
что эквивалентно графическому критерию, заключающемуся в том, что кривая
Найквиста для G{JUJ) должна лежать справа от вертикальной прямой, определя
емой величиной Re[s] = —1//?. Наконец, рассмотрим случай, когда а < 0 < β.
В этой ситуации условие (7.10) эквивалентно неравенству
<0, Vwe [-00,00].
(7.12)
Знак в этом неравенстве изменен на противоположный, поскольку, переходя
от (7.10) к (7.12), мы применили умножение на величину α/β, которая в рас
сматриваемом случае отрицательна. Повторив рассуждения, приведенные выше,
8
Если G(s) имеет полюсы на мнимой оси, кривая Найквиста как обычно усекается в правой
полуплоскости.
Re
7.1 . АБСОЛЮТНАЯ УСТОЙЧИВОСТЬ
287
можно заключить, что для выполнения (7.12) необходимо, чтобы кривая Найкви
ста для G(ju>) лежала внутри круга £>(<*,/?). Следовательно, кривая Найквиста
не может обойти точку —(1/а) + jO. Тогда из критерия Найквиста следует, что
G(s) должна быть гурвицевой для того, чтобы была гурвицевой G(s)/[l+aG(s)].
Критерий устойчивости для рассмотренных трех случаев сформулирован в сле
дующей теореме и известен как круговой критерий
Теорема 7.2. Рассмотрим скалярную систему вида (7.1)-(7.3), где
{А, В, С, D} —минимальное представление для G(s) и ψ € [α, β]. Тогда система
является абсолютно устойчивой, если выполнено одно из следующих условий:
1) Если 0 < а < β, кривая Найквиста для G(ju>) не входит в круг £>(а,/3)
и обходит его против часовой стрелки т раз, где т — число полюсов G(s)
с положительными вещественными частями.
2) Если О = а < /?, G(s) гурвицева и кривая Найквиста для G(ju) ле
жит справа от вертикальной прямой, определяемой соотношением Re[s] =
=
- i/β.
3) Если а < О < /?, G(s) гурвицева и кривая Найквиста для G(ju) лежит во
внутренности круга Ω(α,β).
Если секторное условие выполнено лишь на интервале [а, Ь], вышеприведенные
условия обеспечивают абсолютную устойчивость в конечной области.
Круговой критерий позволяет исследовать абсолютную устойчивость с ис
пользованием лишь информации о кривой Найквиста для G(ju). Это обстоятель
ство представляется важным, поскольку кривая Найквиста может быть непосред
ственно получена из экспериментальных данных. Имея кривую Найквиста для
G(ju)9 мы можем найти секторы для нелинейностей, допустимые с точки зрения
обеспечения абсолютной устойчивости. Следующие два примера иллюстрируют
использование кругового критерия.
Пример 7.2. Пусть
(5+l)(±s+l)(IS+l)'
Кривая Найквиста для G(jtj) показана на рисунке 7.5. Поскольку G(s) гурвицева,
мы можем выбрать а отрицательной и использовать третий случай из теоремы
о круговом критерии. Таким образом, нам необходимо определить круг £>(а,/?),
который включает кривую Найквиста. Очевидно, что эта задача имеет неедин
ственное решение. Предположим, что мы решили расположить центр круга в на
чале координат комплексной плоскости. Это соответствует выбору круга вида
£4—72,72) с подлежащим определению радиусом (I/72) > 0. Кривая Найквиста
будет лежать внутри этого круга, если |G(jo;)| < I/72· В частности, если мы
положим 7i = sup^GjR \G(jtj)\9 то величина 72 должна быть выбрана так, чтобы
288
ГЛАВА 7
было выполнено неравенство 7i72 < 1· Это условие совпадает с тем, что было
найдено в примере 7.1. Нетрудно заметить, что |G(ja;)| достигает максимума при
ω = 0 и 7i = 4. Таким образом, величина 72 должна быть меньше 0.25. Следова
тельно, можно заключить, что система является абсолютно устойчивой для всех
нелинейностей из сектора [—0.25 + ε, 0.25 — ε], где ε > 0 может быть произволь
но малой. Из анализа кривой Найквиста и круга D(—0.25,0.25) на рисунке 7.5
можно сделать вывод, что выбор круга с центром в начале координат не является
наилучшим. Расположив центр круга в другой точке, мы можем сделать так, что-
6
4
2
0
-2
-4
-5
0
5
Рис. 7.5. Кривая Найквиста для примера 7.2
бы этот круг окружил кривую Найквиста более плотно. Например, расположим
центр в точке 1.5 + j0. В этом случае максимальное расстояние от этой точки
до кривой Найквиста равно 2.834. Следовательно, если радиус круга выбрать
равным 2.9, то кривая Найквиста будет лежать внутри круга D(—1/4.4,1/1.4) и,
следовательно, рассматриваемая система будет абсолютно устойчивой для всех
нелинейностей из сектора [-0.227,0.714]. Сравнение этого сектора с предыду
щим (см. рисунок 7.6) показывает, что, ослабив требования на нижнюю границу
сектора, мы получаем значительный выигрыш в отношении верхней границы
этого сектора. Действительно, в этом случае мы получаем большую свободу при
оптимизации выбора места расположения центра круга. Однако в данном при
мере преследовалась другая цель. Здесь мы хотели показать, что графическое
представление, используемое в круговом критерии, дает исследователю более
ясное понимание сути исследуемой задачи, нежели оценки норм, полученные
в примере 7.1. Более того, графическое представление позволило получить ме
нее консервативные оценки на границы сектора нелинейностей.
Другим вариантом использования кругового критерия является выбор вели
чины а, равной нулю, и применение второго случая из теоремы 7.2. Кривая Най
квиста лежит справа от вертикальной прямой Re[s] = —0.857. Следовательно, мы
можем заключить, что система является абсолютно устойчивой для всех нелиней
ностей в секторе [0,1.166]. Этот сектор изображен на рисунке 7.6 вместе с двумя
другими секторами, полученными выше. Этот сектор позволяет получить наи
лучшую оценку величины β, которая достигается, если на класс нелинейностей
.
•''''" 1
>с
^
ImG
Л)
-
4
/
У
ReG
7.1. АБСОЛЮТНАЯ устойчивость
289
1
0.5
0
-0 .5
-1
А
-
"
(-0.25,0.25)
-.-.
[-0 .227,0.714]
2
1
0
-1
-2
А
^-"
(-0 .25,0.25)
-. - . [0,1.166]
-0.5
1
-0.5
0.5
0
0.5
Рис. 7.6. Секторы в примере 7.2
наложить дополнительное требование — принадлежность к первому и третьему
квадрантам. Для того чтобы показать, насколько может быть удобен круговой
критерий при анализе приложений, исследуем вопрос устойчивости изображен
ной на рисунке 7.7 системы, в состав которой входят ограничитель или нелиней
ность насыщения (типичная нелинейность в системах с обратной связью, обу
словленная наличием ограничений на физические переменные). Нелинейность
+
о-
G(s) (s+l)(s/2«f-l)(*/3+l)
Ф(У)А
Рис. 7.7. Взаимосвязанная система с нелинейностью насыщения
насыщения принадлежит сектору [0,1]. Поэтому она принадлежит также сектору
[0,1.166], но не принадлежит секторам (-0.25,0.25) или [-0.227,0.714]. Таким
образом, используя утверждение кругового критерия для второго случая, можно
заключить, что система с обратной связью, изображенная на рисунке 7.7, имеет
глобально асимптотически устойчивую точку равновесия в начале координат. Δ
Пример 7.3. Пусть
G(s) =
(β_1)(1β + 1)(Ιβ + 1)
Эта передаточная функция не является гурвицевой, т. к. она имеет полюсы в от
крытой правой полуплоскости. Поэтому мы должны ограничиться рассмотрени
ем ситуации, когда а положительна, и применить круговой критерий для перво
го случая. Кривая Найквиста для G{ju) показана на рисунке 7.8. Из кругового
290
ГЛАВА 7
0.4
0.2
0
-0.2
-0.4
-4
-2
О
Рис. 7.8. Кривая Найквиста в примере 7.3
критерия известно, что кривая Найквиста должна обойти против часовой стрел
ки круг D(a, β) один раз. Анализ кривой Найквиста показывает, что круг может
быть обойден кривой Найквиста, только если он полностью содержится в одной
из долей кривой Найквиста в левой полуплоскости. Круг в правой доле обходит
ся по часовой стрелке один раз и, следовательно, он не удовлетворяет круговому
критерию. Круг в левой доле обходится против часовой стрелки один раз. Таким
образом, нам необходимо выбрать а и β так, чтобы круг D(a,P) располагался
в левой доле. Расположим центр круга в точке — 3.2 +j'O, приблизительно посре
дине между двумя концами доли на вещественной оси. Минимальное расстояние
от этой точки до кривой Найквиста равно 0.1688. Следовательно, выбрав радиус
круга равным 0.168, мы обеспечим абсолютную устойчивость системы для всех
нелинейностей в секторе [0.2969,0.3298].
Δ
В примерах 7.1-7.3 рассматривались случаи, когда секторное условие вы
полнено глобально. В следующем примере секторное условие справедливо лишь
на конечном интервале.
Пример 7.4. Рассмотрим соединение систем с обратной связью, изоб
раженное на рисунке 7.1, с линейной системой, представленной передаточной
функцией
и нелинейным элементом φ (у) = sat (у). Нелинейность глобально принадлежит
сектору [0,1]. Однако поскольку G(s) не является гурвицевой, мы должны вос
пользоваться первым условием кругового критерия, согласно которому секторное
условие должно выполняться с положительной а. Таким образом, мы не мо
жем установить абсолютную устойчивость системы с использованием кругового
критерия
9
.
Самое большое, на что мы можем рассчитывать, — это установить
абсолютную устойчивость системы в конечной области. Из рисунка 7.9 видно,
9
В действительности начало координат не является глобально асимптотически устойчивым,
поскольку система имеет три точки равновесия.
~Г\/^\
ly\j
ImG
ReG
7.1 . АБСОЛЮТНАЯ УСТОЙЧИВОСТЬ
291
что на интервале [—α, α] нелинейность φ принадлежит сектору [α, β] са = 1/а
и β = 1. Поскольку G(s) имеет полюс с положительной вещественной частью,
кривая Найквиста для G(ju)9 показанная на рисунке 7.10, должна обойти круг
D(a, 1) один раз против часовой стрелки. Аналитически можно показать, что
условие (7.10) выполняется при а > 0.5359. Таким образом, при а = 0.55
секторное условие выполняется на интервале [—1.818,1.818] и круг Z)(0.55,1)
обходится кривой Найквиста один раз против часовой стрелки. Используя пер
вое условие кругового критерия, мы можем заключить, что система абсолютно
устойчива в конечной области. Для оценки области притяжения может быть ис
пользована квадратичная функция Ляпунова V(x) = x
T
Px. Рассмотрим модель
состояния
XI=Х2,
%2=Х\+U,
у=2xi +я2,
и=
-ф(у).
Рис. 7.9. Сектор в примере 7.4
1
0.5
-0.5
ImG
ReG
-2
- 1.5
-1
-0.5 0
Рис. 7.10. Кривая Найквиста в примере 7.4
Преобразование контура, изображенное на рисунке 7.3, определяется равенства
ми
и= —осу+и= —0.55t/+й,
у=(β—а)у+й=0.45?/+ и.
292
ГЛАВА 7
Тогда преобразованная линейная система принимает следующий вид:
х—Ах+Вй: у=Сх+Du,
где
А=
О
1
-0.1
-0.55
В=
С=[0.90.45] и D=1.
Матрица Ρ представляет собой решение уравнений (7.6)-(7.8). Легко прове-
ε=0.02, Ρ =
рить,
10
что
0.4946 0.4834
0.4834 1.0774
L=[0.2946 -0.4436] и W =л/2
удовлетворяют (7.6)-(7.8). Тогда V(x) = х
т
Рх — функция Ляпунова для рас
сматриваемой системы. Оценка области притяжения имеет вид
Пс= {х£Я2|У(ж)<с},
где с ^ miii{|y|=L818} V(x) = 0.3445 выбрана таким образом, чтобы область
Ω0 содержалась в множестве {|у| < 1.818}. При с = 0.34 получаем область
притяжения, изображенную на рисунке 7.11.
Δ
1
0.5
0
-0.5
-1
\
-х^
^
у=-1Я18 \ч
VI
-
1
^
\у=1.818
У(ж)=0.34
У\
,
,
-
X,
-1.5
-1
-0.5
0
0.5
1
Рис. 7.11. Область притяжения в примере 7.4
1.5
7.1.2. Критерий Попова
Рассмотрим специальный случай системы (7.1)—(7.3):
х=Ах+Ви,
у= Сх,
Щ= ~Фг(Уг),1<i^Р,
(7.13)
(7.14)
(7.15)
10
Константа ε выбирается так, чтобы G(s — ε/2) была положительно вещественной и [(ε/2)/ +
+ А] гурвицевой, где G(s) = С (si — А)~
г
В + D. Тогда Ρ вычисляется как решение уравнения
Риккати (см упражнение 6.8).
7.1 . АБСОЛЮТНАЯ УСТОЙЧИВОСТЬ
293
гдех GRn
,
и,у еД
р
, (А,В) — управляемая пара, (А,С) — наблюдаемая пара
ифг : R-+ R — локально липшицевая безынерционная нелинейность, принадле
жащая сектору [0, кг]. В этом случае передаточная функция G(s) = C(sI—A)~
l
B
является строго собственной и φ зависит от времени и разделена относитель
но выходов, т.е. фг(у) = Фг{Уг)- Поскольку D = 0, система с обратной связью
имеет корректно определенную модель состояния. Следующая теорема известна
как многомерный критерий Попова. Она может быть доказана с использовани
ем функции Ляпунова-Лурье V = (1/2)х
т
Рх + ^7г JQ* φ%{ο-)ασ, выбор которой
мотивирован применением преобразования контура, приводящим систему (7.13)-
(7.15) к системе с обратной связью, состоящей из двух пассивных динамических
систем.
Теорема 7.3. Система (7.13)-(7.15) абсолютно устойчива, если для l^i^p
выполнено фг Ε [О,Л;*], 0 < кг ^ оо и существуют константы 7г ^ 0> такие
что (1 + А/с7г) 7^ 0 для каждого собственного значения λ& матрицы А, матрица
Μ -\ - (I+ sT)G(s) строго положительно вещественная, где Г = diag(7i, · · · , 7р)
и Μ = diag(l/fci, · · · , l/kp). Если секторное условие фг Ε [0, кг] выполнено лишь
на множестве Υ С RP, вышеприведенные условия обеспечивают абсолютную
устойчивость системы в конечной области.
ДОКАЗАТЕЛЬСТВО. Преобразование контура, изображенное на рисунке 7.12,
приводит к системе с обратной связью ffi и Яг, где Н\ — линейная система,
г
~
,
i
G(s)
Ψ(·)
+^|
J•
J
1
'
'
1
G(a) [•
</>(·) Ι"
L_
ΓΜ
No
(/+5Γ)
(/ + 6Τ)-
1
ΗΜ
"•
bf
Vе
1
!я,
\+
J
.
η+
·
+9I
ft
'
_,
Рис. 7.12. Преобразование контура
передаточная функция которой имеет вид
Μ+(I+sT)G(s) =M+(I+sT)C(sI -А)'
1
В=
=M+C{sl-A)~
X
B+TCs{sI -А)'
1
В=
=M+C(sl-А)-
1
В+TC(sI -A +A){sl -А)'
1
В=
= M+(C+TCA){sI -А)'
1
В+TCB.
Таким образом, Μ + (I + sT)G(s) может быть реализована моделью состояния
{A,B,C,V},
гдеА =А,В
= В,С =С+ТСАиV=Μ+TCB.Пусть\к
-
294
ГЛАВА 7
собственное значение матрицы Anvk — соответствующий собственный вектор.
Тогда
(С + TCA)vk = (С + TCXk)vk = (J + XkT)Cvk.
Из условия (1 + Ад/уг) Φ 0 следует, что пара (Л, С) наблюдаема и, следовательно,
реализация {А,В,С,Т>} является минимальной. Если Μ + (/ + sr)G(s) строго
положительно вещественна, мы можем применить лемму Калмана-Якубовича-
Попова и заключить, что существуют матрицы Ρ — Р
т
>О,LиW,атакже
положительная константа ε, удовлетворяющие
ΡЛ+А
Т
Р=-L
T
L-εΡ,
(7.16)
РВ={С+TCAf -L
T
W,
(7.17)
WTW =2M+ГСР+Р
Т
СТГ,
(7.18)
иV=(1/2)х
т
Рх — функция запаса для Н\. С другой стороны, можно показать
(см. упражнение 6.2), что #2 пассивна с функцией запаса Х^=17г JQ1 Ψ^^ασ.
Таким образом, функция запаса для преобразованной системы с обратной связью,
изображенной на рисунке 7.12, имеет вид
Р
ГУг
V=\х
т
Рх +V7г/ ^(σ)Ατ.
Используем У в качестве функции Ляпунова для исходной системы (7.13)—(7.15).
Тогда производная V определяется равенством
V=\х
т
Рх +\х
т
Рх +Ф
т
(у)Ту =
=\х
т
{РА +Л
т
Р)х+х
т
РВи + г/>
Т
(у)ГС(Ах + Ви).
Используя (7.16) и (7.17), получаем
V=-\x
T
LTLx
-
\ех
т
Рх +х
т
{Ст
+А
Т
СТТ -L
T
W)u +
+^
Т
(2/)ГСАх + ф
т
(у)ТСВи.
Подставляя и = —ψ(у) и используя (7.18), получаем равенство
V=-\ех
т
Рх -\{Lx+Wu)
T
(Lx + Wu) - ф{у)т[у - Мф{у)} ^
^
-\ех
т
Рх,
которое показывает, что начало координат глобально асимптотически устойчиво.
Если ψ удовлетворяет секторному условию лишь для у е Υ, выполненный ана
лиз справедлив в некоторой окрестности начала координат, т. е. начало координат
асимптотически устойчиво.
Π
7.1. АБСОЛЮТНАЯ устойчивость
295
Для того чтобы Μ + (I + sT)G(s) была строго положительно веществен
ной, необходимо чтобы G(s) была гурвицевой. Так же как и в случае кругового
критерия, это ограничение на G(s) может быть снято с использованием преоб
разования контура, обеспечивающим замену G(s) на G(s)[I 4- KiG(s)]~
1
.
Мы
не будем приводить здесь применение этой идеи, но проиллюстрируем ее на
примере. В скалярном случае ρ = 1 мы можем проверить графически то, что
Z(s) = (l/k) -f (1 + sj)G(s) является строго положительно вещественной. Из
леммы 6.1 следует, что Z(s) является строго положительно вещественной, если
G(s) гурвицева и
\ + Re[G(jcj)} - -yulm[G{jcj)} > 0, \/ω (Ξ [-οο, οο],
(7.19)
гь
где G(ju) = Re[G(ju)] + jlm[G(juj)]. Условие (7.19) выполнено, если график
зависимости между Re[G(ju>)] и ulm[G(juj)] с ω в качестве параметра лежит
справа от прямой, проходящей через точку —(1/к) + J0 и имеющей тангенс угла
наклона 1/7. (См. рисунок 7.13.) Эта кривая известна как кривая Попова, ко-
Угловой
коэффициент =1/7
-1/к
u)lm[G(jujj\
Рис. 7.13. Кривая Попова
торая отличается от кривой Найквиста, поскольку последняя представляет собой
зависимость между Re[G(ju)] и Jm[G(ju)]. Если условие (7.19) выполнено лишь
для ω £ (—οο, οο) и левая часть предыдущего неравенства стремится к нулю при
ω —> οο, то необходимо аналитически проверить выполнение неравенства
lim ω
4
ω—>οο
U+ Re[G(ju)} - 7ωΙΙη[σθω)]| > 0.
Этому случаю соответствует ситуация, когда к = оо и G(s) имеет относительную
степень, равную двум.
При 7 = 0 условие (7.19) сводится к круговому критерию Re[G(jou)] >
-1/к, т.е. для системы (7.13)—(7.15) условия критерия Попова являются более
слабыми по сравнению с условиями кругового критерия. Другими словами, при
7 > 0 свойство абсолютной устойчивости может быть установлено при менее
жестких условиях.
296
ГЛАВА 7
Пример 7.5. Рассмотрим систему второго порядка
±1=Ж2,
Эта система принимает форму (7.13)—(7.15), если положить φ = h, но при этом
матрица А не является гурвицевой. Прибавив и вычтя из правой части второго
равенства член ау, где а > О, и определив нелинейность равенством ^(у) =
= h(y) — ay, мы можем привести систему к виду (7.13)-(7Л5), где
О
-а
В=
иС=[10].
Предположим, что ft принадлежит сектору [α, β], где β > а. Тогда ^ принадле
жит сектору [0, к], где к = β — а. Условие (7.19) принимает вид
1+«
ω2
+ηω
2
к (α-ω
2
)2
+
> О, Vo; G [—00,00].
Это неравенство справедливо при всех конечных положительных значениях α
и fc, если 7 > 1. Более того, предыдущее неравенство выполнено при к — оо для
всех о; G (—оо, оо) и
ω2(α-ω
2
+ηω
2
)
lim
"Г
2ч2 2 =7-1>0.
ω^°° (α - α;2)
2
+ωΖ
Таким образом, система является абсолютно устойчивой при всех нелинейно-
стях h из сектора [а, оо], где а может быть выбрана произвольно малой. На
рисунке 7.14 показана кривая Попова для G(ju) при а = 1. Кривая изображена
только для ω ^ 0, поскольку Re[G(ju;)] и cjIm[G(ja;)] являются четными функ
циями от ω. Кривая Попова расположена справа и асимптотически стремится
к прямой, проходящей через начало координат и имеющей угловой коэффици
ент, равный единице. Поэтому она лежит правее любой другой прямой, имею
щей угловой коэффициент меньше единицы и пересекающей вещественную ось
в начале координат; при этом она асимптотически стремится к этой прямой при
ω —> оо. Для того чтобы убедиться в целесообразности выбора положительной η,
положим 7 = 0и применим круговой критерий. Из второго пункта теоремы 7.2
следует, что система является абсолютно устойчивой, если кривая Найквиста для
G(jui) лежит справа от вертикальной прямой Re[s] = —\/к. Поскольку кривая
Найквиста частично расположена в левой полуплоскости, величина к не может
быть произвольно большой. Максимальное допустимое значение к может быть
вычислено аналитически из условия
Uа—ω"
к
{μ-ω
2
)2
+ω*
> 0, VCJ G [-00,00],
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
297
0.2
0
-0.2
-0.4
-0.6
-0.8
-1
-0.5
0
0.5
1
Рис. 7.14. Кривая Попова в примере 7.5
из которого следует, что к < 1 + 2д/а. Таким образом, используя круговой крите
рий, мы можем заключить лишь то, что система является абсолютно устойчивой
длявсехнелинейностейhизсектора[а,1+α+2у^ —ε],гдеа>0иε>0
могут быть произвольно малыми.
Δ
7.2. Метод описывающей функции
Рассмотрим нелинейную систему с одним входом и одним выходом, пред
ставленную в виде соединения систем с обратной связью, изображенного на
рисунке 7.1, где G(s) — строго собственная рациональная передаточная функ
ция и φ — зависящая от времени нелинейность без памяти. Предположим, что
внешнее входное воздействие отсутствует (г = 0), и рассмотрим вопрос о су
ществовании в системе периодических решений. Периодическое решение удо
влетворяет равенству y(t + 2π/ω) = y(t) для всех £, где ω — частота колебаний.
Мы будем использовать общий метод поиска периодических решений, известный
как метод гармонического баланса. Идея этого метода заключается в том, чтобы
представить периодическое решение в виде ряда Фурье и определить частоту ω
и коэффициенты Фурье с учетом того, что это решение должно удовлетворять
уравнению системы. Предположим, что y(t) — периодическая функция, равен
ство
оо
y(t) = ^Г ak exp(jkut)
k=—oo
представляет собой ее разложение Фурье, где а^ — комплексные коэффициен
ты,
11
ak—a-k
и
3 = V~Т. Поскольку ψ(-)
—
зависящая от времени нелиней
ность, ij)(y{t)) также является периодической функцией с той же частотой ω и она
может быть представлена в следующей форме:
оо
k=—oo
п
Надчеркивание над комплексной величиной обозначает ее комплексное сопряжение.
ωIm G
/I
/УГЛОВОЙ
/ коэф-
/
фициент =1
ReGJ
298
ГЛАВА 7
где каждый комплексный коэффициент ск представляет собой функцию от
всех а*. Для того чтобы функция y(t) являлась решением системы с обратной
связью, необходимо, чтобы она удовлетворяла дифференциальному уравнению
d(p)y(t) +
n(pW(y(t))=0,
где ρ — дифференциальный оператор р(-) = d(-)/dt и n(s) и d(s) — полиномы,
являющиеся соответственно числителем и знаменателем G(s). Поскольку
pexp(jkcut) = —ex$>(jkuji) = jkuexp(jkujt),
имеем
сю
со
d(p) Υ] ак exp(jkut) = V^ d(jku)ak exp(j/cc<;£)
k=—oo
k=—oo
И
oo
oo
n(p) ^2 ckexp(jkut) = ^2
n{jku)ckexp{jkut).
k——oo
k=—oo
Подставляя эти выражения в дифференциальное уравнение, получаем
оо
У^ [d(jkcj)ak + n(jku)ck] exp(jfajt) = 0.
к=—oo
С учетом того что функции expQfca;^) ортогональны при различных значениях /с,
можно утверждать, что коэффициенты Фурье должны удовлетворять равенствам
G(jku>)ck + ак = 0
(7.20)
для всех целых чисел к. Поскольку G(jk(j) = G(—jku>),ak = й-к и ск = с_&,
достаточно рассмотреть (7.20) при к ^ 0. Уравнение (7.20) является бесконеч
номерным уравнением, найти решение которого вряд ли возможно. Поэтому
необходимо найти его конечномерную аппроксимацию. Поскольку передаточная
функция G(s) является строго собственной, т. е. G(JLU) —> 0 при ω —> оо, разумно
предположить, что существует целое число q > 0, такое что при всех к > q и до
статочно малых \G(jku)\ можно заменить G(jku) (и, следовательно, ак) на 0.
Эта аппроксимация позволяет свести (7.20) к конечномерной задаче
G(jku)ck + ак = 0, к = 0,1,2,..., q,
(7.21)
где «крышки» над коэффициентами Фурье поставлены для того, чтобы подчерк
нуть, что решение уравнения (7.21) является лишь аппроксимацией решения
уравнения (7.20). Сложность уравнения (7.21) возрастает с увеличением q, и при
больших q эта конечномерная задача может также оказаться достаточно сложной.
Простейший случай этой задачи возникает при q = l. Для ее решения, разумеет
ся, требуется, чтобы передаточная функция G(s) имела крутую характеристику
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
299
«фильтра нижних частот», что позволяет аппроксимировать G(jku) нулем при
всех к > 1. Однако даже если нам известна G(s), мы не можем быть уверены
в том, что эта аппроксимация является адекватной, поскольку мы не знаем ча
стоты колебаний ω. Тем не менее в классическом методе описывающей функции
используется эта аппроксимация и полагается а& = О при к > 1 для того, чтобы
свести задачу к решению двух уравнений
G(0)c0(a0,ai) + ao = 0,
(7.22)
G(j"cj)ci(ao,ai) + аг = 0.
(7.23)
Заметим, что (7.22) и (7.23) представляют собой систему из одного вещественно
го уравнения (7.22) и одного комплексного уравнения (7.23) относительно двух
вещественных неизвестных ω и ао и одной комплексной неизвестной а\. В ве
щественных величинах эта задача эквивалентна решению трех уравнений отно
сительно четырех переменных. Это обусловлено тем, что для автономной систе
мы начало отсчета времени может быть выбрано произвольно, и, следователь
но, если (ao,ai) удовлетворяет уравнению, то для произвольной вещественной
θ пара (cLQ,aie?
e
) представляет собой другое решение. Для того чтобы учесть
эту «неединственность», выберем в качестве первой гармоники y(t) функцию
a smut, a ^ 0. Тем самым мы выбираем начало отсчета времени так, чтобы
фаза первой гармоники была равна нулю. Используя
asinut = ^[expQcjt) — ехр(—jut)] => а\ = ^г,
перепишем (7.22) и (7.23) в следующем виде:
σ(0)£ο(αο,^)+αο = 0,
(7.24)
G(ja;)c1(a0,^+^ = 0.
(7.25)
Поскольку левая часть (7.24) не зависит от ω, это уравнение может быть разре
шено относительно ао и полученное решение будет функцией от а. Заметим, что
если ф(-) является нечетной функцией, т. е.
Ф(-у) = -Ф(у),
то ао = со = 0 — решение (7.24), поскольку
/»2π/ω
/
^(ao + as
JO
со=w~\
Ψ(ο>ο + asmut)dt.
Для простоты изложения ограничимся рассмотрением случая, когда нелинейно
сти представлены нечетными функциями, и положим ао = со = 0. Тогда уравне
ние (7.25) может быть переписано в следующей форме:
G(ja,)£1(o,^+± = 0.
(7.26)
300
ГЛАВА 7
Коэффициент ci(0, a/2j) представляет собой комплексный коэффициент Фурье
при первой гармонике на выходе нелинейности, если на вход этой нелинейно
сти подается синусоидальный сигнал a smut. Этот коэффициент определяется
равенством
/·2π/ω
ρΖπ/ω
ci(0,a/2j) = ·£- Ι
φ(α sin ut)exp(— jut)dt =
^
πJo
/>2π/ω
=—
/
[φ(asin ut) cos ut — jtp(a sin ut) sinut]dt.
^
πJo
Первый член подынтегрального выражения является нечетной функцией, а вто
рой — четной. Поэтому интеграл от первого члена по полному периоду равен
нулю и, следовательно, предыдущее выражение упрощается:
и
Γ/ω
ci(0, a/2j) — —j— / ip(asinujt) smut dt.
Jo
Определим функцию Φ (α) равенством
φ(α) =
Cl(0?
^
/2j) - §£ Г " <4>{asmut)smutdt.
(7.27)
a
/2j
Jo
Тогда (7.26) может быть переписано в виде
[G(ju)V(a) + 1]о = 0.
(7.28)
Поскольку нас не интересует решение при а = 0, мы можем ограничиться на
хождением всех решений уравнения
G(ju)V(a) + 1-0.
(7.29)
Уравнение (7.29) известно как уравнение гармонического баланса первого
порядка или просто уравнение гармонического баланса. Функция Φ (α), опреде
ляемая равенством (7.27), называется описывающей функцией нелинейности ψ.
Она может быть найдена путем подачи синусоидального сигнала a sin ut на вход
нелинейности и вычислением отношения коэффициента Фурье первой гармони
ки на выходе нелинейности и коэффициента а. Эта функция может рассматри
ваться как «эквивалентный коэффициент усиления» линейного, не зависящего от
времени элемента, реакцией которого на вход a smut является Φ (a) a sin ut. Эта
концепция эквивалентного коэффициента усиления, иногда называемая эквива
лентной линеаризацией, может быть использована и при анализе систем с зави
сящими от времени нелинейностями более общего вида или с нелинейностями
с памятью, например нелинейностями гистерезисного типа или нелинейностями
с люфтом
12
.
В этих ситуациях описывающая функция может быть комплексной
,2
См. работы [18] и [85]. Прим. ред. перев. —
Метод гармонического баланса для исследова
ния колебаний в нелинейных системах был предложен для частного случая систем 2-го порядка
в 1920-е гг. Б. Ван дер Полем и получил далеко идущие обобщения в работах Η. Μ. Крылова
и Н. Н. Боголюбова [Д18]. В теорию управления был введен Л. С. Гольдфарбом [Д24] в 1940-е гг.
Подробнее о методе и о его дальнейшем развитии см. учебники [Д13, Д54, Д58].
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
301
и зависеть от α и о;. Далее мы будем рассматривать лишь описывающие функции
для нечетных, не зависящих от времени нелинейностей без памяти, для которых
функция Φ (α) является вещественной, зависит только от α и задается выражени
ем вида
ф(а) = JL / ^(asin0)sin0d0,
(7.30)
./о
которое может быть получено из (7.27) путем замены переменной интегрирова
нияtнаθ= ut.
Сущность метода описывающей функции (describing function method) заклю
чается в следующих импликациях. Если (7.29) имеет решение (α81ω8), то «воз
можно» существует периодическое решение системы с частотой и амплитудой
(на входе нелинейности) близкими к ω8 и as. Обратно, если (7.29) не имеет ре
шений, то система «возможно» не имеет периодического решения. Для того что
бы заменить слово «возможно» на слово «определенно», а также для того, чтобы
прояснить смысл выражения «близко к ω3 и as» в случае существования перио
дического решения, необходимо выполнить дополнительный анализ. Этот анализ
будет представлен в конце этого параграфа. Здесь мы сосредоточимся на зада
чах нахождения описывающей функции и решения уравнения гармонического
баланса (7.29). Следующие три примера иллюстрируют процедуру определения
описывающей функции для нечетных нелинейностей.
Пример 7.6. Рассмотрим реле φ (у) = sign(y). Описывающая функция
определяется равенством
Ф(а)=^
/ ф{а8шв)зшв(Ю = ^
/зтвав=±.
Jo
Jo
Δ
Пример 7.7. Рассмотрим кусочно-линейную функцию, график которой
изображен на рисунке 7.15. Если синусоидальный сигнал на входе этой нелиней
ности имеет амплитуду α ^ <5, нелинейность действует как линейный усилитель
и на ее выходе появится синусоидальный сигнал с амплитудой s\a. Следователь
но, описывающая функция будет иметь вид Φ (α) — si, т. е. эта функция не будет
зависеть от а. При а > δ мы можем разделить интеграл (7.30) на части, каждая
из которых соответствует очередному линейному сегменту ψ(-). Далее, с учетом
нечетности сигнала на выходе можно упростить процедуры интегрирования:
ψ(α) = JL / ^(asin0)sin0d<9 = ^- [
^(asin0)sin0d<9 =
JO
JO
β
4
Г/2
asi sin2θαθ+ψ^ / [Ss\+ s2(a sinθ-δ)]sinθαθ =
"Ι
302
ГЛАВА 7
УК =%
УК =%
к ψ(a sin#)
Угловой коэффициент - УК
Рис. 7.15. Кусочно-линейная функция
+ ^(f-lsm»-/3+isin2/?| =
«HZ*
(β+'-„.!)+*,
гдеβ=sin
:
(^) · Таким образом,
ад
2(ei - β2)
*>"ii ) + Ii/i- Ι
+ 52.
График полученной описывающей функции показан на рисунке 7.16. Выбирая
значения 5 и угловые коэффициенты si и 52, можно получить описывающие
функции для нелинейностей различного типа. Например, нелинейность насыще
ния является частным случаем кусочно-линейной функции на рисунке 7.15 при
5 = 1, s\ = 1 и 52 = 0. Ее описывающая функция определяется равенством
•
(в)
"
г [-»-&+iiA^
если 0^а^1,
если α>1.
Пример 7.8. Рассмотрим нечетную нелинейность, удовлетворяющую сек
торному условию
осу
2
^уф(у)<Ру
2
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
303
Ща)[
Ща)\
s1>s2
Рис. 7.16. Описывающая функция для кусочно-линейной функции, изображенной на ри
сунке 7.15
для всех у е R. Описывающая функция Φ (α) удовлетворяет оценке снизу
ψ(α) = JL [ ^(аsin(9)sin<9d<9^ψ [ sin
2
0d<9=a
Jo
Jo
и оценке сверху
φ (α) = А Гф(азтв)8твав
^ Щ-Г ш?9М =β.
Jo
Jo
Поэтому
а^ Φ (а) </?, Va^O.
Δ
Поскольку описывающая функция Φ (α) является вещественной, выраже
ние (7.29) может быть переписано в следующем виде:
{Re[G(ju)} + jIm[G(j")]}*(a) + 1 = 0.
Это уравнение эквивалентно двум вещественным уравнениям
l + *(a)Re[G(ju;)] = 0,
Im[G(j")] = 0.
(7.31)
(7.32)
Поскольку (7.32) не зависит от а, мы можем решить это уравнение относитель
но ω, определив возможные частоты колебания. После этого для каждого такого
решения ω мы можем решить (7.31) относительно а. Заметим, что возможные
частоты колебания определяются исключительно передаточной функцией G(s);
эти частоты не зависят от нелинейности ψ(-). Нелинейность определяет соответ
ствующее значение а — возможную амплитуду колебания. Эта процедура может
быть выполнена аналитически для передаточных функций, полиномы которых
имеют малый порядок. Следующие примеры иллюстрируют этот подход.
Пример 7.9. Пусть
G(s)
в(я+ !)(« +2)'
304
ГЛАВА 7
Рассмотрим две нелинейности: реле и нелинейность насыщения. Нетрудно пред
ставить G(ju) в следующем виде:
-3ω-^2-ω
2
)
Уравнение (7.32) принимает следующую форму:
(2-й;2)
9ω3
+ω(2-ω
2
)2
=0
и имеет один положительный корень ω = у/2. Заметим, что для каждого положи
тельного корня (7.32) существует отрицательный корень, равный по абсолютной
величине. Мы будем рассматривать только положительный корень. Заметим так
же, что корень ω = 0 не рассматривается, поскольку ему не соответствует нетри
виальное периодическое решение. Вычисляя Re[G(ju;)] при ω = \/2 и подставляя
полученный результат в (7.31), получаем Φ (α) = 6. Вся эта информация была по
лучена без конкретизации имеющейся в системе нелинейности ψ(-). Рассмотрим
теперь случай, когда нелинейность представлена в виде реле. В примере 7.6 бы
ло показано, что Φ (α) = 4/πα. Поэтому уравнение Φ (α) = 6 имеет единственное
решение а = 2/3π. Мы можем сказать, что нелинейная система с передаточной
функцией G(s) и нелинейностью типа реле будет «возможно» иметь периодиче
ское решение с частотой, близкой к у/2 и амплитудой (на входе нелинейности),
близкой к 2/3π. Рассмотрим теперь случай нелинейности с насыщением. В при
мере 7.7 было показано, что Ф(а) < 1 для всех а. Поэтому Φ (а) = б не имеет
решений и, следовательно, мы можем ожидать, что в нелинейной системе с пере
даточной функцией G(s) и нелинейностью насыщения незатухающие колебания
будут отсутствовать.
Δ
Пример 7.10. Пусть
ад=
s
2
+0.8s+8'
Рассмотрим две нелинейности: «насыщение» (saturation) и «зона нечувстви
тельности» (dead-zone). Последняя является частным случаем кусочно-линейной
функции из примера 7.7 с s\ = 0, $2 = 0.5, и δ = 1. Функцию G(ju) можно
представить в следующем виде:
(.
-p.8u;
2
-ju;(8-uj
2
)
[JU)
0.64α;2
+ (8-ω
2
)2
'
Уравнение (7.32) имеет единственный положительный корень ω = 2>/2. Вычис
ляя Re[G(ju>)} при ω = 2\/2 и подставляя полученное значение в (7.31), полу
чаем Φ (α) = 0.8. Для случая нелинейности насыщения описывающая функция
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
305
приведена в примере 7.7 и уравнение Ф(а) = 0.8 имеет единственное решение
а = 1.455. Поэтому мы можем ожидать, что нелинейная система с передаточной
функцией G(s) и нелинейностью насыщения будет иметь периодическое реше
ние с частотой, близкой к 2>/2 и амплитудой (на входе нелинейности), близкой
к 1.455. При нелинейности типа «зона нечувствительности» описывающая функ
ция Ф(а) меньше 0.8 для всех а. Таким образом, Ф(о) = 0.8 не имеет реше
ний и мы можем ожидать, что в нелинейной системе с передаточной функцией
G(s) и нелинейностью типа «зона нечувствительности» незатухающие колеба
ния будут отсутствовать. В этом примере мы докажем отсутствие незатухающих
колебаний тем, что система является абсолютно устойчивой для класса нели-
нейностей из сектора, включающего рассматриваемую нелинейность типа «зона
нечувствительности». Легко показать, что
Re[G(ju)\ > -1.25, Vu; £ R.
Поэтому с использованием кругового критерия (теорема 7.2) можно показать,
что система абсолютно устойчива для нелинейностей из сектора [0,/?], β < 0.8.
Рассматриваемая в этом примере нелинейность типа «зона нечувствительности»
принадлежит этому сектору. Следовательно, начало координат пространства со
стояния является глобально асимптотически устойчивым, и система не может
иметь незатухающих колебаний.
Δ
Пример 7.11. Рассмотрим уравнение Релея (Raleigh)
z+2=£(i-|i
3
),
где ε — положительная константа. Для исследования вопроса о существовании
у этого уравнения периодических решений мы представим его в виде системы
с обратной связью, изображенной на рисунке 7.1. Пусть и — — £
3
/3, тогда урав
нение системы можно переписать в следующей форме:
z—ez+z=ей,
Первое уравнение представляет собой линейную систему. Выбрав у = z в каче
стве ее выхода, получаем передаточную функцию
G(s) =
es
.2
-S5+1
Второе уравнение определяет нелинейность ψ (у) = y
s
/S. Эти два уравнения
в совокупности представляют собой систему с обратной связью, изображенную
на рисунке 7.1. Описывающая функция для φ (у) = г/
3
/3 определяется равен
ством
φ(а)=^
J (asin0)3
sin<9d<9= |a
2
.
3πα
306
ГЛАВА 7
Функция G(JUJ) может быть записана в виде
jeu[(l - ω
2
)+jeu]
G{ju>)
(\-ω
2
Υ+ε
2
ω-
Уравнение lm[G(ju))] = 0 приводит к ω(1— ω
2
) = 0, и, следовательно, существует
единственное положительное решение ω = 1. Тогда
1 + Φ (α) Re[G(j)} =0=>a = 2.
Поэтому мы можем ожидать, что уравнение Релея имеет периодическое решение
с частотой около 1 рад/с и амплитудой колебания величины z около 2.
Δ
Если передаточная функция имеет высокий порядок, нахождение решения
уравнения гармонического баланса (7.29) может оказаться непростой задачей. Ра
зумеется, всегда можно прибегнуть к использованию численных методов. Однако
мощь метода описывающей функции заключается не в возможности нахождения
решения уравнения (7.29) с использованием аналитических или численных мето
дов, а в том, что это решение может быть получено графически, что сделало этот
метод очень популярным. Равенство (7.29) может быть переписано в следующем
виде:
ад =-^
(7-33)
ИЛИ
Из равенства (7.33) видно, что мы можем решить (7.29), изобразив кривую Най-
квиста для G{jui) при ω > 0 и годограф —1/Ф(а) для а ^ 0. Точки пересе
чения этих линий и представляют собой решения уравнения (7.29). Поскольку
Ф(а) вещественна для нечетных нелинейностей, годограф —1/Ф(а) на комплекс
ной плоскости расположен на вещественной оси. Из равенства (7.34) видно, что
аналогичная процедура может быть выполнена в отношении «обратной» кривой
Найквиста для G(ju), т.е. годографа на комплексной плоскости 1/G(ju) при
различных ω, а также годографа — Φ (α). Кривые Найквиста играют важную роль
в классической теории управления, и описанное графическое представление ме
тода описывающей функции очень популярно среди инженеров, имеющих дело
с нелинейными элементами.
Пример 7.12. Рассмотрим передаточную функцию G(s) из примера 7.9.
Кривая Найквиста для G(ju>) изображена на рисунке 7.17. Эта кривая пересе
кает вещественную ось в точке (—1/6,0). При нечетных нелинейностях уравне
ние (7.29) имеет решение, если годограф —1/Ф(а) на вещественной оси содер
жит эту точку пересечения.
Δ
Обратимся к вопросу обоснования метода описывающей функции. Явля
ясь приближенным методом решения бесконечномерного уравнения (7.20), ме-
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
307
0.05
-0.05
-0.1
ImG
/
ReG
-0.2
-0.1
0
Рис. 7.17. Кривая Найквиста в примере 7.12
тод описывающей функции может быть обоснован оценками ошибки аппрокси
мации. Для простоты мы выполним этот анализ, если нелинейности характери
зуются следующими двумя особенностями
13
:
• Нечетная нелинейность, т.е. ψ (у) = — ^(-у), Vy φ 0.
• Скалярная нелинейность, удовлетворяющая неравенству
а(У2- у\) <Щу2) ~ФЫ)] ^/3(2/2- У\)
для всех вещественных чисел у\ и у2 > у\.
Нелинейность ф(-) с этими свойствами принадлежит сектору [а,/?]. Сле
довательно, с использованием результатов примера 7.8 можно утверждать, что
соответствующая описывающая функция удовлетворяет а ^ Φ (α) < β для всех
а ^ 0. Следует, однако, заметить, что ограничение на угол наклона не эквива
лентно секторному условию. Нелинейность может удовлетворять ограничению
на углы с указанными границами а и β и принадлежать сектору [α, β] с други
ми границами α и /?.
14
Подчеркнем, что при последующем анализе мы будем
использовать ограничения на угол наклона а и /?, но не границы сектора an β.
Пример 7.13. Рассмотрим кусочно-линейную нечетную нелинейность
(у
при0<у^2,
4-у при 2<у<3,
у-2 приу^3,
показанную на рисунке 7.18. Нелинейность удовлетворяет ограничению на угол
наклона
_j<ФШ~ФЫ)<х
^
2/2-2/1
^
13
Теория для нелинейностей более общего вида описана в работах [24], [129] и [189]. Прим. ред.
перев. — На русском языке имеется целый ряд результатов по обоснованию метода гармонического
баланса, см., например, [Д16, Д17].
14
Проверьте, что [α, β] С [α, β].
308
ГЛАВА 7
-5
0
5
Рис. 7.18. Нелинейность в примере 7.13
и секторному условию
1^</%)<л
3^У
^
1в
В последующем анализе следует положить а = — 1 и /? = 1.
Δ
Мы ограничимся рассмотрением вопроса о существовании полуволновых
симметричных периодических решений
15
, т.е. периодических решений, имею
щих только нечетные гармоники. Это ограничение представляется разумным,
поскольку мы рассматриваем нелинейности φ с нечетной симметрией. Коэффи
циенты Фурье нечетной гармоники периодического решения y(t) удовлетворя
ют (7.20) при к = 1,3,5,
Основная идея, лежащая в основе анализа ошиб
ки аппроксимации, заключается в разделении периодического решения y(t) на
первую гармонику y\{t) и более высокие гармоники yh(t). Выберем начальный
отсчет времени так, чтобы фаза первой гармоники была равно нулю, т. е. у\ (t) =
= a sin ut. Тогда
y(t) =
asmut-hyh(t).
С использованием этого представления можно получить коэффициенты Фурье
первой гармоники для y{t) nip(y(t)):
ai Α.
2j"
ρπ/ω
C\=ψ
$(a8mut +
yh(t))exp(-jut)dt.
Jo
Из (7.20) при к = 1 имеем
G(ju))c\ + а\ = 0.
Введя в рассмотрение функцию
Ф*(а,Ы
Jπα
ρπ/ω
У.'
V>(asintt;£ + yh(t)) exp(-jut) eft,
15
Это сделано лишь для простоты изложения. Общий случай рассмотрен в работе [128].
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
309
мы можем переписать уравнение в следующем виде:
1
G{ju>)
+ Ф*(а,уЛ) = 0.
Прибавив Ф(а) к обеим частям (7.35), можно переписать это уравнение:
1
G(j«>)
+9(a) =5Ф,
(7.35)
(7.36)
где
$Ф = Ф(а)-Ф*(а,уЛ).
При yh = 0 справедливо Ф*(а, 0) = Φ (а). Таким образом, 5Ф
сводится к уравнению гармонического баланса
1
G(ju>)
+Φ(α)-0.
0, и (7.36)
(7.37)
Уравнение гармонического баланса (7.37) представляет собой аппроксимацию
точного решения (7.36). Ошибка аппроксимации £Ф не может быть определе
на аналитически, но ее величину можно оценить. Нашей задачей является на
хождение верхней границы для £Ф. Определим с этой целью две функции ρ(ω)
и σ(ω). Изобразим на комплексной плоскости годограф (locus — геометрическое
место точек) 1/G(ju), а также (критический) круг, диаметром которого служит
интервал на вещественной оси [—β,—а]. Заметим, что геометрическое место
точек — Φ (α) расположено на вещественной оси внутри этой окружности, т.к.
а < Φ (α) < β. Рассмотрим ω> такие что точки 1/G, соответствующие ки> (к > 1
и нечетные), расположены вне критической окружности (см. рисунок 7.19). Рас
стояние от любой из этих точек до центра критической окружности равно
α+β
Определим
ρ(ω)
+
inf
fc>l, /снечетные
G(j'M
α+β
+ G(jkw)
(7.38)
Заметим, что мы определили ρ(ω) только для тех ω, при которых значения
l/G(,?'A:u>) расположены вне критической окружности для всех к = 3,5,..., т. е.
для ω, принадлежащих множеству
Ω = {ω |ρ(ω)> |(/?-α)}.
На каждом связном подмножестве Ω' множества Ω определим
2
σ(ω) =
β-α
РИ-
β-α
(7.39)
310
ГЛАВА 7
итическии круг
5ω.
Рис. 7.19. Нахождение ρ(α;)
В следующей лемме утверждается, что положительная величина σ(ω) представ
ляет собой ошибку £Ф.
Лемма 7.1. В условиях сделанных предположений
|2
ρ2π/ω
y2
h(t)dt <
2σ(α>)α
/?-α
, νωeΩ',
|i*| < σ(ω), Vu; € Ω7
.
(7.40)
(7.41)
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. 13.
Π
Доказательство леммы 7.1 основано на анализе уравнения у^ = Т(уь) для
yh(t). Показав, что Т() является сжимающим отображением, мы можем вычис
лить верхнюю границу (7.40), которая в свою очередь используется для вычис
ления оценки сверху члена ошибки (7.41). Ограничения на угол наклона для
нелинейности ψ используются при доказательстве того факта, что Т() является
сжимающим отображением. С использованием оценки (7.41) и неравенства (7.36)
можно показать, что необходимым условием существования полуволнового сим
метричного периодического решения с ω £ Ω' является выполнение неравенства
1
G{ju)
+ Ф(о) ^ σ(ω).
С геометрической точки зрения это неравенство означает, что точка — Φ (α) долж
на быть расположена в круге с центром в l/G(ju>) и радиусом σ(ω). Такой круг
для ошибки можно построить для каждого ω £ Ω' С Ω. Огибающая всех этих
кругов на связном множестве Ω' образует частотную полосу неопределенности.
Основанием для использования подмножества множества Ω является то, что при
приближении ω к границе Ω круги ошибки становятся произвольно большими
и перестают быть источником полезной информации. Подмножество Ω' должно
быть выбрано так, чтобы полоса частот была как можно более узкой. Если G(ju>)
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
311
обладает крутой характеристикой фильтрации нижних частот, полоса неопреде
ленности может быть достаточно узкой на Ω'. Заметим, что ρ(ω) является мерой
крутизны характеристики фильтра нижних частот для G(ju;); из (7.38) видно,
что чем меньше \G(jku))\, к > 1, тем больше ρ(ω). Из (7.39) видно, что при
больших ρ(ω) радиус круга ошибки σ(ω) становится малым.
Рассмотрим пересечение частотной полосы неопределенности с годографом
—Ф(а). Если полоса неопределенности не пересекается с —Ф(а), то, очевид
но, (7.36) не имеет решений при ω Ε Ω'. Если полоса полностью содержит го
дограф —Φ (α) (см. рисунок 7.20), то можно ожидать, что существует решение,
если при этом исключить некоторые вырожденные случаи. Мы можем найти гра-
Полоса — β
неопреде-
—'
ленности /'
Рис. 7.20. Полное пересечение
ницы ошибки при анализе указанных пересечений. Пусть а\ и а,2 — амплитуды,
соответствующие пересечениям границы частотной полосы неопределенности
с годографом — Φ (α), и ω\ и ω^ — частоты, соответствующие кругам ошибки,
касающимся годографа — Φ (α) с обеих его сторон и имеющим радиусы соответ
ственно σ(ω\) и σ(α>2)· Определим на плоскости (ω, α) прямоугольник Г:
Г={(ω,α)\ω\ <ω<Ш2,а\<а<аг}.
Этот прямоугольник содержит точку (ω5, as), в которой пересекаются годографы
1/G и — Ф, и эта точка является решением уравнения гармонического балан
са (7.37). Оказывается, что при выполнении некоторых условий регулярности
можно показать, что (7.36) имеет решение в замыкании Г. Этими условиями ре
гулярности являются следующие выражения:
А
da
Ща)
Ф0; £щвт
ф0.
Полное пересечение полосы неопределенности и годографа — Φ (α) может
быть точно определено, когда годограф 1/G(ju) пересекает годограф — Ф(а);
как было показано, конечное множество Г может быть определено так, что точка
(a;s,as) является единственной точкой пересечения в Г и выполнены условия
регулярности.
312
ГЛАВА 7
Наконец, заметим, что при высоких частотах, для которых всем гармоникам
(включая первую) соответствуют точки 1/G(ju)9 расположенные вне критиче
ского круга, нам не нужно находить полосу неопределенности. Поэтому опреде
лим множество
>
2 >/с= 1,3,5,... > ,
рассмотрим наименьшую частоту в Ω в качестве наибольшей частоты в Ω' и бу
дем уменьшать ω до тех пор, пока круги ошибок не станут слишком большими.
Следующая теорема представляет собой обоснование метода описывающей
функции и является основным результатом этого параграфа.
Теорема 7.4. Рассмотрим систему, изображенную на рисунке 7.1, и пред
положим, что нелинейность ψ(-) является скалярной нечетной, не зависящей от
времени функцией без памяти, удовлетворяющей ограничению на углы наклона
с границами а и β. Изобразим на комплексной плоскости годографы 1/G(ju>)
и — Φ (α) и построим критический круг, а также частотную полосу неопреде
ленности так, как описано выше. Тогда
• система не имеет полуволновых симметричных периодических решений
с собственной частотой ω Ε Ω;
• система не имеет полуволновых симметричных периодических решений
с собственной частотой ω Ε Ω', если соответствующий круг ошибки не
пересекается с годографом — Φ (а);
• для каждого полного пересечения, определяющего на плоскости (а;, а) мно
жество Г, существует по крайней мере одно полуволновое симметричное
периодическое решение
y(t) = asmut + yh(t)
с (ω, а) в Г. При этом yh(t) удовлетворяет оценке (7.40).
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. 14.
Π
Заметим, что в этой теореме дается достаточное условие существования ко
лебаний и достаточное условие отсутствия колебаний. Однако эти условия не
покрывают все возможные ситуации, и существуют такие, когда мы не можем
дать определенного ответа на вопрос о существовании или отсутствии в системе
колебаний.
Пример 7.14. Рассмотрим систему с передаточной функцией
G{s)= 9
~
S
52
+0.85+8
Ω= <ω
•
α+β
+ G{jkw)
7.2 . МЕТОД ОПИСЫВАЮЩЕЙ ФУНКЦИИ
313
и нелинейностью насыщения. В примере 7.10 мы видели, что уравнение гармо
нического баланса имеет единственное решение ω8 = 2\/2 « 2.83 и as = 1.455.
Нелинейность насыщения удовлетворяет ограничениям на угол наклона с грани
цами а = 0 и β = 1. Поэтому центр критического круга расположен в —0.5 и его
радиус равен 0.5. Функция \/G{jui) определяется равенством
1
ОЦш)
= -0.8+j
.8
-ω
2
ω
Следовательно, годограф 1/G(JCJ) расположен на прямой Re[s] = —0.8 (см. ри
сунок 7.21). Радиус круга ошибки σ(ω) был вычислен для восьми значений ча-
0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
Полоса
неопреде- i
ленности
-1.2
-1
-0.8
-0.6
-0.4
-0.2
0
Рис. 7.21. Полоса неопределенности в примере 7.14
0.2
стоты, лежащих в пределах от ω = 2.65 до ω = 3.0 с шагом 0.05. Центры кругов
ошибки располагаются на прямой Re[s] = —0.8 внутри критического круга. Зна
чение σ(ω) при ω = 2.65 равно 0.0388, при ω = 3.0 равно 0.0321, при этом зна
чения σ(ω) монотонно изменяются на всем промежутке рассматриваемых частот.
Во всех случаях ближайшей к критическому кругу гармоникой является третья
и, следовательно, наименьшее значение в (7.38) достигается при к = 3. Границы
полосы неопределенности почти вертикальны. Полоса неопределенности пересе
кается с годографом — Ψ(α) в точках а\ = 1.377 и а,2 = 1.539. Вещественная ось
почти касается расположенного ниже круга ошибки, соответствующего значению
ω = 2.85, и поэтому мы можем положить ω2 = 2.85. Круг ошибки, соответству
ющий ω = 2.8, является ближайшим кругом, почти касающимся вещественной
314
ГЛАВА 7
оси сверху. Из этого следует, что ω\ > 2.8. При ω = 2.81 мы получаем круг, ко
торый почти касается вещественной оси. Вышеприведенные данные позволяют
определить множество Г:
Г={(ω,а)|2.81<ω<2.85,1.377<а<1.539}.
В Г существует лишь одна точка пересечения. Нам необходимо проверить вы
полнение условий регулярности. Значение производной
d
^) =U
da
da
sin
-l
ε) + ελ/1
-
να
rV^
πα"
отлично от нуля при а = 1.455 и
d
αω Im[G(ju)}
o=V8 (0.8)'
9*0.
Таким образом, из теоремы 7.4 следует, что система действительно имеет пе
риодическое решение. Более того, можно утверждать, что частота колебаний
ω принадлежит интервалу [2.81,2.85] и амплитуда первой гармоники на входе
нелинейности принадлежит интервалу [1.377,1.539]. Из оценки (7.40) видно, что
член высших гармоник yh(t) удовлетворяет неравенству
Jo
y2
h(t)dt^ 0.0123, V(cj,a) £ Γ,
из которого видно, что форма волны сигнала на входе нелинейности близка
к форме первой гармоники a smut.
Δ
Пример 7.15. Рассмотрим систему из примера 7.9 с передаточной функцией
ОД s(s+l)(s +2)
и нелинейностью насыщения, удовлетворяющей ограничению на угол наклона
с границами а = 0 и β = 1. Обратная кривая Найквиста для G(ju>), показанная
на рисунке 7.22, лежит вне критического круга для всех ω > 0. Следовательно,
Ω = (0, оо), и мы можем заключить, что колебания в системе отсутствуют.
Δ
7.3. Упражнения
7.1. С использованием кругового критерия исследуйте вопрос об абсолютной
устойчивости систем с нижеследующими передаточными функциями. В каждом
случае определите сектор [а, /?], в котором система является абсолютно устойчи
вой.
(1) G(s) =
s
2
-
s+1
7.3 . УПРАЖНЕНИЯ
315
3
2
1
О
-1
-2
-3
-6
-4
-2
О
Рис. 7.22. Обратная кривая Найквиста и критический круг в примере 7.15
:
:
:
\ 1/»Н_^·^
-:-б j ;_£
>
(s+2)(s+
1
s
2
+s+1'
s
2
-l
3)"
(s + l)(s
2
+ l)'
1-е
(S+l)2
'
s+1
(s + 2)2(s-
1
(S+l)4
'
1
-i)'
(3) G(s) =
(4) G(s) =
(5) G(s) =
(6) G(S) =
(7) G(s) =
(8)
G(
^(s + i)2(s+ 2)
2
·
7.2. Рассмотрим систему, изображенную на рисунке 7.1, при передаточной функ
ции G(s) = 2s/(s
2
+5+1).
(a) Покажите, что система абсолютно устойчива для нелинейностей из сектора
[0,1].
(b) Покажите, что система не имеет предельных циклов при φ (у) = sat (у).
7.3. Рассмотрим систему
х\ = —xi-h{x\+Х2)»#2=х\ -%2-2h(xi +#2),
где h — гладкая функция, удовлетворяющая
yh(y)^0, VyeR,
h(y)
\h(y)\<с при а\<у<а2 и -а2<у< -а\.
с, если у^а,2,
0, если |у| ^ -аь
—с, если у < —а2,
316
ГЛАВА 7
(a) Покажите, что начало координат является единственной точкой равновесия.
(b) Покажите с использованием кругового критерия, что начало координат гло
бально асимптотически устойчиво.
7.4 ([201]). Рассмотрим систему
х\ =#2, #2= —(μ2
+α
2
—
qcosu;t)xi — 2μ£2,
где μ, α, q и ω — положительные константы. Представьте систему в форме со
единения систем с обратной связью, изображенного на рисунке 7.1, с ф(Ь,у) =
= qy cos ut, и используйте круговой критерий для получения условий на μ, α, q
и ω, обеспечивающих экспоненциальную устойчивость начала координат.
7.5. Рассмотрим линейную, не зависящую от времени систему х = [A+BE(t)C]x,
где А — гурвицева матрица, ||£?(i)||2 < 1, Vt ^ 0 и supueRamax[C{ju>I
-
—
A)~
l
B] < 1. Покажите, что начало координат равномерно асимптотически
устойчиво.
7.6. Рассмотрим систему х = Ах + В и. Пусть и = —Fx — стабилизирующая об
ратная связь, т. е. матрица (А — BF) — гурвицева. Предположим, что вследствие
наличия в системе физических ограничений мы должны использовать в цепи
обратной связи ограничитель вида \щ(Ь)\ ^ L. Замкнутая система может быть
представлена в виде х = Ах — BLsat(Fx/L),
где sat(v) — вектор, г-й элемент
которого представлен функцией насыщения.
(a) Покажите, что система может быть представлена в виде соединения систем
с обратной связью, изображенного на рисунке 7.1 с G(s) = F(sl — А +
+ BF)~
l
B и ф(у) = Lsat(y/L) - у.
(b) Определите условия асимптотической устойчивости начала координат с ис
пользованием многомерного кругового критерия.
(c) Примените полученный результат к системе с
F=[12]иL=1
и оцените область притяжения.
7.7. Выполните упражнение 7.1 с использованием критерия Попова.
7.8. В этом упражнении будет получен вариант критерия Попова для скаляр
ной передаточной функции G(s), все полюсы которой расположены в открытой
левой полуплоскости, за исключением одного простого полюса на мнимой оси
с положительным вычетом. Система имеет вид
z=Az-Вф(у), i)= —ф(у) и у=Cz+dv,
где d > 0, А — гурвицева матрица, (А, В) — управляемая пара, (Л, С) — на
блюдаемая пара и φ принадлежит сектору (0, к]. Пусть V(z, υ) = z
T
Pz +а(у-
-
Cz)
2
+ Ь/0
У
ψ(σ)ασ9 гдеΡ=Ρτ >0,α>0иb^0.
01"
L0.51J
,в=
'0"
[1J
7.3 . УПРАЖНЕНИЯ
317
(a) Покажите, что функция V является положительно определенной и радиаль-
но неограниченной.
(b) Покажите, что V удовлетворяет неравенству
V^z
T
(PA +A
T
P)z-2z
T
{PB - и))ф(у) - 1ф2(у),
гдеw=adCT
+ (1/2)ЬАтС
т
и 7 = (2ad/k) + b(d + СВ). Предположите,
что Ь выбрана так, что 7^0.
(c) Покажите, что система абсолютно устойчива, если
i + Re[(l + jwfiGfju))] >0, Υω GД, где η =
^.
7.9 ([85]). Система с обратной связью, изображенная на рисунке 7.23, является
системой управления, в состав которой входит объект управления со (скалярной)
передаточной функцией H(s) и внутренний контур, представляющий исполни
тельное устройство (актюатор). Пусть H(s) — (s + 6)/(s 4- 2)(s + 3), и предполо-
r=0 +r
—
—"\
<я) »
К1
1
1s
гL
—•
H(s) v
r
Рис. 7.23. Система в упражнении 7.9
жим, что к ^ 0 пф принадлежит сектору (0,/?], где β может быть произвольно
большой, но конечной.
(a) Покажите, что система может быть представлена в виде системы с обратной
связью, изображенной на рисунке 7.1, с нулевым выходом е, нулевым входом
исG(s) =[H(s)+ k)/s.
(b) Используя вариант критерия Попова, рассмотренный в упражнении 7.8, най
дите такую нижнюю границу кс, что система является абсолютно устойчи
войдлявсехк> кс.
7.10. Проверьте, что каждой из нижеследующих нелинейностей φ (у) соответ
ствует указанная описывающая функция Φ (α):
(1) ^(у) = 2/5;Ф(а)=5а
4
/8;
(2) ф{у)=у
3
\у\; Ф(а) = 32α3/15π;
(3) ф{у) : рисунок 7.24(a); Φ (о) = к + 4А.
318
ГЛАВА 7
где
(4) φ (у) : рисунок 7.24(b);
ГО
при а<Л;
W
~
\(ΑΒ/πα)[1-(Α/α)ψ2
при а^А;
(5) ^Ы : рисунок 7.24(c);
(О
при а^А]
к[1 - Ν(α/Α)]
приА^а<Б;
k[N(a/B) - N(a/A)} при а ^ В,
ВД =# sin
-1
+ W'-'
1
Ф(у).
slope =
fc
В
2/
(a)
Ψ(у)к \slope = к
АВУ
(Ь)
(с)
Рис. 7.24. К упражнению 7.10
7.11. С использованием метода описывающей функции исследуйте вопрос о су
ществовании периодических решений и определите частоту и амплитуду колеба
ний в изображенной на рисунке 7.1 системе с нижеследующими передаточными
функциями:
(1)G(s) =(1- s)/s(s +1)иф(у)=у
5
.
(2) G(s) = (1 — s)/s(s + 1) и φ — нелинейность из упражнения 7.10(5) с А =
= 1,В =3/2ик=2.
(3) G(s) = 1/(5 + I)6
и ф(у) = sign(y).
(4) G(s) =(s+6)/ф+2)(s+3)иVQ/)= sign(y).
(5) G(s) = s/(s
2
-
s+1)иф(у)=у
ъ
.
(6) G(s) = 5(s + 0.25)/s
2
(s + 2)2 и ^ — нелинейность из упражнения 7.10(3)
сА=1ик =2.
(7) G(s) = 5(s + 0.25)/s
2
(s + 2)2 и ф — нелинейность из упражнения 7.10(4)
сА=1иВ=1.
(8) G(s) = 5(5 + 0.25)/s
2
(s + 2)2 и φ — нелинейность из упражнения 7.10(5)
сА=1,В =3/2ик=2.
(9) G(s) = l/(s + I)3
и ф(у) = sgn(y).
(10) G(s) = 1/{з + l)3
и ф(у) = sat(y).
7.3 . УПРАЖНЕНИЯ
319
7.12. Примените метод описывающей функции при исследовании существова
ния периодических решений в генераторе с отрицательным сопротивлением (см.
параграф 1.2.4) с h(v) = —υ + υ
3
—
υ5/5 и ε = 1. Для каждого периодическо
го решения найдите оценки частоты и амплитуды колебания. С использованием
компьютерного моделирования определите, насколько точны полученные резуль
таты.
7.13. Рассмотрим изображенную на рисунке 7.1 систему с G(s) = 2bs/(s
2
— bs+l)
и φ (у) = sat (у). С использованием метода описывающей функции покажите, что
при достаточно малой b > 0 система имеет периодическое решение. Докажите
полученное утверждение с использованием теоремы 7.4 и сделайте оценки ча
стоты и амплитуды колебания.
7.14. Рассмотрим изображенное на рисунке 7.1 соединение систем с
G(8) -
1
φ(ν)-I
Ь
У>
- 1^Ьу^
1,
G
^-(5 + l)2(5 + 2)2> ^-\sign(y),
%)>lj
гдеb>0.
(a) С использованием кругового критерия найдите максимальную 6, при кото
рой начало координат замкнутой системы глобально асимптотически устой
чиво.
(b) С использованием критерия Попова найдите максимальную Ь, при которой
начало координат замкнутой системы глобально асимптотически устойчиво.
(c) С использованием метода описывающей функции найдите минимальную 6,
при которой в системе существуют колебания, и оцените частоту этих коле
баний.
(d) При b = 10 исследуйте с использованием теоремы 7.4 вопрос о существова
нии периодических решений. Для каждого такого решения (если оно суще
ствует)
i) найдите интервал частот [ω^α^] и интервал амплитуд [ai,a2];
ii) используя лемму 7.1, найдите верхнюю границу энергоемкости (energy
content) высокочастотных гармоник и выразите эту величину в процентах от
энергоемкости первой гармоники и
iii) выполните компьютерное моделирование системы и сравните эти резуль
таты с полученными выше аналитическими результатами.
(e) Выполните пункт (d) при b = 30.
7.15. Выполните пункты (а)-(с) предыдущего упражнения при G(s) = 10/(s +
+ l)2(s + 2).
7.16. Рассмотрим изображенную на рисунке 7.1 систему с G(s) = l/(s + l)3
и кусочно-линейной функцией ψ (у) с δ = l/k, s\ — к и 52 = 0, график которой
изображен на рисунке 7.15.
(а) С использованием метода описывающей функции исследуйте вопрос о су
ществовании периодических решений и определите их частоты и амплитуды
прик=10.
320
ГЛАВА 7
(b) При /с = 10 примените к системе теорему 7.4. Для каждого периодического
решения (если оно существует) найдите интервал частот [CJI,^] и интервал
амплитуд [ai,a2].
(c) Каково максимальное значение углового коэффициента к > 0, при котором
по теореме 7.4 в системе отсутствуют периодические решения?
7.17. В каждом из следующих случаев примените терему 7.4 и исследуйте во
прос о существовании периодических решений в системе, изображенной на ри
сунке 7.1. Для каждого периодического решения (если оно существует) найдите
интервал частот [c^i,^] и интервал амплитуд [oi,a2].
(1) G{s) = 2(5 - l)/s
3
(s + 1)иф(у) = sat(y).
(2) G(s) = -s/(s
2
+ 0.85+8)иф(у)=(1/2)sinу.
(3) G(s) = -s/(s
2
+ О.85 4- 8) и ф(у) — нелинейность из примера 7.13.
(4) G(s) = —24/s
2
(s+I)3
и φ (у) — нечетная нелинейность
^Ы_/г/
3
+У/2 при 0<2/<1,
^
У)
-\2у-1/2
при у>1.
ГЛАВА 8
Устойчивость систем
В главе 4 были представлены основные концепции теории устойчивости
Ляпунова. В настоящей главе эти концепции будут рассмотрены более подробно,
а также будут предложены обобщения и новые версии этих результатов.
В главе 4 было показано, как можно использовать метод линеаризации авто
номных систем для исследования устойчивости их точек равновесия. Мы также
убедились, что этот метод неприменим в случаях, когда матрица Якоби, вычис
ленная в точках равновесия, имеет некоторые собственные числа с нулевыми
вещественными частями и не имеет собственных чисел с положительными веще
ственными частями. В параграфе 8.1 мы сформулируем теорему о центральном
многообразии и используем ее для исследования устойчивости точек равновесия
автономных систем в критических случаях, когда метод линеаризации оказыва
ется неприменим.
Концепция области притяжения асимптотически устойчивой точки равнове
сия была введена в параграфе 4.1. В параграфе 8.2 мы разработаем расширенную
версию этой концепции и представим некоторые идеи, позволяющие оценить об
ласть притяжения. Принцип инвариантности Ла-Салля, сформулированный для
автономных систем в теореме 4.4, очень полезен при исследовании приложений.
Для неавтономной системы общего вида аналогичного принципа инвариантно
сти не существует. Однако существуют теоремы, в которых задействованы неко
торые идеи принципа инвариантности. Две такие теоремы представлены в пара
графе 8.3. В первой теореме идет речь о сходимости траектории к некоторому
множеству, а во второй — о равномерной асимптотической устойчивости начала
координат.
Наконец, в параграфе 8.4 мы введем понятия устойчивости периодических
решений и инвариантных множеств.
8.1. Теорема о центральном многообразии
Рассмотрим автономную систему
х = /(х),
(8.1)
где/:D—•R
n
—
непрерывно дифференцируемая функция и D С Rn
—
от
крытая область, содержащая начало координат х = 0. Предположим, что начало
322
ГЛАВА 8
координат является точкой равновесия системы (8.1). В теореме 4.7 утверждает
ся, что если все собственные числа матрицы
*->
х=0
имеют отрицательные вещественные части, то начало координат асимптотически
устойчиво; если некоторые из этих собственных чисел имеют положительные ве
щественные части, то начало координат неустойчиво. Если некоторые собствен
ные числа А имеют нулевые вещественные части и остальные вещественные
числа имеют отрицательные вещественные части, то с использованием метода
линеаризации невозможно ответить на вопрос об устойчивости начала коорди
нат. В этом параграфе мы более подробно рассмотрим последний случай, т. е. ко
гда метод линеаризации оказывается неприменим. В подобных ситуациях един
ственное, что нам остается, — это выполнить анализ исходной нелинейной систе
мы η-го порядка (8.1). На следующих нескольких страницах будет представлен
интересный результат, заключающийся в том, что свойства устойчивости начала
координат этой системы могут быть установлены на основе анализа нелинейной
системы меньшего порядка — системы, размерность которой равна числу соб
ственных чисел матрицы А с нулевыми собственными частями. Это будет сдела
но с использованием теории центрального многообразия (central manifold)1
.
Существует строгое математическое определение понятия многообразия
размерности к в пространстве R
n
(l < к < п)? Для наших целей достаточно
рассматривать многообразие размерности к как решение уравнения
7/(х) = О,
гдеη:R
n
—>R
n
~
k
—
достаточно гладкая (т. е. достаточно много раз непрерывно
дифференцируемая) функция. Например, единичная окружность
{хеR
2
|х\+х\=1}
является многообразием размерности 1в R
2
.
Аналогично единичная сфера
{xeR
n
\ £*? =1}
г=1
является многообразием размерности (п — 1) в R
n
.
Многообразие {q(x) = 0}
называется инвариантным многообразием для (8.1), если
η(Χ(0)) =0=> v(x(t)) = 0, Vt e [0,*i) С Д,
где [0,ti) — интервал времени, на котором определено решение x(t).
Теория центрального многообразия имеет несколько приложений в области теории динами
ческих систем. В этой книге она представлена лишь в контексте анализа свойств устойчивости
начала координат. Более общий обзор приведен в работе [34].
2
См., например, работу [71].
8.1 . ТЕОРЕМА О ЦЕНТРАЛЬНОМ МНОГООБРАЗИИ
323
Предположим, что f(x) дважды непрерывно дифференцируема. Уравне
ние (8.1) может быть представлено в следующей форме:
х = Ах + /(x)-g(0)x Ax + f(x),
где функция
df,
f(x) = f(x) -
^(0)х
является дважды непрерывно дифференцируемой и
/(0)=0; ||(0)=0.
Поскольку нас интересует ситуация, когда метод линеаризации неприменим,
предположим, что матрица А имеет к собственных чисел с нулевыми веществен
ными частями и т = п—к собственных чисел с отрицательными вещественными
частями. Мы всегда можем найти преобразование подобия Т, преобразующее А
в блочно-диагональную матрицу, т. е.
Τ AT"
1
=
Αλ0
ОА2
где все собственные числа Ai имеют нулевые вещественные части и все соб
ственные числа А2 имеют отрицательные вещественные части. Очевидно, что
матрицы А\ и А2 имеют размерности соответственно к х к и т х т. Замена
переменных
= Тх·
yeR
k
]zeR
m
преобразует (8.1) к следующему виду:
y = A1y + gx{y,z),
z = A2z + g2(y,z),
(8.2)
(8.3)
где gi и д2 наследуют свойства /. В частности, эти функции являются дважды
непрерывно дифференцируемыми и
174(0,0) = 0; ^(0,0) = 0; §j(0,0) = 0, г = 1,2.
(8.4)
Если z = h(y) — инвариантное многообразие для (8.2)-(8.3) и h — гладкая функ
ция, то оно называется центральным многообразием, если
М0)=0; g(0)=0.
324
ГЛАВА 8
Теорема 8.1. Если дг и д2 — дважды непрерывно дифференцируемые функ
ции, удовлетворяющие (8.4), все собственные числа А\ имеют нулевые веще
ственные части и все собственные числа А2 имеют отрицательные веществен
ные части, то существуют константа δ > 0 и непрерывно дифференцируемая
функция h(y), определенная для всех \\у\\ < δ, такие что z = h(y) является
центральным многообразием для (8.2)-(8.3).
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. 15.
Π
Если начальное состояние системы (8.2)-(8.3) принадлежит центральному
многообразию, т.е. z(0) = /i(y(0)), то решение {y(i),z{t)) будет принадлежать
этому многообразию для всех t ^ О, т.е. z(t) = h(y(t)). В этом случае дви
жение системы на центральном многообразии определяется дифференциальным
уравнением порядка к
y = Aiy + gi(y,h(y)),
(8.5)
которое мы будем называть редуцированной системой. Если z(0) φ h(y(0)), раз
ность z(t) — h(y(t)) представляет собой отклонение траектории от центрального
многообразия в момент времени t. Замена переменных
У
w
У
z-h(y)J
преобразует (8.2)-(8.3) в
у=Аху +01(у,w+h(y)),
(8.6)
w=A2[w+h(y)}+g2(y,w+h(y)) -
-^(y)[Aiy + ffl(y,ti; + %))].
(8.7)
В новых координатах центральное многообразие задается равенством w = 0.
Движение на многообразии характеризуется свойством
w(t) =0=»w(t)=0.
Подставляя эти тождества в (8.7), получаем
0 = A2h(y) + g2(y,h(y)) ~ ^(yMiy
+ 9i(y,h(y))}.
(8.8)
Поскольку это равенство должно быть выполнено для любого решения, при
надлежащего центральному многообразию, можно утверждать, что функция
h(y) должна удовлетворять дифференциальному уравнению в частных производ
ных (8.8). Прибавляя и вычитая gi(y,h(y)) к правой части (8.6) и вычитая (8.8)
из (8.7), мы можем переписать уравнение в новых координатах:
у = А1У + 91(у, %)) + iVi(y,w),
(8.9)
w = A2w + N2(y,w),
(8.10)
8.1. ТЕОРЕМА О ЦЕНТРАЛЬНОМ МНОГООБРАЗИИ
325
где
Щу,ъ>) =9i(y,w + h(y))
-9i(y,h(y))
N2(y,w) = g2(y,w + МУ)) - 92{УМУ))
~
^~Ы ЩУ,TM)-
Легко показать, что Ni и N2 являются дважды непрерывно дифференцируемыми
и
Wi(y,0)=0,
^(0,0)= 0, < = 1,2.
Следовательно, в области
<9го
<Р
Ni и 7V2 удовлетворяют неравенствам
1No,TM)||2Ог|Н, < = 1,2,
где положительные константы к\ и &2 могут быть сделаны произвольно малы
ми выбором достаточно малой р. Из этих неравенств, а также из гурвицевости
матрицы А2 следует, что свойства устойчивости начала координат определяются
редуцированной системой (8.5). Это утверждение, известное как принцип редук
ции, сформулировано в виде следующей теоремы.
Теорема 8.2. Если в условиях теоремы 8.1 начало координат у = 0 редуци
рованной системы (8.5) является асимптотически устойчивым {соответствен
но неустойчивым), то начало координат всей системы (8.2), (8.3) также явля
ется асимптотически устойчивым [соответственно неустойчивым).
ДОКАЗАТЕЛЬСТВО. Замена координат (у, z) ь-> (у, w) не влияет на свойства
устойчивости начала координат (см. упражнение 4.26). Поэтому мы можем огра
ничиться анализом системы (8.9), (8.10). Если начало координат редуцированной
системы (8.5) неустойчиво, то начало координат (8.9), (8.10) также неустойчи
во, т.к. любому решению y(t) уравнения (8.5) соответствует решение (y(t),0)
системы (8.9), (8.10). Предположим теперь, что начало координат редуцирован
ной системы (8.5) является асимптотически устойчивым. По обратной теореме
Ляпунова 4.16 существует непрерывно дифференцируемая функция V(y), явля
ющаяся положительно определенной и удовлетворяющая в окрестности начала
координат неравенствам
§^1У + ЫУ,%))К-<*З(1М|2),
ду < а4(|М|2) < к,
326
ГЛАВА 8
где аз и α4 — функции класса /С. С другой стороны, поскольку А2 гурвицева,
уравнение Ляпунова
D/1
'
*2-
РА2+ΑξΡ= -I
имеет единственное положительно определенное решение Р. Рассмотрим
v{y,w)=V(у)+ Vw
T
Pw
в качестве функции Ляпунова
3
для всей системы (8.9), (8.10). Производная ν
вдоль траекторий системы удовлетворяет оценке
|>(у,ги) = ^[А1У + gi(y,h(y)) + N!(y,w)] +
+
*
[w
T
(PA2 + ΑξΡ)νυ + 2w
T
P7V2(</,w)] <
2vw
T
Pw
/
/IIII\.1UIIII
1НЬ
1 foAmaxCP),, „
< —«aClll/lla) + kki\\w\\2 -
+ > ,mHb=
= -ois(\\yh) -
— 7===||^||2 -
1
J^-fe-^^
4у/Атах(Р)
VA
min(P) No·
Уменьшая область вокруг начала координат, мы можем сделать величины fci и &2
сколь угодно малыми, обеспечив этим выполнение неравенства
_
fcfcl_fc2^£L>0.
VAma*(P)
VA
min(P)
Следовательно,
i>(y,ti;) < -α3(||1/||2) - —τ===|Μ|2,
4v<W(P)
и из этого неравенства следует, что z>(y, iu) — отрицательно определенная функ
ция, т.е. начало координат всей системы (8.9)—(8.10) асимптотически устойчиво.
Π
Читателю предлагается (упражнения 8.1 и 8.2) обобщить это доказательство
и показать, что следующие утверждения справедливы.
3
Функция v{y,w) является непрерывно дифференцируемой во всей окрестности начала коор
динат, за исключением многообразия w = 0. Функции v(y,w) и 0(y,w) определены и непрерыв
ны в окрестности начала координат. Легко показать, что утверждение теоремы 4.1 остается в этих
условиях верным.
8.1 . ТЕОРЕМА О ЦЕНТРАЛЬНОМ МНОГООБРАЗИИ
327
Следствие 8.1. Если в условиях теоремы 8.1 начало координат у = 0 реду
цированной системы (8.5) устойчиво и существует непрерывно дифференциру
емая функция Ляпунова V(y), такая что неравенство
4
^[Aiy
+
gi(yMv))]<0
выполнено в некоторой окрестности у = 0, то начало координат всей систе
мы (8.2)-(8.3) также является устойчивым.
Следствие 8.2. В условиях теоремы 8.1 начало координат редуцированной
системы (8.5) асимптотически устойчиво, если и только если начало координат
всей системы (8.2)-(8.3) асимптотически устойчиво.
Для того чтобы применить теорему 8.2, нам необходимо найти централь
ное многообразие z = h(y). Функция h является решением дифференциального
уравнения в частных производных
*(%)) =
f
^(y)[Aiy + gi(yMy))] ~ A2h(y)-g2(y,h(y))
=О
(8.11)
с граничными условиями
А(0)=0; g(0)=0.
(8.12)
В большинстве случаев это уравнение для h не может быть решено аналитически
(для этого необходимо знать решение всей системы (8.2)-(8.3)), но его решение
может быть аппроксимировано с требуемой точностью рядом Тейлора для у.
Теорема 8.3. Если некоторая непрерывно дифференцируемая функция
Ф{у)-> 0(0) — 0, [дф/ду](0) = 0удовлетворяет N(<j>(y)) = 0(||y||p) для некото
рой ρ > 1, то для достаточно малой величины \\у\\
Чу)-Ф(у) = 0(\\у\\П
и редуцированная система может быть представлена в виде
У=
А1У^91(у,ф(у))^0(\\уГ+1
).
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. 15.
Π
4
Существование функции Ляпунова V(y) не может быть доказано с использованием обратной
теоремы Ляпунова. Обратная теорема Ляпунова для случая устойчивости [72,107] гарантирует су
ществование функции Ляпунова V(i, у), производная которой удовлетворяет V(t,y) ^ 0. В общем
случае эта функция не может быть сделана независимой от t. (См. [72, стр. 228].) Даже если мы
можем выбрать V(t,y) непрерывно дифференцируемой по своим аргументам, невозможно гаран
тировать, что частные производные dV/dyi, dV/dt будут равномерно ограничены в окрестности
начала координат при всех t > 0. (См. [107, стр. 53].)
328
ГЛАВА 8
Обозначение О(-) будет формально введено в главе 10. Здесь достаточ
но рассматривать соотношение f(y) = 0(||у||р) как утверждение о том, что
||/(?/)II ^ Щу\\р Для достаточно малых \\у\\. В качестве иллюстрации примене
ния центрального многообразия рассмотрим несколько примеров. В первых двух
примерах мы увидим, что для скалярного уравнения состояния
у = ау^ + 0(\уГ1),
где ρ — положительное целое число, начало координат является асимптотиче
ски устойчивой точкой равновесия, если ρ нечетное и а < 0. Начало координат
является неустойчивым, если ρ нечетное и а > 0 или если ρ четное и а ф О5
.
Пример 8.1. Рассмотрим систему
XI
Х2
Я2,
-Х2 + ах\ + Ъх\Х2,
где а ф 0. Эта система имеет единственную точку равновесия в начале координат.
Линеаризованная система в начале координат имеет матрицу
01
0-1
с собственными значениями 0 и —1. Пусть Μ — матрица, столбцами которой
являются собственные векторы А, т. е.
Положим Τ = Μ
1
. Тогда
М--
1
0
X
ТАТ~
1
=
У'
Ζ
=т
X
X'2
-]
L
'0
0"
0-1
=
Cl+Х2
-Х2
Замена координат
приводит систему к следующему виду:
y=a(y+z)
2
-b(yz + z
2
),
z=-z
-
a{y+z)
2
+b(yz+z
2
).
Уравнение центрального многообразия (8.11) с граничным условием (8.12) имеет
вид
N{h{y)) = h'(y)Hv + %))2
" КуЦу)+h
2
(y))}+%) +
+а(у + %))2
-
b(yh(y) + h
2
{y))=0,Λ(0)=Λ'(0)=0.
См. упражнение 4.2.
8.1 . ТЕОРЕМА О ЦЕНТРАЛЬНОМ МНОГООБРАЗИИ
329
Положим h(y) = h^y
2
Л- hsy
3
H и подставим этот ряд в уравнение централь
ного многообразия. Приравнивая коэффициенты при равных степенях в анало
гичном ряде для у, находим неизвестные коэффициенты /i2, Л-з> · · · (т. к. это урав
нение тождественно выполнено для у). Следует отметить, что нам не известно
заранее, сколько потребуется использовать членов ряда. Начнем анализ с про
стейшей аппроксимации: h(y) « 0. Подставим h(y) = 0(\y\2) в редуцированную
систему и исследуем вопрос об устойчивости ее начала координат. Если в этом
случае свойства устойчивости начала координат могут быть установлены, наш
анализ закончен. В противном случае необходимо вычислить коэффициент /i2,
подставить h(y) = h^y
2
+ 0(|у|3) и снова исследовать вопрос об устойчивости
начала координат редуцированной системы. Если и в этом случае невозможно
установить свойства устойчивости начала координат, выполняем описанную вы
ше процедуру для h(y) « /ад
2
-l· /ад
3
и так далее. Применим эту стратегию
к нашему примеру и рассмотрим аппроксимацию h(y) « 0. В этом случае реду
цированная система имеет вид
у=ау
2
+ 0(\у\3).
Заметим, что ошибка аппроксимации h(y) порядка 0(|у|2) приводит к ошибке
порядка 0(|у|3) для правой части редуцированной системы. Это обусловлено
тем, что функция gi(y,z), присутствующая в правой части редуцированной си
стемы (8.5) в виде gi(y,h(y))9 имеет равную нулю в начале координат частную
производную по z. Очевидно, это выполнено и для аппроксимаций большего по
рядка, т.е. ошибка h(y) порядка 0(|y|fc
) приводит к ошибке порядка 0(|2/|fe+1
)
для g\(y,h(y)) при к > 2. Член ау
2
является доминирующим в правой части
редуцированной системы, и поэтому при а ф 0 начало координат редуцирован
ной системы неустойчиво. Следовательно, по теореме 8.2 начало координат всей
системы также неустойчиво.
Δ
Пример 8.2. Рассмотрим систему
z=-z +ay
2
,
уже представленную в (у, ^)-координатах. Уравнение центрального многообра
зия (8.11) с граничным условием (8.12) имеет вид
h'(y)[yh(y)] + h(y) - ay
2
= 0,Λ(0)=h'(Q)=0.
Рассмотрим простейшую аппроксимацию ф(у) = 0. Редуцированная система
имеет вид
У = 0(\у\3).
Очевидно, что мы не можем сделать определенное заключение об устойчиво
сти начала координат этой системы. Поэтому подставим h(y) = /ад
2
+ 0(|у|3)
330
ГЛАВА 8
в уравнение центрального многообразия и путем сопоставления с коэффициен
тами разложения у
2
найдем /i2 = α. Редуцированная система
6
у=ау
3
+ 0(\у\4).
Поэтому начало координат асимптотически устойчиво, если а < 0, и неустойчи
во, если а > 0. Следовательно, по теореме 8.2 начало координат всей системы
асимптотически устойчиво, если а < 0, и неустойчиво, если а > 0. Если а —
—
0, уравнение центрального многообразия (8.11) с граничным условием (8.12)
сводится к следующему:
ti{y)[yh{y)] + h(y) = 0, h(0) = Λ'(0) = 0.
Это уравнение имеет точное решение h(y) = 0. Начало координат редуцирован
ной системы у — 0 устойчиво, и соответствующая функция Ляпунова имеет вид
V{y)=у
2
.
Поэтому с использованием следствия 8.1 мы можем заключить, что
начало координат всей системы устойчиво, если а = 0.
Δ
Пример 8.3. Рассмотрим систему (8.2)-(8.3) при
01
-1031=
„з
-у\
-1/2+**J
3yi + Ъу\у2.
Μ= -1,9i=Уг
Можно показать, что при ф(у) = 0 выполнено iV(<^(y)) = OOls/Hf) и
У=
-У\ +Уг
~У\~у\J
+ 0(\\y\\i).
Используя V(y) = (yl + у|)/2 в качестве функции Ляпунова, получаем оценку
V -У\-У\+У
Т
0{\\у\\\) ^ -\Ы\ + ШЪ
выполненную в некоторой окрестности начала координат при к > 0. Следова
тельно,
V<-h\\v\\$
при ||у||2<
-\Ы1
4fc*
Из этого неравенства следует, что начало координат редуцированной систе
мы асимптотически устойчиво. Поэтому начало координат всей системы также
асимптотически устойчиво.
Δ
Заметим, что в предыдущем примере недостаточно лишь исследовать сис
тему
У=
-У\ +У2
-Уг~У2J
6
В действительности ошибка правой части редуцированной системы имеет порядок 0(|у|5)
поскольку при h(y) = h,2y2
+ Нзу
3
Ч получаем кз — 0.
8.2 . ОБЛАСТЬ ПРИТЯЖЕНИЯ
331
Необходимо также найти функцию Ляпунова, с помощью которой можно до
казать асимптотическую устойчивость начала координат при всех возмущениях
порядка 0(|М|2). Важность этого замечания иллюстрируется следующим при
мером.
Пример 8.4. Рассмотрим предыдущий пример, в котором матрица А\ за
менена на
"01
ОО
Аг
При ф(у) = О редуцированная система может быть представлена в следующем
виде:
У=
-У\ + 2/2
-у\
+ o(\\y\\i).
При отсутствии члена возмущений О^уЩ) начало координат этой системы явля
ется асимптотически устойчивым
7
.
Однако если попытаться найти функцию Ля
пунова V(y), гарантирующую асимптотическую устойчивость при наличии этого
члена возмущений, нас постигнет неудача. Действительно, можно показать, что
уравнение центрального многообразия (8.11) с граничным условием (8.12) имеет
точное решение h(y) = y\ и редуцированная система определяется уравнением
-Ух+У2
У\-У1
начало координат которого является неустойчивой точкой равновесия
0
8.2. Область притяжения
Очень часто бывает недостаточно установить факт асимптотической устой
чивости точки равновесия исследуемой системы и требуется найти область при
тяжения этой точки или по крайней мере получить ее оценки. Важность зада
чи определения области притяжения может быть выявлена при анализе собы
тий, происходящих при функционировании нелинейной системы. Предположим,
что нелинейная система имеет асимптотически устойчивую точку равновесия хрг
(см. рисунок 8.1). Предположим также, что система xw управляется в устойчи
вом режиме функционирования, соответствующем этой точке равновесия. Пусть
в момент времени to происходит сбой, нарушающий нормальную работу систе
мы, например короткое замыкание в электрической цепи. Предположим, что си
стема в состоянии неисправности не имеет точек равновесия в точке хрг или
в ее окрестности. Траектория системы будет выведена сбоем из точки равнове
сия Хрг. Предположим далее, что неисправность устранена в момент времени t\
7
См. упражнение 4.56.
8
См. упражнение 4.13.
332
ГЛАВА 8
и система после возникновения неисправности имеет асимптотически устойчи
вую точку равновесия xps, где xps = xw или xps достаточно близка к хрг, так что
возможен устойчивый режим функционирования в состоянии xps. В момент вре
мени t\ состояние системы x(t\) может находиться далеко от точки равновесия
системы после возникновения неисправности xps. Ответ на вопрос о том, вернет
ся или не вернется система к устойчивому режиму функционирования в состо
янии XpS, зависит от выполнения условия принадлежности x{t\) области притя
жения XpS, что определяется в свою очередь уравнением системы после возник
новения неисправности. Критическим фактором при определении допустимой
удаленности x(t\) от состояния xps является время, необходимое для устранения
неисправности, т.е. величина (t\ — to). Если (t\ — to) очень мало, то с учетом
непрерывности решения по t можно с большой долей вероятности утверждать,
что x(t\) будет находиться в области притяжения состояния xps. Однако на вы
явление и устранение неисправности может потребоваться значительное время,
что может являться критическим фактором. При проектировании подобных си
стем важно определить «критическое время на устранение неисправности» tc
9
.
Оценка области
tce tc
Область притяжения xf
Рис. 8.1. Критическое время на устранение неисправности
Очевидно, что величина (t\ — to) должна быть меньше tc. Если область притя
жения Хр8 известна, мы можем найти tc, интегрируя уравнения системы в режи
ме неисправности при ее движении из состояния равновесия до возникновения
неисправности хрг до момента достижения траектории системы границы области
притяжения. Время, необходимое для достижения этой границы, может рассмат
риваться как критическое время на устранение неисправности, поскольку если
неисправность устранена в течение этого промежутка времени, состояние x(t\)
будет находиться в области притяжения. Разумеется, мы должны предположить,
что ХрГ принадлежит области притяжения xps. Если действительная область при
тяжения неизвестна и оценка tce времени tc получена с использованием оценки
области притяжения, то tce < tC9 поскольку граница оценки области притяжения
будет находиться внутри границы действительной области притяжения. (См. ри-
9
В электротехнике термин «critical fault clearance time» переводится как «предельное время
отключения цепи (при коротком замыкании)». — Прим. перев.
8.2. ОБЛАСТЬ ПРИТЯЖЕНИЯ
333
сунок 8.1.) Описанная ситуация представляет собой пример, когда нахождение
области притяжения является необходимым этапом проектирования нелинейной
системы. Этот пример также показывает важность нахождения оценок области
притяжения, не являющихся слишком консервативными. Излишне консерватив
ная оценка области притяжения может привести к тому, что величина tce ока
жется слишком малой и потому бесполезной. Дополнительным мотивирующим
фактором для рассмотрения подобных задач является то, что описанная ситуация
не является гипотетической и представляет собой существо задачи устойчивости
переходных процессов в реальных энергетических системах
10
.
Пусть начало координат х = 0 является асимптотически устойчивой точкой
равновесия нелинейной системы
х = /(х),
(8.13)
где/:D—>R
n
—
локально липшицевая функция и D С Rn
—
открытая область,
содержащая начало координат. Пусть 4>(t\x) — решение системы (8.13), начина
ющееся в начальном состоянии х в момент времени t = 0. Область притяжения
начала координат, обозначенная RA, определяется равенством
RA —{%£D|cj){t\х) определено\ft ^ 0иф(Ь\х) —>0приt—• оо}.
Свойства области притяжения сформулированы в следующей лемме, доказатель
ство которой приведено в приложении С. 16.
Лемма 8.1. Если х = 0 — асимптотически устойчивая точка равновесия
системы (8.13), то ее область притяжения RA является открытым, связным,
инвариантным множеством. Более того, граница области RA сформирована
траекториями системы.
Из леммы 8.1 следует, что одним из путей определения области притяжения
является нахождение тех траекторий, что лежат на границе области RA- Суще
ствует несколько методов решения этой задачи, но в них используются геомет
рические понятия из теории динамических систем, которые не предполагается
вводить в этой книге. Поэтому мы не будем рассматривать этот класс методов
11
.
Однако в случае двумерных систем (п = 2) мы можем дать геометрическую ин
терпретацию этих методов с использованием фазовых портретов. В примерах 8.5
и 8.6 рассмотрены типичные случаи для пространства состояния, являющегося
плоскостью. В первом из этих двух примеров границей области притяжения яв
ляется предельный цикл, а во втором граница сформирована устойчивыми тра
екториями, проходящими через седловые точки. В примере 8.7 рассматривается
необычный случай, когда границей является замкнутая кривая, точками которой
являются точки равновесия.
10
3адача устойчивости переходных процессов в энергетических системах рассмотрена в кни
ге [170].
"См. работы [36] и [216].
334
ГЛАВА 8
Пример 8.5. Система второго порядка
х\ = -а?2,
Х2=Х\ + [х\ - 1)Ж2
представляет собой систему Ван дер Поля, представленную в обратном време
ни, т. е. при t, замененном на —t. Эта система имеет точку равновесия в начале
координат и один неустойчивый предельный цикл, что видно из фазового портре
та, изображенного на рисунке 8.2. Легко видеть, что начало координат является
4
2
О
-2
-4
-4 -2024
Рис. 8.2. Фазовый портрет из примера 8.5
устойчивым фокусом и, следовательно, асимптотически устойчиво. Это может
быть доказано с использованием соответствующей линеаризованной системы.
Действительно, матрица
0-11
1 -1J
имеет собственные значения —1/2 ± jy/3/2. Очевидно, что область притяжения
ограничена, т. к. траектории, начинающиеся вне предельного цикла, не могут пе
ресечь его и достигнуть начала координат. Поскольку другие точки равновесия
в системе отсутствуют, в качестве границы области RA должен служить предель
ный цикл. Анализ фазового портрета показывает, что все траектории, начинаю
щиеся внутри предельного цикла, сходятся по спирали к началу координат. Δ
Пример 8.6. Рассмотрим систему второго порядка
±1=Ж2,
Х2= -XI+|^1-Х2.
Эта система имеет три изолированные точки равновесия (0,0), (л/3,0) и (—\/3,0).
Фазовый портрет системы показан на рисунке 8.3. Легко видеть, что начало ко-
А=
^
дх х—0
8.2 . ОБЛАСТЬ ПРИТЯЖЕНИЯ
335
4
2
О
-2
-4
-4-2024
Рис. 8.3. Фазовый портрет из примера 8.6
ординат представляет собой устойчивый фокус, а другие две точки равновесия
являются седловыми точками. Таким образом, начало координат асимптотически
устойчиво, другие две точки равновесия неустойчивы. Это утверждение может
быть подтверждено с использованием анализа линеаризованной системы. Из фа
зового портрета также видно, что устойчивые траектории седловых точек обра
зуют две сепаратрисы, формирующие границы области притяжения. Эта область
ограничена.
Δ
Пример 8.7. Система
х\=
-xi(l-x\-xl),
имеет изолированную точку равновесия в начале координат и континуум точек
равновесия, являющийся единичной окружностью, т. е. каждая точка на единич
ной окружности представляет собой точку равновесия системы. Очевидно, что
область RA должна содержаться во внутренности единичной окружности. Траек
ториями системы являются радиусы единичного крута. В этом можно убедиться,
если представить систему в полярных координатах. Замена координат
х\ =ρcosθ, Х2—ρsinθ
приводит систему к следующему виду:
р = -р(1-р
2
),
0=0.
Все траектории, начинающиеся в точках с ρ < 1, стремятся к началу координат
при £—> оо. Поэтому область RA является внутренностью единичной окружно
сти.
Δ
Для нахождения области притяжения RA ИЛИ ДЛЯ ее оценки может быть ис
пользован метод Ляпунова. Основным способом нахождения границы области
336
ГЛАВА 8
RA является использование теоремы Зубова, формулировка которой приведена
в упражнении 8.10. Однако эта теорема является утверждением о существовании
некоторых функций и требует решения дифференциального уравнения в частных
производных. Оценки области RA могут быть найдены с использованием более
простой процедуры, основанной на методе Ляпунова. Под оценкой области RA
мы понимаем множество Ω с RA, такое что каждая траектория, начинающая
ся в Ω, стремится к началу координат при t —
•
> сю. Далее в этом параграфе мы
обсудим некоторые аспекты задачи оценки RA- Сначала покажем, что открытая
область D в теореме 4.1 (или в следствии 4.1) не является оценкой Дд. В теоре
ме 4.1 и следствии 4.1 было показано, что если D является открытой областью,
содержащей начало координат, и если существует функция Ляпунова V(x), по
ложительно определенная на D, производная которой V(x) отрицательно опре
делена на D или отрицательно полуопределена, но не существует решения, по
стоянно остающегося в множестве {V(x) = 0}, за исключением тривиального
х = 0, то начало координат асимптотически устойчиво. Исходя из этого резуль
тата можно было бы предположить, что D представляет собой оценку области
притяжения RA- Однако этот вывод неверен, и это иллюстрируется следующим
примером.
Пример 8·8. Рассмотрим систему из примера 8.6:
Х\=Х2,
3
Х2=-XI+о
Х
1-
х
2'
Эта система представляет собой частный случай системы, рассмотренной в при
мере 4.5, если положить
h(x\)=х\—}:х\ и а=1.
Поэтому функция Ляпунова определяется равенством
V(x) = \х
т
11
22х+J(y-p
3
)dy =
_
3„2_ 1 г4 , 1Τ1Το_μ 1^2
—
4^1 121
+
2*2 2
2
V(x) = -\х\{1 - \х\) - \х\.
Определив открытую область D равенством
D={хеR
2
|-VS<xi<v^},
можно легко показать, что V(x) > 0 и V(x) < 0 на D — {0}. Анализ фазового
портрета, изображенного на рисунке 8.3, показывает, что D не является подмно
жеством RA.
Δ
8.2. ОБЛАСТЬ ПРИТЯЖЕНИЯ
337
Из этого примера становится понятно, почему D из теоремы 4.1 и след
ствия 4.1 не является оценкой RA- Даже если траектория, начинающаяся в D,
перейдет с одной поверхности Ляпунова V(x) = c\ на внутреннюю поверхность
Ляпунова V(rc) = С2, С2 < ci, нет гарантии, что эта траектория останется навсе
гда в D. Если траектория покинет D, нет гарантии, что V(x) будет отрицатель
но определенной. Следовательно, все рассуждения о стремлении значений V(x)
к нулю, являются полностью неверными. Эта проблема не возникает, если в ка
честве оценки области притяжения RA фигурирует компактное положительно
инвариантное подмножество D, т.е. компактное множество Ω с D, такое что
каждая траектория, начинающаяся в Ω, остается в Ω во все будущие моменты
времени. Из теоремы 4.4 следует, что Ω является подмножеством RA- В качестве
простейшей такой оценки может выступать множество
12
Пс={хеR
n
|V(x) <с},
если Ω0 ограничено и содержится в D. Для квадратичной функции Ляпунова
V(x)=х
т
Рх и D = {\\х\\2 < г} мы можем гарантировать, что Ω0 с D, если
с<minх
т
Рх = Amin (Р)г
2
.
||х||2=г
ПриD={\Ьт
х\<г},гдеЪеД
п
,
13
2
min х
т
Рх=
^
г
\ь
т
х\=г
ЪТР~
1
Ъ
Поэтому множество {х
т
Рх < с} является подмножеством D = {\bfx\ < Ti,i =
= 1,.. .ρ}, если
с<mm
К«р bJP~
l
bi'
Выбор Ω0 = {х
т
Рх ^ с} в качестве оценки области притяжения имеет
важную связь с результатами о линеаризации, представленными в параграфе 4.3.
Мы видели, что если матрица Якоби
А=
д
-1
дх х=0
12
Множество {V(x) ^ с} может состоять из более чем одного компонента, нов D должен
содержаться лишь один из них. Этот компонент должен быть замкнутым и именно этот компонент
и используется при анализе. Например, если V(x) = х
2
/(1+х
4
)иD ={\х\ <1},томножество
{V(x) ^ 1/4} имеет два компонента: {\х\ ^ >/2-V3} И {|Ж| ^ л/2 + л/3}. Исследование
следует проводить для первого компонента.
13
Согласно [122, параграф 10.3], лагранжиан в соответствующей задаче оптимизации с задан
ными ограничениями имеет вид С(х, X) = х
т
Рх + Х[(Ьт
х)
2
—
г
2
]. Необходимые условия первого
порядка имеют вид 2Рх + 2\(bT
x)b=0и(Ьт
х)
2
—
г
2
= 0. Можно показать, что решения λ =
= -\/{bTP~
Y
b) их=±rP~
1
b/(bTP~
1
b) обеспечивают минимизацию значения г
2
/{bTP~
l
b).
338
ГЛАВА 8
является гурвицевой, то квадратичная функция Ляпунова V(x) = x
T
Px может
быть всегда найдена как решение уравнения Ляпунова РА + А
Т
Р=—Qпри
любой положительно определенной матрице Q. С учетом этого результата можно
заключить, что если А гурвицева, то мы всегда можем легко оценить область
притяжения начала координат. Это утверждение иллюстрируется следующим
примером.
Пример 8.9. Система второго порядка
XI=
- Х2,
#2=#1+(х\ -1)Х2
рассматривалась в примере 8.5. Было показано, что начало координат является
асимптотически устойчивым, т. к. матрица
"0
-1
1-1
А=
д
-1
дх 1ж=0
является гурвицевой. Функция Ляпунова для исследуемой системы может быть
найдена как решение Ρ уравнения Ляпунова при Q = I:
РА+А
Т
Р=
-I.
Единственным решением этого уравнения является положительно определенная
матрица
1.5
- 0.5
-0.5
1
Квадратичная функция V(x) = x
T
Px является в некоторой окрестности нача
ла координат функцией Ляпунова для рассматриваемой системы. Поскольку нас
интересует оценка области притяжения, необходимо определить содержащую на
чало координат открытую область D, такую что в этой области производная V(x)
отрицательно определена, а также константу с > 0 такую, что множество Ω0 =
= {V(x) ^ с} является подмножеством D. Мы заинтересованы в том, чтобы мно
жество Ω0 было максимально большим, что означает необходимость определения
максимального значения константы с. Заметим, что нам не следует доказывать
положительную определенность V(x) в £), поскольку V(x) положительно опре
делена для всех х. Более того, V(x) радиально неограниченна и, следовательно,
Ω0 ограничено для любой с > 0. Производная функции V(x) вдоль траекторий
системы определяется равенством
V(x) = -{х\ + х\) - {х\х2 - Zxixl)-
Правая часть выражения для V(x) представляет собой сумму двух членов. Пер
вый член — \\х\\\ представляет собой вклад линейной части Ах9 а второй — вклад
нелинейного члена g(x) = f(x) — Ах. Поскольку
8.2. ОБЛАСТЬ ПРИТЯЖЕНИЯ
339
существует открытый шар D = {х G R2 | \\х\\2 < г}, такой что V(x) отрицатель
но определена в D. Если этот шар будет найден, множество i]ccD может быть
определено неравенством
с< min V(x) = Amin(P)r
2
.
IWl2=r
Таким образом, для того чтобы максимально увеличить оценку области притяже
ния, нам необходимо найти наибольший шар, в котором функция V(x) является
отрицательно определенной. С учетом неравенств \х\\ < ||ж||2> |#i#2| ^ IMIi/2
и \х\ — 2x<i\ < л/5||ж||2 можно показать, что
V{x) ^ -||х||| + |xi| |xix2| \Xl - 2х2\ < -\\xg +
^\\х\Ц
Тогда V(x) отрицательно определена в шаре D с радиусом г
2
= 2/\/5 = 0.8944.
В этом примере анализа системы второго порядка можно получить менее кон
сервативную оценку множества Ω0, если искомый шар D определить в полярных
координатах. Полагая
х\ = pcos#, Х2 = psin#,
получаем
V=-р
2
+р
4
cos
2
θsin0(2sinθ- cosθ) ^
<-ρ
2
+ρ
4
1 cos
2
θsinθ\·|2sinθ- cos0| <
^-p
2
+p
4
x 0.3849 x 2.2361 ^
^V + 0.861p4
<0 при
P2
<Q^I'
Используя этот результат, а также неравенство Amin(P) ^ 0.69, получаем иско
мую величину
с
=
0
-
8<
(шИ·
801
·
Множество Ωβ при с = 0.8 может быть выбрано в качестве оценки области при
тяжения. Менее консервативная оценка (т.е. большее множество) может быть
получена с использованием графиков для V(x) = 0 и V(x) = с, где констан
та с увеличивается до тех пор, пока не будет получено максимальное значение с,
для которого кривая V(x) = с содержится в {V(x) < 0}. Эта процедура пока
зана на рисунке 8.4(a), из которого определено максимальное значение с = 2.25.
Рисунок 8.4(b) представляет собой сравнение полученной выше оценки с обла
стью притяжения, границей которой является предельный цикл.
Δ
Оценка области притяжения множеством Ω0 = {V(x) ^ с} является про
стым, но часто слишком консервативным решением. Согласно теореме Ла-Салля
(теорема 4.4), мы можем работать с любым компактным множеством Ω С D,
если покажем, что оно является положительно инвариантным. Для этого обычно
требуется исследовать векторное поле системы на границе множества Ω и по
казать, что траектории, начинающиеся в Ω, не могут покинуть это множество.
Следующий пример иллюстрирует вышеизложенную идею.
340
ГЛАВА 8
2
1
о
-1
-2
1г
//
/\
/
/
/
/
"~
^ч
1)
УУХх
1
1
-1О
3
2
1
о
-1
-2
-3
ъ
/7^
-2
(а)
О
(Ь)
Рис. 8.4. (а) Кривые V(x) = 0 (пунктир), V(x) = 0.8 (пунктир с точкой) и V(x) = 2.25
(непрерывная линия) в примере 8.9; (Ь) сравнение области притяжения с ее оценкой
Пример 8.10. Рассмотрим систему
XI=Х2,
±2= -4(xi+Х2)-h(xi +Х2),
где h : R —> Д — локально липшицева фикция, удовлетворяющая условию
Л(0) = 0; uft(u) ^0, V|u| ^ 1.
Рассмотрим квадратичную функцию
V(x)=х
т
21
11
X=2х\ +2X1X2+#2
в качестве функции Ляпунова
14
. Производная V(x) определяется соотношениями
V(x) = (4xi + 2x2)xi + 2(xi + Х2)х2 =
= -2х\ -6(xi+х2)
2
-
2(xi + x2)h(xi + х2) ^
<-2x1 -6(xi+х2)
2
V|xi+х2|<1.
Поэтому
V(x) < -х
1
8б
б6
х Vxi,X2:|xi+X2I<1.
Таким образом, V(x) отрицательно определена в множестве
G={xeR
2
||xi+x2|<1},
14
Эта функция Ляпунова может быть получена с использованием метода переменного градиента
или кругового критерия и леммы Калмана-Якубовича-Попова.
8.2 . ОБЛАСТЬ ПРИТЯЖЕНИЯ
341
и мы можем заключить, что начало координат асимптотически устойчиво. Для
получения оценки области притяжения RA начнем анализ с рассмотрения оценки
вида Ω0 = {V(x) ^ с}. Наибольшая константа с > О, при которой Ctc с G,
определяется равенством
τ
1
с=
min хРх=—
—
=1,
|яя+ж2|=1
ЬТР~
1
Ь
где Ь
т
= [ 1 1 ]. Таким образом, Qc при с = 1 представляет собой оценку RA-
(См. рисунок 8.5.) В этом примере мы можем получить лучшую оценку для RA,
Рис. 8.5. Оценки области притяжения в примере 8.10
не ограничиваясь рассмотрением оценок вида Ω0. Ключевым обстоятельством
при последующем анализе будет тот факт, что траектории внутри G не могут
покинуть его через определенные сегменты границы |xi +X2I = 1. В этом можно
убедиться, если исследовать векторное поле на границе или с использованием
следующего анализа. Положим
σ= х\ +Х2-
Тогда граница G определяется равенствами σ = 1 и σ = -1. Производная σ
2
вдоль траекторий системы удовлетворяет оценке
j-σ
2
= 2a(xi +х2) =2ах2 - 8σ2
-
2σΛ(σ) ^ 2ах2 - 8σ2
, V|σ|^1,
и на границе σ = 1 выполнено неравенство
4~σ
2
< 2ж2-8^ 0, Va;2<4.
at
Из этого следует, что, когда траектория проходит через какую-либо точку с х2 ^
^ 4 на сегменте границы, она не может выйти за пределы множества G,
342
ГЛАВА 8
поскольку в этой точке функция σ
2
является неубывающей. Аналогично на гра
ницеσ= — 1
4~σ
2
^-2х2-8^0,\/х2>-4,
at
и, следовательно, траектория не может покинуть множество G через сегмент гра
ницы σ = — 1 через точки с Х2 ^ —4. Эта информация может быть использована
для определения замкнутого, ограниченного, положительно инвариантного мно
жества Ω, удовлетворяющего условиям теоремы 4.4. Для того чтобы сделать мно
жество Ω замкнутым, нам необходимо определить в дополнение к полученным
выше двум сегментам его границы еще два сегмента. Эти сегменты также долж
ны обладать тем свойством, что траектории системы не могут покинуть через
них множество Ω. В качестве этих сегментов мы возьмем сегменты поверхности
Ляпунова. Поверхность Ляпунова V(x) = с\ пересекает границу х\ + Х2 = 1
при Х2 = 4 в точке (—3,4). (См. рисунок 8.5.) Поверхность Ляпунова V(x) — С2
пересекает границу х\ + х2 = — 1 при Х2 = — 4 в точке (3, —4). Искомая поверх
ность Ляпунова имеет вид V(x) = min{ci,C2}. Константы с\ и с2 определяются
равенствами
ci = n*)U=_3,*2=4 = Ю, с2 = Пх)|Ж1=3,Ж2=_4 = Ю-
Поэтому мы можем положить с = 10, что окончательно определит множество Ω:
Ω={xeR
2
|V{x) ^10и\хх+х2\<1}·
Это множество замкнуто, ограничено и положительно инвариантно. Более то
го, V(x) отрицательно определена в Ω, поскольку Ω С G. Таким образом, все
условия теоремы 4.4. выполнены, и мы можем заключить, что все траектории,
начинающиеся в Ω, стремятся к началу координат при t —> оо, т. е. Ω С RA- Δ
8.3. Теоремы инвариантности
В случае автономных систем из теоремы Ла-Салля об инвариантности (тео
рема 4.4) следует, что траектория системы стремится к наибольшему инвариант
ному множеству в Е, где Ε — множество всех точек в Ω, в которых V(x) = 0.
В случае неавтономных систем задача определения множества Ε может оказать
ся непростой, поскольку V(t,x) является функцией не только от х, но и от t.
Ситуация упрощается, если можно показать, что
V(t,x) <-W(a;)<0,
т. к. в этом случае в качестве множества Ε можно взять множество точек, удо
влетворяющих равенству W(x) — 0. Можно ожидать, что траектории системы
будут стремиться к Ε при t —> сю. Эта идея представляет собой суть ниже
следующей теоремы, но прежде чем она будет сформулирована, мы представим
лемму, которая будет использоваться при доказательстве этой теоремы. Лемма
представляет собой результат, который интересен сам по себе и известен как
лемма Барбалата.
8.3 . ТЕОРЕМЫ ИНВАРИАНТНОСТИ
343
Лемма 8.2. Пусть φ : R—> R —равномерно непрерывная функция на [О, оо).
Предположим, что интеграл lim^oo /0 ф{т) dr существует и конечен. Тогда
ф{Ь)—>0приt—оо.
ДОКАЗАТЕЛЬСТВО. ЕСЛИ утверждение леммы неверно, то существует поло
жительная константа fci, такая что для любого Τ > О можно найти Т\ ^ Т,
удовлетворяющий неравенству |0(Ti)| ^ k\. Поскольку ф{{) равномерно непре
рывна, существует положительная константа к2, такая что |</>(£+т) — ф(Ь)\ < fci/2
длявсехt ^0и0^ г ^fc2·Следовательно,
10(*)1 = 1^(*) - 0(^1) + 0(Ti)| >
>\ФШ-Ш-ФШ>
>h-b1
= b1, vte[TuT1 + k2].
Поэтому
2
/Α+«2
I
ЛП+«2
/
4>{t)db\ = /
\<l>(t)\dt> \kihb.
JT^
JTI
Z
/TI
I JTi
В представленном выше выражении равенство выполняется вследствие того, что
</>(£) сохраняет знак при Т\ ^ t ^ Т\ + к2. Таким образом, /0 </>(т) dr не может
иметь конечный предел при t —• оо, что противоречит сделанному предположе
нию.
Π
Теорема 8.4. Пусть D С Rn
—
открытая область, содержащая х = О,
и f(t,x) — функция, являющаяся кусочно-непрерывной по t и локально липши-
цевой по х равномерно по t на [0, оо) х D. Предположим также, что /(£, 0)
равномерно ограничена для всех t ^ 0. Пусть V : [0, оо) х D —» R — непрерывно
дифференцируемая функция, такая что
W1(x)^V(t,x)^W2(x),
для всех t ^ 0 и всех х 6 D, где W\(x) и W2(x) — непрерывные положи
тельно определенные функции и W(x) — непрерывная положительно полуопре
деленная функция на D. Выберем г > 0 так, чтобы Вг С D, и положим
ρ < min\\x\\=rWi(x). Тогда все решения уравнения х = f(t,x) с начальными
данными x(to) £ {х £ Br\W2{x) ^ р} ограничены и удовлетворяют
W(x(t)) -* 0 при t -> оо.
Кроме того, если все условия выполнены глобально и W\(x) радиалъно неограни
ченна, то утверждение теоремы выполнено для всех x(to) £ Rn
.
344
ГЛАВА 8
ДОКАЗАТЕЛЬСТВО. Аналогично тому, как это было сделано при доказатель
стве теоремы 4.8, можно показать, что
x(t0) e{xe Br\w2(x) ^P}=> x(t) e nt,P С{ХЕ Br|Wi(a) ^ p}, vt ^ t0,
поскольку V(t, х) ^ 0. Следовательно, ||ж(£)|| < τ для всех t > to. Так как
V(t,x(t)) является монотонно неубывающей и отделенной снизу от нуля функ
цией, она сходится при t —> оо. Далее,
/ W(x(r))dr^-
[ V(r,x(r))dr = V(to,x(t0))
-V(t,x(t)).
Jt0
Jto
Поэтому Нт^^оо ft W(X(T)) dr существует и конечен. Поскольку x(t) ограниче
на, x(t) = f{t,x(t)) ограничена равномерно по t для всех t ^ to. Следователь
но, x{t) равномерно непрерывна по t на [to,oo). Тогда W(x(t)) является равно
мерно непрерывной по t на [to,oo)9 т.к. W(x) равномерно непрерывна по х на
компактном множестве Вг. Используя лемму 8.2, заключаем, что W(x(t)) —> 0
при t —> оо. Если все предположения выполнены глобально и W\{x) радиально
неограниченна, то для любой x(to) можно найти достаточно большую констан
ту р, такую что x{to) Ε {х Ε Rn\W2(x) ^ ρ}.
•
Из W(x(t)) —> 0 следует, что x(t) стремится к Ε при t —» оо, где
Ε={хΕD|W(x) =0}.
Поэтому положительно предельным множеством для x{t) является подмноже
ство множества Е. Результат о стремлении x(t) к множеству Ε представляет
ся более слабым по сравнению с принципом инвариантности для автономных
систем, согласно которому x(t) стремится к наибольшему инвариантному мно
жеству в Е. Наличие более сильного утверждения для случая автономных си
стем обусловлено тем, что эти системы обладают свойством, сформулированным
в лемме 4.1 и заключающимся в том, что положительно предельное множество
является инвариантным множеством. Существуют классы неавтономных систем,
для которых положительно предельные множества обладают в некотором смыс
ле свойством инвариантности
15
. Однако для неавтономной системы общего вида
положительно предельное множество, вообще говоря, не является инвариант
ным. В случае автономной системы стремление траектории x(t) к наибольше
му инвариантному множеству в Ε позволило доказать следствие 4.1, в котором
асимптотическая устойчивость начала координат была установлена на основа
нии того, что множество Ε не содержит целой траектории системы, отличной от
тривиального решения. Однако для случая неавтономных систем не существу
ет обобщения следствия 4.1, из которого бы следовала равномерная асимптоти
ческая устойчивость. Тем не менее в следующей теореме устанавливается это
15
В качестве примера таких систем можно указать периодические системы, почти-периодиче
ские системы и асимптотически автономные системы. Теоремы инвариантности для этих классов
систем приведены в работе [154, глава 8]. Другое обобщение принципа инвариантности рассмот
рено в работе [136].
8.3 . ТЕОРЕМЫ ИНВАРИАНТНОСТИ
345
свойство, если в дополнение к выполнению условия V(t, х) ^ 0 можно показать,
что функция V убывает на интервале [t, t + δ].
]6
Теорема 8.5. Пусть D С Rn
—
открытая область, содержащая х — 0.
Предположим, что f(t,x) — кусочно-непрерывная по t и локально липшицева
похдлявсехt^0функцияихΕD.Пустьх=0—точкаравновесиядлях=
= f(t,x) при t = 0. Пусть V : [0, оо) х D —> R — непрерывно дифференцируемая
функция, такая что
W1(x)^V(t,x)^W2(x),
V(t + δ,фЦ+δ]t,x)) - V(t,x) < -W(t, x), 0 < λ < 1,17
Vt ^ 0,Vor Ε D при некоторой δ > 0, где W\[x) и W2(x) — непрерывные поло
жительно определенные функции на D и </>(т; £, х) —решение системы, начинаю
щееся в (£,ж). Тогда начало координат равномерно асимптотически устойчиво.
Если все условия выполнены глобально и W\(x) радиально неограниченна, то
начало координат глобально равномерно асимптотически устойчиво. Если
^i(*)^fci|N|c
,
W2(x)^k2\\x\\
c
,
fci>0, fc2>0, ο 0,
то начало координат экспоненциально устойчиво.
ДОКАЗАТЕЛЬСТВО. Выберем г > 0 так, чтобы Br Ε D. Аналогично тому,
как это было сделано при доказательстве теоремы 4.8, можно показать, что
x(t0) Ε {х Ε Br I W2(x) ^p}=^
x(t) Ε Ω4>ρ, Vi ^ to,
где ρ < ттцжц=г VKi(x), поскольку V^t, ж) ^ 0. Далее, для всех t ^ to имеем
V(t + 5,x(i + δ)) ^ ν(*, s(f)) - XV(t,x(t)) = (1 - λ)У(t,x(t)).
Более того, из V(£, x) ^ 0 следует, что
V(r,x(r))^V(t,x(t)),
VrE[t,£ + 5].
16
В работе [1] показано, что равномерная асимптотическая устойчивость может быть установ
лена в условиях, когда вместо неравенства V ^ 0 выполнено
V(t+δ,ф(Ь+*;t,*))- V(i,ж)< -7(INI)
для некоторой /С-функции 7.
17
Не умаляя общности, можно предположить, что λ < 1. Тогда, если это неравенство выполнено
при Ai ^ 1, то оно также выполнено при любой положительной константе λ < 1, т. к. — AiV ^
—XV. Заметим, однако, что это неравенство не может быть выполнено при λ> 1, т.к. V(t,x)>0,
Vs^O.
346
ГЛАВА 8
Для всех t^ to выберем наименьшее положительное число N так, чтобы t < io+
+ Νδ. Разделим интервал [to, to + {Ν — 1)δ] на Ν — 1 равных отрезков длины δ.
Тогда
V(t,x(t)) < V(t0 + (N- l)i,s(*o + (N- Щ) <
^ (1- X)V(t0 +(N- 2)<5,x(t0 +(N- 2)δ))<
(i _ λ)('-
{°)/ν(<0,
-β-*<*-*»)ν(*ο,«(«θ)),
<^4л)(1-А)(*-*°>/М«о,х(*й))
(1-λ)
где
Полагая
b= iln
5 (1-λ)'
можно показать, что функция σ(τ·, θ) принадлежит классу КС и функция
V(i,x(t)) удовлетворяет
V(t,x(t)) < *(^(*о,*(*о)),*-*о), Vy(t0,x(*o)) e [0,р].
Далее доказательство может быть проведено аналогично тому, как это было сде
лано в теореме 4.9. Доказательство утверждений про глобальную равномерную
асимптотическую устойчивость и экспоненциальную устойчивость может быть
выполнено аналогично тому, как это было сделано в теоремах 4.9 и 4Л0.
D
Пример 8.11. Рассмотрим, линейную зависящую от времени систему
х = A(t)x,
где A(t) — непрерывная по t ^ 0 матрица. Предположим, что существует непре
рывно дифференцируемая симметричная матица P(t)9 удовлетворяющая нера
венству
0<ciI^P(t)
<C2/, V*^0,
и дифференциальному уравнению
-P(t) = P(t)A(t) + A
T
(t)P(t) + C
T
(t)C{t),
где C(t) — непрерывная по t. Производная квадратичной функции
V(t,x) = x
T
P(t)x
вдоль траекторий системы удовлетворяет оценке
V(t,x) = -x
T
CT(t)C(t)x
<0.
8.3 . ТЕОРЕМЫ ИНВАРИАНТНОСТИ
347
Решение линейной системы имеет вид ф{т%х) = Ф(т,£)х, где Ф(т,£) — переход
ная матрица состояния. Поэтому
rt+δ
V(t +δ,ф(г+ δ;t,x)) - V{t, x)=
V(T, ф{т\ t, x))dr =
rt+δ
=-х
т
/ Фт(т, *)Ст(т)С(т)Ф(т, t)drx =
=-x
T
W(t,t
+ 6)x,
г
Де
ft+s
W(t,t+S)=
Фт(т, *)Ст(т)С(т)Ф(т, t)dr.
Предположим, что существует положительная константа к < с2, такая что
W(t,t + S) ^kl, W^O.
Тогда
V(t + 5, ф(г + 5; t,я)) - ^(t, x) < -fc||x||| ^ -^ V(t,я).
Таким образом, все предположения теоремы 8.5 выполнены глобально при
\¥г(х) = Ci\\x\\l i = l,2, λ = ^<1,
и мы можем заключить, что начало координат глобально экспоненциально устой
чиво. Читатели, знакомые с линейной теорией, могут заметить, что матрица
W(t,t + δ) является матрицей наблюдаемости пары (A(t),C(t)) и что неравен
ство W(t,t + δ) > kl следует из равномерной наблюдаемости (A(t), C(t)). При
сравнении этого примера с примером 4.21 можно заметить, что теорема 8.5 поз
воляет заменить требование положительной определенности матрицы Q(t) (4.28)
на более слабое требование Q(t) = C
T
(t)C(t) при условии, что пара (Л(£), C(i))
является равномерно наблюдаемой.
Δ
Теоремы 8.4 и 8.5, а также их приложения к линейным системам, например
как в примере 8.11, часто используются при анализе адаптивных систем управ
ления
18
.
В качестве иллюстрирующего примера мы рассмотрим адаптивную си
стему управления из параграфа 1.2.6.
Пример 8.12. В параграфе 1.2.6 мы видели, что уравнения замкнутой адап
тивной системы управления для объекта управления ур = арур + кри с эталонной
моделью уш — amym + kmr имеют следующий вид:
е0 = ате0 + крфгг(Ь) + крф2[е0 + ym(t)],
Ф\=
-je0r(t),
ф2 = -че0[е0 + ym(t)],
См., например, работы [87] и [168].
348
ГЛАВА 8
где 7 > 0 — коэффициент усиления адаптивной системы, е0 = ур—ут — выходная
ошибка и ф\, 02 — параметрические ошибки. Предполагается, что кр > О и, разу
меется, для эталонной модели выполнено ат < 0. Далее мы будем предполагать,
что функция r(t) является кусочно-непрерывной и ограниченной. Используя
г1
+кФ\+Ф1)\
V
τ
ψ-el < 0.
в качестве функции Ляпунова, получаем
^=1Ге
о+
е
о(Ф\Г + 02бо + 02Ут) - <^ie0r - 02βο(βο + ут)
Кр
П/р
Применяя терему 8.4, заключаем, что для любой с > 0 и для всех начальных
состояний из множества {V ^ с} все переменные состояния ограничены при
всех t ^ to, при этом lim^oo e0(t) = 0. Из этого следует, что выход системы
управления ур отслеживает желаемый выход эталонной модели ут, однако мы
ничего не можем сказать о сходимости параметрических ошибок 0i и 02 к нулю.
В действительности они могут не сходиться к нулю. Например, если г и ут —
ненулевые постоянные сигналы, то замкнутая система будет иметь подпростран
ство состояний равновесия {е0 = 0,02 = (am/fcm)0i} и, следовательно, в общем
случае ф\ и 02 не сходятся к нулю. Для того чтобы получить условия сходимости
01 и 02 к нулю, применим теорему 8.5 и докажем равномерную асимптотическую
устойчивость начала координат (е0 = 0, ф\ = 0,02 = 0). Поскольку мы уже пока
зали, что все состояния ограничены, мы можем представить замкнутую систему
в виде линейной, зависящей от времени системы:
kpr{t) kpyp(t) ]
х=
-7
r
W
0
0
ж, где ж=
L-7Ур(*) 0 0 J
L<t>2J
Предположим, что эталонный сигнал r(i) имеет устойчивое значение rss(£), т.е.
hmt^oo[r(t) - rss(t)} = 0. Тогда ]imt-+oo[ym(t) - yss(t)] = 0, где yss(t) - устой
чивый выход эталонной модели. Из существования этих, пределов, а также из
Ншг-юо e0(t) = 0 следует, что линейная система может быть представлена в сле
дующем виде:
х = [A(t) + B(t)]x,
и
lim B(t) 0.
где
«ЧТО
A(t) =
-
7rss(t)
0
0
L -71/esW
0
0
Если мы покажем, что начало координат системы х = A(t)x равномерно асимп
тотически устойчиво, мы сможем использовать свойство limt->ooB(i) = 0 и до
казать равномерную асимптотическую устойчивость начала координат системы
х = [A(i) + B(t)]x.
19
Поэтому мы сконцентрируем наше внимание на анализе
См. пример 9.6.
8.4. УСТОЙЧИВОСТЬ ПЕРИОДИЧЕСКИХ РЕШЕНИЙ
349
системы х = A(t)x. Используя V в качестве функции Ляпунова, получаем
γ=ψβ1 = -хтС
т
Сх,
где C = J—^[1
0 0].
fbp
Ι/
Кр
В примере 8.12 было показано, что начало координат равномерно асимптотиче
ски устойчиво, если пара {A(t), С) равномерно наблюдаема. Равномерная наблю
даемость (A(t), С) эквивалентна равномерной наблюдаемости (A(t) — K(t)C, С)
для любой кусочно-непрерывной, ограниченной матрицы K(t).
20
Положим
к
$) = VТГ7Г"[
а
TM -^«(t) -7»вв(*) ]Т
5
что упрощает исследуемую пару:
A{i)-K(t)C= 0
0
О
0
0
О
С
=\Я?[1
°
0]
·
Проведя анализ наблюдаемости этой пары для заданного эталонного сигнала,
мы сможем ответить на вопрос о выполнении условий теоремы 8.5. Например,
если г — ненулевой постоянный сигнал, можно легко показать, что эта пара не яв
ляется наблюдаемой. В этом нет ничего удивительного, поскольку в этом случае,
как было показано ранее, начало координат не является равномерно асимптоти
чески устойчивым. С другой стороны, если r(t) = a smut с положительными
константами α и ω, то rss(t) = r(t) и yss(t) = aMsin(ujt + δ), где М и δ опре
деляются передаточной функцией эталонной модели. Легко показать, что в этом
случае пара является равномерно наблюдаемой и, следовательно, начало коорди
нат (е0 = 0, ф\ = 0,02 = 0) является равномерно асимптотически устойчивым;
при этом параметрические ошибки </>i(i) и fait) стремятся к нулю при t —> оо
21
.
Δ
8.4. Устойчивость периодических решений
В главе 4 была разработана теория устойчивости точек равновесия. В этом
параграфе мы рассмотрим соответствующую проблему для периодических ре
шений. Пусть функция u{t) является периодическим решением системы
x = f(t,x).
(8.14)
20
См. [87, лемма 4.8.1].
21
В этом случае эталонный сигнал r(t) == α sin ut является сигналом с постоянным возбуж
дением. Постоянный сигнал не является сигналом с постоянным возбуждением. Постоянное воз
буждение сигнала более детально рассматривается в работах [5], [15], [87], [139], [168], а также
в параграфе 13.4 второго издания этой книги.
350
ГЛАВА 8
Что можно сказать о решениях, начинающихся произвольно близко от u(t)? Бу
дут ли они оставаться в окрестности u(t) для всех t или даже стремиться к u(t)l
Эти свойства устойчивости периодического решения u(t) могут быть охаракте
ризованы и исследованы с помощью методов Ляпунова. Пусть
у=х - u(t),
что делает начало координат у = 0 точкой равновесия неавтономной системы
V = f(t,V + u(t))-f(tMt)).
(8.15)
Поведение решений системы (8.14) вблизи u(t) эквивалентно поведению реше
ний системы (8.15) вблизи у = 0. Поэтому мы можем охарактеризовать свойства
устойчивости u(t), исследовав свойства устойчивости точки равновесия у = 0.
В частности, мы будем говорить, что периодическое решение u(t) равномерно
асимптотически устойчиво, если у — 0 является равномерно асимптотически
устойчивой точкой равновесия системы (8.15). Аналогичные заключения можно
сделать и в отношении других свойств устойчивости, например о равномерной
устойчивости. Таким образом, исследование устойчивости решения u(t) сводит
ся к рассмотренной в главе 4 задаче исследования свойств устойчивости точ
ки равновесия неавтономной системы. Понятие равномерной асимптотической
устойчивости периодических решений в смысле Ляпунова окажется весьма по
лезным при исследовании неавтономных систем, зависящих от малых парамет
ров (см. главу 10). Однако это понятие является достаточно ограничительным
при анализе периодических решений автономных систем. Это утверждение под
тверждается следующим примером.
Пример 8.13. Рассмотрим систему второго порядка
\l-x\-xlf
Х\—Х\
Х2=%2
Х\IХо
{l-x\-xlf
-
Х2[1+(1-;
+Х1[1+(1-;
2\21
которая может быть представлена в полярных координатах
xi=гcosθ, X2=rsinθ
с использованием замены переменных
(1- г
2
)3
•*й
4?Ъ
г=
,
0=1+(1-гУ.
Решение, начинающееся в (го,#о)> определяется равенством
1/2
r{t)= . _
,
1
Vl + 4i(l-r$2_
e(t) = e0 + t + \ln[l + 4t(l-rl)2}.
8.4. УСТОЙЧИВОСТЬ ПЕРИОДИЧЕСКИХ РЕШЕНИЙ
351
Из этих равенств видно, что система имеет периодическое решение
~х\ (t) = cost, £2 СО = sini.
Соответствующей периодической орбитой является единичная окружность τ —
—
1. Все начинающиеся вблизи нее решения спирально стремятся к этой пе
риодической орбите при t —• 00. Спиральная сходимость является, очевидно,
разновидностью поведения асимптотически устойчивой системы, и этого сле
довало ожидать при наличии в системе периодической орбиты. Периодическая
орбита известна в классической литературе как устойчивый предельный цикл.
Однако периодическое решение x(t) не является равномерно асимптотически
устойчивым в смысле Ляпунова. Напомним, что для равномерной асимптотиче
ской устойчивости решения необходимо, чтобы
[r(t) cos0(t) - cost]
2
+ [r(t) sin0(t) - sint]2
^Оприt-•00
при достаточно малой величине [VQ COS ΘΟ — I]2
+ fro
s
in #o]
2
-
Поскольку r(t) —» 1
при t —> 00, должно быть справедливо условие
|1—cos(0(t)—t)\—»O при t —» 00,
что, очевидно, не выполнено при го φ 1, т. к. (0(t) — t) является монотонно
возрастающей функцией от t.
Δ
Вышеприведенное утверждение, иллюстрируемое этим примером, справед
ливо и в более общей ситуации. Например, нетривиальное периодическое реше
ние автономной системы может никогда не быть асимптотически устойчивым
в смысле Ляпунова
22
.
Свойства устойчивости периодической орбиты из примера 8.13 могут быть
установлены, если обобщить понятие устойчивости в смысле Ляпунова для точ
ки равновесия на аналогичное понятие для инвариантного множества. Рассмот
рим автономную систему
х=Л*),
(8.16)
где/ :D—>R
n
—
непрерывно дифференцируемое отображение из области
DСRr
вR
n
.
Пусть Μ С D — замкнутое инвариантное множество для (8.16).
Определим ε-окрестность множества Μ равенством
υε = {х € Rn\ dist(s,M) <ε},
где dist(x, Μ) — минимальное расстояние от х до точек из М, т. е.
dist(x,Μ) = inf ||x —2/||.
уем
Определение 8.1. Замкнутое инвариантное множество Μ системы (8.16)
является
Доказательство этого утверждения приведено в работе [72, теорема 81.1].
352
ГЛАВА 8
• устойчивым, если для любой ε > О существует δ > О, такая что
х(0) eU6=> x(t) е U£, V* ^ О;
• асимптотически устойчивым, если оно устойчиво и константа δ может
быть выбрана таким образом, что
х(0) eU6=> lim dist(x(t),M) = О.
Это определение сводится к определению 4.1, если Μ представляет собой
точку равновесия. Теория устойчивости Ляпунова для точек равновесия, пред
ставленная в главе 4, может быть обобщена на случай инвариантных множеств
23
.
Например, следуя доказательству теоремы 4.1, можно убедиться в том, что ес
ли существует функция V(x)9 равная нулю на Μ и положительная в некоторой
окрестности D множества М, исключая само М, и если производная V(x) —
= [dV/dx]f(x) < 0 в D, то Μ устойчиво. Более того, если V(x) отрицательна
в D, исключая М, то множество Μ асимптотически устойчиво.
Устойчивость и асимптотическая устойчивость инвариантных множеств —
это концепции, представляющие самостоятельный интерес. Мы применяем их
в этом параграфе для анализа специфического случая, когда в качестве инвари
антного множества выступает замкнутая орбита, соответствующая периодиче
скому решению. Пусть u{t) — нетривиальное периодическое решение автоном
ной системы (8.16) с периодом Т, и пусть η — замкнутая орбита, определенная
равенством
7={хеR
n
|х=u(t),0<t<Τ}.
Периодическая орбита представляет собой образ u(t) в пространстве состояний.
Она является инвариантным множеством, свойства устойчивости которого даны
в определении 8.1. Общепринято, особенно в контексте систем второго поряд
ка, называть асимптотически устойчивые периодические орбиты устойчивыми
предельными циклами.
Пример 8.14. Гармонический осциллятор
±1 = аг2,
±2=
-X I,
имеет континуум периодических орбит, представляющих собой концентрические
окружности с центром в начале координат. Каждая из этих периодических орбит
устойчива. Рассмотрим, например, периодическую орбиту 7с? определенную ра
венством
jc={хеR
2
\г=О 0}, где г=Jx\ +х\.
23
Этот вопрос всесторонне исследован в работах [213] и [221]; в [118] приведены некоторые
интересные результаты, касающиеся соответствующих обратных теорем Ляпунова.
8.4. УСТОЙЧИВОСТЬ ПЕРИОДИЧЕСКИХ РЕШЕНИЙ
353
Окрестность Ue периодической орбиты 7с представляет собой кольцевую область
Ue={хеВ
2
|с-ε<г<с+ε}.
Эта кольцевая область является инвариантным множеством. Таким образом, для
заданной константы ε > 0 мы можем положить δ = ε и показать, что любое
решение, начинающееся при t = О в окрестности Us, останется в U£ при всех
t ^ 0. Следовательно, периодическая орбита 7с устойчива. Однако она не явля
ется асимптотически устойчивой, поскольку решение, начинающееся в окрест
ности Us периодической орбиты 7с? не стремится при t —> оо к 7с и это свойство
имеет место при сколь угодно малой константе δ. Устойчивость периодической
орбиты {г = с} может быть доказана с использованием функции Ляпунова
V(x) = (r
2
-c
2
)2
=(x
2
1+
xl-c
2
)2
,
производная которой вдоль траекторий системы определяется равенством
V{x) = 4(r
2
-
с
2
)тт=0.
Δ
Пример 8.15. Рассмотрим систему из примера 8.13. Она имеет изолиро
ванную периодическую орбиту
7={х£R2|г=1}, где г=Jx\ +х\.
Прих07имеем
dist(x,7) = inf ||ж - г/||2 = inf л/{хг - yi)2
+(х2-Ы
2
= \г- 1|.
С учетом того что
,1/2
T(t) =
1
1-
Vl + 4*(l-rg)2.
можно легко показать, что условия устойчивости на языке ε — δ выполнены и
dist(x(£),7) —* 0 при t —• оо.
Следовательно, периодическая орбита асимптотически устойчива. Тот же вывод
можно сделать с использованием функции Ляпунова
V(x) = {r
2
-l? ={x\+
xl-l?,
производная которой вдоль траекторий системы имеет вид
V(x) = 4(г
2
-
1)гг = -4(г
2
-
I)4
<0при гф\.
Δ
Определив свойства устойчивости периодических орбит, мы можем опреде
лить свойства устойчивости периодических решений.
354
ГЛАВА 8
Определение 8.2. Нетривиальное периодическое решение u(t) систе
мы (8.16) является
• орбитально устойчивым, если замкнутая орбита η, соответствующая
u(t), устойчива.
• асимптотически орбитально устойчивым, если замкнутая орбита η, соот
ветствующая u(t), асимптотически устойчива.
Заметим, что в литературе используется различная терминология, в зависи
мости от того, говорится о периодическом решении или же о соответствующей
ему периодической орбите. В примере 8.15 мы говорили, что единичная окруж
ность является асимптотически устойчивой периодической орбитой, а периоди
ческое решение (cos £, sin t) называли орбитально асимптотически устойчивым.
8.5. Упражнения
8.1. Докажите следствие 8.1.
8.2. Докажите следствие 8.2.
8.3. Предположим, что условия теоремы 8.1 выполнены для случая, когда
<7i(y>0) — 0? <72(у>0) = 0 и А\ — 0. Покажите, что начало координат всей систе
мы устойчиво.
8.4. Рассмотрим пример 8.1 при α = 0. Покажите, что начало координат устой
чиво.
8.5 ([88]). Рассмотрим систему
х
а—
Ja\
x
ai
x
b)y
ХЬ=AbXb+
fb(xa,Xb)i
где dim(xa) = rci, dim(a;&) = П2, Ab гурвицева, /a и fb непрерывно дифферен
цируемы, [д/ь/дхь](0,0) = 0 и /ь(#а,0) = 0 в окрестности ха = 0.
(a) Покажите, что если ха = 0 — экспоненциально устойчивая точка равновесия
системы ха = /a(^a?0)>
т
° (ха,
х
ь)
=
(0? 0) ~~ экспоненциально устойчивая
точка равновесия всей системы;
(b) Покажите, что если ха = 0 — асимптотически (но не экспоненциально)
устойчивая точка равновесия системы ха — /а(жа,0), то (жа»#ь) = (0)0) —
асимптотически устойчивая точка равновесия всей системы.
8.6 ([70]). Для каждой из следующих систем исследуйте устойчивость начала
координат с использованием теоремы о центральном многообразии:
(1)xi=
- х\,
х
2= —Х2+
х
\+
х
\х2\
(2) х\=ах\-х\,
аф0,
х
2= —Х2+
х
\+
х
\х2\
8.5. УПРАЖНЕНИЯ
355
(3) Xi = -Х2 ~l· XlX3,
%2 = Xl +#2^3>
xz = -x3-(zi+x2) + x
2
;
(4) xi = xfx2,
±2= —x\-%2]
(5) xi = xix2,
X2= —X2—x\+2xf;
(6) ±i = -Xi + X2(xi +X2- 1),
±2 = x2(xi +X2- 1);
(7) Xi=X2,
#2= —a?2+ax\/{\ +x
2
), α^0;
(8) ±i= -2xi-3x2+%3+ж§,
X2= Xl4-Х?+X2,
£3= xb
8.7 ([34]). Рассмотрим систему
xi=xix2+ax\+bxixl
x2= -x2+cx\+dx
2
x2.
Исследуйте устойчивость начала координат с использованием теоремы о цен
тральном многообразии для каждого из следующих случаев:
(1)а+с>0.
(2)а+ с<0.
(3)а+с=0 и cd+Ьс
2
<0.
(4)а+с=0 и cd+be
2
>0.
(5)a+c=cd+be
2
=0.
8.8 ([34]). Рассмотрим систему
xi=ах\+Xix2, x2= —х2+х2+xix2-xf.
Исследуйте устойчивость начала координат с использованием теоремы о цен
тральном многообразии для всех возможных случаев выбора значений веще
ственного параметра а.
8.9 ([88]). Рассмотрим систему
xi=axix2—Χ?, х2 = —х2+6xix2+ex
2
.
Исследуйте устойчивость начала координат с использованием теоремы о цен
тральном многообразии для всех возможных случаев выбора значений веще
ственных констант а, Ъ и с.
356
ГЛАВА 8
8.10 (теорема Зубова). Рассмотрим систему (8.13) и пусть G С Rn
—
откры
тая область, содержащая начало координат. Предположим, что существуют две
функцииV:G—>Rnh:R
n
— > i? со следующими свойствами:
• V непрерывно дифференцируема и положительно определена на G и удо
влетворяет
0<V(x) < 1, VxeG-{0}.
• При приближении х к границе G или при ||х|| —• оо, в случае неограничен
ного G, выполнено ИтУ(ж) = 1.
•
h непрерывна и положительно определена на R
n
.
• При х G функция V(x) удовлетворяет дифференциальному уравнению
в частных производных
2gnx) = -h(x)[l-V(x)].
(8.17)
Покажите, что точка х = 0 асимптотически устойчива и G — область притя
жения.
8.11 ([72]). Рассмотрим систему второго порядка
х\ = -hi(x{) + tofa), Х2 =
- 9i(xi),
где
/ц(0)=0, z/ii(z) >0 V- ai <z<Ьь
g<(0)=0,ед(г)>0 V- а*<z<Ъи
gi(a)da —> 00 при z —>
—a^илиz—>Ь%
для некоторых положительных констант о^Ь* (допустимо сц = оо или Ь* = оо).
Докажите, применив теорему Зубова, что областью притяжения является множе
ство{хеR
2
|—ai<Xi<bi}.
Указание: положите h(x) = gi(xi)hi(xi) и найдите решение дифференциально
го уравнения в частных производных (8.17) в виде V(x) = 1 — W\(x\)W2(x2)·
Заметим, что при указанном выборе функции h производная V(x) является от
рицательно полуопределенной. Примените принцип инвариантности Ла-Салля.
8.12. Найдите область притяжения системы
XI= -XI+Я2,
Х2 = ~ tg(xi).
Указание: используйте результаты предыдущего примера.
8.13. Пусть Ω — открытое, положительно инвариантное множество, содержащее
начало координат. Предположим, что каждая траектория в Ω стремится к началу
координат при t —• 00. Покажите, что Ω связно.
8.5 . УПРАЖНЕНИЯ
357
8.14 Рассмотрим систему второго порядка х — f(x) с асимптотически устойчи
вымначаломкоординат.ПустьV(x) =х\+х\ иD={х еR
2
\\х2\<1,\х\ —
-Х2\ < 1}. Предположим, что \dV/dx]f(x) отрицательно определена на D. Оце
ните область притяжения.
8.15. Рассмотрим систему
XI #2, #2= -Х\ —Х2—(2%2+Sl)(l- х\).
(a) Покажите, используя V(x) = 5x
2
+2xiX2+2x
2
? что начало координат асимп
тотически устойчиво.
(b) Пусть
S={хеВ
2
|V(x) <5}η{х <ЕR
2
\\х2\<1}·
Покажите, что S представляет собой оценку области притяжения.
8.16. Покажите, что начало координат системы
Х\=£2, #2= —Х2 —Х\+х\
асимптотически устойчиво, и оцените область притяжения.
8.17. Рассмотрим систему второго порядка х = /(ж) и функцию Ляпунова V(x).
Предположим, что V(x) < 0 для всех х\ + х\ ^ а
2
.
На рисунке 8.6 показаны
четыре различных направления векторного поля системы в точке на окружно
стих\+х\=а
2
.
Какие из этих направлений возможны, а какие невозможны?
Обоснуйте свои ответы.
Рис. 8.6. К упражнению 8.17
8.18. Рассмотрим систему
х\ =Х2, Х2= —%2—sinxi —2sat(#i+Ж2)·
(a) Покажите, что начало координат является единственной точкой равновесия.
(b) С использованием линеаризации системы покажите, что начало координат
асимптотически устойчиво.
358
ГЛАВА 8
(c)Пустьσ—х\ +Х2-Покажите,чтоσσ ^ —|σ|при|σ|^1.
(d) Пусть V(x) = х\ + 0.5x2 + 1 ~ cosxi. Покажите, что множество
Мс = {хΕВ2|V(s)^с}Π{хвR
2
||σ|<1},о 0
является положительно инвариантным и траектории в Мс стремятся к нача
лу координат при t —• оо.
(e) Покажите, что начало координат глобально асимптотически устойчиво.
8.19· Рассмотрим модель синхронного генератора, описанную в упражнении 1.8.
Пусть переменные состояния и параметры выбраны так, как в пунктах (а) и (Ь)
этого упражнения. Кроме того, положим г = 6.6 sec, Μ = 0.0147 (на единицу
мощности) х sec
2
/radиD/M —4sec
-1
.
(a) Найдите все точки равновесия в области —π ^ х\ ^ π и выполните анализ
свойств устойчивости каждой из найденных точек равновесия с использова
нием линеаризации системы.
(b) Оцените область притяжения каждой асимптотически устойчивой точки рав
новесия.
8.20 ([ИЗ]). Рассмотрим систему
xi=х2,
±2 = -х\ ~ g(t)x2,
где g(t) — непрерывно дифференцируемая функция и 0 < к\ < g(t) ^ к2 для
всехt^0.
(a) Покажите, что начало координат экспоненциально устойчиво.
(b) Будет ли выполнен пункт (а), если g(t) не ограничена? Рассмотрите частный
случай g(t) = 2 + exp(i).
8.21. Рассмотрим систему
х\ =Х2, ±2= - sinxi - g{t)x2,
где g{t) — непрерывно дифференцируемая функция и 0 < к\ ^ g(t) ^ А?2 для
всех t ^ 0. Покажите, что начало координат экспоненциально устойчиво.
Указание: используйте результаты предыдущего упражнения.
8.22. Рассмотрим систему
хх=-хг
-
х2 — a(t)xs,
Х2 = #ъ %з = ot(t)xi,
где a(t) = sini+ sin2£. Покажите, что начало координат экспоненциально устой
чиво.
8.23. Рассмотрим нелинейную систему с одним входом и одним выходом:
Xi=х;+1,1^г^п- 1,
Хп = /о(я) + (<9*)
T
/i(z) + #о(Ж
8.5 . УПРАЖНЕНИЯ
359
где /o,/i и до — известные гладкие функции переменной х, определенные для
всеххеR
n
и 0* G ЕР — вектор неизвестных постоянных параметров. Функ
ция до(х) отделена от нуля, т. е. |#о(#)| ^ ко > О для всех х G Rn
.
Предположим,
что все переменные состояния измеримы. Необходимо разработать адаптивную
систему управления с обратной связью по состоянию, такую что х\ асимптоти
чески отслеживает желаемый командный сигнал r(t), где функция г и ее произ
водные А
г
\ г = 1,..., п, непрерывны и ограничены для всех t ^ 0.
(а) Полажив е*
уравнению
х%—г(
г
^ ие=[ei,...,еп]
т
, покажите, что е удовлетворяет
ё=Ае+B[f0(x) +(в*)
т
Ш +д0(х)и - г<
п
>],
где (А, В) — управляемая пара.
(Ь) Определите К так, чтобы матрица А — ВК была гурвицевой и Ρ — поло
жительно определенное решение уравнения Ляпунова Р(А — ВК) + (А —
—
ВК)ТР = —I. Используя функцию Ляпунова V = е
т
Ре+ф
т
Т~
1
ф, где
φ = θ — 0* и Г — симметричная положительно определенная матрица, пока
жите, что адаптивный закон управления
и
fo{x)-e
T
h{x) + r^-Ke
9о(х) L
e = Th{x)e
T
PB
обеспечивает ограниченность всех переменных состояния и выполнение
linif^oo e(t) = 0.
(с) Пусть
" 0»х« -Bfi{K) '
A(t)
о,'рхп
0;'рхр
Is—[*ПVnXpJ,
где 1Z — [г,..., А
п1
)]т
. Покажите, что если (A(i), С) — равномерно наблю
даемая пара, то параметрическая ошибка φ стремится к нулю при t —» оо.
ГЛАВА 9
Устойчивость возмущенных систем
Рассмотрим систему
x = /(t,x)+ $(*,*),
(9.1)
где/ :[0,оо)хD—>R
n
ид:[0,оо)xD—>R
n
—
кусочно-непрерывные по £ и ло
кально липшицевы по х на [0, оо) х D функции и D С Rn
—
открытая область,
содержащая начало координат х = 0. Мы будем рассматривать эту систему как
возмущение номинальной системы
± = f{t,x).
(9.2)
Наличие члена возмущения g(t,x) может быть обусловлено ошибками в опре
делении модели, изменении со временем параметров или другими неопределен
ностями и возмущениями, которые всегда имеют место в реальных системах.
В типичной ситуации нам неизвестна функция g(t,x), однако некоторая инфор
мация о ней доступна для нас, например верхнее значение величины \\g(t,x)\\.
Здесь мы ввели возмущение в виде аддитивного члена в правой части уравне
ния состояния. Неопределенности, которые не изменяют порядок системы, все
гда могут быть представлены таким образом. В этом случае, если возмущенная
правая часть системы представлена некоторой функцией /(£,#), то, прибавляя
и вычитая /(£,ж), мы можем переписать правую часть в следующем виде:
f(t,x) = f(t,x) + [f(t,x)-f(t,x)]
и определить
g(t,x) = f(t,x)-f(t,x).
Предположим, что номинальная система (9.2) имеет равномерно асимптотически
устойчивую точку равновесия в начале координат. Что можно сказать в этом слу
чае о свойствах устойчивости возмущенной системы? Для того чтобы ответить
на этот вопрос, представляется разумным использовать функцию Ляпунова но
минальной системы для анализа возмущенной системы. Именно этот прием был
использован при анализе метода линеаризации в параграфах 4.3 и 4.6. Элемент
новизны, представленный в этой главе, заключается в том, что член возмущений
может иметь более общий вид по сравнению с членом возмущения, возникаю
щим при исследовании линеаризованной системы. Заключение, к которому мы
можем прийти в ходе нашего анализа системы, существенно зависит от ответа на
вопрос о равенстве нулю члена возмущений в начале координат. Если g(t,0) =
= 0, то возмущенная система (9.2) имеет точку равновесия в начале координат.
9.1 . ВОЗМУЩЕНИЕ, ИСЧЕЗАЮЩЕЕ В НАЧАЛЕ КООРДИНАТ
361
В этом случае мы можем выполнить анализ свойств устойчивости начала коорди
нат, рассматривая эту точку в качестве точки равновесия возмущенной системы.
Если g(t, 0) φ 0, начало координат не является точкой равновесия возмущен
ной системы. В этом случае мы можем исследовать возмущенную систему на
предмет предельной ограниченности ее решений.
Случаи, когда возмущение равно нулю и не равно нулю, исследованы соот
ветственно в параграфах 9.1 и 9.2. В параграфе 9.3 мы сконцентрируем наше вни
мание на случае, когда номинальная система имеет экспоненциально устойчивую
точку равновесия в начале координат, и используем лемму сравнения для полу
чения более определенных результатов об асимптотическом поведении решения
возмущенной системы. В параграфе 9.4 будет представлен результат о продол
жимости решения уравнения состояния на бесконечном интервале времени.
В последних двух параграфах этой главы рассматриваются взаимосвязанные
системы и медленно меняющиеся системы. В этих случаях анализ устойчивости
может быть упрощен, если рассматривать эти системы как возмущение более
простых систем. В случае взаимосвязанных систем упрощение достигается при
разложении исходной системы на не связанные друг с другом системы меньшего
порядка. Упрощение анализа медленно меняющихся систем может быть достиг
нуто, если исходная неавтономная система с медленно меняющимися входами
аппроксимируется автономной системой, в которой медленно меняющиеся вхо
ды рассматриваются как постоянные параметры.
9.1. Возмущение, исчезающее в начале координат
Начнем наше исследование со случая, когда g(t, 0) = 0. Предположим, что
х = 0 — экспоненциально устойчивая точка равновесия номинальной системы
(9.2) и пусть V(t,x) — функция Ляпунова, удовлетворяющая
ci||ar||
2
^V(t,x) <c2\\x\\
2
,
(9.3)
ж
+
^
ЖхК
"
СзМ2
'
(9
·
4)
dV
дх
<С4||х||
(9.5)
для всех (£, х) Ε [0, оо) xD и некоторых положительных констант ci, С2, сз и с±.
Существование функции Ляпунова, удовлетворяющей (9.3)-(9.5), гарантируется
теоремой 4.14 при выполнении некоторых дополнительных требований. Предпо
ложим, что член возмущений g(t, x) удовлетворяет линейному ограничению на
рост
||ff(t,a;)|| ^l\\x\\, V^0,Vze Д
(9.6)
где 7 — неотрицательная константа. Наличие такого ограничения представляет
ся естественным условием в силу принятых предположений о функции g(t,x).
В действительности любая функция g(t,x)9 которая становится равной нулю
362
ГЛАВА 9
в начале координат и является локально липшицевой по х равномерно по t для
всех t ^ 0 в ограниченной окрестности начала координат, удовлетворяет (9.6)
в этой окрестности
1
. Для исследования устойчивости начала координат как точ
ки равновесия возмущенной системы (9.1) мы будем использовать в качестве
функции Ляпунова функцию V. Производная V вдоль траекторий системы (9.1)
определяется равенством
Первые два члена в правой части представляют собой отрицательно опреде
ленную и удовлетворяющую (9.4) производную V(t,x) вдоль траекторий но
минальной системы. Наличие третьего члена [dV/dx]g обусловлено наличием
возмущения. Поскольку функция д в общем случае неизвестна, мы не можем су
дить о влиянии этого члена на выполнение условия отрицательной определенно
сти V(t,x). Поскольку ограничение на рост (9.6) — это единственная доступная
для нас информация о функции д, мы должны рассмотреть наихудший случай,
т.е. когда [dV/dx]g ограничена неотрицательной величиной. Используя (9.4)-
(9.6), получаем
V(t,x) ^-сф\\* + av !!<?(*, хЖ-сз||х||
2
+ с47|М|
дх
Если константа η достаточно мала, так что выполнено
7<§.
(9-7)
ТО
V(t,x) < -(с3 -7С4)Ця||
2
> (с3-7^4)>0.
Таким образом, с использованием теоремы 4.10 мы получаем следующую лемму.
Лемма 9.1. Пусть х = 0 — экспоненциально устойчивая точка равновесия
номинальной системы (9.2) и V(t, x) — функция Ляпунова номинальной системы,
удовлетворяющая (9.3)-(9.5) в [0, оо) х D. Предполоэюим, что член возмущений
g(t,x) удовлетворяет (9.6) и (9.7). Тогда начало координат является экспонен
циально устойчивой точкой равновесия возмущенной системы (9.1). Кроме того,
если все предположения выполнены глобально, то начало координат глобально
экспоненциально устойчиво.
Эта лемма важна с концептуальной точки зрения, поскольку она показы
вает, что экспоненциально устойчивая в начале координат система робастна для
класса возмущений, удовлетворяющих (9.6) и (9.7). Для установления этого свой
ства робастности нам не требуется знать соответствующую функцию Ляпунова.
Заметим, однако, что линейное ограничение на рост (9.6) становится ограничительным требо
ванием в глобальной постановке задачи, поскольку это влечет необходимость наложения требова
ния о глобальной липшицевости функции g по х.
9.1. ВОЗМУЩЕНИЕ, ИСЧЕЗАЮЩЕЕ В НАЧАЛЕ КООРДИНАТ
363
Нам достаточно доказать, что номинальная система экспоненциально устойчива
в начале координат. Иногда мы можем доказать экспоненциальную устойчивость
системы в начале координат без нахождения явного вида функции Ляпунова, удо
влетворяющей (9.3)-(9.5)2
. Вне зависимости от того, какой метод используется
для доказательства экспоненциальной устойчивости начала координат, мы можем
гарантировать существование V(t, x), удовлетворяющей (9.3)-(9.5), с использо
ванием теоремы 4.14 (при условии, что матрица Якоби [df/dx] ограничена). Од
нако, если нам неизвестна функция Ляпунова V(t,x), мы не можем вычислить
границу (9.7). Таким образом, когда мы говорим об экспоненциальной устойчи
вости начала координат для всех возмущений, удовлетворяющих
\\9(t,x)\\<l\\x\\
с достаточно малой константой 7, наше заключение о робастности становится ка
чественной характеристикой системы. С другой стороны, если функция V(t,x)
нам известна, мы можем определить границу (9.7), что само по себе представля
ет собой дополнительную информацию о системе. При этом следует быть вни
мательным, поскольку можно переоценить значимость этой оценки для нашего
анализа в случае, если она окажется слишком консервативной для определенного
возмущения g(t, x). Избыточный консерватизм этой оценки может быть обуслов
лен тем, что мы изначально сделали предположения для наихудшей ситуации.
Пример 9.1. Рассмотрим систему
х—Ах+g(t,x),
где А — гурвицева матрица и ||^(i,x)||2 ^ 7lWh Для всех t ^ 0 и всех х е R
n
.
ПустьQ—Q
T
> 0. Решим уравнение Ляпунова
РА+А
Т
Р= -Q
относительно Р. Из теоремы 4.6 следует, что существует единственное решение
Ρ=Р
т
> 0. Квадратичная функция Ляпунова V(x) = x
T
Px удовлетворя
ет (9.3)-(9.5). В частности,
(P)\\x\\l ^V(x) ^ Xmax(P)\\x\\l
-р—Ах = —х Qx ^ "~Amin(Q)||a;||2,
|И| = \\2х
т
Р\\2 < 2||Р||2||х||2 = 2Атах(Р)||х||2.
Производная функции V(x) вдоль траекторий возмущенной системы удовлетво
ряет
V(t,x) < -Xnnn{Q)\\x\\
2
2 + 2Ашах(Р)7|кЩ.
2
Это возможно, например, в случае, когда экспоненциальная устойчивость начала координат
устанавливается с использованием теоремы 8.5.
364
ГЛАВА 9
Следовательно, начало координат глобально экспоненциально устойчиво, если
7 < ^min(Q)/2Amax(P). Поскольку эта оценка зависит от выбора Q, необходимо
выбрать Q так, чтобы максимизировать отношение Amin(Q)/Amax(P). Оказыва
ется, что эта величина достигает максимума при Q = I (см. упражнение 9.1).
Δ
Пример 9.2. Рассмотрим систему второго порядка
xi=х2,
±2= —4ri—2x2+/Зх|
с неизвестной константой β ^ 0. Рассмотрим эту систему как возмущенную
систему (9.1) с
/(х) = Ах
0
-4
XI
Х2
9{х)
0
гз
2
1
L8
11
8
5
16.
Собственные числа матрицы А равны — ldtjy/З, и, следовательно, А — гурвицева.
Решение уравнения Ляпунова РА + А
Т
Р = —Iимеетвид
Р=
Как мы видели в примере 9.1, функция Ляпунова V(x) = x
T
Px удовлетворяет
неравенствам (9.3)-(9.5) с константами сз = 1 и
с4 = 2Атах(Р) = 2 х 1.513 = 3.026.
Член возмущений д(х) удовлетворяет
||$(*)||2 = β\Χ2? < β$\Χ2\ < ^||ж||2
для всех |х2| ^ fe. Заметим, что нам не известна точная оценка X2{t), но мы
знаем, что величина X2(t) ограничена, если траектория x(t) принадлежит ком
пактному множеству. Оставим &2 неопределенной и продолжим наш анализ. Ис
пользуя V(x) в качестве функции Ляпунова для возмущенной системы, получаем
V(x)^-\\x\\l
+ 3.026fik%\\x\\l
Следовательно, V(x) будет отрицательно определенной, если
1
β< 3.026/й'
Для того чтобы получить оценку &2, положим Ω0 = {х € R2 \ V(x) ^ с}.
Для любой положительной константы с множество Пс замкнуто и ограничено.
Граница множества Ω0 — поверхность Ляпунова
V(x)=\х\ +\Xlx2 +^х\ =с.
9.1. ВОЗМУЩЕНИЕ, ИСЧЕЗАЮЩЕЕ В НАЧАЛЕ КООРДИНАТ
365
Наибольшее значение величины \х2\ на поверхности V(x) = с может быть опре
делено путем дифференцирования уравнения поверхности по х\. Это приводит
к следующему результату:
3xi+ix2=0.
Тогда экстремум величины х2 достигается в точке пересечения прямой х\ —
—
— #2/12 с поверхностью Ляпунова. Легко показать, что максимальное значе
ние х\ на поверхности Ляпунова равно 96с/29. Таким образом, все точки внут
ри Ω0 удовлетворяют оценке
|x2|^fc2, где Щ = Щ.
Тогда при
3<
29
^ 0.1
μ 3.026х96с~ с
производная V(x) будет отрицательно определена на Qc и мы можем заключить,
что начало координат х = 0 экспоненциально устойчиво и Ω0 представляет со
бой оценку области притяжения. Неравенство β < 0.1 /с показывает взаимосвязь
между оценками области притяжения и верхней границы β. Чем меньше верх
няя граница /?, тем больше оценка области притяжения. Наличие взаимосвязи
компромиссного характера между этими двумя величинами представляется есте
ственным фактом. Действительно, замена переменных
Z\ = \Ι-γΧ2>
Z2 = \l-£(4x1 + 2x2-βΧ%)
r=2t
приводит уравнение состояния к следующему виду:
dz\
-^
=
~
Z2
>
^
= Zl+(4 -1)Z2.
В примере 8.5 было показано, что область притяжения этой системы ограничена
и окружена неустойчивым предельным циклом. Область притяжения, представ
ленная в ^-координатах, увеличивается с уменьшением β и уменьшается с уве
личением β.
Этот пример может служить в качестве иллюстрации нашего замечания
о консервативности оценки (9.7). С использованием этого ограничения мож
но получить оценку β < 1/3.026/^2, из которой следует, что в качестве члена
366
ГЛАВА 9
возмущений g(t,x) может выступать любой двумерный вектор, удовлетворяю
щий неравенству ||<7(£,х)||2 ^ /З/сЩхЦг- Этот класс возмущений представляется
более общим по сравнению с возмущением, имеющим место в рассматривае
мом конкретном примере и обладающим структурной особенностью — первый
компонент вектора возмущений д равен нулю. Проведенный анализ показывает,
что можно рассмотреть возмущения общего вида, когда все компоненты векто
ра д могут изменяться. Однако подобное пренебрежение спецификой возмуще
ния обычно приводит к консервативным оценкам. Повторим наш анализ, на этот
раз принимая во внимание структуру возмущения. В этом случае вместо того,
чтобы использовать оценку общего вида (9.7), мы вычислим производную V(t, x)
вдоль траекторий возмущенной системы:
V(x) = -\\x\\
2
2+2x
T
Pg(x) =
= -\\х\\1 + 20хЩхгх2 + Аж2) ^
<-Nil + 2)8х1(^||х||1 Ч-Ау^^
^-||x||l + |/3fcl||x||l.
Таким образом, V(x) отрицательно определена при β < 4/3&2- Используя снова
тот факт, что для всех х £ ftc выполнено |х2|2
^ Щ = 96с/29, получаем оценку
β < 0.4/с, которая в четыре раза больше соответствующей оценки, полученной
с использованием (9.7).
Δ
В случае когда начало координат номинальной системы (9.2) равномерно
асимптотически устойчиво, но не экспоненциально устойчиво, анализ устойчи
вости возмущенной системы становится более сложным. Предположим, что но
минальная система имеет положительно определенную, убывающую функцию
Ляпунова V(tjc\ удовлетворяющую неравенству
f + 1ж*к-*эд
для всех (£,х) £ [0, сю) х D, где Ws(x) — положительно определенная и непре
рывная функция. Производная V вдоль траекторий системы (9.1) удовлетворяет
*<*•*> = f
+
f'<*»*>
+
f'<*·*>*
^ -W3(x) + fp«,x)
Наша задача — доказать, что выполнено неравенство
\dV
дх
•g(t,x) < W3(x)
9.1. ВОЗМУЩЕНИЕ, ИСЧЕЗАЮЩЕЕ В НАЧАЛЕ КООРДИНАТ
367
для всех (t, х) е [0, оо) х D. Эта цель не может быть достигнута с использова
нием лишь простой оценки сверху на ||#(i,x)||, как это было сделано в случае
экспоненциальной устойчивости. Оценка роста для ||^(i,x)|| зависит от выбора
функции Ляпунова номинальной системы. Одним из классов функций Ляпуно
ва, для которых анализ почти так же прост, как и в случае экспоненциальной
устойчивости, является класс положительно определенных, убывающих функ
ций, удовлетворяющих неравенствам
^
+ %No,х)^-съф\х),
(9.8)
дУ
дх
^ сАф(х)
(9.9)
для всех (t,x) € [0, оо) х D и некоторых положительных констант сз и с^, где
φ:R
n
—» R — положительно определенная и непрерывная функция. Функция
Ляпунова, удовлетворяющая (9.8) и (9.9), обычно называется функцией Ляпунова
квадратичного типа. Очевидно, что функция Ляпунова, удовлетворяющая (9.3)-
(9.5), является функцией квадратичного типа. Функция Ляпунова квадратичного
типа может существовать для системы даже в случаях, когда начало координат не
является экспоненциально устойчивым. Этот утверждение можно проиллюстри
ровать небольшим примером. Если номинальная система (9.2) имеет функцию
Ляпунова V(t,x) квадратичного типа, то производная этой функции вдоль тра
екторий (9.1) удовлетворяет неравенству
V(t,x) < -с3ф
2
(х) + C4<Kx)\\g(t,x)\\.
Предположим, что член возмущений удовлетворяет оценке
\\д&х)\\^чф(х), 7<|·
Тогда
У(г,х)^-(с3-са)Ф2{х)·
Это неравенство показывает, что V(t, x) отрицательно определена.
Пример 9.3. Рассмотрим скалярную систему
х=—х
3
+ g(t,x).
Номинальная система
х=-х
3
имеет глобально асимптотически устойчивую точку равновесия в начале коор
динат, однако, как мы видели в примере 4.23, оно не является экспоненциально
устойчивым. Таким образом, не существует функции Ляпунова, удовлетворяю
щей (9.3)-(9.5). С другой стороны, функция Ляпунова V{x) = х
4
удовлетворя
ет (9.8) и (9.9) с ф(х) = |ж|
3
, сз = 4 и С4 = 4. Предположим, что член возмуще
ний g(t, х) удовлетворяет оценке \g(t,х)\ ^ 7|ж1
3
Для
всеххП
РИ7 < 1·Тогдадля
368
ГЛАВА 9
производной функции V вдоль траекторий возмущенной системы справедливо
неравенство
У(^х)^-4(1-7)ф2(х).
Следовательно, начало координат является глобально равномерно асимптотиче
ски устойчивой точкой равновесия возмущенной системы.
Δ
Важно отметить, что в отличие от случая экспоненциальной устойчивости
номинальная система с равномерно асимптотически устойчивым, но не экспо
ненциально устойчивым началом координат не является робастной относительно
гладких возмущений с произвольно малой границей линейного роста (9.6). Это
утверждение иллюстрируется следующим примером
3
.
Пример 9.4. Рассмотрим скалярную систему из предыдущего примера
свозмущениемд=jx, гдеη>О,т.е.
х=—х
3
+ jx.
Можно легко показать с использованием линеаризации этой системы, что для
любой 7 > 0 начало координат неустойчиво при произвольно малой 7·
Δ
9.2. Возмущения, не исчезающие в начале координат
Обратимся к рассмотрению более общей ситуации, когда условие #(£, 0) = 0
не выполняется и, следовательно, начало координат х = 0 не является точкой
равновесия возмущенной системы (9.1). В этом случае мы не можем исследовать
устойчивость начала координат как точки равновесия системы и не можем ожи
дать, что решение возмущенной системы будет стремиться к началу координат
при i —> оо. Максимум, на что мы можем рассчитывать, — это то, что реше
ние x{t) будет предельно ограничено малой величиной, если возмущения g(t,x)
малы в некотором смысле. Начнем наше исследование со случая, когда начало
координат номинальной системы (9.2) является экспоненциально устойчивым.
Лемма 9.2. Пусть = О — экспоненциально устойчивая точка равновесия
номинальной системы (9.2) uV(t,x) — функция Ляпунова номинальной системы,
удовлетворяющая (9.3)-(9.5) на [0, оо) х D, где D = {х G Rn | ||ж|| < г}.
Предположим, что член возмущения g(t,x) удовлетворяет неравенству
\No,х)\\^6<ЩуЩвг
(9.10)
для всех t ^ 0, х G D и некоторой положительной константы θ < 1. Тогда для
всех ||х(£о)|| < у/с\/С2Г решение x(t) возмущенной системы (9.1) удовлетворяет
оценкам
\\x(t)\\ < kexp[-<y(t - *о)]||я(*о)||, V*o < t < t0 + Τ
3
См. также упражнение 9.7.
9.2 . ВОЗМУЩЕНИЯ, НЕ ИСЧЕЗАЮЩИЕ В НАЧАЛЕ КООРДИНАТ
369
||x(i)|| <Ь,
Vt^to+T
для некоторого конечного момента времени Т, где
~~
(1 - θ)ο3
L
£2
Ci' 7
2с2
С25
ДОКАЗАТЕЛЬСТВО. Используем V(t, х) в качестве функции Ляпунова для
возмущенной системы (9.1). Производная функции V(t,x) вдоль траекторий си
стемы (9.1) удовлетворяет неравенствам
V(t,x) < -с3||х||
2
+
dV
дх
\\9&х) €
^ -сз||х||
2
+ с4<5||х|| =
= -(1 - 0)с3||а;||2
-
9с3\\х\\
2
+с46\\х\\<, 0<θ<1
<-(1-0)с3||х||
2
,
VM^c4/0c3.
Применив теорему 4.18 и использовав результаты упражнения 4.51, мы заверша
ем доказательство.
Π
Заметим, что предельная граница b в лемме 9.2 пропорциональна верхней
оценке возмущений 5. Этот результат может рассматриваться как свойство ро-
бастности номинальных систем с экспоненциально устойчивым началом коорди
нат. Действительно, произвольно малые (равномерно ограниченные) возмущения
не приводят к значительным отклонениям от установившегося начала координат.
Пример 9.5. Рассмотрим систему второго порядка
х2=-4xi-2х2+βА.+Ф)>
где β ^ 0 — неизвестная константа и d(t) — равномерно ограниченное возму
щение, удовлетворяющее неравенству \d(t)\ < δ для всех t > 0. Эта система
совпадает с той, что мы исследовали в примере 9.2, за исключением того, что
в новой системе имеется дополнительный член возмущения d(t). Эта система
может рассматриваться как возмущение номинальной линейной системы, функ
ция Ляпунова которой имеет вид V(x) = x
T
Px, где
•
з
2
1
L8
11
8
5
16J
Эту функцию V(x) можно рассматривать в качестве функции Ляпунова для воз
мущенной системы, но при этом анализ влияния двух членов возмущения /Зх|
и d(t) следует проводить по отдельности, поскольку первый член равен в начале
370
ГЛАВА 9
координат нулю, а второй нет. Вычисляя производную V(x) вдоль траекторий
возмущенной системы, получаем
V(t,х) = -\\х\\1 + 2рхЩх1Х2 + ^х
2
2) + 2а(Щхг + -^х2) <
<-IWIl + |^||x||l + ^iNi2.
При получении этой оценки мы использовали неравенство
|2xi + 5x2| < ||х||2\/4 + 25,
а также то, что к2 является верхней границей \х2\. Предположим, что β ^ 4(1 —
-
С)/3/с|, где 0 < С < 1. Тогда
|2^ л/295„ „
,
(л
т.м ||2 UILII ^.._
л/295
v(t,х) <-ф\\г2 +^FNo <-(1-в)Ф\& vNb ^μ
:
8С0 '
где 0 < θ < 1. Как было показано в примере 9.2, величина \х2\
2
ограничена
на Ω0 значением 96с/29. Таким образом, если β ^ 0.4(1 — Q/c и константа δ
мала настолько, что выполнено ^
2
Атах(-Р) < с, το Βμ С Ωβ и все траектории,
начинающиеся в Ω0, останутся для всех будущих моментов времени в Пс. Кроме
того, условия теоремы 4.18 выполнены в Ω0, и, следовательно, решения возму
щенной системы равномерно предельно ограничены величиной
\/295 Хтах(Р)
see YAmin(P)·
Δ
В более общем случае, когда для номинальной системы (9.2) начало коор
динат х = 0 не экспоненциально устойчиво, а лишь равномерно асимптотически
устойчиво, анализ возмущенной системы выполняется аналогичным образом.
Лемма 9.3. Пусть х = 0 — равномерно асимптотически устойчивая точ
ка равновесия номинальной системы (9.2). Пусть V(t, x) — функция Ляпунова
номинальной системы, удовлетворяющая неравенствам
4
ai(||»||)<V(t,s)<a2(NI),
(9.11)
% + %f(t,x)^-a3(\\x\\),
(9.12)
dv
дх
< MINI)
(9.13)
4
Существование функции Ляпунова, удовлетворяющей этим неравенствам (в ограниченной об
ласти), гарантируется теоремой 4.16 при некоторых дополнительных предположениях.
9.2 . ВОЗМУЩЕНИЯ, НЕ ИСЧЕЗАЮЩИЕ В НАЧАЛЕ КООРДИНАТ
371
на[О,оо)хД гдеD ={хGRn \\\х\\<г} иaj(·), г = 1,2,3,4, — функции клас
са /С. Предположим, что член возмущения g(t, x) удовлетворяет равномерной
оценке
y(t,x) О <
Гт
(9.14)
Эля всех t ^ 0,х € D и некоторой полоэюительной константы θ < 1. Тогда для
всех ||ж(£о)|| <
а
2^(
а
1(г)) решение x(t) возмущенной системы (9.1) удовлетво
ряет неравенствам
\\x(t)\\ ^ /3(||x(t0)||,i - to), V*0 < t < to + Τ
\\x(t)\\ ^ρ{δ), Vt^to + T
для некоторой КС-функции β и некоторого конечного момента времени Τ; ρ —
К-функция от δ, определяемая равенством
ДОКАЗАТЕЛЬСТВО. Используем V(t,x) в качестве функции Ляпунова для
возмущенной системы (9.1). Производная V(t,x) вдоль траекторий системы (9.1)
удовлетворяет
V(t,x)^-a3(\\x\\) + dv Mt,x)\\ <
дх
<-α3(Ν) + &*4(||*||)<
< -(1 - θ)α5{\\Χ\\) - θαΑ{\\Χ\\) + δα4(τ) <, О < θ < 1
< -(1 " θ)α3(\\Χ\\), V ||х|| > «J
1
(^ψ!\
Применив теорему 4.18, завершаем доказательство.
Π
Эта лемма аналогична той, что мы доказали ранее для случая экспонен
циальной устойчивости, при анализе которого использовалась некоторая осо
бенность, которая не имеет соответствующего аналога в анализе более общей
ситуации равномерной асимптотической устойчивости. Именно при исследова
нии экспоненциальной устойчивости предполагалось, что δ удовлетворяет (9.10).
Правая часть (9.10) стремится к оо при г —> оо. Поэтому, если это предположение
выполнено глобально, мы можем заключить, что для всех равномерно ограничен
ных возмущений решения возмущенной системы будут равномерно ограничены.
Это утверждение верно, поскольку для любой δ мы можем выбрать достаточ
но большую г так, чтобы было выполнено (9.10). С другой стороны, в случае
372
ГЛАВА 9
равномерной асимптотической устойчивости предполагается, что δ удовлетворя
ют (9.14). Анализ (9.14) показывает, что без дополнительной информации о свой
ствах /С-функций мы ничего не можем сказать о предельных значениях правой
части этого неравенства при г —> оо. Таким образом, мы не можем определен
но утверждать, что при возникновении равномерно ограниченных возмущений
в номинальной системе с равномерно асимптотически устойчивой точкой равно
весия в начале координат ее решения останутся ограниченными вне зависимости
от величины действующих возмущений. Разумеется, тот факт, что мы не можем
доказать это, еще не означает, что система не может обладать этим свойством.
Тем не менее оказывается, что это утверждение действительно неверно. Можно
привести примеры систем (см. упражнение 9.13), для которых начало координат
является глобально равномерно асимптотически устойчивой точкой равновесия,
но ограниченные возмущения приводят к тому, что решения возмущенной систе
мы уходят на бесконечность.
9.3. Метод сравнения
Рассмотрим возмущенную систему (9.1). Пусть V(t, x) — функция Ляпунова
для номинальной системы (9.2), и предположим, что производная функции V
вдоль траекторий системы (9.1) удовлетворяет дифференциальному неравенству
V^h{t,V).
Из леммы сравнения 3.4 следует, что
V(t,x(*))<y(t),
где y(i) — решение дифференциального уравнения
у = h(t,y), y(t0) = V(t0ix(to)).
Этот подход особенно полезен в ситуациях, когда приведенное дифференциаль
ное неравенство является линейным, т.е. когда h(t,V) = a(t)V + b(t). В этом
случае мы можем получить явное представление решения у соответствующе
го линейного дифференциального уравнения первого порядка. Линейное диффе
ренциальное неравенство также может быть получено в ситуациях, когда начало
координат номинальной системы (9.2) является экспоненциально устойчивым.
Пусть V(t, х) — функция Ляпунова номинальной системы (9.2), удовлетворяю
щая (9.3)-(9.5) для всех (t,x) G [0,оо) х D, где D = {х е R
n
\ \\х\\ < г}.
Предположим, что член возмущения g(t, x) удовлетворяет оценке
\\g{t,x)\\ ^ 7(*)И*Н + <*(*)>
v
*>0,\/хеD,
(9.15)
где η : R —> R — неотрицательная и непрерывная функция для всех t ^ О
и δ : R —> R — неотрицательная, непрерывная и ограниченная функция для всех
9.3 . МЕТОД СРАВНЕНИЯ
373
t ^ 0. Производная функции V вдоль траекторий системы (9.1) удовлетворяет
*<*'*>=f
+
f/fc*>
+
!£'<«·*><
av
dx HsMII <
<-C3||a;||2
+ C47(i)||a;||2
+ C4<5(i)||x||
Используя (9.3), можно получить верхнюю границу V:
(9.16)
^<-[1-^)]^ + с4адД
Для того чтобы получить линейное дифференциальное неравенство, положим
W(t) = y/V(t,x(t)) и используем тот факт, что W = V/2y/V при V φ 0. Тогда
W<
сз
2 Lc2 I*)]
И
'
+
2^ад·
(9.17)
В случае если У = 0, можно показать,
5
что D
+
W(t) < c^5{t)/2y/c{. Следова
тельно, D
+
W(t) удовлетворяет (9.17) для всех значений функции V. Из леммы
сравнения следует, что W(t) удовлетворяет неравенству
W(t) < ф{1, t0)W(t0) + -^=
[ ф& τ)δ(τ)ατ,
(9.18)
где переходная функция </>(Мо) определяется равенством
0(i, to) = exp
•t(i
-
io)+ti0
7
H·
Используя (9.3) и (9.18), получаем
Далее, предположим, что 7(£) удовлетворяет условию
/'
Jto
j(r)dr <ε(*- to)+η
для некоторых неотрицательных констант ε и η, где
cic3
ε < С2С4'
(9.19)
(9.20)
(9.21)
См. упражнение 9.14.
374
ГЛАВА 9
Определив константы аир равенствами
и подставляя (9.20) и (9.21) в (9.19), получаем
И*(*)И < y^HH*o)l|e-
a(i
-
to)
+ ^J* e-^-^S(T)dr.
(9.23)
Для выполнения этой оценки необходимо обеспечить \\x(t)\\ <r для всех
t^to.
Заметим, что
6
IW*)H < У|р1к(*о)Це-
а(
*-'
о)
+ ££- [l - е-«(*-«о)] Mpi(t) <
< max jygpHio)!!, ^
supi(i) j .
Тогда условие ||ж(£)|| < г выполнено, если
"
ж
(*о)|| <
T
-
psI%
(9.24)
sup*(i)<^.
(9.25)
Суммируем полученные результаты в следующей лемме.
Лемма 9.4. Пусть х = 0 — экспоненциально устойчивая точка рав
новесия номинальной системы (9.2). Пусть V(t,x) — функция Ляпунова но
минальной системы, удовлетворяющая (9.3)-(9.5) на [0, оо) х D, где D =
= {х Ε Rn I ||x||2 < τ}. Предположим, что для члена возмущения g(t,x) вы
полнено (9.15), где y(t) удовлетворяет (9.20) и (9.21). Тогда при условии, что
x(to) удовлетворяет (9.24) и выполнено (9.25), для решения возмущенной си
стемы (9.1) справедлива оценка (9.23). Кроме того, если все условия выполне
ны глобально, то оценка (9.23) справедлива для всех х(£о) и любой ограничен
ной 6(t).
Рассматривая предыдущую лемму в частном случае, когда возмущения ста
новятся в начале координат равными нулю, т.е. когда 6(t) = 0, мы получаем
следующий результат:
6
При этом мы использовали тот факт, что функция ae~
at
+6(1—е
-
"*),гдеа,Ъиа—положи
тельные константы, монотонно изменяет свои значения от начального а до конечного Ъ. Следова
тельно, она ограничена величиной, равной максимуму из этих двух чисел.
9.3 . МЕТОД СРАВНЕНИЯ
375
Следствие 9.1. Пусть х = 0 — экспоненциально устойчивая точка равнове
сия номинальной системы (9.2). Предполоэюим, что V(t,x) — функция Ляпунова
номинальной системы, удовлетворяющая (9.3)-(9.5) на [0, оо) х D. Предполо
эюим также, что для возмущения g(t, x) выполнено
Hs(t,aOII<7(*)IWI,
где 7(£) удовлетворяет (9.20) и (9.21). Тогда начало координат является экспо
ненциально устойчивой точкой равновесия возмущенной системы (9.1). Кроме
того, если все предположения выполнены глобально, то начало координат гло
бально экспоненциально устойчиво.
Если7(0=7
=
const, то для выполнения условий следствия 9.1 необ
ходимо, чтобы 7 удовлетворяла оценке η < С1С3/С2С4, что совпадает с усло
вием леммы 9.1 7 < C3/C4, поскольку (с\/с2) < 1. В действительности, если
(С1/С2) < 1, то указанная оценка будет более консервативной (т.е. верхняя грань
будет меньше) по сравнению с соответствующей оценкой из леммы 9.1. След
ствие 9.1 применяется в случаях, когда интеграл от j(t) удовлетворяет услови
ям (9.20) и (9.21), но величина sup^io j(t) недостаточно мала в том смысле, что
не удовлетворяет sup^to ^(t) < C3/C4. Три подобных случая рассматриваются
в следующей лемме.
Лемма 9.5.
1) Если
/*оо
/ η{τ)ατ < /с,
./о
то(9.20)выполненоприε—0иη= к.
2) Если
j(t) —•0приt—>00,
то для любой ε > 0 существует η = η(ε) > 0, такая что выполнено (9.20).
3) Если существуют константы Δ > 0, Τ ^ 0, и ε\ > 0, такие что
7(r)dr<ei, Vt^T,
то (9.20) выполнено при ε = ε\ и η = ε\Α + J0 7(i)dt.
ДОКАЗАТЕЛЬСТВО. Доказательство первого случая очевидно. Рассматривая
второй случай, заметим, что поскольку lim^oo j(t) = 0 для любой ε > 0, то
существует момент времени Т\ — Т\{е) > 0, такой что j(t) < ε для всех £ > Т\.
Пустьη=f0
г
~f(i)dt. Если to ^ Τ\, то
7(r)dr^ / εατ = e(t — to).
Jt0
и
Jto
376
ГЛАВА 9
Еслиt<ΤΙ,то
rt
гП
/η(τ)dr^
η(τ)dr=η.
Jto
Jo
Еслиto^Ti<t,то
/•t
/»i i
/>t
/ 7(r)dr =
7(7-) dr +
7(7-) dr <
Λο
Λο
«Μ
/*
Tl
< / 7(7-)dr+ε(*- Ti)^77+e(t-to).
./0
В третьем случае, если t ^ Τ, то
/ 7(r)dr ^
η(τ)dr<η.
Jto
Jo
При t^ti^T
положим Ν — целое число, при котором (N—1)A ^t—t\ < ΝΔ.
Тогда
w
г=АГ-2
-*1+(»+1)Δ
И
/7(r)^
r
—zl/
^(
T
)^
T
+/
7(r) ^
r
^
Λ1
-
=0 7ti+iA
Jti+(N-l)b
i=N-2
^
^
€iA + eiA < 6i(t-*i) + €iA.
г=0
Это неравенство используется далее при ti = to, когда £ ^ to ^ ?\ и при ti = Τ,
когда to ^T
^t. Если£^io^Г,то
rt
Idr ^ ei{t - to)+εΧΔ<εΧ(*- t0)+V>
/ 7(τ)<
Jto
Еслиto^Τ"^ £>то
/ 7(r)dr =
η(τ)dr+Ιj(τ)dr ^
Λ0
Λο
JT
^ [ j(r)dT +6!(t-T) +егА ^ ei(t-to) +η.
Jo
Π
В первом случае предыдущей леммы условие (9.20) выполнено при ε = 0,
а во втором случае — при произвольно малой ε. Поэтому в обоих случаях усло
вие (9.21) всегда выполняется и начало координат возмущенной системы (9.2)
экспоненциально устойчиво. В третьем случае леммы устанавливается граница
величины скользящего среднего для функции j(t) при достаточно больших t.
Начало координат возмущенной системы (9.2) будет экспоненциально устойчи
во, если эта граница достаточно мала.
9.3 . МЕТОД СРАВНЕНИЯ
377
Пример 9.6. Рассмотрим линейную систему
х = [A(t) + B(t)]x,
где A(t) и B(t) — непрерывные матрицы и A(t) ограничена на [0, оо). Пред
положим, что начало координат является экспоненциально устойчивой точкой
равновесия номинальной системы
х = A(t)x
B(t) —• 0приt—• оо.
Из теоремы 4.12 следует, что существует квадратичная функция Ляпунова
V(t,x) = x
T
P(t)x, для которой глобально выполнены неравенства (9.3)-(9.5).
Член возмущения B(t)x удовлетворяет неравенству
||Я(«)*|| < ||J5(t)|| IN-
Поскольку ||β(t)|| —> 0 при t —> оо, мы можем заключить с использованием
следствия 9.1 и второго случая из леммы 9.5, что начало координат является гло
бально экспоненциально устойчивой точкой равновесия возмущенной системы.
Δ
Аналогичные заключения могут быть сделаны и в случае, когда
/0°° ||J3(i)||dt < оо (см. упражнение 9.15) и /0°° ||B(i)||2
cft < оо (см. упражне
ние 9.16). Случай, когда возмущения не становятся равными нулю в начале ко
ординат, т. е. если 5(t) φ О, рассматривается в следующей лемме. В ней форму
лируются результаты, касающиеся асимптотического поведения x(t) при t —> оо.
Лемма 9.6. Предположим, что условия леммы 9.4 выполнены, и пусть
x(t) —решение возмущенной системы (9.1).
1) Если выполнена оценка
Jto
для некоторой положительной константы β, то x(t) равномерно предельно
ограничено с предельной границей
h-
С4Р(3
2ci0*
где θ £ (О,1) — произвольная константа.
2) Если выполнено
limS(t)=#оо>О,
t—юо
378
ГЛАВА 9
то x(t) равномерно предельно ограничено с предельной границей
,
=
С4/РДОО
"
2aci0'
где 0 Ε (0,1) — произвольная константа.
3) .Если
limi(t)=О, то
lim х(£) = 0.
t—>оо
t—> ·οο
£с/ш условия леммы 9.4 выполнены глобально, то вышеприведенные утвержде
ния выполнены для любого начального состояния x(to).
ДОКАЗАТЕЛЬСТВО. Результаты всех трех случаев следуют из неравен
ства (9.23). Для доказательства первых двух случаев достаточно использовать
тотфакт,чтоеслиu(t) =w(t) +априа>0иИт^-юоw(t) =О,тоu(t) предель
но ограничено величиной α/θ для любой положительной θ < 1. Действитель
но, существует конечный момент времени Т, такой что выполнено неравенство
\w(t)\ ^ а(1 — θ)/θ для всех t ^ Т. Далее, для доказательства последнего свой
ства мы используем тот факт, что если u(t) = Jt exp(—a(t — T))W(T) dr, где w(t)
ограничена и lim^oo w(t) = w^, то lim^oo u(t) = Woo/a.
7
Π
9.4. Непрерывность решений на бесконечном интервале
В параграфе 3.2 мы исследовали свойство непрерывной зависимости ре
шений уравнения состояния от начальных данных и параметров. В частности,
в теореме 3.4 рассматривалась номинальная система
x = f(t,x)
(9.26)
и возмущенная система
x = f(t,x)+g(t,x)
(9.27)
в условиях предположения о том, что неравенство \\g(t, х)\\ < δ выполнено в рас
сматриваемой области. Используя неравенство Гронуолла-Беллмана, можно по
лучить следующий результат: если y(t) и z(t) — хорошо определенные решения
соответственно номинальной и возмущенной систем, то
На/С*) " *(*)Н < \Шо) - z(t0)\\ exp[L(i - to)} + |{exp[L(i - t0)} - 1}, (9.28)
где L — константа Липшица для функции /. Эта оценка верна только на ком
пактном интервале времени, поскольку экспоненциальный член exp[L(t — to)]
неограниченно возрастает при t —> оо. В действительности эта оценка представ
ляет интерес лишь при анализе системы на интервале [to, h], где t\ — достаточно
7
См. [33, теорему 3.3.2.33].
9.4. НЕПРЕРЫВНОСТЬ РЕШЕНИЙ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ
379
мало, т. к. в противном случае, т. е. если t\ велико, оценка будет слишком консер
вативной и потому бесполезной. В этом нет ничего удивительного, поскольку, так
же как и в параграфе 3.2, мы не накладываем каких-либо требований на устой
чивость системы. В этом параграфе мы используем лемму 9.4 для вычисления
оценки разности решений систем (9.26) и (9.27), которая является равномерной
поtдлявсехt^to.
Теорема 9.1. Пусть D С Rn
—
открытая область, содержащая начало
координат. Предположим, что
• f(t,x)
и ее первые частные производные по х непрерывны, ограничены
и липшицевы по х равномерно по t для всех (t,x) Ε [0, оо) х Do, где
DQ С D — компактное множество;
• g(t,x) — кусочно-непрерывная функция от t, локально липшицева по х и
\\g(t,x)\\ ^ δ, V(t,a;) Ε [0,оо) х D;
(9.29)
• начало координат х = О — экспоненциально устойчивая точка равновесия
номинальной системы (9.26);
• существует функция Ляпунова V(t, x), удовлетворяющая условиям теоре
мы 4.9 для номинальной системы (9.26) при (t,x) Ε [0, оо) х D и {W\(x) <
с} — компактное подмножество D.
Пусть y(t) и z(t) —решения соответственно номинальной системы (9.26)
и возмущенной системы (9.27). Тогда для любого компактного множества Ω С
{И^ОЕ) < рс, 0 < /9 < 1} существуют положительные константы /?, 7> Vi β
ик, независящие отδитакие, чтоесли у(to)ΕΩ,δ<ηи\\z(to) —y(to)\\ <μ,
то решения y(t) и z(t) равномерно ограничены для всех t ^ to ^ 0 и
\\z(t) - y(t)\\ < ke-^ -^\\z(t0)
-
y(to)\\ + βδ.
(9.30)
Заметим, что в рассматриваемом случае, когда начало координат экспонен
циально устойчиво, на функцию Ляпунова V накладываются требования, соот
ветствующие равномерной асимптотической устойчивости системы, но не (более
жесткие) условия, соответствующие ее экспоненциальной устойчивости. В ре
зультате мы получаем более консервативные оценки множества Ω. В случае ко
гда номинальная система (9.26) является автономной, существование функции V
гарантируется теоремой 4.17 и в качестве множества Ω может быть выбрано лю
бое компактное подмножество области притяжения. Свойство экспоненциальной
устойчивости системы используется лишь локально, когда ошибка z(t) — y(t)
достаточно мала.
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 9.1. Производная функции V вдоль траекто
рий возмущенной системы (9.27) удовлетворяет равенству
V = ТЕ" + ТЕТЯ*'*) + ^9{t,x)
<~W3(x)+Μ
380
ГЛАВА 9
для всех х G {W"i(x) < с}, где к\ — верхняя граница dV/dx, вычисленная на
множестве {Wi(x) ^ с}. Пусть к^ > 0 — минимальное значение функции W$(x)
на компактном множестве Λ = {W\(x) <си W2(x) ^ с}. Тогда
^<-^зИ -\к2+Μ<-\wb{x\
\fx е Λ,V<K ^.
Из этой оценки видно, что V отрицательна на V(t,x) = с и, следовательно,
множество {V(t, x) < с} положительно инвариантно. Поэтому для всех z(to) E
{W^OE) ^ с} решение z(t) системы (9.27) равномерно ограничено. Поскольку
Ω находится внутри множества {W2(x) < с}, существует μ\ > 0, такое что
z(to) 6 {W2(x) ^ с} при у (to) eft и \\z(to) — y(to)\\ ^ μ\. Также легко показать,
что при у (to) е Ω решение y(t) равномерно ограничено и y(t) -> 0 при £ —> оо,
равномерно по to- Ошибка e(t) = z(t) — y(t) удовлетворяет уравнению
е=z -у =/(*,z)+g(t,z)-/(*,у)=f(t, e)+Δ(*,e)+g(t,z\
(9.31)
где
Δ(«, e) = /(t,y(t) + e) - /(*,y(t)) - /(t, e).
Исследуем уравнение ошибки (9.31) в шаре {||е|| ^ г} с Ζλ Уравнение (9.31)
может рассматриваться как возмущение системы
ё = /(*,е),
начало координат которой экспоненциально устойчиво. По теореме 4.14 суще
ствует функция Ляпунова V(t, е), удовлетворяющая (9.3)-(9.5) при ||е|| < г$ < г.
С использованием теоремы о среднем значении можно представить член ошибки
Δ; в следующем виде:
Ai(*,e) = §§«,А,е + !,)-§§(«,Л2е) е,
где 0 < Хг < 1. Поскольку матрица Якоби [df/dx] липшицева по х равномерно
по t, член возмущения (Δ + д) удовлетворяет
\\A(t,e)+g(t,z)\\
< LiWef + L2\\e\\ \\y(t)\\ + δ,
где y(t) —> 0 при t —• оо равномерно по £о- Следовательно,
||Δ(*.е) + fl(t,г)|| < {Ьщ + L2||y(i)||}||e|| + δ
для всех ||е|| < ri < го. Это неравенство принимает форму (9.15) при
-y(t) = {L1r1 + L2\\y(t)\\} и S(t) = S.
9.5 . ВЗАИМОСВЯЗАННЫЕ СИСТЕМЫ
381
Для любой €i > 0 существует момент времени Т\ > О, такой что ||y(t)|| ^ е\ для
всех t > to + Т\. Поэтому (9.20) выполнено с
/ l{r)dr ^ (€i + Liri)(t - t0) + Ti maxL2||y(t)||.
Выбирая ε\ и ri достаточно малыми, мы можем обеспечить выполнение (9.21).
Таким образом, все предположения леммы 9.4 выполнены и (9.30) следует
из (9.23).
Π
9.5. Взаимосвязанные системы
Сложность анализа устойчивости нелинейной динамической системы быст
ро возрастает с увеличением ее порядка. Это служит мотивацией для поиска пу
тей упрощения анализа. Если модель системы может быть представлена в виде
взаимосвязанных подсистем более низкого порядка, мы можем разделить ана
лиз устойчивости на два этапа. На первом шаге мы выполняем декомпозицию
системы на изолированные подсистемы меньшего порядка и для каждой из них
проводим соответствующее исследование свойств устойчивости. На втором шаге
мы используем полученные на первом шаге результаты и информацию о взаим
ных связях между этими подсистемами для того, чтобы определить свойства
устойчивости всей взаимосвязанной системы. В этом параграфе мы покажем,
как этот подход может быть использован для нахождения функций Ляпунова для
взаимосвязанных систем.
Рассмотрим взаимосвязанную систему
х% = fi(t, Xi) + 9i(t, х), г = 1,2,...,
га,
(9.32)
гдеXiеД
п
%ni+···+пш =ηих=[xj,...
,х^]
т
.
Предположим, что fi
идг — функции, достаточно гладкие для того, чтобы обеспечивалось существова
ние и единственность решения этого уравнения для всех его начальных условий
из исследуемой области. Предположим также, что
/i(t,0)=0, ft(*,0) = 0, Vi,
т. е. начало координат х = 0 является точкой равновесия системы. Если не учи
тывать перекрестные члены <^, система разбивается на га изолированных подси
стем:
Xi = fi(t,Xi),
(9.33)
каждая из которых имеет точку равновесия в соответствующем начале коорди
нат Xi = 0. Предположим, что найдены функции Ляпунова, которые гарантируют
равномерную асимптотическую устойчивость начала координат каждой из изоли
рованных подсистем, т. е. существуют положительно определенные убывающие
382
ГЛАВА 9
функции Ляпунова T^(t, я^), производные которых вдоль траекторий изолирован
ных подсистем отрицательно определены. Функция
771
г=1
называется композитной функцией Ляпунова совокупности т изолированных
подсистем для всех значений положительных констант di. Рассматривая взаи
мосвязанную систему (9.32) как возмущение совокупности изолированных под
систем (9.33), разумно попытаться использовать V(t,x) в качестве функции Ля
пунова для (9.32). Производная V(t, x) вдоль траекторий (9.32) определяется ра
венством
V(t,x) = J2
d
i
г=1
at+dxi
t%Khx%) + Σ*ΑΓ«(*'
Χ)·
г=1
Первый член в правой части этого равенства отрицательно определен, посколь
ку Vi — функция Ляпунова для г-й изолированной подсистемы, но знак второго
члена в общем случае не определен. Таким образом, мы находимся в ситуа
ции, аналогичной той, что возникла при анализе возмущенных систем в парагра
фе 9.1. С использованием этого подхода мы можем исследовать взаимосвязан
ную систему в предположении, что член [dVi/dxi]gi ограничен неотрицательной
верхней границей. Это может быть сделано с использованием функции Ляпуно
ва квадратичного типа, предложенной в параграфе 9.1. Предположим, что при
г = 1,2,..., т функция Vi(t,Xi) удовлетворяет неравенствам
^
+
ЩтХг)^-*гФ1(Хг),
(9.34)
dVi
дХо
< РгФг{Хг)
(9.35)
для всех £^0и||х||<ги некоторых положительных констант ai и ft, где
фг:R
Ui
— > R — положительно определенные и непрерывные функции. Далее,
предположим, что перекрестные члены gi(t,x) удовлетворяют оценкам
hi(t,x)
3=1
(9.36)
для всех £^0и||х||<ги некоторых неотрицательных констант 7г?· Тогда про
изводная функции V(i,x) = ΣTM=1 diVi(t,Xi) вдоль траекторий взаимосвязанной
системы (9.32) удовлетворяет неравенству
V(t,x)^J2di
г=1
-а гф1(Хг) +
^РЯчФNo)ФАх
з)
J'=l
9.5. ВЗАИМОСВЯЗАННЫЕ СИСТЕМЫ
383
Правая часть этого неравенства представляет собой квадратичную форму по
Фи-'-чФт- Тогда
V(t,x) ^-\<j>
T
(DS +S
T
D)<j>,
где
(9.37)
φ=[фг, · · ·, Фт]
Т
1 D = diag(di,..., dm)
и S — (га x m) -матрица с элементами
( o>i- βαα,
г=j,
Если существует положительная диагональная матрица D, такая что
DS+5
Т
Г>>О,
то V(t, х) отрицательно определена, поскольку ф(х) = О, если и только если х =
= 0. Напомним, что фг(хг) — положительно определенные функции от х\. Таким
образом, достаточным условием равномерной асимптотической устойчивости на
чала координат взаимосвязанной системы является существование положитель
ной диагональной матрицы D, такой что матрица DS + S
T
D является положи
тельно определенной. Матрица S имеет специальный вид: ее внедиагональные
элементы не положительны. Следующая лемма применима именно к этому клас
су матриц.
Лемма 9.7. Для существования положительной диагональной матрицы D,
такой что матрица DS-\-S
T
D положительно определена, необходимо и доста
точно, чтобы матица S была М-матрицей, т. е. ее ведущие главные миноры
положительны:
det
5Ц
521
Ski
512'•
Sik 1
* SkkJ
> 0, fe = l,2,...,m.
ДОКАЗАТЕЛЬСТВО. СМ. [57].
Π
Условие принадлежности к классу М-матриц может быть интерпретировано
как требование на диагональные элементы матрицы S, заключающееся в том, что
они должны быть «больше в своей совокупности», чем внедиагональные элемен
ты. Можно показать (см. упражнение 9.22), что матрицы с диагональным доми
нированием и неположительными внедиагональными элементами принадлежат
классу М-матриц. Своеобразной мерой для диагональных элементов матрицы S
является «степень устойчивости» изолированных подсистем в том смысле, что
константа а$ представляет собой нижнюю границу скорости убывания функции
384
ГЛАВА 9
Ляпунова Vi по отношению к ф?(хъ). Внедиагональные элементы S представ
ляют собой «силу взаимных связей между подсистемами» в том смысле, что
они представляют собой верхнюю границу gi(t,x) по отношению к 4>J{XJ), j =
= 1,..., га. Таким образом, условие принадлежности к классу М-матриц может
быть сформулировано следующим образом: если степень устойчивости изоли
рованных подсистем больше в своей совокупности, чем сила взаимных связей
между изолированными подсистемами, то взаимосвязанная система имеет рав
номерно асимптотически устойчивую точку равновесия в начале координат. Сум
мируем полученный результат в следующей теореме.
Теорема 9.2. Рассмотрим систему (9.32) и предположим, что существу
ют положительно определенные убывающие функции Ляпунова Vi(t,Xi), удо
влетворяющие (9.34) и (9.35). Предположим также, что д%(Ь,х) удовлетворя
ет (9.36) для всех t ^ 0 и \\х\\ < г и матрица S, определенная равенством (9.37),
принадлежит классу М-матриц. Тогда начало координат равномерно асимпто
тически устойчиво. Более того, если все условия выполнены глобально uVi(t,Xi)
радиально неограниченны, начало координат глобально равномерно асимптоти
чески устойчиво.
Пример 9.7. Рассмотрим систему второго порядка
1г23
Х\=
— Х\ — L.OX-yX*})
±2 = —х\ + 0.5xfx2-
Система может быть представлена в форме (9.32) с
/i(#i) = -хи 9i(x) = -1.5ж?ж|, /2(^2) = ~х\ и д2(х) = 0.5ж?ж|.
Первая изолированная система х\ = —х\ имеет функцию Ляпунова V\(x\) =
= x\j% которая удовлетворяет равенству
a^/ifa) = ~
х
\ = -ai</>i(zi),
где а\ = 1 и фх(xi) = \х\|. Вторая изолированная система ±2 = —х\ имеет
функцию Ляпунова V<i{x2) = х\1^-> которая удовлетворяет равенству
0^Ы
Х
2)=~
Х
2 = -0С2Ф\{Х<1),
гдеQ!2=1иФ2{х2)=\х21
3
·
Функции Ляпунова удовлетворяют (9.35) с β\ =
= /?2 = 1. Для перекрестного члена д\{х) справедливо неравенство
\gi{x)\ = l.bx\\x2\* ^1.Ьс\ф2(х2)
для всех \х\\ ^ с\. Для перекрестного члена д2{х) справедливо неравенство
Ьг(ж)| = O.bxjxl ^ 0.5ciC2</>i(xi)
9.5. ВЗАИМОСВЯЗАННЫЕ СИСТЕМЫ
385
для всех |xi| ^ с\ и \х2\ < с2. Таким образом, если ограничиться рассмотрением
множества
G={хеR
2
||a?i|^ сь \х2\ ^с2},
можно заключить, что перекрестные члены удовлетворяют (9.36) с
7и = 0,712=1.5с?,721=0.5cic| и 722=0.
Матрица
Г1
- 1.5с? 1
[ -0.5ск$
1J
принадлежит классу М-матриц, если 0.75cfc2 < 1. Это имеет место, например,
при с\ = С2 = 1. Таким образом, начало координат асимптотически устойчиво.
Если нас интересует оценка области притяжения, нам необходимо знать компо
зитную функцию Ляпунова V = diVi + d2V2, т.е. нам необходимо найти по
ложительную диагональную матрицу D, такую что DS + S
T
D > 0. Полагая
ci = С2 = 1, получаем матрицу
2di
-1.5di -0.5d2 1
-1.5di - 0.5d2
2d2
J'
которая является положительно определенной при 1 < d2/d\ < 9. Поскольку, не
умаляя общности, можно умножать функцию Ляпунова на любую положитель
ную константу, мы положим d\ = 1 и запишем композитную функцию Ляпунова
в следующем виде:
V(x)=\х\ +\d2x\, К d2<9.
Тогда оценка области притяжения определяется равенством
Пс={хеВ
2
|V(x) <с},
где с ^ min{l/2, cf2/4}, и этот выбор определяется тем, что множество Ω0 долж
но быть расположено внутри прямоугольника |х$| ^ 1. Заметим, что поверхность
V(x) = с пересекает х\- и ж2-оси соответственно в точках у/2с и (4c/d2)
1
/4
. То
гда минимум расстояния между этими точками достигается при d2 = 2 и с = 0.5.
Δ
Пример 9.8. Математическая модель нейронной сети была введена в па
раграфе 1.2.5 и ее свойства устойчивости исследовались в примере 4.11 с ис
пользованием принципа инвариантности Ла-Салля в условиях предположения
о симметричности матрицы Т, т.е. Тц = Τβ. Это условие позволило предста
вить правую часть уравнения состояния в виде градиента скалярной функции.
Здесь мы опустим это предположение и исследуем свойства устойчивости сети,
рассматривая ее как взаимосвязанную систему, состоящую из подсистем, каж
дая из которых представляет отдельный нейрон. Уравнения этой системы удобно
DS+S
T
D=
386
ГЛАВА 9
представить в терминах входных напряжений на усилителях щ, определяемых
уравнениями
3
где г = 1,2,...,пи^(·)— сигмоидальные функции, Ii — постоянная сила тока
в усилителях, Ri > О и d > 0. Мы будем предполагать, что система имеет конеч
ное число изолированных точек равновесия. Каждая такая точка равновесия и*
удовлетворяет уравнению
0 = £т^(и*)--^<+/;.
Ri
J
Для того чтобы исследовать свойства устойчивости определенной точки равно
весия и*, переместим начало координат в эту точку. Пусть Xi = щ — и*. Тогда
х
г—π
и
г—п
_1_
]ГTij9j(xj + и)) - j^(xi + <) + h
з
2_^TijVj{%j) ~~ jr.
00
*
где
Vi{Xi) = 9г(Хг + <) ~ 9г(и·).
Предположим, что щ(·) удовлетворяет секторному условию
где кц и кгч — положительные константы. Из рисунка 9.1 видно, что это условие
действительно выполняется, если дг(щ) = (2Ум/π)tg~
1
(λπг£г/2Vм),λ > 0. Эта
система может быть представлена в виде (9.32) с
fi(Xi) = -7Гй:
Х
*
+ -ТтТгМХг),
9г{х) = 7Т Х^Л?^.?)-
CiRi
зфг
Используя
*г(#г) — К^г^г
в качестве функции Ляпунова для г-й изолированной системы, получаем
г\ Н\Хг) — /?.*^*
- Чг^г^г^г)·
ЕслиТЦ<0,то
J-ii
x
iVi\Xi) ^ Кгг|^г1^
9.5 . ВЗАИМОСВЯЗАННЫЕ СИСТЕМЫ
387
Рис. 9.1. Секторная нелинейность ty(xi) в примере 9.8
Легко видеть, что правая часть этого неравенства отрицательно определена. Если
Та>0,то
^-г%ХгЦг\Хг) ^ ^-ii^ilXi
В этом случае мы предположим, что Тцк{2 < l/Ri- Тогда производная функ
ции Vi отрицательно определена. Для упрощения обозначений положим
6i=
\Тц\кц,
еслиТц<О,
[ -Тцкг2,
еслиТц>0.
Тогда Vi(xi) удовлетворяет (9.34) и (9.35) на интервале [—Гг,Гг] с
1
а<=
\Д: +
*
<
/'&
=С
*> Фг(^г) = \Хг1
где а^ — положительны по предположению. Перекрестный член д%{х) удовлетво
ряет неравенству
\9i{X)\ < ^ Σ 1^-11^(^)1 ^ ΤΓΣΙ^Μ**!·
ci j^»
J¥*
388
ГЛАВА 9
Таким образом, д^х) удовлетворяет (9.36) с 7м = 0 и η^ = kj2\Tij\/Ci при г Φ j.
Теперь мы можем определить элементы матрицы S:
s
ij—
6i+l/Ri приг=j,
.-\?ij\kj2 при г φ j.
Точка равновесия и* является асимптотически устойчивой, если S принадлежит
классу М-матриц. Оценка области притяжения имеет следующий вид:
Пс=<хеR
n
Y^diVi(xi) ^ с
г=1
где с ^ 0.5mmi{diCirf}, и этот выбор обусловлен тем требованием, что мно
жество Ω0 должно находиться внутри множества \xi\ ^ гг. Приведенный выше
анализ должен быть выполнен для каждой асимптотически устойчивой точки
равновесия. Оценки, полученные в этом примере, являются более консерватив
ными по сравнению с результатами, полученными с использованием принципа
инвариантности Ла-Салля. При этом мы наложили дополнительные условия на
коэффициенты перекрестных связей Тц так, чтобы было выполнено требование
принадлежности 5-классу М-матриц. Кроме того, в этом примере мы получили
лишь локальные оценки областей притяжения для изолированных точек равнове
сия. Объединение этих оценок не покрывает всю исследуемую область. С другой
стороны, мы избавились от требования Тц = Tj{.
Δ
9.6. Медленно меняющиеся системы
Систему
± = /(ж,и(*)),
(9.38)
гдехΕRn
иu(t)GГсR
m
для всех t ^ 0, рассматривают как медленно
меняющуюся, если u(t) непрерывно дифференцируема и ||й(£)|| «достаточно ма
ла». Компонентами вектора u(t) могут быть переменные входа или зависящие
от времени параметры. При анализе (9.38) функция и обычно рассматривается
как фиксированный параметр и предполагается, что для каждого фиксированно
го и = а е Г соответствующая система имеет изолированную точку равновесия,
определяемую равенством х — h(a). Если х = h(a) выполнено равномерно по а,
то разумно ожидать, что медленно меняющаяся система (9.38) будет обладать
тем же свойством. Подобные системы характерны тем, что их движение зависит
в большей степени от начальных данных, нежели от входных воздействий или
изменений параметров. В этом параграфе мы покажем, как теория устойчивости
Ляпунова может быть использована при анализе медленно меняющихся систем.
Предположим, что /(x,tt) локально липшицева на R
n
x Г и для каждого
и G Г уравнение
0 = f(x,u)
9.6. МЕДЛЕННО МЕНЯЮЩИЕСЯ СИСТЕМЫ
389
имеет непрерывно дифференцируемый корень х = h(u), т. е.
0 = f(h(u),u).
Далее, предположим, что
dh
ди
^L, ViiGT.
(9.39)
Для того чтобы выполнить анализ свойств устойчивости фиксированной точки
равновесия х = h(a), переместим начало координат в эту точку с использовани
ем замены переменных z = х — h(a). В результате получим уравнение
def
z = f(z + h(a),a) = g(z,a).
(9.40)
Наша задача состоит в том, чтобы найти функцию Ляпунова и доказать с ее ис
пользованием, что z = 0 является асимптотически устойчивой точкой равнове
сия. Поскольку g(z, а) зависит от параметра а, функция Ляпунова для системы
может в общем случае зависеть от а. Предположим, что мы нашли функцию
Ляпунова V(z,a)9 удовлетворяющую условиям
c1\\z\\
2
^V(z,a)^c2\\z\\
dz
g(z,a) < -c3||z||
2
,
dV
dz
dv_
da
^c4\\z\l
< сьЫ
(9.41)
(9.42)
(9.43)
(9.44)
длявсехzeD={z£Rn\\\z\\<г}иaGГ,гдеQ,г=1,2,...,5 —положи
тельные константы, не зависящие от а. Неравенства (9.41) и (9.42) представляют
собой стандартные условия положительной определенности и убывания функ
ции V, а также отрицательной определенности ее производной вдоль траекторий
системы (9.40). Кроме того, из этих неравенств следует, что начало координат z =
= 0 экспоненциально устойчиво. В этом параграфе мы будем предполагать, что
эти неравенства выполнены равномерно по а. Неравенства (9.43) и (9.44) необ
ходимы для анализа возмущений системы (9.40), обусловленных тем, что u(i)
является зависящей от времени функцией. Дальнейший анализ системы (9.38)
будет проведен с использованием V(z,u) в качестве функции Ляпунова. Замена
переменных z = х — h(u) приводит систему (9.38) к следующему виду:
9(*>и)
(9.45)
390
ГЛАВА 9
где зависимость и обуславливает возникновение члена возмущений в систе
ме (9.40). Производная функции V(zyu) вдоль траекторий (9.45) определяется
равенством
V
f-f^) =
f*M
+
u(t)<
дУ дУdh
ди dz ди\
< -сйА? + c5|N|2||u(i)|| + c4L\\z\\ ||u(t)||.
Полагая
7(i) = gNo(t)|| и i(i) = L||«(t)||,
можно переписать последнее неравенство в виде
V^-c3\\z\\
2
^ca(t)\\z\\
2
+ c4S(t)\\zl
совпадающем по форме с неравенством (9.16) из параграфа 9.3. Поэтому, при
меняя так же, как и в параграфе 9.3, лемму сравнения, можно показать, что ес
ли u(t) удовлетворяет
Jt0
||«(т)\\dr ^ ei(t- to)+щ, где «1<§§•
(9.46)
и°)||<й\/|;
s?iw)»^
2C\OL\T
C4P1L '
где ai и pi определяются равенствами
«1
1сз Siсъ
2 Lc2
"Ci
то z(t) удовлетворяет неравенству
>0, р!=ехр(ЦЛ >1,
CipiL
Mt)\\^\I^PiMO)\\e-^ +
^Jo
,-Ql(t-T) Ι|ω(τ)|| dr.
(9.47)
С использованием этого неравенства можно получить несколько результатов,
в зависимости от предположений, сделанных относительно ||й||. Некоторые из
этих результатов сформулированы в следующей теореме.
Теорема 9.3. Рассмотрим систему (9.45). Предположим, что [dh/du] удо
влетворяет (9.39), ||й(£)|| ^ е для всех t ^ 0. Предположим также, что суще
ствует функция Ляпунова, удовлетворяющая (9.41)-(9.44). Если
С
2С5 г+C4L/C5'
9.6 . МЕДЛЕННО МЕНЯЮЩИЕСЯ СИСТЕМЫ
391
то для любых ||^(0)|| < Гу/с{/с2 решения системы (9.45) равномерно ограниче
ны для всех t^ 0 и равномерно предельно ограничены с границей
Ъ=
C2C4I/6
#(cic3 -бс2с5)'
где θ G (0,1) — произвольная константа. Если, кроме того, ii(t) —> 0 при t —> 00,
тоz(t) —>0wpw£—*оо.Наконец,еслиh(u) =Одлявсехи£Гме<с$/сь,то
z = 0 — экспоненциально устойчивая точка равновесия системы (9.45). Эквива
лентно х = О — экспоненциально устойчивая точка равновесия системы (9.38).
ДОКАЗАТЕЛЬСТВО. Поскольку ||й(£)|| ^ е < С1С3/С2С5, неравенство (9.46)
выполнено при е\ — е и 771 = 0. Следовательно,
оц
1
Гс
з
^51Λ i
Задав верхнюю границу б, получаем
2с\а\г
C4L
>
С\Т
c±L
С\Т
ClCS
сз
.
с
2"
сз
02
V
с
1.
>
_£з х
г
С
2 Г+ C4L/C5
г
С
2С5
г + C4L/C5
Следовательно, неравенство supt^0 ||ω(£)|| < 2C\OL\TIC^L выполнено, и из (9.47)
получаем
И*)Н <
|г(0)||е-
-OL\t
^
V§T ||*(0)||е —ait
+
+
C4L
2с7
θ4^ε
2ciai
Jo
||г(0)||е"
—ait + 6(9.
По прошествии конечного промежутка времени экспоненциально убывающий
член станет меньше (1 — в)Ъ и, следовательно, z(t) предельно ограничено ве
личиной Ь. Если, кроме того, u(i) —• 0 при t —> 00, то из (9.47) видно, что
z(t) —^ 0при£—• 00.Если/i(u)=0длявсехиΕГ,мыможемположитьL=0.
Тогда выражение для верхней границы V упрощается и принимает вид
из которого видно, что z
если б < сз/с5.
V^-(c3-c5e)\\z\\
2
,
0 экспоненциально устойчивая точка равновесия,
Π
392
ГЛАВА 9
д
9(\
Wz
M
<bi
:(z,a) < £2ll*ll
В теореме требуется существование для системы (9.40) функции Ляпуно
ва V(z,a)9 удовлетворяющей неравенствам (9.41)-(9.44). Из леммы 9.8 следует,
что такая функция действительно существует при выполнении некоторых усло
вий гладкости и если эта система экспоненциально устойчива равномерно по а.
Это может быть доказано с использованием функции Ляпунова, существование
которой гарантируется обратными теоремами Ляпунова из параграфа 4.7.
Лемма 9.8. Рассмотрим систему (9.40) и предположим, что g(z,a) —
непрерывно дифференцируемая функция и матрицы Якоби [dg/dz] и [дд/да]
удовлетворяют неравенствам
\да
длявсех(z,a) GDхГ,гдеD={zGRn\\\z\\<г}.Пустьfc,7иго—
положительные константы и TQ < г/к. Определим Do = {z G Rn \ \\z\\ < ro}.
Предположим, что траектории системы удовлетворяют оценкам
\\z(t)\\ < fc||z(0)||e-^, Vz(0) G Γ>0,α G T,t ^ 0.
Тогда существует функция V : DQ X Г —> R, удовлетворяющая (9.41)-(9.44).
Кроме того, если все предполоэюения выполнены глобально (по z), то V(z,a)
определена и удовлетворяет (9.41)-(9.44) на R
n
xГ.
ДОКАЗАТЕЛЬСТВО. Вследствие эквивалентности норм достаточно доказать
лемму для случая 2-нормы. Пусть ф{Ь\г^а) — решение (9.40), начинающееся
в (0,z), т.е. φ(0]Ζ,α) = z. Это обозначение подчеркивает факт зависимости
решения от параметра а. Пусть
V(z,a) = / φτ(1]Ζ,α)φ(^Ζ,
a)dty
Jo
где Τ = 1п(2/с
2
)/27· Аналогично тому, как это было сделано при доказательстве
теоремы 4.14, можно показать, что V(z,a) удовлетворяет (9.41)-(9.43) с с\ =
= [1 - exp(-2LiT)]/2Li, с2 = fc
2
[l - ехр(-27Т)]/27, с3 = 1/2 и с4 = 2к{\ -
—
ехр[—(7 — Li)T]}/(j — Li). Для того чтобы доказать выполнение (9.44) для
V(z,a), заметим, что функция чувствительности 0а(£;г,а) удовлетворяет урав
нению чувствительности
•^Фа = ^(^;2,а),а)4 + ^(^;г,а),а), <£Q(0;z,a) -0,
из которого можно получить следующую оценку:
\\φα&Ζ,α)\\2<:
/ ii||<Mr;2:,a)||2dT +
Jo
dr^
/
L2U(r;z,a
Jo
^ f Li||0a(r;^a)||2dr+ / L2ke^
r
dr\\z\\2 <
Jo
Jo
< f'Ыфа{т;г,а)\\2ат
+
^\\г\\2.
9.6 . МЕДЛЕННО МЕНЯЮЩИЕСЯ СИСТЕМЫ
393
Используя неравенство Гронуолла-Беллмана, получаем
Noe(i;*,a)l|2<^N|2e
Llt
.
Следовательно, выполнены неравенства
ψ-\
= \\[ 2φτ(1]Ζ,α)φα{1]Ζ,α)αΙ
fJo
<
£/
2ke-~<
t
\\zh(^)e
Llt
\\z\\2dt^
\Ч2Ι-ψJe
й
2k2L2
7(7-L0
1-е
-h-LiYT \4l = cb\\z\\l
из которых следует утверждение теоремы.
Π
В случае если система (9.40) линейна, функция Ляпунова, удовлетворяю
щая (9.41)-(9.44), может быть явно определена путем решения параметризован
ного уравнения Ляпунова. Это утверждение формулируется в виде следующей
леммы.
Лемма 9.9. Рассмотрим систему z = A(a)z, где α Ε Τ и А(а) — непре
рывно дифференцируемая матрица. Предположим, что элементы матрицы А
и их первые частные производные по а равномерно ограничены, т. е.
Ш«)Ь < с,
_д_
да.
А(а) О*,
VaeT, VI <г ^ га.
Предположим также, что А(а) гурвицева равномерно по а, т. е.
Re[A(i4(a))] ^ -σ < 0, Va G Г.
Тогда уравнение Ляпунова
РА(а) + А
Т
(а)Р =
-I
(9.48)
имеет единственное положительно определенное решение Р(а) для каждой
a Ε Г. Кроме того, P(ot) непрерывно дифференцируема и удовлетворяет нера
венствам
c\z
T
z^z
T
P(a)z ^ C2ZT
z,
tp{a) ^μ^VI^г^т
длявсех(г,а)6Rn
х Г, где с\, С2, и μ\ — не зависящие от а положительные
константы. Тогда V(z,a) = z
T
P(a)z удовлетворяет (9.42)-(9.44) (для 2-норм)
сс3=1,с4=2с2ис5=\JYT-i
~V>b
394
ГЛАВА 9
ДОКАЗАТЕЛЬСТВО. ИЗ равномерной гурвицевости матрицы А(а) следует,
что матричная экспонента ехр[£А(а)] удовлетворяет неравенству
||ехр[*А(а)]|| ^ к{А)е^\ Vt > 0,Vc* е Γ,
где β > О не зависит от а, но к(А) > 0 зависит от а. То, что свойство экс
поненциального убывания границы выполняется равномерно по а, следует из
ограниченности величины ||А(а)||. Множество матриц, удовлетворяющих нера
венствам Re[A(A(a))] ^ — σ и ||А(а)|| < с, компактно. Обозначим это множество
через S. Пусть А и В — два любых элемента множества S. Рассмотрим
8
exp[t(A + В)] = exp[tA] + / exp[(i - т)А]В ехр[т(А + В)] dr.
Jo
С учетом того что граница ехр[£А] экспоненциально убывает, имеем
|| exp[t(A + В)]|| < к(А)е~^ + / к(А)е'^
г
-
т
Цв\\ || ехр[т(Л + В)]\\ dr.
Jo
Умножая это неравенство на е^*, получаем
e&\\exp[t(A + B)]\\^k(A) + k{A)\\B\\ [ e^||exp[r(A + S)]||dr.
Jo
Используем неравенство Гронуолла-Беллмана:
||exp[t(A + B)]|| < к{А)е~^-^
А
^
в
^\
V*>0.
Следовательно, существуют положительная константа η < β и некоторая окрест
ность Af(A) матрицы А такие, что если С G Л/"(А), то
||exp[tC]|| ^к(А)е~ч\ V* ^ 0.
Поскольку S компактно, оно покрывается конечным числом таких окрестностей.
Следовательно, мы можем найти не зависящую от а положительную константу к,
такую что
||exp[L4(a)]|| < fee"
7
*,Vt^0,Va€Г.
Рассмотрим уравнение Ляпунова (9.48). Существование единственного положи
тельно определенного решения для всех а £ Г гарантируется теоремой 4.6. Кроме
того, из доказательства этой теоремы следует, что
Р(а)=Г[е
ы
^]
Т
[е
ы
М]<И.
8
Это матричное тождество может быть доказано, если записать х = (А + В)хв виде х = Ах +
+ Вх и рассмотреть Вх в качестве входа системы. Подставляя x(t) — exp[t(A + В)]хо в Вх,
получаем решение системы
exp[t(A + В)]хо = exp[tA]xo + / exp[(t - т)А]В ехр[т(Л 4- В)]хо dr.
Jo
Поскольку это выражение выполнено для всех хо Ε Rn
, получаем требуемое матричное тожде
ство.
9.6. МЕДЛЕННО МЕНЯЮЩИЕСЯ СИСТЕМЫ
395
Поскольку А(а) непрерывно дифференцируема, этим же свойством обладает
и матрица Ρ (а). Имеем
z
T
P(a)z < £k*e-**\\z\\ldt
= £\\z\\l =•с2= £.
Пусть y(t) = е*^^г. Тогда у = А(а)у,
-*
Т
(*Ж*) = -y
T
(t)A(a)y(t) < ||A(a)||2i/T(t)i/(t) < q/T(t)i,(i)
/»oo
/»oo
^
P(a)z = / yT(t)y(t) dt> J ^y
T
{t)y{t) dt =
=
ТсГ i[
-
yT{t)yit)] dt =
Tc
[
-
yT{t)y{m
°
Найдем частную производную P(a)A(a) + A
T
(a)P(a) = -I no каждому из
компонентов щ вектора а и обозначим производную Ρ (а) через Р'(а). Тогда
Р\а)А{а) + А
т
(а)Р'{а) = -{P(a)A'(a) + [A'(a)]TP(a)}
и Р'(а) определяется равенством
Р'\
Следовательно,
\а)=/[e
tA
^\ {P(a)A'(a) + [А'(а)]Т Р(а)} etA(a) dt.
\\P'(a)h^fee-^bidt=
b
^^t,l=
b
^,
что завершает доказательство леммы.
Π
Следует заметить, что множество Г в лемме 9.9 не обязательно является
компактным. Если Г компактно, ограниченность А(а) и ее первых производных
следует из предположения о том, что А(а) непрерывно дифференцируема.
Пример 9.9. Рассмотрим систему
х = A(et)x,
где ε > 0. Если ε достаточно мала, мы можем исследовать эту систему как мед
ленно меняющуюся. Она представлена в форме (9.38) с и = εε и Г = [0, оо). Для
любого и G Г начало координат х = 0 является точкой равновесия системы. Сле
довательно, этот пример соответствует частному случаю предыдущей леммы для
396
ГЛАВА 9
h(u) = 0. Предположим, что Re[A(A(a))] < — σ < 0 и А(а), А'(а) равномерно
ограничены для всех a G Г. Тогда решение уравнения Ляпунова (9.48) обла
дает свойствами, установленными в лемме 9.9. Используя V(x, и) = х
т
Р(и)х
в качестве функции Ляпунова для системы х = А(и)х, получаем
V(t,x) = x
T
[P(u(t))A(u(t)) + A
T
(u(t))P(u(t))}x + х
т
Ρ'(u(t))u(t)x <
l|2
Il2>
<-x
T
x + ec5||x||2 = -(1 - ec5)||x||
2
где С5 — верхняя граница ||Ρ'(α)||2. Поэтому для всех ε < 1/с$ начало координат
х = 0 является экспоненциально устойчивой точкой равновесия системы х =
= A(ct)x.
Δ
9.7. Упражнения
9.1 ([150]). Рассмотрим уравнение Ляпунова РА + А
Т
Р= -Q,гдеQ=Q
T
>0
и Л — гурвицева матрица. Пусть /i(Q) = Amin(Q)/Amax(P).
(a) Покажите, что μ(1$0>) — v{Q) для любой положительной константы к.
(b) ПустьQ=Q
T
> 0 имеет Amin(Q) = 1. Покажите, что μ(Ι) ^ μ{0).
(c) Покажите, что μ(Ι) ^ μ{€}),\/(} = Q
T
>0.
Указание: в пункте (Ь) пусть Pi и Р2 — решения уравнения Ляпунова для Q = I
и Q = Q соответственно. Покажите, что
/»оо
Рг-Р2=
/ exp(ATt)(I - Q) exp(At) dt ^ 0.
9.2. Рассмотрим систему х = Ах + Бгг, и пусть и = — Fx — стабилизирую
щая обратная связь по состоянию, т. е. матрица (А — BF) является гурвице-
вой. Предположим, что вследствие физических условий значения щ ограничены
\ui(t)\ ^ L. Замкнутая система может быть представлена в виде системы х =
= Ах — BLssi(Fx/L),
где sat(v) — вектор, г-е компоненты которого являются
функциями насыщения. Прибавляя и вычитая BFx, можно переписать уравне
ние состояния замкнутой системы в виде х = (А — BF)x — Bh(Fx), где h(v) —
= Lsat(v/L) — v. Тогда указанные ограничения могут рассматриваться как воз
мущение номинальной системы без ограничений.
(а) Покажите, что
ЫУ)\^—^ -=Г\Щ\,\/\Щ\^Ц1
+ 6),
(1+5)'
гдеδ>0.
(b) Пусть Ρ — решение уравнения
Р(А-BF)+(А-BF)TP =
-I.
9.7. УПРАЖНЕНИЯ
397
Покажите, что производная функции V(x) = x
T
Px вдоль траекторий за
мкнутой системы отрицательно определена в области |(Рх)г| < L(l + <$), Уг
при условии, что δ/(1 + δ) < 1/(2||ΡΡ||2||Ρ||2).
(c) Покажите, что начало координат асимптотически устойчиво, и обсудите пу
ти определения области притяжения.
(d) Примените полученный в пункте (с) результат к случаю
F=[1 2] и L=l
и оцените область притяжения.
9.3. Рассмотрим систему
х=f(t,x) +Bu, y=Cx и
u=-g(t,y),
где /(£,0) = 0, g(ty0) = 0 и ||р(£,у)|| ^ 7IMI Для
всех
t ^ 0. Предположим, что
начало координат системы х = f(t,x) глобально экспоненциально устойчиво,
и пусть V(t,x) — функция Ляпунова, глобально удовлетворяющая (9.3)-(9.5).
Найдите границу 7* для 7? такую что начало координат этой системы глобально
экспоненциально устойчиво при 7 < 7*·
9.4. Рассмотрим возмущенную систему
х=Ах+В[и+g(t,x)],
где g(t,x) — непрерывно дифференцируемая функция, удовлетворяющая нера
венству ||<7(£,х)||2 < &||#||2> Vt ^ 0, \/х Ε Вг для некоторой г > 0. Пусть
Ρ=Р
т
> 0 — решение уравнения Риккати
РА+А
Т
Р+Q-РВВ
Т
Р +2аР=0,
гдеQ^fc
2
/ и α > 0. Покажите, что закон управления и = —В
т
Рх стабилизи
рует начало координат возмущенной системы.
9.5 ([101]). Рассмотрим возмущенную систему
х=Ах+Ви+Dg(t,у),у=Сх,
где g(t,y) — непрерывно дифференцируемая функция, удовлетворяющая нера
венству ||#(£,2/)||2 ^ &1М|2> Vi > 0, V||y||2 < г* для некоторой г > 0. Предполо
жим, что уравнение
РА+А
Т
Р+eQ-\РВВТР +}-PDD
T
P+^С
Т
С=0,
гдеQ=Q
T
>0? ε>0π0<7< 1А> имеет положительно определенное
решение Ρ = Р
т
> 0. Покажите, что и = —{1/2е)ВтРх стабилизирует начало
координат возмущенной системы.
А=01
0.5 1
,в=0
1
398
ГЛАВА 9
9.6. Рассмотрим систему
xi = -aa?i- ωΧ2+(Pxi- 7^2)(#?+#2)5
х2 =ωΧ\- ах2+(7#1+β%2)(#i+ х\),
где α > О, /3, j πω > 0 — некоторые константы.
(a) Рассматривая эту систему как возмущение линейной системы
Х\ — —OiX\ — UJX2-> Х>2 = UX\ — OtX2->
покажите, что начало координат возмущенной системы экспоненциально
устойчиво и множество {||х||2 ^ г] содержится в области притяжения, если
\β\ и |7| достаточно малы. Найдите верхние границы для \β\ и |7| в терми
нах г.
(b) Используя V(x) = х\ + х\ в качестве функции Ляпунова для возмущен
ной системы, покажите, что начало координат глобально экспоненциаль
но устойчиво, если β < 0, и экспоненциально устойчиво и множество
{||ж||2 < Va/β} содержится в области притяжения, если β > 0.
(c) Сравните результаты пунктов (а) и (Ь) и прокомментируйте консервативный
характер результата в пункте (а).
9.7. Рассмотрим возмущенную систему
х = f(x)+g(x).
Предположим, что начало координат номинальной системы х = f(x) асимпто
тически (но не экспоненциально) устойчиво. Покажите, что для любой 7 > 0
существует функция д(х), удовлетворяющая в некоторой окрестности начала ко
ординат неравенству ||^(х)|| ^ 7llxll> такая что начало координат возмущенной
системы неустойчиво.
9.8 ([66]). Рассмотрим возмущенную систему
* = f(x) +9(x),
где f(x) и д(х) — непрерывно дифференцируемые функции и ||^(ж)|| ^ 7IWI
для всех ||ж|| < г. Предположим, что начало координат номинальной системы
х — f(x) асимптотически устойчиво и существует функция Ляпунова V(x),
удовлетворяющая неравенствам (9.11)—(9.13) для всех ||х|| < г. Пусть Ω =
= {V(x) ^ с},гдес< а\(г).
(a) Покажите, что существует положительная константа 7*> такая что при η <
7* решения возмущенной системы, начинающиеся в Ω, остаются в Ω для
всех t ^ 0 и предельно ограничены /С-функцией η.
(b) Предположим, что номинальная система характеризуется дополнительным
свойством, заключающимся в том, что А = [df/dx] (0) является гурвицевой.
Покажите, что существует 7i, такая что при 7 < 7i решения возмущенной
системы, начинающиеся в Ω, стремятся к началу координат при t —> сю.
9.7 . УПРАЖНЕНИЯ
399
(с) Будет ли верен результат пункта (Ь), если А не является гурвицевой? Рас
смотрите частный случай, когда
/(*) =
д(х)=а
-х2
-(2xi + х3)
3Ι
XI
я1- жз- (2а?1+хз)
3
О
О
,
афО.
Указание: для примера из пункта (с) используйте
V(x) =х\+\х\ +\х\ +xix3
для доказательства того, что начало координат системы х = f(x) асимптотически
устойчиво, и примените теорему 4.16 с целью определения функции Ляпунова,
удовлетворяющей (9.11)—(9.13).
9.9. Рассмотрим систему
Х\= ~х\ +Х%-7^2, #2= —х\-#2+7(^1+
х
2), 0^7<£'
(a) При 7 = 0 покажите, что начало координат глобально асимптотически
устойчиво. Является ли оно экспоненциально устойчивым?
(b) При 0 < 7 ^ 1/2 покажите, что начало координат неустойчиво и решения
системы глобально предельно ограничены предельной границей, являющей
ся некоторой /С-функцией от η.
9.10 ([19]). Рассмотрим систему
х\ = Х2, Х2 = —asinxi — 6xi — сх2 — ч(сх\ + 2х2) + g(£)cosxi,
где α, Ъ > а, с и η — положительные константы и g(£) — непрерывная функция.
(a) При q(t) = 0 используйте функцию
V(x) = (6+ \<?)х\ + cxiX2+ #i + 2a(l — cosxi)
и покажите, что начало координат глобально экспоненциально устойчиво.
(b) Исследуйте свойства устойчивости системы при q(t) ^ Ои \q(t)\ < к для
всехt^0.
9.11. Рассмотрим систему
xi = [(sinx2)
2
-
1]»1,#2= -6xi - (1+6)х2·
400
ГЛАВА 9
• При 6 = 0 покажите, что начало координат экспоненциально устойчиво
и глобально асимптотически устойчиво.
• При 6 φ 0 покажите, что начало координат экспоненциально устойчиво при
достаточно малой величине |6|, но не является глобально асимптотически
устойчивым вне зависимости от того, насколько мала |6|.
• Обсудите результаты пунктов (а) и (Ь) в контексте задачи робастности, рас
смотренной в параграфе 9.1, и покажите, что при 6 = 0 начало координат не
является глобально экспоненциально устойчивым.
9.12 ([8]). Рассмотрим систему
х\ = —х\+(х\+а)ж2,&2 = —£i(#i+а)4-6x2,аф0.
(a) Пусть 6 = 0. Покажите, что начало координат глобально асимптотически
устойчиво. Является ли оно экспоненциально устойчивым?
(b) Пусть 6 > 0. Покажите, что начало координат экспоненциально устойчиво
при 6 < min{l,a
2
}.
(c) Покажите, что начало координат не является глобально асимптотически
устойчивым при любой 6 > 0.
(d) Обсудите результаты пунктов (а)-(с) в контексте задачи робастности, рас
смотренной в параграфе 9.1, и покажите, что при 6 = 0 начало координат не
является глобально экспоненциально устойчивым.
Указание: в пункте (d) матрица Якоби номинальной системы не является
глобально ограниченной.
9.13. Рассмотрим скалярную систему х = —х/(1 + х
2
)иV(x) = x
A
.
(a) Покажите, что неравенства (9.11)—(9.13) выполнены глобально при
ai(r) = а2(г) = г
4
; аз(г) =
г
; а4(г) =4г
3
.
1+г
А
(b) Покажите, что эти функции принадлежат классу /Соо·
(c) Покажите, что правая часть (9.14) стремится к нулю при г —> оо.
(d) Рассмотрим возмущенную систему х = — х/(1 + х
2
)+δ,гдеδ—поло
жительная константа. Покажите, что при δ > 1/2 решение x(t) стремится
к бесконечности при любом начальном состоянии системы х(0).
9.14. Покажите, что D+W{t) удовлетворяет (9.17) при V = 0.
Указание: покажите, что V(t + h,x(t + h)) < 0.5c4/i2||g(£, 0)||2
+ ho(h), где
o(h)/h —> 0 при h —> 0. Далее используйте тот факт, что Л/СА/2С\ ^ 1.
9.15. Рассмотрим линейную систему из примера 9.6, но заменим сделанное для
B(t) предположение на следующее: /0°° ||В(£)||<й < оо. Покажите, что начало
координат экспоненциально устойчиво.
9.7 . УПРАЖНЕНИЯ
401
/(0, х) = Ах- {х\ + х\)Вх,
А=
9.16. Рассмотрим линейную систему из примера 9.6, но заменим сделанное для
B(t) предположение на следующее: /0°° ||Б(£)||2
<Й < оо. Покажите, что начало
координат экспоненциально устойчиво.
Указание: используйте неравенство
Jv(t)dt^\(Ъ-а)Iv
2
(t)dt, Vv(t) ^ 0,
которое следует из неравенства Коши-Шварца.
9.17. Рассмотрим систему х = A(t)x, где A(t) — непрерывная матрица. Пред
положим, что Нтг-юо A(i)A существует и А гурвицева. Покажите, что начало
координат экспоненциально устойчиво.
9.18. Выполните пункт (Ь) упражнения 9.10 в случае, когда q(t) ограничена
иq(t)—»0приt—>ос.
9.19. Рассмотрим систему х = /(£,х), где \\f(t,x) — /(0,ж)||2 ^ iWll^lb Для
всехt^0,хеR
2
,j(t) —>0приt—• оо,
—α
—ω1
_
ГβΩ
ω -а\'
~
[-Ω β
и α, /?, α>, Ω — положительные константы. Покажите, что начало координат
глобально экспоненциально устойчиво.
9.20. Рассмотрим систему х = f(x) + G(x)u + w(t), где ||ги(£)||2 < а + се~
1
.
Пред
положим, что существует симметричная положительно определенная матрица Р,
положительно полуопределенная функция W(x) и положительные константы 7
и σ, такие что
2x
T
Pf(x) + 7ХТРя + И^ж) - 2ax
T
PG(x)GT(x)Px
<0,VxGiT.
Покажите, что при η = —aG
T
(x)Px траектории замкнутой системы равномерно
предельно ограничены величиной 2акХт&к(Р)/'у\т[П(Р) для некоторой к > 1.
9.21. Рассмотрим возмущенную систему (9.1). Предположим, что существует
функция Ляпунова V(t,x), удовлетворяющая (9.11)—(9.13). Пусть член возму
щения удовлетворяет неравенству ||р(*,ж)|| < S(t), \/t ^ 0,Vx e Ζλ Покажите,
чтодлялюбых€>0иΔ>0существуютту>0иρ>0,такиечтопри
(1/Δ)//+ S(r)dr < η любое решение возмущенной системы с ||я(£о)|| < Ρ
удовлетворяет ||ж(£)|| < e,Vt ^ to,
(Этот результат известен как свойство устойчивости при постоянно действую
щих ограниченных в среднем возмущениях [107].)
Указание: пусть W = y/V, выберите на интервале времени точки to + iA, г =
—
0,1,2,..., и покажите, что W(to+iA) удовлетворяет разностному неравенству
W(t0 +(г+1)Δ)<e-
aA
W(t0 + гА) + kVA.
9.22.ПустьА—(пхп)-матрица, такаячтоац ^ 0длявсехгφjиац>
> Y^j^i |ау |, г = 1,2,..., п. Покажите, что А принадлежит классу М-матриц.
Указание: покажите, что Σ?=1 α^· > 0, г = 1,... ,п, и, используя метод матема
тической индукции, докажите, что все ведущие главные миноры положительны.
402
ГЛАВА 9
9.23. Предположим, что условия теоремы 9.3 выполнены при
Фг(Хг) = NH, QlNII2
^ Vi(t,Xi) < Q2||Xz||
2
·
Покажите, что начало координат экспоненциально устойчиво.
9.24 ([132]). Исследуйте свойства устойчивости начала координат системы
х\ = —х\ — 1.5xi |#2|3
,
^2= —х\+ х\х\
с использованием композитной функции Ляпунова.
9.25. Исследуйте свойства устойчивости начала координат системы
*1=Х2+#2#з>
^2=
—XI
-
Х2+%Ь #3=Х\+#2~#з
с использованием композитной функции Ляпунова.
9.26. Рассмотрим линейную взаимосвязанную систему
т
Х% ==
-^-ЦХг ~г / ^ AijXj) %== 1,Δ, ... ,772,
где Xi — векторы размерности щ и Ац — гурвицевы матрицы. Исследуйте свой
ства устойчивости начала координат системы с использованием композитной
функции Ляпунова.
9.27 [175]). Сложная взаимосвязанная система может быть подвержена структур
ным возмущениям, что приводит в процессе ее функционирования к тому, что
группы подсистем подключаются друг к другу или отключаются друг от друга.
Система с подобными структурными возмущениями может быть представлена
в виде
%г
=
JiV")
x
i) ' 9ъ\Р)е
г1^1>···j
e
im%m))
Z=1,z,...,771,
где eij — бинарная переменная, принимающая значение 1, если j-я подсистема
действует на г-ю подсистему, и значение 0 в противном случае. Начало коорди
нат взаимосвязанной системы называется коннективно (connective) асимптоти
чески устойчивым, если оно асимптотически устойчиво для всех конфигураций
соединений во взаимосвязанной системе, т. е. для всех возможных значений би
нарных переменных е^. Предположим, что все условия теоремы 9.2 выполнены
для неравенства (9.36), принимающего в этом случае вид
т
\\9i(t
г=1
Покажите, что начало координат коннективно асимптотически устойчиво.
9.28 ([49]). Выход y(t) линейной системы
х=Ах+Ви,у=Сх
должен отслеживать эталонное входное воздействие г. Рассмотрим интеграль
ный регулятор
Ζ—τ
—
Сх, и = —F\x—F2Z.
9.7 . УПРАЖНЕНИЯ
403
Предполагается, что состояние х может измеряться и матрицы F\ и F2 выбраны
таким образом, что матрица
ГА-SFi -BF2 l
[-С
0\
гурвицева.
(a) Покажите, что если г = const, то y(t) —> г при t —• оо.
(b) Исследуйте свойства устойчивости системы, если r(i) является медленно
меняющимся входным воздействием.
9.29 ([86]). Выход y(t) нелинейной системы
x=f(x,u), y=h(x)
должен отслеживать эталонное входное воздействие г. Рассмотрим интеграль
ный регулятор
z=г—h(x), и =7(ж,z,г).
Предполагается, что состояние ж может измеряться и функция η выбрана таким
образом, что замкнутая система
х=/(ж,7(х,*,г)),i =г- h(x)
имеет экспоненциально устойчивую точку равновесия (ж, г) и функции /, /г, и 7
дважды непрерывно дифференцируемы по своим аргументам.
(a) Покажите, что если г = const и начальное состояние (ж(0), г(0)) достаточно
близко к (ж,г), то y(i) —» г при £ —> оо.
(b) Исследуйте свойства устойчивости системы, если r(i) является медленно
меняющимся входным воздействием.
9.30 ([86]). Рассмотрим задачу слежения из примера 9.29, но предположим, что
измерению доступен лишь выход системы у = h(x). Рассмотрим интегральный
контроллер с наблюдателем
h = f{zi,u) + G{r)[y-h(zi)],
z2=r-y
иu=
j(zuz2,r).
Предположим, что η и G выбраны таким образом, что замкнутая система имеет
экспоненциально устойчивую точку равновесия (ж, г 1,^2)· Исследуйте свойства
устойчивости системы, если
(1) г = const;
(2) r(t) медленно меняющееся воздействие.
9.31. Рассмотрим линейную систему х = A(t)x, где ||.А(£)|| ^ к и собственные
значения матрицы A(t) удовлетворяют Re[A(t)] ^ —σ для всех t ^ 0. Предполо-
оо
жим, что J \\A(t)\\2dt ^ р. Покажите, что начало координат системы х = A(t)x
о
экспоненциально устойчиво.
ГЛАВА 10
Теория возмущений и усреднение
Решения нелинейных дифференциальных уравнений удается получить в яв
ном виде лишь для некоторых классов дифференциальных уравнений. В общем
случае приходится довольствоваться лишь аппроксимацией этих решений. Суще
ствует две различные категории методов аппроксимации, которые доступны для
использования инженерами и учеными в задачах анализа нелинейных систем:
(1) численные методы получения решения и (2) асимптотические методы. В этой
и следующей главах мы рассмотрим некоторые асимптотические методы анализа
нелинейных дифференциальных уравнений
1
.
Рассмотрим уравнение состояния
i = /(t,s,e),
где ε — «малый» скалярный параметр. Предположим, что при некоторых усло
виях это уравнение имеет решение x(t,e), определенное в явном виде. Уравне
ния этого типа возникают в различных приложениях. Целью асимптотическо
го метода является получение аппроксимирующего решения x(t,e), такого что
ошибка аппроксимации x(t,e) — x{t,e) мала в некоторой норме при малой |ε|.
При этом приближенное решение x(t,e) должно быть представлено в терминах
уравнений, которые проще исходного уравнения. С практической точки зрения
важность асимптотических методов заключается в том, что они позволяют вы
явить внутренние структурные свойства, присущие исходному уравнению со
стояния при малой |ε|. В параграфе 10.1 мы рассмотрим примеры, в которых
асимптотические методы позволяют обнаружить слабое взаимодействие между
изолированными подсистемами, а также исследовать роль слабой нелинейности,
имеющейся в системе. Более важным аспектом использования асимптотических
методов является то, что они позволяют исследовать системы, в которых при
сутствуют структуры с различными постоянными времени. Очень часто реше
ние уравнения состояния демонстрирует поведение, характеризующееся тем, что
некоторые переменные изменяются быстрее других, что приводит при рассмот
рении подобных систем к разделению переменных на «быстрые» и «медленные».
Методы усреднения, рассмотренные в этой главе, и методы сингулярных воз
мущений, которые будут рассмотрены в следующей главе, учитывают характер
взаимодействия этих быстрых и медленных переменных.
'Численные методы решения дифференциальных уравнений не рассматриваются в этой книге,
т. к. предполагается, что студенты знакомы с этими подходами из учебных курсов по дифференци
альным уравнениям и численному анализу.
10.1. МЕТОД ВОЗМУЩЕНИЙ
405
В параграфе 10.1 представлен классический метод возмущений, использу
емый при нахождении приближенного решения в виде конечного ряда Тейлора
для точного решения. Достоверность этого метода в асимптотике обосновыва
ется для конечного интервала времени в параграфе ЮЛ, а для бесконечного —
в параграфе 10.3. В параграфе исследуется автономная система, подвергающаяся
воздействию слабого периодического возмущения. Результаты этих первых трех
параграфов интересны не только сами по себе, но также и тем, что они представ
ляют собой теоретический базис для метода усреднения. В параграфе 10.4 будет
введен метод усреднения для простейшего случая, когда функция в правой ча
сти уравнения является периодической по времени. Этот вариант метода иногда
называют методом «периодического усреднения». В параграфе 10.5 рассматрива
ется применение метода усреднения для исследования периодических решений
слабо нелинейной системы второго порядка. Наконец, более общая форма метода
усреднения будет представлена в параграфе 10.6.
10.1. Метод возмущений
Рассмотрим систему
x = /(t,x,e),
(10.1)
где/ :[tojii]xD
х
[—εο,εο] —> Д
п
—
функция, «достаточно гладкая» по сво
им аргументам, заданная в области D С Rn
.
Условия гладкости будут конкре
тизированы по мере изложения. Предположим, что необходимо найти решение
уравнения состояния (10.1) для заданного начального состояния
x(to) = τ/(ε),
(10.2)
которое может «гладко» зависеть от ε. Решение задачи (10.1) и (10.2) зависит
от параметра ε, и это подчеркивается введенными обозначениями для решения
системы x(t,e). При использовании метода усреднения «малость» параметра ε
используется при нахождении приближенного решения, которое аппроксимиру
ет точное при малой величине |ε|. Простейшие приближенные результаты могут
быть получены, если положить г = 0в(10.1)и (10.2). Это приводит к номиналь
ной (или невозмущенной) системе вида
£ = /(t,x,0), x(t0) = m,
(Ю.З)
где ηο = 7/(0). Предположим, что эта задача имеет единственное решение xo(t),
определенное на [to>*i] и xo(t) Ε D для всех t G [to, ^i]- Предположим так
же, что / непрерывна по (t,x,e) и локально липшицева по (ж, ε) равномерно
по t; функция η локально липшицева по ε для (£,ж,е) из [to» *i] x D х [—εο,εο].
Близость решений возмущенной системы к решениям невозмущенной системы
следует из непрерывности решений по начальным данным и параметрам. В част
ности, из теоремы 3.5 следует, что существует положительная константа ε\ < εο,
такая что для всех |ε| ^ ε\ задача (10.1) и (10.2) имеет единственное решение
406
ГЛАВА 10
x(t,e), определенное на [to^i]· Далее, из теоремы 3.4 следует, что существует
положительная константа к, такая что
\\x(t,e) - x0(t)\\ ^ k\e\, ν|ε| < ebW G Mi].
(10.4)
Если ошибка аппроксимации удовлетворяет оценке (10.4), мы будем говорить,
что эта ошибка имеет порядок О (ε), и писать
x(t,e) — xo(t) = О (ε).
Это обозначение для порядка малости, которое будет часто использоваться на
протяжении этой и следующей глав, определяется следующим образом.
Определение 10.1. δ\(ε) = 0(^(ε)), если существуют положительные
константы кис, такие что
Ые)\ < k\S2(e)l V|e|<c.
Пример 10.1.
• εη=0(ε7ΤΙ)длявсехη^га,т.к.
|е|
п
= ΙεΠεΓ""
1
<|εΓ,Υ|ε|<1.
•ε
2
/(0.5 + ε) = Ο(ε2),τ.κ.
< jrzr—kl
2
,
ν|ε| <c<0.5.
0.5 —с
1
'
''
• 1+2ε=0(1),τ.κ.
|1+2ε|<1+2с,ν|ε|<α
• ехр(—c/ε), где с и ε — положительные константы, имеет порядок 0(εη) для
любого положительного числа п, т. к.
-рг< {15) е
> νε>0.
Δ
Что можно сказать о значении ошибки аппроксимации #(ε,ε) — хо(0 при
заданном значении ε, когда ошибка имеет порядок О (ε)? К сожалению, не су
ществует прямого метода получения на основе информации о порядке вели
чины О (ε) численного значения величины ошибки. Если ошибка имеет поря
док О (ε), это означает, что ее норма меньше чем к\е\ для некоторой положитель
ной константы к, не зависящей от ε. Однако нам не известно значение к — оно
0.5 +ε
10.1. МЕТОД ВОЗМУЩЕНИЙ
407
может быть равно 1, 10 или любому другому положительному числу
2
. Тот факт,
что к не зависит от ε, гарантирует лишь то, что значение к\е\ монотонно убы
вает при уменьшении |ε|. Поэтому при достаточно малой |ε| ошибка будет мала.
Точнее говоря, задав некоторый допустимый предел 5, мы можем быть уверены
в том, что норма ошибки будет меньше δ для всех |ε| < δ/к. Если этот предел
слишком мал для того, чтобы можно было получить решение для константы ε со
значениями, требуемыми сутью исследуемой задачи, необходимо увеличить сте
пень достоверности приближенного решения с использованием аппроксимации
более высоких порядков. Аппроксимация порядка О (ε2) будет приемлемой при
допустимом пределе достоверности решения δ для всех |ε| < д/(5/&2, аппрок
симация порядка 0(ε3) будет приемлемой для всех |ε| < (δ/k^)
1
^
3
и так далее.
Несмотря на то что константы к, &2, к%,... не обязательно должны быть рав
ны, длины этих интервалов для ε увеличиваются, поскольку значение предела
достоверности δ обычно меньше единицы. Другой подход к рассмотрению ап
проксимации более высокого порядка заключается в следующем: для заданного
«достаточно малого» значения ε ошибка порядка 0(εη) будет меньше ошибки
порядка О (ε771
), определенной для т < п, поскольку
—
<1,V|£|<
UJ
Аппроксимации высокого порядка для решений задачи (10.1) и (10.2) могут быть
получены непосредственными вычислениями, если функции /иг/ достаточно
гладкие. Предположим, что / и η имеют при (t,x,e) £ [to,ti] х D х [—εο,εο]
непрерывные частные производные по (ж, ε) до порядка N включительно. Для
того чтобы получить аппроксимацию высокого порядка для х(£, ε), выпишем ко
нечный ряд Тейлора
ЛГ-1
x(t,e) = Σ Xk{t)e
k
+e
N
Rx(t,e).
(10.5)
к=0
Далее необходимо выполнить две операции. Первое, необходимо вычислить чле
ны жо, жь ..., Ж]у-1. Одновременно с этим будет показано, что эти члены хорошо
определены. Второе, необходимо показать, что оставшийся член Rx также хоро
шо определен и ограничен на [io, h]. Тогда величина ^,к=о
x
k(t)z
k
будет аппрок
симацией x(t, ε) порядка 0(εΝ) (Ν-το порядка). По теореме Тейлора
3
требование
гладкости для начального состояния η(ε) гарантирует существование конечного
2
Следует заметить, однако, что в хорошо сформулированной задаче на возмущения, в которой
переменные нормализованы так, что переменные состояния, времени и параметр возмущения яв
ляются безразмерными, следует ожидать, что значение к будет не намного превышать единицу.
В примере 10.4 мы рассмотрим подобную нормализацию. Другие примеры приведены в рабо
тах [98] и [141].
3
См. [10, теорема 5-14].
408
ГЛАВА 10
ряда Тейлора для η(ε), τ. е.
Ν-1
к=0
Тогда
Xk(to) = Vk, * = 0,1,2,...,ΛΓ-1.
Подставляя (10.5) в (10.1), получаем
Ν-1
Σ *к(Ь)е
к
+e
N
Rx(t, ε) = f(t, x(t, ε), ε) =
f
h(t, ε)
Ν-1
= Ythk(t)ek
+e
N
Rh(t9e)J
(10.6)
k=0
где в качестве коэффициентов ряда Тейлора h[t^e) выступают функции от ко
эффициентов ряда Тейлора для x(t,e). Поскольку (10.6) выполнено для всех до
статочно малых ε, оно должно выполняться тождественно по ε. Следовательно,
коэффициенты при соответствующих степенях ε должны быть равны. Прирав
нивая эти коэффициенты, получаем систему уравнений, которым должны удо
влетворять хо, х\ и так далее. Прежде чем выполнить этот шаг, мы должны
определить коэффициенты ряда Тейлора для h(t, ε). Член нулевого порядка ho(t)
определяется равенством
M*) = /(*i*o(*),0).
Приравнивая эту величину коэффициенту при ε° в (10.6), мы заключаем,
что xo(t) удовлетворяет уравнению
хо = /(*,жо,0), ^о(^о) = Vo,
которое, разумеется, представляет собой невозмущенную систему (10.3). Член
первого порядка hi (t) определяется равенством
hi(t)= |^/(*,*(*,ε),ε)
ε=0
=
{^(*'
ж
(*'
е
)'
е
)й(*
,е)+
^
(*
,ж(
*
,е),е)}| _
=
= |£(t,xoW,0)si(t) + ^(t,*o(*),0).
Приравнивая эту величину коэффициенту при ε
1
в (10.6), мы заключаем, что
х\ (t) удовлетворяет уравнению
±1 = — (t,x0(t),0)xi
+ -7^(t,x0(t),0),
xi(t0) = т.
10.1. МЕТОД ВОЗМУЩЕНИЙ
409
Введем обозначения
A(t) = |£(*,яо(*),0), gi{t,x0(t)) = |£(*,*ο(*),0)
и перепишем уравнение для х\ в виде
XI = А(*)Ж1 +01(*,ЖО(*)), ^i(io) = Ш-
Это линейное уравнение имеет единственное решение, определенное на [io,£i].
Эта процедура может быть продолжена, в результате чего будут получены
уравнения, которым удовлетворяют Ж2,жзи так далее. Следует заметить, что для
этого потребуется вычислять производные высоких порядков функции / по ж,
что, вообще говоря, может быть затруднительно. Нет смысла выписывать эти
уравнения в общем случае, но для конкретной задачи это может быть сделано.
Тем не менее в целях выявления существа рассматриваемой проблемы мы по
лучим, рискуя утомить читателя, уравнение для х2. Коэффициент при второй
степени в ряде Тейлора для h(t,e) определяется равенством
h2{t)=\j^h{t,e)
ε=0
Далее,
= ^&x,e)[xi(t)
+ 2ex2(t) + ···] + -j£(t,x,e).
В целях упрощения обозначений положим
ip(t,x,e) =
-7^(t,x,e)xi(t)
и вычислим вторую производную функции h по ε:
£2h(t,e) = ^(Μ,ε)|(Μ) 4- £
d
/x(t,X,e)Xl(t) +
+2^{t,x,e)x2(t)
+ ^%(t,x,e)^(t,e) +
d2f
+-^(t,x,e)+e[-\.
Таким образом,
h2(t) = A(t)x2(t) + g2(t,x0(t),xi(t)),
410
ГЛАВА 10
где
92(t,xo(t),xi(t))
= |^(*,a:o(i),0)xi(i) + ^^(t,xo{t),0)xi(t)
+
+!0(i>xo(i)lo).
Приравнивая в (10.6) коэффициенты при ε
2
, получаем
Х2 = A(t)x2 +g2(t,X0(t),Xl(t)), Χ2(*θ) = %·
Суммируя результаты, заключаем, что коэффициенты ряда Тейлора хо, #ъ · · ·,
x#_i могут быть получены как решения уравнений
*о = Ж а:0,0), x0(*o) = W),
(Ю.7)
хк = A(t)xk + gk(t,xo(t),...
,x&_i(£)), xfc(£0) = %,
(Ю.8)
где /с = 1,2,..., Ν — 1, A(t) — матрица Якоби [df/дх], вычисленная при х =
= xo(t) и ε = 0; член gk(t,xo(t),xi(i),...,Xfc_i(t))
представляет собой полином
относительно xi,..., x^-i с коэффициентами, зависящими от £ и xo(t). Из пред
положения о том, что xo(i) определено на [to, h], следует, что A(t) определена на
том же интервале и, следовательно, линейные уравнения (10.8) имеют единствен
ные решения, определенные на [to, ^i]. Проиллюстрирует процедуру вычисления
коэффициентов ряда Тейлора на примере системы второго порядка.
Пример 10.2. Рассмотрим уравнение Ван дер Поля
xi =S2,
EI(0) =m(e),
±2 = -xi + ε(1 - х\)х2, X2(0) = rfr{e).
Предположим, что необходимо построить ряд Тейлора для N = 3. Пусть
х%=ХгО+ехц+ε
2
Χ{2+£
3
RXi, г = 1,2,
и
^г= ^го4-εη»1+е
2
щ2+ε
3
^, г=1,2.
Подставляя ряды для xi и х2 в уравнение состояния, получаем
хю+ех\\+ε
2
Χ12+e
z
RXl = Х20+£#21+ε
2
Χ22+ε
3
^Ζ2>
х2о+εΧ21+ε
2
Χ22+ε
3
Дг2=-^ю-ехц-е
2
х\2-£
S
RXl +
+ε[1-(хю+ехц +ε
2
ΧΧ2+e
3
RXl)
2
]x
x(#20+εΧ21+ε
2
Χ22+ £
3
RX2).
Приравнивая коэффициенты при ε°, получаем систему
хю = #20,
хю(Р) = 77Ю,
^20 = -хю,
£2о(0) = гу2о,
10.1. МЕТОД ВОЗМУЩЕНИЙ
411
представляющую собой невозмущенную систему при ε = 0. Далее, приравнивая
коэффициенты при ε, получаем
in =ж21,
sn(O) = т7и,
#21 = ~#11 + (1 - #1θ)#20, #21 (0) = ?721
и, выполняя аналогичную процедуру для ε
2
, получаем
#12 = #22,
#12(0) = 7/12,
#22 = -#12 + (1 - #10)#21 ~ 2£ю#И#2(Ь #22(0) = 7/22·
Последние две системы уравнений представлены в виде (10.8) при к = 1,2. Δ
После вычисления членов жо> #ъ · · · >#N-I нашей следующей задачей яв
ляется доказательство того, что J^JQ xk(t)£k действительно является аппрокси
мацией x(t,e) порядка 0(εΝ). Рассмотрим ошибку аппроксимации
Ν-1
е = х- Y^xk(t)ek
.
(10.9)
к=0
Дифференцируя правую и левую части (10.9) по t и подставляя производные х
и хк из (10.1), (10.7) и (10.8), можно показать, что е удовлетворяет уравнению
е=A(t)e+pi(t,е,ε)+р2(*,ε), e(t0) =e
N
Rv{e),
(10.10)
где
N-l
N-l
pi(t,e,e) = /(t,e + J] Χ*(*)ε*,ε) - /(i, J^ xk{t)e\s) - A(t)e,
к=0
к=0
N-l
N-l
P2&e) = /(*, Σ
x
k{t)ek
,e) - f(t,x0(t),0) - ^2[A(t)xk(t) + дк(-)]е
к
.
k=0
k=l
По предположению xo(i) ограничено и принадлежит D для всех t G [io>^i]·
Следовательно, существуют λ > 0 и ε\ > 0, такие что xo(t)9 ^2к=о
x
k(t)£k ие+
+ ^2k=o
x
k{t)
ek
принадлежат компактному подмножеству D для всех ||е|| ^ λ
и |ε| ^ е\. Можно легко показать, что
pi(t,0,e)=0,
(10.11)
||pi(*,e2,e) -pi(*,ei,e)|| Oi||e2-ei||,
(10.12)
\\p2(t,e)\\^k2\e\
N
(10.13)
для всех t G [t(b*i]>ei,e2 ^ ^λ>ε £ [—^b^i] и некоторых положительных кон
стант к\ и /с2- Уравнение (10.10) может рассматриваться как возмущение уравне
ния
е0 = A(t)eo + pi(i,e0,e), e0(t0) = 0,
(10.14)
412
ГЛАВА 10
которое имеет единственное решение eo(t,e) = 0 при t G [to,ti]. Из теоремы 3.5
следует, что (10.10) имеет единственное решение, определенное на [to, ti] для
достаточно малого |ε|. Кроме того, из теоремы 3.4 следует, что
\\e(t,£)\\ =
\\e(t,e)-eo(t,e)\\=0(e
N
).
Полученные результаты могут быть сформулированы в виде следующей теоре
мы.
Теорема 10.1. Предположим, что
•
f и ее частные производные по (ж, ε) до порядка N включительно непре
рывны по (£,ж,е) при (£,я,е) G \t^t\] x D х [—εο,εο]/
• η и ее производные до порядка N включительно непрерывны при ε G
[-ε0,ε0];
• номинальная система (10.3) имеет единственное решение xo(t), определен
ноена[to,h]иxo(t)GDдлявсехtG[to?h]-
Тогда существует ε* > 0, такое что для любого |ε| < ε* задача (10.1) и (10.2)
имеет единственное решение x(t,e), определенное на [to,ti] и удовлетворяющее
N-1
x(t,e)-J2xk(t)e
k
= 0(e
N
).
k=0
При аппроксимации x(t,e) функцией xo(t) нам необходимо знать значение
параметра ε, однако это может быть невозможно, поскольку этот параметр часто
представляет собой отклонение параметров системы от их номинальных зна
чений. При использовании аппроксимации высокого порядка ^,к=о
x
k(t)z
kП
РИ
N > 2 нам также необходимо знать значение ε для того, чтобы построить аппрок
симирующий ряд, но в практических ситуациях при вычислении членов жх, Х2
и так далее это значение не требуется. С учетом того что для построения ап
проксимирующего ряда Тейлора нам необходимо знать ε прежде, чем приступать
к решению задачи, следует сравнить вычислительную трудоемкость процедуры
аппроксимации решения с использованием ряда Тейлора с трудоемкостью на
хождения точного решения. Точное решение x(t,e) может быть получено путем
решения нелинейного уравнения состояния (10.1), а приближенное решение —
путем решения нелинейного уравнения состояния (10.7) и нескольких линейных
уравнений (10.8), число которых зависит от порядка исследуемой системы. По
скольку в обоих случаях необходимо решать нелинейное уравнение состояния
порядка п, можно поставить вопрос: каков выигрыш мы получим, решая (10.7),
вместо (10.1)? Одной из ситуаций, когда аппроксимация решения с использова
нием ряда Тейлора является более предпочтительным способом решения задачи,
является случай нахождения решения для нескольких значений ε. При использо
вании аппроксимации рядом Тейлора уравнения (10.7) и (10.8) решаются только
10.1. МЕТОД ВОЗМУЩЕНИЙ
413
один раз, после чего строятся различные ряды Тейлора, соответствующие раз
личным значениям ε. Кроме этого специального случая необходимости нахожде
ния решения для нескольких значений ε, подход с использованием рядов Тейлора
представляется эффективным в ситуациях, когда
• невозмущенное уравнение состояния (10.7) существенно проще зависящего
от ε уравнения состояния (10.1) и
• ε настолько мала, что приемлемая точность аппроксимации может быть до
стигнута при небольшом количестве членов ряда Тейлора.
В большинстве инженерных приложений, использующих метод возмуще
ний, вполне адекватные аппроксимации могут быть получены при N = 2 или 3.
Более того, если положить ε = 0, это существенно упрощает уравнение состо
яния. В следующих двух примерах мы увидим, что, полагая ε = 0, мы можем
существенно уменьшить сложность уравнения состояния. В первом примере мы
рассмотрим уравнение Ван дер Поля из примера 10.2, которым может быть опи
сан широкий класс «слабо нелинейных систем», становящихся линейными при
ε = 0. В этом случае для построения ряда Тейлора необходимо лишь решить
линейные уравнения. Во втором примере мы рассмотрим взаимосвязанную си
стему, состоящую их подсистем со «слабыми» связями (ε-связями). При ε = 0
система декомпозируется на независимые подсистемы меньшего порядка. При
построении аппроксимирующего ряда Тейлора мы всегда решаем независимые
системы меньшего порядка, что может быть проще решения исходного уравне
ния высокого порядка (10.1).
1
0.5
0
0.5
-1
—- »^
1
1
г
-
\ч
I
1
^"Т"
0
12
3
(а)
0
-0.02
-0.04
-0.06
-0.08
-0.1
-0.12
(Ь)
Рис. 10.1. К примеру 10.3. При ε = 0.1: (a) x\{t,e) (непрерывная линия) и xw(t) (пунк
тирная линия), (b) x\(t,e) — x\o(t) (непрерывная линия) и xi(t,ε) — xw(t) — sx\\{t)
(пунктирная линия)
Пример 10.3. Предположим, что необходимо решить уравнение Ван дер
Поля
XI
Х2
%2,
-xi +ε(1 •ж?)ж2,
xi (0)
х2(0)
1,
0
414
ГЛАВА 10
на интервале времени [0, π]. Положим ε = 0 и получим линейное невозмущенное
уравнение
#ю = #20,
#ю(0) = 1,
#20 = ~#10, #20(0) = 0,
решение которого имеет вид
#юΜ — cosi, #20Μ = — sint.
Все предположения теоремы 10.1 выполнены, и мы можем заключить, что ошиб
ка аппроксимации х(£, ε) — хо(£) имеет порядок О (ε). Вычислив численно х(£, ε)
при трех различных значениях ε и используя
Ео = maxO < t < π||Χ(£,ε) - #о(01|2
в качестве меры ошибки аппроксимации, находим Ео = 0.0112, 0.0589 и 0.1192
при ε = 0.01, 0.05 и 0.1 соответственно. Полученные значения показывают, что
ошибка ограничена при ε ^ 0.1 величиной 1.2ε. На рисунке 10.1(a) показаны
точная и приближенная траектории первого компонента вектора состояния при
ε = 0.1. Предположим, что необходимо увеличить точность аппроксимации при
ε = 0.1. В примере 10.2 было показано, что хц и Х21 удовлетворяют системе
уравнений
Хц =Х2Ь
#11 (0) =0,
#21= —#и — (1— cos
2
1)sini, #21(0)= 0,
решение которой имеет вид
#и(t) = -^sini- isin3£+ |icosi,
q
о
о
#21(t)=£;COSt- ^rCOS3t- §tSint.
Из теоремы 10.1 следует, что аппроксимация xo(t) +exi(t) имеет порядок 0(ε2)
и близка к точному решению при достаточно малом ε. Для того чтобы сравнить
приближенное решение с точным при ε = 0.1, вычислим
Ех = max ||х(£,0.1) - x0(t) - 0.1xi(£)||2 = 0.0057.
Таким образом, ошибка аппроксимации уменьшилась почти на порядок. На ри
сунке 10.1(b) показаны ошибки аппроксимации первого компонента вектора со
стояния для аппроксимации первого порядка хо и аппроксимации второго поряд
кахо+ех\ приε=0.1.
Δ
Пример 10.4. В состав показанной на рисунке 10.2 электрической цепи
входят нелинейные резисторы с I — У -характеристикой г = ψ (υ). Дифференци
альные уравнения для напряжений на конденсаторах имеют вид
С
^Ж
=
R{E
~
Щ)
~
ФМ
~~k
(Vl
"
V2)
>
C^r =±(Е-v2)-φ(ν2)-i(«2- Vl).
10.1. МЕТОД ВОЗМУЩЕНИЙ
415
Рис. 10.2. Электрическая цепь в примере 10.4
Электрическая цепь имеет два ДС-контура, соединенных через резистор Rc. Ес
ли Rc «относительно велико», связь между этими двумя контурами становится
«слабой». В частности, если Rc = оо, эти два контура становятся полностью
независимыми. Рассматриваемая цепь представляет собой систему с ε-связью,
в которой связь между двумя контурами может быть параметризована малым
параметром ε. На первый взгляд в качестве параметра ε следует выбрать ε =
= l/Rc. Действительно, при таком выборе перекрестные члены в вышеприве
денных уравнениях оказываются умноженными на ε. Однако в этом случае пара
метр ε становится зависимым от абсолютной величины физического параметра,
значение которого вне зависимости то того, мало оно или велико, не представ
ляет какого-либо самостоятельного смысла без одновременного учета значений
других физических параметров системы. В хорошо сформулированной задаче
с возмущениями параметр ε должен быть выбран в виде отношения физических
параметров, и это отношение должно быть действительно «мало» по смыслу за
дачи. Для того чтобы сделать именно такой осмысленный выбор параметра ε,
обычно сначала выбирают переменные состояния и/или независимую перемен
ную (время) так, чтобы эти переменные были безразмерными величинами. В рас
сматриваемом примере очевидным выбором переменных состояния являются ве
личины vi и^. Однако вместо этого мы масштабируем их так, чтобы экстре
мальные значения масштабированных переменных были бы близки к ±1. Вслед
ствие того что в рассматриваемой задаче контуры одинаковы и связаны между
собой слабой связью, масштабирующий коэффициент а для обеих переменных
состояния должен быть один и тот же. Определим переменные состояния следу
ющим образом: х\ — vi/аи х^ = VIJOL. Выбрав безразмерное время г = t/RC9
получаем с учетом того, что dx/dr = x, уравнение состояния рассматриваемой
системы
xi=-^
- xi-
- ^ф(ахг) - д -(я1 - ж2),
Ε
R
R
Х2= -^
- Х2-
^{ах2)
-
^-(X2 - xi)·
416
ГЛАВА 10
0.15
0.1
0.05
-
\
^
\
\
1
1
1
1
09
0.8
0.7
0.6
X,
У
/
/
-
/S
//
0
0.5
1
Время
1.5
5
0
0.5 1 1.5
2
Время
Рис. 10.3. К примеру 10.4: точное решение (непрерывная линия), аппроксимация первого
порядка (пунктирная линия) и аппроксимация второго порядка (штрихпунктирная линия)
приε =0.3
Теперь видно, что в качестве малого параметра ε разумно выбрать величи
ну R/Rc.
Предположим, что R — 1.5 х 103Ω, Ε = \.2V и в качестве нелинейных
резисторов используются туннельные диоды с
ψ(ν) = 1(Г3
х (17.76?; - 103.79?;2
+ 229.62ν3
-
226.31?;4
+ 83.72?;5).
Пусть а = 1. Тогда уравнения состояния принимают вид
х\ =1.2
—
xi —h(x\) —е{х\ —Х2),
±2=1.2
-
Х2- h(x2) - е(х2 - #i),
гдеh(v) =1.5х103
х ψ (υ). Предположим, что необходимо решить это уравнение
с начальными данными
xi(0)=0.15; х2(0)=0.6.
Полагая ε = 0, получаем развязанные уравнения
xi=1.2
-
xi - /i(xi), xi(0) = 0.15,
Х2= 1.2
-
Х2 - h(X2), Х2(0) = 0.6,
которые могут быть решены независимо друг от друга. Пусть xw(i) и Х2о(0 —
соответствующие решения. Из теоремы 10.1 следует, что при достаточно малом
параметре ε эти решения представляют собой аппроксимации точного решения
порядка Ο(ε). Для того чтобы получить аппроксимацию порядка 0(ε2), выпишем
уравнения для хц и Х2ь
in = -[1 + h'(xio(t))]xn - [xio(t) - Х2о(*)],
^n(O) = 0,
*21 = "[Ι + h'(x2o(t))]x2l - [X20(t) ~ Xlo(t)], S2l(0) = 0,
где h!(·)
—
производная h(-). На рисунке 10.3 показано точное решение, а также
его аппроксимации первого и второго порядков при ε = 0.3.
Δ
10.2. МЕТОД ВОЗМУЩЕНИЙ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ
417
Серьезным ограничением теоремы 10.1 является то, что оценка ошибки ап
проксимации порядка 0(εΝ) верна лишь на конечных (порядка 0(1)) интервалах
времени [to, ti]. Она неверна, например, на интервалах [to, Τ/ε] и на бесконечном
интервале [to, оо). Это обусловлено тем, что константа к в оценке k\e\
N
зависит
от t\ и, следовательно, величина этой оценки неограниченно возрастает с уве
личением t\. Появление константы к в выражении для оценки обусловлено тем,
что мы воспользовались теоремой 3.4. В частности, если обратиться к форму
лировке этой теоремы, можно убедиться в том, что развернутое выражение для
этой оценки будет содержать член exp(Lt\). В следующем разделе мы увидим,
как можно использовать информацию об устойчивости системы для того, чтобы
обобщить результаты теоремы 10.1 на случай бесконечного интервала времени.
Если определенные условия устойчивости не выполняются, аппроксимация мо
жет оказаться неверной при больших t, даже если она верна на интервалах вре
мени порядка 0(1). На рисунке 10.4 показаны точные и приближенные решения
уравнения Ван дер Поля из примера 10.3 на большом интервале времени при
ε = 0.1. При большом t нельзя сказать, что ошибка xi(t,e) — x\o{t) имеет поря
док 0(ε). Более того, ошибка х\(t, ε) — x\o(t) — ехц(t) неограниченно возрастает
вследствие того, что компонента x\\{t) содержит член tcost.
Рис. 10.4. Точное решение (непрерывная линия), аппроксимация первого порядка (пунк
тирная линия) и аппроксимация второго порядка (штрихпунктирная линия) для уравне
ния Ван дер Поля на большом интервале времени
10.2. Метод возмущений на бесконечном интервале времени
Результаты теоремы 10.1 могут быть перенесены на бесконечный интервал
времени [to,oo) при выполнении некоторых дополнительных условий на свой
ства устойчивости рассматриваемой системы. В следующей теореме будет пред
полагаться, что номинальная система (10.7) имеет экспоненциально устойчивую
точку равновесия в начале координат. При этом соответствующая функция Ляпу
нова будет использоваться для оценки области притяжения. Не умаляя общности,
можно считать, что точка равновесия расположена в начале координат, поскольку
418
ГЛАВА 10
начало координат может быть всегда перемещено в эту точку путем соответству
ющей замены координат.
Теорема 10.2. Пусть D С Rn
—
открытая область, содержащая начало
координат. Предположим, что
• / и ее частные производные по (ж, е) до порядка N включительно непре
рывны и ограничены для (£,ж,б) Ε [0,оо) х Do x [—бо,бо] для любого ком
пактного множества Do С D; если N = 1, то [df/dx](t,x,e)
липшицева
по (ж, е) равномерно по t;
• η и ее производные до порядка N включительно непрерывны для е Ε
е [-во, б0];
• начало координат является экспоненциально устойчивой точкой равновесия
номинальной системы (10.7);
• существует функция Ляпунова V(t,x), удовлетворяющая условиям теоре
мы 4.9 для номинальной системы (10.7) при (£,ж) Ε [0, оо) х D; {W\(x) <
^ с} — компактное подмножество множества D.
Тогда для любого компактного множества Ω С {^(ж) ^ рс, 0 < ρ < 1} су
ществует положительная константа е*, такая что для всех to ^ 0,770 Ε Ω
и \е\ < б* уравнения (10.1) и (10.2) имеют единственное решение ж(£, б), равно
мерно ограниченное на [to,oo), и
N-1
к=0
где условие 0(e
N
) выполняется равномерно по t для всех t ^ to-
Если номинальная система (10.7) автономна, то в качестве множества Ω
в теореме 10.2 можно выбрать любое компактное подмножество области при
тяжения начала координат. Это утверждение является следствием обратной тео
ремы Ляпунова 4.17, т. к. для функции Ляпунова V(x) из формулировки теоремы
выполнено свойство, заключающееся в том, что любое компактное подмноже
ство области притяжения может быть включено во внутренность компактного
множества вида {V(x) ^ с}.
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 10.2. Применяя теорему 9.1, можно показать,
что существует в\ > 0, такая что для всех |б| < е\ решение x(t,e) равномер
но ограничено и ж(£, б) — xo(t) имеет порядок 0(e) равномерно по t для всех
t > to- Также очевидно, что при τ/ο Ε Ω функция xo{t) равномерно ограниче
на и Ит$- _ю оЖо(*) = 0. Рассмотрим линейные уравнения (10.8). Из теоремы 5.1
(об устойчивости «ограниченный вход - ограниченный выход») следует, что ре
шение системы (10.8) будет равномерно ограничено, если начало координат си
стемы z = A(i)z экспоненциально устойчиво и выступающая в качестве входа
10.2 . МЕТОД ВОЗМУЩЕНИЙ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ
419
системы функция д^ ограничена. Функция д^ представляет собой полином по
#!,..., Xk-i с коэффициентами, зависящими от t и xo(t). Зависимость от t обу
словлена зависимостью частных производных / от t, которые ограничены на
компактных подмножествах множества D. Поскольку xo(t) ограничена, коэффи
циенты полинома также ограничены для всех t ^ to· Следовательно, ограничен
ность gk следует из ограниченности жх,... ,ж*._х. Матрица A(t) определяется
равенством
^(*) = §£(Мо(*),0),
где xo(t) — решение номинальной системы (10.7). Покажем, что для любого ре
шения xo(t), начинающегося в множестве Ω, экспоненциальная устойчивость
начала координат как точки равновесия системы (10.7) гарантирует экспонен
циальную устойчивость начала координат системы z = A(t)z. Для того чтобы
убедиться в этом, положим
4)(«) = §£м,о)
def
и запишем
A(t) = A0(t) + [A(t) - A0(t)) u
= Ao(t) + B(t).
Таким образом, линейная система z = A(t)z может рассматриваться как возму
щение системы у = Ao(t)y. Поскольку [df/dx](t,x,0) липшицева по х равно
мерно по t, имеем
No)\\ g(i,x0(t),0)-^(t,0,0) < L\\x0(t)\\.
С другой стороны, с учетом экспоненциальной устойчивости начала координат
системы (10.7) и с использованием теоремы 4.15 можно показать, что начало
координат линейной системы у = Ao(t)y экспоненциально устойчиво. Поэто
му аналогично тому, как это было сделано в примере 9,6, мы можем показать
с учетом lim^oo х$(t) = 0, что начало координат линейной системы z = A(t)z
экспоненциально устойчиво.
Поскольку ||хо(£)Н ограничена и gi(t,xo(t)) = [df/de](t,xo(i),0)9 функ
ция gi ограничена для всех t ^ to. Следовательно, из теоремы 5.1 следует,
что x\(t) ограничена. Аналогично можно показать, что X2(t),... ,х&_х(£) также
ограничены.
Таким образом, мы показали, что точное решение x(t,e) и приближенное
решение Υ^^=ο
х
к(^)
ек
равномерно ограничены на [to,oo) при достаточно ма
лой |е|. Для того чтобы завершить анализ, нам необходимо оценить ошибку е =
—
х — X^JQ1 Xk(t)e
k
.
Это может быть сделано аналогично тому, как это было
сделано в параграфе 10.1. Ошибка удовлетворяет (10.10), где р\ и р2 удовлетво
ряют (10.11), (10.13) и
dpi u
ч
Oi(||e|| + |e|)
420
ГЛАВА 10
для всех (£,е,в) е [to^oo) х В\ х [—ei,€i] при достаточно малой е\. Уравнение
ошибки (10.10) может рассматриваться как возмущение системы е = A(t)e, где
возмущение удовлетворяет неравенствам
||pi(t,e,e) + P2(i,e)|| ^ кг(\\е\\ + |s|)||e|| + k2\e\
N
^ h(X + |ε|)||β|| + k2\e\
N
.
С учетом того что ||e(to>e)|| = 0(εΝ), с использованием леммы 9.4 заключаем,
что для достаточно малой |ε| выполнено ||β(£,ε)|| = 0(εΝ) для всех t ^ to.
•
Пример 10.5. Электрическая цепь из примера 10.4 описывается уравнени
ем
х\ =1.2 —х\ —h{x\)—е(х\ —х2),
±2=1.2 —Х2—h{x2)- е(х2- х\),
где
h(v) = 1.5(17.76v - 103.79<u
2
+ 229.62v
3
-
226.31т;
4
+ 83.72г;
5
).
При ε = 0 невозмущенная система распадается на две изолированные подсисте
мы первого порядка:
х\ = 1.2 — х\— h(xi),
±2=1.2
-
Х2- h(x2).
Можно показать, что каждая из подсистем имеет три точки равновесия: 0.063,
0.285, и 0.884. Матрица Якоби -1 + h!(xi) отрицательна при xi = 0.063 и Xi =
= 0.884 и положительна при Х{ = 0.285. Следовательно, точки равновесия
в 0.063 и 0.884 экспоненциально устойчивы, а точка равновесия в 0.285 неустой
чива. При совместном функционировании подсистем единая система второго
порядка имеет девять точек равновесия. Лишь четыре из них экспоненциаль
но устойчивы: (0.063, 0.063), (0.063, 0.884), (0.884, 0.063) и (0.884, 0.884). Из
теоремы 10.2 следует, что если начальное состояние х(0) принадлежит компакт
ному подмножеству области притяжения одной из этих точек равновесия, при
ближенное решение, найденное в примере 10.4, будет верно для всех t ^ 0. На
рисунке 10.3 показаны результаты компьютерного моделирования, проведенного
на интервале времени, достаточно продолжительном для того, чтобы решение
системы стало установившимся. В рассмотренном частном случае в качестве
начального состояния была взята точка (0.15, 0.6), принадлежащая области при
тяжения точки равновесия (0.063, 0.884).
Δ
Полученная в теореме 10.2 оценка порядка 0(εΝ) верна лишь в тех случа
ях, когда начало координат экспоненциально устойчиво. Этот результат не обя
зательно остается верным в случае, когда имеет место не экспоненциальная, но
асимптотическая устойчивость. Это утверждение иллюстрируется следующим
примером.
10.2. МЕТОД ВОЗМУЩЕНИЙ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ
421
Пример 10.6. Рассмотрим систему первого порядка
X= —X
3
+£Х
и предположим, что ε > 0. Начало координат невозмущенной системы
х=
-х
3
глобально асимптотически устойчиво, но не является экспоненциально устой
чивым. (См. пример 4.23.) Возмущенная система имеет три точки равновесия
в х = 0 и х = ±у/е. Точка равновесия х = 0 неустойчива, а другие две точки
равновесия асимптотически устойчивы. Находя решения этих двух систем при
одном и том же положительном начальном состоянии х(0) = а, можно показать,
что
x(t,e) —> y/ε и xo(t) —> 0
при t —> оо. Поскольку порядок y/ε не равен О (ε), порядок ошибки аппрокси
мации x(t,e) — xo(t) также не равен Ο(ε) для всех t ^ 0. Тем не менее, так
как начало координат асимптотически устойчиво, мы можем получить некото
рые результаты об асимптотическом поведении аппроксимации при t —> оо, но
они будут более слабые по сравнению с утверждением теоремы 10.2. Поскольку
начало координат невозмущенной системы асимптотически устойчиво, решение
xo(i) стремится к нулю при t —> оо. Иными словами, для любой δ > 0 существу
етТ\>0,такойчто
||*о(*)||<*/2, V^Tb
Решения возмущенной системы предельно ограничены с границей, которая
уменьшается с уменьшением ε. Поэтому для любой δ > 0 существуют Т2 > 0
иε*>0,такиечто
\\x(t,e)\\ <i/2, ν*^Τ2,νε<ε*.
С учетом этих двух оценок мы можем заключить, что для любой δ > 0 ошибка
аппроксимации удовлетворяет
\\x(t,e)-x0(t)\\
<«, ν*^Γ,νε<ε*,
где Τ = max{Ti,T2}. Из теоремы 10.1 следует, что на интервале времени [0, Т]
порядка 0(1) ошибка аппроксимации имеет порядок О (ε). Поэтому мы можем
сказать, что для любой δ > 0 существует ε** > 0, такая что
||α(*,ε)-Χ0(*)|| < *, Vie [0,οο),νε < ε**.
Последнее неравенство эквивалентно тому, что ошибка аппроксимации стремит
ся к нулю при ε —> 0 равномерно по t для всех t ^ 0, и этот результат в общем
случае является наиболее сильным результатом, который может быть получен
при отсутствии экспоненциальной устойчивости. Разумеется, в этом конкретном
примере мы можем получить xo(t) и x(t,e) в явном виде и показать, что в дей
ствительности ошибка аппроксимации имеет порядок О (y/ε).
Δ
422
ГЛАВА 10
10.3. Периодические возмущения автономных систем
Рассмотрим систему
x = f{x)+eg(t,x,e),
(10.15)
где /, д и их первые частные производные по х непрерывны и ограничены для
всех (t,ж,ε) Ε [0, оо)XDQX [—εο,εο] для любого компактного множества Do С D9
гдеDсi?
n
—
открытая область, содержащая начало координат. Предположим,
что начало координат является экспоненциально устойчивой точкой равновесия
автономной системы
х = /(ж),
(10.16)
что эквивалентно
4
тому, что матрица А = [df/dx](0) является гурвицевой. По
скольку д ограничена, мы можем использовать теорему 4.14 и лемму 9.2 и пока
зать, что существуют г >0ие\ >0, такие что для всех ||ж(0)||<ги|ε|^ε\
решение системы (10.15) равномерно предельно ограничено с предельной гра
ницей, пропорциональной величине |ε|. Другими словами, при t —> оо все реше
ния стремятся к 0(г)-окрестности начала координат. Это утверждение остается
верным для любой ограниченной д. В этом параграфе мы исследуем поведение
системы в этой О (ε)-окрестности, если д является Т-периодической по t, т. е.
g(t + T,x,e) =g(t,x,e), V(t,x,e) G [0,oo) x D x [-ε0,ε0].
В частности, мы исследуем вопрос о существовании Т-периодического решения
в 0(г)-окрестности начала координат.
Пусть <j>(t]to,xo,e) — решение (10.15), начинающееся в (to.xo), т.е. жо =
— </>(to-to,xo,e). Для всех ||ж|| < г определим отображение Р£(х)
Р£(х) = ф(Т;0ух,е),
т. е. Р£{х) — состояние системы в момент времени Т, имеющей начальное состоя
ние х в нулевой момент времени. Это отображение играет ключевую роль при ис
следовании вопроса о существовании периодических решений системы (10.15)5
.
Лемма 10.1. В условиях принятых предположений уравнение (10.15) име
ет Τ-периодическое решение, если и только если уравнение
х = Ре{х)
(10.17)
имеет решение.
4
Эквивалентность следует из теоремы 4.15.
5
Это отображение может быть интерпретировано [см. 70, параграф 4.1] как отображение Пуан
каре для автономной системы размерности (п + 1)
х = f(x) +ед(9>ху€), 0=1.
10.3. ПЕРИОДИЧЕСКИЕ ВОЗМУЩЕНИЯ АВТОНОМНЫХ СИСТЕМ
423
ДОКАЗАТЕЛЬСТВО. Поскольку д является Т-периодической по £, реше
ние (10.15) инвариантно относительно сдвига времени на величину, кратную Т.
В частности,
</>(£+Τ;Τ,ж,ε)= </>(*;0,х,ε), Vt ^ 0.
(10.18)
Это устанавливается с использованием замены времени t \-> τ = t — Τ, которая
приводит к системе
^
= f{x) + ед{т + Τ,Χ,ε) = /(я) + ед(т,х,е).
С другой стороны, из единственности решения следует, что
</>(* + Τ;0,Χ,ε) = 0(* + Τ;Τ,<£(Τ;Ο,Χ,ε),ε), Vt ^ 0.
(10.19)
Для того чтобы доказать достаточность, положим
ρε = Ρε{ρε) = φ{Τ;0,ρε,ε).
Тогда
^
+ Γ;Ο,ρε,ε) = 0(* + Γ;Γ,^(Γ;Ο,ρε,ε),ε) =
= </>(* +Τ;Τ,ρε, ε) =
= #*;0,ρε,ε),
(10.20)
где первое равенство следует из (10.19), а последнее — из (10.18). Уравне
ние (10.20) показывает, что решение, начинающееся в (0,ρε), является Т-
периодическим. Для того чтобы доказать необходимость, предположим, что
x(i) — Т-периодическое решение (10.15). Пусть у = х(0). Тогда
ф(г + Т;0,у,е) = ф(Ь0,у,е),
Vt^O.
При t = 0 получаем равенство
0(Γ;Ο,Ι/,ε) = 0(Ο;Ο,»,ε)=1/,
из которого следует, что у является решением (10.17).
Π
Лемма 10.2. В условиях принятых предположений существуют положи
тельные константы к и в2, такие что (10.17) имеет единственное решение
в\\х\\<к\е\длявсех\е\<е%
ДОКАЗАТЕЛЬСТВО. При ε = 0, </>(£; 0,#,0) является решением невозмущен
ной системы (10.16), начинающимся в (0,х). Поскольку х = 0 — точка равнове
сия для (10.16), 0 = ф{Ь\ 0,0,0) для всех t ^ 0. Следовательно,
Ро(О)=0(Г;О,О,О)=О.
424
ГЛАВА 10
Из теоремы о неявной функции следует, что если матрица Якоби
J=I-
δΡε
дх ж=0,е=0
невырожденна, то существует положительная константа S2, такая что уравне
ние (10.17) имеет единственное решение ре при |ε| < ε2· Невырожденность
матрицы Якоби устанавливается следующим образом. Напомним, что решение
ф(Р, 0, я, ε) определяется равенством
(/>(£; 0, #, ε) = х + / [/(</>(τ;0,Χ,ε)) + ε#(τ,</>(τ;0,Χ,ε),ε)] dr.
Jo
Дифференцируя по х, получаем
£***<>-'+No£<·>+«£<·>£<·>: dr.
Пусть
Тогда
f/(i)= |>(i;0,x,e)
ОХ
1х=0,е=0
U(t) =1+1 ^(°No) dr = I+ f AU(T) dr
ftU(t) = AU(t), £7(0) = /.
Таким образом, U(t) = exp(At) и, следовательно,
дх
=
I-exp(AT).
Ж=0,5=0
Поскольку А гурвицева, все собственные значения ехр(АТ) расположены строго
внутри единичной окружности
6
. Тогда J невырожденна и, следовательно, (10.17)
имеет единственное решение ρε, \/|ε| < ε2· С другой стороны, т.к. при t —> оо
все решения (10.15) стремятся к О (ε)-окрестности начала координат, должно
быть справедливо то, что ре имеет порядок О (ε), поскольку при t —> оо соответ
ствующее периодическое решение проходит через ре бесконечно много раз. Π
Теперь становится очевидно, что при достаточно малой ε возмущенная си
стема (10.15) имеет Т-периодическое решение в (З(г)-окрестности начала коор
динат. В действительности это периодическое решение должно быть единствен
ным, вследствие единственности решения уравнения (10.17). С учетом гурвице-
вости А можно продолжить рассуждения и показать, что периодическое решение
является экспоненциально устойчивым.
6
Этот хорошо известный в теории импульсных систем результат может быть доказан преобра
зованием А к жордановой форме.
10.3. ПЕРИОДИЧЕСКИЕ ВОЗМУЩЕНИЯ АВТОНОМНЫХ СИСТЕМ
425
Лемма 10.3. В условиях принятых предположений, если x(t, ε) является
некоторым Τ-периодическим решением (10.15), таким что \\x(t,e)\\ ^ k\e\, то
x(t, ε) экспоненциально устойчиво.
ДОКАЗАТЕЛЬСТВО. Систематическая процедура исследования устойчивости
x(t, ε) состоит в том, что выполняется замена переменных z = x — x(t, ε) и затем
исследуется устойчивость точки равновесия z = 0. Новая переменная z удовле
творяет уравнению
z = f(z + x(t,e))-f(x(t,e))+e\g(t,z
+
x(t,e),e)-g(t,x(t,e),e)]
=
f(t,z).
Линеаризация в окрестности z = 0 приводит к следующей системе:
дд\
def
2i
dz 2=0
dx
A+
+ε
z=0
d£
dx
dx z=0
(x(t,e))-A
do/ _/
Из непрерывности [df /dx) следует, что для любой δ > 0 существует ε* > 0,
такая что
тNo>
е
»-ш® <s
при ε < ε*. Поскольку А гурвицева и [dg/dx](t,x,e)
имеет порядок 0(1), мы
можем заключить, что при достаточно малой ε линейная система
У Л+ [ ^(x(tte))-A\ +eg(t>«(t,e),e) У
имеет экспоненциально устойчивую точку равновесия в у = 0. Поэтому из теоре
мы 4.13 следует, что z = 0 — экспоненциально устойчивая точка равновесия. Π
Сформулируем полученный результат в виде следующей теоремы.
Теорема 10.3. Предположим, что
• /, g и их первые частные производные по х непрерывны и ограничены для
всех (£,£,ε) G [0, оо) х Do х [—£о?£о] °^
ля лю
^
ого
компактного множества
DoСD,гдеDСRn
—
открытая область, содержащая начало координат;
• начало координат является экспоненциально устойчивой точкой равновесия
автономной системы (10.16);
g(t, х, ε) — Τ -периодическая по t
426
ГЛАВА 10
Тогда существуют положительные константы ε* и к, такие что для всех
\ε\ < ε* уравнение (10.15) имеет единственное Τ-периодическое решение x(t, ε),
обладающее свойством ||a?(t,e)|| < &|ε|. Более того, это решение является экс
поненциально устойчивым.
Если #(£, 0, ε) = 0, то начало координат представляет собой точку равнове
сия возмущенной системы (10.15). Из единственности периодического решения
х(£, ε) следует, что x(t, ε) является тривиальным решением х = 0. В этом случае
теорема гарантирует, что начало координат является экспоненциально устойчи
вой точкой равновесия возмущенной системы (10.15).
10.4. Метод усреднения
Метод усреднения применяется при анализе систем вида
х = ε/(£,Χ,ε),
где ε — малый положительный параметр и f(t,x,e)
—
Т-периодическая по t
функция, т. е.
f(t +Г,х,ε)=/(*,х,ε),V(t,ж,ε)е[0,оо)хD х[0,ε0]
для некоторой области D с R
n
.
С использованием этого метода решение систе
мы апроксимируется решением «усредненной системы», получаемой усреднени
ем /(i, х, ε) при ε = 0. Для мотивации метода усреднения рассмотрим скалярный
пример.
Пример 10.7. Рассмотрим линейную систему первого порядка
х = ea(t,e)x, x{0) = г/,
(10.21)
где ε — положительный параметр, а — достаточно гладкая по своим аргументам
функция и a(t + Τ, ε) = α(£, ε) для всех t ^ 0. Для получения приближенного
решения, верного при малом значении ε, можно применить метод возмущений,
рассмотренный в параграфе 10.1. При ε = 0 получаем невозмущенную систему
х=0,х(0)=η,
которая имеет постоянное решение xo(i) = η. В соответствии с теоремой 10.1
ошибка этой аппроксимации будет иметь порядок О (ε) на 0(1)-интервалах вре
мени. Невозмущенная система не удовлетворяет условиям теоремы 10.2. Поэто
му неясно, является ли эта аппроксимация верной на интервалах, больших чем
0(1)-интервалы. Поскольку в этом примере можно выписать точное решение
в явном виде, оценим ошибку аппроксимации с помощью непосредственных вы
числений. Решение уравнения (10.21) имеет вид
x(t,ε)= ехр ε/α(τ,ε)dr
10.4. МЕТОД УСРЕДНЕНИЯ
427
Следовательно, ошибка аппроксимации определяется равенством
x(t,ε) — xo(t) = s exp ε / α(τ,e)dr\
—
1>η.
Для того чтобы исследовать изменение этой ошибки аппроксимации при уве
личении t, необходимо оценить в предыдущем равенстве интегральный член.
Функция α(£, ε) является периодической по t. Пусть ее среднее определяется ра
венством
1Г
α(ε)= -
/ а{т, ε) dr.
Перепишем α(£,ε) в следующем виде:
a(t,e) = α(ε) + [α(£,ε) — α(ε)].
Член в скобках представляет собой Т-периодическую функцию времени с нуле
вым средним. Поэтому интеграл
/ [α(τ,ε)-α(ε)]^τα=Δ(^ε)
Jo
также является Т-периодической функцией и, следовательно, ограничен при всех
t > 0. С другой стороны, при интегрировании члена α(ε) на [0, t] получаем ta(e).
Таким образом,
x(t,e) — xo(t) = {βΧρ[ε£α(ε)]βΧρ[εΔ(£,ε)] - 1}η.
За исключением случая α (ε) = 0, ошибка аппроксимации имеет порядок О (ε)
только на 0(1)-интервалах времени. Тщательный анализ ошибки аппроксимации
показывает, что лучшим приближением для x(t,e) является ΘΧρ[ε£α(ε)]τ7 или да
же βΧρ[ε£α(0)]?7, поскольку α(ε) - α(0) = Ο(ε). Рассмотрим x(et) = exp[£io(0)]ry
в качестве альтернативной аппроксимации. Тогда ошибка аппроксимации опре
деляется равенством
x(t,e) —x{et) = {βΧρ[ε*α(ε)]βΧρ[εΔ(*,ε)] - βΧρ[ε£α(0)]}η =
= βΧρ[ε£α(0)]{θΧρ[ε£(α(ε) — α(0))] βΧρ[εΔ(£,ε)] — 1}?7.
Заметим, что
βΧρ[εΔ(^ε)] = 1 + Ο(ε), W ^ 0,
βΧρ[ε£(α(ε) - α(0))] = βΧρ[£θ(ε2)] = 1 + Ο(ε), V* € [0,6/ε]
ехр^а(О)] = 0(1), Vt G [0,Ь/е]
для любого положительного Ь > 0. Тогда #(£,ε) — α;(ε£) = О (ε) на интервалах
времени порядка 0(1/ε), что подтверждает утверждение о том, что аппроксима
ция x(et) = exp^ia(0)]ry лучше аппроксимации rco(i) = η. Заметим, что x(et) —
решение усредненной системы
х = εα(0)Χ, х(0) = г/,
(10.22)
428
ГЛАВА 10
правая часть которой представляет собой усреднение правой части (10.21) при
е=0.
Δ
В этом примере мы получили усредненную систему (10.22) с использовани
ем выражения в явном виде для точного решения уравнения (10.21). Это выра
жение в явном виде можно получить лишь в частных случаях. Однако примени
мость метода усреднения распространяется не только на конкретные примеры.
Рассмотрим идею метода усреднения с другой стороны. Правая часть (10.21)
умножается на положительную константу ε. Если ε мала, решение х изменяется
с течением времени «медленно» по сравнению с периодическими флуктуация-
ми α(£, ε). Интуитивно понятно, что отклик системы изменяется более медленно,
чем возбуждающее воздействие и поэтому, этот отклик определяется преимуще
ственно усреднением этого возбуждения. Эта догадка имеет свои корни в теории
линейных систем, из которой известно, что если полоса пропускания системы
существенно меньше диапазона частот на входе, то система функционирует как
фильтр нижних частот, отсекающий высокочастотные компоненты входного сиг
нала. Если решение (10.21) в основном определяется усреднением флуктуации
а(£, б), разумно при получении О (б)-аппроксимации заменить функцию а(£, б) на
ее усреднение. Эта интерпретация метода усреднения с двойным масштабиро
ванием по времени никак не зависит от специфических особенностей системы
в примере 10.7 и при таком подходе никак не используется линейность системы.
Как мы увидим далее, эта идея применима и к более общим ситуациям.
Рассмотрим систему
i=€/(*,ж,б),
(10.23)
где / и ее частные производные по (х,б) до второго порядка включительно
непрерывны и ограничены при (£, #, е) € [0, оо) х Do x [0, ео] для любого ком
пактного множества Do С D, где D С Rn
—
некоторая открытая область. Пред
положим, что /(£,х,б) является Т-периодической по t для некоторого Τ > 0
и положительного параметра ε. Мы будем ассоциировать с системой (10.23) ав
тономную усредненную систему
X — £/av(#)>
где
fw(x) = ^J /(r,x,0)dr.
(10.25)
При использовании метода усреднения основной задачей является получе
ние ответа на вопрос, в каком смысле поведение автономной системы (10.24)
аппроксимирует поведение неавтономной системы (10.23). С использованием за
мены переменных можно показать, что неавтономная система (10.23) может быть
представлена в виде возмущения автономной системы (10.24). Для этого опреде
лим
u(t,x)= / h(r,x)dr,
(10.26)
Jo
(10.24)
10.4 . МЕТОД УСРЕДНЕНИЯ
429
где
h(t, х) = /(*, ж, 0) - /av(x).
(10.27)
Поскольку h(t,x) является Т-периодической по t и имеет нулевое среднее, функ
ция u(t,x) также является Т-периодической по t. Следовательно, u(t,x) ограни
чена для всех (t,x) Ε [0, оо) х DQ. Более того, ди/дЬ и ди/дх, определяемые
равенствами
ди=ш
ч
ди
dt
n[hx)
>
дх l £<*·*>*·
являются Т-периодическими по t и ограниченными на [0, оо) х Д). Здесь мы ис
пользовали тот факт, что dh/dx является Т-периодической по t и имеет нулевое
среднее. Рассмотрим замену переменных
x=y+eu(t,y).
(10.28)
Дифференцируя левую и правую части по t, получаем
Подставив в это равенство х из (10.23), заключаем, что новая переменная состо
яния у удовлетворяет уравнению
1+е
ди
ду У = ef(t,y + €u,e) -ε-j^
=
def
= ef(t, у+ещε)- e/(t,у,0)+efAV(y) =
def
ef*v(y)+ep(t,y,e),
где
p(t,У,ε)=[/(*, у+ ей,ε)-f(t, у,ε)}+[/(*, у,ε)- /(t,у,0)].
Функция p(t, у, ε) является Т-периодической по t. С использованием теоремы
о среднем значении мы можем представить ее в следующем виде:
p(t, у,ε)=Fi(i,у,ей,ε)εη+F2(t, у,ε)ε.
Поскольку ди/ду ограничена на [0, оо) х Д), матрица / + εдu/дy невырожденна
при достаточно малой ε и
Ι+εди
ду =Ι+ 0(ε).
Поэтому уравнение состояния для у имеет вид
у=е/лу(у) +ε
2
4(£,2/,ε),
(10.29)
430
ГЛАВА 10
где q(t,y,e) является Т-периодической по t и /av><7 и их первые частные про
изводные по (у, ε) непрерывны и ограничены на [0, оо) х Do при достаточно
малой ε. Это уравнение представляет собой возмущенную систему для усреднен
ной системы (10.24). Применяя результаты предыдущих трех параграфов к рас
сматриваемой задаче, получаем теоретический базис для аппроксимации реше
ний (10.29) решениями усредненной системы (10.24).
Замена времени s = et приводит (10.29) к виду
^ = Λν(»)+εφ/ε>2/,ε),
(10.30)
где q{s/e, у, ε) является εΤ-периодической по 5 и ограниченной на [0, оо) х Do
при достаточно малой ε. Применяя теоремы 3.4 и 3.5 о непрерывности решений
по начальным данным и параметрам, заключаем, что если усредненная система
имеет единственное решение y(s), определенное на [0,6], y(s) G D для всех
5 G [0,6] и у(0, ε) - a?av(0) = Ο(ε), то существует константа ε* > 0, такая что
для всех 0 < ε < ε* возмущенная система (10.30) имеет единственное решение,
определенное для всех s G [0,6] и близость этих двух решений имеет поря
докО(ε).Посколькуt=s/εих—у
—
О (ε) (см. (10.28)), решение усредненной
системы (10.24) представляет собой О ^-аппроксимацию решения (10.23) на ин
тервале времени [0, b/ε] временной шкалы t.
Предположим, что усредненная система (10.24) имеет экспоненциально
устойчивую точку равновесия в начале координат и D — некоторая открытая
область, содержащая начало координат. Пусть V(у) — функция Ляпунова, суще
ствование которой гарантируется обратной теоремой Ляпунова 4.17. Тогда для
любого компактного подмножества Ω области притяжения начала координат су
ществует константа с > 0, такая что Ω принадлежит внутренности компактного
множества {V(y) < с}. Предположим, что y&v(0) G Ω и у(0,е) - yav(0) = 0(ε).
Из теоремы 9.1 следует, что О (ε)-аппроксимация будет верна для всех s ^ 0, т. е.
длявсехt^0.
Наконец, из теоремы 10.3 следует, что (10.30) имеет единственное, экспонен
циально устойчивое, (εΤ)-периодическое решение ^(θ/ε,ε) в О (ε)-окрестности
начала координат. Периодическое решение имеет период εΤ во временной шка
ле s, т. е. период Τ во временной шкале t. Из (10.28) видно, что (10.23) имеет Т-
периодическое решение
x(t, ε) = y(i, ε) + eu{t, y(t, ε)).
Поскольку и ограничена, периодическое решение x(t,e) принадлежит 0(e)-
окрестности начала координат. Суммируем полученные результаты в следующей
теореме.
10.4. МЕТОД УСРЕДНЕНИЯ
431
Теорема 10.4. Пусть /(£,#, ε) и ее частные производные по (ж, ε) до вто
рого порядка включительно непрерывны и ограничены при (t,x,e) G [0, оо) х
Do х [0, εο] для любого компактного множества Do С D, где D С Rn
—
неко
торая открытая область. Предположим, что f является Τ-периодической по t
для некоторого Τ > 0 и некоторого положительного параметра е. Пусть x(t,e)
и x&v(et) — соответственно решения (10.23) и (10.24).
• Если x&v(et) G D Vt G [0,6/ε] и #(0,ε) — a?av(0) = 0(ε), то существует
константа ε* > 0, такая что для всех 0 < ε < ε* функция x(t, ε) определена
и
x(t, ε) — Xav(et) = Ο (ε) на [0, b/ε].
• £слм начало координат х = 0 Ε D является экспоненциально устойчивой
точкой равновесия усредненной системы (10.24), Ω С D — компактное
подмножество ее области притяжения, xav(0) G Ω и #(0,ε) — xav(0) =
= О(ε), mo существует ε* > 0, такая что для всех 0 < ε < ε* функция
x(t,e) определена и
ж(£, ε) — Χ&ν(ε£) = Ο(ε) длл всех £ G [0, оо).
• £с/ш начало координат х = 0 G D является экспоненциально устойчивой
точкой равновесия усредненной системы (10.24), то существуют положи
тельные константы ε* и к, такие что для всех 0 < ε < ε* система (10.23)
имеет единственное, экспоненциально устойчивое Τ-периодическое x(t, ε),
обладающее свойством \\x(t,e)\\ ^ Ιτε.
Если /(£,0,ε) = 0 для всех (£,ε) G [0,оо) х [0,εο], το начало координат яв
ляется точкой равновесия системы (10.23). Из единственности Т-периодического
решения x(t,e) следует, что x(t,e) является тривиальным решением х = 0.
В этом случае теорема гарантирует, что начало координат является экспонен
циально устойчивой точкой равновесия системы (10.23).
Пример 10.8. Рассмотрим линейную систему
х = eA(t)x,
гдеA(t+Г)=A(t) иε>0.Пусть
Усредненная система имеет вид
х=εАх.
Она имеет точку равновесия в х = 0. Предположим, что матрица А гурвицева.
Тогда из теоремы 10.4 следует, что при достаточно малой константе ε система
432
ГЛАВА 10
х = eA(t)x имеет единственное Т-периодическое решение в 0(в)-окрестности
начала координат х = 0. Заметим однако, что х = 0 — точка равновесия си
стемы. Следовательно, периодическое решение является тривиальным решением
x(t) = 0. Поэтому мы можем заключить, что при достаточно малой ε точка х = 0
является экспоненциально устойчивым состоянием равновесия неавтономной си
стемы х = eA(t)x.
Δ
Пример 10.9. Рассмотрим скалярную систему
х = e(xsm
2
t —0.5х
2
)=
ef(tyx).
Функция f(t,x) является π-периодической по t. Усредненная функция /av(#)
имеет вид
/av(x) = ! / (*sin
2
1-0.5x
2
)dt=0.5(ж- х
2
).
Jo
Усредненная система
х=0.5ε(Χ—х
2
)
имеет две точки равновесия вж = 0их = 1. Якобиан df&v/dx9 вычисленный
в этих точках, определяется равенствами
dfa*
d
= (0.5-«)U=o = 0.5,
х=0
= (0.5-х)|ж=1 = -0.5.
х=1
Таким образом, при достаточно малой ε система имеет экспоненциально устой
чивое π-периодическое решение в О (ε)-окрестности точки х = 1. Нарисовав
график функции х — х
2
, можно увидеть, что областью притяжения точки х = 1
является (0, оо). Следовательно, найдя решение усредненной системы с теми же
начальными состояниями, что и для исходной системы, при условии, что эти
начальные состояния принадлежат компактному интервалу [а, Ь] С (0, оо), полу
чаем аппроксимацию
x(t,e) - Хы(еЬ) = Ο(ε), Vf ^ 0.
Пусть теперь необходимо найти аппроксимацию второго порядка. Для этого сле
дует применить замену переменных (10.28), рассмотреть стандартную задачу
с возмущениями и вычислить соответствующее приближенное решение в со
ответствии с процедурой, представленной в параграфе 10.1. С учетом (10.26)
заключаем, что функция u(t, x) определяется равенством
u(t,x)= / (xsin
2
r- 0.5x
2
-
О.Ьх + 0.5x
2
)dr =
-jxsm2t.
Jo
4
Замена переменных (10.28) принимает в рассматриваемом случае вид
х = у — jeysin2t = (1 — jesm2t)y.
10.4 . МЕТОД УСРЕДНЕНИЯ
433
Дифференцируя по t, получаем
х = (1 — jssm2t)y — 7reycos2t.
Следовательно,
У=Ι//лч-o.^
sin2
^~ \*
2
+h
cos2t
)'
1- (ε/4)sin2t
ΖΖ
Подставляя представление х в терминах у и раскладывая член 1/[1 — (ε/4) sin 2t]
в степенной ряд
,
*.0
= 1 + ±esin2* + 0(ε2),
l-(e/4)sin2i
4
v
"
получаем уравнение
jf=\е(у-у
2
)+^е
2
(уsin4i + 2y2
sin2i) + 0(ε3).
Таким образом, система представлена в виде возмущения усредненной системы.
Для того чтобы найти аппроксимацию второго порядка, необходимо представить
?/о и у\ в виде конечного ряда Тейлора
у=2/о+eyi+ε
2
^.
Известно, что уо = #av является решением усредненной системы. Уравнение для
yi имеет вид
У1=£
(l-yo(t))yi + ±yo(t)sm4t+iy%(t)sm2t\
, yi(0)=0.
Это уравнение получено в предположении, что начальное состояние ж(0) не за
висит от ε. С учетом (10.28), получаем аппроксимацию второго порядка для х:
х = (l - iesin2i) x&y(et) + eyi(t,e) + 0(ε2).
На рисунке 10.5 показаны решение неусредненной системы, решение усреднен
ной системы и аппроксимация решения второго порядка при х(0) = 0.7 и ε = 0.3.
Из этого рисунка видно, насколько точно решение усредненной системы прибли
жает точное решение. Аппроксимация второго порядка практически неотличима
от точного решения, но по мере того, как система приходит в установившийся
режим, разность между этими функциями становится более заметной.
Δ
Пример 10.10. Рассмотрим маятник из параграфа 1.2.1 и предположим,
что точка подвеса подвержена высокочастотным вертикальным колебаниям ма
лой амплитуды, которые имеют вид sinu;£, где а — амплитуда и ω — частота.
434
ГЛАВА 10
Рис. 10.5. Точное решение (непрерывная линия), усреднение (пунктирная линия) и ап
проксимация второго порядка (штрихпунктирная линия) в примере 10.9 при ε — 0.3
Уравнение Ньютона, описывающее движение подвешенной массы в направле
нии, перпендикулярном стержню маятника, имеет следующий вид:
7
m(W — au;
2
sinu;isin0) = — тд sin θ — k(W + aujcosuitsmO).
Предположим также, что α/Ι С 1 и ω$/ω <С 1, где ω$ = y/g/l — частота сво
бодных колебаний маятника вблизи нижнего положения равновесия θ = 0. Пусть
ε = а/1 и ωο/ω = αε, где а — ω^Ι/ωα. Положим β = k/muo и сделаем замену
времени г — ut. В новом временном масштабе уравнения движения принимают
следующий вид:
^1 + αβεψ. + {α2ε2 εsinτ)sinθΗ-αβε
2
cosτ sinθ —0.
Рассматривая
#1=0, Χ2=ρΤ~+
cos τ snl
*
ь
ατ
в качестве переменных состояния, получаем уравнение состояния:
dx
dr
••ef(r,x),
(10.31)
7
Для того чтобы получить это уравнение, необходимо выписать выражения для х- и у-
координат массы: х = IsinO и у — IcosO — asinc^i. Далее, получаем выражения для скорости
и ускорения массы в направлении, перпендикулярном стержню маятника: (ΙΘ + αω cos ut sin Θ)
и (ΙΘ—αω
2
sin ω£ sin Θ) соответственно. В качестве модели силы трения выбираем модель вязкого
трения, согласно которой сила трения пропорциональна скорости движения массы; соответствую
щий коэффициент пропорциональности обозначаем через к.
10.4 . МЕТОД УСРЕДНЕНИЯ
435
где
/i(τ,х) =Х2—sinх\cosτ,
/2(т,х)= —αβΧ2—a
2
sinх\ + #2cos x
icos
т
~~
snl x
icosx
icos 2т.
Функция f(r,x) является (27г)-периодической по т. Усредненная система имеет
вид
dx
dr
—
^/avV^j?
(10.32)
где
1/
/avl(z) = 2π / /l(r
>z)
dr
=
^2,
/av2(^) = o~ / f2(r,x)dr = -a/fo2 - a
2
sin:zi - ±sin2xi.
При получении этих выражений мы использовали тот факт, что усреднение
COST равно нулю, а усреднение cos
2
τ равно 1/2. Исходная неусредненная систе
ма (10.31) и усредненная система (10.32) имеют точки равновесия (xi = 0,а;2 =
= 0) и (xi = 7г,£2 = 0), которые соответствуют положениям равновесия ма
ятника θ = 0 и θ = π. Если точка подвеса неподвижна, положение равновесия
0 = 0 экспоненциально устойчиво, а положение равновесия θ = π неустойчиво.
Исследуем влияние вертикального колебания точки подвеса. Для того чтобы при
менить теорему 10.4, необходимо выполнить анализ свойств устойчивости точки
равновесия усредненной системы (10.32). Это можно сделать с использованием
метода линеаризации. Матрица Якоби fa,v(x) имеет вид
ей
дх
0
1
—a
2
cosх\ —0.5cos2x\ —αβ
В точке равновесия (х\ = 0, Х2 = 0) якобиан
-а
2
-0.5
1
-αβ
является гурвицевой матрицей для всех положительных значений а и β. Тогда
из теоремы 10.4 следует, что при достаточно малой ε исходная система (10.31)
имеет единственное экспоненциально устойчивое (27г)-периодическое решение
в 0(е)-окрестности начала координат. Поскольку начало координат является точ
кой равновесия исходной системы, периодическое решение является тривиаль
ным решением х = 0. В этом случае из теоремы 10.4 следует, что при достаточ
но малой ε начало координат является экспоненциально устойчивой точкой рав
новесия исходной системы (10.31). Другими словами, экспоненциальная устой
чивость нижнего положения равновесия маятника сохраняется при колебании
436
ГЛАВА 10
(с малой амплитудой и высокой частотой) точки подвеса. В точке равновесия
(xi = π,Χ2 = 0) якобиан
0
1
а
2
-0.5
-αβ
является гурвицевой матрицей при 0 < а < 1/\/2 и β > 0. Заметим, что (х\ =
= 7г,Ж2 = 0) является точкой равновесия исходной системы. Тогда с исполь
зованием теоремы 10.4 заключаем, что если а < 1/л/2, то верхнее положение
равновесия θ = π является экспоненциально устойчивой точкой равновесия ис
ходной системы (10.31) при достаточно малой ε. Этот результат представляется
интригующим, поскольку из него следует, что неустойчивое положение равнове
сия маятника может быть стабилизировано вертикальным колебанием (с малой
амплитудой и высокой частотой) точки подвеса
8
.
Δ
10.5. Осцилляторы второго порядка со слабой нелинейностью
Рассмотрим систему второго порядка
у+ш
2
у = ед(у,у),
(10.33)
где #(·,·)
—
достаточно гладкая функция, такая что \д\ ограничена величинами
к\у\ или к\у\ на компактных множествах точек (у, у); к — некоторая положитель
ная константа. Выбрав х\ = у и x<i = у/ω в качестве переменных состояния,
получаем уравнение состояния
Х\ = UX2,
х2 = -ωΧλ + ^д(х1,шх2).
Представление этой системы в полярных координатах
х\ =гsin</>,Х2=гcosφ
имеет вид
1
Ε
Г = ψ(Χ\ΧΙ +£2^2) = ^#(r SHI 0,tJr COS 0) COS </>,
(10.34)
φ= -^(^2^1 —#1X2)= ω —βψg(r sinφ,ωτcosφ)sinφ. (10.35)
Второй член в правой части (10.35) имеет порядок О (ε) на ограниченных мно
жествах значений г, что является следствием предположения о том, что \д\ огра
ничена величинами к\у\ или к\у\. Следовательно, правая часть (10.35) положи
тельна при достаточно малой ε. Разделим (10.34) на (10.35):
dr
εg(r sinφ,ωτ cosφ)cosφ
αφω
2
—
(г/г)д(г sin φ, ων cos φ) sin φ
Идея введения высокочастотных колебаний с нулевым средним в параметры динамической
системы для целенаправленной модификации свойств этой системы обобщена в виде принципа
вибрационного управления в работах [22] и [127].
10.5 . ОСЦИЛЛЯТОРЫ ВТОРОГО ПОРЯДКА СО СЛАБОЙ НЕЛИНЕЙНОСТЬЮ
437
Это уравнение может быть переписано в следующей форме:
^=ε/(0,Γ,ε),
(10.36)
где
g(r sin0,ων cosφ)cosφ
1(Ф,г,е) ω2
—
(e/r)g(r sin φ, ων cos φ) sin φ
Если рассмотреть ф как независимую переменную, то (10.36) примет вид (10.23),
где /(</>, г,ε) — (27г)-периодическая по φ функция. Функция /&у(г) определяется
равенством
1/*
2π
1/*
2π
/av(О = oz
/(Φ, г, 0)# = -—-
/ #(r sin</>,cjr cosφ)cos<
/
> d<£.
Z7r
Jo
2πατ У0
Предположим, что усредненная система
^
= ^/av(r)
(10.37)
имеет точку равновесия г*, где [df&y/dr](r*) < 0. Тогда существует такой ε* > 0,
что для любого ε, удовлетворяющего 0 < ε < ε*, уравнение (10.36) имеет
единственное экспоненциально устойчивое (27г)-периодическое решение г =
= Я(ф, ε) в Ο (ε)-окрестности г*. Из этого результата, вообще говоря, не следует,
что (10.33) имеет периодическое решение для t. Для того чтобы получить этот ре
зультат, необходимо выполнить дополнительный анализ. Подставляя г = Я(ф, ε)
в (10.35), получаем
φ—ω
—j-—-д(Я(ф, ε) sin φ, иЯ(ф, ε) cosφ) sin φ.
ищф,е)
Пусть ф*(Ь, ε) — решение этого уравнения, начинающееся в ф*(0, ε) = 0. Для того
чтобы показать, что (10.33) имеет периодическое решение, необходимо доказать,
что существует момент времени Τ = Τ (ε) > 0, вообще говоря, зависящий от ε,
такой что
(£*(* +Τ,ε) = 2π + </>*(*,ε),ν* ^ 0.
(10.38)
Рассмотрим с этой целью равенство
Λ(<£*(* + Τ,ε),ε) =Λ(2π+ (/>*(*, ε), ε) = Rty*(t,e),e),
из которого следует, что Я(ф*(Ь, ε), ε) — Т-периодическая функция по t. Посколь
ку
ф*(t+τ,ε)=φ*(t,ε)+ωτ +Ο(ε)
для ограниченных τ ^ 0, можно легко показать, что при достаточно малой ε
уравнение (10.38) имеет единственное решение Τ (ε) = 2π/ω + Ο(ε).
438
ГЛАВА 10
График решения г = R((j?(t,e),e) на (а?ь ^-плоскости представляет со
бой замкнутую орбиту в окрестности окружности г = г*. Поскольку периоди
ческое решение г = Д(0, ε) экспоненциально устойчиво, эта замкнутая орбита
притягивает все решения из этой окрестности, т. е. замкнутая орбита является
устойчивым предельным циклом.
Пример 10.11. Уравнение Ван дер Поля
у+у=еу{1-у
2
)
представляет собой частный случай системы (10.33) с ω = 1 и д(у, у) = у(1 — у
2
).
Функция f&y (г) определяется равенством
1 f2n
ΛνΟ")=о~/ i1
~^
Sin2
^)
Г COs2
Φ^Φ
=
/»2π
.
/*2π
7г— /
r cos
2
φαφ—— /
r
3
sin
2
<
/
> cos
2
27Γ Λ
2π JO
=К-V.
28
Усредненная система
имеет три точки равновесия вг = 0,г = 2иг = —2. Поскольку по определению
г ^ 0, отрицательный корень не рассматривается. Свойства устойчивости будут
установлены с использованием метода линеаризации. Матрица Якоби имеет вид
d
/av=1_32
dr
28·
Тогда
ffiav
dr
Ι>ο·
^
2>U
'
dr
=-К0.
r=2
r=0
Таким образом, точка равновесия г = 2 экспоненциально устойчива. Поэтому
при достаточно малом ε уравнение Ван дер Поля имеет устойчивый предельный
цикл в 0(е)-окрестности г = 2. Отклонение периода колебаний от 2π имеет
порядок О (ε). Этот устойчивый предельный цикл был исследован с использова
нием компьютерного моделирования в примере 2.6.
Δ
Заметим в заключение этого параграфа, что представленная процедура мо
жет быть также использована для доказательства существования в системе
неустойчивого предельного цикла. Это может быть сделано, если рассмотреть
(10.33) в обратном времени, т. е. при замене переменной времени t на новую τ =
= —t. Если система имеет устойчивый предельный цикл в обратном времени, то
она имеет неустойчивый предельный цикл в прямом времени.
10.6. МЕТОД УСРЕДНЕНИЯ для ОБЩЕГО СЛУЧАЯ
439
10.6. Метод усреднения для общего случая
Рассмотрим систему
x = ef(t,x,e),
(10.39)
где / и ее частные производные по (ж, ε) до второго порядка включительно
непрерывны и ограничены при (£,х, е) G [0, оо) х Do x [0,εο] для любого ком
пактного множества Do С D. Параметр ε является положительной константой
иDсR
n
—
некоторая открытая область. Метод усреднения может быть при
менен к системе (10.39), не только когда функция f(t,x,e)
является периодиче
ской по t, но и в более общих случаях. В частности, этот метод применим, если
в соответствии со следующим определением функция /(£, х,0) имеет хорошо
определенное среднее.
Определение 10.2. Непрерывная, ограниченная функция д : [0, оо) х D —»
—»R
n
имеет среднее {average) д^(х), если предел
1 ft+T
5av0*0=lim- /
g(r,x)dr
Г->оо 1 Jt
существует и
rt+τ
\TJt
g(r,x)dr
- 9&y(x) ^ fea(T), V(i,x) G [0,oo) x D0
для любого компактного множества Do С D, где А: — некоторая положительная
константа (возможно, зависящая от Do). Строго убывающая, непрерывная,
ограниченная функция σ : [0, сю) -» [0, оо), такая что σ(Τ) —> 0 при Τ —> оо,
называется функцией сходимости (convergency function)
9
.
Пример 10.12.
• Пусть g(t,x) = Y^,k=i9k(t,x), где </&(£, ж) — периодическая по £ функция
с периодом Tfc, Т\ Φ Tj при i φ j. Функция g не является периодической
10
по t, но она имеет среднее
N
k=l
где gk&v — среднее периодической функции gk{t,x)9 определенное в пара
графе 10.4. Функция сходимости σ имеет порядок 0(1/Т) при Τ —> оо.
В качестве такой функции может быть взята σ(Τ) = 1/(Т + 1).
9
Точнее было бы назвать σ(τ) функцией скорости сходимости. Следовало бы также показать,
что предел не зависит от t (что, впрочем, легко сделать). — Прим. ред. перев.
10
Эта функция называется почти-периодической. Теория почти-периодических функций изло
жена в работах [59] и [75].
440
ГЛАВА 10
• Среднее для функции
9(^x) = j^h(x)
равно нулю и в качестве функции сходимости σ можно взять σ(Τ) =
= (1/Г)1п(1+Г).
Δ
Предположим, что /(£, х, 0) имеет среднее fa,v(x) с функцией сходимости σ.
Пусть
/i(*,x) = /(*,x,0)-/av(x).
(10.40)
Функция ft(i, ж) имеет нулевое среднее с функцией сходимости σ. Предположим,
что матрица Якоби dh/dx имеет нулевое среднее с той же функцией сходимо
сти σ. Определим
ги(£,ж,77) = / ft(r,x)exp[—7/(i — r)]dr
(10.41)
Λ)
для некоторой положительной константы г/. При г/ = 0 функция w(t,x,0) удо
влетворяет равенству
\\w(t + δ,х,0) — ги(£,ж,0)|| = / h{r^x)dr — I h(r,x)dr
\\Jo
Jo
II /*
<+<5
II
=
/ h(T,x)dr\\ < jfeia(i).
(10.42)
ΙΙΛ
II
Из этого равенства, в частности, следует, что
|Н*,х,0)|| < kta(t), V(i,x) G [0,oo) x Дь
т. к. гу(0, х, 0) = 0. Вычисляя интеграл в правой части (10.41) по частям, получа
ем
w(t,х,η)=w(t,x,0)—η / exp[—r/(i—т)]ги(т,x,0)dr =
Λ)
= exp(—tf)w(t, x, 0) — 77 / exp[—??(£ — г)] [ги(т, х, 0) — w(t, x, 0)] dr.
Второе равенство было получено путем прибавления и вычитания
η / ехр[—т?(£ — г)] dr ги(£, х, 0)
./о
к правой части равенства. С учетом (10.42), получаем
\\w(t,x^)\\4:kAexp(-rit)a(t)
+ fy / exp[-^t - r)](t - r)a(t - r)dr. (10.
Jo
43)
10.6 . МЕТОД УСРЕДНЕНИЯ для ОБЩЕГО СЛУЧАЯ
441
Это неравенство может быть использовано при доказательстве того, что функ
ция 77||W(£,X,77)|| равномерно ограничена величиной fca(r/) для некоторой /С-
функции а. Например, если a{t) = l/(t + 1), то
г/||г£7(*,дг,г/)|| ^fc?7exp(—7/i)+ krf I exp[—ry(i — τ)] dr = fcry.
Jo
Определив α(η) — η, получаем 77||ги(£,х, 77)|| < kafy). Если a(t) = l/(*
r
+ 1), где
0<г<1,то
т/И*, ж, т/)|| ^М
(1
"
г)
е"^+^
2
/е"
7
^"^ - т)^~
г
Чт^
Jo
^ kV(^ψ
1
)
е-^-
7
^ +kV
2
Γ e-i's^-^da
^
<
kr}
(1
-^)
1
~
Гe
~
{l
~
r)
+
к
ч
2
Щ^
<
kk
^
r
i
где Γ(·)
—
стандартная гамма-функция. Определив α(η) = к^
г
,
получаем
?у||гу(*,ж,г/)|| ^ ка^). В общем случае можно показать (см. упражнение 10.19),
что существует /С-функция а, такая что
η\\ν&Χ,η)\\ ^ ka(V)y V(t,x) € [0,oo) x D0.
(10.44)
Не умаляя общности, можно выбрать α(η) такую, что α(η) ^ ση при η е [0,1],
где с — положительная константа. Частные производные [dw/dt] и [dw/dx] опре
деляются равенствами
-^=
h(t,x)-ryu)(t,x^),
dw
дх
=
f^x)eM-v(t-T)}dr.
Поскольку [dh/dx] характеризуется теми же свойствами, что и h, мы можем
повторить действия, которые позволили получить (10.44), и показать, что
V
dw
dx
^ fcafa), V(i,s) 6 [0,оо) х Д).
(10.45)
Не умаляя общности, можно использовать в (10.44) и (10.45) одну и ту же /С-
функцию, т. к. две соответствующие оценки будут отличаться лишь положитель
ной константой при члене, зависящем от η. Поэтому в качестве коэффициен
та в выражении, определяющем а, можно использовать максимум из этих двух
констант.
Определенная выше функция w(t,x^) обладает всеми ключевыми свой
ствами, характеризующими функцию u(t,x) в параграфе 10.4. Единственным
442
ГЛАВА 10
отличием будет то, что параметризация функции w параметром η такова, что
границы для w и [dw/dx] имеют вид Ηα{η)/η, где а — некоторая /С-функция.
Необходимость параметризации функции и каким-либо параметром отсутству
ет. В действительности функция u(t,x) представляет собой функцию νυ(1,Χ,η),
вычисленную при η = 0. В этом нет ничего удивительного, поскольку в периоди
ческом случае функция сходимости имеет вид a(t) = l/(t + 1) и, следовательно,
α(η)/η = 1.
Дальнейший анализ будет почти полностью аналогичен тому, что был вы
полнен в параграфе 10.4. Определим замену переменных
x = y + ew(t,y,e).
(10.46)
Член ew(t,y,e) имеет порядок 0(а(е)). Таким образом, при достаточно малой ε
замена переменных (10.46) хорошо определена, т.к. матрица [/ + edw/dy] невы-
рожденна. В частности,
ду
1 =/ + 0(а(С)).
Продолжая анализ аналогично тому, как это было сделано в параграфе 10.4, мож
но показать, что уравнение состояния для у имеет вид
у = e/av(y) + ea(e)q(t, у, ei),
(10.47)
где функция q(t, у, е) ограничена на [0, оо) х DQ при достаточно малой ε. При
получении (10.47) использовался тот факт, что α(ε) ^ се. Уравнение (10.47)
представляет собой возмущение усредненной системы
х = е/лу(х)
(10.48)
и аналогично (10.29) с учетом того, что в рассматриваемом здесь случае вместо
коэффициента ε
2
при q стоит εα(ε). С учетом этого обстоятельства мы можем
получить аналогичный теореме 10.4 результат, в котором 0(б)-оценки из этой
теоремы будут заменены на 0(α(ε))-оценки.
Теорема 10.5. Пусть f(t,x,e)
и ее частные производные по (ж, ε) до вто
рого порядка включительно непрерывны и ограничены при (£, х, ε) Ε [0, оо) хД) х
х
[0? £о] для
любого компактного множества Do С D, где £>0м1)сД
п
-
некоторая открытая область. Предположим, что /(£,я,0) имеет среднее
/av(x) на [0, оо) х D и якобиан функции h(t,x) = f(t, x,0) — /av(#) имеет нуле
вое среднее с функцией сходимости, равной функции сходимости для /. Пусть
x(t,ε) и #&ν(ε£) —решения (10.39) и (10.48) соответственно, и ос — К -функция,
фигурирующая в оценках (10.44) и (10.45).
• Если x&v(et) e D\/t е [0, Ь/ε] и ж(0,£) — £av(0) = 0(α(ε)), то существует
ε* > 0, такая что для всех 0 < ε < ε*, £(£,ε) определено и
x(t,e) - x&v(et) = 0(α(ε)) на [0,6/ε].
10.6 . МЕТОД УСРЕДНЕНИЯ для ОБЩЕГО СЛУЧАЯ
443
• Если начало координат х = 0 £ D является экспоненциально устой
чивой точкой равновесия усредненной системы (10.48), Ω С D — ком
пактное подмножество области притяжения этой точки, xav(0) £ Ω
и #(0,ε) — Χαν(0,ε) = 0(α(ε)), то существует ε* > 0, такая что для
всех 0 < ε < ε*, x(t,e) определено и
x(t, ε) — xav(st) = 0(α(ε)) для всех t Ε [0, οο).
• Если начало координат х = 0 £ D является экспоненциально устойчивой
точкой равновесия усредненной системы (10.48) и /(£,0,ε) = 0 для всех
(£,ε)Ε[0,сю)х[0,εο], тосуществуетε* > 0,такая чтодлявсех0<ε <ε*
начало координат является экспоненциально устойчивой точкой равновесия
исходной неусредненной системы (10.39).
ДОКАЗАТЕЛЬСТВО. Выразив (10.47) во временном масштабе s = et, при
менив теоремы 3.4 и 3.5 и выполнив замену переменных (10.46), получаем ре
зультат, соответствующий первой части утверждения теоремы. Для доказатель
ства второй части применим теорему 9.1 о непрерывности решений на беско
нечном интервале времени. Далее, с учетом того, что h(ty 0) = 0, w(t, 0,77) = 0
и ||#iu/cta|| ^ 1τα{η)/η, получаем новую версию оценки для w:
η\\υ)ψ,Χ,η)\\ < ка^)\\х\\.
Из предположения /(£,0,ε) = 0 и дифференцируемости / по ε следует, что
/(£, х, ε) липшицева по ε линейно по х, т. е.
||/(t,x,e)-/(i,x,0)||<Lie||a:||.
С использованием полученных оценок можно показать, что функция q(t,y,e)
в (10.47) удовлетворяет неравенству \\q(t, 2/,ε)|| < Ь|М| с некоторой положитель
ной константой L для всех (t,y,e) Ε [0,oo) x D\ x [0,si], где £>i = {||у|| < г{\
и ri, ε1 достаточно малы. Из обратной теоремы Ляпунова 4.14 и леммы 9.1 сле
дует, что при достаточно малой ε начало координат является экспоненциально
устойчивой точкой равновесия исходной системы (10.39).
Π
Пример 10.13. Рассмотрим линейную систему
х = eA(t)x,
где ε > 0. Предположим, что A(t) и ее производные до второго порядка включи
тельно непрерывны и ограничены. Предположим также, что A(t) имеет среднее
rt+T
Aav= lim£/
A(r)dr
Г-юо 1 Jt
в смысле определения 10.2. Усредненная система определяется равенством
X==
SSTLQ^X.
444
ГЛАВА 10
Предположим, что Лау гурвицева. С использованием теоремы 10.5 заключаем,
что начало координат исходной, зависящей от времени системы экспоненциаль
но устойчиво при достаточно малой ε. Предположим также, что матрица A(i) =
= AtT(t) + Ass(t) является суммой переходной составляющей Atr(t) и установив
шейся составляющей Ass(t). Переходная составляющая экспоненциально убыва
ет до нуля, т. е.
Ptr(*)|| < fci exp(-7*), fci > 0, 7 > 0,
а элементы установившейся составляющей представляют собой конечные суммы
синусоид с различными частотами. Среднее переходной компоненты равно нулю,
т.к.
rt+T
л
rt+T
kie
7
*Г1
_yn /
к2
I jf \\Atr(r)\\dr < I jf fcie-^dr
=^[1-e^
T
]<
Г+1"
С учетом результатов первого пункта примера 10.12 можно заключить, что функ
ция сходимости, соответствующая усреднению функции A(t), имеет вид σ(Τ) =
= 1/(Т + 1). Следовательно, /С-функция из теоремы 10.5 имеет вид α(η) = η.
Пусть x(t)S) и x&v(et) — соответственно решения исходной и усредненной си
стем, начинающиеся в одной и той же начальной точке. Из теоремы 10.5 следует,
что
x(t,e) - Xw{et) = Ο(ε), Mt ^ 0.
Δ
10.7. Упражнения
10.1. Если δ (ε) = Ο(ε), является ли она также функцией порядка 0{ε1/
2
) или
0(ε3/
2
)?
10.2. Если δ(ε) = ε
1
/71
, где п > 1 — положительное число, существует ли поло
жительное целое число Ν, такое что δ(ε) = 0(εΝ)?
10.3. Рассмотрим задачу с начальными данными
±1= -(0.2+e)xi+| ~tg-1
x\ + £tg_1
X2, xi(0) = m,
х2 = -(0.2 +ε)Χ24-J
-
tg"
1
X2+εtg"
1
жь ж2(0) - η2·
(a) Найдите О (ε)-аппроксимацию.
(b) Найдите 0(г
2
)-алпроксимацию.
(c) Исследуйте вопрос достоверности аппроксимации на бесконечном интерва
ле времени.
(d) Используя компьютерное моделирование, найдите точное решение, Ο(ε)-
аппроксимацию и О (ε2)-аппроксимацию при ε = 0.1, щ = 0.5 и η2 = 1.5
на интервале времени [0,3]. Прокомментируйте точность аппроксимации.
10.7 . УПРАЖНЕНИЯ
445
Указание: в пунктах (а) и (Ь) достаточно выписать уравнения, определяющие ап
проксимации. Необходимость в нахождении аналитического выражения аппрок
симации в явном виде отсутствует.
10.4. Выполните упражнение 10.3 для системы
х\ =#2, %2= —х\-#2+ех\.
В пункте (d) положите ε = 0.1, ?7i = 1.0, 772 = 0.0 и в качестве интервала
времени рассмотрите [0,5].
10.5. Выполните упражнение 10.3 для системы
1я
Х\= -Х\+Х2, #2=SX\—Х2— о
х
2·
В пункте (d) положите ε = 0.2, щ
=
1-0, Ш = 0.0 и в качестве интервала
времени рассмотрите [0,4].
10.6 ([166]). Выполните упражнение 10.3 для системы
Х\=Х\—Х1+€Х\Х2,
Х2= 2X2~ %2~ &Х\Х2·
В пункте (d) положите ε = 0.2, щ — 0.5, щ = 1.0 и в качестве интервала
времени рассмотрите [0,4].
10.7. Выполните упражнение 10.3 для системы
х\ = —хг + яг(1+х\)-l·ε(1+ х{)2
,
x2 = —х\{х\ + 1).
В пункте (d) положите ε = —0.1, 771 = — 1 и η% = 2. Выполните дополнительные
вычисления при ε = —0.05 и ε = —0.2 и прокомментируйте точность аппрокси
мации.
10.8. Рассмотрим задачу с начальными данными
Х\= —XI+£Х2,Ж1(0)=Τ/,
Х2= -а?2- esi, £2(0)=τ?·
Найдите 0^)-аппроксимацию. Определите точное и приближенное решения при
ε = 0.1 и двух различных начальных условиях: (1) η = 1, (2) ту = 10. Про
комментируйте точность аппроксимации. Объясните несовместность получен
ных результатов с теоремой 10.1.
10.9 [70]). Исследуйте с использованием метода усреднения следующие скаляр
ные системы:
(1)
х=е{х-x
2
)sm
2
t,
(2)
х = e(xcos
2
t-\х
2
),
(3)
х—ξ(—Χ+cos
2
1),
(4)
х = —ex cost.
10.10. Для каждой из следующих систем покажите, что при достаточно малой
ε > 0 начало координат экспоненциально устойчиво:
(1)
Хх = 8X2,
±2= —ε(1+2sint)x2 —ε(1+ cost)sinxi;
446
ГЛАВА 10
(2)
±i = ε[(—1 + 1.5cos
2
i)xi + (1 - 1.5 sin £ costal,
#2 = ε[(—1
—
1.5sinicosi)a:i + (—1 + 1.5sin
2
i)x2];
(3)
x = e(-xsm
2
t+x
2
sint + яе
_<
),ε>0.
10.11. Рассмотрим систему
±i = ε[(—1 + 1.5cos
2
i)xi + (1 — 1.5sinicost)x2L
#2 = ^[(—1
—
1.5sin£cost)a:i + (—1 + 1.5 sin
2
i)^]+e
_i
.
Покажите, что существует ε* > 0, такая что для всех 0 < ε < ε* и всех х(0) G R2
выполнено x(t) —> 0 при £ —> оо.
10.12. Рассмотрим систему у = Лу + eg(tyy,e), ε > 0, где (η х п)-матрица А
имеет только простые собственные значения на мнимой оси.
(a) Покажите, что exp(At) и ехр(—At) ограничены для всех t ^ 0.
(b) Покажите, что замена переменных у — exp(At)x преобразует систему к ви
ду х = ef(t,x,e)9 где / =
exp(-Ai)g(t,exp(At)x,e).
10.13 ([166]). Исследуйте уравнение Матье у + (1 4- 2ecos2t)y = 0, ε > 0,
используя метод усреднения.
Указание: воспользуйтесь результатами упражнения 10.12.
10.14 ([166]). Исследуйте уравнение у + у = 8е(у)2
cos t, используя метод усред
нения. Указание: воспользуйтесь результатами упражнения 10.12.
10.15. Примените метод усреднения при исследовании вопроса о существовании
предельных циклов для каждой из следующих систем второго порядка. В слу
чае если предельный цикл существует, найдите его месторасположение на коор
динатной плоскости состояний и соответствующий период колебания, а также
определите, является ли этот цикл устойчивым или неустойчивым.
(1) у+у= -еу{1-у
2
),
(2) у+у=
еу(1-у
2
)-еу
г
,
(3) у + у = -е(1-^|у|)у,
(4) ν+ν=
-ε(1-ψNo,
(5) y+y=s(y-y
3
),
(6) у-\-у =
еу(1-у
2
-у
2
).
10.16. Рассмотрим систему второго порядка
±1=Х2, Х2= -xi +е[х\+Ж2(1-
х
\-
х
1)]>
£
>0·
(a) Покажите, что при достаточно малой ε система имеет устойчивый предель
ный цикл.
(b) Покажите, что система не имеет периодических орбит при ε > 1.
10.17. Рассмотрим уравнение Рэлея
Г
ч91
du
тЩ+ки
dt
2
1
dt'
гдега,fc,λ и а — положительные константы,
(а) С использованием нормированных переменных у = и/и*, τ = t/t* и ε =
= λ/λ*, где (и*)
2
ак = га/3, t* = у/т/к и λ* = л/кт, покажите, что
уравнение может быть приведено к нормализованной форме
У + У = е(у-±у3),
где у — производная у по т.
10.7. УПРАЖНЕНИЯ
447
(b) Примените метод усреднения и покажите, что нормализованное уравнение
Рэлея имеет устойчивый предельный цикл. Оцените местоположение пре
дельного цикла на плоскости (у, у).
(c) С использованием численных методов получите фазовые портреты норма
лизованного уравнения Рэлея на плоскости (?/, у) при
(i) ε=1,
(ii) ε=0.1
и (iii) ε - 0.01.
Сравните полученный результат с предельным циклом из пункта (Ь).
10.18. Рассмотрим уравнение Дуффинга
ту+су+ку+ка
2
у3
= A cosω£,
где А, а, с, к, т и ω — положительные константы.
(a) Положив х\ — у, Х2 = у, г = ut и ε = 1/CJ, покажите, что это уравнение
может быть представлено в виде dx/dr = ε/(г, я, ε).
(b) Покажите, что система имеет экспоненциально устойчивое периодическое
решение при достаточно большой ω. Оцените частоту колебаний в системе
и местоположение периодической орбиты в фазовом пространстве.
10.19. Докажите (10.44).
Указание: рассмотрите (10.43) и используйте тот факт, что при t < l/^rj функция
a(t) ограничена, а при t > l/y/η выполнено a(t) ^ a(l/^/rj) .
10.20. Используйте метод усреднения для общего случая при исследовании ска
лярной системы
х=ε^Ιη
2
1+sin1.5t+ e
_<
)x.
10.21 ([168]). Выход линейной, не зависящей от времени системы η-го порядка
с одним входом и одним выходом может быть представлен в виде y(t) = 9
T
w(t),
где θ — вектор размерности (2п + 1), компонентами которого являются постоян
ные параметры системы, и w(t) — дополнительный сигнал, который может быть
синтезирован на основе информации о входе и выходе системы при неизвестном
векторе Θ. Предположим, что вектор θ неизвестен, и обозначим его истинное
значение через 0*. В процессе идентификации системы значения параметра 9{t)
изменяются с использованием закона адаптации вида 0 = —ee{t)w{t)y где e(t) =
= [e(t) — 6*]
T
w(t) — рассогласование между действительным выходом системы
и выходом системы, который соответствует текущим значениям вектора парамет
ров в(Ь). Пусть ф(Ь) = 0(i) — 0* — параметрическая ошибка.
(a) Покажите, что φ = εΑ(£)φ, где A(t) =
—w(t)w
T
(t).
(b) Используя метод усреднения для общего случая, получите условия на w(t),
обеспечивающие при достаточно малой ε выполнение 9(t) —> 0* при t —> оо.
ГЛАВА 11
Сингулярные возмущения
Рассмотренный в параграфе 10.1 метод возмущений применяется к уравне
ниям состояния, которые гладко зависят от малого параметра ε. В этой главе
мы рассмотрим более сложную задачу с возмущениями, в которой зависимость
свойств исследуемой системы от параметра возмущения ε не является непрерыв
ной. Мы выполним анализ так называемой стандартной модели с сингулярными
возмущениями
x = f(t,x,z,e),
ez = g(t,x,z,e).
Если в этой системе положить ε = 0, это приводит к фундаментальному и внезап
ному изменению динамических свойств системы, т. к. дифференциальное урав
нение ez = g превращается в алгебраическое или трансцендентное уравнение
0 = g(t,x,z,0).
Существо представленной в этой главе теории заключается в том, что нару
шение непрерывности решений, обусловленное наличием в системе сингуляр
ных возмущений, может быть успешно исследовано при его рассмотрении во
временном масштабе, отличном от временного масштаба всей системы. Под
ход, в рамках которого при исследовании системы используются различные вре
менные шкалы, является фундаментальной особенностью метода сингулярных
возмущений.
В параграфе 11.1 мы дадим определение стандартной формы модели с син
гулярными возмущениями и приведем несколько физически мотивированных
примеров. В параграфе 11.2 будут исследованы свойства стандартной моде
ли и получены аппроксимации ее траекторий с использованием декомпозиции
этой модели на две подмодели: редуцированную (медленную) и пограничную
(быструю). Эти приближенные результаты распространяются в параграфе 11.3
на случай бесконечного интервала времени. Декомпозиция системы на осно
ве введения различных временных шкал становится интуитивно более понят
ной, если использовать геометрический подход, изложенный в параграфе 11.4.
Введенная в параграфе 11.2 временная декомпозиция используется в парагра
фе 11.5 при анализе свойств устойчивости точки равновесия по методу Ляпу
нова.
11.1. СТАНДАРТНАЯ ФОРМА МОДЕЛИ С СИНГУЛЯРНЫМИ ВОЗМУЩЕНИЯМИ 449
11.1. Стандартная форма модели с сингулярными возмущениями
Модель динамической системы с сингулярными возмущениями представ
ляет собой модель состояния, в которой производные некоторых переменных
состояния умножаются на малый положительный параметр ε:
ж = /(*,ж,г,е),
(11.1)
ez = g(t,x,z,e).
(11.2)
Мы будем предполагать, что функции / и д непрерывно дифференцируемы по
своим аргументам при (t,x,z,e) Ε [0, ti] x Dx x Dz x [0,εο], где Dx с R
n
иDzСRm
—
открытые связные множества. Если в (11.1) и (11.2) положить
ε = 0, размерность уравнения состояния уменьшается с η + га до п, т. к. диффе
ренциальное уравнение (11.2) становится алгебраическим уравнением
0 = р(*,ж,*,0).
(11.3)
Мы будем говорить, что модель (11.1)-(11.2) представлена в стандартной форме,
если (11.3) имеет к ^ 1 изолированных вещественных корней
z = hi(t,x), г = 1,2,...,/с,
(11.4)
при любых (£,х) Ε [0, ti] х ДЕ. Из этого предположения следует, что каждо
му корню (11.3) будет соответствовать корректно определенная редуцированная
модель размерности п. Для того чтобы получить г-ю редуцированную модель,
подставим (11.4) в (11.1) при ε = 0. В результате получим
x = f(t,x,h(t,x),0).
(11.5)
В этом уравнении в функции h нижний индекс г опущен для упрощения обозна
чений. Из контекста понятно, что при этом используется корень уравнения (11.3).
Эту модель иногда называют квазиустановившейся моделью состояния, посколь
ку величина z, скорость которой z = g/ε может быть большой при малой ε
и при д φ 0, может быстро стремиться к значению корня уравнения (11.3), явля
ющемуся точкой равновесия системы (11.2). Модель (11.5) называют медленной
моделью. В следующем параграфе мы исследуем свойства системы (11.1), (11.2),
характеризующейся подобным двойным масштабированием по времени.
Представление физических систем в стандартной форме с сингулярными
возмущениями может оказаться непростой задачей. Не всегда ясно, как можно
выбрать параметры так, чтобы при дальнейшем исследовании их можно было
рассматривать как малые. К счастью, во многих прикладных случаях наше по
нимание происходящих в системе процессов, а также дополнительные знания
о компонентах системы помогают нам выбрать правильный путь
1
. Представлен
ные ниже четыре примера иллюстрируют четыре «стандартных» подхода, при
меняемых при выборе параметра ε. В первом примере в качестве ε выбирается
'Моделирование физических систем, представленных в стандартной форме с сингулярными
возмущениями, рассмотрено в работах [38], [105, глава 1] и [104, глава 4].
450
ГЛАВА 11
малая постоянная времени. Такой выбор приводит к возникновению сингулярно
возмущенных моделей, и исторически этот подход мотивировал интерес к иссле
дованию сингулярных возмущений. Малые постоянные времени, массы, емкости
и подобные им «паразитные» параметры, увеличивающие размерность модели,
часто появляются в физических моделях. В целях упрощения исходной моде
ли исследователи обычно пренебрегают этими паразитными параметрами, что
уменьшает порядок рассматриваемой системы. Теория сингулярных возмущений
позволяет обосновать это преднамеренное упрощение модели и предоставляет
средства улучшения чрезмерно упрощенных моделей. Во втором примере в ка
честве параметра ε выбрана обратная величина к коэффициенту обратной связи
системы управления. Этот пример принадлежит к очень важному классу син
гулярно возмущенных моделей. Использование в системах управления сильной
обратной связи, или, точнее говоря, параметров, асимптотически стремящихся
к бесконечности, является общепринятым приемом. Типичный подход, исполь
зуемый при анализе и разработке систем с сильной обратной связью, заключается
в построении их моделей в форме стандартной модели с сингулярными возму
щениями. В третьем примере параметром ε является паразитное сопротивление
резистора в электрической цепи. Исключение этого резистора из цепи приводит
к уменьшению порядка модели, однако эта процедура приводит модель к форме,
несколько отличающейся от той, что была получена при пренебрежении пара
зитной малой постоянной времени в первом примере. Моделирование системы,
представленной в стандартной форме с сингулярными возмущениями, сопряжено
с тщательным выбором переменных состояния. В четвертом примере параметром
ε является отношение собственной частоты корпуса автомобиля к собственной
частоте подвески. Особенностью этого примера является то, что представленная
в нем модель не может быть представлена в стандартной форме с сингулярными
возмущениями без применения к переменным состояния зависящего от ε мас
штабирования.
Пример 11.1. Модель электродвигателя постоянного тока с якорным управ
лением представлена в виде уравнения состояния второго порядка
—kuj—Ri+u,
где г, и, R и L — ток в обмотке якоря, напряжение, сопротивление и индуктив
ность, J — момент инерции, ω — угловая скорость, кг и ки> — соответственно
момент и противоэлектродвижущая сила, возникающая под воздействием посто
янного поля подмагничивания. Первое уравнение состояния представляет собой
уравнение механического момента, а второе — уравнение, описывающее пере
ходный электрический процесс в обмотке якоря. Обычно величина L является
«малой» и играет роль параметра ε. Введя переменные состояния ω = х и г =
= z, получаем при R φ 0 модель мотора в стандартной форме (11.1)—(11.2).
7αω _
J
dt~
Tdi _
11.1 . СТАНДАРТНАЯ ФОРМА МОДЕЛИ С СИНГУЛЯРНЫМИ ВОЗМУЩЕНИЯМИ 451
Положив L — О, решаем уравнение
О= —ки
—
Ri+u
и получаем единственный корень
и—ки;
г=
R
Подставляем полученный результат в уравнение момента и приходим к следую
щей модели:
к
2
к
которая представляет собой хорошо известную модель электродвигателя посто
янного тока. Как было установлено в главе 10, в качестве параметра возмущения
ε следует использовать безразмерное отношение каких-либо двух физических
параметров. Применяя этот подход, определим безразмерные переменные
и
iR
гг
~ш'
перепишем уравнение состояния в виде
±т
dt
le
dt
—
2т>
= —ωτ—
ur
ir+
_
и
иГу
где Тт = JR/k2
—
постоянная времени для механической подсистемы иТе =
=
L/R — постоянная времени для электрической подсистемы. Поскольку
Тт > Те, выберем Тт в качестве единицы времени, т. е. введем безразмерную
переменную времени tr = t/Tm. Тогда уравнение состояния принимает следую
щий вид:
dujr
_
.
dtr
1е Ο/Ιγ
.
T~~T~~Tj~
—
^r
V~г^r·
m Ο&γ
Выполненное масштабирование по времени приводит рассматриваемую систему
к стандартной форме модели с физически значимым безразмерным параметром
£=Те_Lk2
Тт JR2
'
Δ
Пример 11.2. Рассмотрим систему управления с обратной связью, изоб
раженную на рисунке 11.1. Внутренний контур представляет собой управле
ние приводом с сильной обратной связью. Параметром сильной обратной свя
зи является константа к\ в блоке интегратора. Объект управления представляет
452
ГЛАВА 11
и+,
V^O—
i
—
,I
ψ(·)
—•
к
s
1UP
hnL
n>2
Xp
—
J\.Xp
~\~ jDUn
у=Схр
У
Рис. 11.1. Управление приводом с сильной обратной связью
собой систему η-го порядка с одним входом и одним выходом, которая описы
вается моделью состояния {А, В, С]. Нелинейность характеризуется свойством
ф(-) е (0,оо],т.е.
^(0)=0 и уф(у)>0, Vy^O.
Уравнение состояния замкнутой системы имеет вид
Хр = J\.Xp ~г JDUp^
1 ...
fci
lip=φ(и —Up— к,2Схр).
При ε = 1/fci, xp = x иир = z модель принимает форму (11.1)-(11.2). Полагая
ε = О, что эквивалентно к\ = оо, получаем уравнение
ф(и—ир—к2Схр) —О,
единственным корнем которого является
ир=и—к2Схр.
Единственность корня обусловлена тем, что ф(-) равна нулю в начале координат.
Упрощенная блок-схема соответствующей редуцированной модели
хр = (А- Вк2С)хр + Ви
изображена на рисунке 11.2. На этой схеме внутренний контур управления при
водом (см. рисунок 11.1) заменен на прямое соединение.
Δ
Пример 11.3. Рассмотрим электрическую цепь из примера 10.4, показан
ную на рисунке 10.2. Дифференциальные уравнения, описывающие изменение
напряжений на конденсаторах, имеют следующий вид:
СЩ=±(Д- VI)-Φ(νλ)-
- L(V1 - V2),
Cv2=±(E-v2)-ФЫ
-
Yc(v2 - vi).
11.1 . СТАНДАРТНАЯ ФОРМА МОДЕЛИ С СИНГУЛЯРНЫМИ ВОЗМУЩЕНИЯМИ 453
Рис. 11.2. Блок-схема, являющаяся упрощением блок-схемы, изображенной на рисун
ке 11.1
В примере 10.4 было выполнено исследование цепи при «большом» значении со
противления Дс, что представляет собой идеализацию ситуации, когда эта цепь
становится незамкнутой, если величину l/Rc положить равной нулю. На этот
раз мы исследуем случай, когда Rc «мало». При Rc = 0 в электрической цепи
происходит замена резистора на прямое соединение, что делает два конденсатора
подключенными параллельно. В корректно определенной модели этой упрощен
ной цепи два подключенных параллельно конденсатора следует рассматривать
как один эквивалентный по емкости конденсатор. Это приводит к упрощению
модели, и ее порядок становится равным единице. Для того чтобы получить мо
дель системы в форме, для которой описанное упрощение модели и уменьшение
ее размерности соответствует сингулярному возмущению, выберем в качестве
малого параметра величину ε = Rc и перепишем уравнение состояния в виде
ещ=-^(Е -vi)-^Ы
-
£j(vi - Ъ),
εν2 = -fftiP ~
v
i)~^Ы
~ ^{v2 - vi).
Если бы эта модель была представлена в форме (11.1)-(11.2), переменные v\
и v2 могли бы рассматриваться как z-переменные и уравнение (11.3) свелось бы
к следующему:
V\—V2 =0.
Однако корни этого уравнения не являются изолированными и, следовательно,
основное требование к корням уравнения (11.3) не выполняется. Поэтому выше
приведенная модель не является моделью, представленной в стандартной форме
системы с сингулярными возмущениями, и нам следует сделать другой выбор
переменных состояния. Положим
2
х = \(vi+v2)\z = i(vi -v2).
Этот выбор переменных состояния следует из систематической процедуры, описанной в ра
боте [38].
454
ГЛАВА И
Тогда в новых переменных уравнение состояния перепишется в следующем виде:
SZ
ε
CR
+ ^*-^[1>{*
+
z)-No -*)\.
В этом случае единственным корнем (11.3) является z = О и мы получаем соот
ветствующую редуцированную модель
х=
- ±(Е-х)-±ф(х).
В упрощенной блок-схеме этой модели, изображенной на рисунке 11.3, каждая
пара аналогичных параллельных участков цепи заменена на единый эквивалент
ный элемент цепи. Для того чтобы получить параметр ε в безразмерном виде,
нормализуем ж, гиф:
хг =|; zr =J; фг(у)= ^ψ(Εν).
Тогда сингулярно возмущенная модель, представленная в нормализованном вре
мени tr = t/CR, имеет следующий вид:
CbJUf
dzr
dtr
-^
= 1- xr - £[</v(#r+Zr)+фг(хг - Zr)],
-(ε + 2)zr - |[Vv(#r + Zr) - ipr(xr - Zr)],
где ε = Rc/R — безразмерная величина.
Δ
2
Ε
+
υ 4= 2С 2ψ(ν)
Рис. 11.3. Упрощенная электрическая цепь при Rc = 0
Пример 11.4. Схема автомобильной подвески четырехколесного автомо
биля изображена на рисунке 11.4. Здесь ms и ти — массы корпуса автомобиля
и шины колеса, ks и kt — жесткость пружин стойки шины и самой шины, bs —
11.1 . СТАНДАРТНАЯ ФОРМА МОДЕЛИ С СИНГУЛЯРНЫМИ ВОЗМУЩЕНИЯМИ 455
« Quarter-car »-модель
Упрощенная модель
1
Корпус
автомобиля
Шина
Поверхность
дороги
17
-
Базовая система координат
Рис. 11.4. Схема автомобильной подвески четырехколесного автомобиля
константа демпфера ударов и F — сила, развиваемая приводом активной или
полуактивной подвески. При F — 0 эта схема соответствует традиционной пас
сивной подвеске. Длины ds, dundr
—
высота расположения стойки шины, самой
шины, а также высота поверхности дороги, отсчитанные от некоторой базовой
точки. Закон Ньютона, который описывает баланс сил, действующих на массы
ms и ти, можно записать в виде следующих уравнений:
msds +bs(ds —du)+ks(ds —du) =F,
mudu +bs(du —ds)+ks(du —ds)+kt(du —dr) =—F.
В типичном автомобиле собственная частота шины \/kt/mu
приблизительно
в 10 раз больше собственной частоты стойки шины и корпуса автомобиля
yjks/ms.
Поэтому в качестве малого параметра разумно выбрать следующий:
ε=
\ks/ms
kt/rrtu
hrns'
Рассматриваемая система типа «груз на пружине» интересна тем, что она не мо
жет быть преобразована в стандартную форму сингулярной модели без масшта
бирования переменных состояния, зависящего от параметра ε. Жесткость шины
kt = 0(1/ε2) стремится к бесконечности при ε —>> 0. Для того чтобы обеспечить
ограниченность потенциальной энергии шины kt(du — dr)
2
/2, необходимо, чтобы
смещение du — dr было порядка О (ε), т.е. чтобы масштабированное смещение
(du — dr)/e оставалось конечной величиной. В дополнение к этому масштаби
рованию мы выполним нормализацию переменных, обеспечивающую их безраз-
мерность: все длины поделим на некоторую величину £, имеющую размерность
длины, скорости поделим на £y/ks/ms,
силы поделим на iks и время поделим
на y/ms/ks.
Далее, для того чтобы представить систему в стандартной форме
456
ГЛАВА И
сингулярно возмущенной системы, введем медленные и быстрые переменные:
(du - dr)/(e£)
х=
(ds - du)/e
{ds/i)^ms/ks
(du/l)yjms/ks
Пусть и = F/(ks£) — вход системы (управление), w = (dr/£)^ms/ks
—
возму
щение входа системы и tr = t^ks/ms — безразмерное время. Тогда сингулярно
возмущенная модель имеет следующий вид:
dx\
—
=Х2~*2,
atr
<^=
-
ΧΙ-β{Χ2-
dz\
ε—
=
Z2-w,
atr
-
z2)+u,
ε-г^- = OLX\- αβ(Ζ2- x2) —z\— au,
где
а=
lksms
ktmu'
β=
\/ksms
В случае пассивной подвески параметры α, β и ε принимают значения в преде
лах [0.6,1.2], [0.5,0.8] и [0.08,0.135] соответственно. При активной/полуактив
ной подвеске константа демпфера может быть уменьшена, поскольку привод
обеспечивает дополнительное демпфирование. При ε = 0 получаем редуциро
ванную модель
=x2—w:
dx\
dtr
которая соответствует упрощенной модели с одной степенью свободы, схема ко
торой изображена на рисунке 11.4.
Δ
11.2. Временные свойства стандартной модели
При управлении динамической системой с сингулярными возмущениями
в ней возникают переходные процессы, в которых имеют место как медленные,
так и быстрые составляющие. Вольно говоря, медленная составляющая реак
ции системы на входное воздействие приближенно определяется редуцирован
ной моделью (11.5), а быстрая составляющая переходного процесса соответству-
11.2. ВРЕМЕННЬ'Ш СВОЙСТВА СТАНДАРТНОЙ МОДЕЛИ
457
ет разности между реакцией редуцированной модели и реакцией всей систе
мы (11.1)-(11.2). Для получения более строгих результатов рассмотрим уравне
ние состояния
х =/(*,х,z,ε), x(t0) =ξ(ε),
(11.6)
ez = g(t,x,z,e),
z(t0)=v(e),
(11.7)
где ξ(ε) и η(ε) гладко зависят от ε и to £ [0, h). Пусть x(t,e) и z(t,e) — ре
шения задачи (11.6) и (11.7). Если мы поставим соответствующую задачу для
редуцированной модели (11.5), мы можем задать лишь п начальных данных, т. к.
эта модель будет иметь порядок п. Разумеется, в редуцированной задаче нам
следует использовать соответствующие начальные данные для х:
х = /(*,х,Л(*,а;),0), x(t0) = ξο
d
= ξ(0).
(11.8)
Обозначим решение (11.8) через x(t). Поскольку переменная z исключена из
редуцированной модели путем ее замены на «квазиустановившееся состояние»
h(t,x), единственное? что мы можем получить при решении (11.8), — это функ
ция
z(t)^ h(t,x(t)),
описывающая квазиустановившееся поведение переменной z при х = х. Для
первоначальной переменной z задавалось при to начальное значение г/(ε), но для
квазиустановившегося состояния ~z такое начальное состояние не может быть
свободно назначено? и соответствующая разность между начальным значением
~z{to) = Λ(£ο»£ο) и
заданным начальным значением ц{е) для переменной z может
быть большой. Таким образом, функция ~z{t) не может служить в качестве равно
мерной аппроксимации функции z(t,e). Самое большое, что мы можем ожидать
в этой ситуации, — это то, что оценка
z(t,e) -z(t) = 0(ε)
будет выполнена на интервале времени, не включающем момент to, т. е. при t Ε
Ε [£b?*i]> где tb > to. С другой стороны, можно рассчитывать на то, что оценка
x(t,e) -x(t) = 0(ε)
будет выполнена равномерно для всех t Ε [io>*i]» поскольку
х(*о, ε) - x(t0) = ξ(ε) - ξ(0) = Ο(ε).
Если ошибка z(t,e) — ~z(t) действительно имеет порядок О (ε) на [£b,£i], то на
начальном «пограничном» интервале времени [to,tb] переменная z должна стре
миться к ~z. Напомним, что скорость z может быть большой, поскольку z = g/ε.
На практике, положив ε = 0 в (11.2), мы должны получить для переменной z
458
ГЛАВА 11
мгновенный переходный процесс, если д φ 0. С учетом выполненного выше ис
следования свойств устойчивости точки равновесия, становится ясно, что мы не
можем рассчитывать на то, что z будет стремиться к квазиустановившемуся со
стоянию ~z, если не будут выполнены определенные условия устойчивости. Эти
условия устанавливаются при дальнейшем анализе системы.
Для последующего исследования полезно выполнить замену переменных
y = z-h(t,x),
(11.9)
которая обеспечивает перенос начала координат в квазиустановившееся состо
яние переменной z. В новых переменных (ж, у) рассматриваемая задача имеет
следующий вид:
ж = f(t,ж, у + h(t,ж),ε), x(t0) = ξ(ε),
(11.10)
еу = g(t,ж, у + h(t,ж),ε) - ε-щ
-
-ε||/(*, ж, у + h(t, ж), ε), y(t0) = η(ε) - /i(t0, ξ{ε)). (11.11)
Квазиустановившимся состоянием для (11.11) является у = 0, при подстанов
ке которого в (11.10) мы получаем редуцированную модель (11.8). При анали
зе (11.11) следует учитывать, что величина еу может оставаться конечной, даже
если ε стремится к нулю и у стремится к бесконечности. Положим
dy dy
dr1
ε—=
—
и, следовательно,
—
=-
at
ат
at
ε
и рассмотрим г = 0 в качестве начального значения при t = to. Новая перемен
ная времени г = (t — to)/ε представляет собой «растянутое» время, т. е. если ε
стремится к нулю, то τ стремится к бесконечности, даже если конечное t больше
to на небольшую, не зависящую от ε, величину. При т-масштабировании времени
уравнение (11.11) принимает вид
-£ =g(t,ж,у+h(t,ж),ε)-ε-^
-
-ε||/(*, ж, у + h(tyж),ε), у(0) = η(ε) - h(t0,ξ(ε)).
(11.12)
В этом уравнении переменные t и х являются медленными, поскольку в масшта
бе времени г они определяются равенствами
t=to+ετ, ж=x(to+£т,ε).
Задавая ε = 0, мы замораживаем эти переменные на фиксированных значениях
t = to и х = ξο, что делает уравнение (11.12) автономной системой
^ =^о,&,У+Л(*о,&),0), y(0) = 4(0)-/i(io,&)d
= = %-M*o,&), (П-13)
11.2 . ВРЕМЕННЬШ СВОЙСТВА СТАНДАРТНОЙ МОДЕЛИ
459
которая имеет точку равновесия у — 0. Если эта точка равновесия является
асимптотически устойчивой и у(0) принадлежит ее области притяжения, то мож
но ожидать, что решение (11.13) достигнет О (ε)-окрестности начала координат
в течение пограничного интервала времени. Для анализа свойств решения за
пределами этого интервала нам необходимо убедиться в том, что это решение
обладает свойствами устойчивости, которые гарантируют близость у(т) к нулю
при отклонении значений медленно меняющихся параметров (£, х) от их началь
ных значений (£сь£о)· Для анализа этой ситуации мы допустим изменение за
мороженных параметров в пределах области медленно меняющихся параметров
(t,x).
3
Предположим, что решение x(t) редуцированной задачи определено при
t € [0,ii] и x(t) £ DX С Rn для некоторой области DX. Запишем (11.13) в виде
|U <?(*,х, у+ />(*, *),0),
(11.14)
где (t,x) Ε [0,ti] x Dx рассматриваются как фиксированные параметры. Мы
будем называть (11.14) пограничной моделью или пограничной системой
4
.
Ино
гда мы будем называть пограничной моделью и (11.13). При этом следует быть
внимательным, т.к. (11.13) представляет собой (11.14) при заданных начальном
моменте времени и начальном состоянии. Нам важно установить для систе
мы (11.14) свойство экспоненциальной устойчивости ее начала координат, ко
торое выполнялось бы равномерно по замороженным параметрам. Это свойство
определяется следующим образом.
Определение 11.1. Точка равновесия у = 0 пограничной системы (11.14)
является экспоненциально устойчивой равномерно по (t,x) G [0, ti] x Dx, если
существуют положительные константы k, η и ро, такие что решения (11.14)
удовлетворяют неравенству
\Ш\\ < *||i/(0)||exp(-7r), V||y(0)|| < ро, V(i,x) e [0,*i] x DX, Vr ^ 0.
(11.15)
За исключением тривиальных случаев, когда решения пограничной модели
могут быть получены в явном виде, проверка выполнения свойства экспонен
циальной устойчивости начало координат должна проводиться либо с исполь
зованием метода линеаризации, либо методом Ляпунова. Можно показать (см.
упражнение 11.5), что если собственные значения матрицы Якоби [dg/ду] удо
влетворяет условию
< -с <0, У(*,ж)G[0,*i]xДс,
(11.16)
3
В параграфе 9.6 было показано, что если начало координат системы (11.13) экспоненциально
устойчиво равномерно по фиксированным параметрам (£о,£о), то оно остается экспоненциально
устойчивым при их замене на медленно меняющиеся переменные (i, x).
4
В отечественной литературе используется термин «присоединенная система». — Прим. ред.
перев.
Re ||^,*,м*,*),о)}
460
ГЛАВА 11
то существуют константы А:, 7 и ро, для которых выполнено (11.15). Этот резуль
тат, разумеется, является лишь локальным, т. е. константа ро может быть очень
малой. Альтернативно можно показать (см. упражнение 11.6), что если существу
ет функция Ляпунова V(t, x, у), удовлетворяющая
cl\\y\\2
^V(t,x,y)^c2\\y\\\
(11.17)
^g{t,x>y
+ h{t,x),Q) ^-c3\\y\\2
(И.18)
при (t,x,y) Ε [0,ti]xDx x Dy, где Dy С Rm
—
некоторая открытая область,
содержащая начало координат, то условие (11.15) выполнено с оценками
Ро = Р\/сГ/с2, к = у/с£/си
7 = с3/2с2,
(11.19)
гдеВрСDy.
Теорема 11.1. Рассмотрим задачу с сингулярным возмущением (11.6),
(11.7), и пусть z = h(t,x) — изолированный корень (11.3). Предполоэюим, что
следующие условия выполнены для всех
[t,x,z
-
h(t,x),e] Ε [0, ti] х Dx х Dy х [0,εο]
для некоторых областей Dx С Rn
иDyСRm
,
где Dx выпукла и Dy содержит
начало координат:
• Функции /, д, их первые частные производные по (xyz, ε), и первая частная
производная g no t непрерывны; функция h(t, x) и якобиан [dg(t, x, z, 0)/dz]
имеют непрерывные первые частные производные по их аргументам; на
чальные данные ξ(ε) и η(ε) являются гладкими функциями от ε.
• Редуцированная задача (11.8) имеет единственное решение x(t) Ε S при
t Ε [t(h£il·
г
^
е
& ~ компактное подмножество Dx.
• Начало координат является экспоненциально устойчивой точкой равнове
сия пограничной модели (11.14) равномерно по (t,x); пусть 1Zy С Dy —
область притяжения (11.13) и fty — компактное подмножество Иу.
Тогда существует положительная константа ε*, такая что для всех щ —
—
М^О) £о) € Ц/ и 0 < ε < ε* задача с сингулярными возмущениями (11.6)
и (11.7) имеет единственное решение x(t^),z(t,e)
на [to^ti] и равенства
x(t,e)-x(t)
= 0(e),
(11.20)
z(t, ε) - h(t, x(t)) -y{(t-
to)/ε) = 0(ε)
(11.21)
выполнены равномерно при t E [to>^i]» где у(Т) —решение пограничной моде
ли (11.13). Более того, для любого заданного tb > to существует ε** ^ ε*,
такая что равенство
z(t, ε) - h(t, x(t)) = Ο(ε)
(11.22)
выполнено равномерно по t Ε [tb,ti], если ε < ε**.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. 17.
Π
11.2. BPEMEHHb'lE СВОЙСТВА СТАНДАРТНОЙ МОДЕЛИ
461
Эта теорема известна как теорема Тихонова
5
.
При ее доказательстве свой
ства устойчивости пограничной модели используются для того, чтобы показать
справедливость неравенства
\\y(t,e)\\ < fciexp
-
a(t - to)
+ εδ.
С использованием этой оценки и (11.10) доказывается выполнение равен
ства (11.20), что представляется правдоподобным, поскольку f0 exp(—as/ε) ds
имеет порядок О (ε). Доказательство завершается анализом ошибки (11.11) в т-
масштабе времени, результатом которого являются равенства (11.21) и (11.22).
Пример 11.5. Рассмотрим задачу с сингулярными возмущениями
х=z,
х(0) = ξ0,
sz=-х
-
z + u(t),
z(0) = r/o,
которая соответствует модели электродвигателя постоянного тока из приме
ра 11.1. Предположим, что u(t) = t при t > 0. Нам необходимо решить уравнение
состояния на интервале [0,1]. Единственным корнем (11.3) является h(t,x) —
= — х +1, и пограничная модель (11.14) имеет вид
dy
d^=
-
y
-
Легко показать, что начало координат пограничной системы является глобально
экспоненциально устойчивым. Редуцированная задача
х=—х+£,х(0)=ξο
имеет единственное решение
x(t) = t - 1+(1+ξ0) exp(-i).
Пограничная задача
%= -V,2/(0)=%+€о
имеет единственное решение
У(т) = (г?о + ^о)ехр(-г).
Из теоремы 11.1 следует, что
х - [t- 1+(1+ξ0)exp(-t)]= О(е),
5
Существуют другие версии теоремы Тихонова, в которых используются несколько другие
условия. (См. например, [105, Chapter 1, Theorem 3.1].)
Прим. ред. перев. — На русском языке имеется обширная литература по методу сингулярных
возмущений (см. [Д19, Д50]).
462
ГЛАВА 11
z— Ы +ξο)exp (r^)
+ 1- (1+ ξο)exp(-t) = 0(ε)
для всех t е [0,1]. Переходный процесс для О (ε)-аппроксимации переменной z
имеет две составляющие различного временного масштаба. Эволюция системы
начинается с быстрого переходного процесса (щ + £о) ехр(—t/ε). Это поведение
соответствует так называемой пограничной части решения. После затухания это
го процесса z остается близкой к [1 - (1 + ξο) ехр(—£)] и эта часть переходного
процесса соответствует медленной части решения, когда система достигла квази-
установившегося состояния. Подобное поведение с двумя временными шкалами
характерно лишь для переменной z, в то время как переменная х остается пре
имущественно медленной. В действительности х испытывает быстрый (погра
ничный) переходный процесс, но он имеет порядок О (ε). Поскольку эта система
линейна, мы можем исследовать ее поведение с использованием модального ана
лиза. Легко видеть, что система имеет одно медленное собственное значение Аь
близость которого к собственному значению редуцированной модели имеет по
рядок Ο(ε), т. е. Ai = — 1 + 0(ε), и одно быстрое собственное значение λ2 = λ/ε,
где близость λ к собственному значению пограничной модели имеет порядок
Ο(ε), т.е. λ2 = [—1 Η- 0(ε)]/ε. Точными решениями х и z являются линейные
комбинации медленной моды exp(Aii), быстрой моды exp(\t/e)
и установив
шегося компонента, соответствующего входу системы u(t) = t. Если модальная
декомпозиция может быть получена в явном виде, можно показать, что коэффи
циент при быстрой моде по х имеет порядок О (ε). В случае линейной системы
это исследование может быть выполнено аналитически. (См. упражнение 11.14.)
Δ
Пример 11.6. Рассмотрим задачу с сингулярными возмущениями
х—Ах+Bz,
х(0) = ξο,
ez=ψ(η(£)—z
—
къСх),
z(0)=щ
для системы управления с сильной обратной связью из примера 11.2. Предпо
ложим,чтоu{t)=1приt>0иψ(·) =tg-1
(·). Единственным корнем (11.3)
является h(t,x) = 1 — А^Сх, и пограничная модель (11.14) имеет вид
^=tg-
1
(-2/) = -tg-
1
(2/)·
Якобиан
ду у=0
1+У
2
у=0
является гурвицевои матрицей и, следовательно, начало координат пограничной
модели экспоненциально устойчиво. Очевидно также, что начало координат яв
ляется глобально асимптотически устойчивым. Редуцированная система
х=(А-Вк2С)х +Б, х(0)=ξο
11.2. ВРЕМЕННЫЕ СВОЙСТВА СТАНДАРТНОЙ МОДЕЛИ
463
линейна, и все предположения теоремы 11.1 выполнены. Следовательно, мы мо
жем получить аппроксимации х и z в терминах решений этих редуцированной
и пограничной моделей.
Δ
Пример 11.7. Рассмотрим задачу с сингулярными возмущениями
х
^x
2
(l-\-t)/z)
х(0) = 1,
*(0) = %.
ez = -[z + (1+t)x)z[z - (1+t)],
Уравнение (11.3) принимает в рассматриваемом примере вид
0= -[*+(1+*)ф[*-(1+*)]
и имеет три изолированных корня
z = -(l+t)x,
z=0 и z=l+t
вобласти{i^0иа;>fc},0<fc< 1.Рассмотримпервыйкореньz = —(1+ t)x.
Пограничная модель (11.14) имеет следующий вид:
dr
(l + t)x]\y-{l + t)x-(l + t)].
Из графика функции (см. рисунок 11.5(a)), определяемой правой частью этого
равенства, видно, что начало координат асимптотически устойчиво при у < (1 +
+ t)x и эта область является областью притяжения этой точки. Положив V(y) =
(а)
(Ъ)
Рис. 11.5. Правая часть пограничной задачи: (a) z = -(1 + t)x, (b) z = О
=у
2
, можно легко показать, что V удовлетворяет (11.17) и (11.18) при у ^ ρ <
(1 -f t)x. Редуцированная задача
х= —х,х(0)=1
имеет единственное решение x(t) — ехр(—t) для всех t ^ 0. Пограничная задача
приt=0их=1
^
= -»(у-1)(у-2), у(0)=чо + 1
464
ГЛАВА И
имеет единственное затухающее решение у(т) при щ < 0. Рассмотрим следую
щий корень z = 0. Пограничная модель (11.14) имеет вид
$L = -\y + (l + t)x]y\y-(l + t)].
Из графика функции (см. рисунок 11.5(b)), определяемой правой частью этого
равенства, видно, что начало координат является неустойчивым. Следовательно,
в этом случае применить теорему 11.1 невозможно. Наконец, пограничная модель
для третьего корня z = 1 +1 имеет вид
ау_
dr
-]y + {l + t) + (l+t)x][y + (l+t)]y.
Аналогично тому, как это было сделано в первом случае, можно показать, что
начало координат экспоненциально устойчиво равномерно по (t,x). Редуциро
ванная задача
х=х
2
,
ж(0)=1
имеет единственное решение x(i) = 1/(1—t) для всех t Ε [0,1). Заметим, что x(t)
уходит на бесконечность за конечное время при t = 1. Тем не менее теорема 11.1
в рассматриваемом случае применима при t е [0, ti], t\ < 1. Пограничная задача
приt=0их=1
йу_
dr
-(v + 2)(y + l)y, у(0) = !»-1
имеет единственное решение у (г) при щ > 0. Из всех трех корней (11.3) лишь
два корня h = -(l + t)x и h = Ι + t приводят к требуемой редуцированной моде
ли. Теорема 11.1 применяется в случае первого корня h = —(l + t)x, если щ < 0,
и в случае второго корня h = 1 +1, если 770 > 0. На рисунках 11.6 и 11.7 по
казаны результаты компьютерного моделирования при ε = 0.1. На рисунке 11.6
2
1
\^-^
z
-2
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2
Время
Рис. 11.6. Результаты компьютерного моделирования для z из примера 11.7 при ej = 0.1:
пунктирная линия — решение редуцированной задачи, непрерывная линия — точное ре
шение задачи
11.3. СИНГУЛЯРНЫЕ ВОЗМУЩЕНИЯ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ 465
J
1
1
I
I
L
О0.511.522.533.544.55
Время
Рис. 11.7. Точное (непрерывная линия) и приближенное (пунктирная линия) решения из
примера 11.7 при ε = 0.1
показан график z для двух пар значений 770 (для каждой из двух редуцирован
ных моделей соответствующая пара значений). На рисунке 11.7 показаны точное
и приближенное решения х и z при 770 = —0.3. Из рисунка 11.6 легко видеть,
что переходный процесс имеет две компоненты, эволюционирующие в двух раз
личных временных шкалах. Быстрая компонента решения z(t,e) начинается в 770
и стремится к ~z(t). После затухания этого переходного процесса траектория оста
ется вблизи ~z(t). В случае когда щ = —0.3, сходимость к z(t) не заметна на
протяжении интервала времени [0,0.2]. Однако если рассмотреть этот процесс
на протяжении более длительного интервала времени (см. рисунок 11.7), можно
заметить, что z(t,e) стремится к ~z(t). Рисунок 11.7 иллюстрирует результат тео
ремы Тихонова, касающийся асимптотической 0(е)-аппроксимации.
Δ
11.3. Сингулярные возмущения на бесконечном интервале времени
Как видно из доказательства теоремы 11.1, она верна лишь на 0(1)-
интервалах времени. В частности, в соответствии с (С.81), имеем оценку
\\x(t,e) -x(t)\\ <sfc3[l + ii -to]exp[L6(ii -t0)].
Для любого конечного t\ предыдущая оценка имеет порядок О (ε), но ее порядок
не равен О (ε) равномерно по t для всех t ^ t^. Для того чтобы это требование
было выполнено, необходимо показать, что
\\x{t,e)-x{t)\\ ^ек, Vte [*о,оо).
Это может быть сделано при выполнении некоторых дополнительных условий
устойчивости. В следующей теореме на редуцированную систему (11.5) будет
наложено требование экспоненциальной устойчивости начала координат и для
оценки области притяжения этой точки будет использована теория функций Ля
пунова.
466
ГЛАВА И
Теорема 11.2. Рассмотрим задачу с сингулярными возмущениями (11.6)
и (11.7). Пусть z = h(t,x) — изолированный корень (11.3). Предположим, что
следующие условия выполнены для всех
[t, x,z
—
h(t, х),ε]Ε[О,оо) х Dx х Dy х [О,εο]
для некоторых областей Dx С Rn
иDyСRm
,
содерэюащих соответствующие
начала координат:
• на любом компактном подмножестве Dx x Dy функции /, д, их первые
частные производные по (х, z, ε) и первая частная производная g not непре
рывны и ограничены, h(t,x) и [dg(t,x,z,0)/dz]
имеют ограниченные пер
вые частные производные по своим аргументам и
[df(t,x,h(t,x),0)/dx]
липшицева по х равномерно по t; начальные данные ξ(ε) и η(ε) являются
гладкими функциями параметра ε;
• начало координат является экспоненциально устойчивой точкой равнове
сия редуцированной системы (11.5); существует функция Ляпунова V(t,x),
удовлетворяющая условиям теоремы 4.9 для (11.5) при (£, х) Ε [0, сю) х Dx
и для {W\(x) ^ с} — компактного подмножества Dx;
• начало координат является экспоненциально устойчивой точкой равнове
сия пограничной системы (11.14) равномерно по (£,х); пусть 1Ζυ С Dy —
область притяжения (11.13) и Пу — компактное подмножество 1Zy.
Тогда для любого компактного множества Ω,Χ С {И^Ос) ^ рс, 0 < ρ < 1}
существует положительная константа ε*, такая что для всех to ^ 0,£о £
fyr> Vo — h(to, ξο) £ Ц/ и 0 < ε < ε* задача с сингулярными возмущениями (11.6)
и (11.7) имеет единственное решение #(£,ε), z(t^) на [£о>оо) и равенства
x(t,t)-x(t)
= 0(e),
(11.23)
z(t,e) - h(t,x(t)) - No
~ *о)/0 = 0(ε)
(11.24)
выполнены равномерно по t Ε [to, оо), где x(t) и у (τ) — решения редуцированной
и пограничной задач (11.8) и (11.13). Более того, для любого заданного t& > to
существует ε** < ε*, такая что равенство
z(t,e) - h(t,x(t)) = 0(ε)
(11.25)
выполнено равномерно для t Ε [£&, оо), если ε < ε**.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С. 18.
Π
В случае когда редуцированная система (11.5) автономна, в качестве множе
ства ΩΧ в теореме 11.2 можно взять любое компактное подмножество его области
притяжения. Это утверждение является следствием обратной теоремы Ляпуно
ва 4.17, которая гарантирует существование функции Ляпунова V(x), такой что
любое компактное подмножество области притяжения принадлежит внутренно
сти компактного множества вида {V(x) ^ с}.
11.3. СИНГУЛЯРНЫЕ ВОЗМУЩЕНИЯ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ 467
Пример 11.8. Рассмотрим задачу с сингулярными возмущениями
1,
х = 1 — х \[ψ(Χ + Ζ)+ψ(Χ-Ζ)], Χ(0)=ξ0,
ez = -(e + 2)z-^[ip(x + z) •ф(х-г)], z(0) = г7о.
Эта модель соответствует электрической цепи, рассмотренной в примере 11.3.
Предположим, что
ψ(ν)=а ехр
-1
, а>0,6>0.
Для того чтобы упростить здесь запись соответствующих уравнений из приме
ра 11.3, мы опустили нижний индекс г. Условия теоремы 11.2, касающиеся диф-
ференцируемости и липшицевости, выполнены на любом компактном множестве
точек (x,z). Редуцированная модель
х=1—х
—
аехр ?)-1
def£(>.
= fo(x)
имеет единственную точку равновесия в х = ρ , где ρ — единственный корень
уравнения /0(р*) = 0. Легко видеть, что 0 < р* < 1. Якобиан
dfo\
dx х=р*
_-i-f«p(£-
<
отрицателен и, следовательно, точка равновесия х = ρ является экспоненциаль
но устойчивой. Более того, нарисовав график функции /0(х), можно заметить,
что х = р* является глобально асимптотически устойчивой точкой. Замена пере
менных х = х — р* перемещает точку равновесия в начало координат. Погранич
ная модель
dz
dr
= -2z
не зависит от ж, и ее начало координат является глобально экспоненциально
устойчивым. Таким образом, все условия теоремы 11.2 выполнены глобально
и оценки (11.23)—(11.25) при h = 0 выполнены для всех i > 0 и для любого
ограниченного начального состояния (£о>?7о)·
Δ
Пример 11.9. Рассмотрим адаптивное управление объектом, заданным пе
редаточной функцией второго порядка
P(s)
Κηη
(s-ap)(es + 1)'
где αρ, кр > 0 и ε > 0 — неизвестные параметры. Параметр ε представляет собой
малую «паразитную» постоянную времени. Предположим, что мы положили ε =
= 0 и упростили тем самым передаточную функцию:
Р(*) =
ГЬГ)
468
ГЛАВА 11
Разработаем адаптивный регулятор для системы, задаваемой этой передаточной
функцией первого порядка. В параграфе 1.2.6 был предложен адаптивный регу
лятор с эталонной моделью вида
и=0ir+в2ур,
01 = -7(Ур ~ Ут)г,
02 = ~7(Ур - Ут)Ур,
где ур, и, г и ут — выход объекта управления, входное управляющее воздей
ствие, эталонный вход и эталонный выход соответственно. В параграфе 1.2.6
было показано, что для рассматриваемой здесь модели первого порядка и для
эталонной модели
Ур = &рУр ~г крУ*
и
Ут
=
^тУт ~т~ ^"wXt ^m -> "»
уравнение состояния замкнутой адаптивной системы управления имеет вид
е0 = ате0 + крф\г + крф2(е0 + ут),
Ф\=
~ie0r,
ф2 = _7e0(e0 + i/m),
гдее0=ур- ут, фг= θλ-θ\,ф2=θ2- 0$,θ\=кт/кр иθ\=(ат -
ар)/кр.
Определим вектор состояния
х=[е0 фхф2]
и перепишем уравнение состояния в следующей форме:
где /o(i, 0) = 0. Мы будем называть это уравнение состояния первого порядка но
минальной адаптивной системой управления и используем его при исследовании
свойств устойчивости рассматриваемой системы. При этом мы будем предпола
гать, что начало координат модели является экспоненциально устойчивым
6
. При
6
В примере 8.12 было показано, что это предположение будет выполнено при наличии в систе
ме постоянного возбуждения. В частности, начало координат будет экспоненциально устойчивым,
если r(t) = a smut. Заметим, что анализ в этом примере выполняется в предположении, что r(t)
фиксировано, и исследование асимптотического поведения системы проводится при малой ε. Как
только мы зафиксировали значение параметра ε и положили его равным некоторой малой констан
те, сделанное предположение накладывает ограничение на r(t) и, в частности, на частоту входного
сигнала ω. При увеличении ω мы можем оказаться в ситуации, когда результаты рассматриваемого
примера становятся неверны, т. к. высокочастотный вход может привести к тому, что изменение
медленной переменной х перестанет быть медленным. Например, сигнал r(i), имеющий порядок
О (ω), может привести к нарушению нашего предположения о том, что г имеет порядок 0(1) по ε.
11.3. СИНГУЛЯРНЫЕ ВОЗМУЩЕНИЯ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ 469
использовании адаптивного регулятора в неупрощенной системе второго поряд
ка соответствующая замкнутая модель будет отличаться от номинальной модели.
Представим рассматриваемую задачу в форме задачи с сингулярными возмуще
ниями. Неупрощенная модель второго порядка может быть представлена в сле
дующем виде:
Уρ =:
&рУр "г fopX")
ez — —z-\- и.
Используя предложенный в параграфе 1.2.6 подход, можно представить неупро
щенную адаптивную систему управления в виде модели с сингулярными возму
щениями
* = fo(t,x) + K[z-h(t,x)},
ez = —z + h(t,x),
где
h(t,х)=и=
(ΘΙ + 4n)r(t) + (θ*2 + ф2)(е0 + УтШ
к
= Noρ,0,0]Т
.
Сигнал ym(i) представляет собой выход системы с гурвицевой передаточной
функцией с входом r(i). Поэтому он имеет те же свойства гладкости и огра
ниченности, которыми обладает r(t). В частности, если r(t) имеет непрерывные
и ограниченные производные до порядка N включительно, то это свойство будет
выполнено и для ym(t). Исследуем полученную систему с сингулярными возму
щениями. При ε = 0 имеем z = h(t, x) и редуцированная модель принимает вид
уравнения
x = fo(t,x),
являющегося замкнутой моделью номинальной адаптивной системы управле
ния. Мы предположили, что начало координат модели является экспоненциально
устойчивым. Пограничная модель
dy
не зависит от (£, х), и ее начало координат глобально экспоненциально устойчи
во. Если эталонный входной сигнал r(t) и его производная r(t) ограничены, то
все предположения теоремы 11.2 будут выполнены на любом компактном мно
жестве точек (x9z). Обозначим через х решение номинальной адаптивной систе
мы управления, а через x(t,e) — решение неупрощенной адаптивной системы
управления и предположим, что начальные условия для этих решений совпада
ют. С использованием теоремы 11.2 заключаем, что существует ε* > 0, такая что
для всех 0 < ε < ε* выполнено
x{t,e) -x(t) = 0(ε)
равномерно по t для всех t^t$. Этот результат показывает, что рассматриваемая
адаптивная система управления является робастной относительно немоделируе-
мой быстрой динамики объекта.
Δ
470
ГЛАВА 11
11.4. Медленные и быстрые многообразия
В этом параграфе мы дадим геометрическое представление о поведении
решений (11.1)-(11.2), являющихся траекториями в Д
п
+
т
и характеризующих
ся тем, что соответствующие процессы в системе протекают в двух временных
шкалах. Для того чтобы использовать концепцию инвариантных многообразий
7
,
ограничимся рассмотрением автономных систем. Кроме того, для упрощения
обозначений мы предположим, что / и д не зависят от ε. Таким образом,
в этом параграфе мы будем рассматривать системы с сингулярными возмуще
ниями (11.1)-(11.2) следующего вида:
x = f(x,z),
(11.26)
ez = g(x,z).
(11.27)
Пусть z = h(x) — изолированный корень уравнения 0 = д(х, z), и предположим,
что для этого корня выполнены условия теоремы 11.1. Уравнение z = h(x) задает
многообразие размерности η в пространстве состояний (х, z) размерности (п +
+ га). Оно является инвариантным для системы
* = /(*,*),
(Н.28)
0 = g(x,z),
(11.29)
поскольку траектория системы (11.28)—(11.29), начинающаяся на многообразии
z = h(x), остается на этом многообразии для всех будущих моментов времени
(для которых это решение определено). Движение на этом многообразии описы
вается редуцированной моделью
х=
f(x,h(x)).
Из теоремы 11.1 следует, что траектории системы (11.26)—(11.27), начинающиеся
в О (ε)-окрестности z = h(x), останутся в О (ε)-окрестности z = h(x). Этот ре
зультат мотивирует постановку следующего вопроса: существует ли аналог инва
риантного многообразия z = h(x) при ε > 0? Оказывается, что в условиях пред
положений теоремы 11.1 существует инвариантное многообразие для (11.26)-
(11.27), которое лежит в О (ε)-окрестности z = h(x). Далее мы будем искать это
инвариантное многообразие для (11.26)—(11.27) в виде
z = H(xye),
(11.30)
где Η — достаточно гладкая (т. е. достаточно много раз непрерывно дифференци
руемая) функция от х и ε. Выражение (11.30) определяет в пространстве состоя
ний (ж, z) размерности (п+га) многообразие размерности п, зависящее от ε. Для
того чтобы z = Н(х,е) было инвариантным многообразием для (11.26)—(11.27),
должно быть выполнено
z(0,ε)- #(я(0,ε),ε)=0=> z(t, ε) - H(x(t, ε),ε) = 0, Vt GJ С [0,oo),
7
Инвариантные многообразия были введены в параграфе 8.1.
11.4 . МЕДЛЕННЫЕ и БЫСТРЫЕ МНОГООБРАЗИЯ
471
где J — любой интервал времени, на котором существует решение [ж(£, ε), z(t, ε)].
Дифференцируя (11.30) по t, умножая на ε и подставляя ж, ez и z из (11.26),
(11.27) и (11.30) соответственно, получаем уравнение многообразия
0 - д(х, Я(х, ε)) - ε§|/(*, Я(х, ε)),
(11.31)
которому должна удовлетворять функция Н(х,е) для всех я из рассматриваемой
области и для всех ε Ε [0, εο]. При ε = 0 дифференциальное уравнение в частных
производных (11.31) сводится к следующему уравнению:
0 = </(ж,Я(ж,0)),
из которого следует, что Я (ж, 0) = h(x). Поскольку уравнение 0 = д(х, z) может
иметь неединственный изолированный корень z = h(x), можно искать инвари
антное многообразие для (11.26)—(11.27) в окрестности каждого такого корня.
Можно показать,
8
что существуют ε* > 0 и функция Η (я, ε), удовлетворяющая
уравнению многообразия (11.31) для всех ε Ε [0,ε*] и такая, что
H(x,e)-h(x) = 0(e)
для ограниченных х. Инвариантное многообразие z = H(x,e) называется мед
ленным многообразием для системы (11.26)—(11.27). Каждому медленному мно
гообразию соответствует медленная модель
± = /(х,Я(я,£)),
(11.32)
описывающая движение на этом многообразии.
В большинстве случаев мы не можем получить решение уравнения многооб
разия (11.31) в явном виде, но можем аппроксимировать Н(х,е) с произвольной
точностью, используя ряд Тейлора в ε = 0. Процедура получения приближенного
решения начинается с подстановки в (11.31) ряда Тейлора для Я(ж,е):
Я(ж,е) = Я0(х) + еНг(х) + е
2
Н2(х) +···.
Далее вычисляются Но(х), Н\(х) и так далее путем приравнивания соответству
ющих членов при равных степенях ε. Для этого необходимо, чтобы функции /
и g были непрерывно дифференцируемыми по своим аргументам достаточное
количество раз. Очевидно, что Щ(х) = Я(ж,0) = h(x). Уравнение для Н\{х)
принимает вид
fz(x,h(x))H1(x) =
^f(x,h(x))
Здесь мы не доказываем существование инвариантного многообразия. Доказательство этого
факта по форме совпадает с доказательством теоремы 8.1 (о центральном многообразии), пред
ставленным в приложении С. 15. (См. [34, параграф 2.7].) Доказательство существования этого
многообразия в условиях предположений теоремы 11.1 может быть найдено в работе [102].
472
ГЛАВА И
и имеет единственное решение, если якобиан [dg/dz], вычисленный в z = h(x),
является невырожденной матрицей. Невырожденность якобиана следует из усло
вия на собственные значения (11.16). Аналогично только что рассмотренному
случаю для Hi уравнения для членов высшего порядка будут линейными и раз
решимыми, если якобиан [dg/dz] является невырожденным.
Для того чтобы ввести понятие быстрого многообразия, рассмотрим (11.26)-
(11.27) во временной шкале г = t/ε. При ε = 0, х(т) = х(0)9 a z{r) эволюцио
нирует в соответствии с уравнением
% = 9(x(0),z),
стремясь к точке равновесия z = h(x(0)). Это движение соответствует траекто
риям (ж,z) вД
п+т
, принадлежащим для любого заданного ж(0) быстрому мно
гообразию Fx, которое определяется равенством х = х(0) = const. Эти траекто
рии быстро сходятся к многообразию z = h(x). Если параметр ε больше нуля, но
мал, быстрые многообразия представляют собой «расслоение» решений, быстро
стремящихся к медленному многообразию. Проиллюстрируем описанную ситу
ацию двумя примерами систем второго порядка.
Пример 11.10. Рассмотрим систему с сингулярными возмущениями
X= —X+Ζ,
εΖ = tg_1
(l—z
—
х).
При ε = 0 медленное многообразие определяется уравнением z = h(x) = 1 - х.
Соответствующая медленная модель
х=-2х+1
имеет асимптотически устойчивую точку равновесия в х = 0.5. Поэтому траек
тории на многообразии z = 1-х движутся в направлении к точке Ρ = (0.5,0.5),
как это показано стрелками на рисунке 11.8. Заметим, что (0.5,0.5) является
точкой равновесия всей системы. При ε = 0 быстрые многообразия параллель
ны z-оси и траектории на них стремятся к медленному многообразию z = 1 — х.
С учетом этой информации мы можем построить фазовый портрет системы. На
пример, траектория, начинающаяся в точке А, проходит вертикально вниз до тех
пор, пока не достигает многообразия z = 1 — х в точке В. Из точки В траекто
рия движется вдоль многообразия к точке равновесия Р. Аналогично траектория,
начинающаяся в точке С, проходит вертикально вверх до точки D и далее про
ходит вдоль многообразия до точки равновесия Р. Если параметр ε > 0, но мал,
фазовый портрет системы будет близок к аппроксимации, полученной при ε = 0.
На рисунке 11.9 показан фазовый портрет при ε = 0.1.
Δ
Схожесть этих двух фазовых портретов отчетливо видна.
11.4 . МЕДЛЕННЫЕ И БЫСТРЫЕ МНОГООБРАЗИЯ
473
0
2
1
0
-1
-2
-3
1
|
1
Ζ
\р
С
I
τ—
'
i
x
'
А
1
I
5
i
J
-
Χ
-
I
-3 -2 -10
1
2
3
Рис. 11.8. Аппроксимация фазового портрета системы из примера 11.10
о
2
1
0
-1
2
9
XV
•
л\\
/
/\
/
\
1.1
\
1
1
-
/
1\^ /
ж
1 \V-^
\
1
1
\
1
-3-2-10123
Рис. 11.9. Фазовый портрет системы из примера 11.10 при ε = 0.1
Пример 11.11. Рассмотрим уравнение Ван дер Поля
при μ ^> 1. Используя
Λ_^_^+„_0
*=-Р!
+
»-И
*="
в качестве переменных состояния, t = s/μ в качестве переменной времени и по
лагая ε = Ι/μ2
,
мы можем представить систему в стандартной форме модели
474
ГЛАВА 11
с сингулярными возмущениями
х=z,
1я
ΕΖ= -Х+Ζ- ±Ζ°.
В примере 2.9 мы установили с использованием теоремы Пуанкаре-Бендиксона,
что уравнение Ван дер Поля имеет устойчивый предельный цикл. В рассматри
ваемом здесь примере мы хотим использовать метод сингулярных возмущений
для получения лучшей оценки местоположения предельного цикла. При ε — О
нам необходимо найти корни уравнения z = h(x), которое в рассматриваемом
случае имеет вид
Кривая—х+z—z
3
/3 = 0, являющаяся медленным многообразием при ε = 0,
изображена на рисунке 11.10. При х < —2/3 существует лишь один корень на
3
2
1
0
-1
-2
-3
-4-3-2-101234
Рис. 11.10. Аппроксимация фазового портрета уравнения Ван дер Поля
участке кривой АВ. При —2/3 < х < 2/3 существует три корня, расположенных
соответственно на участках АВ, ВС и CD. При х > 2/3 существует один корень
на участке CD. Для корней на участке кривой АВ якобиан удовлетворяет
-^
=1-z
2
<0приz
2
>1.
oz
Таким образом, корни на участке АВ (исключая окрестность точки В) являют
ся экспоненциально устойчивыми. Аналогичное утверждение справедливо и для
корней на участке CD (исключая окрестность точки С). С другой стороны, кор
ни на участке ВС неустойчивы, т. к. они принадлежат области z
2
< 1. Построим
|
-
1
с
Ε
1
Ζ
V
л
•
1
В
•
1
X
11.4. МЕДЛЕННЫЕ и БЫСТРЫЕ МНОГООБРАЗИЯ
475
аппроксимацию фазового портрета с использованием метода сингулярных воз
мущений. Для этого разделим пространство состояний равновесия (плоскость)
на три области, каждая из которых соответствует определенным значениям х.
Траектории, начинающиеся в области х < —2/3, движутся параллельно оси z
и приближаются к участку АВ медленного многообразия. Траектории, начинаю
щиеся в области —2/3 < х < 2/3, также параллельны оси z, но приближаются
либо к участку АВ, либо к участку CD, в зависимости от начального значения z.
Если начальная точка расположена выше участка ВС, траектория приближается
к АВ; в противном случае она приближается к участку CD. Наконец, траек
тории, начинающиеся в области х > 2/3, приближаются к участку CD. Тра
ектории на медленном многообразии движутся вдоль этого многообразия. На
правление этого движения может быть определено с учетом знака векторного
поля (см. рисунок 11.10). В частности, поскольку х = z, траектории на участ
ке АВ движутся вниз по этому многообразию, а на участке CD — вверх. Нет
необходимости в том, чтобы проводить исследование траекторий на участке ВС,
поскольку редуцированные модели, соответствующие неустойчивым корням на
этом участке, отсутствуют. Таким образом, мы построили приближенный фазо
вый портрет на всех областях, исключая участок ВС и окрестности точек В и С.
В этих областях мы не можем использовать теорию сингулярных возмущений
для построения фазового портрета. Исследуем поведение системы в окрестно
сти В, когда значение ε положительно, но мало. Траектории, движущиеся вдоль
участка АВ по направлению к точке В, в действительности движутся вдоль точ
но определенного медленного многообразия z = H(x,e). Поскольку траектория
движется к В, должно быть выполнено д < 0. Следовательно, точное медленное
многообразие должно лежать выше участка АВ. Исследование векторного поля
в окрестности В показывает, что траектория пересекает проходящую через В
(т. е. при х = 2/3) вертикальную прямую выше точки В. Как только траектория
пересекает эту прямую, она оказывается в области притяжения устойчивого кор
ня на участке CD и поэтому эта траектория быстро вертикально поднимается
в направлении участка CD. Аналогичные рассуждения приводят к выводу, что
движущаяся вдоль участка CD траектория пересекает проходящую через С вер
тикальную прямую ниже точки С и далее движется вертикально по направлению
к участку АВ. Эти последние штрихи завершают наше построение аппроксима
ции фазового портрета системы. Траектории, начинающиеся в какой-либо точке
пространства состояния, движутся вертикально и притягиваются к одному из
двух участков АВ или CD. Оказавшись на медленном многообразии, траекто
рии движутся к замкнутой кривой Ε — В
—
F—С
—
Ε (если изначально на ней
не находились), накручиваются на нее и, наконец, циклически движутся вдоль
этой кривой. Точно определенный предельный цикл уравнения Ван дер Поля
расположен в 0(е)-окрестности этой замкнутой кривой. Это утверждение под
тверждается видом фазового портрета при ε = 0.1, показанным на рисунке 11.11.
Можно также оценить период колебания периодического решения. Замкну
таякриваяΕ—В
—
F—С
—
Ε имеет два медленных участка и два быстрых.
Пренебрегая временем быстрых переходных процессов движения от точки В
476
ГЛАВА 11
i
"•
i—
•
1
J
1
л
I/
г
-
Ζ
¥
\
I
1
—
•
—
i
X
1
1
-3 -2 -10123
Рис. 11.11. Фазовый портрет уравнения Ван дер Поля при ε = 0.1
к точке F, а также от С к Е, оценим величину tEB + tpc в качестве искомого
периода колебания. Оценка времени tEB может быть получена с использованием
редуцированной модели
х=z,
Дифференцируя второе уравнение по t и исключая из этих двух уравнений ±,
получаем
Интегрируя это уравнение на участке στ Ε до В, получаем tEB = (3/2) — In 2.
Оценка времени tpc может быть получена аналогичным образом, вследствие
имеющейся симметрии. В результате получаем tEB = tpc- Таким образом, пе
риод колебания, приближенно вычисленный при малой значении параметра ε,
равен 3- 2In2.
Δ
11.5. Анализ устойчивости
Рассмотрим автономную систему с сингулярными возмущениями
A = /(x,z),
ez=g(x,z)
(11.33)
(11.34)
и предположим, что начало координат (х = 0, z = 0) является изолированной
точкой равновесия и функции / и g являются локально липшицевыми в области,
11.5. АНАЛИЗ устойчивости
477
содержащей начало координат. Тогда
/(0,0) = 0, fl(0,0) = 0.
Наша цель в этом параграфе заключается в том, чтобы исследовать свойства
устойчивости начала координат с использованием редуцированной и погранич
ной моделей. Пусть z = h(x) — изолированный корень уравнения
0 = g(x,z),
определенного для всех х G Dx с R
n
, где Dx — открытая область, содержащая
х = 0. Предположим, что h(0) = 0. Если для уравнения 0 = д корень z = h(x)
является единственным, то он должен быть равен нулю в начале координат, т. к.
#(0,0) = 0. Если существует два или более изолированных корней, то один из
них должен быть равен нулю при х = 0 и именно для этого корня мы и будем
далее проводить анализ. Удобно ввести (ж, у)-координаты, где
y=z- h(x),
поскольку при таком выборе переменных точка равновесия пограничной модели
перемещается в начало координат. В новых координатах система с сингулярными
возмущениями принимает следующий вид:
x = f(x,y + h(x)),
(11.35)
εν= <К*>У+h(x)) - еЦ/С&,У+h(x)).
(11.36)
В предположении, что ||Л(ж)|| ^ CGMI) Для
всех х
€ Ас>
г
ДеС
—
некоторая
/С-функция, отображение у = z — h(x) сохраняет свойства устойчивости систе
мы, т.е. начало координат (11.33)-(11.34) является асимптотически устойчивым,
если и только если начало координат (11.35)-(11.36) является асимптотически
устойчивым. Редуцированная система
x = f(x,h(x))
(11.37)
имеет точку равновесия в х = 0 и пограничная система
^p = g(x,y + h(x)),
(11.38)
где г = t/ε и х рассматривается как фиксированный параметр, имеет точку
равновесия в у = 0. Дальнейший анализ будет проведен в условиях основно
го предположения, заключающегося в том, что для каждой из этих двух систем
соответствующее начало координат является асимптотически устойчивым и что
нам известны соответствующие функции Ляпунова, удовлетворяющие условиям
теоремы Ляпунова. В случае пограничной задачи будет также предполагаться,
478
ГЛАВА 11
что свойство асимптотической устойчивости начала координат выполняется рав
номерно по фиксированному параметру х. Ранее мы определили это свойство
в случае экспоненциально устойчивого начала координат (см. определение 11.1).
Здесь и далее мы будемговорить,что начало координат системы (11.38) асимп
тотически устойчиво равномерно по х, если решения (11.38) удовлетворяют
Ыт)||</%(0),т), Vr^CVxeA,,
где β — /С£-функция. Выполнение этих условий будут следовать из предположе
ний, которые будут сделаны ниже в отношении функции Ляпунова для (11.38).
Рассматривая систему с сингулярными возмущениями (11.35)-(11.36) как взаи
мосвязанную систему, компонентами которой являются редуцированная и по
граничная системы, мы построим композитную функцию Ляпунова для всей
системы в виде линейной комбинации функций Ляпунова для редуцированной
и пограничной систем. Далее мы вычислим производную композитной функции
Ляпунова вдоль траекторий всей системы и убедимся в том, что при некоторых
условиях роста, накладываемых на функции / и #, композитная функция Ляпу
нова удовлетворяет условиям теоремы Ляпунова для достаточно малой ε.
Пусть V(x) — функция Ляпунова для редуцированной системы (11.37), такая
что
|£/(*,М*)) <-aitf?(*)
(11.39)
длявсеххеДг,гдеtpi:R
n
— > R — положительно определенная функция,
т.е.
-01(0) = 0 иipi(x) > 0для всех х е Dx — {0}.Пусть W(x,y) —функция
Ляпунова для пограничной системы (11.38), такая что
^S(x,у + h(x)) < -a2ifi(y)
(11.40)
длявсех(х,у)GDx xDy, гдеDy с R
m
—
открытая область, содержащая у =
= 0,иip2:R
m
— > R — положительно определенная функция, т.е. ^(0) = 0
и
Ф2(у) > 0 для всех у е Dy — {0}. Исследование будет выполнено в предпо
ложении, что функция Ляпунова W может зависеть от х. Это условие является
естественным, поскольку х — параметр системы. Поэтому функция Ляпунова мо
жет, вообще говоря, зависеть от этого параметра (и других). С учетом того что
в действительности х не является постоянным параметром, мы должны будем
иметь в виду при дальнейшем анализе эту зависимость W от х. Для того что
бы обеспечить асимптотическую устойчивость начала координат системы (11.38)
и равномерное выполнение этого свойства по х, мы предположим, что W(x,y)
удовлетворяет неравенству
Wx{y) < W(x,y) < W2(y), V(x,y) eDxxDy
(11.41)
для некоторых положительно определенных непрерывных функций W\ и И^·
Рассмотрим композитную функцию Ляпунова
1/(яг,у)=(1-d)V(x) +dW(x,у),0<d<1,
(11.42)
11.5. АНАЛИЗ устойчивости
479
где константа d подлежит определению. Вычисляя производную и вдоль траек
торий всей системы (11.35)-(11.36), получаем
v = (l-d)^:f(x,y
+ h(x)) + l^g(x,y
+ h(x))-
дх
dWdh
jdW
~
d
%fJ^ У+
h
(*)) +
d
^f^ У+
h
^=
]
дх'
= (1- d)^f(x,
h(x)) + f ^9(Χ9у
+ h(x)) +
ddW
ду
sdV<
+(1 - d)^[/(x,y + h(x)) - f(xM*))] +
+d
dW dWdh
дх дудх
f(x,y + h{x)).
Легко видеть, что производная ν является суммой четырех членов. Первые два
члена представляют собой соответственно производные V и W вдоль траекторий
редуцированной и пограничной систем. Из неравенств (11.39) и (11.40) следует,
что эти два члена отрицательно определены соответственно по х и у. Оставшиеся
два члена обусловлены взаимосвязью между медленной и быстрой динамикой,
которой мы пренебрегаем при ε = 0. Знак этих членов, вообще говоря, не опре
делен. Первый из оставшихся членов
^-lf(X,y
+
h(x))-f(x,h(x))}
соответствует отклонению (11.35) от редуцированной системы (11.37). Второй
член
1dW dWdhI
дх
f{x,y + h(x))
ду дх\
соответствует отклонению (11.36) от пограничной системы (11.38), а также обу
словлен эффектом фиксации х во время анализа пограничной системы. Предпо
ложим, что эти члены возмущений удовлетворяют неравенствам
dv
дх
dw
dwdh
[f(x,y +
h(x))-f(x,h{x))]<PiM*)Mv)
f(x,y + h(x)) < Mi{*)Mv)+Vl>2(v)
(11.43)
(11.44)
дх ду дх\
для некоторых неотрицательных констант /?i, ft и 7. С использованием (11.39),
(11.40), (11.43) и (11.44) получаем
*<-(1- d)ai^(x) - f a2Vi(y) + (1 - а)р1ф1(х)ф2(у) +
+dfoil>i(x)ih(y) + dj^l(y) =
=
-ф
т
(х,у)Аф(х,у),
480
ГЛАВА 11
где
ф(х,у) =
Ф2(У) J
А=
(1 - d)ai
-±(i-d)/3i-|d/%
-1(1-d)A-Id/%
d((a2/e) - 7)
Правая часть последнего неравенства имеет вид квадратичной формы по ψ. Эта
квадратичная форма отрицательно определена, если выполнено неравенство
d(l-d)ai(^ - 7)>\[(1~d)/?i+ ОД2
или эквивалентное
ε<
OL\OL<l
ai7 +
1
4d(l - d)
[(l-d)/?i+d/?2]
2
def
(11.45)
График зависимости ε^ от d изображен на рисунке 11.12. Легко видеть, что мак
симальное значение Ed достигается при d* = β\/{β\ + fa) и равно
aia2
<*l7 + β\β2 '
(11.46)
Следовательно, начало координат (11.35)-(11.36) асимптотически устойчиво для
всех ε < ε*. В следующей теореме суммируются полученные результаты.
с^
d*
б^
d
Рис. 11.12. Верхняя граница для ε
Теорема 11.3. Рассмотрим систему с сингулярными возмущениями (11.35)
и (11.36). Предположим, что существуют функции Ляпунова V(x) и W(x,y),
удовлетворяющие (11.39)—(11.41), (11.43) и (11.44). Пусть ε^ и ε* определя
ются равенствами (11.45) и (11.46). Тогда начало координат (11.35) и (11.36)
11.5. АНАЛИЗ УСТОЙЧИВОСТИ
481
асимптотически устойчиво для всех О < ε < ε*. Кроме того, функция и(х, у),
определенная равенством (11.42), является функцией Ляпунова при ε е (0,ε</).
Анализ устойчивости, посредством которого был получен результат теоре
мы 11.3, позволяет наметить этапы процедуры построения функций Ляпунова
для систем с сингулярными возмущениями (11.35)-(11.36). Процедура начинает
ся с исследования редуцированной и пограничной систем и нахождения функций
Ляпунова V{x) и W(x,y), удовлетворяющих (11.39)—(11.41). Далее проверяется
выполнение неравенств (11.43) и (11.44), которые мы называем условиями на
взаимосвязь указанных двух системам. Для нахождения требуемых функций Ля
пунова может потребоваться проверить несколько функций-кандидатов. В каче
стве руководства для этого поиска может служить то, что условия на взаимосвязь
выполняются, если
ЗУ
дх
< fci^i(ff); ||/(s, h{x))\\ < M>i(z),
\\f(x,y + h(x)) - f(x,h(x))\\ < к3ф2(у),
dW
dy < k^2{y)\ dw
dx
^ kbfoiy)-
Напомним, что функция Ляпунова V(x), удовлетворяющая (11.39) и ||<?V/cta|| ^
k\ijji(x), называется функцией Ляпунова квадратичного типа, а функция ψ\ на
зывается функцией сравнения. Таким образом, поиск подходящих функций Ляпу
нова будет успешным, если мы сможем найти функции Ляпунова квадратичного
типа V и W и функции сравнения ifti и ^2? такие что ||/(x,/i(^))|| ограниче
на функцией ip\{x) и ||/(#,у + h(x)) — f(x,h(x))\\ ограничена функцией г/>2(у)·
При этом мы можем заключить, что начало координат асимптотически устой
чиво при ε < ε*. Каждой заданной константе ε < ε* соответствует некоторый
интервал (di,^) (см. рисунок 11.12), такой что для любой d G (dbcfo) функ
ция v{x, у) = (1 — d)V(x) + dW(x, у) является искомой функцией Ляпунова для
всей системы. Свобода при выборе значения d позволяет обеспечить выполнение
дополнительных целей, например, улучшить оценки области притяжения.
Пример 11.12. Система второго порядка
х
3
+z,
х=/(ж,я)=х
ez=g(x,z)=—x
—
z
имеет единственную точку равновесия в начале координат. Положим у
—
h(x) = z + x и перепишем систему в виде
х
еу
-х
3
+у,
-2/ + ε(-Ζ
3
+ у).
Для редуцированной системы
х=—х
482
ГЛАВА 11
выберем функцию Ляпунова V(x) = (1/4)х
4
, удовлетворяющую (11.39) с ф\(х) =
= |х|
3
иа1 = 1. Для пограничной системы
dy
выберем функцию Ляпунова W(y) = (1/2)у2
, удовлетворяющую (11.41)
с
Ф2(у) = \у\ и «2 = 1. Условия взаимосвязи (11.43) и (11.44) принимают следу
ющую форму:
|£ [Дх, У+ h(x)) - /(*, h(x))] = Х
3
У < falfo
и
^/(х, у + h(x)) = у(-х
3
+у)^гРгф2+</>2·
Заметим, что dW/dx = 0. Следовательно, (11.43) и (11.44) выполнены с β\ =
= /?2=7
=
1· Поэтому начало координат асимптотически устойчиво при
ε < ε* = 0.5. В действительности, поскольку все условия выполнены глобально
и v(x,y) = (1 — d)V{x) + бГИ^(у) радиально неограниченна, начало координат
является глобально асимптотически устойчивым при ε < 0.5. Для определения
степени консервативности полученных оценок заметим, что из характеристиче
ского уравнения для линеаризованной в начале координат системы
λ2
+(\-1]λ=0
видно, что начало координат неустойчиво при ε > 1. В рассматриваемом простом
примере мы можем вычислить производную функцию Ляпунова
/ч1—d\
.
d2
фуУ)= —£-
х
+ψ
вдоль траекторий всей системы с сингулярными возмущениями и попытаться
получить менее консервативную оценку на ε (по сравнению с соответствующей
оценкой, получаемой с использованием теоремы 11.3):
ν=(1- d)x
3
(-x
3
+y)- f</
2
+ dy(-x
3
+у)=
= -(1-d)x
6
+ (1- 2d)x
3
y-d(\-l\у2
.
Легко видеть, что при d = 1/2 перекрестные произведения исключаются и мы
получаем выражение для производной
>—y-i(i-*)*·
11.5. АНАЛИЗ УСТОЙЧИВОСТИ
483
являющейся отрицательно определенной для всех ε < 1. Эта оценка действи
тельно менее консервативна по сравнению с оценкой из теоремы 11.3. Более
того, эта оценка действительно определяет границы ε, для которых начало коор
динат асимптотически устойчиво.
Δ
Пример 11.13· Система
х—
—х4-z,
EZ = tg_1
(l—X
—
Ζ)
имеет точку равновесия в (0.5,0.5). Замена переменных
х=х-0.5; z=z—0.5
перемещает точку равновесия в начало координат. Для упрощения обозначений
опустим тильды и перепишем уравнение состояния в следующем виде:
х=—х
-Ь 2,
εi = -tg~
1
(x-\- z).
Уравнение
0= -tg"
1
(x+^)
имеет единственный корень z = h(x) = —х. Выполним замену переменных у =
= z + х, в результате которой получаем
х=-2х+у,
£У= ~ tg"
1
У+е(-2х + у).
Для редуцированной системы выберем V(x) = (l/2)rr
2
, удовлетворяющую
(11.39) с ai = 2 и ^i(x) = \х\. Для пограничной системы выберем W(y) =
= (1/2)у2
.
Тогда (11.40) принимает вид равенства
выполненного при всех у G Dy = {у \ \у\ < р}. Таким образом, (11.41) выпол
нено со!2 = (tg_1
ρ) Ιρ и -02 (у) = \у\- Условия взаимосвязи (11.43) и (11.44) вы
полнены глобально с /?i = 1, ft = 2 и 7 = 1. Следовательно, начало координат
асимптотически устойчиво для всех ε < ε* = (tg_1
ρ)/2ρ. Β действительности
начало координат экспоненциально устойчиво, т.к.ии отрицательно определен
ная оценка сверху на U являются квадратичными формами по (х, у).
Δ
Представленный выше ляпуновский анализ может быть обобщен на слу
чай неавтономных систем. Мы не будем детально рассматривать здесь этот во
прос,
9
но рассмотрим случай экспоненциальной устойчивости и используем об
ратные теоремы Ляпунова для доказательства результата, имеющего концепту
альное значение.
9
Детальное исследование неавтономного случая выполнено в работе [105, параграф 7.5].
484
ГЛАВА 11
Теорема 11.4. Рассмотрим систему с сингулярными возмущениями
я = /(*,*,*, ε),
(11.47)
ez = #(£,£, г, ε).
(11.48)
Предположим, что следующие предположения выполнены для всех
(£,Χ,ε) е [0,оо) х Вг х [0,εο] :
•
/(t,0,0,s)=0tt^(t,0,0,s)=0.
• Уравнение
Q = g(t,x,z,Q)
имеет изолированный корень z = h(t, х), такой что h(t, 0) = 0.
• Функции f,g,h и их частные производные до второго порядка включитель
но ограничены при z — h{t, х) Ε Вр.
• Начало координат редуцированной системы
х=
f(t,x,h(t,x),0)
экспоненциально устойчиво.
• Начало координат пограничной системы
d/u
—
=g(t,x,y + h(t,x),0)
экспоненциально устойчиво равномерно по (£, х).
Тогда существует константа ε* > 0, такая что для всех ε < ε* начало коорди
нат системы (11.47)-(11.48) экспоненциально устойчиво.
ДОКАЗАТЕЛЬСТВО. ПО теореме 4.14 для редуцированной системы существу
ет функция Ляпунова, удовлетворяющая неравенствам
ci||x||
2
<F(i,a;)<C2|M|2
,
%+
%f{t,xMt,x\b)^-cz\\x\\\
dv
дх
^ с4||ж||
для некоторых положительных констант Q, г = 1,...,4 И ДЛЯ Х £ Вго, где
го ^ г. По лемме 9.8 для пограничной системы существует функция Ляпунова
W(t,x,y), удовлетворяющая неравенствам
bilMI2
<w4<,*,y)o2|M|2
,
11.5 . АНАЛИЗ УСТОЙЧИВОСТИ
485
|^(<,*,у + М*,*),0)<-Ьз|М|2
,
dW
dW
dt
ду
< МУ112;
< MMI,
aw
дх
< MMI
2
для некоторых положительных констант Ь^ i = 1,...,6 и для у Ε £?ро, где
ро ^ /?· При замене переменных
у=z — h(t,x)
система (11.47)—(11.48) принимает вид
ж = /(*,ж,2/Ч-Л(*,ж),е),
,0Л
еу=#(£,х,у+ft(i,х),ε)-ε
.ал.
а*
(11.49)
(11.50)
-ε^/(*,Χ,» + /*(*,Χ),ε).
Далее мы намерены использовать функцию
i/(i,a?,y) = V
r
(iJx) + W
r
(i,x,y)
в качестве функции Ляпунова для системы (11.49)—(11.50). Но прежде чем сде
лать это, отметим некоторые свойства, выполненные в окрестности начала ко
ординат. Поскольку функции /ид равны нулю в начале координат для всех
ε £ [0, εο], они являются липшицевыми по ε линейно по вектору состояния (х, у).
В частности,
||/(t,х,у + h(t,х),ε) - /(*,х,у + fc(t,x),0)|| < sLi(||x|| + \\y||),
||<?(*, х, у + Л(*, х),ε) - g(t, х, у + Л(*, х), 0)|| < εΖ,2(||Χ|| + ||у||).
Кроме того,
||/(i,x,y + /i(i,x),0)-/(i,x,ft(i,x),0)|| <L3||y||,
||/(*,x,/i(i,x),0)|| <L4||x||,
|<9/i|
dt
<*iN;
<9x
<*2·
При получении этих неравенств мы использовали тот факт, что /(£, х, Л(£, х), 0)
иft(t,х) равны нулю при х = 0 для всех t. С использованием этих оценок, а так
же свойств функций V и W можно показать, что производная ν вдоль траекторий
системы (11.49)—(11.50) удовлетворяет неравенству
ν < -ai||x||
2
+ εα2||Χ||2
flMI2
+ «4||y||2
+
+а5||х|||Ы|+а6|И||Ы|2
+ а7||у||3
486
ГЛАВА 11
с положительными а\ и аз и неотрицательными константами a<i и a^-aj. Для
всех || у || < ро это неравенство можно переписать в более простой форме:
аз.
ν^
-ai||x||
2
+ 6a2||x||
2
НЫ|2
+ а8|Ы|2
+ 2а9|И||Ы|
IN
а\ — εα>2
-ад
ы
-а
9
(as/ε)- а8 J[\\у\\J
Таким образом, существует ε* > 0, такая что для всех 0 < ε < ε* выполнено
для некоторой η > 0. Тогда
i/(i, x(t),y(t)) < exp[-27(t - *о)М*о, ж(*0), 2/(*о))
и с учетом свойств V nW получаем
\x(t)\
\y(t)
z — h(t,x) и ||ft(i,x)|| ^ &2||#||> получаем
^ jriexp[-7(i-io)] ж (i0)
l/(*o)
Поскольку у
x(f)
z(t)
^K2exp[-j(t-t0)}
x(t0)
z(t0)
Эти неравенства завершают доказательство теоремы.
Π
Теорема 11.4 имеет важное концептуальное значение, поскольку в ней сфор
мулировано утверждение о робастности экспоненциально устойчивой системы
по отношению к немоделируемой быстрой (высокочастотной) динамике. При
анализе динамических систем очень часто используются модели пониженного
порядка, получаемые при пренебрежении малыми «паразитными» параметрами.
Модель пониженного порядка может быть представлена в виде системы с син
гулярными возмущениями, в которой нередуцированная модель с сингулярными
возмущениями представляет собой действительную систему с паразитными па
раметрами, а редуцированная модель представляет собой упрощенную модель,
используемую при анализе. Разумно предположить, что пограничная модель име
ет экспоненциально устойчивое начало координат. В действительности, если бы
связанная с паразитными элементами динамика была неустойчивой, нам не сле
довало бы пренебрегать ею на первом этапе анализа. Предположение о экспо
ненциальной устойчивости, но не об асимптотической устойчивости, или пред
положение о равномерности свойства экспоненциальной устойчивости являют
ся вполне естественными в большинстве приложений. В этой связи достаточно
вспомнить хотя бы то, что эти предположения автоматически выполняются, если
быстрая динамика является линейной. Если начало координат редуцированной
модели экспоненциально устойчиво, теорема 11.4 гарантирует экспоненциаль
ную устойчивость начала координат нередуцированной системы при условии,
что быстрая динамика, которой мы пренебрегли, является достаточно быстрой.
Следующий пример иллюстрирует, как эти свойства робастности могут быть ис
пользованы при исследовании задач управления.
11.5 . АНАЛИЗ УСТОЙЧИВОСТИ
487
Пример 11.14. Рассмотрим задачу стабилизации с помощью обратной свя
зи системы
x = f(t,x,v),
ez=Az+Ви,
ν= Cz,
где /(£,0,0) = 0 и А — гурвицева матрица. Неуправляемая система имеет точ
ку равновесия в начале координат, и задача заключается в том, чтобы постро
ить закон управления с обратной связью по состоянию, обеспечивающий ста
билизацию начала координат. Линейная часть этой модели представляет собой
динамику привода, которая обычно является более быстрой по сравнению с ди
намикой объекта управления, представленной нелинейным уравнением х = /.
Для упрощения нашей задачи пренебрежем динамикой привода, положив ε = 0
и подставив υ = — СА~
х
Ви в уравнение объекта управления. Для упрощения
обозначений предположим, что —СА~
1
В = I. Тогда редуцированная модель
имеет вид
х = /(£,х,и).
Эта модель будет использована при построении закона управления и = j(t, x)
с обратной связью по состоянию, обеспечивающего экспоненциальную устойчи
вость начала координат замкнутой модели
x=
f(t,x,7(t,x)).
Мы будем называть эту модель номинальной замкнутой системой. Будет ли этот
закон управления стабилизировать действительную систему, в которой динами
ка привода присутствует? Если закон управления применить к действительной
системе, соответствующее замкнутое уравнение будет иметь вид
x = f(t,x,Cz),
ez = Az + Bj(t,x).
Таким образом, мы свели нашу задачу к задаче с сингулярными возмущениями,
в которой нередуцированной моделью с сингулярными возмущениями является
действительная замкнутая система, а редуцированной моделью — номинальная
замкнутая система. По построению, начало координат редуцированной модели
экспоненциально устойчиво. Пограничная модель
не зависит от (t,x) и ее начало координат экспоненциально устойчиво, т. к. мат
рица А гурвицева. В предположении, что / и j достаточно гладкие функции,
удовлетворяющие условиям теоремы 11.4, мы можем заключить, что начало ко
ординат действительной замкнутой системы экспоненциально устойчиво при до
статочно малой константе ε. Этот результат обосновывает выполненное упроще
ние модели путем пренебрежения динамикой привода.
Δ
488
ГЛАВА И
11.6. Упражнения
11.1. Рассмотрим электрическую ДС-цепь (см. рисунок 11.13) и предположим,
что емкость конденсатора Сг мала по сравнению с емкостью конденсатора С\
и R\ — i?2 = R- Представьте систему в стандартной форме с сингулярными
возмущениями.
AW—i VW
Рис. 11.13. К упражнениям 11.1 и 11.2
11.2. Рассмотрим электрическую ДС-цепь (см. рисунок 11.13) и предположим,
что сопротивление резистора R\ мало по сравнению с сопротивлением резистора
Л2 и С\ = C<i = С. Представьте систему в стандартной форме с сингулярными
возмущениями.
11.3. Рассмотрим электрическую цепь с туннельным диодом, представленную
в параграфе 1.2.2, и предположим, что индуктивность L мала по сравнению
с постоянной времени, так что константа L/R существенно меньше постоян
ной времени CR. Представьте систему в стандартной форме с сингулярными
возмущениями при ε — L/CR2
.
11.4 ([105]). Система с обратной связью, изображенная на рисунке 11.14, име
ет усилитель с сильной обратной связью с коэффициентом усиления к, а также
нелинейный элемент ψ. Представьте систему в стандартной форме с сингуляр
ными возмущениями при ε = 1/fc.
и +,"virv^
J\
къ-
1
bo
1
S
У
1
s
X
Рис. 11.14. К упражнению 11.4
11.5. Покажите, что если якобиан [дд/ду] удовлетворяет условию на собственные
значения (11.16), то существуют константы /с, η и ро, для которых выполнено
неравенство (11.15).
11.6. УПРАЖНЕНИЯ
489
11.6. Покажите, что если существует функция Ляпунова, удовлетворяющая (11.17)
и (11.18), то неравенство (11.15) выполнено с оценками (11.19).
11.7. Рассмотрим задачу с сингулярными возмущениями
х=х
2
+z,х(0)=ξ,
ez=x
2
—
z+1,z(0)=η.
(a) Найдите 0(е)-аппроксимации x и z на интервале времени [0,1].
(b) Пусть ξ = η = 0. Выполните компьютерное моделирование и получите
графики для х и z при
(1) ε=0.1 и (2) ε=0.05.
Сравните полученные результаты с аппроксимациями, полученными в пунк
те (а). При проведении компьютерного моделирования примите во внимание
то обстоятельство, что система уходит на бесконечность за конечное время
вскоре после момента времени t = 1.
11.8. Рассмотрим задачу с сингулярными возмущениями
х=х+г,х(0)=ξ,
sz = -^tg-
1
(^(2x
+ z)j,z(0) = V.
(a) Найдите О (ε)-аппроксимации х и z на промежутке времени [0,1].
(b) Пусть ξ = η = 1. Выполните компьютерное моделирование и получите
графики для х и z при
(1) ε=0.2 и (2) ε=0.1.
Сравните полученные результаты с аппроксимациями, полученными в пунк
те (а).
11.9. Рассмотрим систему с сингулярными возмущениями
х=z,
ez=—х
—
ez —ехр(г)+1+ u(t).
Постройте редуцированную и пограничную модели и исследуйте свойства устой
чивости пограничной модели.
11.10 ([105]). Рассмотрим систему с сингулярными возмущениями
х=*А,
ez=-(z+xt)(z-2){z-4).
(a) Сколько редуцированных моделей может иметь эта система?
(b) Исследуйте свойства устойчивости каждой пограничной модели.
490
ГЛАВА 11
(с) Пусть х(0) = 1 и г(0) = а. Найдите О (ε)-аппроксимацию для х и z на
интервале времени [0,1] для всех значений а в интервале [—2,6].
11.11. Примените теорему 11.2 для исследования асимптотического поведения
системы
х= —х+z—sint, ez=—z+sint
приt—>оо.
11.12 ([105]). Найдите точное выражение для медленного многообразия системы
XZ
ez•
г4/3
+1
ет 16/3
11.13 ([105]). Сколько медленных многообразий имеет следующая система? Ка
кие из этих многообразий притягивают траектории системы?
-XZ,
ez = -(z- sin
2
x)(z-e
ax
)(z-2e
lax
), a>0.
11.14 ([105]). Рассмотрим линейную автономную систему с сингулярными воз
мущениями
х=Ацх +A\2Z,
ez = А2\х + A22Z,
гдехеR
n
, zΕRm
и Л22 — гурвицева матрица.
(a) Покажите, что при достаточно малой е система имеет медленное многооб
разие, точное выражение для которого имеет вид z = —L(e)x, где L удовле
творяет алгебраическому уравнению
-eL(An
-
Ai2L) = А2\ - A22L.
(b) Покажите, что замена переменных η = z+L(e)x приводит систему к блочно-
диагональному виду.
(c) Покажите, что собственные значения системы разделяются на две группы: п
медленных собственных значений порядка 0(1) и т быстрых собственных
значений порядка 0(1/ε).
(d) Пусть Η(е) — решение линейного уравнения
е(Ап - A12L)H - Н(А22 + eLA12) + А12 = 0.
Покажите, что преобразование подобия
I-eHL
L
-еН
I
приводит систему к блочной модальной форме
i = Α8(ε)ξ, εη = А/(е)гу,
где собственными значениями матриц As и Af/e являются соответственно
медленные и быстрые собственные значения всей системы с сингулярными
возмущениями.
11.6 . УПРАЖНЕНИЯ
491
(e) Покажите, что быстрая компонента х имеет порядок О (ε).
(f) Предложите альтернативное доказательство теоремы Тихонова для рассмат
риваемого случая.
11.15. Рассмотрим линейную систему с сингулярными возмущениями
х = Ацх +A12z +Bxu(t)y x(0)=ξ,
ez — А21Х + A22Z + B2u(t), 2(0) = 77,
гдеx Gi?n
,zei?m
,иeR
p
, A22 — гурвицева и u(t) равномерно ограничена
для всех t ^ 0. Пусть x(t) — решение редуцированной системы
х=А0х +В0и(г), х(0)=ξ,
гдеА0 =Ап - А12А22А21иВо=Вх -
А^А^В^.
(a) Покажите, что x(t,e) — x{i) = О (ε) на любом компактном интервале [0,£i].
(b) Покажите, что если Ао гурвицева, то x(t,e) — x(t) = О (ε) для всех i ^ 0.
Указание: используйте преобразование системы из предыдущего упражне
ния.
11.16. Рассмотрим систему с сингулярными возмущениями
Х\=Ж2> ^2= —Х2+
z
i £Z=tg_X
(l-Х\-Ζ).
(a) Найдите редуцированную и пограничную модели.
(b) Исследуйте свойства устойчивости пограничной модели.
(c) Пусть х\ (0) = £2(0) = z(0) = 0. Найдите О (ε)-аппроксимацию решения.
Найдите с использованием численных методов точное и приближенное ре
шения на интервале времени [0,10] при ε = 0.1.
(d) Исследуйте вопрос о достоверности аппроксимации на бесконечном интер
вале времени.
(e) Покажите, что система имеет единственную точку равновесия, и исследуйте
ее свойства устойчивости с использованием метода сингулярных возмуще
ний. Является ли эта точка асимптотически устойчивой? Является ли эта
точка глобально асимптотически устойчивой? Является ли эта точка экс
поненциально устойчивой? Вычислите верхнюю границу ε* для значений
константы ε, при которых результаты исследования устойчивости остаются
верными.
11.17. Выполните упражнение 11.16 для системы с сингулярными возмущениями
х = -Hiarl- х
2
-f-z, ez—х- х
2
—
z.
-.-
-
В пункте (с) положите х(0) = z(0) = 1 и в качестве интервала времени возьми
те [0,5].
492
ГЛАВА 11
11.18. Выполните упражнение 11.16 для системы с сингулярными возмущениями
х=xz
3
,
ez=-2х
4/3
-
2z.
В пункте (с) положите х(0) = z(0) = 1 и в качестве интервала времени возьми
те [0,1].
11.19. Выполните упражнение 11.16 для системы с сингулярными возмущениями
х= —х
3
+ tg_1
(z), ez=—х
—
z.
В пункте (с) положите х(0) = —1,^(0) = 2 и в качестве интервала времени
возьмите [0,2].
11.20. Выполните упражнение 11.16 для системы с сингулярными возмущениями
х=-х+z\+Z2+z\Z2, ez\—
—zi, ez2 = -z<i—(x+zi+ xz\).
В пункте (с) положите х(0) = ^i(O) = ^(0) = 1ив качестве интервала времени
возьмите [0,2].
11.21. Рассмотрим электрический двигатель постоянного тока из упражне
ния1.17.Пустьva = Va = constиVf=U =const.
(a) Покажите, что система имеет единственную точку равновесия в
j=U_j
=
С3Уд
д=
C2VaU/Rf
fV
а
c3Ra + clC2U
2
/Ry
c3Ra +
ClC2U2/Ry
Далее (7/,/α,Ω) будет рассматриваться в качестве номинальной рабочей
точки.
(b) В типичном случае постоянная времени для тока в обмотке якоря Та =
= La/Ra существенно меньше постоянной времени цепи поля возбуждения
Tf = Lf/Rf и постоянной времени механической подсистемы. Поэтому
модель системы может быть получена в виде модели с сингулярными воз
мущениями, в которой переменные if и ω являются медленными, а га —
быстрой. Полагая х\ = if/If, x2 = ω/Ω, z = га//а, u = Vf/U, e = Ta/Tf
и используя tf — t/Tf в качестве новой переменной времени, покажите, что
модель с сингулярными возмущениями имеет вид
х\ = —х\ +гх, Х2—CL{X\Z—Х2), ez = —z
—
Ьх\Х2 + с,
где а = LfCz/RfJ, b = C1C2U2/c3RaR?^ с = Va/IaRa и (.) обозначает
производную по t'.
(c) Найдите редуцированную и пограничную модель,
(d) Исследуйте свойства устойчивости пограничной модели.
(e) Найдите О (ε)-аппроксимации для х и z.
11.6. УПРАЖНЕНИЯ
493
(f) Исследуйте вопрос о достоверности аппроксимации на бесконечном интер
вале времени.
(g) С использованием численных методов вычислите при ε = 0.2 и ε = 0.1
точное и приближенное решения при входе и, имеющем вид единичной сту
пенчатой функции, и при нулевых начальных состояниях. В качестве интер
вала времени возьмите [0,10]. Значения констант определяются равенствами
ci=c2 = \/2x 10"
2
Н-м/А,с3=бхЮ
-6
Н-м-с/рад, J = Ю
-6
Н-м-с
2
/рад,
Ra =Rf=lОм,Lf=0.2Гн,Va=1ВиU=0.2В.
11.22 ([105]). Рассмотрим систему с сингулярными возмущениями
х——г){х)+az,
ez=—^
—
z,
где а — положительная константа и η — гладкая нелинейная функция, удовлетво
ряющая
77(0)=0 и Χη(Χ)>0 при х е (-оо,6)-{0}
при некоторой константе Ъ > 0. Исследуйте свойства устойчивости начала коор
динат при малой ε с использованием метода сингулярных возмущений.
11.23 ([105]). Система с сингулярными возмущениями
х=-2х
3
+z
2
,
ez—х
3
-
tgz
имеет изолированную точку равновесия в начале координат.
(a) Покажите, что асимптотическая устойчивость начала координат не может
быть установлена с использованием линеаризации системы.
(b) Покажите с использованием метода сингулярных возмущений, что начало
координат асимптотически устойчиво при ε Ε (0, ε*). Найдите оценку для ε*
и области притяжения.
11.24 ([105]). Пусть условия теоремы 11.3 выполнены с ^i(x) = \\х\\ и гр2{у) —
= ||у||. Предположим также, что V(х) и W(x,y) удовлетворяют
ki\\x\\
2
^V(x)^k2\\x\\
2
,
V (х, у) £ Dx х Dy, где fci, fo, &з, &4 — положительные константы. Покажите, что
утверждения теоремы 11.3, в которых асимптотическая устойчивость заменена
на экспоненциальную устойчивость, выполнены.
11.25 ([191]). Рассмотрим систему с сингулярными возмущениями
* = /(я,2/),
ey = Ay + egi(x,y),
где А — гурвицева и / и д\ — достаточно гладкие функции, обращающиеся в ноль
в начале координат. Предположим, что существует функция Ляпунова V(x), та
кая что в рассматриваемой области выполнено [dV/dx]f(x,0) ^ —а\ф{х), где
494
ГЛАВА 11
QLI > 0 и ф(х) положительно определена. Пусть Ρ — решение уравнения Ляпу
новаРА+А
Т
Р=-I.ПоложимW(y)= y
T
Py.
(a) Предположим, что / и д\ удовлетворяют в рассматриваемой области нера
венствам
Hfli(^O)||2<fci01/2
(a:), А* ^ О,
%\f&v) ~Н*М <M
1/2
(*)llvll2, fc2 > о.
Покажите с использованием функции Ляпунова v(x,y) = (1 — d)V(x) +
+ dW(y), 0 < d < 1, и метода исследования, представленного перед фор
мулировкой теоремы 11.3, что начало координат асимптотически устойчиво
при достаточно малой ε.
(b) В качестве альтернативы формулировки теоремы 11.3 предположим, что /
и #i удовлетворяют в рассматриваемой области неравенствам
Ы*,0)||2 ^ к3ф
а
(х), к3>0,0<а^±,
^[/(х,»)-/(х,О)]<*40Ь(«)||»||2, *4>0, 0<Ь<1, с=Ц^.
Покажите с использованием функции Ляпунова ъ>(х,у) — V(x) + {утРу)1
,
где 7 = 1/2а, что начало координат асимптотически устойчиво при доста
точно малой ε.
Указание: с использованием неравенства Янга
1
V
uw^^и
р
+ μν-
1
νορ-
1
^4
^ 0,гО 0,μ>0,р>1,
покажите, что и < —ci0 - с2|М|2
7
-
Далее покажите, что при достаточно
малой ε коэффициенты с\ и с2 могут быть сделаны положительными.
(c) Приведите пример, в котором условия взаимосвязи для случая (Ь) выполне
ны, а для случая (а) — нет.
11.26 ([99]). Рассмотрим систему с MHoronapaMeipHHecjK^MiLjCHHr3mqpHMft/fi4-^o3-
мущениями
X~J\xi Ζ1·> ·
-
·
»
z
rci)i
m
Zik=mix)+52a*j^·, i=1,...,771,
i=i
где x — вектор размерности η, ^ — скалярные переменные и ε* — малые положи
тельные параметры. Пусть ε = max* ε*. Это уравнение может быть переписано
&^ледующем виде:
x = f(x,z),
sDz = ry(x) + Ах,
11.6. УПРАЖНЕНИЯ
495
где z и η — векторы размерности га, компонентами которых являются соответ
ственно Zi и 7?г, А — (га х т)-матрица с элементами ац и D — диагональная
(га х га)-матрица с диагональными элементами ε*/ε. Диагональные элементы
матрицы D положительны и ограничены единицей. Предположим, что начало
координат редуцированной системы х = /(х, — Α~
1
η(Χ)) асимптотически устой
чиво и существует функция Ляпунова V(x), удовлетворяющая условиям теоре
мы 11.3. Предположим также, что существует диагональная матрица Ρ с поло
жительными элементами, такая что
РА+А
Т
Р= -Q,Q>0.
Используя функцию
i/(s, *) = (!- й)^(х) + φ + А-^аО^РД* + Λ"
1
^*)),0<d<1
в качестве функции Ляпунова, исследуйте свойства устойчивости начала коор
динат. Сформулируйте и докажите теорему для многопараметрического случая,
аналогичную теореме 11.3. Этот результат должен допускать произвольный вы
бор параметров ε*, ограниченный лишь единственным условием, заключающим
ся в том, что они должны быть достаточно малыми.
11.27 ([105]). Система с сингулярными возмущениями
Х\=(а+£2)#1+22, Х2=Ъх\, SZ= —Х\Х2—Ζ,
гдеа > 0иb> 0, имеет множество точек равновесия {х\ =0,z = 0}.Ис
следуйте асимптотическое поведение решения при малой ε, используя принцип
инвариантности Ла-Салля.
Указание: асимптотическое поведение редуцированной модели было иссле
довано в примере 4.10. Используйте композитную функцию Ляпунова и выпол
ните исследование, аналогичное тому, что было выполнено в параграфе 11.5.
Заметим, однако, что теорема 11.3 неприменима к этому случаю.
11.28. Покажите, что начало координат системы
х\= Х2+e~
fz, ±2=-Х2+Zi ez=-(х\ +z)—(х\+zf
глобально экспоненциально устойчиво при достаточно малой ε.
11.29. Рассмотрим систему с сингулярными возмущениями
х= —х+tg_1
z, ez=—х
—
z+и.
(a) Найдите ε*, такую что \/ε < ε* начало координат свободной системы гло
бально асимптотически устойчиво.
(b) Покажите, что для любой ε < ε* система является устойчивой по входу-со
стоянию.
496
ГЛАВА 11
11.30. Рассмотрим систему с обратной связью, изображенную на рисунке 7.1,
в которой линейная подсистема является системой с сингулярными возмущени
ями:
±1=Х2,
±2= -Х\-2X2+Ζ,
SZ= —Ζ+U,
у=2xi+х2,
где φ — гладкая, не зависящая от времени нелинейность без памяти, принадле
жащая сектору [0, к] для некоторой к > 0.
(a) Представьте замкнутую систему в виде системы с сингулярными возмуще
ниями и найдите ее редуцированную и пограничную модели.
(b) Покажите, что для любой к > 0 существует ε* > 0, такая что система
является абсолютно устойчивой для всех 0 < ε < ε*.
ГЛАВА 12
Управление с обратной связью
В последних трех главах этой книги рассматривается задача нахождения
закона управления с обратной связью. Для построения нелинейного закона
управления предлагается несколько подходов, включая метод построения закона
управления с использованием линеаризованной модели, метод нахождения инте
грального закона управления, метод настройки обратной связи,
1
метод линеари
зации системы обратной связью, метод нахождения закона управления в сколь
зящем режиме, метод Ляпунова, метод бэкстеппинга, метод управления на ос
нове пассивности системы и метод построения наблюдателей с сильной обрат
ной связью. Средства нелинейного анализа, предложенные в предыдущих главах,
используются в последующих трех главах для построения различных законов
управления, и это способствует лучшему пониманию рассмотренных теорети
ческих результатов. Настоящая глава начинается с водного для всех трех глав
параграфа, в котором дается постановка задачи управления. В последующих че
тырех параграфах этой главы рассматриваются важные в прикладных задачах
классические средства, такие как метод линеаризации, метод построения инте
грального управления и метод настройки обратной связи. Метод линеаризации
системы обратной связью представлен в главе 13, а другие подходы к задаче
построения нелинейных законов управления рассматриваются в главе 14.
12.1· Задача управления
Существует множество задач, для решения которых требуется построить за
кон управления в виде обратной связи. Цели, преследуемые при разработке за
кона управления, определяют различные формулировки соответствующих задач
управления. Задачи стабилизации, слежения, компенсации и подавления возму
щений (и различные их комбинации) приводят к постановке различных задач
управления. В каждом из этих случаев может быть сформулирована задача по
строения обратной связи по состоянию, когда все эти переменные доступны для
измерения, или же задача построения обратной связи по выходу, когда может из
меряться лишь вектор выхода, размерность которого обычно меньше размерно
сти вектора состояния. В типичной задаче управления ставятся дополнительные
'Методы настройки (планирования) коэффициентов регулятора (gain scheduling) в отечествен
ной литературе называются «настройка регулятора по разомкнутому контуру», в отличие от ме
тодов настройки в замкнутом контуре или самонастройки, относящихся к адаптивному управле
нию. — Прим. ред. перев.
498
ГЛАВА 12
цели управления, например, обеспечение выполнения определенных требова
ний на характер переходных процессов в системе или выполнение некоторых
ограничений на управляющее воздействие. При построении закона управления
эти требования могут оказаться противоречивыми. Для нахождения компромисс
ного решения формулируются различные задачи оптимального управления. Ес
ли модель обладает некоторой неопределенностью, возникают вопросы, связан
ные с чувствительностью системы и ее робастностью. Задача построения закона
управления с обратной связью, обеспечивающего достижение цели управления
для широкого класса неопределенности моделей, формулируется в виде задач ро-
бастного или адаптивного управления. В задаче робастного управления неопре
деленность модели выступает в роли возмущения номинальной модели. Номи
нальная модель может рассматриваться как точка в некотором пространстве, а ее
возмущенные модели представляют собой другие точки, содержащиеся в шаре,
включающем точку номинальной модели. Робастное управление строится таким
образом, чтобы цель управления была выполнена для любой модели из «шара
неопределенности». С другой стороны, при построении адаптивного управления
неопределенность параметризуется в терминах неизвестных параметров и об
ратная связь используется для того, чтобы оценить эти параметры в процессе
функционирования системы (on-line). В более сложной схеме адаптивного управ
ления регулятор может распознавать не неизвестные параметры, а некоторые
нелинейные функции. Существуют также и другие формулировки, допускающие
одновременное достижение робастных и адаптивных целей управления. В этом
параграфе будет приведена формулировка задачи управления, которую мы будем
исследовать в этой и в последующих двух главах. Обсуждение будет ограниче
но основными задачами управления — стабилизация, слежение и компенсация
возмущений. Сначала будет рассмотрена задача стабилизации с использовани
ем обратной связи по состоянию и по выходу. Далее будут рассмотрены задачи
слежения и компенсации возмущений. Некоторые задачи робастного управления
будут рассмотрены в главе 14.
Задача стабилизации с использованием обратной связи по состоянию для
системы
х = f(t,x,u)
заключается в том, чтобы построить закон управления с обратной связью по
состоянию
такой что начало координат х = 0 является равномерно асимптотически устой
чивой точкой равновесия замкнутой системы
x = f{t,x,j{t,x)).
Обратную связь и = j(t, x) обычно называют «статической обратной связью» по
состоянию (static state feedback), поскольку она задается функцией без памяти от
переменных х. Иногда используется динамическая обратная связь по состоянию
12.1. ЗАДАЧА УПРАВЛЕНИЯ
499
(dynamic state feedback)
u = j(t,x,z),
где z — решение динамической системы, входом которой является х, т. е.
z = g(t,x,z).
В качестве примеров систем с динамической обратной связью можно указать
рассмотренную в параграфе 12.3 систему с интегральным управлением и адап
тивную систему управления, исследованную в параграфе 1.2.6.
Задача стабилизации с использованием обратной связи по выходу для систе
мы
x = f(t,x,u),
y = h(t,x,u)
заключается в том, чтобы построить статический закон управления с обратной
связью по выходу (static output feedback)
u = j(t,y)
или динамический закон управления с обратной связью по выходу (dynamic
output feedback)
u = 4(t,y,z),
z = g(t,y,z),
такой что начало координат является равномерно асимптотически устойчивой
точкой равновесия замкнутой системы. В случае динамической обратной связи
стабилизируемым началом координат является точка (х = 0, z = 0). Динамиче
ская обратная связь обычно применяется в схемах управления по выходу, т.к.
в этих случаях отсутствие возможности измерения некоторых переменных состо
яния может быть компенсировано использованием в регуляторе «наблюдателей»
или аналогичных компонентов.
Поскольку задача стабилизации в стандартной постановке предполагает ста
билизацию точки равновесия в начале координат, мы можем использовать пол
ностью аналогичную формулировку для задачи стабилизации системы в произ
вольной точке xss. Для этого нам необходимо установить факт существования
функции входа uss, такой что замкнутая система имеет точку равновесия в xss,
т.е.
0 = f(t,xss,uss), \/t ^ 0.
Замена переменных
Xfi—X 3?ss>^δΖ=ΙΑ
^ss
приводит систему к следующему виду:
Х$=/(t,Xss + Х$,Uss+ Us) = fs(t, X<5,Us),
500
ГЛАВА 12
где fs(ti 0,0) = О для всех t ^ 0. В случае задачи стабилизации по выходу вектор
выхода переопределяется:
ys = y-h(t,xss,uss)
=
= h(t, xss + х«5, uss + us) — h(t, xss, uss) = hs(t, xs, us),
где hs(t, 0,0) Ξ 0 для всех t ^ 0. Таким образом, мы приходим к рассмотрению
стандартной задачи стабилизации для системы
%δ = 1б(1,х5,щ),
уδ = hs(t,xs,us),
где us — обратная связь по переменным xs или ys. Окончательный закон управ
ления и = us 4- uss имеет компонент обратной связи us и компонент прямой
связи uss. Разумеется, задача стабилизации становится существенно проще, если
система является линейной и не зависит от времени:
х=Ах+Ви,
у=Сх+ Du.
В этом случае закон управления с обратной связью и = —Кх сохраняет свойство
линейности системы и начало координат замкнутой системы
х=(А- ВК)х
является асимптотически устойчивым, если и только если матрица А — В К гур-
вицева. Таким образом, задача стабилизации системы статической обратной свя
зью сводится к задаче нахождения матрицы К, такой что собственные значения
матрицы А — ВК расположены в левой полуплоскости комплексной плоско
сти. Линейная теория управления позволяет
2
решить эту задачу и назначить соб
ственным значениям матрицы А — ВК произвольные значения (с единственным
ограничением, заключающимся в том, что комплексные собственные значения
должны образовывать сопряженные пары) при условии, что пара (А, В) являет
ся управляемой. Даже когда некоторые из собственных значений неуправляемы,
стабилизация системы возможна, если эти неуправляемые собственные значения
имеют отрицательные вещественные части. В этом случае пара (А, В) называ
ется стабилизируемой и неуправляемые (для разомкнутой системы) собственные
значения матрицы А являются (для замкнутой системы) собственными значени
ями матрицы А — ВК. Если измерению доступен лишь вектор выходов у, для
стабилизации системы можно применить динамическую компенсацию в виде ре
гулятора с наблюдателем
и= —Кх,
А=Ах+Ви+Н(у-Сх-
Du).
2
См., например, работы [9], [35], [ПО] и [158].
12.1 . ЗАДАЧА УПРАВЛЕНИЯ
501
В этом случае обратная связь имеет вид обратной связи по состоянию с коэф
фициентом усиления К, подобранным таким образом, чтобы матрица А — ВК
была гурвицевой, в то время как коэффициент усиления в наблюдателе Η под
бирается так, чтобы обеспечить гурвицевость матрицы А — НС. Собственными
значениями замкнутой системы являются собственные значения матриц А — В К
и А — НС? Стабилизация А — НС является дуальной задачей по отношению
к стабилизации А — ВК? и для решения этой задачи требуется наблюдаемость
(или по крайней мере различимость (detectability)) пары (Л, С).
В случае нелинейной системы общего вида рассматриваемая задача ста
билизации становится более сложной. С практической точки зрения наиболее
простым подходом для решения этой задачи является использование результа
тов, имеющихся для линейных систем, т.е. использование метода линеариза
ции. В параграфе 12.2 закон управления будет построен посредством линеариза
ции системы в окрестности желаемой точки равновесия в виде обратной связи
для соответствующей линеаризованной системы. Применимость этого подхода
обусловлена первым методом Ляпунова, сформулированным в виде теорем 4.7
и 4.13. Очевидно, что результаты, полученные с использованием этого подхо
да, будут иметь локальный характер, т. е. он гарантирует лишь асимптотическую
устойчивость замкнутой системы, но не позволяет в общем случае определить
область притяжения или обеспечить глобальную асимптотическую устойчивость.
В параграфе 12.5 будет предложен метод настройки обратной связи, позволяю
щий расширить сферу применимости метода линеаризации за счет решения зада
чи стабилизации в различных рабочих точках и последовательного гладкого или
скачкообразного перехода регулятора с одного режима на другой. В главе 13 бу
дет предложен другой метод линеаризации для специального класса нелинейных
систем, которые могут быть преобразованы в линейные системы заменой вход
ных функций и (при необходимости) переменных состояния. После выполнения
этого преобразования можно построить линейную обратную связь для получен
ной линейной системы. Этот метод линеаризации отличается от рассмотренного
выше стандартного метода линеаризации тем, что он является в определенном
смысле точным методом, т.к. при этом нет какой-либо аппроксимации. Одна
ко для получения этого результата необходимо знать точное уравнение состоя
ния системы, т.к. именно это точное знание позволяет исключить нелинейно
сти системы. Поскольку невозможно допустить в общем случае, что эволюция
системы точно описывается рассматриваемым при решении задачи уравнением
состояния, применение этого метода почти всегда приводит к анализу замкну
той системы, являющейся возмущением номинальной системы, начало коорди
нат которой является экспоненциально устойчивой точкой равновесия. Приме
нимость этого метода вытекает из теории Ляпунова для возмущенных систем
(см. главу 9) и, в частности, из робастности свойства экспоненциальной устой
чивости.
3
Этот факт известен как «принцип разделения» (separation principle), т. к. назначение собствен
ных значений для замкнутой системы может быть выполнено по отдельности в задачах нахожде
ния коэффициентов усиления для обратной связи и для наблюдателя.
502
ГЛАВА 12
При стабилизации линейной системы обратной связью начало координат со
ответствующей замкнутой системы является глобально асимптотически устойчи
вым. Этот результат не верен для нелинейных систем общего вида, для которых
могут быть введены различные понятия стабилизации. Если нелинейная система
стабилизируется с использованием метода линеаризации, начало координат за
мкнутой системы становится асимптотически устойчивым. Без дополнительного
анализа системы невозможно определить область притяжения начала координат.
В этом случае мы будем говорить, что закон управления с обратной связью обес
печивает локальную стабилизацию. Если этот закон управления гарантирует, что
существует некоторое множество, принадлежащее области притяжения, или если
имеется оценка области притяжения, то мы будем говорить, что закон управления
обеспечивает стабилизацию в области. Если начало координат замкнутой систе
мы глобально асимптотически устойчиво, мы будем говорить, что закон управле
ния обеспечивает глобальную стабилизацию. Если закон управления не обеспе
чивает глобальной стабилизации, но при этом сколь угодно большое множество
можно включить в область притяжения, мы будем говорить, что закон управ
ления обеспечивает полуглобальную стабилизацию (semiglobal stabilization). Эти
четыре понятия стабилизации иллюстрируются в следующем примере.
Пример 12.1. Предположим, что задача заключается в стабилизации ска
лярной системы
х=х +и
с использованием обратной связи по состоянию. Линеаризация в окрестности
начала координат приводит к линейной системе х = и, которая может быть ста
билизирована обратной связью и = —кх, где к > 0. Если этот закон управления
применить в исходной нелинейной системе, получаем
х= —кх+х
2
.
Линеаризация этого уравнения в окрестности начала координат приводит к урав
нению х = —кх. Таким образом, по теореме 4.7 начало координат является
асимптотически устойчивым, и мы можем сказать, что и = —кх обеспечивает
локальную стабилизацию. В этом примере нетрудно получить область притя
жения: {х < к}. С учетом этого результата мы можем сказать, что и = —кх
обеспечивает стабилизацию в области. Увеличиваяfc,можно расширить область
притяжения. Фактически для любого компактного множества ВТ = {\х\ ^ г} мы
можем обеспечить его вхождение в область притяжения, выбрав к > г. Следо
вательно, и = —кх обеспечивает полуглобальную стабилизацию. Важно отме
тить, что и — —кх не обеспечивает глобальную стабилизацию. Действительно,
для любого конечного коэффициента к существует подмножество пространства
состояний (т. е. х ^ к), которое не содержится в области притяжения. Несмот
ря на то что при полутлобальной стабилизации любое компактное множество
может быть включено в область притяжения, закон управления зависит от это
го множества и может оказаться неработоспособным для большего множества.
Для любого заданного г можно выбрать к > г. При фиксированном коэффици
енте усиления регулятора к решение x(t) может уйти на бесконечность, если
12.1. ЗАДАЧА УПРАВЛЕНИЯ
503
начальное состояние принадлежит множеству {х > к}. Тем не менее глобальная
стабилизация может быть обеспечена с использованием нелинейной обратной
связи
U^— Χ
ΙνΧ)
которая исключает нелинейность разомкнутой системы и приводит замкнутую
линейную систему к виду х = — кх.
Δ
Перейдем к рассмотрению более общей задачи управления — задаче слеже
ния при наличии возмущений. Модель системы имеет вид
х=
f(t,x,u,w),
y = h(t,x,u,w),
ym=
hm(t,x,u,w),
где х — состояние, и — управление, w — возмущение, у — выход системы, по ко
торому осуществляется управление, и ут — измеряемый выход. Задача состоит
в том, чтобы построить закон управления, такой что выход системы у отслежи
вает некоторый заданный сигнал г, т. е.
e(t)=y(t)- r(t)«0, W^0,
где to — момент времени, когда начинается процесс управления. Поскольку на
чальное значение выхода у зависит от начального состояния x(to), для выпол
нения этого требования для всех t ^ to необходимо предопределять либо x(to)9
либо начальное значение командного сигнала, что предполагает знание x(to).
Во многих приложениях это невозможно. Поэтому в качестве цели управления
выступает требование асимптотического слежения по выходу, заключающееся
в том, что ошибка слежения е стремится к нулю при t —• оо, т. е.
e(t)—>0приt—>оо.
Если асимптотическое слежение по выходу обеспечено при наличии возмуще
ний в канале входа, мы будем говорить, что достигнута цель асимптотической
компенсации возмущения. Если внешние сигналы г и w генерируются известной
моделью (например, если эти сигналы имеют постоянные значения или являют
ся синусоидальными колебаниями известной частоты), цели асимптотического
слежения по выходу или асимптотической компенсации возмущения могут быть
достигнуты путем включения этой известной модели в разрабатываемый регу
лятор с обратной связью
4
. Это может быть сделано, даже если модель системы
содержит неизвестные параметры. В специальном случае, когда внешние сиг
налы постоянны и целью управления является обеспечение асимптотического
стремления выхода у к «контрольной точке» г, асимптотическое регулирование
и компенсация возмущений могут быть достигнуты путем включения в регу
лятор «интегрального действия». Этот способ асимптотического регулирования
4
Этот факт известен как «принцип внутренней модели» (internal model principle). (См. [32]).
504
ГЛАВА 12
представляется единственным способом достижения цели в случае, когда в си
стеме имеются параметрические неопределенности, и это объясняет популяр
ность в промышленном применении ПИ- и ПИД-регуляторов (соответствен
но пропорционально-интегральных (ПИ) (proportional-integral) и пропорцио
нально-интегрально-дифференциальных (ПИД) (proportional-integral-derivative)).
Принцип использования интегрального действия никак не связан со свойством
линейности системы. В параграфе 12.3 интегральное управление будет представ
лено для нелинейной системы общего вида. Далее в параграфе 12.4 мы покажем,
как метод линеаризации может быть использован для нахождения стабилизиру
ющего компонента интегрального регулятора. В параграфах 14.1.4 и 14.5.3 гла
вы 14 мы покажем, как ПИ- и ПИД-регуляторы могут быть применены в робаст-
ной системе управления для класса нелинейных систем.
В случае когда возмущение во входном канале представлено функцией вре
мени общего вида w(t), обеспечить выполнение цели асимптотической компен
сации возмущений невозможно. В подобной ситуации можно попытаться обеспе
чить цель подавления возмущений (distubances attenuation), которая эквивалентна
требованию предельной ограниченности ошибки слежения с заданным допуском,
т.е.
||e(t)|| ^s, Vi^T,
где ε — заданная (малая) положительная константа. С другой стороны, мож
но рассмотреть задачу подстройки вход-выходного отображения замкнутой си
стемы, действующего от возмущения в канале управления w к ошибке слеже
ния е. Например, если w является /^-сигналом, то в качестве цели управления
можно рассмотреть минимизацию коэффициента усиления ^2-устойчивого вход-
выходного отображения w i—• е замкнутой системы или, как минимум, обеспе
чение требования, что этот коэффициент будет меньше заданного допустимого
значения
5
.
Законы управления с обратной связью для задач слежения могут быть клас
сифицированы аналогично тому, как это было сделано для задач стабилизации.
Если состояние х измеряемо, то мы говорим о построении обратной связи по
состоянию и в этом случае ут = х; в противном случае мы говорим о построе
нии обратной связи по выходу. Кроме того, в этих случаях обратная связь может
быть статической или динамической. Цель управления может быть сформулиро
вана как локальное, полуглобальное и глобальное слежение или слежение в об
ласти. Новым элементом в этих формулировках является то, что в них говорится
не только о переменных состояния, но и о внешних сигналах г и w. Например,
в типичной задаче локального слежения цель управления достигается при доста
точно малых отклонениях начальных состояний и при достаточно малых внеш
них сигналах, а в задаче глобального слежения цель управления достигается для
любого начального состояния и для любых (r,w), принадлежащих заданному
классу внешних сигналов.
5
Эта формулировка соответствует задаче нахождения Нею -управления. (См., например, рабо
ты [20], [54], [61], [90], [199] и [219].)
12.2 . СТАБИЛИЗАЦИЯ ПОСРЕДСТВОМ ЛИНЕАРИЗАЦИИ
505
12.2. Стабилизация посредством линеаризации
В этом параграфе мы проиллюстрируем процедуру построения закона
управления с использованием метода линеаризации на примере задачи стабили
зации. Сначала будет рассмотрен вопрос построения статической обратной связи
по состоянию, а затем — вопрос построения обратной связи по выходу.
Рассмотрим систему
± = /(*,*),
(12.1)
где /(0,0) = 0 и f(X)U) — непрерывно дифференцируемые функции в обла
стиDxхDuсR
n
xR
p
, содержащей начало координат (х = 0,и = 0). Наша
цель заключается в построении закона управления с обратной связью по состо
янию и — j(x), обеспечивающего стабилизацию системы. Линеаризация (12.1)
в окрестности (х = 0, и — 0) приводит к линейной системе
х=Ах+Вщ
(12.2)
где
df,
v
Тх
М
=0,w=0
OU
1ж=0,и=0
Предположим, что пара (Д В) управляема или по крайней мере стабилизируема.
Найдем матрицу К, такую что желаемые собственные значения матрицы А —
—
ВК расположены в открытой левой полуплоскости комплексной плоскости.
Применим линейную обратную связь по состоянию и = —Кх к нелинейной
системе (12.1). Замкнутая система имеет вид
x = f(x,-Kx).
(12.3)
Очевидно? начало координат является точкой равновесия замкнутой системы.
Линеаризация (12.3) в окрестности начала координат х = 0 приводит к системе
?1(х,-Кх)
+
^{х,-Кх)(-К)
х = (А- ВК)х.
х=0
Поскольку А — ВК гурвицева, из теоремы 4.7 следует, что начало координат яв
ляется асимптотически устойчивой точкой равновесия замкнутой системы (12.3).
В действительности в соответствии с теоремой 4.13 начало координат является
экспоненциально устойчивым. При использовании подхода линеаризации мы мо
жем попутно получить функцию Ляпунова для замкнутой системы. Пусть Q —
положительно определенная симметричная матрица. Решим уравнение Ляпунова
Р(А-ВК)+(А-ВК)ТР = -Q
относительно Р. Поскольку (А — ВК) гурвицева, уравнение Ляпунова имеет
единственное положительно определенное решение (см. теорему 4.6). Квадра
тичная функция V(x) = x
T
Px является функцией Ляпунова для замкнутой си
стемы в окрестности начала координат. Эту функцию можно использовать для
оценки области притяжения.
506
ГЛАВА 12
Пример 12.2. Рассмотрим уравнение маятника
θ -asinθ- Ьв+ сТ,
гдеа=д/1>0,Ъ=к/т ^0,с=1/ml
2
> 0 и 0 —угол между стерж
нем маятника и вертикальной осью, Τ — вращательный момент, приложенный
к маятнику. Пусть этот момент рассматривается в качестве управляющего воз
действия системы, и предположим, что наша цель заключается в стабилизации
положения маятника, соответствующего углу θ = δ. Для того чтобы точкой рав
новесия маятника было положение θ = 5, вращательный момент должен иметь
составляющую Tss, удовлетворяющую равенству
0= —asin<S+ cTss.
Выберем в качестве переменных состояния х\ = θ — δ, Х2 = θ, а в качестве
переменной управления и = Τ — Tss. Тогда уравнение состояния
xi=х2,
Х2= —a[sin(xi +δ)— sinδ]—Ьх^4-си
представлено в стандартной форме (12.1), где /(0,0) = 0. Линеаризация системы
в окрестности начала координат приводит к линейной системе с
0
1
—acos(#i + δ) —b
-1*1=0
0
1
-a
cosδ —b
В
Пара (А, В) управляема. Пусть К = [к\ fo]. Тогда легко показать, что А — В К
гурвицева при
acosδ
7_^
b
С
кл>
к2>
Управляющий момент определяется равенством
τ=αψδ_ΚΧ=αψδ_]61φ_δ)_1β2^
Читателю предлагается (упражнение 12.1) выполнить анализ устойчивости за
мкнутой системы.
Δ
Обратимся к задаче стабилизации системы с помощью обратной связи по
выходу. Модель системы имеет вид
x = f(x,u),
У = Л(ж),
(12.4)
(12.5)
где /(0,0) = 0, h(0) = 0 и /(ж, и), h(x) — непрерывно дифференцируемые функ
циивобластиDx хDu с R
n
xR
p
, содержащей начало координат (х = 0, и = 0).
Наша цель заключается в построении закона управления с обратной связью по
12.2. СТАБИЛИЗАЦИЯ ПОСРЕДСТВОМ ЛИНЕАРИЗАЦИИ
507
выходу (т.е. используя доступный для измерения вектор у), обеспечивающего
стабилизацию системы. Линеаризация (12.4)—(12.5) в окрестности (х = 0,и = 0)
приводит к линейной системе
х=Ах+Вщ
(12.6)
у=Сх,
(12.7)
где А и В определяются равенствами, приведенными после (12.2); вектор С
определяется равенством
с=|м х=0
Предположим, что (А, В) — стабилизируемая пара и (А, С) — различимая пара.
Построим линейный динамический регулятор с обратной связью по выходу
z=Fz+Gy,
(12.8)
u=Lz+My,
(12.9)
такой что матрица замкнутой системы
мп
ηт. Л
(12.10)
А+ВМС BL
GC
F
является гурвицевой. Одним из решений этой задачи является регулятор с на
блюдателем с
z = x, F =A-BK-HC,
G=H,L = -K, Af=0,
где К и Η выбраны так, чтобы матрицы А — ВК и А — НС были гурвицевы-
ми. Нелинейная система (12.4)—(12.5), замкнутая регулятором (12.8)—(12.9), имеет
следующий вид:
х = /(ж, Lz + Mh(x)),
(12-И)
z=Fz +Gh{x).
(12.12)
Легко показать, что начало координат {х — 0, z = 0) является точкой равнове
сия замкнутой системы (12.11)-(12.12) и ее линеаризация в окрестности начала
координат приводит к линейной системе с гурвицевой матрицей (12.10). Таким
образом, мы можем заключить, что начало координат является экспоненциально
устойчивой точкой равновесия замкнутой системы (12.11)-(12.12). Функция Ля
пунова для замкнутой системы может быть получена в виде решения уравнения
Ляпунова для гурвицевой матрицы (12.10).
Пример 12.3. Рассмотрим уравнения маятника из примера 12.2 и предпо
ложим, что измерению доступен угол Θ, но угловая скорость θ не измеряется.
508
ГЛАВА 12
В качестве переменной выхода у можно взять у = х\ — θ
—
δ. Регулятор с обрат
ной связью по состоянию из примера 12.2 может быть реализован с использова
нием наблюдателя
х=Ах+Ви+Н(у—х\).
Положим Η = [h\ h^Y'. Тогда можно показать, что матрица А — НС является
гурвицевой, если
hi+b >0, hib+h2+acos6 >0.
Управляющий момент определяется равенством
Τ= *ψ± _какш
д
12.3. Интегральное управление
В примере 12.2 была рассмотрена задача управления маятником и целью
управления являлось обеспечение постоянного значения δ угла наклона Θ. Све
дем эту задачу к стандартной задаче стабилизации, переместив желаемую точку
равновесия в начало координат. Этот подход применим, если параметры системы
известны, но не может быть использован при наличии параметрических возму
щений. Закон управления
Т=^^
-
^(θ -δ)- k29
включает составляющуюТ88 = (а/с) sin δ, которая соответствует установившему
ся состоянию 0SS угла наклона 0, при желаемом угле δ, а также составляющую
обратной связи — Кх, такой что матрица А — В К гурвицева. Несмотря на то что
вычисление обеих составляющих зависит от параметров системы, составляющая
обратной связи может быть найдена так, чтобы система была робастна по от
ношению к широкому классу параметрических возмущений. В частности, если
нам известна верхняя оценка отношения а/с, скажем если а/с ^ р, можно обес
печить гурвицевость матрицы А — ВК, выбрав коэффициенты fci и &2 с учетом
выполнения неравенств
ki>ρ,k<i >0.
Однако вычисление составляющей Tss может быть чувствительно к параметри
ческим возмущениям. Предположим, что Tss вычисляется с использованием но
минальных значений ао и со величин а и с. Точка равновесия замкнутой системы
определяется равенством
asin#ss = с ^sini - fci(0ss -δ)\.
Если δ = 0 или δ = π (т. е. маятник стабилизируется в одной из точек равновесия
разомкнутой системы), из Tss = 0 и предыдущего равенства следует, что 0SS = δ.
12.3. ИНТЕГРАЛЬНОЕ УПРАВЛЕНИЕ
509
В этом случае используемый в примере 12.2 подход будет робастным по отноше
нию к параметрическим возмущениям. Для других значений δ разность между
углом наклона и желаемым его значением будет слишком большой. Например,
если δ = 45°, с = со/2 (удвоение массы) при а = ао и к\ = Зао/со, будем иметь
θ88 « 36°.
В этом параграфе мы представим метод интегрального управления, кото
рый обеспечивает асимптотическое регулирование системы при наличии в ней
параметрических возмущений с сохранением свойств устойчивости замкнутой
системы. Метод интегрального управления применим не только к линейным си
стемам и не обусловлен применением линеаризации системы для построения
регулятора с обратной связью. Этот подход будет представлен в этом параграфе
для нелинейной системы общего вида, а в следующем параграфе будет показано,
как линеаризация системы может быть использована для построения регулятора
с обратной связью.
Рассмотрим систему
х = /(ж,«,ги),
(12.13)
y = h(x,w),
(12.14)
ym = hm(x,w),
(12.15)
гдехΕRn
—
вектор состояния, и Ε RP — вектор управления, у Ε RP — управ
ляемый выход, ут Ε Rm
—
измеряемый выход и w Ε Rl
—
вектор неизвест
ных постоянных параметров и возмущений. Функции /, h и hm предполагают
ся непрерывно дифференцируемыми по (х,и) и непрерывными по w в области
DxхDuхDwСRn
xR
p
xR
l
.
Пусть г Е Dr С RP — известный постоянный
командный сигнал. Положим
г
w
еDv=DrxDu
Наша цель заключается в построении обратной связи, такой что
y(t)—•г приt—>оо.
Предположим, что у доступен для измерения, т. е у является подмножеством ут.
Цель управления заключается в стабилизации системы к точке равновесия у = г.
Предположим, что для любого υ Ε Dv существует единственная пара (xSs?^ss)>
непрерывно зависящая от ν, удовлетворяющая уравнениям
0 = f(xss,uss,w),
(12.16)
r = h(xss,w)
(12.17)
и такая, что xss — желаемая точка равновесия и uss — компонент управления, со
ответствующий установившемуся режиму в точке равновесия xss. Для введения
в управление компонента интегрального действия рассмотрим ошибку е = у — г,
удовлетворяющую уравнению
σ—е.
510
ГЛАВА 12
Добавим к уравнению состояния (12.13) интегратор:
i = /(a?,u,w),
(12.18)
а = Ь,(х,ь)) -г.
(12.19)
В случае нескалярного управления (р > 1) интегратор представляет собой стек
из ρ интеграторов для каждого элемента вектора е. Легко видеть, что для выпол
нения интегрирования е необходимо в режиме реального времени располагать
значениями у иг. Таким образом, нам необходимо построить закон управления,
обеспечивающий стабилизацию расширенной модели состояния (12.18)—(12.19)
в точке равновесия (XSS?CTSS)> где ass соответствует желаемому uss. На рисун
ке 12.1 показана блок-схема интегрального управления.
Λ
J
/
—σ Стабилизирующий
регулятор
>
и
—»·
гл\>
KJy
Измеряемый
сигнал
У
Рис. 12.1. Интегральное управление
В состав интегрального управления входят два компонента: интегратор
и стабилизирующий регулятор. Интегратор иногда называют внутренней моде
лью, т. к. она дублирует модель, представленную уравнением ν = 0 и генериру
ющую внешний постоянный сигнал v. Структура стабилизирующего регулятора
зависит от характера измеряемого сигнала. Например, в случае обратной связи по
состоянию, т. е. при ут = х, стабилизирующий регулятор принимает следующий
вид:
м = 7(я,а,е),
где 7 выбрана такими образом, что существует единственная σ88, удовлетворяю
щая уравнению
7l^ss>^"ss)UJ= Uss,
и замкнутая система
* = /(я,7(я,σ,h(x, w) - г), w),
σ=h(x,w) —г
имеет асимптотически устойчивую точку равновесия в (xSs>0ss)· В точке равно
весия у = г и это свойство выполнено для любого значения w. Следовательно,
асимптотическое регулирование обеспечивается для всех начальных состояний
в области притяжения точки (#ss, ass).
12.4. ПОСТРОЕНИЕ ИНТЕГРАЛЬНОГО УПРАВЛЕНИЯ
511
Тот факт, что изображенный на рисунке 12.1 регулятор является робаст-
ным по отношению к любым параметрическим возмущениям, не нарушаю
щим свойств устойчивости замкнутой системы, может быть интуитивно обосно
ван следующим образом. Регулятор с обратной связью создает асимптотически
устойчивую точку равновесия. В этой точке все сигналы должны быть постоян
ными. Для того чтобы интегратор σ = е имел постоянный выход σ, его вход е
должен быть нулевым. Таким образом, введение в схему управления интегратора
приводит к тому, что ошибка регулирования становится равной нулю в точке рав
новесия. Параметрические возмущения изменяют точку равновесия, но условие
е = 0 остается выполненным в точке равновесия. Поскольку возмущенная точ
ка равновесия остается асимптотически устойчивой, обеспечивается выполнение
цели управления.
Разработка стабилизирующего регулятора — это нетривиальная задача, по
скольку уравнение замкнутой системы зависит от неизвестного вектора w. В сле
дующем параграфе будет предложен непосредственный метод разрешения этой
дилеммы с использованием линеаризации системы, но этот подход обеспечивает
лишь локальное регулирование. Нелинейное регулирование может быть обес
печено с использованием способов, описанных в главе 14. Пример применения
подобного подхода рассмотрен в параграфе 14.1.4.
12.4. Построение интегрального управления с использованием
линеаризации
В этом параграфе будет разработан интегральный регулятор с обратной свя
зью, после чего будет рассмотрена задача построения обратной связи по выходу.
Наша цель заключается в нахождении закона управления и = 7(ж, σ, е), стабили
зирующего расширенную модель состояния (12.18)—(12.19) в точке (xss,crss), где
^ss = 7(#ss> 0ss?O). Поскольку мы собираемся использовать подход линеариза
ции, разумно рассмотреть линейное управление в виде обратной связи
и=-Кхх
-
Κ2σ - К3е.
(12.20)
Замыкая управлением (12.20) систему (12.18)—(12.19), получаем
х=f(x,
-Кгх
-
Κ2σ - K3(h(x, w) - г), ги),
(12.21)
& = h(x,w) -r.
(12.22)
Точки равновесия (х,а) системы (12.21)—(12.22) удовлетворяют уравнениям
0 = /(ж,й,м),
0=/i(x,w)—г,
й= —К\х —Kip.
С учетом предположения о том, что равновесные уравнения (12.16) и (12.17)
имеют единственное решение (#ss,^ss) в рассматриваемой области, заключаем,
512
ГЛАВА 12
что х = xss и и = uss. Выбрав невырожденную матрицу К^ гарантируем, что
существует единственное решение ass уравнения
uss = — Kixss — K2ass.
Наша цель заключается в стабилизации точки равновесия (xSs,0ss)· Линеариза
ция замкнутой системы (12.21)—(12.22) в окрестности (xss,ass) приводит к ли
нейной системе
ts = (A-BK)b,
где
&
X
#ss
О—Crss
А=
д
-1дх
гл=
(x,u,w)
'АО'
СО,β=
'В'
0,£=
X'
=
^Xss,U
=
Uss
3J—Xss j W—Wss
C=g(x,W)
CC—£Css
Матрицы Л, Б и С в общем случае зависят от v. Предположим, что пара (Л, В)
управляема (соответственно стабилизируема) и
6
rank
АВ
СО
п+р.
(12.23)
Тогда пара (А, В) управляема (соответственно, стабилизируема)
7
.
Найдем не
зависящую от w матрицу /С такую, что матрица А — ВК гурвицева для всех
ν G Dv} Для любой такой матрицы матрица K<z будет невырожденной
9
. Таким
образом, (xSs?0"ss) является экспоненциально устойчивой точкой равновесия за
мкнутой системы (12.21)—(12.22), и все решения, начинающиеся в ее области
притяжения, стремятся к ней при t —> оо. Следовательно, y(t) — г
—>0при
t —> сю. Заметим, что при стабилизации точки (XSSJ'WSS) можно обеспечить ^з =
= 0. Поэтому мы можем положить К% = 0 или же мы можем использовать эту
матрицу по своему усмотрению для улучшения переходных процессов в системе.
6
Из рангового условия (12.23) следует, что линейная модель состояния (А, Б, С) не имеет
передаточных нулей в начале координат.
7
См. упражнение 12.3 .
8
Это соответствует задаче робастной стабилизации, всесторонне исследованной в литерату
ре по линейной теории управления (См., например, работы [48] и [69].) Заметим, что если К
выбрана так, чтобы стабилизировать систему с матрицей А — ВК для некоторых значений но
минальных параметров, то матрица А — ВК останется гурвицевой в некоторой окрестности этих
номинальных параметров вследствие непрерывной зависимости собственных значений матрицы
от ее элементов.
9
Если Къ вырождена, то А — ВК также вырождена, что противоречит тому, что А — ВК гур
вицева.
12.4. ПОСТРОЕНИЕ ИНТЕГРАЛЬНОГО УПРАВЛЕНИЯ
513
Суммируя все вышесказанное, можно заключить, что если пара (А, В) ста
билизируема и выполнено ранговое условие (12.23), то управление с обратной
связью по состоянию может быть выбрано в виде:
и=—К\х
—
КЪ<У,
σ=е=у—г,
где матрица /С = [К\ К^ такова, что А — ВК является гурвицевой матрицей.
Пример 12.4. Рассмотрим уравнение маятника
0 = -asin0-60 + cT,
гдеа—д/1>О,Ь=к/т ^0,с=1/ml
2
> О, 0 — угол между стержнем
маятника и вертикальной осью и Τ — вращательный момент, приложенный к ма
ятнику. Пусть Τ рассматривается как управляющее воздействие, и предположим,
что мы хотим обеспечить стабилизацию 0 в точке δ. Положив х\ = θ — 5, Х2 =
= 0, и = Т и у = х\у запишем уравнение состояния:
XI=Ж2,
±2= —asm(xi +δ)—bx2+ си,
Легко показать, что желаемая точка равновесия определяется равенством
О
О
3?ss —
US{
': sin δ.
Матрицы А, В и С имеют вид
А=
0
—acosδ
1
-6
;в=
0
с
;С=[ 1о].
Поскольку с > 0, можно показать, что пара (А, В) управляема и ранговое усло
вие (12.23) выполнено. Полагая К\ = [k\ fe] и К2 = кз и используя критерий
Рауса-Гурвица, заключаем, что матрица А — ВК является гурвицевой, если
Ь+&2С>0, (b+k2c)(acosδ+ kic) —кзс> 0 и к$с>0.
Предположим, что нам не известны точные значения параметров а > 0, 6^0,
с > 0, но известны верхние оценки р\ и р2 для отношений а/с и 1/с соответ
ственно. Тогда выбор
&2>0, &3>0И *1>Р1+7ГР2
«2
(12.24)
обеспечивает гурвицевость матрицы Л — Н/С. Закон управления с обратной свя
зью определяется равенством
и = —к\{в —δ)—&2#—кза,
σ= θ-δ
514
ГЛАВА 12
и имеет вид классического ПИД-регулятора. Сравнивая этот закон управления
с законом управления, полученным в примере 12.2, видим, что в рассматривае
мом здесь случае нам не нужно вычислять момент для установившегося режима,
необходимый для фиксации системы в равновесном положении. Цель управления
достигается для всех параметрических возмущений, удовлетворяющих неравен
ству (Ь + /с2с)(а cos δ + к\с) — k%c > 0. Ha рисунке 12.2 представлены результаты
компьютерного моделирования управления маятником при δ = π/4 при введении
в схему управления интегрального действия (см. пример 12.4) и без применения
этого интегрального действия (см. пример 12.2). В первом случае выбранным
коэффициентам усиления обратной связи к\ = 8, &2 = 2 и кз = 10 соответству
ют собственные значения —15.93, —2.93 и —2.14. Во втором случае выбранным
коэффициентам усиления обратной связи к\ =3, &2 = 0.7 соответствуют соб
ственные значения —4 ± J4.59. В обоих случаях в качестве номинальных пара
метров взяты а = с = 10 и 6 = 1. В случае наличия возмущений в качестве
значений Ьи с взяты 0.5 и 5, что соответствует удвоению массы. Из этих резуль
татов моделирования видно, что при введении в схему управления интегрального
действия имеет место улучшение характеристик установившегося режима, но это
достигается за счет увеличения длительности переходного процесса и значений
управляющего момента в этот период.
Δ
/ Без интегрального
/
действия
1^
2
Время
-|
1
г
-
С интегральным
действием
(D
о
2
«
н
ы
μ0
54>
вев
Λ
PQ
1
2
3
Время
Рис. 12.2. Результаты компьютерного моделирования процесса управления маятником
при номинальных (непрерывная линия) и возмущенных (пунктирная линия) параметрах,
при введении в схему управления интегрального действия (пример 12.4) и без такового
(пример 12.2)
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ связи
515
В задаче нахождения обратной связи по выходу интегральный регулятор
имеет вид
σ=е=у—г,
z=Fz+G\a4-G2ym,
u=Lz+Mia+M2ym+M3e,
где JF, GI, G2I I/, Mi, M2 и Мз не зависят от ги и такие, что матрица
(12.25)
(12.26)
(12.27)
Ас=
А+ВМ2Ст +ВМгС ВМХ BL
С
00
G2Cm
G\F
является гурвицевой для всех υ G Dv; Cm
чивается невырожденность матрицы
[dhm/dx](xss,w). При этом обеспе-
пяин
Mi
Gi
L'
F
fss
^-ss
Mi
Gi
L
F
M2hm(xss,w)
G2hm(xss,w)
имеет единственное решение (σ88, zss). Таким образом, (х88, σ88, zss) — единствен
ная точка равновесия замкнутой системы, в которой и = uss и е = 0. Можно по
казать, что матрица Лс является матрицей линеаризованной замкнутой системы
в окрестности (xss, σ88, zss). Следовательно, указанная точка равновесия является
экспоненциально устойчивой, и все решения, начинающиеся в ее области притя
жения, стремятся к ней при t —• 00. Следовательно, y{t) — г
—»0приt—>00.
12.5. Метод настройки обратной связи
Основным ограничением метода построения закона управления с исполь
зованием линеаризации системы является то, что построенный закон управле
ния применим лишь в некоторой окрестности рабочей точки (точки равновесия).
В этом параграфе мы представим метод настройки обратной связи, позволяю
щий расширить применимость метода линеаризации на случай нескольких рабо
чих точек. Во многих ситуациях известно, как изменяется динамика системы при
смене рабочих точек. Более того, иногда оказывается возможным построить мо
дель системы, в которой рабочие точки параметризуются одной или несколькими
переменными, которые мы будем называть настроечными переменными. В этих
случаях мы можем выполнить линеаризацию системы в окрестностях нескольких
точек равновесия, построить законы управления в каждой из этих окрестностей
516
ГЛАВА 12
и реализовать полученное семейство линейных законов управления в виде едино
го регулятора, параметры которого изменяются в ходе мониторинга настроечных
переменных. Подобный регулятор называется регулятором с настраиваемой об
ратной связью.
Концепция настройки обратной связи была изначально предложена при раз
работке систем управления полетом
10
.
Нелинейные уравнения движения само
лета или ракеты линеаризовывались в окрестности выбранных рабочих точек,
соответствующих различным эксплуатационным режимам полета. Далее строи
лись линейные регуляторы, которые обеспечивали требуемые свойства устойчи
вости и желаемые эксплуатационные характеристики линеаризованных систем
в окрестности выбранных рабочих точек. Затем параметры регуляторов интер
полировались функциями от настроечных переменных. В качестве этих пере
менных обычно выступали динамическое давление, число Маха, высота полета
и угол атаки. Наконец, построенный регулятор с настраиваемой обратной свя
зью применялся в исходной нелинейной системе. Рассмотрим простой пример,
иллюстрирующий идею настройки обратной связи.
Пример 12.5. Рассмотрим систему резервуаров из упражнения 1.19, в ко
торой площадь поперечного сечения А изменяется при изменении уровня жид
кости. Модель этой системы может быть представлена уравнением
jt(/ A(y)dy )=Wi- ky/pgh,
где h — высота уровня жидкости в резервуаре, wi — скорость потока поступаю
щей жидкости, ρ — плотность жидкости, д — ускорение свободного падения и к —
некоторая положительная константа. Рассматривая х = h в качестве переменной
состояния и и = Wi в качестве управления системы, получаем модель состояния
~-
{и-су/х) = /(ж, и),
А(х)
где постоянная с — ку/рд будет рассматриваться в качестве неизвестного па
раметра. Предположим, что нам необходимо построить регулятор, такой что х
отслеживает некоторый командный сигнал г. Пусть у = х — управляемый вы
ход и г — настроечная переменная. При г — а (некоторая положительная кон
станта) управление должно обеспечивать стремление выхода у к а. С учетом
наличия в системе параметрической неопределенности с разумно использовать
интегральное управление. Уравнения равновесия (12.16) и (12.17) принимают
в рассматриваемой ситуации вид
U — 1i>ss
C\/#ss,
OL = X$s·
10
В работе [159] приведен обзор метода настройки обратной связи и его приложений в области
систем управления полетом и автомобильными двигателями.
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ связи
517
Следовательно, xss = а и uss = Су/а. Дополняя уравнение состояния интеграто
ромσ=е=у—г,получаем
х=
f(x,u),
σ=х—г.
Используем ПИ-регулятор
и = —к\(а)е — к2(а)а
для стабилизации расширенного уравнения состояния в точке (xss, σ88), где <TSS =
=
—
^ss/^2(^) при условии, что к2 Φ О· Замкнутая система имеет вид
х = /(ж, -ki(a)(x
-
г) - к2(а)а),
σ=х—г.
При г = а система имеет точку равновесия в (ж88, σ88). Линеаризация замкнутой
системы в окрестности (ж, σ) = (ж88, σ88) и г = α приводит к линейной системе
£*=
а(а) — b(a)ki (а) —6(α)&2(α)
1
О
ξδ+
Ь(а)к\(а)
-1
rs,
Уд = я<5,
где&=[xsσδ]Τ, xs =х-&,σδ=σ-σ88,r$=г
1(-с\
А'{х)
•OLb
α{α)
= Tx х=а,и=Су/а
Су/а
A(x) \2y/x-J
A2(x)
(и — Су/х)
J x=a,u=Cy/a
2аА(а)
*»>-£ s=atu=cy/a
А(а)
В предположении, что нам известна верхняя оценка величины с, выберем к\ и к2:
ki(a) Κωη к2(а) = ωΖ
Ь(аУ
где0<С<1
и
2ξωη > |a(oi)|. Этот выбор обусловлен тем, что при этом
собственные значения замкнутой системы (приблизительно) равны корням урав
нения
s
2
+2ξωη8+ω\=0.
Таким образом, линеаризация замкнутой системы, полученной применением ре
гулятора с обратной связью при фиксированной г, приводит к линейной системе
£δ = Af(a)£s + Bfr5,
уδ = С/&,
518
ГЛАВА 12
где
Мое) =
а(а) - 2ξωη -ω
2
η
1
О
Bf=
-1
и C/=[l 0].
Передаточная функция замкнутой системы от входа г$ к выходу ys имеет вид
2(u;ns + ω
2
η
s
2
+ [2ξωη - a(a)]s + ω*'
Перейдем от рассмотрения гипотетической ситуации, когда предполагалось,
что г является константой, к случаю зависящей от времени г. ПИ-регулятор с на
страиваемой обратной связью имеет вид
и = —к\(г)е — к2(г)а,
σ—е=х —г,
где α заменена на г и, следовательно, коэффициенты усиления к\ и k<i изменя
ются вместе с г. Нелинейная система, замкнутая регулятором с настраиваемой
обратной связью, принимает следующий вид:
х = /(ж, — ki(r)(x — г) — к2(г)а).
σ=х—г.
При г = а система имеет точку равновесия в (#ss,ass). Из этого следует, что
нелинейная система, замкнутая регулятором с настраиваемой обратной связью,
стабилизируется в желаемой рабочей точке при любой а. Линеаризация в окрест
ности (ж, σ) = (xss, σ88) и г = а приводит к линейной системе
ξδ = Α3{α)ξδ + Bs(a)rs,
ys = 08ξδ,
где
As(a) = α(α) - 2ξωη -ω\ Λ
1
0
,
Β8{α) =
2ξωη + 7(α)
-1
c8=[i ο ]
и j(a) = —b(a)k'2(a)ass(a) = Af(a)c^/a/A2(a). Передаточная функция замкну
той системы от входа г$ к выходу ys имеет вид
[2ξωη + 4(α)]8 + ω*
2'
s
2
+ [2ξωη - a(a)]s + и%
Отметим различия между двумя линейными моделями (Л/, J5/, С/) и (А3,Вв,
Cs).
Первая модель представляет собой линеаризацию замкнутой системы для ре
гулятора с фиксированной обратной связью, а вторая модель — линеаризацию
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ связи
519
замкнутой системы для регулятора с настраиваемой обратной связью. В обо
их случаях линеаризация выполняется в окрестности желаемой рабочей точки.
Ситуация была бы идеальной, если бы эти две модели были эквиваленты, т. к.
в этом случае мы были бы уверены в том, что локальное поведение замкнутой
системы вблизи желаемой рабочей точки соответствовало бы поведению, пред
сказанному нашей моделью управления. Сравнивая две модели, можно заметить,
что As = Af и Cs = Cf, но Bs φ Bf, что приводит к различным расположениям
нулей передаточных функций соответствующих замкнутых систем. За исключе
нием этого различия, две передаточные функции имеют одни и те же полюса,
а также нулевые установившиеся ошибки при ступенчатых входах. Если выпол
нение этих характеристик является единственной целью управления, мы можем
принять построенный регулятор с настраиваемой обратной связью как приемле
мый. С другой стороны, если требуется обеспечить какие-либо другие характери
стики (например, соблюдение специальных условий при переходных процессах
между переключениями режимов управления), зависящие от расположения ну
лей передаточной функции, то необходимо исследовать эффект смещения нулей
с помощью анализа соответствующей линейной системы или с использованием
компьютерного моделирования модели (As, BS,CS) (или обеих моделей). Альтер
нативным подходом является модификация регулятора с настраиваемой обратной
связью, которая осуществляется с целью получения линейной модели, которая
была бы эквивалентна (Af, Bf,Cf) для любой а. Это может быть сделано путем
замены регулятора с настраиваемой обратной связью
11
на следующий:
и = —ki(r)e + 77, η = —k2(r)e.
При постоянном коэффициенте усиления &2 эта модификация может быть интер
претирована как коммутирование коэффициента усиления — к^ с интегратором.
(См. рисунок 12.3.) Нелинейная система, замкнутая модифицированным регуля-
-Ф)
-Ш
Исходный
<±>^
-К(г)
-*»(»·)
/R±>^
Модифицированный
Рис. 12.3. Модификация ПИ-регулятора с настраиваемой обратной связью из приме
ра 12.5
тором с настраиваемой обратной связью, имеет вид
х = /(#, -h(r)(x
-
г) + г/),
η = —k2(r)(x — г).
11
Эта модификация называется алгоритмом скоростей (velocity algorithm) и была предложена
в [96]. Другая подобная модификация рассмотрена в работе [114].
520
ГЛАВА 12
При г = а система имеет точку равновесия в х = xss и η = uss. Линеаризация
в окрестности (ж, г;) = (xss, uss) и г = а приводит к линейной системе
Ч Ams(a)zs + Bms(a)rs,
y5 = Cmszs,
где
Ams(a)
а(а) — 2ξωη
-шЦНа)
Ь(а)
0
Bms(a)
"IK*)
Cms={10]
иz$=[х<5%]т
, % = η —uss- Производная к'2 не присутствует в этой модели, т.к.
к% умножается на е, равную нулю в точке равновесия. Легко видеть, что модели
(Af,Bf,Cf) и (Ams,Bms,Cms)
эквивалентны и соответствующее преобразова
ние подобия задается равенством
&=
о
-b(a)/ul
Ζδ.
Следовательно, обе модели имеют одну и ту же передаточную функцию от г$
ку5.
Δ
С учетом результатов этого примера можно предложить процедуру постро
ения стабилизирующего регулятора с настраиваемой обратной связью. Эта про
цедура состоит из следующих шагов:
1) Линеаризация нелинейной модели в окрестности семейства рабочих точек
(точек равновесия), параметризованных настроечными переменными.
2) С использованием линеаризованных систем находится параметризованное
семейство линейных стабилизирующих регуляторов, обеспечивающих же
лаемые характеристики поведения системы в каждой из рабочих точек.
3) Построение регулятора с настраиваемой обратной связью, такого что
• для каждого постоянного значения внешнего входного сигнала замкну
тая регулятором с настраиваемой обратной связью система имеет ту же
точку равновесия, что и система, замкнутая регулятором с фиксирован
ной обратной связью;
• линеаризация системы, замкнутой регулятором с настраиваемой обрат
ной связью, эквивалентна линеаризации системы, замкнутой регулято
ром с фиксированной обратной связью.
4) Проверка достижения цели управления при нелокальном применении регу
лятора с настраиваемой обратной связью путем моделирования замкнутой
нелинейной модели.
Второй шаг может быть выполнен путем нахождения соответствующих за
конов управления для семейства линейных моделей, непрерывно зависящих от
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ связи
521
настроечных переменных (аналогично тому, как было сделано в предыдущем
примере), или путем решения этой задачи лишь для конечного числа рабочих
точек с использованием регулятора, имеющего для каждой из этих точек анало
гичную структуру, но с учетом возможности изменения параметров регулятора
при переключении системы управления с одной рабочей точки на другую. После
этого параметры регулятора интерполируются в промежуточных рабочих точках,
что приводит к получению параметризованного семейства линейных регулято
ров. Этот интерполяционный процесс в каждом конкретном случае специфичен
по своей природе и связан с физикой рассматриваемой системы
12
. В дальнейшем
мы ограничимся рассмотрением случая, когда задача построения стабилизирую
щего регулятора для семейства линейных моделей уже решена и эти модели
непрерывно зависят от настроечных переменных.
Рассмотрим систему
x = f(x,u,v,w),
(12.28)
y = h(x,w),
(12.29)
Ут = hm(x,w),
(12.30)
где /, h и hm — дважды непрерывно дифференцируемые функции от (х, и, ν)
инепрерывныепоwвобластиDx xDuxDvxDwсR
n
xRPxR
q
xR
l
;x—
вектор состояния, и — вектор управления, υ — измеряемый внешний сигнал, w —
вектор неизвестных постоянных параметров и возмущений, у Ε Rp
—
управляе
мыйвыходиутΕRm
—
измеряемый выход. Предположим, что у может быть
измерен, т. е. у является подмножеством ут. Пусть г Ε Dr С RP — командный
сигнал. Необходимо разработать регулятор с обратной связью по выходу, кото
рый обеспечивает малую ошибку слежения е = у — г при внешнем входном
сигнале
Гг
P=
[v
Для обеспечения в установившемся режиме нулевой ошибки при ρ = а (неко
торый постоянный вектор) используем интегральное управление и применим ре
гулятор с настраиваемой обратной связью для обеспечения малой ошибки от
слеживания медленно меняющегося вектора р. Разобьем вектор а следующим
образом: а = [aJT, о%]Т
, где аг и av — постоянные значения для г и υ соответ
ственно. Вектор ρ будет рассматриваться как вектор настроечных переменных
13
.
При разработке интегрального управления мы будем предполагать, что суще
ствует единственная пара (xSs?^ss) · Dp
x
Dw —> Dx x DU9 элементы которой
непрерывно дифференцируемы по α и непрерывны по го и такая, что
0 = f(xS8(a,w),uaa(a,w),av,w),
(12.31)
ar = /i(xss(a, w),w)
(12.32)
12
Более подробное обсуждение этого интерполяционного процесса приведено в работе [159].
13
В литературе, посвященной методу настройки обратной связи, рассмотрен также случай, когда
настроечная переменная может зависеть от измеряемого выхода уш. (См., например, [159].)
еД
def
DrxDv
522
ГЛАВА 12
для всех (а,гу) G Dp х Ζ>^. При ρ — а можно аналогично тому, как это было
сделано в предыдущем параграфе, выполнить линеаризацию и построить инте
гральный регулятор вида
σ=е=у—г,
z = F(a)z + Gi(a)a + G2(a)ym,
и = L(a)z + Mi(a)a + M2(a)ym + M3(a)e,
(12.33)
(12.34)
(12.35)
где коэффициенты усиления регулятора F, Gi, G2, I/, Mi, M2 и Мз являют
ся непрерывно дифференцируемыми функциями от а, выбранными так, чтобы
матрица
ГА+ВМ2Ст +£M3G ВМг BL
Ас(а, w)=\
С
0
0
L
G2Cm
G\
F
была гурвицевой для всех (а,ги) £ Dp x Dw. В этой матрице
а/
5х'
Бв/
ди
Сdh
дх
^т—
дх
где все матрицы Якоби вычислены в точке (х, и, v) = (xss, uss, αυ). Β рассматри
ваемом в этом параграфе случае новым аспектом является то, что коэффициенты
усиления регулятора могут зависеть от а (т. е. от фиксированного значения на
строечной переменной р). В случае построения обратной связи по состоянию
можно опустить z и уравнение состояния для этой переменной (12.34) и поло
житьут =х,L =0,Mi= -К2, М2= -KiиМ3=0,гдеК=[К\К2]
такова, что матрица
А-ΒΚλ
- ΒΚ2
С
0
является гурвицевой для всех (a, w) Ε Dp x Dw.
Замкнутая регулятором с фиксированной обратной связью система (12.33)-
(12.35) имеет вид
х=/(х,Lz+Mia+M2hm(x, w)+M3e,υ,w),
(12.36)
<j=e=h(x,w) -г,
(12.37)
z = Fz 4-Gia + G2hm(x, w),
(12.38)
y = h(x,w).
(12.39)
При ρ — а, система имеет точку равновесия (xSS) Assess)? в которой е = 0. Ли
неаризация в окрестности (х, σ, z) = (xss, ass, zss) и ρ = α приводит к линейной
системе
is = Af{a,w^5
+ Bf(a,w)ps,
ys = С/(а,ги)&,
(12.40)
(12.41)
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ связи
523
где
&=
X
Xss
σ—ass
Af=Лс,
Bf=
Ρδ = p-Oi--
-BMS Ε
-I
0
0
0
ys=y- ar,
Cf=[C
0 0],
E=
-?r-{x,u,v,w)
x=xss ,u=uss ,v=av
Следовательно, при ρ = а точка равновесия (xss, ass, zss) экспоненциально устой
чива.
Регулятор с настраиваемой обратной связью может быть получен на осно
ве регулятора с фиксированной обратной связью (12.33)—(12.35), если в качестве
коэффициентов усиления F, Gi, G2 L, Mi, M2 и Мз выбрать функции от на
строечной переменной р, т. е. путем замены а на р. Можно показать, что система,
замкнутая таким регулятором, будет иметь желаемую точку равновесия и ее ли
неаризация приведет к линейной системе (As(a,w),Bs(a,w)1Cs(a,w))
сAs =
= Af = Ac Cs = G/, однако в общем случае Bs ^ Bf, что обусловлено выпол
нением частного дифференцирования указанных коэффициентов усиления по р.
Поскольку матрица Ac(a,w) является гурвицевой для всех (a,w) Ε Dp x DW9
применение регулятора с настраиваемой обратной связью приведет к образова
нию экспоненциально устойчивой точки равновесия, в которой установившаяся
ошибка слежения будет равна нулю при ρ = а. Однако следует иметь в ви
ду, что передаточная функция замкнутой системы от р$ к ys может отличаться
от соответствующей передаточной функции модели, на основе которой строится
закон управления. Поэтому следует проверять локальную применимость регу
лятора с настраиваемой обратной связью путем дополнительного анализа или
с использованием компьютерного моделирования. Если этот регулятор оказыва
ется приемлемым, можно продолжить выполнение процедуры построения регу
лятора с настраиваемой обратной связью. Следует отметить, однако, что мож
но добиться большего. Подобно тому как это было сделано в примере 12.5,
можно модифицировать регулятор с настраиваемой обратной связью так, чтобы
обеспечить эквивалентность линеаризованных замкнутых систем для регулято
ра с фиксированной обратной связью и для регулятора с настраиваемой обрат
ной связью. В упомянутом примере мы выполнили коммутирование обратной
связи &2 с интегратором, т. е. интегратор был перемещен из входного канала ре
гулятора в его выходной канал. Поэтому оба коэффициента усиления к\ и &2
умножались на ошибку е, равную нулю в установившемся режиме. В рассмат
риваемой здесь ситуации следует выполнить аналогичную операцию для регу
лятора (12.33)—(12.35), однако в этом случае имеется дополнительная сложность,
связанная с наличием динамического уравнения (12.34), в котором аиут играют
роль входов. Вектор σ представляет собой выход интегратора, и, следовательно,
524
ГЛАВА 12
имеет смысл рассмотреть вопрос о перемещении интегратора в выходной канал
регулятора, однако ут не является выходом интегратора. Эта проблема может
быть решена, если имеется возможность измерять ут, производную ут. В этом
случае регулятор (12.33)—(12.35) можно представить в следующем виде:
Х= ф,
г = F(a)z + G(a)X,
и = L{a)z + Μ(α)λ + М3(а)е,
где
ф=
е
Ут
G=[d G2]
и М=[MiM2].
Передаточная функция от φ к и — М${а)е
{L{a)[sI-F{a)}-
l
G{cx)
+ M{a)}\
эквивалентна
\{L{a)[sI-F{a)TlG{a)
+ M{a)}.
Следовательно, регулятор может быть реализован следующей системой:
φ = F{a)ip + G{a)ip,
η = L(a)cp -f M(a)V>,
и —η+Мз(а)е.
На рисунке 12.4 показаны исходная и модифицированная реализации регулято
ра с фиксированной обратной связью. Если в качестве коэффициентов усиления
F, G, L, Μ и Ms в модифицированной реализации взять функции от настроеч
ной переменной р, получим регулятор с настраиваемой обратной связью:
φ = F(p)<p + Gi(p)e + G2(p)ym,
η = L{p)<p + Мг(р)е + M2(p)ym,
u=η+Мз(р)е.
(12.42)
(12.43)
(12.44)
Применив этот регулятор в нелинейной системе (12.28)—(12.30), получаем за
мкнутую систему
X = g(X,p,w),
y = h(x,w),
(12.45)
(12.46)
где
X
х
Ψ
LV
g(X,p,w)
/(x77 + M3(p)e,t;,w)
F(p)p + Gi(p)e + G2(p)yi
L(p)tp + Mi(p)e + M2(p)y,
"m
]
m
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ связи
525
@—
и
Исходный регулятор
ν tr^
e
г\
Ут
Η5
*-
JΜ
\ш
з
L{sI-F)-
l
G+M
1s\
^
(+)—
и
Модифицированный регулятор
Рис. 12.4. Модификация регулятора с настраиваемой обратной связью
dhm.
е=h(x,w)-г,
уп
дх
•(х, w)f(x, η + М3(р)е, υ, w).
При ρ = а система (12.45)-( 12.46) имеет единственную точку равновесия
Xss(a,w) =
xss(a,w)
О
Uss(a,w) J
(12.47)
в которой у = аг. Линеаризация (12.45)-( 12.46) в окрестности X — Xss и ρ = а
приводит к линейной системе
14
Χδ = Am8(a9w)Xs +
Bms(a,w)ps,
Уδ = Cms(a)w)Xs,
(12.48)
(12.49)
где
/Χξ—Л,
^ss} **-ms —
А+ВМ3С
О
В
G1C + G2Cm(A + BM3C) F G2CmB
МХС + М2Ст(А + ВМ3С) L М2СтВ J
14
При вычислении матриц Ams и Bms следует иметь в виду, что частные производные в коэф
фициентах при φ, е и / обращаются в нуль в рабочей точке.
526
ГЛАВА 12
CmS= [С ОО].
-В М3
Ε
BmS=I —G\
—
G2CmBM3
G2CmE
-M1-M2CmBM3
M2CmE
Читателю предлагается в качестве упражнения (см. упражнение 12.6) проверить
невырожденность матрицы
Р=
I
G2Cm
м2ст
о
Mi
О
F
L
и выполнение равенств
•*
A-ms*
—
A-i
Ρ Bms—Вf
CmsP — Cf.
(12.50)
(12.51)
Следовательно, линейная модель (12.48)-(12.49) эквивалентна линейной моде
ли (12.40)-(12.41).
До этого момента исследование замкнутой системы для регулятора с на
страиваемой обратной связью касалось лишь локального поведения системы
в окрестности постоянной рабочей точки. Можно ли получить какие-либо ре
зультаты, касающиеся нелинейной системы? Что изменится, если настроечная
переменная не является постоянной? В практических применениях оказывается
возможным настройка зависящих от времени переменных при условии, что их
изменение происходит достаточно медленно по сравнению с динамикой системы.
Этот факт может быть обоснован следующей теоремой.
Теорема 12.1. Рассмотрим замкнутую систему (12.45)-(12.46) β условиях
принятых предположений. Предположим, что p(t) непрерывно дифференцируе
мая функция, p(t) £ S (некоторое компактное подмноэюество Dp) и \\p(t)\\ < μ
для всех t ^ 0. Тогда существуют полоэюительные константы fci, k2, k и Τ
такие, что если μ <k\u ||Af(0) — Xss(p(Q),w)\\ < k2, то X(t) будет равномерно
ограничено для всех £ > 0 и
\\e(t)\\ ^kμ,
Vt^T.
Более того, еслиp(t)—» pss иp(t) —>0приt —• оо,то
e(t) —>0приt —> оо.
ДОКАЗАТЕЛЬСТВО. СМ приложение С. 19.
Π
Из этой теоремы следует, что если настроечная переменная является медлен
но меняющейся и начальное состояние достаточно близко в начальный момент
времени к точке равновесия, то ошибка слежения будет иметь в асимптотике по
рядок производной настроечной переменной и будет стремиться к нулю, если
настроечная переменная стремится к постоянному пределу.
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ СВЯЗИ
527
Если ут недоступна для измерения, можно использовать регулятор с настра
иваемой обратной связью
φ = F(p)<p + Gx (p)e + G2(p)0>
(12-52)
η = Σ,(ρ)φ + Μ1(ρ)β + Μ2(ρ)υ,
(12.53)
и=η+М3(р)е,
(12.54)
где ут заменена на ее оценку β, получаемую на выходе фильтра
еС= -С+Ут,
(12-55)
0=|(-С+Ут),
(12-56)
где ε — «достаточно малая» положительная константа. Предполагается, что на
чальным значением этого фильтра всегда является £(0), такое что
НС(0)-No»(0)||<*е
(12.57)
для некоторой к > 0. Поскольку ут доступно для измерения, выполнение этого
условия всегда можно обеспечить. Более того, если эволюция системы начина
ется в точке равновесия, условие (12.57) автоматически выполнено, т.к. в точке
равновесия ут = £. Фильтр (12.55)—(12.56) действует как устройство аппрокси
мации производной (аппроксиматор производной) при условии, что ε достаточно
мала. Это утверждение следует из того, что передаточная функция
65+1
аппроксимирует передаточную функцию дифференцирующего устройства si,
функционирующего при частотах существенно меньших, чем l/ε.
15
Система,
замкнутая регулятором с настраиваемой обратной связью (12.52)—(12.56), прини
мает вид системы с сингулярными возмущениями
X=д(Х,р,w)+N(p)(# - ут),
y = h(x,w),
(12.58)
(12.59)
(12.60)
где
dh
Ут = -Q^T(X
>
w
)f(x
>V+M3(p)e,v,w), N =
0
G2
M2
15
Аппроксимация производной ут может быть выполнена с использованием наблюдателя
с сильной обратной связью, рассмотренного в параграфе 14.5. В действительности фильтр (12.55)—
(12.56) представляет собой наблюдатель пониженного порядка с сильной обратной связью для
системы второго порядка, выходом которой является ут. Условие (12.57) устраняет возникнове
ние резких скачков в переходном процессе. Если это условие не может быть обеспечено, для
предотвращения возникновения подобных скачков оценка # должна искусственно ограничиваться
функцией насыщения так, как было предложено в параграфе 14.5.
528
ГЛАВА 12
Полагая ε = О, получаем $ — ут, и система (12.58)—(12.60) сводится к си
стеме (12.45)-( 12.46). Следующая теорема обосновывает использование филь
тра (12.55)—(12.56) при достаточно малой ε.
Теорема 12.2. Рассмотрим замкнутую систему (12.58)-(12.60) в условиях
принятых предположений. Предположим также, что p(t) — непрерывно диф
ференцируемая функция, p(t) Ε S {некоторое компактное подмножество Dp)
и
II/КО II ^ Μ для всех t ^ 0. Тогда существуют положительные константы
&ъ &2, ks, k иТ такие, что если μ < fci, ЦЛ'(О) — Xss(p(0),w)\\ < k2 и ε < k%,
то X(t) будет равномерно ограничено для всех £ ^ 0 и
\\e{t)\\ ^kμ,
Vt^T.
Болеетого,еслиp(t)—>pss иp(t)—• 0приt—>оо,то
e(t)—• 0приt—>оо.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.20.
Π
Из этой теоремы следует, что если настроечная переменная является мед
ленно меняющейся, начальное состояние достаточно близко в начальный мо
мент времени к точке равновесия и ε достаточно мала, то ошибка слежения бу
дет иметь в асимптотике порядок производной настроечной переменной и будет
стремиться к нулю, если настроечная переменная стремится к постоянному пре
делу.
Пример 12.6. Рассмотрим систему второго порядка
*i = tg#i+a;2,
#2=#i+Щ
где у — единственный измеряемый сигнал, т. е. ут = у. Цель заключается в от
слеживании выходом у заданного командного сигнала г. В качестве настроеч
ной переменной будет использована г. При г = а = const уравнения равнове
сия (12.31) и (12.32) имеют единственное решение
Xss(0i)
tg lOL
а
а)=tg a
Используем интегральный регулятор с наблюдателем:
σ=е=у-г,
(12.61)
х=А(а)х +Ви+Н(а)(у -Сх),
(12.62)
и = -Кг(а)х
-
Κ2(α)σ,
(12.63)
12.5. МЕТОД НАСТРОЙКИ ОБРАТНОЙ связи
529
где
А(а) =
1+а
2
1
1
и
,в=
0
1
С=[0 1],
Кг(а) = (1+ а
2
)(3+а
2
)+3+
1+а
2
3+а
2
К2(а)
1
1+а
2
Н(а)
10+(4+ а
2
)(1+а
2
)1
(4+а
2
)
J*
Коэффициенты обратной связи К\(а) и К2(а) выбираются таким образом,
чтобы собственными значениями матрицы замкнутой системы являлись — 1,
— (1/2) ±j(y/3/2). Коэффициент обратной связи Н(а) наблюдателя выбран та
ким образом, чтобы собственными значениями наблюдателя являлись —(3/2) ±
j(3y/3/2). Для удобства мы выбрали собственные значения так, чтобы они не
зависели от а, но это условие не является обязательным, т. к. рассматриваемый
здесь метод остается верным и при наличии такой зависимости, но при условии,
что вещественные части этих собственных значений меньше некоторого отрица
тельного числа, не зависящего от а. Предложенный регулятор с фиксированной
обратной связью представляет собой специальный случай регулятора (12.33)-
(12.35) при z = ж, F = А-ВКг-НС,
Gx = -ВК2,
G2=H,L=-Къ Μλ=
= —К2, М2 = 0 и Мз = 0. Поскольку у недоступна для измерения, используем
регулятор с настраиваемой обратной связью (12.52)—(12.56) с ε = 0.01. На рисун
ке 12.5 показан переходный процесс в замкнутой системе для случая ступенчато
го командного сигнала. Каждому ступенчатому изменению командного сигнала
0.8
0.6
0.4
0.2
0
'
-J
20
40
60
80
Время
100
120
140
Рис. 12.5. Командный сигнал (пунктирная линия) и выход системы (непрерывная линия),
замкнутой регулятором с настраиваемой обратной связью из примера 12.6
соответствует смена точки равновесия системы; начальное состояние системы
в момент времени 0+ является состоянием равновесия в момент времени 0_.
Если начальное состояние расположено в области притяжения новой точки рав
новесия, система достигает установившегося режима в этой точке. Поскольку
наш регулятор основан на использовании метода линеаризации, он гарантирует
лишь локальную стабилизацию. Поэтому в общем случае отдельное ступенчатое
530
ГЛАВА 12
изменение командного сигнала должно быть ограничено. Достижение большого
значения командного сигнала реализуется в виде последовательности ступенча
тых изменений командного сигнала (см. рисунок 12.5), для каждого из которых
предусматривается достаточно большой промежуток времени, необходимый для
того, чтобы система достигла установившегося режима на этом шаге процес
са регулирования. Другой метод, используемый для смены заданного значения
командного сигнала, заключается в его медленном изменении. На рисунке 12.6
показан переходный процесс в замкнутой системе, в которой смена значения
командного сигнала от одного значения до другого осуществляется в виде его
медленного увеличения на протяжении периода времени 100 секунд. Характер
0
20
40
60
80
100
120
Время
Рис. 12.6. Командный сигнал (пунктирная линия) и выход системы (непрерывная ли
ния), замкнутой регулятором с настраиваемой обратной связью из примера 12.6: (а) угол
наклона командного сигнала = 0.01; (Ь) угол наклона командного сигнала = 0.1
переходного процесса в этом случае соотносится с нашими результатами, касаю
щимися поведения регуляторов с настраиваемой обратной связью при медленно
меняющихся настроечных переменных. На этом же рисунке показан переход
ный процесс при большем угле наклона командного сигнала. При увеличении
угла наклона командного сигнала, характеристики переходного процесса ухуд
шаются. Если продолжить увеличение угла наклона командного сигнала система
в конце концов может стать неустойчивой. Регулятор с настраиваемой обратной
связью имеет преимущество по сравнению с регулятором с фиксированной об
ратной связью. На рисунке 12.7 показан переходный процесс в замкнутой систе
ме для ступенчатого изменения командного сигнала при использовании регуля
тора с фиксированной обратной связью а = 0. При малых значениях командного
сигнала характеристики переходного процесса соответствуют характеристикам
переходного процесса при использовании регулятора с настраиваемой обратной
связью, но при увеличении командного сигнала эти характеристики ухудшаются
и система становится неустойчивой.
Наконец, рисунок 12.8 доказывает целесообразность модификации в соот
ветствии с рисунком 12.4 регулятора с настраиваемой обратной связью. Переход
ный процесс в системе, замкнутой немодифицированным регулятором (получен
ным путем замены в уравнениях регулятора а на г), показан для случая ступен-
12.6. УПРАЖНЕНИЯ
531
чатого изменения командного сигнала, показанного на рисунке 12.5. Несмотря
на то что обеспечены устойчивость и нулевая ошибка слежения в установив
шемся режиме, характеристики переходного процесса быстро ухудшаются при
увеличении командного сигнала. Это обусловлено появлением дополнительных
нулей передаточной функции замкнутой системы. Несмотря на то что неустой
чивость системы в этом примере не наблюдается, плохой переходный процесс
может привести к потере устойчивости, т. к. в этом случае возможен выход со
стояния системы из конечной области притяжения.
Δ
0.8
0.6
0.4
0.2
0
-0.2
0
10
20
30
40
Время
50
60
70
Рис. 12.7. Командный сигнал (пунктирная линия) и выход системы (непрерывная линия),
замкнутой регулятором с фиксированной обратной связью из примера 12.6
140
Рис. 12.8. Командный сигнал (пунктирная линия) и выход системы (непрерывная ли
ния), замкнутой немодифицированным регулятором с настраиваемой обратной связью
из примера 12.6
12.6. Упражнения
12.1. Рассмотрим замкнутую систему из примера 12.2. Пусть а — с = 10, δ =
= π/4, 6 = 0, к\ = 2.5 и &2 = 1. Найдите функцию Ляпунова системы и исполь
зуйте ее для оценки области притяжения.
532
ГЛАВА 12
12.2. Для каждой из следующих систем с использованием метода линеаризации
(a) постройте регулятор с обратной связью по состоянию, обеспечивающий ста
билизацию начала координат;
(b) постройте регулятор с обратной связью по выходу, обеспечивающий стаби
лизацию начала координат.
(1)
(2)
(3)
±1=Х\+Х2,
±2=%х\х2+Х\+U,
У -х\+х2;
Х\= Х\+ Х2-,
±2=Х\х\ —Я\+#3,
ХЗ=Щ
у=-х\+х2;
12.3. Пусть
л=
XI=
- -Х\ +Х2,
Х2=^1- ^2-X\X%+U,
хз=х\+х\хъ -2хз,
У=Х1-
А0'
С0,в=
'в'
0?
где А, В и С удовлетворяют ранговому условию (12.23). Покажите, что пара
(Л, В) управляема (соответственно стабилизируема), если и только если пара
(А, В) управляема (соответственно стабилизируема).
12.4. Рассмотрим маятник из примера 12.2.
(a) Предположим, что угол θ доступен для измерения, но θ недоступна для из
мерения. С использованием метода линеаризации постройте интегральный
регулятор с обратной связью по выходу, обеспечивающий стабилизацию по
ложения маятника, соответствующего углу наклона θ = δ.
(b) Предположим, что θ и θ доступны для измерения. Постройте интегральный
регулятор с настраиваемой обратной связью по состоянию такой, что угол θ
отслеживает командный сигнал вг. Исследуйте характеристики регулятора
с настраиваемой обратной связью с использованием компьютерного моде
лирования.
(c) Предположим, что угол θ доступен для измерения, но θ недоступна для
измерения. Постройте интегральный регулятор с настраиваемой обратной
связью и наблюдателем, обеспечивающий отслеживание командного сигнала
0Г. Исследуйте характеристики регулятора с настраиваемой обратной связью
с использованием компьютерного моделирования.
Используйте следующие значения параметров: а = 10, Ъ = 0.1 и с = 10.
12.5. Рассмотрим линейную систему
х — А(а)х + В(а)и,
12.6 . УПРАЖНЕНИЯ
533
где А(а) и В (а) — непрерывно дифференцируемые функции от постоянного
вектора а, такого что а е Г (компактное подмножество R
m
). Пусть W(a) —
грамиан, который определяется равенством
W(a)=Г
exp[-A{a)a]B(a)BT(a)exp[-A
T
(a)a]da
Jo
для некоторого г > 0, не зависящего от а. Предположим, что пара (А, В) управ
ляема, и что это свойство выполняется равномерно по а, т. е. существуют поло
жительные константы с\ и С2, не зависящие от а, такие что
cil ^W(a)
^с2/, УаеГ.
Пусть
Q(a)= Г e-
2c(T
exp[-A(a)a}B(a)BT(a)exp[-A
T
(a)a]da,
с >0.
Jo
(а) Покажите, что
и = -K(a)x
d
=
-\в
т
(а)Р(а)х,
cie-
2cT
I ^Q(a)^c2I,Va<ЕГ.
(b) Пусть
it=
—
ТС (т\т =
—
Л
где Р(а) = Q~
1
(a). Используя V = х
т
Р(а)х в качестве функции Ляпунова
для системы
х = [А(а) - В(а)К(а)]х,
покажите, что V ^ — 2cV.
(c) Покажите, что [А(а) — В (а) К (а)] гурвицева равномерно по α для всех
аеТ.
12.6. Покажите, что Р(а), определяемая равенством (12.50), невырожденна
и удовлетворяет (12.51).
12.7. Упрощенная модель низкочастотных колебаний корабля имеет вид диффе
ренциального уравнения [60]
τψ+ψ=kS,
где φ — курсовой угол корабля и δ — угол поворота руля, рассматриваемый здесь
в качестве управления системой. Постоянная времени г и коэффициент обратной
связи к зависят от продольной скорости корабля ν, и эта зависимость определя
ется равенствами т = TOVQ/V И к = kov/vo, где то, ко и vo — константы.
(а) В предположении, что продольная скорость постоянна, постройте инте
гральный регулятор с обратной связью по состоянию, такой что ψ отсле
живает заданный угол фг.
534
ГЛАВА 12
(b) Используйте метод настройки обратной связи для компенсации эффекта,
связанного с изменением продольной скорости движения корабля.
12.8. Модель системы магнитной подвески из упражнения 1.18 имеет вид систе
мы уравнений
XI=Х2,
Х2=9~ш
х
2-
к
L0axl
2m(a + х{)
1Г^
хз=
Цхг)
Ьоах2хг .
(а+хгУ
где х\ = г/, Х2 = г/, хг = i и tx — v. Используйте следующие численные данные:
m = 0.1кг,к =0.001Н/м/с,# =9.81м/с
2
, α=0.05м,L0=0.01Гн,Lx =
= 0.02ГниД=1Ом.
(a) Найдите установившиеся значения Jss и V^s для г и υ соответственно, при
которых обеспечивается стабилизация шара в желаемом положении у —
=
г>0.
(b) Покажите, что при и = Vss соответствующая точка равновесия неустойчива.
(c) С использованием метода линеаризации постройте закон управления с об
ратной связью по состоянию, обеспечивающий стабилизацию шара в поло
жении у = 0.05 м.
(d) Предположим, что пределы допустимого изменения переменной у — от 0
до 0.1 ми напряжение может изменяться в пределах от 0 до 15 В. Пред
положим также, что в начальный момент времени шар находится в точ
ке равновесия. Используя компьютерную модель системы, сместите шар на
небольшое расстояние вверх (и вниз) и предоставьте ему возможность дви
гаться далее свободно. Повторите этот эксперимент, постепенно увеличи
вая величину начального возмущения. Определите экспериментально мак
симальный интервал первоначального возмущения, при котором шар воз
вращается в точку равновесия, не нарушая указанных ограничений на изме
нение переменных у и v. Для того чтобы учесть ограничение на υ9 введите
в компьютерную модель ограничитель.
(e) С использованием компьютерного моделирования исследуйте воздействие
возмущений, связанных с неточным знанием массы га. Выполните компью
терное моделирование замкнутой системы с номинальным регулятором, но
при отклонении величины массы от ее номинального значения. Найдите пре
делы изменения массы га, для которых этот регулятор обеспечивает стаби
лизацию шара, и исследуйте характеристики ошибки слежения в установив
шемся режиме.
(f) Решите задачу пункта (с) с использованием интегрального регулятора. По
вторите пункты (d) и (е) для этой схемы управления. Прокомментируйте из
менение характеристик переходных процессов и ошибки в установившемся
12.6 . УПРАЖНЕНИЯ
535
режиме, связанное с заменой закона управления из пункта (с) на интеграль
ный регулятор.
(g) Решите задачу пункта (с) в предположении, что измерению доступно
лишь у. Повторите пункты (d) и (е) для этой схемы управления.
(h) Решите задачу пункта (с) в предположении, что измерению доступны лишь у
и г. Повторите пункты (d) и (е) для этой схемы управления.
(i) Постройте интегральный регулятор из пункта (f) в предположении, что из
мерению доступно лишь у. Повторите пункты (d) и (е) для этой схемы
управления.
(j) Постройте интегральный регулятор из пункта (f) в предположении, что из
мерению доступны лишь у и г. Повторите пункты (d) и (е) для этой схемы
управления.
(к) Постройте интегральный регулятор с настраиваемой обратной связью и на
блюдателем, обеспечивающий отслеживание переменной у заданного поло
жения шара г в предположении, что измерению доступны у и г. Используя
компьютерное моделирование, исследуйте характеристики регулятора с на
страиваемой обратной связью при медленном изменении г от 0.03 до 0.07.
(1) Если измерению доступно г, можно ли построить линейный закон управле
ния с обратной связью по выходу, который обеспечивал бы стабилизацию
шара в положении у = г? Можно ли построить линейный закон интеграль
ного управления с обратной связью по выходу?
12.9. Электрический двигатель постоянного тока описан в упражнении 1.17. Если
ток возбуждения в цепи обмотки статора рассматривать как управление, модель
системы может быть представлена в виде модели состояния второго порядка
Х\= -Θ\ΧΙ -02^2^+03,
х2 = -Θ4Χ2 + в^хгщ
У=Х2,
где х\ — ток в обмотке якоря, х^ — скорость вращения, и — ток в обмотке статора
и0$, i = l,...,5 — положительные константы. Необходимо построить систему
управления скоростью, обеспечивающую асимптотическое отслеживание у за
данной скорости г. Предполагается, что г
2
< 0|0б/4010204 и допустимая область
ограничена условием х\ > 0з/20ь
(a) Найдите вход uss для установившегося режима, при котором обеспечивается
желаемый выход системы г. Проверьте, что система, замкнутая управлением
и = uss, имеет экспоненциально устойчивую точку равновесия.
(b) С использованием компьютерного моделирования выполните малое поша
говое изменение командного сигнала для двигателя, находящегося в устано
вившемся режиме (у = 0). Выполните этот эксперимент, постепенно уве
личивая величину шага изменения командного сигнала. Определите макси
мальное значение начального увеличения командного сигнала, при котором
536
ГЛАВА 12
двигатель возвращается в установившийся режим вращения с желаемой ско
ростью.
(c) С использованием компьютерного моделирования исследуйте характеристи
ки системы, если момент инерции ротора изменяется на ±50%.
(d) Используя метод линеаризации, постройте интегральный регулятор с обрат
ной связью по состоянию, обеспечивающий желаемую скорость вращения.
Выполните пункты (Ь) и (с) для этого регулятора и сравните характеристики
замкнутой системы с результатами пункта (а).
(e) Предположим, что измерению доступна скорость X2, но ток в обмотке яко
ря х\ не измеряется. Выполните пункт (d) с использованием наблюдателя,
обеспечивающего получение оценок величины тока в обмотке якоря. Вы
полните пункты (Ь) и (с) для этого регулятора и сравните характеристики
замкнутой системы с результатами пункта (d).
(f) Постройте интегральный регулятор с настраиваемой обратной связью и на
блюдателем, обеспечивающий отслеживание переменной Х2 заданной ско
рости г.
В пунктах (Ь)-(е) используйте следующие численные данные: θ\ = 60, #2 = 0.5,
0з=40,ΘΑ=6и<95=4х104
.
12.10. Рассмотрим обратный маятник из упражнения 1.15.
(a) Используя х\ — 0, Х2 = 0, хз = У и х± = у в качестве переменных состоя
ния и и = F в качестве управления, запишите уравнение состояния.
(b) Покажите, что незамкнутая система имеет множество состояний равновесия.
(c) Предположим, что задача состоит в стабилизации маятника в вертикальном
положении (Θ = 0). Найдите точку равновесия незамкнутой системы, в ко
торой 0 = 0, и покажите, что она неустойчива.
(d) Линеаризуйте нелинейное уравнение состояния в окрестности желаемой
точки равновесия и проверьте, что соответствующая линейная система
управляема.
(e) Используя метод линеаризации, постройте закон управления с обратной свя
зью по состоянию, стабилизирующий систему в желаемой точке равновесия.
(f) Используя компьютерное моделирование, исследуйте переходный процесс
системы и эффект от ±20%-го изменения массы маятника и его момента
инерции.
(g) Используя компьютерное моделирование, отклоните находящийся в положе
нии равновесия маятник на малый угол вправо (и влево) и предоставьте ему
возможность свободного колебания. Повторите этот эксперимент, постепен
но увеличивая величину начального возмущения. Используя компьютерное
моделирование, определите максимальную величину начального возмуще
ния, при котором маятник возвращается в положение равновесия.
(h) Предположим, что измерению доступны угол 0 и положение тележки у. Ис
пользуя метод линеаризации, постройте регулятор с обратной связью по вы-
12.6 . УПРАЖНЕНИЯ
537
ходу, обеспечивающий стабилизацию маятника в положении θ = 0. Выпол
ните пункты (f) и (g) для этого регулятора.
(i) Выполните пункт (h), если цель управления состоит в стабилизации маят
ника в положении θ = 0Г, где —π/2 < вг < π/2.
В пунктах (e)-(i) используйте следующие численные данные: т = 0.1 кг, Μ =
= 1кг,к =0.1Н/м/с,/ =0.025/3кгм
2
, д =9.81м/с
2
иL=0.5м.
ГЛАВА 13
Линеаризация обратной связью
Рассмотрим класс нелинейных систем вида
* = /0*0 + G{x)u,
У=h{x)
и зададимся вопросом о существовании замены обратной связи по состоянию
и=а(х)+P(x)v
и замены переменных состояния
z = Г(х),
с использованием которых нелинейная система может быть преобразована в эк
вивалентную линейную систему. В параграфе 13.1 мы предложим мотивацию для
этого подхода, рассмотрим простые примеры и введем понятия линеаризации
посредством замены переменных состояния, при которой уравнение состояния
линеаризуется по всем переменным состояния, а также понятие линеаризации
по входу-выходу, при которой достигается линеаризация отображения вход-вы
ход, но уравнение состояния линеаризуется лишь по части переменных. В пара
графе 13.2 мы исследуем метод линеаризации по входу-выходу, введем понятия
относительной степени, нуль-динамики и минимально-фазовой системы. В пара
графе 13.3 будет рассмотрен класс нелинейных систем, которые могут быть лине
аризованы обратной связью. Для упрощения изложения в параграфах 13.2 и 13.3
рассматриваются системы с одним входом и одним выходом. Законы управления
с обратной связью, применяемые в системах, которые могут быть линеаризуемы
(или частично линеаризуемы) обратной связью по состоянию, предложены в па
раграфе 13.4. В качестве задач управления рассматриваются задачи стабилизации
и слежения.
13.1. Мотивация
Для мотивации метода линеаризации нелинейных систем обратной связью
рассмотрим задачу стабилизации начала координат уравнения маятника
XI=£2,
±2= —a[sin(xi +δ)— sinδ]—bx2 + си.
13.1. МОТИВАЦИЯ
539
При анализе уравнения состояния можно заметить, что если и выбрать в виде
и = |[sin(#i+δ)- sinδ]+ |,
то это приведет к исключению нелинейного члена a[sin(a?i + δ) — sin δ], в резуль
тате чего исходная система преобразуется к линейному виду
±1=Х2,
±2= —ЬХ2+V.
Таким образом, задача стабилизации нелинейной системы может быть сведена
к задаче стабилизации управляемой линейной системы. Для этой системы можно
построить стабилизирующее управление с обратной связью по состоянию
V = -kiXi - &2Х2,
такое что собственные значения матрицы замкнутой линейной системы
XI=Х2,
х2 = -kixi - (fc2+Ъ)х2
расположены в открытой левой полуплоскости. Тогда закон управления с обрат
ной связью по состоянию для исходной нелинейной системы имеет вид
U=
\с1 НП(
Х
1+*)~~
SU1(
*]~c^
lXl
+
fc
2#2)·
Совершенно очевидно, что мы не можем рассчитывать на применимость это
го метода исключения нелинейности в случае нелинейной системы общего вида.
Это возможно, только если эта система обладает определенными структурными
свойствами, которые позволяют выполнить подобное исключение. Для исключе
ния нелинейного члена а(х) путем его вычитания управление и и нелинейность
а(х) должны присутствовать в уравнении состояния в виде суммы и + а(х). Для
исключения нелинейного члена η(ρε) путем деления на этот член управление и
и нелинейность j(x) должны присутствовать в уравнении состояния в виде про
изведения ^{х)и. Если матрица ^у(х) невырожденна в рассматриваемой области,
она может быть исключена заменой управления и = β(Χ)υ, где /3(х) =
n
f~
1
(x) —
обратная матрица для матрицы ^(х). Поэтому замена управления, позволяющая
преобразовать нелинейное уравнение состояния в управляемое линейное уравне
ние состояния путем исключения нелинейности, может быть выполнена в случае,
когда нелинейное уравнение состояния имеет специальную структуру:
х = Ах + Bj(x)[u - а(х)],
(13.1)
где А и В — (п х п)- и (n x р)-матрицы, пара (Л, В) управляема, функции
а:R
n
—>В?иη:R
n
—»R
pxp
определены в области D С Лп
, содержащей
540
ГЛАВА 13
начало координат, и матица ^(х) невырожденна для всех х Ε D. Если уравнение
состояния представлено в форме (13.1), мы можем линеаризовать его обратной
связью по состоянию
и = а(х) + p{x)v,
(13.2)
где /?(х) = 7
-1
(#)· В результате этого мы получаем линейное уравнение состоя
ния
А=Ах+Bv.
(13.3)
Для стабилизации этой системы используем закон управления ν = —Кх, такой
что матица А — ВК гурвицева. Тогда закон управления с обратной связью по
состоянию для исходной нелинейной системы имеет вид
и = а(х) - Р(х)Кх.
(13.4)
Предположим, что нелинейное уравнение состояния не имеет структуры,
представленной равенством (13.1). Означает ли это, что мы не можем выполнить
линеаризацию системы обратной связью? Ответ на этот вопрос отрицательный.
Заметим, что представление модели состояния системы не единственно. Оно за
висит от выбора переменных состояния. Даже если система не имеет структуры
уравнения (13.1) для одного выбора переменных состояния, она может иметь эту
структуру, будучи представленной в других переменных состояния. Рассмотрим,
например, систему
±1 = asinx2j
Мы не можем предложить замену и, которая бы исключила нелинейный член
a sin #2- Однако если предварительно выполнить замену переменных
Z\ =Xi,
Z2—ashlar= ^ъ
для которых выполнены равенства
Z2 = acosx2(—xl + и),
то нелинейность может быть исключена заменой управления
n=x
i + acosx2
V
>
которая определена при —π/2 < Х2 < π/2. Уравнение состояния в новых коор
динатах (zi,Z2) может быть получено с использованием обратной замены пере
менных, представляющей (x\,X2) в терминах (^1,2:2)·
xi=zi,
Х2=S1I1 (—)
13.1. МОТИВАЦИЯ
541
и определенной при — а < Ζ2 < а. Преобразованное уравнение состояния имеет
вид
h=22,
Z2= acos(sin
-1
(-§•)) (—zf + u).
Замена переменных z = Т(х), используемая для представления уравнения
состояния в z-координатах, должна быть обратимой, т. е. отображение Τ должно
иметь обратное Т
-1
(),такоечтох=T~
l
(z) для всех z Ε T(D), где D — область
определения отображения Т. Более того, вследствие необходимости обеспечения
непрерывности производных z и х, требуется, чтобы отображения Т() и Т
-1
()
были непрерывно дифференцируемыми. Непрерывно дифференцируемое отоб
ражение с непрерывно дифференцируемым обратным отображением называется
диффеоморфизмом. Если матрица Якоби [дТ/дх] невырожденна в точке хо Ε D,
из теоремы об обратной функции
1
следует, что существует окрестность N точки
хо, такая что сужение отображения Τ на N является диффеоморфизмом на N.
Отображение Τ называется глобальным диффеоморфизмом, если оно является
диффеоморфизмом на R
n
и T(Rn)
=R
n
? После введения этих понятий мы мо
жем перейти к определению понятия систем, линеаризуемых обратной связью.
Определение 13.1. Нелинейная система
х=f(x) +G(x)%
(13.5)
гдеf :D—>R
n
иG:D—>R
nx
P — достаточно гладкие функции
3
в области
DСRn
,
называется линеаризуемой (или линеаризуемой по входу-состоянию)
обратной связью, если существует диффеоморфизм Τ : D —• R
n
,
такой что
Dz = T(D) содержит начало координат и замена переменных z = Т(х) преоб
разует нелинейную систему (13.5) к виду
z=Az+Вф)[и
-
а(х)Ъ
(13.6)
где пара (Л, В) управляема и *у(х) невырожденна для всех х Ε D.
Если рассматривается система с выходом, например в задачах слежения,
модель состояния описывается уравнениями состояния и выхода. Линеаризация
уравнения состояния не обязательно приводит к линеаризации уравнения выхода.
Например, если система
х\ =αsin#2)
%2=—х\+и
*См. [10, теорема 7-5].
2
Отображение Τ является глобальным диффеоморфизмом, если и только если матрица [дТ/дх]
невырожденна для всех х е R
n
и отображение Τ является собственным, т. е. Шпца-ц -юо ||Т(ж)|| =
= оо. (Доказательство этого утверждения приведено в работах [165] и [212].)
3
Выражение «достаточно гладкие» означает, что все частные производные, которые впослед
ствии будут использоваться при анализе, определены и непрерывны.
542
ГЛАВА 13
имеет выход у = Х2, то замена переменных и обратной связи по состоянию
2
1
*i=ai, z2 = asmx2
ии=хг+
acosX2v
приводит к системе
h=^25
i2=ν,
y-in-(f).
Несмотря на то что полученное уравнение состояния линейно, решение задачи
слежения по-прежнему остается непростой задачей, поскольку уравнение выхода
содержит нелинейность. Анализ уравнений состояния и выхода в ^-координатах
показывает, что, если использовать замену обратной связи и = х\ + υ, можно
линеаризовать отображение вход-выход от и к у и получить следующую его ли
нейную модель:
Х2=V,
У=Х2-
Решение задачи слежения для преобразованной системы может быть выпол
нено с использованием линейной теории управления. Из этого примера видно,
что иногда оказывается полезным линеаризовать отображение вход-выход, даже
если при этом часть уравнения состояния остается нелинейной. В этом случае
система называется линеаризуемой по входу-выходу. Однако при выполнении ли
неаризации по входу-выходу следует иметь в виду, что отображение входа-выхо
да для полученной линеаризованной системы может не учитывать всей динамики
системы. В предыдущем примере вся система описывается уравнениями
xi = asin#2,
±2=v,
У=Х2-
Заметим, что переменная состояния х\ не связана с выходом у. Другими словами,
линеаризующая замена обратной связи сделала переменную х\ ненаблюдаемой
по выходу у. При решении задачи слежения нам бы хотелось, чтобы поведение
переменной х\ было приемлемым, т.е. чтобы эта переменная была в некото
ром смысле ограниченной и чтобы система была устойчива по ней. Простей
шая схема управления, построенная с использованием линейного отображения
входа-выхода, может привести к слишком большим значениям сигнала x\(t) в хо
де переходного процесса. Например, предположим, что мы построили линейное
управление, обеспечивающее стабилизацию выхода у вблизи постоянного значе
ния г. Тогда xi(t) = xi(0) + tasmr и при sin г ф 0 значения х\(€) неограниченно
возрастают. Этот вопрос о внутренней устойчивости будет исследован с исполь
зованием концепции нуль-динамики.
13.2 . ЛИНЕАРИЗАЦИЯ ПО ВХОДУ-ВЫХОДУ
543
13.2. Линеаризация по входу-выходу
Рассмотрим систему с одним входом и одним выходом
x = f{x)+g{x)u,
(13.7)
У=Цх),
(13.8)
где /, д и h — достаточно гладкие в области D с R
n
функции. Отображения
/:D—>R
n
ид:D—»R
n
называются векторными полями на D. Производная у
определяется равенством
У = Ц[/(*) + fl(»)«] =
f
Lfh{x) + Lgh(x)u,
где функция
LfKx) = fx /(*)
называется производной Ли
4
(Lie derivative) h вдоль поля /. Это понятие сходно
с хорошо известным понятием производной функции h вдоль траекторий си
стемы х = /(#). Вновь введенное понятие удобно, если необходимо выполнять
вычисление повторных производных функции вдоль одного векторного поля. На
пример, далее будут использоваться следующие обозначения:
LgLfh(x) =
^
д(х),
L}h(x) = LfLfh(x) = Щ^No,
d{Lkf
l
h)
L°fh{x) = h(x).
Если Lgh(x) = 0, то у = Lfh(x) не зависит от и. Если продолжить вычисление
производных, то вторая производная у, обозначенная как у^
2
\ имеет вид
у{2) = Щ£1Ш +д{х)и] = L2h{x) +LgLfh{x)u_
Снова, если LgLfh(x) = 0, то у^ = L%h(x) не зависит от и. Продолжая эту
процедуру, можно заметить, что если h(x) удовлетворяет равенству
LgLy
i
h(x) =0,г=1,2,...,ρ-1;LgL
p
flh{x) φ 0,
Ли, Мариус Софус (Lie, Marius Sophus) (1842-1899), норвежский математик.
—
Прим. ред.
перев.
544
ГЛАВА 13
то и не входит в выражения для у, у,..., у(р
^ и появляется в равенстве для у^
с ненулевым коэффициентом:
yW=^Л(ж)+
LgL^h^u.
Из этого равенства следует, что система линеаризуема по входу-выходу, посколь
ку замена обратной связи по состоянию
и=
-1 i-L
p
Mx) +ν]
LgL
p
f-
l
h{x)
f
приводит отображение вход-выхода к виду
у(р) = у.
Это отображение представляет собой цепочку из ρ интеграторов. В этом слу
чае целое число ρ будет называться относительной степенью системы (relative
degree).
Определение 13.2. Говорят, что нелинейная система (13.7)-(13.8) имеет
относительную степень, равную р, 1 ^ ρ < η в области Do С D, если
Ьд1^
г
к(х) =О,г=1,2,...,ρ-1; LgL
p
flh(x) φ О
(13.9)
для всех х е -Do-
Пример 13.1. Рассмотрим уравнение Ван дер Поля с управлением
XI=Я2,
±2= —х\+ε(1—х\)Х2+^>ε>0.
Пусть выход определяется равенством у = х\. Вычисляя производные функции
выхода, получаем
у=х1= х2)
у=±2= —xi+ε(1- х\)х2 +гг.
Следовательно, система имеет относительную степень, равную двум в R
2
.
Если
выход определяется равенством у = х2, имеем
у= -х\ +ε(1- х\)х2+и
и система имеет относительную степень, равную единице в R
2
.
Если выход опре
деляется равенством у = х\ + х\, имеем
у= х2 +2ж2[-#1+ε(1- a?i)a:2+и]
13.2. ЛИНЕАРИЗАЦИЯ ПО ВХОДУ-ВЫХОДУ
545
и система имеет относительную степень, равную единице в DQ = {х € R2\x2 φ
^0}.
Δ
Пример 13.2. Рассмотрим систему
±1 =Ж1,
#2=#2+
и
*
У=Х1.
Вычисляя производные у, получаем
у=±г=Х1=у.
Следовательно, у^
= у = х\ длявсехη ^ 1.Вэтомслучаесистеманеиме
ет хорошо определенной относительной степени. Поскольку рассматриваемый
пример достаточно прост, легко доказать справедливость этого заключения. Дей
ствительно, выход y(t) = xi(t) = e*xi(0) не зависит от входа и.
Δ
Пример 13.3. Модель электрического двигателя постоянного тока с прене
брежимо малым демпфированием вала может быть представлена в виде уравне
ния состояния следующего вида (упражнение 1.17):
х\=—ах\+и,
±2= —ЬХ2+к—CX\Xz,
хз = 0xi#2,
где xi, X2 и х% — ток в обмотке статора, ток в обмотке якоря и угловая скорость
вращения; а, Ь, с, к и θ — положительные константы. Для нахождения закона
управления скоростью вращения выберем в качестве выхода у = жз· Производ
ные выхода имеют вид
у=х3 = 6xix2y.
У=0Х\Х2+0Х\Х2=(')+9Х2Щ
где (·) содержит члены, зависящие от х. Система имеет относительную степень,
равную двум в области Do = {х Ε R3\x2 φ 0}.
Δ
Пример 13.4. Рассмотрим линейную систему, представленную передаточ
ной функцией
„,
ч Ът8
т
+ Ьт-1з
т
-
1
+ .--
+Ьо
His) =
,
s
n
+ Оп-гз"-
1
+ ···+αο
где т < η и Ьт φ 0. Модель состояния системы имеет вид
х=Ах+Ви,у=Сх,
546
ГЛАВА 13
где
С=[Ь0h
Cbqm
Ьгг О
о
1
О
,в=
о,
о,
1X71
Эта линейная модель состояния представляет собой частный случай модели
(13.7)—(13.8), с f(x) = Ах, д — В и h(x) = Сх. Для определения относительной
степени системы вычислим производные выхода. Первая производная имеет вид
у=САх + СВи.
Если т = η — 1, то СБ = Ъп-\ Φ 0 и система имеет относительную степень,
равную единице. В противном случае СВ = 0 и мы продолжаем процедуру вы
числения производных выхода, получив у(2\ Заметим, что СА является вектор-
строкой, полученной путем смещения элементов С на одну позицию вправо.
Аналогично СА2
является вектор-строкой, полученной путем смещения элемен
тов С на две позиции вправо. Продолжая эту процедуру, можно заметить, что
СА*-
г
В = 0 при г = 1,2,...,п-т-1 и САп
~
т
-
1
В =Ътф0.
Таким образом, и появляется впервые в равенстве для y(n_m
)
у(п-т) = САп-тх
+
САП
-
т
-
1
Ви,
и, следовательно, относительная степень системы равна п—т (разность степеней
полиномов в знаменателе и числителе передаточной функции H(s))
5
.
Δ
В целях дальнейшего исследования линеаризуемых по входу-выходу систем
и вопросов, связанных с внутренней устойчивостью, рассмотрим линейную си
стему из предыдущего примера. Передаточная функция H(s) может быть запи
сана в следующем виде:
N(s)
H(s) = D(sY
Таким образом, введенная относительная степень для нелинейной системы совпадает с отно
сительной степенью из линейной теории управления, определяемой как п — т.
13.2 . ЛИНЕАРИЗАЦИЯ ПО ВХОДУ-ВЫХОДУ
547
_
е
Г
w
Q(s)
N(s)
У
Рис. 13.1. Представление H(s) в виде соединения обратной связи
гдеdegD=η иdegΝ= т < п. Относительная степеньравнаρ =η —т.
С использованием алгоритма деления Евклида, D(s) можно записать в виде
D(s) = Q(s)N{s) + R(s),
где Q(s) и R(s) — частное и остаток (полиномы). Согласно алгоритму деления
Евклида,
degQ=η —т
—
р1 degR <т
и старший коэффициент Q(s) равен 1/Ьт. С учетом этого представления D(s)
перепишем H(s) следующим образом:
_1
N(8)
Щз) = Q(s)N(s) + R(s)
1+
Q(s)
l R(s)
Q(s) N(s)
Таким образом, H(s) может быть представлена в виде отрицательной обратной
связи с l/Q(s) в канале прямой связи и с R(s)/N(s) в канале обратной связи.
(См. рисунок 13.1.) Передаточная функция 1/Q{s) порядка ρ не имеет нулей
и может быть реализована при векторе состояния размерности р:
(Р-1)
]•
ξ=LУ' У> ···>У[
Тогда модель состояния имеет вид
ξ = (Ас + Β0Χτ)ξ + Bcbme,
У=Сс£,
где (Ас, Вс, Сс) — каноническое представление цепи ρ интеграторов:
Ас=
Сс
Г01
00
[0...
[10.
0...0,
1...0,
01,
...
00
..00]
>Вс=
о,
о,
о,
_
1
(13.10)
548
ГЛАВА 13
иλΕRp
.
Пусть (AQ, БО, СО) — минимальное представление передаточной функ
ции
R(S)/N(S)9T.G .
η=Α0η + В0у,
w=Ο0η.
Собственные числа матрицы AQ ЯВЛЯЮТСЯ нулями полинома N(s), которые
в свою очередь являются нулями передаточной функции H(s). Из представле
ния в виде соединения обратной связи для передаточной функции H(s) видно,
что эта функция может быть реализована в виде модели состояния
η=Αοη+Β0Οοξ,
(13.11)
ξ=Α0ξ +Β€(\τξ - bmC0v + Ъти),
(13.12)
У=Сс£.
(13.13)
С учетом специальной структуры (Ас, Вс, Сс) можно показать, что
y(p)
=X
T
t-bmC0v
+ bmu.
Тогда (линеаризующая по входу-выходу) замена обратной связи
u=j^[-\
T
t
+bmCw+v]
приводит систему к виду
η=Αοη+Β0Οεξ,
ξ=Α0ξ + Bcv,
У= Οαξ.
Для этой системы отображение вход-выход представляет собой цепь из ρ инте
граторов, и подвектор η вектора состояния этой системы является ненаблюдае
мым по выходу у. Предположим, что задача заключается в стабилизации выхода
вблизи постоянного значения г. Для этого необходимо обеспечить стабилиза
цию ξ в точке ξ* = (г, 0,..., 0)т
. Перемещая точку равновесия в начало коорди
нат с использованием замены переменных ξ = ξ — ξ*, сводим рассматриваемую
задачу к задаче стабилизации системы £ = Ас£ + Bcv. Полагая ν = —Κξ
—
—
— К (ξ — ξ*), где Ас — ВСК — гурвицева матрица, получаем закон управления
и = Μ-\Τξ +bmCoV- Κ(ξ-ξ*)}.
Соответствующая замкнутая система имеет вид
С=(Ас- вск)с
Поскольку для любого начального состояния £(0) матрица Ас — ВСК гурвицева,
выполнено £(£) —• 0 при t —> оо. Следовательно, y(t) —> г при t —• оо. Что
13.2. ЛИНЕАРИЗАЦИЯ по ВХОДУ-ВЫХОДУ
549
можно сказать о поведении η? В уравнении (13.11) функция у = Сс£ выступает
в качестве входа. Для обеспечения ограниченности ηψ) для всех возможных сиг
налов y(t) и всех возможных начальных состояний η(0) необходимо потребовать,
чтобы матрица А$ была гурвицевой или, эквивалентно, чтобы нули H(s) лежали
в открытой левой полуплоскости. Передаточная функция, все нули которой рас
положены в открытой левой полуплоскости, называется минимально-фазовой.
В терминах расположения полюсов, применение построенного выше с исполь
зованием метода линеаризации по входу-выходу закона управления с обратной
связью по состоянию приводит к тому, что собственные значения соответству
ющей замкнутой системы разбиваются на две группы: ρ собственных значений
матрицы Ас — ВСК располагаются в открытой левой полуплоскости и η — ρ соб
ственных значений становятся равными нулям разомкнутой системы
6
.
Наше исследование линейной системы из примера 13.4 проливает некото
рый свет на сущность замены обратной связи по состоянию, приводящей к тому,
что отображение вход-выход приводится к виду цепи интеграторов, а также при
ближает нас к тому, чтобы охарактеризовать понятие внутренней устойчивости.
Рассмотрим для этого модель состояния (13.11)—(13.13). Наша цель заключает
ся в том, чтобы разработать нелинейную версию уравнений (13.11)—(13.13) для
нелинейной системы (13.7)—(13.8) в случае, если ее относительная степень рав
на р. Переменные ξ выбираются теми же, что были использованы в линейном
случае, т. к. в качестве отображения вход-выход будет по-прежнему использовать
ся цепь из ρ интеграторов. Нам осталось выбрать переменные η для получения
нелинейной версии уравнения (13.11). Ключевой особенностью (13.11) является
отсутствие в этом уравнении управления и. Замена переменных, которая при
водит (13.7)—(13.8) к нелинейной версии уравнений (13.11)—(13.13), может быть
выбрана в следующем виде:
z=Т{х)
фг(х)
Фп-р(х)
h(x)
L^hix)
def
ф(х)
ф(х)
def
(13.14)
где функции с фг, i = 1...п
—
ρ, выбраны так, чтобы отображение Т(х) было
диффеоморфизмом в области DQ С D и
дфг
дх
д(х)=0 при 1<г<η—ρ, VxGD0.
(13.15)
6
Следует отметить, что при стабилизации выхода вблизи постоянного командного значения
не требуется выполнение свойства минимальной фазовости системы. Это требование необходимо
для того, чтобы, в соответствии с нашим выбором, некоторые из собственных значений замкнутой
системы стали равны нулям разомкнутой системы.
550
ГЛАВА 13
В следующей теореме показывается, что функции ф^ г — 1... η — ρ, существуют
по крайней мере локально.
Теорема 13.1. Рассмотрим систему (13.7)-(13.8) и предположим, что она
имеет относительную степень, равную ρ < η в D. Если ρ = п, то для любого
XQ Ε D существует окрестность N точки XQ, такая что отображение
Т(х) =
h(x)
Lfh(x)
тп—1h(x) J
суженное на окрестность Ν, является диффеоморфизмом на N. Если ρ < п,
то для любого хо Ε D существуют окрестность N точки хо и гладкие функции
ф\(х)^...,
фп-р(х), такие что (13.15) выполнено для всех х Ε Ν и отображение
Т(х), заданное равенством (13.14) и суженное на окрестность Ν, является
диффеоморфизмом на N.
U
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.21.
Условие (13.15) гарантирует, что при вычислении
*) = §£[/(*)+fl(*)«]
член при и исчезает. Легко проверить, что замена переменных (13.14) преобра
зует (13.7)—(13.8) к виду
ξ = Α0ξ + Вс-у(х)[и - а(х)],
У=Сс£,
(13.16)
(13.17)
(13.18)
гдеξ€Д',7?еR
n
-",
(AC,BC,CC)
интеграторов и
каноническое представление цепи из ρ
Л(Ъ0 =|£/(*)
x=T~
1
(z)
j(x) = LgL
p
rh(x)иа(х)=—
Lp
fh(x)
LgL
p
f-
l
h(x)
(13.19)
(13.20)
В уравнении (13.17) мы использовали представление функций α и 7 в исход
ных координатах. Эти функции определяются единственным образом равенства
ми (13.20) в терминах функций /, g и h и не зависят от выбора ф. Они могут
быть представлены в новых координатах с использованием равенств
α0(η,ξ)=α(Τ-\Ζ))
и то(»7,0 =7(Г"
1
(«))·
13.2 . ЛИНЕАРИЗАЦИЯ ПО ВХОДУ-ВЫХОДУ
551
Эти выражения, разумеется, зависят от выбора ф. В этом случае уравне
ние (13.17) может быть переписано в следующем виде:
ξ=Ас£+Бс7о(ту,О[и - а0(η,ξ)}.
Если х* является точкой равновесия разомкнутой системы (13.7), то точка
(ту*,ξ*), определяемая равенством
η* = φ(Χ*), е=[Кх*)
0 ··· 0],
является точкой равновесия системы (13.16)—(13.17). Если у обращается в нуль
при х = х*, т. е. h(x*) = 0, то х* может быть преобразована в точку начала
координат (η = 0,ξ = 0) путем выбора ф(х) так, чтобы ф(х*) — 0.
Представление системы в виде (13.16)—(13.18) называется нормальной фор
мой. Эта форма соответствует декомпозиции системы на внешнюю составляю
щую ξ и внутреннюю составляющую η. Внешняя составляющая линеаризуется
с использованием замены обратной связи по состоянию
и = а(х) + /3(х)г>,
где Р(х) = j~
1
(x). Внутренняя составляющая становится ненаблюдаемой после
применения указанной замены обратной связи. Внутренняя динамика описыва
ется уравнением (13.16). Полагая в этом уравнении ξ = 0, получаем уравнение
η = Μη,0),
(13.21)
которое называется уравнением нуль-динамики (zero dynamics) системы. Это по
нятие соотносится с известными результатами из теории линейного управления.
Действительно, в случае линейных систем уравнение (13.21) имеет вид η = Αοη
и собственные значения матрицы AQ ЯВЛЯЮТСЯ нулями передаточной функ
ции Η(s). Система называется минимально-фазовой, если (13.21) имеет асимп
тотически устойчивую точку равновесия в рассматриваемой области. В частно
сти, если Т(х) выбрано так, чтобы начало координат (η = 0,ξ = 0) являлось
точкой равновесия системы (13.16)—(13.18), то система называется минимально-
фазовой, если начало координат для уравнения нуль-динамики (13.21) асимпто
тически устойчиво. Полезно знать, что нуль-динамика может быть охарактеризо
вана в терминах исходных координат. С учетом
y(t) Ξ0^ ξ(1) Ξ0^ u(t) = a(x(t)),
можно заметить, что если выход системы тождественно равен нулю, то решение
уравнения состояния должно быть заключено в множестве
Z*={хеDQ\h(x)=Lfh(x) = ... = L
p
flh(x) = 0}
и вход системы должен иметь вид
и = и*{х) = a(x)\xeZ*·
552
ГЛАВА 13
Движение системы в этой области описывается уравнением
* = /* 0*0 = [/(х) + g{x)a(x)]xez*.
В частном случае ρ = η, нормальная форма (13.16)—(13.18) сводится к следую
щему уравнению:
z = Acz + Bc7(x)[u - а(х)],
(13.22)
У=Ccz,
(13.23)
где z = ξ = [Л(ж),··· ,L^
-1
/i(x)]T
и переменная η отсутствует. В этом слу
чае система не имеет нуль-динамики и по определению называется минимально-
фазовой.
Пример 13.5. Рассмотрим уравнение Ван дер Поля с управлением
Х\=Х2,
±2= -х\ +ε(1- х\)х<2+ и,
у= х2.
В примере 13.1 было установлено, что эта система имеет относительную сте
пень, равную единице в R
2
.
Положив ξ = у и η — х\ь заключаем, что система
уже представлена в нормальной форме. Нуль-динамика определяется уравнени
ем х\ — О, не имеющим асимптотически устойчивой точки равновесия. Следо
вательно, система не является минимально-фазовой.
Δ
Пример 13.6. Разомкнутая система
2+ х?
xi=-xi+
-и,
1+ я|
Х2=ЖЗ,
ЖЗ= ^1^3+Щ
У=Х2
имеет точку равновесия в начале координат. Производные выхода имеют вид
у=±2= х3,
у=х3=Xlx3 +и.
Таким образом, система имеет относительную степень, равную двум в Д
3
. Суче
том того что в (13.20) LgLfh(x) = 1 и lAh(x) = x\Xz, получаем
7=1 и а(х)=—Ж1£з·
Для того чтобы охарактеризовать нуль-динамику, рассмотрим эволюцию пере
менной х на множестве
Z*={хеR
3
\x2=£3=0}
13.2 . ЛИНЕАРИЗАЦИЯ ПО ВХОДУ-ВЫХОДУ
553
и положим и = и*(х) = 0. В результате получаем уравнение
xi = -xi,
из которого видно, что система является минимально-фазовой. Для того чтобы
представить ее в нормальной форме, выберем функцию ф(х) так, чтобы было
выполнено
ф(0)=0, ^9(х) =0
и чтобы отображение
Т(х)= [ ф(х) Х2 xsf
являлось диффеоморфизмом на некоторой области, содержащей начало коорди
нат. Дифференциальное уравнение в частных производных
дф2+*j|дф=Q
дх\ 1+х\ дхз
может быть решено методом разделения переменных, в результате чего получаем
решение
ф(х)=-х\ +хз+tg"
1
х3,
которое удовлетворяет условию ф(0) = 0. Отображение Т(х) является глобаль
ным диффеоморфизмом, и это утверждение следует из того факта, что для любой
Z€R3 уравнение Т(х) = z имеет единственное решение. Таким образом, нор
мальная форма имеет вид
4=(-4+i2+tg-
1
6)fi + ^^e2j,
и определена глобально.
Δ
Пример 13.7. Электрический двигатель постоянного тока из примера 13.3
описывается системой, имеющей относительную степень, равную двум в Do =
={хеR
z
\x2 φ 0}. Используя (13.20), получаем
,ч
0X2(-axi) + 6xi(-bx2 + k- cxixs)
η=6x2 и а(х) =
-
.
0X2
Для того чтобы охарактеризовать нуль-динамику, рассмотрим эволюцию пере
менной х на множестве
Ζ*={хеD0\x3 =0их\Х2=0}={хеD0\x3 =0иxi=0}
554
ГЛАВА 13
и положим и = и*(х) = О, в результате чего получаем уравнение
±2— —Ьх24-к.
Уравнение нуль-динамики имеет асимптотически устойчивую точку равновесия
в Х2 = к/Ъ. Следовательно, система является минимально-фазовой. Для ее пре
образования в нормальную форму найдем функцию ф(х), такую что [дф/дх]д =
= дф/dxi = 0, и отображение Τ = [ф(х),хз,0х1Х2]т
, являющееся диффеомор
физмом на некоторой области Dx С Д> Функция ф(х) = х2 — к/Ь удовлетво
ряет дф/дх\ = 0. При этом отображение Т(х) является диффеоморфизмом на
Dx = {х £ R3\x2 > 0} и точка равновесия нуль-динамики становится началом
координат.
Δ
Пример 13.8. Рассмотрим нелинейную систему с одним входом и одним
выходом, представленную дифференциальным уравнением η-го порядка
+g(z, ΖTM,. . . , z(m-l)?y>y(l)? _ ?y(»-l))z(m)? m < n? ^3^4)
гдеz —вход,у —выход,р(-) иq(-)
—
достаточно гладкие в рассматриваемой
области функции и q(-) φ 0. Эта нелинейная модель в терминах вход-выход сво
дится к модели передаточной функции линейных систем из примера 13.4. Рас
ширим динамику системы, добавив во входной канал последовательность из га
интеграторов, и определим и = z^ как вход расширенной системы
7
. Расширен
ная система имеет порядок (п + га). В модели состояния расширенной системы
в качестве переменных состояния выступают
с=
Ζ
у(тп-1)
,£=
У
У
„(1)
(п-1)
ИX
В этих переменных модель состояния имеет вид
С=AiC+Βη%
ξ = Α0ξ + Bc\p{x) + q(x)u],
У= 0€ξ,
7
В этом примере будет показано, что расширенная система является линеаризуемой по
входу-выходу. Это позволяет разработать закон управления с обратной связью с использованием
метода линеаризации по входу-выходу. При применении такого управления в исходной системе га
интеграторов становятся частью динамики регулятора.
13.2. ЛИНЕАРИЗАЦИЯ ПО ВХОДУ-ВЫХОДУ
555
где (АС^ВСУСС) — каноническая форма представления цепи η интеграторов
и (Аи,Ви) — управляемая пара, представленная в канонической форме и пред
ставляющая собой цепь из т интеграторов. Пусть D С j?n
+
m
—
открытая об
ласть, в которой ρ и q являются достаточно гладкими и q φ 0. С учетом специ
альной структуры (Ас, Вс, Сс) можно заметить, что
у^ =CcA\iпри1^г<η-1 иу
(п)
= р(х) + q(x)u.
Следовательно, система имеет относительную степень п. Для нахождения урав
нения нуль-динамики заметим, что L
l
r
l
h(x)
= & и, следовательно, Z* =
={хеД
п+т
|£ = 0} и u*(x) = —p(x)/q(x) вычисляется при ξ = 0. Таким
образом, нуль-динамика определяется уравнением
C = AuC + Buu*(x).
С учетом определения ξ можно показать, что £i = z удовлетворяет дифференци
альному уравнению m-го порядка
0=р(*,*(
1
\...,*<
т
-
1
\ОД...,о) +
+q (z,z
(1
>, ... ^"^СО,... ,θ) 2(т)
,
(13.25)
которое совпадает с уравнением, полученным из (13.24) при y(t) Ξ 0. В случае
линейных систем, уравнение (13.25) сводится к линейному дифференциально
му уравнению, соответствующему полиному в числителе передаточной функции.
Свойство минимальной фазовости системы может быть установлено путем ана
лиза (13.25). Для преобразования системы в нормальную форму заметим, что ξ
уже представляет собой вектор, элементами которого являются выход у и все его
последовательные производные, включая г/
71-1
). Поэтому нам осталось найти
функцию φ = φ(ξ, ξ) : i?n
+
m
—•R
m
9 удовлетворяющую уравнению
которое эквивалентно следующему:
|г- +1г«(аО=0
П
РИ К*<т.
(13.26)
В некоторых специальных случаях можно легко найти решения этих дифферен
циальных уравнений в частных производных. Например, если q является посто
янной, функция φ может быть выбрана в виде
Фг=Сг- -ξξη-m+i При 1<I<Ш.
Другой подобный случай рассматривается в упражнении 13.5.
Δ
556
ГЛАВА 13
13.3. Линеаризация по всем переменным состояния
Система с одним входом
x = f{x)+g(x)u,
(13.27)
где fug — достаточно гладкие в области D С Rn функции, является линеаризу
емой обратной связью, если существует достаточно гладкая функция h : D —> R,
такая что система
х = /(х) +д(х)щ
(13.28)
у=h(x)
(13.29)
имеет относительную степень η в области DQ С D. Это утверждение следует из
того факта, что нормальная форма системы с относительной степенью η имеет
вид
z = Acz + Bc-f{x) [и - а(х)],
(13.30)
у=Ccz.
(13.31)
С другой стороны, если система (13.27) линеаризуема обратной связью в соот
ветствии с определением 13.1, то существует замена переменных £ = S(x), такая
что преобразованная система имеет вид
£ = АС + &у(х)[и-а(х)]>
где пара (Д В) управляема и j(x) φ- 0 в некоторой области. Для любой управля
емой пары (Д В) можно найти невырожденную матрицу М, такую что при со
ответствующем преобразовании пара (А, В) приводится к канонической форме
управляемости,
8
т. е. МАМ~
1
=Ас+Вс\
т
и MB = ВС9 где (Д., Вс) представ
ляет цепь из η интеграторов. Замена переменных
z=МС=MS{x)
d
= T(x)
приводит систему (13.27) к виду
z = Acz + Bcj(x)[u - а(х)],
гдеу(х) =j(x) иа(х) —а(х) —X
T
MS(x)/y(x). Поскольку
._&г.
z
~
дх
х
>
См., например, книгу [158].
«Каноническое представление управляемости» или «Управляемое каноническое представле
ние», см. также [ДЗ, Д4]. —Прим. ред. перев.
13.3. ЛИНЕАРИЗАЦИЯ ПО ВСЕМ ПЕРЕМЕННЫМ состояния
557
равенство
АсТ(х) + Вс7(х)[и - «(*)] = g[/(x) + д(х)и]
должно выполняться в рассматриваемой области для всех хии. Положив и = О,
мы разделяем предыдущее уравнение на два уравнения:
ЦДя) = АсТ(х) - Вса(х)у(х),
(13.32)
2£д(х) = Всф).
(13.33)
Уравнение (13.32) эквивалентно системе
§/(*) = Т2(х),
^/(»)=Тз(х),
^/(х) - Тп(х),
|^/(х) =
-а(хЫх).
В свою очередь, уравнение (13.33) эквивалентно системе
ети-1
^(Χ) = 7(Χ)^0.
Полагая /i(x) = 7\(х), получаем
Г<+1(ж) = LfTi(x) = L}h(x), г = 1,2,... ,п - 1.
Функция /&(#) удовлетворяет дифференциальному уравнению в частных произ
водных
LgL)-
l
h(x) =0,г=1,2,...,η-1,
(13.34)
при
LgL
n
flh(x) φ 0,
(13.35)
558
ГЛАВА 13
и α, 7, определяемых равенствами
гП—1
7(х) = LgL
n
flh{x),
a{x) =
-
Ln
fh(x)
LgL
n
flh(x)
(13.36)
Суммируя все вышесказанное, можно отметить, что система (13.27) явля
ется линеаризуемой обратной связью, если и только если существует функция
h(x), такая что система (13.28)—(13.29) имеет относительную степень п, или, эк
вивалентно, функция h удовлетворяет дифференциальному уравнению в частных
производных (13.34) при выполнении условия (13.35). Существование функции h
обусловлено необходимыми и достаточными условиями на векторные поля / и д.
Для формулировки этих условий используются понятия скобок Ли и инвариант
ных распределений, которые будут введены ниже.
Длядвухвекторныхполей/иgнаDСRn
скобка Ли (Lie bracket) [/, g]
определяется как векторное поле
1/.Ж*) £'«-!*>·
где [дд/дх] и [df/dx] — матрицы Якоби. Повторные скобки Ли векторного поля g
по векторному полю / определяются следующим образом:
adPfg(x) = g{x)y
adfg(x) = [f,g](x),
ad)g(x) = [/,adj_1
ff](a:), k > 1.
Очевидно, что [/,g] = — [#, /]· и для постоянных векторных полей / и g справед
ливо [/,#] = 0.
Пример 13.9. Пусть
Тогда
/(*)
оо
10
-XI
Х\ +Х2
Ж2,
—
sinx\• Х2
о,
XI
Х2
-sinxi
def
Х2
о
•COSХ\
о
XI
adjg,
ad}g = [/, adfg]
-10
^2
1 1II—sinх\ —Х2
—Х\ — 2X2
х\+ Х2—sinх\ —х\ cos х\
о
cos xi
1
-1
-xi
Xl +X2
Δ
13.3. ЛИНЕАРИЗАЦИЯ ПО ВСЕМ ПЕРЕМЕННЫМ состояния
559
Пример 13.10. Если f(x) = Ах ид — постоянное векторное поле, то
adfg(x) = [f,g](x) =
-Ад,
оЩд = [f,a,dfg] = ~А(-Ад) = А
2
д
ad)g = (-l)kA
k
g.
Δ
Для векторных полей Д, /2,..., fk на D с R
n
определим
А(х) = span{/i(x), /2(х),..., /*(х)}
как подпространство R
n
,
натянутое на векторы /i(x), /2(ж),...,/fe(x) в каж
дой фиксированной точке х £ D. Семейство всех векторных пространств Δ (ж)
для х £ D называется распределением (distribution) и записывается следующим
образом:
A = span{/i,/2,...,/fc}.
Размерность Δ (ж), определенная равенством
dim(A(x)) = rank[/i(x), /2(ж),..., Λ (ж)],
может отличаться для различных точек ж, но если Δ = span{/i,..., Д}, где
{/i(x),..., fk(x)} линейно независимы для всех х £ D, то dim(A(x)) = А: для
всех х £ D.B этом случае мы будем говорить, что Δ — невырожденное распре
деление на!)с генераторами /ь ..., /*. Распределение Δ называется инволю-
тивным, если
дх£Δ и д2£А=> \gu92]6Δ.
Если Δ — невырожденное распределение на D с генераторами /ь..., /ь то мож
но показать (см. упражнение 13.9), что Δ инволютивно, если и только если
[£,/,·] 6Δ, Vl^M<fc.
Пример 13.11. Пусть J9 = Д
3
и Δ = span{/i, /2}, где
Г2х2 "
1
L°
,
/2=
"11
0
.
х
2J
Можно показать, что dim(A(a:)) = 2 для всех х £ D и
[/b/2]--^/l-^/2-
560
ГЛАВА 13
Векторное поле [/ъ /г] £ Δ, если и только если rank[/i(x), /2(ж), [/i, /2](ж)] = 2
для всех х е D. Однако
гапк[Д(х), /2(ж), [/ь /г](ж)] = rank
2х210,
100,
L0х21
-3, VxeD.
Следовательно, Δ инволютивно.
Δ
Пример13.12. ПустьD ={х е В?\х\ + х\ Φ0}иΔ = span{/i,/2}, где
/i=
2х3
-1
0
,
/2
-XI
-2х2
Можно показать, что dim(A(x)) = 2 для всех х е D,
гл fl
9/2
dfi
-4x3
2
0
rank[/i(x), /2(x), [/1, /2] (ж)] = rank
2x3 -xi
-4x3,
-1
-2x2 2,
0
x3
0
= 2, VxED.
Поэтому [/ъ/г] € Δ. Поскольку [/2,/i] = —[/15/2], заключаем, что Δ инволю
тивно.
Δ
Введя все эти понятия, мы можем охарактеризовать класс систем, которые
могут быть линеаризованы обратной связью.
Теорема 13.2. Система (13.27) является линеаризуемой обратной связью,
если и только если существует открытая область DQ С D, такая что
1) матрица G{x) = [g(x),adfg(x),...
,асГГ~ д(х)] имеет ранг η для всех
хеD0;
2) распределение D = span{p, ао!/#,..., a(Pl~
2
g} инволютивно в DQ.
ДОКАЗАТЕЛЬСТВО. СМ. приложение С.22.
Π
В следующих трех примерах мы проиллюстрируем применение теоре
мы 13.2 и рассмотрим различные подходы к решению дифференциальных урав
нений в частных производных (13.34). Во всех примерах мы будем предполагать,
что система (13.27) имеет точку равновесия х* при и = 0. Выберем h(x) так, что
бы /i(x*) = 0. Тогда замена переменных z = T(x) переводит точку равновесия
х=х*вначалокоординатz=0.
13.3. ЛИНЕАРИЗАЦИЯ по ВСЕМ ПЕРЕМЕННЫМ состояния
561
Пример 13.13. Рассмотрим снова систему
asinX2
+
def
f(x)+gu
из параграфа 13.1. Имеем
adfg=[f,g] =
—^g
—a cos X2
О
Матрица
G = [д, adfg]
0 —αcos#2,
1
О
имеет ранг два для всех х, таких что cos Х2 φ 0. Распределение V = span{#}
является инволютивным. Следовательно, условия теоремы 13.2 выполнены в об
ласти Do = {х Ε R2\ cos#2 Φ 0}. Для нахождения замены переменных, преобра
зующей систему к виду (13.6), найдем функцию h(x), удовлетворяющую
d(Lfh)
dx
дфО и Λ(0)=0.
Из условия [dh/dx]g = 0 получаем
dh.
dx^
dh
дх2
0.
Таким образом, h не должна зависеть от переменной Х2. Поэтому
dh
Lfh(x) = ——α sin #2-
J
OX\
Условие
d(Lfh)
d(Lfh)
-9=
dx
8X2
dh
dx\
acosX2φ0
выполнено в области DQ9 что обусловлено выбором функции h, при котором
справедливо (dh/dxi) φ 0. Полагая h{x) = x\, получаем ранее полученное
преобразование. Можно выбрать другую функцию h, например, h(x) = х\ +
+ х\. При этом соответствующая замена переменных также приводит систему
к виду (13.6).
Δ
Пример 13.14. Манипулятор с одним звеном, упругим соединением и пре
небрежимо малым демпфированием может быть представлен моделью четверто
го порядка (см. упражнение 1.5):
*= /0*0+ди,
562
ГЛАВА 13
где
Х2
—a
sinxi —Ъ{х\—xz)
Х4
c(xi - хз)
»9=
'0
0
0
.
d
No
и а, Ь, end — положительные константы. Свободная система имеет точку рав
новесия в х = 0. Имеем
adf9=[f,9}= —^9 =
0
0
-d
0
Матрица
adJ9=[f,adf9\
diad
f9
9f.
adJ9 = [/, adfg] = —x-adfg =
дх
0
bd
О
—cd
-bd
0
cd
0
Q = \g, adfg, adjg, adjg]
0
0
0
d
0
0
-d
0
0
bd
0
—cd
-bd
0
cd
0
имеет полный ранг для всех х G R4
.
Распределение Δ = span(p, adfg, adfeg)
глобально инволютивно, т. к. #, adfg и adZg являются постоянными векторны
ми полями. Таким образом, условия теоремы 13.2 выполнены для всех х G R4
.
Для нахождения замены переменных, преобразующей уравнение состояния к ви
ду (13.6), найдем функцию h(x), удовлетворяющую
d(Ifflh)
дх
9=0, * = 1,2,3,
d{L)h)
дх
д^О
и Л(0)=0.
Из условия [dh/dx]g = 0 имеем (dh/dx±) = 0. Поэтому мы должны выбрать h
так, чтобы эта функция не зависела от переменной х±. Тогда
Lfh(x) = ^-х2 + ^[-asinx! - Ъ(Х1 - хз)] + Ц^·
13.3. ЛИНЕАРИЗАЦИЯ ПО ВСЕМ ПЕРЕМЕННЫМ состояния
563
Из условия [d(Lfh)/dx]g — 0 получаем
^
=0^
=0.
ΟΧΙ
ΟΧ3
Поэтому мы должны выбрать функцию h так, чтобы она не зависела от х%. Тогда
выражение для Lfh упрощается и принимает вид
Lfh(x) = -—х2 + тч—[ -a sin xi - b(xi - s3)]·
Кроме того,
d(Lfh) [ d(Lfh)T
.
Ч1 , d(Lfh)
Lfh(x) = —τ: Х2Η -к
[-asmxi
-
b(xi- x3)JΗ -^
#4·
Наконец,
d(L}h)
d(Lfh)
dh
1
-
0=* у
;
=0=*|2-=0,
9^4
dxs
8x2
и поэтому мы должны выбрать h так, чтобы она не зависела от #2- Тогда
d(L2
fh)
d(L2
fh)
d(L)h)
Lfh(x) = —j. X2Η TJ [-asinx\ -b[x\- ж3)]Η TJ #4
и условие [<?(Lr/i)/da;](7 7^ 0 выполнено при (dh/dxi) φ 0. Таким образом,
приходим к выбору h{x) = x\. Замена переменных
z\ =h(x) = х\,
Z2 = Lfll(x) = X2,
zs = L/fh(x) = —asin^i — b{x\ — #3),
Z4=L
3
fh(x)= —ax2cosx\ —b(x2—#4)
преобразует уравнение состояния к виду
h=Z2,
h=23,
23=24,
Z4= —(acosz\+b+c)zs+a(z^ —c)sinz\-f-frdu,
соответствующему форме представления (13.6). В отличие от предыдущего при
мера, в рассматриваемом здесь случае уравнение состояния в z-координатах
определено глобально, т. к. z = Т(х) является глобальным диффеоморфизмом. Δ
564
ГЛАВА 13
Пример 13.15. В примерах 13.3 и 13.7 мы рассматривали модель электри
ческого двигателя постоянного тока, представленную в виде уравнения состоя
ния третьего порядка
я=/0*0+9Щ
где
—ах\
— 6X2+к—CXiXs
вх\Х2
>9=
'1
0
0
No=
и α, 6, с, θ и к — положительные константы. Мы показали, что, в случае ко
гда выход выбран в виде у = х%, эта система имеет относительную степень,
равную двум и, следовательно, является частично линеаризуемой обратной свя
зью. Рассмотрим вопрос о линеаризуемости этого уравнения состояния по всем
переменным состояния. Имеем
а
схз
-0X2
adf9= [f,g] •-
Определитель матрицы
G = [д, adfg, adjg]
o>d)g = [/, adfg] =
a*
(α + b)cxs
I (b- а)вх2 -вк ]
10
a
2
О схз
(α + b)cxs
0-0x2(b-а)вх2-вкJ
определяется равенством
det Q = св(-к + 26x2)x3.
Следовательно, g имеет ранг три при Х2 φ к/2b и хз Φ 0. Распределение V —
—
span{#, adfg} инволютивно, если [д, adfg] G V. Имеем
d{adfg)
[g,adfg] =
^
g=
0
0
0
00'
0с
-Θ0
"1
0
0
Следовательно, V инволютивно, и условия теоремы 13.2 выполнены в области
D0 = {x G Д3|х2 > |их3>0}.
Найдем функцию h, удовлетворяющую (13.34) и (13.35). Свободная система име
ет множество точек равновесия при х\ — 0, Х2 = к/Ъ. Выберем в качестве же
лаемой рабочей точки х* = [0, к/Ъ, и>о]
т
, где ω$ — заданное желаемое значение
13.3. ЛИНЕАРИЗАЦИЯ ПО ВСЕМ ПЕРЕМЕННЫМ состояния
565
угловой скорости хз· Необходимо найти функцию h(x), удовлетворяющую урав
нениям
dhn n.
d(Lfh)
d(LJh)
при h(x*) = 0. Из условия
—
а=^
=О
дх
дх\
видно, что h не должна зависеть от х\. Поэтому
Lfh(x) = - —[ -Ьх2 + к - cxixs] + ~κ—##i#2·
Из условия [d(Lfh)/dx]g = 0 получаем равенство
которое справедливо, если h имеет вид
h= с\[6x2+cxl\ +С2,
где с\ и С2 — некоторые константы. Пусть с\ = 1. Тогда, для того чтобы было
выполнено условие h(x*) = 0, положим
с2 = -0(*Ю
2
-
с(х*3)
2
= -9(k/b)2
-
cul
При таком выборе /г, Lfh и 1Д/ь определяются равенствами
Lfh(x) = 29х2(к — bx2), L
2
h(x) = 26{к — 2bx2)(—bx2 + к — сх\х^).
Следовательно,
-£ -9
= ^L-
=
- 2c9(k-2bx2)xs,
и условие [d(L2fh)/dx]g φ 0 выполнено при Х2 φ к/2Ъ и хз Φ 0. Предполагая
#з > 0, можно легко показать (упражнение 13.15), что отображение z = Т(х)
является диффеоморфизмом на Do и уравнение состояния в z-координатах опре
делено в области
Dz =T(D0) =Le i?3|^i>θφ
2
(Ζ2) - в(к/Ь)2
-
о4 иΖ2< ^|,
где ф(-)
—
обратное отображение для отображения Ζ2 = 2вх2(к — Ъх2), которое
определено при Х2 > к/2Ь. Открытая область Dz содержит начало координат
г=0.
Δ
566
ГЛАВА 13
13.4. Управление с обратной связью по состоянию
13.4.1. Стабилизация
Рассмотрим частично линеаризуемую обратной связью систему вида
Ч = /о(ч,0,
(13-37)
ξ = Αξ + Bj(x)[u - а(х)},
(13.38)
где
it.
=Т(х)=
' ад1
. адj
Отображение Т(х) является диффеоморфизмом в области Dci?n
,Dz=T(D)
содержит начало координат, (А, В) — управляемая пара, ^(х) — невырожденная
матрица для всех х Ε D, /о(0,0) = 0 и /о(т/, 0>
а
(х)
и
7(ж) ~ непрерывно диф
ференцируемые функции. Наша цель в этом параграфе заключается в том, чтобы
построить закон управления с обратной связью по состоянию, который обес
печивает стабилизацию начала координат z = 0. Представление системы в ви
де (13.37)—(13.38) тесно связано с представлением линеаризуемой по входу-вы
ходу системы в нормальной форме (13.16)—(13.18). Однако в рассматриваемом
здесь случае уравнение (13.18) опущено, т.к. в задаче стабилизации по состо
янию выход у не рассматривается. Класс систем вида (13.37)—(13.38) включает
в себя также и системы, которые могут быть линеаризуемы обратной связью —
этот случай возникает, если опустить уравнение (13.37). В представленном ни
же анализе мы не будем ограничиваться рассмотрением лишь систем с одним
входом и одним выходом или линейных систем, для которых соответствующая
пара (А, В) управляема и представлена в канонической форме. Мы будем рас
сматривать системы общего вида (13.37)—(13.38), и полученные результаты бу
дут применимы (как частные случаи) к системам, представленным в нормальной
форме (13.16)—(13.18), а также к системам, линеаризуемым обратной связью.
Замена обратной связи по состоянию
и = а(х) 4- P(x)v,
гдеР(х) =7
-1
(#), приводит (13.37)—(13.38) к «треугольному» виду
Ч = /о(ч,0,
(13.39)
ξ=Αξ+Βν.
(13.40)
Уравнение (13.40) может быть стабилизировано обратной связью υ = —Κξ,
где К выбрана так, чтобы матрица (А — В К) была гурвицевой. Асимптотическая
устойчивость начала координат всей замкнутой системы
η = Μη,ξ),
(13.41)
ξ=(Α- ΒΚ)ξ
(13.42)
следует из асимптотической устойчивости начала координат уравнения η =
= /о(»7,0). Это утверждение сформулировано в виде следующей леммы.
13.4. УПРАВЛЕНИЕ С ОБРАТНОЙ связью по состоянию
567
Лемма 13.1. Начало координат (13.41)-(13.42) является асимптотически
устойчивым, если начало координат η = /о(?7,0) является асимптотически
устойчивым.
ДОКАЗАТЕЛЬСТВО. ИЗ обратной теоремы Ляпунова 4.16 следует, что суще
ствует непрерывно дифференцируемая функция Ляпунова ν\(η), такая что нера
венство
^/о(>?,ОК-аз(|М|)
выполнено в некоторой окрестности η = 0, где аз — некоторая /С-функция. Пусть
Ρ=Р
Т
> 0 — решение уравнения Ляпунова Р(А — ВК) + (А — ВК)ТР = —I.
Используем ν(η, ξ) = Vi (77) + к\/^
т
Р^, где к > 0, в качестве функции Ляпунова
для системы (13.41)—(13.42)9
. Производная V определяется равенством
V = TST/оЫ) + -η!ψ=?\Ρ{Α - ВК) + (А- ВК)ТР%
'
2γξ Ρξ
В любой ограниченной окрестности начала координат с использованием свой
ства непрерывной дифференцируемоеTM функций V\ и /о можно получить оцен
ку
v-^-«3(INI) + *illill-**2llill.
где к\ и к2 — некоторые положительные константы. Выбор к > k\jk<i обеспечи
вает отрицательную определенность V. Следовательно, начало координат асимп
тотически устойчиво.
Π
Из предыдущего обсуждения следует, что минимально-фазовая линеаризу
емая по входу-выходу система может быть стабилизируема с использованием
обратной связи по состоянию
и = а(х) - Р(х)КТ2{х).
(13.43)
Управление (13.43) не зависит от Т\{х). Поэтому оно не зависит от функ
ции ф, удовлетворяющей дифференциальному уравнению в частных производ
ных (13.15).
Доказательство леммы 13.1 справедливо лишь для ограниченных множеств.
Следовательно, оно не может быть обобщено на случай глобальной асимпто
тической устойчивости. Для того чтобы доказать глобальную асимптотическую
устойчивость системы, необходимо наложить на систему η = fo(v,0 дополни
тельное требование — она должна быть устойчивой по входу-состоянию при ξ,
рассматриваемом в качестве входа.
9
Функция ν(η,ξ) является непрерывно дифференцируемой в окрестности начала координат,
за исключением многообразия ξ — 0. Функция ν(η,ξ) и ее производная ν(η,ξ) определены
и непрерывны в окрестности начала координат. Легко показать, что утверждение теоремы 4.1
справедливо для рассматриваемого случая.
568
ГЛАВА 13
Лемма 13.2. Начало координат системы (13.41)-(13.42) глобально асимп
тотически устойчиво, если система η = /ο(η,ξ) является устойчивой по
входу-состоянию.
ДОКАЗАТЕЛЬСТВО. Примените лемму 4.7.
Π
Как мы видели в параграфе 4.10, устойчивость по входу-состоянию систе
мы η = /о (??,£) не следует из глобальной асимптотической или даже экспонен
циальной устойчивости начала координат системы η = /о(^,0). Следовательно,
выполнение свойства «глобальной» минимальной фазовости линеаризуемой по
входу-выходу системы не гарантирует, что закон управления (13.43) обеспечи
вает глобальную стабилизацию системы. Этот закон управления будет обеспе
чивать глобальную стабилизацию, если начало координат системы η = fo(v,fy
является глобально экспоненциально устойчивым и функция fo{Vi& является
глобально липшицевой по (η, ξ), т. к. в этом случае из леммы 4.6 будет следовать,
что система η — /ο(η,ξ) является устойчивой по входу-состоянию. В противном
случае свойство устойчивости по входу-состоянию следует устанавливать путем
дополнительного анализа системы. Условие глобальной липшицевости иногда
называют условием линейного роста (linear growth). Следующие два примера
иллюстрируют те сложности, которые могут возникнуть в случае, если условия
линейного роста не выполняются.
Пример 13.16. Рассмотрим систему второго порядка
η=-η+η
2
ξ,
ξ=ν.
Начало координат η = — η глобально экспоненциально устойчиво, но система
η= —η+η
2
ξ не является устойчивой по входу-состоянию. Этот факт может
быть установлен, если заметить, что из £(£) Ξ 1 и 7/(0) ^ 2 следует ?)(£) ^ 2
и поэтому η неограниченно возрастает. С другой стороны, из леммы 13.1 следу
ет, что линейное управление ν = —fc£,k > 0, стабилизирует начало координат
всей системы. В действительности при таком законе управления начало коорди
нат будет экспоненциально устойчиво. Однако этот линейный закон управления
не обеспечивает глобальную асимптотическую устойчивость начала координат.
Полагая ν — ηξ и и заметив, что
ν=ηξ+ηξ= -fa£-ηξ+η
2
ξ2
= -(1+k)v+г/
2
,
получаем, что множество {ηξ < 1 + к} положительно инвариантно. На границе
ηξ = 1+fc траектория определяется равенствами η(η = βΗη(0) и £(t) = e~
kt
£(0).
Тогда η(1;)ξ(1) = 1 + k. Внутри множества {ηξ < 1 + fc} функция v(t) будет строго
убывающей и после конечного момента времени Τ будет выполнено v(t) ^ 1/2
для всех t > Г. Таким образом, ηη ^ — (1/2)η2 для всех t ^ Г, и из этого нера
венства следует, что траектория стремится к началу координат при t, стремящем
ся к бесконечности. Следовательно, множество {ηξ < 1 + к} представляет собой
точную область притяжения. Из этого результата следует, что начало координат
13.4. УПРАВЛЕНИЕ С ОБРАТНОЙ СВЯЗЬЮ по состоянию
569
не является глобально асимптотически устойчивым, однако легко заметить, что
область притяжения расширяется при увеличении к. В действительности, выби
рая достаточно большую константу fc, мы можем обеспечить включение сколь
угодно большого компактного множества в область притяжения. Таким образом,
линейное управление с обратной связью υ — — к£ может обеспечить полугло
бальную стабилизацию.
Δ
Если начало координат системы η = /о(?7,0) глобально асимптотически
устойчиво, можно было бы ожидать, что треугольная система (13.39)—(13.40)
может быть глобально (или по крайней мере полуглобально) стабилизируема
с использованием линейной обратной связи υ = — К ξ, построенной так, чтобы
собственные значения матрицы (А — ВК) располагались в левой полуплоскости
комплексной плоскости и достаточно далеко от мнимой оси, что обеспечило бы
произвольно быстрое стремление решений системы ξ = (Α—ΒΚ)ξ к нулю. Тогда
решения системы η = /о(77, £) быстро стремились бы к решениям системы η =
= /о(т7,0), поведение которых соответствует нашим целям, т. к. начало координат
этой системы глобально асимптотически устойчиво. Может даже показаться, что
именно эта стратегия использовалась в предыдущем примере для достижения
полуглобальной стабилизации. Однако этот подход применим не всегда, и это
показывает следующий пример
10
.
Пример 13.17. Рассмотрим систему третьего порядка
ii=6,
£2=ν
Применение линейной обратной связи
ν=-к% -2кЬ
d
^
f
-Κξ
приводит к линейной системе с матрицей
А-ВК=01,
-к
2
-2к
собственными значениями которой являются —к и —к. Из выражения для мат
ричной экспоненты
(1 + kt)e~
kt
te~
kt
,
-k
2
te~
kt
(1 - kt)e~
kt
e(A-BK)t
=
видно, что при к —• оо решение £(£) стремится к нулю произвольно быстро. За
метим, однако, что коэффициент при элементе (2,1) матичной экспоненты пред
ставляет собой квадратичную функцию от к. Можно показать, что абсолютное
'Случай успешного применения этого подхода рассмотрен в упражнении 13.20.
570
ГЛАВА 13
значение этого элемента матрицы принимает максимальное значение к/е при t =
= 1/к. Несмотря на то что имеется возможность обеспечить произвольно быст
рое стремление этого члена к нулю путем выбора достаточно большого коэффи
циента к, в переходном процессе эволюции этой величины имеется пик поряд
каfc
11
.Взаимодействие этого пика с нелинейным ростом может привести к деста
билизации системы. В частности, для начальных состояний 77(0) = 770, £i(0) = 1
и
Ы0) = 0 получаем &0О = -k
2
te~
kt
и
i) = -i(l-fc
2
te-*V.
Во время образования пика коэффициент при η
3
положителен, что обуславли
вает рост |r/(i)|. Через некоторое время коэффициент при η
3
может стать отри
цательным, но если система имеет конечное время ухода на бесконечность, это
не позволит заново стабилизировать систему. Действительно, из выражения для
решения
видно, что если η$ > 1, то рассматриваемая система имеет конечное время ухода
на бесконечность при достаточно большом к.
Δ
Мы вернемся к рассмотрению треугольной системы (13.39)—(13.40) в пара
графах 14.3 и 14.4, где будет представлен закон управления υ в виде нелинейной
функции от ξ и η, который обеспечивает глобальную стабилизацию. Этот резуль
тат будет получен с использованием метода бэкстеппинга из параграфа 14.3 и на
основе метода пассивности из параграфа 14.4. Мы также рассмотрим случаи,
когда система η = /о(?7,0 не является устойчивой по входу-состоянию.
Метод линеаризации обратной связью предлагает простую и систематиче
скую процедуру построения стабилизирующих законов для класса нелинейных
систем, однако при его использовании возникают законные вопросы о робастно-
сти и эффективности полученных законов управления. В заключение параграфа
мы рассмотрим именно эти аспекты.
Метод линеаризации обратной связью основан на полном исключении нели
нейных членов о; и 7, и для этого требуется точно знать α, β = 7
-1
и Т2. С прак
тической точки зрения это требование представляется невыполнимым вследствие
наличия некоторой идеализации модели, ее параметрической неопределенности,
а также по причине неизбежного возникновения вычислительных ошибок. Наи
более вероятный сценарий предполагает, что регулятор будет реализован на ос
нове функций α, β и Т2, представляющих собой аппроксимации α, β и Т2, т.е.
закон управления с обратной связью будет иметь вид
и = а(х)-$(х)КТ2(х).
"Явление образования пиков (резких максимумов) при переходном процессе рассматривает
ся в работе [188]. В качестве иллюстрации систем, в которых это явление наблюдается, можно
рассмотреть наблюдатели с сильной обратной связью (см. параграф 14.5).
13.4. УПРАВЛЕНИЕ С ОБРАТНОЙ связью по состоянию
571
В этом случае соответствующая замкнутая система принимает следующую
форму:
*7 = /о(»7>0>
£ = Αξ + Вф)[а(х)
-
Р(х)КТ2(х) - а(х)\.
Прибавляя и вычитая из правой части второго уравнения член ΒΚξ, мы можем
переписать эту систему:
η = Μη,0,
(13-44)
ξ = (Α- ΒΚ)ξ + BS(z),
(13.45)
где
δ(Ζ)=φ){α(Χ)-α(Χ)
+ [β(Χ)-β(Χ)}ΚΤ2(Χ) + β(Χ)Κ[Τ2(Χ)-Τ2(Χ)}}\
.
\x=T~
L
(z)
Таким образом, замкнутая система представляет собой возмущение номинальной
системы
ξ = (Α-ΒΚ)ξ.
С учетом результатов главы 9 можно ожидать получение приемлемых результа
тов, если ошибка S(z) мала. Следующие две леммы подтверждают это предпо
ложение. Начнем наш анализ со случая линеаризуемых обратной связью систем,
для которых соответствующее уравнение замкнутой системы упрощается и при
нимает вид
z = (A- BK)z + BS(z).
(13.46)
Лемма 13.3. Рассмотрим замкнутую систему (13.46), где (А — В К) —
гурвицееа матрица. Пусть Ρ = Р
Т
> 0 — решение уравнения Ляпунова
Р(А-ВК) +(А-ВК)ТР
=
-I
и к — неотрицательная константа, значение которой меньше 1/(2||Р#||2).
• Если \\S(z)\\ < fc||z|| для всех z, то начало координат системы (13.46) гло
бально экспоненциально устойчиво.
• Если \\6{z)\\ < k\\z\\ + ε для всех z, то состояние z глобально предельно
ограничено величиной ее для некоторой с > 0.
ДОКАЗАТЕЛЬСТВО. Пусть V(z) = z
T
Pz. Тогда
V=z
T
[P(A - ВК) +(А- BK)TP)z + 2z
T
PB6(z),
<-|Н|1 + 2||РВ||2|И|2||^)||2.
572
ГЛАВА 13
Если ||5(^)||2 ^ &IN|2 + ε> ползаем
V < -\\z\\l + 2ft||PB||2||s||| + 2ε||ΡΒ||2||*||2 =
= -(1 - вг)\\г\\1 - вфЩ + 2Й||РВ||2||*|Ц + 2ε||ΡΒ||2||*||2,
где константа θ\ £ (0,1) выбрана достаточно близко к единице, так чтобы к <
0i/(2||PB||2). Тогда
V^-(l-e1)\\z\\
2
2
+ 2e\\PB\\2\\z\\2.
Если ||5(^)||2 < &IN|2, полагаем в предыдущем неравенстве ε = 0 и заключаем,
что начало координат глобально экспоненциально устойчиво. Если ε > О,
*<-(!- fli)(l - в2)||г||1, V ||*||2 > ψ^τ
&
= εοο,
(1 - Vx)t>2
где 02 Ε (0,1). Из теоремы 4.18 следует, что z(t) глобально предельно ограничено
ВеЛИЧИНОЙ ECQ V%nax(-P)/Amin (Ρ) ·
Π
Из приведенного доказательства видно, что если оценка на S(z) выполнена
лишь в окрестности начала координат, то мы можем доказать лишь локальную
версию этой леммы.
Пример 13.18. Рассмотрим уравнение маятника
±1=Х2,
±2= —asin(xi +δ{)—Ьх2 +см,
где xi = θ — Si, Х2 = 0ии = Т — вращающий момент, рассматриваемый
в качестве управления. Цель состоит в стабилизации угла наклона маятника θ =
= Si. Линеаризующая и стабилизирующая обратная связь имеет вид
м= (§Jsin(zi+<*i)- iс)(
fc
ixi +
fc
2#2),
где ki иfc2выбраны так, чтобы матрица
А-ВК=О
1
•fa -{к2 + Ъ)
была гурвицевой. Предположим, что вследствие неопределенности в задании па
раметров α и с управление реализуется в виде
и=(?Jsin(xi+Si)-(
-
J (faxi + /c2x2),
13.4. УПРАВЛЕНИЕ С ОБРАТНОЙ связью по состоянию
573
где α и с — оценки α и с. Замкнутая система имеет следующий вид:
#2= —kiXi- (fc2+&)^2+5(ж),
где
5(х) = ( 9£—1!£.J sin(xi + δ\) - ( ^-7-^ J (hxi + &2#2).
Член ошибки S(x) глобально удовлетворяет оценке \6(х)\ < к\\х\\2 + ε, где
к=
ас—ас
+
с—су/с1+А:2,
ас — ас |sin5i|.
Константы fc и ε являются мерой величин ошибок оценивания параметров α и с.
Пусть матрица
ρ_ГРп Рп,
L Pl2 P22
является решением уравнения Ляпунова Р(А — ВК) + (А — ВК)ТР
= —I. Если
1
к<
2VPl2+P22
J"
решения системы глобально предельно ограничены величиной, которая пропор
циональна ε. Если sin δ\ = О, предыдущая оценка для к гарантирует глобальную
экспоненциальную устойчивость начала координат.
Δ
Обратимся к рассмотрению более общего случая, когда замкнутая система
имеет вид (13.44)-(13.45).
Лемма 13.4. Рассмотрим замкнутую систему (13.44)-(13.45), где А —
—
ВК — гурвицева матрица.
• Если ||S(z) || ^ ε для всех z и система η = /о(т7,£) устойчива по входу-со
стоянию, то состояние z глобально предельно ограничено KL-функцией от
е.
• Если \[8{z)\\ ^ k\\z\\ β некоторой окрестности z = 0 при достаточно ма
лой к и начало координат системы η = /о(?7,0) экспоненциально устойчиво,
то z = 0 является экспоненциально устойчивой точкой равновесия систе
мы (13.44)-(13.45).
ДОКАЗАТЕЛЬСТВО. Пусть ν(ξ) = ξτΡξ, где Ρ = Ρτ > 0 — решение урав
нения Ляпунова Р(А - ВК) + (А - ВК)ТР
= -L Тогда
V =ξτ[Ρ(Α - ВК) +(А - ΒΚ)τΡ]ξ + 2ξτΡΒδ(Ζ)
<-||i|li + 2||PB||2||€||2||i(z)||2.
574
ГЛАВА 13
Если ||й(^)||2 ^ £> получаем
V < -ΙΚΙΙ1 + 2ε||ΡΒ||2||ξ||2 < -|||ξ|||, V||e||2 ^ 4e||PB||2.
Следовательно, с использованием теоремы 4.18 заключаем, что существуют ко
нечный момент времени to и положительная константа с, такие что
|Ш|2<С6, Vt^to·
С учетом устойчивости по входу-состоянию системы η = fo(ViO получаем
Нч(*)112^А)(|1ч(*о)||2,*-*о) +
+ 7o(sup U(t)h) < Po(\\v(to)h,t- t0) + 7o(ce),
где ft и 7o - соответственно /C£- и /С-функции. Член βο(\\ν(^ο) h, t — to) удовле
творяет неравенству βο ^ ε после некоторого конечного момента времени. По
этому величина ||z(£)||2 предельно ограничена /С-функцией вида се + ε + 7о(с£)·
Для доказательства второго пункта леммы заметим, что в соответствии с теоре
мой 4.14 в некоторой окрестности точки η = 0 существует функция Ляпунова
ν\(η), такая что
cilMl! < УМ < ca||t7||l, ^/о(ч,0) < —оз||*7|Ц,
avi
5т?
< с4||»7||2·
Используя V(z) = bV\{q) + ξτΡξ, b > 0, в качестве функции Ляпунова для
системы (13.44)-(13.45), получаем
*
=
Ь
^Л(»7,0) + Ь^[/о(»7,0-/о(»7,0)] +
+ ξτ{Ρ(Α - ВК) + (А- ΒΚ)τΡ]ξ + 2ξτΡΒδ{Ζ) «ξ
< -bczHW + 6c4L||»/||2||ei|2 - M\\l + 2k\\PB\\2Uf2 + 2*||ΡΒ||2||ξ||2|Μ|2 =
def
\\m\2,
bc3
-(k\\PB\\2 + bc4L/2)
-(k\\PB\\2 + bc4L/2)
1 - 2fc||PB||2
1Mb,
IKII2
def
Q MbJ'
где L — константа Липшица для функции /о по ξ. Полагая b = к, можно пока
зать, что Q положительно определена при достаточно малой к. Поэтому начало
координат экспоненциально устойчиво.
Π
В упражнениях 13.22-13.24 представлены различные версии леммы 13.4. Ес
ли система η = /о(?7,£) не является устойчивой по входу-состоянию, но начало
координат системы η = /о(τ/, 0) асимптотически устойчиво, то можно доказать
13.4. УПРАВЛЕНИЕ С ОБРАТНОЙ связью по состоянию
575
локальную версию первого пункта леммы (см. упражнение 13.22). Если /(ту? О
глобально липшицева и начало координат системы η = /о (?7,0) глобально экс
поненциально устойчиво, то можно доказать глобальную версию второго пункта
леммы (см. упражнение 13.23). Если начало координат системы η = /ο(^0)
асимптотически, но не экспоненциально, устойчиво, то можно доказать асимп
тотическую устойчивость начала координат замкнутой системы в случае, если δ
зависит только от η (см. упражнение 13.24).
Обратная связь и = а{х) — Р(х)К£ имеет линеаризующий компонент и =
= a(x)+P(x)v и стабилизирующий компонент ν = — Κξ. Представленный выше
анализ показывает, что стабилизирующий компонент обеспечивает некоторую
степень робастности в условиях неопределенности модели
12
.
В главе 14 будет
показано, что стабилизирующий компонент может быть выбран так, что обес
печивается большая степень робастности в условиях предположения о принад
лежности члена возмущения B5(z) в (13.45) пространству значений столбцов
входной матрицы В. О подобном возмущении говорят, что оно удовлетворяет
условию согласованности (matching condition). Представленная в главе 14 мето
дология может гарантировать робастность системы для любой S(z) при условии,
что верхняя граница значений δ известна.
Основой метода линеаризации систем обратной связью является идея ис
ключения нелинейных членов. Однако при использовании этого метода наряду
с вопросами, связанными с возможностью осуществления такой замены, нали
чием в системе различных неопределенностей, вычислительными трудностями
нахождения этой замены и другими проблемами, следует рассмотреть и фило
софский аспект задачи: хороша ли сама по себе идея исключения из модели
нелинейных членов? Наша мотивация для выполнения этого действия была чи
сто математической. Мы хотим линеаризовать систему для того, чтобы упро
стить ее анализ и использовать многочисленные результаты в области линейного
управления. Однако с точки зрения конкретной реализации нелинейный член мо
жет быть «хорошим» или «плохим» и охарактеризовать его в этом смысле можно
лишь с учетом специфики рассматриваемой задачи. В качестве иллюстрации этих
вопросов рассмотрим два примера.
Пример 13.19. Рассмотрим скалярную систему
х=ах—Ьх
г
+и,
где а и Ъ — положительные константы. Линеаризующий и стабилизирующий
закон управления может быть выбран в следующем виде:
и=-(к+а)х+foe
3
,к>0.
Соответствующая замкнутая система имеет вид х = —кх. Представленная об
ратная связь исключает нелинейный член — Ьх
3
. Однако в действительности этот
12
3десь не рассматривается другой тип неопределенности модели, соответствующий чувстви
тельности относительной степени и свойства минимальной фазовости системы к параметрическим
возмущениям. Эти вопросы исследуются в работах [92] и [169].
576
ГЛАВА 13
член представляет собой «нелинейное демпфирование» и в рассматриваемом
примере обеспечивает ограниченность решений даже при отсутствии управления
и несмотря на то, что начало координат неустойчиво. Зачем же нам исключать
его? Если применить простое линейное управление
и= —(к+а)х,к>О,
мы получим замкнутую систему
X—— КХ ОХ^
начало координат которой глобально экспоненциально устойчиво и ее траектории
стремятся к началу координат даже быстрее, чем траектории замкнутой системы
х = — кх в случае использования нелинейной версии закона управления. Более
того, этот линейный закон управления более прост и его легче реализовать. Δ
Пример 13.20. Рассмотрим систему второго порядка
±1=х2,
#2 = —h{x\) Л-и,
где /г(0) = 0 и x\h(x\) > 0 для всех х\ Φ 0. Легко видеть, что система лине
аризуема обратной связью и соответствующий закон стабилизации может быть
выбран в виде
и = h{x{) - (fciffi + £2X2),
где к\ и к2 — выбраны так, чтобы собственные значения замкнутой системы рас
полагались в левой полуплоскости комплексной плоскости. С другой стороны,
с использованием результатов главы 7 о пассивных системах можно построить
закон управления с обратной связью вида
и = -а(ж2),
где σ — любая локально липшицева функция, удовлетворяющая σ(0) = 0
и
νσ(ν) > 0
П
РИ У Φ 0· Тогда замкнутая система будет пассивна и производ
ная функции Ляпунова V = J^
1
h(z)dz + (l/2)x| имеет вид
V=
— Χ2σ(Χ2).
Поскольку
x2(t) = 0 => x2(t) = 0^ /i(xi(i)) Ξ04 xi(t) = 0,
с использованием принципа инвариантности можно заключить, что начало коор
динат асимптотически устойчиво. Кроме того, закон управления и = — а(х2)
имеет два преимущества по сравнению с представленной выше линеаризую
щей и стабилизирующей обратной связью. Во-первых, в этом пассивном законе
управления не используется модель нелинейной функции h, и, следовательно, он
является робастным по отношению к неопределенности модели h. Во-вторых,
13.4. УПРАВЛЕНИЕ С ОБРАТНОЙ связью по состоянию
577
возможность выбора функции σ может быть использована для улучшения рабо
чих характеристик закона управления. Например, можно обеспечить соблюдение
ограничения \и\ < к, если в качестве закона управления выбрать и = — fcsat^).
Однако закон управления и = —σ(#2) не позволяет обеспечить требуемую ско
рость убывания x(t). Линеаризация замкнутой системы в окрестности начала
координат приводит к линейной системе с характеристическим уравнением
52
+σ
/
(0)5 + /1/(0)=0.
Один из двух корней этого уравнения не может быть перемещен в полуплоскость,
находящуюся левее прямой Re[s) = —у/ЩО). Законы управления с обратной
связью, при построении которых используются свойства пассивности системы,
будут рассмотрены в параграфе 14.4.
Δ
Эти два примера показывают, что существуют ситуации, когда нелинейно
сти выполняют полезную роль и их исключение может быть нецелесообразным.
При анализе системы следует предпринять все усилия для того, чтобы понять ха
рактер воздействия нелинейных членов на систему и на основании полученной
информации принять решение об исключении или не исключении этих членов.
Известно, что это непростая задача.
Вышеупомянутые вопросы робастности и эффективности, связанные с про
цедурой линеаризации системы обратной связью и построением соответствую
щего закона управления, не умаляют достоинств представленной в этой главе
теории линеаризации. Она содержит набор полезных средств для характериза-
ции класса нелинейных систем, структура которых позволяет разработать схемы
управления с исключением имеющихся нелинейностей, или без такового. По
нятия относительной степени и нуль-динамики нелинейных систем позволяют
с единой точки зрения рассмотреть в терминах вход-выход структуру линейных
и нелинейных систем и играют важную роль при обобщении на случай нелиней
ных систем некоторых процедур построения обратной связи, успешно исполь
зуемых для линейных систем. В этой связи в качестве примера можно упомя
нуть метод построения закона управления с сильной обратной связью. Если при
преобразовании системы в нормальную форму нелинейные члены оказываются
в полученном уравнении состояния в канале управления, возникает структура,
удовлетворяющая условию согласованности. Для подобных систем в главе 14
будет разработано несколько методик, позволяющих построить законы управле
ния, обладающие робастными свойствами.
13.4.2. Задача слежения
Рассмотрим линеаризуемую по входу-выходу систему с одним входом и од
ним выходом, представленную в нормальной форме (13.16)—(13.18):
ξ = Α€ξ + Всч(х)[и - а(я)],
У=ССЦ.
578
ГЛАВА 13
Не умаляя общности, будем предполагать, что /о (0,0) = 0. Задача состоит в раз
работке закона управления с обратной связью по состоянию, обеспечивающего
асимптотическое слежение по выходу у некоторого командного сигнала. В случае
когда система имеет относительную степень р = п, она не имеет нетривиальной
нуль-динамики. При этом переменная η и соответствующее уравнение в модели
состояния отсутствуют, но все остальные результаты для этой системы остаются
верными. Мы будем предполагать, что
• функция r(t) и ее производные до r^
p
\t) включительно ограничены для
всех t ^ 0 и производная р-го порядка r^ (t) является кусочно-непрерывной
функцией времени t;
• сигналы г,..., г(
р
) доступны для измерения в режиме реального времени.
Командный сигнал r(t) и его производные могут быть представлены в ви
де заданных функций времени, или они могут быть выходами соответствующей
эталонной модели с заданным входным сигналом w(t). В последнем случае вы
полнение упомянутых выше условий на г может быть обеспечено путем выбо
ра соответствующей эталонной модели. Например, для систем с относительной
степенью, равной двум, в качестве эталонной модели можно взять линейную, не
зависящую от времени систему второго порядка, представленную передаточной
функцией
s
2
+ 2Cu;ns + u;2'
где положительные константы £ и и>п выбраны так, чтобы для заданного входного
сигнала w(t) выходом этой модели являлся командный сигнал r(t). Сигнал r(t)
может генерироваться в режиме реального времени на выходе модели состояния
У\ =У2
т
<4»1 К^пУ2 + U
2
nW,
Поэтому можно считать, что r(£), r(t) и f(t) доступны в режиме реального вре
мени. Если w(t) является кусочно-непрерывной ограниченной функцией време
ни t, то r(t), r(t) и r(t) будут удовлетворять сформулированным выше предпо
ложениям.
Пусть
П-
,(P-I)
£i
_
г(р-1)
••ξ-π.
Замена переменных е = ξ — ΤΖ приводит к получению системы
ё = Асе + Bc{j(x)[u - а(х)] - No}.
13.4. УПРАВЛЕНИЕ С ОБРАТНОЙ связью по состоянию
579
Замена обратной связи по состоянию
и=а(х) +β(Χ)[υ+ г
(р)
],
где Р(х) = l/j(x), приводит нормальную форму к каскадному представлению
е=Асе+Bcv.
Поставленная цель правления может быть достигнута с использованием стаби
лизирующего закона управления для второго уравнения, обеспечивающего, кро
ме того, ограниченность ηдля всех t ^ 0.Приυ = —Ке, гдеАс — ВСК—
гурвицева матрица, обратная связь по состоянию для всей системы имеет вид
13
и = а(х) +Р(х)(-К[Т2(х) - П]+rW\ .
Тогда замкнутая система может быть записана следующим образом:
?7 = /о(г7,е + 7г),
(13.47)
е=(Ас- ВсК)е.
(13.48)
В случае минимально-фазовой системы начало координат уравнения η = /о(гу, 0)
асимптотически устойчиво. Из обратной теоремы Ляпунова 4.16 и теоремы 4.18
следует, что при достаточно малых е(0), η(0) и TZ(t) состояние r/(i) будет ограни
чено для всех t ^ 0. Таким образом, обратная связь по состоянию (13.47) пред
ставляет собой локальное решение задачи слежения. При попытке обеспечить
применимость полученного результата в случае задачи глобального слежения
для любой ограниченной функции !Z(t) мы сталкиваемся с теми же трудностя
ми, что возникали при решении задачи глобальной стабилизации. Достаточным
условием разрешимости задачи глобального слежения является устойчивость по
входу-состоянию системы η = /ο(τ7>0·
Пример 13.21. Рассмотрим уравнение маятника
Х\=Х2,
±2= —asinх\ —Ьх2+сгх,
у= х\.
Система имеет относительную степень, равную двум в Я
2
, и уже представлена
в нормальной форме. Она не имеет нетривиальной нуль-динамики и по умолча
нию является минимально-фазовой. Рассматривается задача слежения, т. е. цель
управления состоит том, чтобы на выходе системы у был некоторый командный
13
Так же как и в параграфе 13.2, отображение Тъ соответствует последним ρ компонентам диф
феоморфизма Т(х), преобразующего систему к нормальной форме.
580
ГЛАВА 13
сигнал r(t). При этом необходимо обеспечить ограниченность производных r(t)
и r(t). Положив
61=Х\-Г,б2=Х2-Г,
получаем
ei=e2,
в2= —asm xi—bx2+cu—r.
В этом случае обратная связь по состоянию (13.47) принимает следующий вид:
и= -[asiiLXi+Ьх24-г
-
kiei - йгег],
где вектор К = [fci,^] выбран таким образом, чтобы собственные значения
матрицы Ас — ВСК располагались в левой полуплоскости комплексной плоско
сти. Поскольку все предположения выполнены глобально, этот закон управления
представляет собой решение задачи глобального слежения. На рисунке 13.2 пока
занпереходныйпроцессвсистемеприа= с = 10,Ь =1,к\ =400икч—20для
некоторого командного сигнала. Непрерывная линия соответствует командному
1.5 U
i'
Ю0.5К
or
0
0.5
1
1.5
2
2.5
3
Время
Рис. 13.2. Компьютерное моделирование системы слежения из примера 13.21
сигналу и выходному сигналу в номинальном случае — они совпадают. Легко
видеть, что слежение обеспечивается не только асимптотически, но и для всех t,
т.к. х(0) = TZ(0). Если х(0) ф 7^(0), обеспечивается асимптотическое слежение
(пунктирная линия). Наконец, линия, показанная точками, соответствует ситуа
ции, когда в системе имеются параметрические возмущения Ь — 0.5 и с = 5, т. е.
когда масса увеличена вдвое.
Δ
Во многих задачах управления имеется возможность выбора командного
сигнала г. Например, одной из типичных задач управления в робототехнике
является перемещение схвата манипулятора из начальной точки в заданную за
определенное время. На первом этапе решения этой задачи выполняется плани
рование траектории между этими двумя точками, удовлетворяющей некоторым
ограничениям, обусловленным наличием препятствий. Затем для построенной
13.5 . УПРАЖНЕНИЯ
581
траектории движения определяются скорости и ускорения подвижных частей
манипулятра в виде функций времени. В результате этой предварительной опе
рации получается командный сигнал, который должен быть отслежен системой
управления по выходу14
. Свобода в выборе командного сигнала может быть ис
пользована для улучшения характеристик системы, особенно в случае наличия
ограничений на значения управляющего сигнала. Это иллюстрируется следую
щим примером.
Пример 13.22. Рассмотрим снова уравнение маятника с номинальными
параметрами а = с = 10 и 6 = 1. Предположим, что неуправляемый маятник
находится в точке равновесия х = 0и требуется перевести его в новую точку
равновесия х\ = π/2, Х2 = 0. В качестве командного сигнала г возьмем выход
передаточной функции второго порядка l/(rs+l)2
, входом которой является сту
пенчатая функция w, соответствующая поставленной цели управления — изме
нению угла наклона до величины π/2. Закон управления, являющийся решением
задачи слежения, имеет вид
и = 0.1(10sinх\ + Х2 + г - fciei — к^еъ),
где к\ = 400 и кч = 20. Выбрав нулевые начальные условия для эталонной
модели, получаем для этого случая, что ошибка слежения e(t) = x(t) — TZ(t) тож
дественно равна нулю и движение маятника отслеживает желаемый командный
сигнал для всех t. Выбор постоянной времени τ определяет скорость движе
ния из начального положения в конечное. В условиях отсутствия ограничений
на величину управляющего сигнала и можно было бы выбрать произвольно ма
лую г и обеспечить произвольно быстрый переход из х\ = 0 в х\ — π/2. Однако
следует учитывать, что управляющий сигнал и на практике представляет собой
вращающий момент на оси двигателя и эта величина не может быть сколь угодно
большой. Это обстоятельство обуславливает ограничение на скорость вращения
маятника. Выбрав г так, чтобы эта величина была сопоставима с постоянной
времени двигателя, можно обеспечить лучшие характеристики переходного про
цесса. На рисунке 13.3 показаны два случая, соответствующие различному вы
бору τ при наличии ограничения на управляющий сигнал |гх|^2. При т=0.05
с выход y(t) отклоняется от командного сигнала r(t), что указывает на выход
величины управляющего сигнала за переделы эксплуатационных характеристик
используемого двигателя. При т=0.25 с обеспечиваются приемлемые характери
стики процесса отслеживания командного сигнала. В обоих случаях не удалось
обеспечить длительность переходного процесса менее 1.2 секунд, но при τ =
= 0.25 удалось избежать перерегулирования, имевшего место при г = 0.05. Δ
13.5. Упражнения
13.1. Рассмотрим модель третьего порядка синхронного генератора, соединенно
го с бесконечной электрической шиной (см. упражнение 1.8). Рассмотрим два
14
3адача планирования траектории рассмотрена в работе [171].
582
ГЛАВА 13
т=0.05
т=0.25
1.5
1
0.5
о'
—
выход
- - - командный сигнал •
Рис. 13.3. Компьютерное моделирование системы слежения из примера 13.22
возможных выбора выхода системы:
(1) у=δ· (2) у=й+75,7^0.
В каждом из этих двух случаев определите относительную степень системы
и преобразуйте эту систему в нормальную форму. Укажите область определе
ния этого преобразования. В случае возможности определения нуль-динамики
ответьте на вопрос о минимальной фазовости системы.
13.2. Рассмотрим систему
Х\= -Х\+Х2- #3, #2= —Х\ХЪ-X2 +U, Х$= -Х\+16, У—Х^
(a) Является ли эта система линеаризуемой по входу-выходу?
(b) Если да, преобразуйте ее в нормальную форму и укажите область определе
ния соответствующего преобразования.
(c) Является ли эта система минимально-фазовой?
13.3. Рассмотрим обратный маятник из упражнения 1.15, и пусть в качестве
выхода системы выбран угол Θ. Является ли эта система линеаризуемой по
входу-выходу? Является ли эта система минимально-фазовой?
13.4. Рассмотрим систему из примера 12.6. Является ли эта система линеаризуе
мой по входу-выходу? Является ли эта система минимально-фазовой?
13.5. УПРАЖНЕНИЯ
583
Xl'
1
0
xz.
,
Ых) =
'-e
X2
1
0
0
оJ
13.5. Рассмотрим дифференциальные уравнения в частных производных (13.26)
из примера 13.8. Предположим, что q(x) не зависит от £т и ξη. Покажите, что
фг= Qприl^i^m
—
1ифт
= Ст — £n/q(x) удовлетворяют указанным
дифференциальным уравнениям в частных производных.
13.6. Покажите, что уравнение состояния из упражнения 6.11 линеаризуемо об
ратной связью.
13.7. Покажите, что уравнение состояния для m-звенного манипулятора из
упражнения 1.4 линеаризуемо обратной связью.
13.8. Докажите тождество Якоби
L[fi9]h(x) = LfLgh(x) — LgLfh(x),
где /ид — векторные поля и h — вещественная функция.
13.9. Пусть Δ — невырожденное распределение на D с генераторами Д,..., /г.
Покажите, что Δ инволютивно, если и только если [/$, fj] е Δ, V1 < г, j'^ г.
13.10. Пусть
h(x) =
D=R
4
и Δ = span{/i, /2}. Покажите, что Δ инволютивно.
13.11. Рассмотрим систему
х\=х\+#2, #2=Ъх\х2+х\+гц у= -х?+Χ2·
(a) Является ли эта система линеаризуемой по входу-выходу?
(b) Если да, преобразуйте ее в нормальную форму и укажите область определе
ния соответствующего преобразования.
(c) Является ли эта система минимально-фазовой?
(d) Является ли эта система линеаризуемой обратной связью?
(e) Если да, найдите замены обратной связи и переменных, обеспечивающие
линеаризацию уравнения состояния.
13.12. Выполните предыдущее упражнение для системы
Xl= -Xl+XlX2, #2=#2+#3, Хз= 6(х)+Щ
У = Х\+Х2,
где 5(х) — локально липшицева функция х.
13.13. Модель мобильного робота (или тягача с полуприцепом) может быть пред
ставлена следующим уравнением состояния:
х\ = tg(x3),
*«0*2) ,
1
Х2= ~
хг=
acos(xs)
tg(aft)
acos(x3)'
+ 6C0S(X2)C0S(X3)
tg(w),
584
ГЛАВА 13
где а и Ь — положительные константы. Покажите, что система линеаризуема
обратной связью, и укажите область определения соответствующего преобразо
вания.
13.14. Рассмотрим систему
Х\= —Х\+Х2— %3: Х2= —#1#3—Х2+U,
^3=~Х\+U.
(a) Является ли эта система линеаризуемой обратной связью?
(b) Если да, найдите замены обратной связи и переменных, обеспечивающие
линеаризацию уравнения состояния.
13.15. Докажите, что отображение z = T(x) в примере 13.15 является диффео
морфизмом на Do и что уравнение состояния в ^-координатах хорошо определе
но на Dz = Τ(D0).
13.16. Рассмотрим маятник из примера 12.2 с численными параметрами, приве
денными в упражнении 12.1. Найдите стабилизирующий закон управления с об
ратной связью по состоянию, используя метод линеаризации системы обратной
связью. Коэффициенты обратной связи должны быть выбраны так, чтобы соб
ственные значения замкнутой системы располагались в местах, определенных
в упражнении 12.1. Сравните характеристики полученной замкнутой системы
с характеристиками соответствующей системы из упражнения 12.1.
13.17. Покажите, что система
XI= -Х\+£2, Х2=Х\-Х2-X\XZ+Щ ХЗ=Х\+Х\Х2~2#3
является линеаризуемой обратной связью, и найдите закон управления с обрат
ной связью по состоянию, обеспечивающий глобальную стабилизацию начала
координат.
13.18. Рассмотрим систему
Х\ — Х2, х>2 — CLsinxi — bucosxi,
где а и Ъ — положительные константы.
(a) Покажите, что система является линеаризуемой обратной связью.
(b) Используя метод линеаризации системы обратной связью, найдите закон
управления с обратной связью по состоянию, обеспечивающий стабилиза
цию системы в точке х\ = 0, где О < θ < π/2. Можно ли сделать эту точку
равновесия глобально асимптотически устойчивой?
13.19. Рассмотрим манипулятор из примера 13.14. Предположим, что точные зна
чения параметров а, Ь, cud неизвестны, но имеется возможность получить их
оценки а, 6, с и d. Найдите линеаризующий и стабилизирующий закон управ
ления с обратной связью по состоянию в терминах а, 6, с и d и представьте
замкнутую систему в виде возмущения номинальной линейной системы.
13.20. Рассмотрим специальный случай системы (13.37)—(1338), где /о(^,0 за
висит лишь от £i и пара (А, В) = (Ас, Вс) управляема, представлена в канониче
ской форме и описывает цепь из ρ интеграторов. Такое представление системы
13.5. УПРАЖНЕНИЯ
585
называется специальной нормальной формой. Предположим, что начало коор
динат системы η = /о (?7,0) глобально асимптотически устойчиво и существует
радиально неограниченная функция Ляпунова Vb(^), такая что
^/ofa,0)<-Wfo)
для всех η, где W{rj) — положительно определенная функция.
(a) Покажите, что замена обратной связи и = а(х) + P(x)v, где /?(ж) = 7
_1
(х)>
и замена переменных
*i=£i, Ζ2 = εξ2,
...,
Ζρ=ερ~
1
ξρ,
w=ερν
приводит систему к виду
V = /o(4>*i)> ei = Ac£ + Всги.
(b) Пусть If выбрана так, что матрица Ас — ВСК является гурвицевой; Ρ —
положительно определенное решение уравнения Ляпунова Р(АС — ВСК) +
+ (Ас — ВСК)ТР = —I. Положив w = —Кг и используя ν(η, z) = ν$(η) +
в качестве функции Ляпунова для замкнутой системы, покажите,
что при достаточно малой ε начало координат (η — 0, z = 0) асимптотически
устойчиво и множество {ν(η, z) < с}, где с > 0 — произвольная константа,
принадлежит области притяжения.
(c) Покажите, что этот закон управления с обратной связью обеспечивает полу
глобальную стабилизацию, т.е. начальные состояния (т7о,£о)> принадлежа
щие любому компактному подмножеству в i?
n
, могут быть включены в об
ласть притяжения.
(d) С учетом результатов примера 13.17 исследуйте вопрос о возникновении при
переходном процессе в замкнутой системе явления образования пиков (рез
ких максимумов). Если это явление действительно имеет место, объясните,
почему тем не менее оказывается возможным обеспечить полуглобальную
стабилизацию, несмотря на наличие этих пиков в переходном процессе.
13.21. Рассмотрим систему
Xlf +U,
(a) Покажите, что система может быть представлена в глобально определенной
специальной нормальной форме.
(b) Покажите, что начало координат нуль-динамики глобально асимптотически
устойчиво.
х\•
Х2•
хг•
У
= Х2+Х\Х2—х\+
и
->
= Х\Х2 —Х*2+
и
->
=
Я?1+ Х\Х2 —Х%~ (
х
=XI-Х2.
586
ГЛАВА 13
(с) Найдите закон управления с обратной связью по состоянию, обеспечиваю
щий полуглобальную стабилизацию системы.
Указание: см. упражнение 13.20.
13.22. Рассмотрим систему (13.44)-(13.45), где А — В К — гурвицева матрица,
начало координат системы η = /о(?7,0) асимптотически устойчиво и ||<S(z)|| < ε.
Покажите, что существует окрестность D точки z = 0 и константа ε* > 0, такие
что для любых z(0) € D и ε ^ ε* состояние z предельно ограничено некоторой
/С-функцией от ε.
13.23. Рассмотрим систему (13.44)—(13.45), где А — ВК — гурвицева матрица,
начало координат системы η = /о(г/,0) глобально экспоненциально устойчиво,
/о — глобально липшицева и \\δ\\ ^ k\\z\\ для всех z. Покажите, что для доста
точно малой к начало координат z = 0 глобально экспоненциально устойчиво.
13.24. Рассмотрим систему (13.44)-( 13.45), где А — В К — гурвицева матри
ца, начало координат системы η — /о (?7,0) асимптотически устойчиво и соот
ветствующая функция Ляпунова Vo(ry) такова, что [Ονο/δη]/ο(η,0) ^ —Wty),
где \ν(η) — некоторая положительно определенная функция. Предположим, что
Ш\ ^ МН£Н + Wfa)]· Используя композитную функцию Ляпунова V = Vb(ry) +
+ \у/$гр£9 где Ρ - решение уравнения Ρ (А - ВК) + (А - ВК)ТР = -J,
покажите, что при достаточно малой к начало координат z = 0 асимптотически
устойчиво.
13.25. Рассмотрим систему
Х\=Х2+2х1?
±2=ХЗ+^5
Х%=Х\—Хз? У= Х\-
Найдите закон управления с обратной связью, обеспечивающий асимптотическое
слежение по выходу у командного сигнала r(t) = sint.
13.26. Выполните предыдущее упражнение для системы:
х\ = Х2 + 2Cisina:i, X2=xiX2 + ^,
У=xi-
13.27. Модель системы магнитной подвески из упражнения 1.18 может быть за
писана в следующей форме:
Х\ = Х2->
к
L0axl
Х2=9-
ш
х
2
ХЗ
ш Δ 2m(a+z1)
2
'
1
L(xi)
D
LQCLX2X3 ,
Rx
* +T~i
^2+
U
где х\ = у, Х2 = 2/, хз = i и и = ν. Используйте следующие численные данные:
га= 0.1кг,к = 0.001Н/м/с,д =9.81м/с
2
, a =0.05м,L0=0.01Гн,Lx =
= 0.02ГниД=1Ом.
(а) Покажите, что система является линеаризуемой обратной связью.
13.5. УПРАЖНЕНИЯ
587
(b) Используя метод линеаризации системы обратной связью, найдите закон
управления с обратной связью по состоянию, обеспечивающий стабилиза
цию шара в положении у = 0.05 м. Выполните пункты (d) и (е) упражне
ния 12.8 и сравните характеристики этого регулятора с характеристиками
регулятора, построенного в пункте (с) этого упражнения.
(c) Покажите, что если в качестве выхода системы выбрать положение шара у,
то система может быть линеаризована по входу-выходу.
(d) Используя метод линеаризации системы обратной связью, найдите закон
управления с обратной связью по состоянию, обеспечивающий асимптоти
ческое отслеживание выходом у командного сигнала r(t) = 0.05 + 0.01 sini.
Выполните компьютерное моделирование замкнутой системы.
13.28. Модель электродвигателя постоянного тока описана в упражнении 1.17.
В случае когда возбуждение обеспечивается постоянным током, проходящим че
рез обмотку статора, сила этого тока может рассматриваться в качестве управле
ния и соответствующая модель системы принимает вид системы второго порядка
Х\ = -0\Xi - в2Х2У> + #3,
Х2 = -04#2 + #5#1^,
где х\ — ток в обмотке якоря, х2 — скорость вращения, и — ток в обмотке стато-
ра и 9i, г = 1,..., 5 — положительные константы. Постройте закон управления
с обратной связью по состоянию, обеспечивающий асимптотическое отслежива
ние выходом у зависящего от времени командного сигнала г(£), такого что r(t)
и r(t) — непрерывные и ограниченные для всех t ^ 0 функции. Предположим,
что эксплуатация двигателя возможна при выполнении ограничения х\ > 0з/20ь
(a) Покажите, что система является линеаризуемой по входу-выходу и имеет
относительную степень, равную единице.
(b) Покажите, что система является минимально-фазовой.
(c) Используя метод линеаризации системы обратной связью, найдите закон
управления с обратной связью по состоянию, обеспечивающий отслежива
ние командного сигнала с указанными свойствами.
(d) Используя компьютерное моделирование, исследуйте характеристики за
мкнутой системы в случае, когда г представляет собой выход фильтра пер
вого порядка 1/(т5 + 1), входом которого является ступенчатая функция w.
Постоянная времени г может выбираться с целью подстройки скорости из
менения г. При выполнении компьютерного моделирования используйте на
чальные условия х\(0) = #з/#1 и ^(О) = 0 и численные данные θ\ =
= 60,02=0.5,9s=40,04=6и05=4х104
. В качестве ступенчатой
функции w выберите одиночный скачок от 0 до 100 в момент времени t — 1.
Кроме того, добавьте в канал входа модели функцию насыщения, обеспечи
вающую ограничение управляющего входного сигнала в пределах ±0.05.
588
ГЛАВА 13
(i) Измените τ и параметры регулятора так, чтобы переходный процесс
закончился к моменту времени 0.5.
(ii) Измените τ и параметры регулятора так, чтобы переходный процесс
закончился к моменту времени 0.1.
(iii) Вернитесь к параметрам, выбранным для случая (i), и исследуйте ха
рактеристики системы при изменении момента инерции ротора в пре
делах ±50 %.
(iv) Можно ли выбрать параметры регулятора так, чтобы улучшить свой
ства робастности системы по отношению к параметрическим возму
щениям из предыдущего пункта?
ГЛАВА 14
Нелинейные законы управления
Построение нелинейного управления с обратной связью — это сложная за
дача, решение которой требует разработки различных систематических проце
дур, предназначенных для достижения тех или иных целей управления и поз
воляющих удовлетворить определенным техническим условиям на проектирова
ние. Совершенно очевидно, что отдельно выбранная процедура не может быть
успешно применена ко всем нелинейным системам. Также маловероятно, что
в качестве теоретической основы структурной схемы построенного регулятора
будет выступать лишь одно из средств построения нелинейной обратной связи.
Для решения этой задачи исследователю требуется целый набор средств ана
лиза и проектирования, покрывающий широкий класс ситуаций. При анализе
конкретного приложения инженер должен выбрать и использовать тот метод,
который представляется наиболее подходящим для данного случая. В преды
дущих главах мы уже рассмотрели несколько подобных методов. В этой гла
ве собраны вместе пять методов построения нелинейной обратной связи, кото
рые, с одной стороны, достаточно просты для того, чтобы быть рассмотренны
ми в учебной книге, и, с другой стороны, обладают достаточно большим прак
тическим значением и поэтому могут быть успешно использованы в реальных
задачах
1
.
В первых двух параграфах будет рассмотрено робастное управление для си
стем, удовлетворяющих условию согласованности, т. е. когда в уравнении состо
яния системы неопределенные члены и члены управления находятся в одном
и том же месте. Рассмотренный в параграфе 14.1 закон управления в скользящем
режиме обеспечивает достижение траекторий системы некоторого многообразия
скольжения за конечное время и последующее их движение вдоль этого многооб
разия во все будущие моменты времени. Движение вдоль многообразия скольже
ния не зависит от неопределенностей, удовлетворяющих условию согласованно
сти. Многообразие скольжения определяется с использованием модели редуци
рованного порядка и соответствует поставленной цели управления. В методе по
строения законов управления на основе теории Ляпунова, рассмотренного в па
раграфе 14.2, функция Ляпунова для номинальной системы используется для на
хождения дополнительного компонента закона управления, обеспечивающего ро-
бастность этого закона по отношению к неопределенностям, удовлетворяющим
условию согласованности. Законы управления, основанные на использовании
1
Другие средства построения нелинейных систем управления рассмотрены в работах [88], [89],
[103], [124], [153], [167] и [172].
590
ГЛАВА 14
этих двух методов — метода скользящего режима и метода ляпуновского син
теза, — представляют собой разрывные функции, что, вообще говоря, является
недостатком, проявляющимся при наличии в системе задержек и немоделируе-
мой высокочастотной динамики. Поэтому мы разработаем «непрерывные» вер
сии этих законов управления. В параграфе 14.1 мы рассмотрим пример системы
второго порядка, мотивирующий основные элементы метода скользящего режи
ма, и после этого будут представлены основные результаты, касающиеся задач
стабилизации, слежения и интегрального управления. В параграфе 14.2 рассмат
ривается метод построения законов управления с использованием метода ляпу
новского синтеза и показывается, как этот метод может быть использован для
стабилизации системы. В заключение этого параграфа будет представлен метод
нелинейного демпфирования, при использовании которого гарантируется огра
ниченность траекторий даже в случае, когда верхняя граница неопределенных
параметров системы неизвестна.
Связанные с условием согласованности ограничения могут быть ослабле
ны с использованием метода бэкстеппинга (backstepping), рассмотрению кото
рого посвящен параграф 14.3. Бэкстеппинг — это рекурсивная процедура, в ко
торой совмещены задачи нахождения функции Ляпунова и соответствующего
закона управления. Согласно этому методу, задача разработки закона управления
для всей системы разбивается на последовательность соответствующих подза
дач для подсистем меньшего порядка (или даже скалярных систем). Поскольку
при анализе скалярных систем и систем малого порядка исследователь облада
ет большей свободой, метод бэкстеппинга часто позволяет сравнительно легко
решить задачи стабилизации и слежения с использованием робастного управ
ления в условиях менее ограничительных, чем в случае использования других
методик.
Метод управления на основе пассивности основан на использовании свой
ства пассивности разомкнутой системы. Стабилизация пассивной системы в точ
ке равновесия фактически равносильна введению в систему демпфирования.
В параграфе 14.4 рассматривается основная идея построения пассивного управ
ления. Кроме того, описывается метод пассивизации системы, при использова
нии которого непассивная система преобразуется в пассивную посредством за
мены обратной связи.
Представленные в главах 12-14 методы построения законов управления за
ключались в нахождении обратной связи по состоянию. В параграфе 14.5 будут
рассмотрены наблюдатели с сильной обратной связью, использование которых
позволяет для класса нелинейных систем расширить сферу применения этих ме
тодов на случай построения обратной связи по выходу2
.
Основная идея, лежа
щая в основе представленных в параграфе 14.5 результатов, заключается в том,
что динамика системы с глобально ограниченной обратной связью по состоянию
может быть воспроизведена с использованием обратной связи по выходу при
условии, что коэффициент обратной связи наблюдателя достаточно большой.
2
Другие методы построения обратной связи по выходу описаны в упражнениях 14.47-14.49.
14.1 . УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
591
14.1. Управление в скользящем режиме
14.1.1. Мотивирующий пример
Рассмотрим систему второго порядка
XI=Х2,
х2 = h(x) + д(х)щ
где Ни д — неизвестные нелинейные функции и д(х) ^ до > 0 для всех х. Задача
состоит в построении закона управления с обратной связью по состоянию, обес
печивающего стабилизацию начала координат. Предположим, что известен закон
управления, удерживающий траектории системы на многообразии (или поверх
ности) s = а\Х\ + Х2 = 0. На этом многообразии движение определяется урав
нением х\ = —а\Х\. Выбор а\ > 0 гарантирует стремление x(t) к нулю при t,
стремящемся к бесконечности. При этом скорость сходимости может управлять
ся выбором значения сц. Движение на многообразии s = 0 не зависит от h и д.
Как можно обеспечить приведение траектории системы на многообразие 5 = 0
и ее удержание на нем? Переменная s удовлетворяет уравнению
s — а\Х\+±2=а\Х2+h{x) + g(x)u.
Предположим, что h и д удовлетворяют неравенству
^ е(ж),VxeR
2
для некоторой известной функции Q(X). Используя V = (l/2)s
2
в качестве функ
ции Ляпунова для системы s = а\Х2 + h(x) + д(х)щ получаем
V = ss = s[a\X2 + h(x)] + g{x)su < g(x)\s\g(x) + g(x)su.
Полагая
3
u = -/?(#) sign(s),
гдеβ(ρ)^Q{X)+A),A)>0и
i1,
5>0,
sign(s) = < 0,
5=0,
I -1,
s<0,
3
Следует отметить, что нижеприведенный закон управления применяется лишь при s φ 0,
поскольку в идеальном скользящем режиме управление и не определено на поверхности скольже
ния s = 0. Альтернативно можно записать и = —Р(х) sign(s) для всех s, если функция sign(s)
не определена в s = 0. Это замечание остается справедливым на протяжении всей этой главы
в случаях, соответствующих идеальному скользящему режиму.
а\Х2 + h(x)
592
ГЛАВА 14
получаем
V ^ g(x)\s\Q(x) - д(х)[д(х) + p0]ssiga(s) = -g(x)p0\s\ < —^оА>|^|-
Таким образом, функция W = л/2У = |s| удовлетворяет дифференциальному
неравенству
D+W < -(?ο/?ο,
и из леммы сравнения следует, что
W(s(t))^W(s(0))-g0Pot.
Поэтому траектория системы достигает многообразия s = 0 за конечное вре
мя и, оказавшись на нем, не может его покинуть, что видно из неравенства
У ^ —#οΑ)Ν· Суммируя вышесказанное, можно заключить, что движение си
стемы состоит из двух фаз: сначала траектория, начинающаяся вне многооб
разия s = О, движется по направлению к этому многообразию и достигает его
за конечное время {фаза достижения), а затем наступает скользящий режим
(фаза скольжения), в ходе которого движение осуществляется на многообразии
s = 0 и динамика система определяется моделью редуцированного порядка х\ =
= —а\Х\. Фазовый портрет системы изображен на рисунке 14.1. Многообразие
Рис. 14.1. Типичный фазовый портрет системы при использовании управления в сколь
зящем режиме
5 = 0 называется многообразием скольжения, и соответствующий закон управ
ления и = — P(x) sign(s) называется управлением в скользящем режиме. Заме
чательной особенностью управления в скользящем режиме является то, что этот
закон управления является робастным по отношению к1гид. Для его реализации
необходимо знать лишь верхнюю границу д(х), и во время скользящего режима
движение полностью не зависит от h и д.
Закон управления в скользящем режиме упрощается, если в рассматривае
мой области функции h и д удовлетворяют неравенству
aix2+M#) ^
14.1 . УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
593
для некоторой известной неотрицательной константы к\. В этом случае закон
управления принимает вид
и = —fcsign(s),к > к\
и представляет собой простое реле. Однако в этом случае область притяжения
будет конечной и ее оценка может быть получена следующим образом. При вы
полнении в множестве {\s\ ^ с} условия ss < 0 обеспечивается положительная
инвариантность этого множества. Из уравнения
х\ =Х2= —а\Х\+s
и с использованием функции V\ = (l/2)a:f получаем
Vi = x\X\
Тогда
а\х\+x\s<—а\х\ -f\х\\с^0,V|xi|>^-.
и множество
l^i(o)l < sr =• Ι«1(*)Ι < sr> ν* > ο,
изображенное на рисунке 14.2, будет положительно инвариантным, если выпол
нено
а\Х2 + h(x)
9(х)
^ fci,Ух€Ω.
5=0
Рис. 14.2. Оценка области притяжения
Более того, любая траектория, начинающаяся в Ω, стремится к началу координат
при t —• оо. При выборе достаточно большой константы с любое компактное
множество на плоскости может быть включено в Ω. Поэтому, если константа к
может быть выбрана произвольно большой, представленный выше закон управ
ления может обеспечить полуглобальную стабилизацию.
594
ГЛАВА 14
Вследствие несовершенства устройств переключения и реле, в системах
с управлением в скользящем режиме часто возникает биение (chattering — чат
тер). На рисунке 14.3 показано, как наличие задержек может привести к возник
новению чаттера. Траектория в области s > 0 движется по направлению к мно
гообразию скольжения s = О и впервые достигает его в точке а. При идеально
реализованном управлении в скользящем режиме эта траектория должна, начи
ная с этой точки, двигаться вдоль многообразия скольжения. Однако на практи
ке существует задержка между моментом изменения знака s и моментом, когда
действительно происходит переключение режима управления. Во время этого
периода задержки траектория пересекает многообразие и оказывается в области
s < 0. При переключении режима управления траектория изменяет направление,
снова направляется к многообразию скольжения и в очередной раз пересекает
его. В результате повторения этого цикла траектория становится зигзагообраз
ной (см. рисунок). Этот колебательный режим известен как чаттер. Это явление
приводит к снижению точности управления, тепловым потерям в электрических
сетях и повышенному износу подвижных механических частей механизмов. Оно
также может привести к возникновению в системе немоделируемой высокоча
стотной динамики, которая может ухудшить ее характеристики или даже приве
сти к неустойчивости.
\ Многообразие скольжения
s<0 VN s>0
а
Рис. 14.3. Чаттер в системе, обусловленный задержками при переключении управления
Для лучшего понимания эффекта чаттера рассмотрим результаты компью
терного моделирования модели маятника
±1=Ж2,
#2 = -(go/£)sin(xi + Si) - (ко/т)х2 + (l/mi
2
)u,
и = —ksign(s) — —fcsgn(ai#i+ хг)?
где х\ = θ — δ\ и Х2 = Θ. Задача состоит в стабилизации положения маятника
в позиции δ\ = π/2. Константы m, £, ко и до представляют собой соответствен
но массу, длину подвеса, коэффициент трения и ускорение свободного падения.
14.1. УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
595
Положим а\ = 1 и к = 4. Коэффициент усиления к = 4 выбирается так, чтобы
было выполнено
а\Х2 + h(x)
=\£
2
(т — ко)х2 — mgo£cos(xi)\ ^
^£
2
\т - к01 (2тг) + тд0£ ^ 3.68,
где оценка вычислена на множестве {\xi\ ^ π, |#i + жг! ^ тг} при 0.05 ^ т <
0.2, 0.9 < t < 1.1 и 0 ^ ко ^ 0.05. Моделирование выполнялось при т =
= 0.1, -£=1и/со = 002. На рисунке 14.4 показаны результаты для идеального
управления в скользящем режиме, а на рисунке 14.5 — для неидеального случая,
когда переключение осуществляется с задержкой, обусловленной немоделируе-
мой динамикой привода с передаточной функцией 1/(0.015 + I)2
.
0.05 0.1 0.15
Время
Рис. 14.4. Идеальное управление в скользящем режиме
2.1 2.2 2.3
Время
Рис. 14.5. Управление в скользящем режиме в условиях немоделируемой динамики при
вода
Ниже будут предложены два подхода, позволяющие уменьшить влияние чат-
тера или полностью его исключить. Первый подход предполагает разделение
управления на две составляющие — непрерывную и разрывную, соответствую
щую переключениям. Амплитуду последней необходимо уменьшить. Пусть h(x)
596
ГЛАВА 14
и д(х) — номинальные модели функций h(x) и д(х) соответственно. Положив
[а\Х2 + h(x)]
и=—-
получаем
аг 1-
9(х)
+v,
def
х2+h(x)-
—— h{x) + g(x)v = S(x) + g(x)v
9KX)
Если член возмущения 6(х) удовлетворяет неравенству
\δ(Χ)\
Φ)
< Q(x),
в качестве закона управления можно положить
v=
-p(x)sign(s),
где Р(х) > д(х) + /?о· Поскольку ^ — оценка сверху члена возмущения, очень
вероятно, что эта величина должна быть меньше верхней границы всей функции.
Следовательно, при использовании этого подхода можно ожидать, что амплитуда
разрывной компоненты будет меньше. Например, возвращаясь к рассмотрению
уравнения маятника и полагая га = 0.125, £ = 1, fco — 0.025, т.е. равными их
номинальным значениям га, £, ко, получаем
5{х)
(а\т£
2
—
airrur — к$£2
+ коР)х2 — дъ(т£ — тп£) cosxi
^ 1.83,
где оценка вычисляется на том же множестве, что и ранее. Тогда модифициро
ванный закон управления в скользящем режиме принимает вид
и = —0.1x2 + 1.2263 cos х\ — 2sign(s).
Легко видеть, что амплитуда составляющей переключений уменьшилась и стала
равна не 4, как ранее, а 2. На рисунке 14.6 показаны результаты компьютер
ного моделирования системы с использованием модифицированного управления
в условиях немоделируемой динамики привода. Отчетливо видно, что амплитуда
чаттера уменьшилась.
Второй подход, используемый для исключения чаттера из динамики систе
мы, заключается в замене функции знака на функцию насыщения с большим
углом наклона линии переключения. В этом случае закон управления имеет вид
и = -β(Χ) sat (§)
14.1. УПРАВЛЕНИЕ В СКОЛЬЗЯЩЕМ РЕЖИМЕ
597
2.1 2.2 2.3
Время
Рис. 14.6. Модифицированное управление в скользящем режиме в условиях немодели-
руемой динамики привода
где sat() — функция насыщения, определяемая равенством
sat(y) = i
y
.' ,,
«*"!»]<;·
чг//
\sign(y),
если \у\ > 1,
и ε — некоторая положительная константа. Графики функций знака и насыщения
показаны на рисунке 14.7. Угловой коэффициент линии переключения функции
sgn(y) f
1
sat (у /ε)
-1
Рис. 14.7. Функция знака и ее аппроксимация функцией насыщения
sat(s/e) равен l/ε. Для хорошей аппроксимации требуется, чтобы константа ε
была мала. В предельном случае ε —> 0 функция насыщения sa,t(s/e) стремится
к функции знака sign(s). При анализе характеристик «непрерывного» регулятора
в скользящем режиме будем исследовать фазу достижения многообразия сколь
жения с использованием функции V = (l/2)s
2
.
Ее производная удовлетворяет
неравенству
V ^ -<7оА)И
при |s| ^ ε, т.е. вне полосы {|s| < ε}. Поэтому при |s(0)| > ε функция \s(i)\
будет строго убывающей до тех пор, пока траектория не достигнет за конечное
время множества {|s| ^ ε}. После этого момента траектория будет двигаться
внутри указанной полосы во все будущие моменты времени. В этом режиме
598
ГЛАВА 14
динамика системы описывается уравнением
х\ = —а\Х\ -Ь5,
где \s\ ^ ε и производная функции V\ = (1/2)х^ удовлетворяет неравенству
Vi = -а\х\ -\-x\s ^ -а\х\ + \х\\е < -(1 - 6i)aix\, V|xi| ^ -%-,
где 0 < 01 < 1. Таким образом, траектория достигает множества Ωε =
= {\xi\ ^ ^/(tti0i), |s| < ε} за конечное время. В общем случае стабилизация
начала координат не обеспечивается, но гарантируется предельная ограничен
ность с предельной границей, значение которой может быть уменьшено путем
уменьшения ε. Характер процессов внутри Ωε зависит от специфики рассматри
ваемой задачи. В качестве примера рассмотрим уравнение маятника. Внутри по
лосы {|s| ^ ε} закон управления сводится к линейному управлению и = —ks/ε,
в результате применения которого мы получаем замкнутую систему
XI=Ж2,
#2 = -(9o/f) sin(xi + Si) - (ko/m)x2 - (k/m£
2
e)(aixi + x2)·
Эта система имеет единственную точку равновесия (а?ь 0), где величина х\ удо
влетворяет уравнению
emgoisin(xi + δ\) + ка\Х\ = 0
и может быть аппроксимирована при малой ε следующим образом: х\ «
« — (emgoi/kai)smdi. Переместим точку равновесия в начало координат, ис
пользуя замену переменных
2/1= х\ -хи
2/2 = Х2-
В результате получаем систему
т=2/2,
*»
=_аЫ
~(-
+
dfc)
У2
'
где
^(2/i) = (W^)[sin(2/i + ^i + 5i) - sin(xi + ii)] + (kai/m£
2
e)yi.
Используя
V = / σ(β)ω + (1/2)«|
./о/о
в качестве функции Ляпунова, можно показать, что функция
V > -(flu/20»i + {kal/2mi
2
e)yl + (1/2)у2
14.1. УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
599
положительно определена при (к/ε) > (migo/ai) и ее производная удовлетворя
ет равенству
Из принципа инвариантности следует, что точка равновесия (#1,0) является
асимптотически устойчивой и притягивает любую траекторию в Ωε.
Для того чтобы обеспечить большую точность регулирования, необходимо
выбрать константу ε настолько малой, насколько это возможно. Однако следует
иметь в виду, что при слишком малом значении ε и при наличии в системе задер
жек или немоделируемой динамики может возникнуть чаттер. На рисунке 14.8
показаны результаты моделирования движения маятника для случая «непрерыв
ного» управления в скользящем режиме при двух различных значениях ε. На
ε=0.3
з|
2
1
1
^
Ор*"^
...
1
О0.511.522.5
Время
ε-0.03
0
2
4
6
8
00.511.522.5
Время
Время
Рис. 14.8. «Непрерывное» управление в скользящем режиме
рисунке 14.9 показаны результаты моделирования этой системы при наличии
немоделируемой динамики привода с передаточной функцией l/(0.01s + I)2
.
Интересно отметить, что для идеального регулятора уменьшение ε приводит
к увеличению точности регулирования, но при наличии задержек этот эффект
не наблюдается вследствие возникновения чаттера.
В некоторых случаях оказывается возможным обеспечить стабилизацию на
чала координат без сильного уменьшения ε. Подобная ситуация возникает, на
пример, при /i(0) = 0, когда поведение системы внутри полосы описывается
ε=0.3
2
1.5
>1
0.5
0
2
1.5
?1
0.5
0
f0
2
4
Время
ε=0.03
f
•
6
600
ГЛАВА 14
ε=0.3
ε=0.3
4
6
Время
ε=0.03
2.2 2.3
Время
Рис. 14.9. «Непрерывное» управление в скользящем режиме при наличии немоделируе-
мой динамики привода
уравнением состояния
XI=Х2,
±2=h(x) -
д(х)к
(aixi + х2)
и начало координат является точкой равновесия. Необходимо выбрать ε достаточ
но малой, чтобы обеспечить стабилизацию точки начала координат и сделать Ωε
подмножеством ее области притяжения. В случае уравнения маятника с δ\ = π
применение вышеприведенного подхода для анализа устойчивости системы при
водит к заключению, что эта цель может быть достигнута, если к/ε > mgot/ai.
Приt<1.1,m ^ 0.2,к =4иа\=1следуетвыбратьε<1.8534.Нарисун
ке 14.10 показаны результаты компьютерного моделирования для случая ε = 1.
Если угол δ\ отличается от 0 или π (т. е. не соответствует точкам равновесия
разомкнутой системы), система стабилизируется в точке равновесия, отличной
от начала координат с ошибкой в установившемся режиме, приближенное значе
ние которой было получено ранее: {^mgoi/kai) sm8\. Для того чтобы получить
в установившемся режиме нулевую ошибку, следует использовать закон управ
ления с интегральным действием. Пусть XQ = J x\. Тогда расширенная система
14.1. УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
601
ε=1
£=1
Рис. 14.10. «Непрерывное» управление в скользящем режиме при Si = π
имеет вид
XQ=Xi,
±1=Х2,
%2 = —(^o/^)sin(xi + ^i) - (ко/т)х2 + (1/т£
2
)и.
Положим s = CLQXQ + а\х\ + х2, где коэффициенты таковы, что матрица
А0=\
|
_
—ао
—а\ J
является гурвицевой. Если в рассматриваемой области выполнено
m£
2
\aoXi + а\х2 - (go/i) sin(xi + <5i) - (ко/т)х2\ ^ fci,
можно применить «непрерывное» управление в скользящем режиме вида
и= —fcsati|J,к>к\.
Этот закон управления обеспечивает достижение 5 границы полосы {\s\ ^ ε} за
конечное время, т. к.
ss ^ —(к—ki)\s\
при\s\^ε.
Внутри полосы система описывается уравнением
η=Α0η +B0s,
гдеη=
хо
xi
В0=
Полагая V\ = ητΡοη, где PQ — решение уравнения Ляпунова, PQAQ + AQPQ = —I,
можно показать, что
Vi = -ητη + 2ητΡ0Β03 < -(1 - tfOIMll, V |М|2 > 2||Ρ0Βθ||2ε/^1,
602
ГЛАВА 14
где 0 < #i < 1. Таким образом, все траектории достигают множества
ViW<«*pNoiW<£
s?
за конечное время. Внутри Ωε система
XQ
XI
ХЪ
Ж2,
^2 = —{%/t) sin(xi + Si) - (ко/т)х2 - (k/m£
2
s)(aoXo + а\Х\ + х2)
имеет единственную точку равновесия ъх = [—(етдо£/као) sin δ\, 0,0]т
. Повто
рив представленный выше анализ устойчивости системы, можно показать, что
при достаточно малой ε точка равновесия х асимптотически устойчива и каждая
траектория в Ωε стремится к х при t —• оо. Следовательно, угол θ стремится
к желаемому положению δ\. Результаты компьютерного моделирования при т =
= 0.1,I =1,&о=0-02,<5i=π/2,αο=oi=1,fc=4иε=1показанына
рисунке 14.11.
ε=1
ε=1
Рис. 14.11. «Непрерывное» управление в скользящем режиме и с интегральным действи
емприδ\=π/2
14.1.2. Стабилизация
Рассмотрим систему
х = f{x) + B(x)[G(x)E(x)u
+ S(t, x, и)],
(14.1)
гдех£Rn
—
вектор состояний, и G Rp
—
вектор управлений, /, В, G и Ε —
достаточно гладкие функции в области D С Rn
,
содержащей начало координат.
Функция δ предполагается кусочно-непрерывной по i и достаточно гладкой по
(х,и) при(£,х,и) е[0,оо)хD xi?
p
.
Мы будем также предполагать, что /, В
и i? известны, a G и £ могут быть неизвестны. Кроме того, в (14.1) матрица Е(х)
14.1 . УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
603
невырожденна и G(x) — диагональная матрица с положительными элементами,
отделенными от нуля, т.е. д%(х) ^ до > 0, для всех х е D.
4
Предположим, что
/(0) = 0, т. е. при отсутствии δ начало координат является точкой равновесия
разомкнутой системы. Наша цель заключается в построении закона управления
с обратной связью по состоянию, обеспечивающего стабилизацию начала коор
динат для любых неопределенностей в G и δ.
ПустьΤ:D—>R
n
—
диффеоморфизм, такой что
£*<*>
(14.2)
где / — единичная (р х р)-матрица
5
.
Замена переменных
= Т(х), η€Rn
~
p
,
ξ€Rp
,
(14.3)
приводит систему к следующему виду:
Ч = /«(ъ0,
(14.4)
t = /bfa, Ο + G(x)E(x)u + i(t, x, и).
(14.5)
Представление (14.4)—(14.5) обычно называют регулярной формой. Разработку
закона управления в скользящем режиме мы начнем с построения многообра
зия скольжения s = ξ — φ(η) = 0 такого, что при движении системы по этому
многообразию она описывается моделью редуцированного порядка
η = /α(η,Φ(η)),
(14.6)
имеющей асимптотически устойчивую точку равновесия в начале координат. На
хождение φ(η) равносильно решению задачи стабилизации для системы
17 = /а(Ч,0>
где ξ рассматривается в качестве входа. Эта задача может быть решена либо
с использованием метода локальной линеаризации системы, либо с использо
ванием метода линеаризации обратной связью, представленного в предыдущих
двух главах, либо с применением какого-либо другого метода построения нели
нейного закона управления из тех, что будут представлены далее в этой главе
(например, бэкстеппинг или метод, основанный на пассивности системы). Здесь
мы будем предполагать, что нам известен стабилизирующий закон в виде непре
рывно дифференцируемой функции φ(η), φ(0) = 0. Тогда следующим шагом
4
Путем включения внедиагональных элементов в δ представленный здесь метод может быть
обобщен на случай, когда матрица G не является диагональной. Поскольку в этом случае зависи
мость δ от и будет ограничена, этот подход применим лишь в случаях, когда матрица G обладает
свойством диагонального доминирования.
5
Вопрос существования Τ рассматривается в упражнении 14.9.
604
ГЛАВА 14
решения поставленной задачи будет нахождение и, обеспечивающего приведе
ние величины s к нулевому значению за конечное время и удержание системы
в этом режиме во все будущие моменты времени. Для этого запишем 5-уравнение
в следующем виде:
*= Μη,ξ)~ ^/«fa, 0 +G{x)E(x)u +d(t,x,и).
(14.7)
В мотивирующем примере мы показали, что управление и может быть выбрано
в виде простого реле или же оно может иметь дополнительную непрерывную
составляющую, которая обеспечивает исключение известных членов в правой
части (14.7)6
. Если G(x) — номинальная модель для G(x), непрерывная состав
ляющая и будет иметь вид —E~
1
G~
1
[Д — (δφ/δη)/α]. При отсутствии неопреде
ленностей, т.е. при δ = 0 и известной G, выбор и = —E~
1
G~
1
[fb — (9φ/Θη)/α]
обеспечивает 5 = 0, что гарантирует выполнение условия 5 = 0 для всех бу
дущих моментов времени. Для того чтобы выполнить анализ этих двух случаев
одновременно, запишем закон управления и в виде
и = Е~\х) |-ВД[ДЫ) - ^аЫ)\
+<j ,
(14.8)
где L{x) — G~
l
{x) в ситуации, когда выполняется исключение известных чле
нов, и L = 0 в противном случае. Подставляя (14.8) в (14.7), получаем
к =9i{x)vi+Ai(t,x,v), 1<г^ р,
(14.9)
где Δ^ — г -я компонента вектора
A(t,x,v) = S(t,x, -Е-ЧхЩхМьЫ)
-
(ΡΦ/θη)/α(η,ξ)) + Е~\х)у) +
+ [I - G(x)L(x)][fb(V^)
-
{θφ/θη)Μη,ξ)]
и gi — г -й диагональный элемент G. Мы будем предполагать, что отношение
Аг/д% удовлетворяет неравенству
Ai(t,x,v)
9г(х)
^ Q(X) + KO\\V\\OO, V(i,x,v) e [0,oo)xDxBP,Vl ^г^ру (14.10)
где д(х) ^ 0 (непрерывная функция) и/со G [0,1) — известно. Используя оцен
ку (14.10), найдем г>, обеспечивающее стремление s к многообразию 5 = 0. Ис
пользуя Vi = (1/2)5? в качестве функции Ляпунова для (14.9), получаем
Vi = SiSi = Sigi(x)vi + SiAi(t,x,v) ^ 9i{x){siVi + |з<|[^(ж) + «o||v||oo]}.
Непрерывная составляющая обычно называется эквивалентным управлением.
14.1 . УПРАВЛЕНИЕ В СКОЛЬЗЯЩЕМ РЕЖИМЕ
605
Положим
7
Vi= -P(x) sign(si),1^г<р,
(14.11)
где
No)> Г^Г+Яь УхеД
(14.12)
иβ0 >0.Тогда
Vi < gi(x)[-P(x) + *?(ж) + «о/9(ж)]|вг| = л(ж)[-(1 - «о)/?(я) + *?(*)]hl <
< Р»(ж)[-^(х) - (1 - Ко)А) + £(#)]Ы < -Ρθ/?θ(1 - «0)|«г|.
Неравенство Т^ ^ — #оА)(1 — «оЖ1 гарантирует, что любая траектория, начинаю
щаяся вне многообразия s = 0, достигает его за конечное время, а те траектории,
которые лежат на этом многообразии, не могут покинуть его.
Процедура построения стабилизирующего регулятора в скользящем режиме
может быть сформулирована в виде последовательности следующих шагов:
• Определение многообразия скольжения ξ = φ(η) и стабилизация системы
редуцированного порядка (14.6).
• Нахождение закона управления и в виде и =
Ε~
1
{—0~
1
[^—(δφ/δη)$α]+ν}
или и = Ε~λν.
• Оценка величин д(х) и «о в (14.10) при Δ, зависящем от выбора, сделанного
на предыдущем шаге.
• Выбор /?(х), удовлетворяющей (14.12), и определение релейного (разрывно
го) закона управления ν в соответствии с (14.11).
Эта процедура предполагает редуцирование порядка системы, т. к. эта опе
рация необходима для решения основной части задачи — стабилизации редуциро
ванной системы (14.6). Ключевой особенностью закона управления в скользящем
режиме является то, что этот закон является робастным по отношению к неопре
деленностям, удовлетворяющим условию согласованности. Во время фазы до
стижения многообразия скольжения цель управления — направить траектории
к этому многообразию и удержать их на нем — обеспечивается с использовани
ем релейного управления (14.11) при условии, что /?(#) удовлетворяет неравен
ству (14.12). Из (14.10) видно, что д(х) представляет собой меру неопределен
ности. Поскольку мы не требуем, чтобы д(х) была мала, релейное управление
может обеспечить выполнение цели управления даже при больших неопределен
ностях, ограничениями для которых являются лишь физические требования на
амплитуду управляющих сигналов. Во время фазы движения вдоль многообра
зия скольжения поведение системы описывается уравнением (14.6), которое не
зависит от неопределенных членов G и δ.
7
Для удобства записи мы выбрали коэффициент при функции знака одинаковым для всех ком
понентов вектора управления, но это ограничение может быть ослаблено (см. упражнение 14.12).
606
ГЛАВА 14
Закон управления в скользящем режиме содержит разрывную функцию зна
ка sign(si), что вызывает определенные вопросы теоретического и практического
характера. Теоретические вопросы, такие как вопрос о существовании и един
ственности решений или вопрос о достоверности результатов анализа Ляпуно
ва, должны рассматриваться так, чтобы не возникала необходимость наложения
требования локальной липшицевости функций в правой части уравнения состо
яния
8
. Возникает также чисто практический вопрос о влиянии чаттера, обуслов
ленного несовершенством релейных устройств и наличием задержек. Эта про
блема была проиллюстрирована в мотивирующем примере. Во избежание воз
никновения этого явления мы использовали непрерывную аппроксимацию функ
ции знака
9
. Использование подхода непрерывной аппроксимации позволяет из
бежать теоретических трудностей, связанных с применением разрывных законов
управления
10
.
Аппроксимируем функцию знака sign(s^) функцией насыщения
с большим углом наклона линии переключения sat (θ*/ε):
п
щ= -β{Χ)sat(f), 1<г<ρ,
(14.13)
где β(ρβ) удовлетворяет (14.12). В целях выполнения анализа характеристик
«непрерывного» закона управления в скользящем режиме исследуем фазу до
стижения многообразия скольжения с использованием функции Ляпунова Vi =
= (l/2)sf. Производная Vi удовлетворяет неравенству
Vi ^ g%{x) |-/3(x)sisat (γ) + o(x)\si\ + «o/?(aOW|.
В области \si\ ^ ε справедливо неравенство
Vi ^ gi(x)[-(l - коЩх) + £(#)]N < -0оА)(1 - «о) W>
из которого следует, что при |s*(0)| > ε величина \si(t)\ убывает и по истечении
некоторого конечного промежутка времени для всех будущих моментов времени
траектория остается в множестве {\si\ ^ ε}. Множество {\si\ < ε, 1 ^ г ^ р}
называется пограничным слоем (boundary layer). Для исследования поведения η
примем во внимание, что в фазе движения вдоль многообразия скольжения вы
полнено ξ = φ(η), и предположим, что существует (непрерывно дифференциру
емая) функция Ляпунова ν(η), удовлетворяющая неравенствам
«i(IMI) < ν{η) < α2(|Μ|),
(14.14)
8
Дифференциальные уравнения с разрывными правыми частями рассмотрены в работах [58],
[147], [173], и [198].
9
Другие подходы к проблеме устранения чаттера предполагают использование наблюдате
лей [197] или расширение динамической модели системы путем добавления интеграторов [177].
Следует отметить, что подход, в котором используется непрерьюная аппроксимация, не может
быть применен в приложениях с приводами, используемыми в режиме включения-выключения
(например, тиристоры).
10
В этой книге мы не будем подробно рассматривать разрывные законы управления в сколь
зящем режиме, но читателю рекомендуется с использованием компьютерного моделирования ис
следовать характеристики систем, замкнутых разрывным законом управления и соответствующей
непрерывной аппроксимацией этого закона.
11
Гладкая аппроксимация рассмотрена в упражнении 14.11.
14.1 . УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
607
|£/β(4, φ(η) + в) < -а3(Ы), V ||τ/|| ^ 7(NI),
(14.15)
для всех (г/,ξ) G T(D), где ai, α^, аз и 7 — некоторые /С-функции
12
. Заметив,
что для некоторой положительной константы к\ выполнено
13
\si\<спри1<г^ ρ =^ ||s||Oic => У^ -<*з(1Ы1)ПР
И
IMI ^ 7(&ic),
определим /С-функцию α равенством
а(г) = a2(/y(kir)).
Тогда
У(т?) ^ а(с) =» Vfa) > a2(7(*ic)) =» а2(||г/||) > а2(7(М) =»
=* N11 > 7(*ic) =* V < -<*з(1М1) < -аз(7(*1с)).
Из этого следует, что множество {V(rj) < со} при со ^ а(с) является положи
тельно инвариантным, т.к. V отрицательна на границе V(rj) = со. (См. рису
нок 14.12.) Тогда множество
ε
с
\з\
Рис. 14.12. Множество Ω для скалярной 5. V < 0 выше кривой ск(.)
Ω={ν(η)<с0}х{Ы<с,1<г^р},с0^а(с),
(14.16)
положительно инвариантно при с > ε и Ω С T(D). Выберем ε, с > ε и со ^ а(с)
так, чтобы Ω С T(D). Компактное множество Ω служит в качестве оценки
«области притяжения». Для любых начальных состояний, принадлежащих Ω,
соответствующие траектории будут ограничены для всех i ^ 0 и по проше
ствии некоторого конечного промежутка времени будет выполнено неравенство
\si(t)\ ^
£
-
Из представленного выше анализа следует, что V ^ — аз (7(^1 ε)) Для
12
Из неравенства (14.15) следует локальная устойчивость по входу-состоянию системы η
= /α(?7, Φ(η) + s), в которой s рассматривается в качестве входа. (См. упражнение 4.60.)
13
Константа к\ зависит от типа нормы, используемой при анализе.
608
ГЛАВА 14
всех ν(η) > α(ε). Следовательно, траектории достигнут положительно инвари
антного множества
Ωε={ν(η)^α(ε)}х{\8i\ ^ε,1^г^р}
(14.17)
за конечное время. Множество Ωε может быть сделано сколь угодно малым путем
выбора достаточно малой ε. В предельном случае ε —> 0 множество Ωε сужается
до точки — начала координат, — и это свидетельствует о том, что «непрерывная»
версия закона управления в скользящем режиме воспроизводит характеристики,
которыми обладает соответствующая разрывная версия. Заметим, что если все
предположения выполнены глобально и ν(η) радиально неограниченна, множе
ство Ω может быть выбрано произвольно большим и так, чтобы оно включало
любое начальное состояние. Представленные результаты могут быть сформули
рованы в виде следующей теоремы.
Теорема 14.1. Рассмотрим систему (14.4)-(14.5). Предположим, что су
ществуют φ(η), ν(η), о{х) и «о, удовлетворяющие (14.10), (14.14) и (14.15).
Пусть и и ν определяются выражениями (14.8) и (14.11) соответственно.
Предположим, что ε, с > ε и CQ ^ а(с) выбраны так, чтобы множество Ω,
определяемое (14.16), содержалось в T(D). Тогда для всех (гу(0), £(0)) G Ω тра
ектория (Tj(t)^(t)) ограничена для всех t^Ou достигает за конечное время по
ложительно инвариантного множества Ωε, определяемого (14.17). Более того,
если все предположения выполнены глобально и ν(η) радиально неограниченна,
утверждения теоремы выполнены для любого начального состояния.
Из этой теоремы следует, что «непрерывный» закон управления в скользя
щем режиме обеспечивает предельную ограниченность с предельной границей,
величина которой может быть изменена выбором параметра ε. В этой теоре
ме сформулированы также условия глобальной предельной ограниченности. По
скольку неопределенность δ может быть представлена функцией, не обращаю
щейся в нуль в точке х = 0, свойство предельной ограниченности — это мак
симально возможный результат, который может быть достигнут в общем случае.
Если δ обращается в начале координат в нуль, оказывается возможным доказать
асимптотическую устойчивость начала координат.
Теорема 14.2. Предположим, что все предположения теоремы 14.1 выпол
нены с ρ(0) = 0 и ко = 0. Предположим также, что начало координат системы
V = /α(ν^Φ(ν)) экспоненциально устойчиво. Тогда существует ε* > 0, такая
что для всех 0 < ε < ε* начало координат замкнутой системы экспоненциально
устойчиво и множество Ω является подмножеством его области притяжения.
Более того, если все предположения выполнены глобально, то начало координат
глобально равномерно асимптотически устойчиво.
ДОКАЗАТЕЛЬСТВО. ДЛЯ выполнения при ко = 0 неравенства (14.10) необхо
димо, чтобы функции Δ* не зависели от υ9 т.е. Δ* = Ai(t,x). Из теоремы 14.1
следует, что все траектории, начинающиеся в Ω, достигают Ωε за конечное время.
14.1 . УПРАВЛЕНИЕ В СКОЛЬЗЯЩЕМ РЕЖИМЕ
609
Внутри Ωε замкнутая система определяется уравнениями
η = Ια(η,Φ{η) + *),
ёг = Ai(t, x)
-—£
s<,1^г^р.
Из обратной теоремы Ляпунова 4.14 следует, что существует функция Ляпунова
Vo(v)> удовлетворяющая неравенствам
ci\\v\\
2
2<Vo(v)^c2\\V\\l
^fa(v,4>m<-<*\\v\\i
dV0
δη <c4|
2
в некоторой окрестности Νη точки η = 0. Из гладкости fa и Δ и неравенства
|Д*(£,ж)| ^ gi(x)p(x), р(0) = 0 следует, что неравенства
||/a(r/,^(»i)+e)-/e(»7^(»7))||2<fclN|2,
||Δ||2^Α2|Η|2 + Α:3||β||2
выполнены в некоторой окрестности N точки (η, ξ) = (0,0). Выберем ε настоль
ко малой, что Ωε С Νη и Ωε С TV. Используя функцию Ляпунова
г=1
можно показать, что
w < -с3|М|| + c^lMhlNb + ШШЬ +fcslNIi- !ψ\\*\\1
Выражение в правой части этого неравенства может быть сделано отрицательно
определенным в Ωε путем выбора достаточно малой ε.
Π
Главная идея, лежащая в основе представленного выше доказательства,
заключается в использовании внутри пограничного слоя управления V{ —
—
— P(x)si/e, которое при малой ε представляет собой закон управления с силь
ной обратной связью. Выбирая ε достаточно малой, можно обеспечить стаби
лизацию начала координат соответствующей сильной обратной связью. Следует
заметить, что этот закон управления можно было бы использовать при любых на
чальных данных, удовлетворяющих условиям предыдущих теорем, однако при s,
достаточно удаленных от нуля, управляющий сигнал будет слишком большим.
Мы уже отмечали, что закон управления в скользящем режиме обладает ро-
бастными свойствами по отношению к неопределенностям, удовлетворяющим
610
ГЛАВА 14
условию согласованности. Что можно сказать в ситуациях, когда неопределенно
сти не удовлетворяют этому условию? Рассмотрим случай, когда уравнение (14Л)
имеет модифицированный вид
х = f(x) + B(x)[G{x)E(x)u + 6(t, x, и)] + δλ(Χ).
(14.18)
Замена переменных (14.3) преобразует систему к виду
V = Ια(η,ξ) + δα(η,ξ),
i =Μη,ξ)+G{x)E(x)u + S(t,x,и)+Sb(v,ξ),
где
Член 6ь входит в правую часть второго уравнения в виде слагаемого вместе
с неопределенностью, удовлетворяющей условию согласованности. Наличие это
го члена приводит к изменению верхней границы функций Δ*/*/*. С другой сто
роны, член δα не удовлетворяет условию согласованности; его наличие приво
дит к модификации соответствующей редуцированной модели на многообразии
скольжения:
η = /α(η, ФШ + δα(η, φ(η)).
Функция φ должна быть выбрана так, чтобы обеспечивалась асимптотическая
устойчивость начала координат η — 0 в условиях наличия неопределенности δα.
Эта задача робастной стабилизации может быть решена с использованием силь
ной обратной связи. В случае когда система содержит лишь неопределенности,
удовлетворяющие условию согласованности, может быть построен закон управ
ления в скользящем режиме, гарантирующий робастность системы по отноше
нию к любым таким неопределенностям в условиях, когда известна верхняя гра
ница значений этих неопределенностей и когда может быть обеспечена требуе
мая амплитуда соответствующего управляющего сигнала. При наличии в системе
неопределенностей, не удовлетворяющих условию согласованности, невозможно
гарантировать выполнение указанного свойства системы. Мы можем лишь на
ложить ограничения на верхнюю границу этих неопределенностей и обеспечить
робастную стабилизацию системы на многообразии скольжения. Это утвержде
ние иллюстрируется следующими двумя примерами.
Пример 14.1. Рассмотрим систему второго порядка
XI — Х2 + Θ\ΧΙ SinX2?
±2=Θ<ΙΧ%+Х\+U,
где #i и #2 — неизвестные параметры, удовлетворяющие ограничениям |0i| ^ a
и |#2| ^ Ь для некоторых известных значений а и Ь. Система представлена в виде
14.1. УПРАВЛЕНИЕ В СКОЛЬЗЯЩЕМ РЕЖИМЕ
611
регулярной формы с η = х\ и ξ = Х2. Неопределенность 02 удовлетворяет усло
вию согласованности, а неопределенность θ\ — не удовлетворяет. Рассмотрим
систему
х\= Х2+Θ\Χ\sinХ2
и найдем Х2, при котором обеспечивается робастная стабилизация начала коор
динат х\ = 0. Эта цель может быть достигнута путем выбора Х2 — —кх\, к > а,
т.к.
#i#i = —кх\ 4- в\х\ sin(—кх\) ^ —(к — а)х\.
Многообразие скольжения определяется равенством s = Х2 + кх\ = 0. При этом
S= ^2^2+
х
1+
и
+ к{х2 + 01^1 SinX2)·
Для исключения известного члена в правой части положим
и=—х\—кх2+ν,
в результате чего получим
s=ν+Δ(#),
где Д(ж) = ^2^2 + k6\Xi sinx2· Поскольку
|А(х)| < ak\xi\ + Ъх\,
положим
Р(х) =ак\хг\ +Ьх\+/?о,/?о>0
и
u = -xi — кх2 — Р(х) sign(s).
Этот закон управления или его непрерывная аппроксимация обеспечивают гло
бальную стабилизацию начала координат при достаточно малой ε.
Δ
В предыдущем примере нам удалось использовать сильную обратную связь
для робастной стабилизации редуцированной модели с неудовлетворяющей усло
вию согласованности неопределенностью \θ\\ ^ а без наложения каких-либо до
полнительных ограничений на величину а. В общем случае это может оказаться
невозможным, и подобная ситуация рассматривается в следующем примере.
Пример 14.2. Рассмотрим систему второго порядка
X1=Xl + (l — 0i)#2,
±2=#2#2+
Ж
1+
и
->
где 01 и 02 — неизвестные параметры, удовлетворяющие неравенствам |0i| ^ α
и |02| ^ Ь. Рассмотрим систему
XI=Х\+(1-0i)x2
612
ГЛАВА 14
и найдем #2> при котором обеспечивается робастная стабилизация начала коорди
нат х\ = 0. Заметим, что эта система не может быть стабилизируема при θ\ = 1.
Следовательно, необходимо ограничить значение а — эта величина должна быть
меньше единицы. Полагая x<i = —кх\, получаем
xi±i =х\ —к(1—9i)xl ^ —[к(1—а)—\}х\.
Следовательно, начало координат х\ = 0 может быть стабилизируемо при
к > 1/(1 — а). Многообразие скольжения определяется равенством s = x<i +
+ кх\ = 0. Следуя процедуре, описанной в предыдущем примере, получаем
закон управления в скользящем режиме вида
и= —(1+к)х\ —кх2—Р(х) sign(s),
гдер(х) =Ьх\+ак\х2\ +/?о,/?о>0.
Δ
14.1.3. Слежение
Рассмотрим систему с одним входом и одним выходом
х - f(x) + S1(x)+g(x)[u + S(t,x,u)]i
(14.19)
У = h(x)9
(14.20)
где х,и и у — состояние, управление и управляемый выход системы соответ
ственно. Предположим, что /, д, hnSi— достаточно гладкие функции в области
DСRn
и δ — кусочно-непрерывная по t и достаточно гладкая по (ж, и) функция
для всех (i, х, и) Ε [0, оо) х D x R. Предположим также, что / и h известны,
ар, δ и 6i могут быть не определены. Для всех возможных неопределенностей
в д мы будем предполагать, что система
x = f(x) + g(x)u,
(14.21)
у=h{x)
(14.22)
имеет в D относительную степень р, т. е.
Lgh(x) = ... = LgL
p
f2h(x)
=0,LgL
p
flh(x)
^а>0
для всех х G Ζλ14 Наша цель заключается в том, чтобы построить закон управле
ния с обратной связью по состоянию, такой что выход системы у асимптотически
отслеживает командный сигнал r(t)9 удовлетворяющий условиям
14
Не умаляя общности, можно предположить, что LgL
p
f~
l
h положительно определена. Если
это не так, положим и = —и и продолжим анализ для и. Таким образом, решив поставленную
задачу для положительно определенной LgL
p
j~
l
h, мы фактически получим решение задачи для
всех двух случаев знакоопределенности, умножая в случае необходимости член управления на
sign(LgLj-1
/i).
14.1. УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
613
функция r(t) и ее производные до A
p
\t) включительно ограничены для всех
i ^ 0 и /9-я производная r^
p
\t) является кусочно-непрерывной функцией
от t:
сигналы г,
Ар
^ доступны для измерения в режиме реального времени.
С использованием метода линеаризации по входу-выходу (см. параграф 13.2)
можно показать, что система (14.21)—(14.22) может быть преобразована в нор
мальную форму посредством замены переменных
V
ф(х)
ф{х)
фг(х)
Фп-Р(х)
h(x)
o-l i
=
Т(х),
(14.23)
Lpf
l
h(x)
где фг, г = 1,..., η — ρ удовлетворяют уравнениям в частных производных
-p-glx) =0,1^г^η-ρ,
VxeD.
ox
Мы будем предполагать, что отображение Т(х) является диффеоморфизмом
на D. Поскольку функции / и h известны, а функция д может быть не опре
делена, можно полагать, что функция ψ известна, а ф может быть неизвестной.
Наложим ограничения на возмущения δ и δ\ такие, что при выполнении в возму
щенной системе (14.19)—(14.20) замены переменных (14.23) сохраняется струк
тура нормальной формы. С учетом условия на относительную степень можно
заключить, что уравнение состояния для η не будет зависеть от и. Выпишем
уравнение состояния для ξ:
& = §[/+*+*(«+*)] = §(/+*).
Если Si принадлежит нуль-пространству матрицы [dh/dx], т. е. [dh/dx]Si{x) = 0
для всех х е D, получаем
ii = Lfh(x) = ξ2·
Аналогично
&=
Лм
[/+ii+д{и+S)]=
(/ + ii).
дх
дх
Если Si принадлежит нуль-пространству матрицы [d(Lfh)/dx] для всех х £ D,
получаем
6=L^(x) =ξ3·
614
ГЛАВА 14
Продолжая эту процедуру, можно показать, что если
d(L\h)
J
ft(s)=0,1^г^ρ-2, VseД
(14.24)
то замена переменных (14.23) приводит к нормальной форме
ξρ-1 = ξρ,
ξρ = Хг^Л(ж) + L6lL
p
flh(x) + LgL
p
f-
l
h(x)[u + S(t,x,u)],
Пусть
г
[ r(p-l)
,
e=
6-r 1
При замене переменных e = ξ — 1Ζ получаем
»7 = /o(q,0>
ei=e2,
^p—1
=
e
p?
ep=L
p
h(x) + L5lL
p
flh(x) + LgL
p
f-
l
h{x)[u + i(*,a;,u)] - r
{p
\t).
Решением задачи асимптотического слежения является закон управления с обрат
ной связью по состоянию, обеспечивающий ограниченность e(t) и стремление
этой функции к нулю при t —» оо. Из ограниченности е следует ограниченность
ξ, τ. к. !Z(t) ограничена. Необходимо также обеспечить ограниченность η. Для
этого предположим, что система
обладает свойством устойчивости типа «ограниченный вход - ограниченное со
стояние» (bounded-input-bounded-state stable). Это требование выполняется для
любого ограниченного входа ξ и любого начального состояния η(0), если систе
ма η = /ο(*7,0 является устойчивой по входу-состоянию. Итак, начиная с это
го момента, мы сконцентрируем наше внимание на вопросе об ограниченности
функции е и ее стремлении к нулю. Уравнение для е принимает регулярную
14.1. УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
615
форму (14.4)—(14.5), если положить η = [ei,... ,ep_i]T
и ξ = ер. Рассмотрим
систему
где ер рассматривается как вход системы. Необходимо найти ер, обеспечивающее
стабилизацию начала координат. С учетом того что эта система представляет
собой управляемую линейную систему, представленную в канонической форме,
в качестве искомого закона управления можно взять
еР = -(fciei + · · · + fcp-iep-i),
где ki, г = 1,..., ρ — 1 выбраны так, чтобы полином
з
р
~
1
+ Vi*
P
"
2
+···+*i
был гурвицевым. Тогда многообразие скольжения определяется равенством
s=(fcieiΗ hkp-iep-i) +ep=0
и
5 = &ie2 Η hfcp-iep+ L
p
jh{x) + Z/51L^~
1
/i(x)+
+ L^"
1
/^)^ + i(t,x,u)] - rW(t).
В качестве w = ν можно выбрать простое реле или использовать закон управле
ния, обеспечивающий исключение известных членов из правой части уравнения
состояния и имеющий вид
_±
\клРп-\
k fc_ ,*> 4- ΤΚΚ(τλ —
L^L^hix)
и=
-^
[fcie2+ ···+VieP +Ь/Л(ж)- rW(t)}+υ,
где #(#) — номинальная модель для д(х). Заметим, что если д известна, т. е. когда
д=д,член
\
[Lp
fh(x) - г <">(*)]
представляет собой линеаризующую составляющую закона обратной связи,
предложенного в параграфе 13.4.2. В обоих случаях уравнение для s может быть
переписано в следующей форме:
s=LgL
p
f
1
h(x)v-\-A(t,x,v).
616
ГЛАВА 14
Предположим, что неравенство
^ Q{X)+ «ОМ,0^ко<1,
выполнено для всех (t, х, г?) Ε [0, оо) х D x R, где £ и «о предполагаются извест
ными. Тогда закон управления может быть выбран в виде
v = -/?(x)sign(s),
где /3(х) ^ Q{X)/{\ — ко) 4- /?о> /?о > 0 и его непрерывная аппроксимация может
быть получена путем замены sign(s) на sa.t(s/e). Читателю предлагается (упраж
нение 14.13) показать, что при использовании «непрерывного» закона управле
ния в скользящем режиме соответствующая замкнутая система обладает следу
ющим свойством. Существуют конечный момент времени Т\, возможно, завися
щий от ε и начальных состояний, и положительная константа к, не зависящая от
ε и начальных состояний, такие что неравенство \y(t) — r(t)\ < ке выполнено
длявсехt^Т\.
14.1.4. Интегральное управление
Рассмотрим систему с одним входом и одним выходом:
х = f(x) + Si(x,w) + g(x,w)[u + 5(ж,г&,ги)],
(14.25)
y = h(x),
(14.26)
гдехΕRn
—
состояние, и Ε R — управление, у Ε R — управляемый выход
uw ΕRl
—
вектор возмущений и неизвестных постоянных параметров. Функции
/, #, h, δ и δ\ предполагаются достаточно гладкими по (х, и) и непрерывными
поwдляхΕDСДп
, иΕRиwΕDwСR\гдеDиД^ —открытыесвязные
множества. Мы будем предполагать, что система
x = f(x) + g{x,w)u>
(14
·
27
)
V = h(x),
(14.28)
имеет относительную степень ρ в D равномерно по w, т.е. для всех (x,w) E
D x Dw выполнено
Lgh(x,w)=···=LgL
p
r h(x,w) = 0, LgL
p
f h(x,w) >α>0.
Наша цель состоит в том, чтобы построить закон управления с обратной связью
по состоянию, такой что выход системы у асимптотически отслеживает постоян
ный командный сигнал г Ε Dr С R, где Dr — открытое связное множество. Эта
задача представляет собой частный случай задачи, рассмотренной в предыдущем
Afore, у)
LgL
Q
flh(x)
14.1. УПРАВЛЕНИЕ в СКОЛЬЗЯЩЕМ РЕЖИМЕ
617
параграфе: здесь в качестве командного сигнала выступает константа и неопреде
ленность параметризована вектором w. Поэтому мы можем использовать постро
енный в предыдущем параграфе закон управления в скользящем режиме. Если
аппроксимировать функцию знака sign(s) функцией насыщения sat(s/s), ошиб
ка управления будет предельно ограничена постоянной величиной ке для неко
торой к > 0. Этот результат представляется максимально возможным для общего
случая задачи слежения, но, рассматривая соответствующую задачу интеграль
ного управления, можно обеспечить нулевую ошибку в установившемся режиме.
Выполняя анализ аналогично тому, как это было сделано в параграфе 12.3, до
полним систему интегратором ошибки управления у — г и построим регулятор
с обратной связью, обеспечивающий стабилизацию расширенной системы в точ
ке равновесия, соответствующей выполнению равенства у = г. С этой целью
предположим, что для любой пары (г, w) G Dr x Dw существует единственная
пара (xss, Uss), которая непрерывно зависит от (г, w) и удовлетворяет уравнениям
0 = /(xss) + <*1(яки «О + 9(xss, w)[uss + 6(xss, uss, w)\
r = h(xss),
т. e. xss — точка равновесия и uss — управление в установившемся режиме, обес
печивающее нахождение системы в точке равновесия xss. При
d{L)h)
дх
tfi(x,iu)=0, 1<г<р-2, \/(ж,ги) G D x Dw,
замена переменных (14.23) приводит систему (14.25)-(14.26) к нормальной
форме
ξρ-1 = ξρ,
ξρ=L
p
fh(x) 4- Lb-Jff h(x,w) + LglA~ h{x,w)[u + 6(x,uyw)],
При этом исходная точка равновесия xss переходит в новую точку равновесия
(T?SS5£SS)> где £ss = [г, 0,... ,0]т
. Дополнив вышеприведенную систему интегра
тором
ео=У~г
и применив замену переменных
Ζ = η-ηΒΒ,
е=
"ех"
β2
-
е
Р-
=
"£i-г"
6
-
£Р_
618
ГЛАВА 14
получаем расширенную систему
* = fo(z + Vss,£,w) = /о(г,е,гу,г),
ео=ei,
ei=e2,
е
/9—1
—
вр,
ер=L
p
fh(x) + Ls1L
p
f~ h(x,w) + LgL
p
f h(x,w)[u + S(x,w,w)].
Легко видеть, что система, расширенная цепью из ρ +1 интеграторов, сохранила
структуру нормальной формы после замены координат. Поэтому при разработке
закона управления в скользящем режиме мы можем воспользоваться результата
ми предыдущего параграфа. В частности, мы можем выбрать
s=fcoeo+kiei -\
Ь кр-\ер-\ + ер,
где &г, i = 0,..., ρ — 1 выбраны так, чтобы полином
s
p
+ кр-гз^
1
+···+hs+fco
был гурвицевым. Тогда
s= k0ei Η hfc^-Ιβρ+
+L
P
fh(x) +L(51L^~
1
/i(x,w) +L5L^
_1
/i(x,w;)[n + 5(a:,w,ii;)].
Закон управления принимает следующий вид:
и=υ или и=
[ковгΗ hkp-itp + L
p
f(x)] + ν,
где д(х) — номинальная модель для д(х, w). При этом
s=Lglff~h(x, w)v +Δ(ж,ν,w,г).
Если неравенство
Δ (ж, v,w,r)
LgL
p
f h(x, w)
<ρ(α)+«oM,0<«о<1,
выполнено для всех (ж, v,w,r) £ D x Rx Dw x Dr, где ^ и /со — известны, мы
можем положить
t; = -/?(*) sat (§),
14.1. УПРАВЛЕНИЕ В СКОЛЬЗЯЩЕМ РЕЖИМЕ
619
где/?(х) ^ д(х)/(1—«о)+Аь А) > 0. Соответствующая замкнутая система имеет
точку равновесия в (z, ео, е) = (0,ёо, 0). Факт стремления траекторий замкнутой
системы к этой точке равновесия может быть доказан аналогично тому, как это
было сделано в параграфе 14.1.2. В частности, если для системы i = fo(z, e, w, r)
существует функция Ляпунова Vi(z,w,r), удовлетворяющая неравенствам
аг(\\г\\) ^V1(z,w,r)
^a2(\\z\\),
^f0(z,e,w,r)^-a3(\\z\\),V\\z\\>ne\\)
равномерно по (w, г) для некоторых /С-функций oi, 0:2, аз и j, можно показать,
что существуют два компактных положительно инвариантных множества Ω и Ωε,
таких что каждая траектория, начинающаяся в Ω, достигает Ωε за конечное вре
мя. Множества Ω и Ωε могут быть определены в соответствии с нижеследующей
процедурой. На первом шаге запишем замкнутую систему в следующей форме:
i = /o(z,e,w,r),
з =-{LgL^fyPsat (|)+Δ,
где С = [ео,..., ep_i]T
и матрица А гурвицева. С использованием неравенства
ss < —а/?о(1— ^о)к| при \s\ ^ε
покажем, что множество {\s\ ^ с}, с > ε, является положительно инвариантным.
На втором шаге процедуры с использованием функции Ляпунова V2(C) = С
Т
^С>
где Ρ — решение уравнения Ляпунова РА + А
Т
Р = —/, и неравенства
^<-C
T
C + 2||CIII|PB|IN
покажем, что множество {|s| ^ с} Π {V2 ^ c
2
pi} является положительно инвари
антным для некоторой р\ > 0. Внутри этого множества выполнено неравенство
II с II < ср2 для некоторой р^ > 0. Наконец, на заключительном шаге процедуры
используем неравенство
Vi <-Q3(|N|), У||г||>7(одг)
для доказательства того, что множество
Ω={\s\^ с}Π{V2^ с
2
Р1}П{Vi<со}
является положительно инвариантным для любой со ^ 02(7(^2)). Аналогично
может быть показано, что множество
Ωε={\з\<ε}Π{У2<ε
2
Ρ1} Π {Vx < 02(7(^2))}
является положительно инвариантным и что каждая траектория, начинающаяся
в Ω, достигает Ωε за конечное время.
620
ГЛАВА 14
Если точка z = 0 является экспоненциально устойчивой точкой равнове
сия системы z = /o(^,e,ti;,r), можно повторить доказательство теоремы 14.2
и показать, что каждая траектория в Ωε стремится к желаемой точке равновесия
при t —> оо. В частности, если Vs(z^w^r) является функцией Ляпунова, полу
ченной с использованием обратной теоремы Ляпунова 4.14 для экспоненциально
устойчивого начала координат z = О, Ρ — решение уравнения Ляпунова РА +
+А
Т
Р = — I и (£, ё) — отклонение (С, s) от соответствующего равновесного
состояния, то можно показать, что производная функции
ν0 = νΖ+\ξτρξ +\8
2
при λ > 0 удовлетворяет неравенству
15
,τ
Vo^-
-кг
λ
(Afc5 + *β)
—&4
-{Хк5 + кв)
(к2/е) - к7
ИС1ЫИ1
где к\ и k<i — положительные константы иfc^,г — 3,..., 7, — неотрицательные
константы. Производная Vo может быть сделана отрицательно определенной, ес
ли положить λ > Щ/к\ и выбрать константу ε достаточно малой, так чтобы
(3 х 3)-матрица в предыдущем выражении была положительно определенной.
В частном случае, когда β — к (константа) и и — ν, «непрерывный» закон
управления в скользящем режиме имеет вид
-fcsat
fcoeo + к\е\ Η h kp-\ep-\ + ер
(14.29)
При ρ = 1 закон управления (14.29) принимает классический вид ПИ-регулятора
с насыщением на выходе (см. рисунок 14.13). При ρ — 2 вышеприведенный за
кон управления представляет собой классический ПИД-регулятор с насыщением
на выходе (см. рисунок 14.14). Таким образом, можно отметить существование
явной связи между этими двумя классическими регуляторами и «непрерывным»
законом управления в скользящем режиме.
14.2. Ляпуновский синтез закона управления
14.2.1. Задача стабилизации
Рассмотрим систему
х = f(t,x) + G{t,x)[u + 6(t,x,u)},
(14.30)
15
Для доказательства этого неравенства необходимо дополнительное условие
\A(xss,vi,wyr)
-
A(a;Ss,V2,w,r)
LgL
p
f h(xSS)w)
длявсех(г?1,г>2,гу,г)£ихRxDw x Dr.
<ф1-г*|, 0<*<1,
14.2. ЛЯПУНОВСКИЙ СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ
621
1
^
Λ
J
1 *·]К,
*
КР
Τ
А;
к
—»· ОУ
У
ОУ - объект управления
Рис. 14.13. «Непрерывный» закон управления в скользящем режиме (14.29) для систем
с относительной степенью, равной единице: ПИ-регулятор с Ki = kko/ε и Кρ = к/ε
и насыщением на выходе
Λ
JА
S
1»-
S
Кр
»•
KD
У
\5—
к
к
—*· ОУ
У
ОУ - объект управления
Рис. 14.14. «Непрерывный» закон управления в скользящем режиме (14.29) для систем
с относительной степенью, равной двум: ПИД-регулятор с Ki = kko/ε, Кρ — к/ε,
KD = к/ε и насыщением на выходе
гдех€Rn
—
состояние и и G RP — управление. Функции /, G и δ опре
деленыдля (£,ж,м)G[0,оо)хD хR
p
,
гдеDсR
n
—
открытая область, со
держащая начало координат. Предположим, что /, G и δ кусочно-непрерывны
по t и локально липшицевы по х и и. Функции / и G предполагаются извест
ными, а функция δ неизвестна и включает в себя различные неопределенности,
наличие которых обусловлено упрощением модели, параметрическими возмуще
ниями и т.п. Предполагается, что неизвестный член δ удовлетворяет условию
согласованности. Номинальная модель системы имеет вид
х=f(t, х)+G(t,x)u.
(14.31)
Наша цель состоит в том, чтобы с использованием этой модели разработать ста
билизирующий закон управления с обратной связью по состоянию. Предполо
жим, что существует закон управления с обратной связью и = tp(t, x) такой, что
начало координат замкнутой номинальной системы
х=f(t, х)+G(t,х)ф{г,х)
(14.32)
равномерно асимптотически устойчиво. Предположим также, что известна
функция Ляпунова для системы (14.32), т.е. существует непрерывно диф-
622
ГЛАВА 14
ференцируемая функция V(t, x), удовлетворяющая неравенствам
аг(\\х\\) *ZV(t,x) ^а2(\\х\\),
(14.33)
^
+ %No*)
+ О^хШЬх)] < -а3(||*||)
(14.34)
для всех (t,x) € [0, оо) х D, где ai, «2 и «з - /С -функции. Предположим, что
при и = tp(t, х) + ν неопределенный член δ удовлетворяет неравенству
\\S(t,x,il>(t,x) + v)|| < p(t,x) + κο\\ν\1 0 < «о < 1,
(14.35)
где ρ : [0, оо) х D —> R — неотрицательная непрерывная функция. Оценка (14.35)
является единственной доступной для нас информацией о неизвестном члене δ.
Функция ρ представляет собой меру неопределенности. Важно подчеркнуть, что
мы не требуем, чтобы ρ была малой, но она должна быть известна. Наша цель
в этом параграфе заключается в том, чтобы с учетом того, что функция Ляпу
нова V, функция ρ и константа ко в (14.35) известны, синтезировать обратную
связь ν так, чтобы закон управления и = ф(Ь,х) + ν стабилизировал рассматри
ваемую систему (14.30) при наличии в ней указанных неопределенностей. Метод
нахождения ν называется ляпуновским синтезом (Lyapunov redesign).
Прежде чем перейти к описанию этого метода, рассмотрим вопрос о том,
как представленный в предыдущей главе метод линеаризации обратной связью
может быть использован для решения сформулированной выше задачи.
Пример 14.3. Рассмотрим линеаризуемую обратной связью систему
* = /0*0 + G(x)u,
где/:D—>R
n
иG:D—•R
nx
P — гладкие функции, определенные в области
DСRn
.
Предположим, что существует диффеоморфизм Г : D —• i?n
, такой
что Dz = T(D) содержит начало координат и Т(х) удовлетворяет уравнениям
в частных производных
^/(х) = АТ(х)-Вф)а(х),
^С(х) = Вф),
где (А, В) — управляемая пара и j(x) — невырожденная для всех х £ D матрица.
Замена переменных z = T(x) преобразует систему к виду
z = Az + В^{х)[и — а(х)].
Рассмотрим возмущенную систему
* = /0*0+Δ/0*0+No) + AG(x)]u
14.2. ЛЯПУНОВСКИЙ СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ
623
с гладкими возмущениями, которые удовлетворяют на D условиям
16
Цд^я) = Вф)А1(х), AG(x) = G(x)A2(x).
Возмущенная система может быть представлена в виде (14.30), т. е.
z = Az — Bj(x)a(x) + В^{х)[и + 6(х, it)],
где S(x,u) = A\(x) + А2(х)и. Поскольку номинальная система линеаризуема
обратной связью, номинальный стабилизирующий закон управления может быть
выбран в следующем виде:
ф(х) = а(х) - ^f~
1
(x)Kz = а(х) - j~
1
(x)KT(x),
где К выбрана так, чтобы матрица (А — В К) была гурвицевой. В качестве функ
ции Ляпунова для замкнутой номинальной системы
z=(А- BK)z
может быть выбрана V{z) = z
T
Pz, где Ρ — решение уравнения Ляпунова
Р(А-ВК)+(А-ВК)ТР =
-L
При и = ф(х) + ν неопределенный член 6(х, и) удовлетворяет неравенству
Щх,<ф{х) + υ)\\ < \\Аг(х) + А2(х)а(х) - A2(x)1~
1
(x)Kz\\ + \\А2(х)\\ \\v\\.
Таким образом, для того чтобы неравенство (14.35) было справедливо, необходи
мо обеспечить выполнение для некоторой непрерывной функции р(х) неравенств
||Δ2(*)||<«ο<1
(14.36)
и
\\Аг(х) + А2(х)а(х) - А2(х)7-\х)КТ(х)\\
< р(х)
(14.37)
в области, содержащей начало координат
17
. Неравенство (14.36) представляется
ограничительным, т. к. оно накладывает условия на пределы возможного изме
нения возмущения А2. С другой стороны, неравенство (14.37) не является столь
ограничительным, поскольку по предположению функция ρ не должна быть ма
лой. Выбором функции ρ определяется рост величины в левой части неравен
ства (14.37).
Δ
16
Можно показать, что возмущенная система также линеаризуема обратной связью и с исполь
зованием той же замены переменных Т(х) при условии, что матрица I + Аг невырожденна. Из
условия (14.36) следует, что / + Аг действительно невырожденна.
17
Автор вводит функцию р(х) в (14.37) вместо функции p{t,x) в (14.35). Это возможно, по
скольку левая часть (14.37) не зависит от £. — Прим. ред. перев.
624
ГЛАВА 14
Система (14.30), замкнутая управлением и = ф(Ь, х) + ν, имеет вид
х=f(t, х)+G(t,х)ф(Ъх)+G(t,x)[v+$(*,х,ф{Ь,х)+ν)].
(14.38)
и представляет собой возмущение замкнутой номинальной системы (14.32). Вы
числим производную функции V(t,x) вдоль траекторий системы (14.38). Для
упрощения записи опустим аргументы функций:
*=ж
+
f(/+Сф)+
fG(w+δ)
<-"
3(WI) +
%G{V+δ)
·
Положим w
T
= [dV/dx]G и перепишем последнее неравенство в следующей
форме:
V < -α3(ΙΝ|) 4- w
T
v+w
T
S.
Первый член в правой части обусловлен вычислением производной функции Ля
пунова V вдоль траекторий замкнутой номинальной системы. Аналогично вто
рой и третий члены соответствуют управлению ν и неопределенному члену 5.
В предположении о выполнении условия согласованности неопределенный член
δ и член управления ν появились в правой части этого неравенства вместе в виде
суммы. Следовательно, можно выбрать υ так, чтобы скомпенсировать (дестаби
лизирующий) эффект от воздействия возмущения δ на величину V. Далее бу
дут предложены два метода выбора υ, при которых обеспечивается выполнение
неравенства w
T
v + νοτδ ^ 0. Предположим, что неравенство (14.35) выполнено
с нормой || · ||2, т.е.
\\6(t,x,ip(t,x) +υ)\\2 < p(t,x) + K0IN2, 0 ^ «о < 1.
Тогда
w
T
v+w
T
5<w
T
v +IMI2IHI2<w
T
v + |И|2[р(*,ж) + «oIMb].
Полагая
г/ = -|7(*,х).-^г,
(14.39)
где η — неотрицательная функция, получаем
w
T
v + νυτδ < -r?|H|2 4- p\\w\\2 + W/IMh = -*?(1 - «o)INh + PlIHh-
Выбор η(1,Χ) ^ p(t,x)/(l — «0) для всех (t,x) £ [0,00) х D обеспечивает
w
T
v + νοτδ < —р||го||2 + PlIHh = 0.
Следовательно, при использовании закона управления (14.39) производная функ
ции V(t,x) вдоль траекторий замкнутой системы (14.38) отрицательно опреде
лена.
14.2. ЛЯПУНОВСКИЙ СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ
625
Альтернативный подход заключается в следующем. Предположим, что
(14.35) выполнено с нормой || · ||оо, т.е.
\\5(t,x,il;(t,x) +г>)||оо ^ p{t,x) + ^о|М|ос, 0 ^ к0 < 1.
Тогда
w
T
v+w
T
S<w
T
v+IHI1NI00<TM
T
v + |k||i[p(t,x) + «oNloo].
Положим
ν = —ry(i, x) sign(w),
(14.40)
где ηψ,Χ) ^ p(t,x)/(l - no) для всех (t,x) Ε [0,oo) x .D и sign(w) — вектор
размерности р с компонентами sign (од). Тогда
w
T
v+w
T
<!> < -??IMIi + PlIHIi + «(WllHli =
= -T?(I-«O)NII + PIHII<
<-p|Hi+p|H|i=0.
Следовательно, при использовании закона управления (14.40) производная функ
ции У(£, ж) вдоль траекторий замкнутой системы (14.38) отрицательно определе
на. Заметим, что законы управления (14.39) и (14.40) совпадают в случае, когда
система имеет один вход (р = 1).
Законы управления (14.39) и (14.40) являются разрывными функциями со
стояния х. Отсутствие непрерывности в правой части модели приводит к воз
никновению некоторых сложностей теоретического и практического характера.
С теоретической точки зрения мы должны переопределить закон управления для
того, чтобы избежать возможного деления на нуль. Также следует тщательно ис
следовать вопрос о существовании и единственности решений замкнутой систе
мы, т. к. используемые в этом случае обратные связи не являются локально лип-
шицевыми по х функциями. С практической точки зрения при реализации этих
разрывных законов управления часто возникает явление чаттера, обусловленное
несовершенством используемых реле и наличием задержек в канале управления
и выражающееся в том, что при переключении режимов управления траектории
системы часто пересека.т поверхность переключения
18
. Для того чтобы избавить
себя от необходимости решать все эти непростые проблемы, можно воспользо
ваться более простым и эффективным методом — применить вместо разрывного
закона управления соответствующую непрерывную аппроксимацию. Процедура
нахождения этой аппроксимации аналогична для двух вышеуказанных законов
управления. Поэтому далее мы найдем непрерывную аппроксимацию для зако
на управления (14.39), а соответствующую задачу для закона управления (14.40)
предложим читателю решить самостоятельно (см. упражнения 14.21 и 14.22).
Рассмотрим закон управления с обратной связью
ν= /~^>*)(TM/ΙΗ|2),
если 77(£,х)|Н|2 > ε,
(14 41)
\-^(t,x)(w/e)
если г/(*,ж)||гу||2 < ε.
ν''
Явление чаттера рассматривается более подробно в параграфе 14.1.
626
ГЛАВА 14
При использовании управления (14.41) производная функции V вдоль траекто
рий замкнутой системы (14.38) отрицательно определена при 77(£,ж)||ги||2 ^ ε.
Нам осталось установить знак V при Т7(£,ж)||ги||2 < ε. В этом случае
У^-аз(\\х\\2) + TM
7
с
€
Член
η2
< -а3(||а;||2) - -^INll + PlNh + «olHhNh =
= -α3(ΙΜ|2) - ^\\w\\l + p\\w\\2 + !^-\\w\\l ^
s$ -аз(||ж||2) + (1 - «о) ( -7HNI2 + V\\wh I ·
-^Nli + ^INb
ε
принимает максимальное значение ε/4 при r/IIHh = ε/2. Поэтому
при ry(i,a;)||if;||2 < ε. С другой стороны, при 7/(£,ж)||гу||2 ^ ε производная V
удовлетворяет оценке
V < -аз(||х||2) < -аз(||*||2) +
в(1
~Ч
Таким образом, неравенство
ν <-«*(No)+ ^^
выполнено независимо от значения ^(t, х)||ги||2. Пусть г > 0 таково, что Вг с D.
Выберем ε < 2аз(а^~
1
(а1(г)))/(1 — «о) и положим μ = α^"
1
(ε(1 - «о)/2) <
a2
1
(ai(r)). Тогда
V^-±a3(\\x\\2), V^^ ||x||2 < г.
Применяя теорему 4Л 8, приходим к заключению, что решения замкнутой систе
мы равномерно предельно ограничены некоторой функцией от ε, принадлежащей
классу /С. Этот результат сформулирован в виде следующей теоремы.
Теорема 14.3. Рассмотрим систему (14.30). Пусть D С Rn
—
область,
содержащая начало координат, и Вг — {ЦжЦг ^ г} С D. Пусть t/>(t,x) —
стабилизирующий закон управления для номинальной системы (14.31) и соот
ветствующая функция Ляпунова V(t,x) удовлетворяет (14.33) и (14.34) для 2-
нормы при всех t ^ 0, х £ D и для некоторых К-функций ai, OL<I и аз. Пред
положим, что неопределенный член δ удовлетворяет (14.35) для 2-нормы при
14.2. ЛЯПУНОВСКИЙ СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ
627
всех t ^ 0, х Ε D. Пусть υ определяется равенством (14.41), и выберем
ε < 2as(oi21(ai(r)))/(l — ко). Тогда для любого ||а;(£о)||2 <
a
21(
a
i(r)) суще
ствует конечный момент времени t\, такой что решение замкнутой систе
мы (14.38) удовлетворяет неравенствам
\\x(t)\\2 ^ No(*0)||2,t - to), Vi0 ^ t < tu
(14.42)
\\x(t)\\2^b(e), Vi^i,
(14.43)
где β — некоторая КС-функция и Ь — некоторая К-функция, определяемая ра
венством
Ь(е) = α^(α2(μ)) = af
1
(а2(а^(ε(1 - «о)/2))).
Если все предположения выполнены глобально иа\ принадлежит классу /CQO, то
неравенства (14.42) и (14.43) выполнены для любого начального состояния x(to).
Таким образом, в общем случае полученный с использованием ляпуновско-
го синтеза непрерывный закон управления (14.41) не обеспечивает стабилизацию
начала координат, в то время как соответствующий разрывный закон управления
гарантирует достижение этой цели. Тем не менее непрерывная версия этого за
кона гарантирует равномерную предельную ограниченность решений. Посколь
ку в качестве предельной границы выступает принадлежащая классу /С функ
ция 6(ε), эта граница может быть сделана произвольно малой путем выбора до
статочно малой ε. В предельном случае ε —> 0 мы получаем соответствующий
разрывный закон управления. Заметим, что нет никакой необходимости в том,
чтобы делать константу ε очень малой. Единственным требованием на ε являет
ся то, что она должна удовлетворять неравенству ε < 2скз(а^~
1
(а1(г)))/(1 — к$).
Это условие выполнено для любого значения ε, если все сделанные предположе
ния остаются справедливыми глобально и функции с^, (г = 1,2,3) принадлежат
классу /Соо. Разумеется, с практической точки зрения параметр ε следует делать
малым, т. к. наша цель заключается в том, чтобы привести траектории системы
в окрестность начала координат, которая должна быть настолько малой, насколь
ко это возможно. Более строгие результаты о малости ε можно получить, если
предположить, что член неопределенности δ обращается в нуль в начале коор
динат. Предположим, что существует шар Ва = {\\х\\2 ^ а},а < г, такой что
следующие неравенства выполнены для всех х Ε Βα:
аз(1МЬ) > Ф\х),
(14.44)
??М^?7о>0,
(14.45)
p(f,*)<pi0(x),
(14.46)
гдеφ:R
n
—> R — положительно определенная функция от х. Выбор ε < Ь~
г
(а)
гарантирует, что траектории замкнутых систем будут принадлежать Ва после
некоторого конечного момента времени. При 77(£,х)||г(;||2 < ε производная V
628
ГЛАВА 14
удовлетворяет неравенствам
V < -α3(||*||2) -
??2(1
£"
K0)|NI + Р\Н\2 <
< -|аз(||х||2) - \ф\х) ~ ^e^Ml + Р1Ф(х)ЫЬ <
< -±«з(1МЫ - \
ф(х)
\\M\2
1
-Pi
-Р\ 2?7о(1 - «ο)/ε J IHh
Матрица квадратичной формы будет положительно определенной, если ε <
< 2т7о(1 — tto)/Pi· Таким образом, выбрав ε < 2г7о(1 — К>О)/РЪ получаем
У < —аз(1к1Ь)/2. Поскольку У ^ —азСМЬ) ^ —аз(||ж||2)/2, выполнено
г/(^,х)||гу||2 ^ ε и можно заключить, что
V < -^аз(||х||2).
Из этого неравенства следует, что начало координат равномерно асимптотически
устойчиво.
Следствие 14.1. Предположим, что выполнены все предположения теоре
мы 14.3, а также неравенства (14.44)-(14.4б). Тогда для всех ε < min{2ryo(l —
—
tto)/Pi> b
-1
(a)} начало координат замкнутой системы (14.38) равномерно
асимптотически устойчиво. Если OLi{r) = k^r
0
, начало координат экспоненци
ально устойчиво.
Следствие 14.1 особенно полезно в случаях, когда начало координат замкну
той номинальной системы (14.32) экспоненциально устойчиво и возмущение
S(t, х, и) является липшицевой по х и и функцией, обращающейся в нуль в (х =
= 0,и = 0). В подобных ситуациях ф(х) пропорциональна \\х\\2 и для неопре
деленного члена выполнено (14.35) с р(х), удовлетворяющей (14.46). В общем
случае условие обращения возмущения в нуль в начале координат может ока
заться недостаточным для выполнения условия (14.46). Например, если в ска
лярном случае ф(х) = |х|
3
, то член возмущения х не может быть ограничен
функцией р\ф{х).
Результат о стабилизации, сформулированный в следствии 14.1, зависит
от выбора функции ту, которая должна удовлетворять (14.45). Можно показать
(упражнение 14.20), что если η не удовлетворяет (14.45), предложенный закон
управления может не обеспечить стабилизацию начала координат. Если η удо
влетворяет (14.45), закон управления (14.41) действует в области г/ЦгуЦг < ε как
обратная связь с большим коэффициентом усиления ν = —kw, где k ^ Ηο/ε-
Этот закон управления с сильной обратной связью может стабилизировать нача
ло координат, если выполнены (14.44)-(14.46) (см. упражнение 14.24).
Пример 14.4. Продолжим рассмотрение системы, линеаризуемой обрат
ной связью и введенной в примере 14.3. Предположим, что неравенство (14.36)
выполнено с нормой || · \\2. Предположим также, что неравенство
\\Аг(х) + А2(х)а(х) + A2(x)-y-
1
(x)Kz\\2
< Pi\\z\\2
14.2. ЛЯПУНОВСКИЙ СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ
629
выполнено для всех z Ε Вг С Dz. Тогда (14.37) выполнено с ρ = Р1Ц2Ц2. Выбе
рем закон управления υ в виде (14.41) с
77= 1 + Pill*ll2
(1-«о)'
w
T
=
2z
T
PB,
ε<min«
2(1- «0) 2r
2
An ,(P)
P? ' (1 - /^o)Amax(P)
Можно показать, что все предположения теоремы 14.3 и следствия 14.1 выпол
нены при ai(r) = Amin(P)r
2
,
a2(r) = Amax(P)r
2
,
a3(r) = r
2
,
<£(*) = ||z||2
и а = г. Таким образом, использование управления и = ф{х) +v делает начало
координат возмущенной замкнутой системы экспоненциально устойчивым. Если
все предположения выполнены глобально и отображение Т(х) является глобаль
ным диффеоморфизмом, начало координат х — О является глобально асимптоти
чески устойчивым
19
.
Δ
Пример 14.5. Рассмотрим уравнение маятника, введенное в примере 13.18:
Х\=Ж2,
Х2=αsinxi —bx24-си.
Пусть δ\ = π. Наша цель заключается в стабилизации маятника в точке равнове
сия разомкнутой системы х = 0. Эта система является линеаризуемой обратной
связью и заменой переменных Т(х) = х. Номинальный закон управления с об
ратной связью может быть записан в следующей форме:
ф{х)= - (τ)sinrri-(
-
J (feixi + к2Х2),
где а и с — номинальные значения параметров а и с и к\ и к2 выбраны так, чтобы
матрица
0
1
была гурвицевой. При и = ф{х) + ν неопределенный член δ имеет вид
А-ВК =
i=i
Следовательно,
ас—ас\ .
(с—с\п
,7
λ
sinxi - (
——
] {kixi + k2x2) +
V.
\δ\ < pi||x||2 + «oM, Vx Ε Д2
, Уг;ЕД,
19
В действительности начало координат z = 0 является глобально экспоненциально устойчи
вым, но мы не можем сделать заключения о том, что точка х = 0 является глобально экспоненци
ально устойчивой, если не наложим дополнительные условия на линейный рост ||Т(ж)|| < £i||#||
и ЦТ-1
(г)|| ^ ЬгЦгЦ, которые должны выполняться глобально.
630
ГЛАВА 14
где
к0^
К=-с
И
к>
ас—ас
+
ф^1
В предположении, что ^о < 1> выберем ν как в предыдущем примере. Тогда по
лученный закон управления и = ф(х) + ν делает начало координат глобально
экспоненциально устойчивым. В примере 13.18 мы исследовали рассматривае
мую здесь систему, но замкнутую управлением и = ф(х). Сравнение соответ
ствующих результатов выявляет эффект наличия дополнительной компоненты ν
в законе управления. В примере 13.18 было показано, что закон управления и =
= тр(х) стабилизирует систему при введении ограничения на к:
к< 2VP212+P22
В рассматриваемом здесь случае это ограничение снимается, но при условии, что
нам известно значение к.
Δ
Пример 14.6. Рассмотрим снова уравнение маятника из предыдущего при
мера. На этот раз предположим, что точка подвеса маятника движется в горизон
тальном направлении с ускорением, заданным ограниченной и зависящей от вре
мени функцией. Для простоты изложения пренебрежем трением (6 = 0). Урав
нение состояния имеет вид
±1=Х2,
±2 = asin#i +cu + h(t) cosxi,
где h(t) — (нормализованное) ускорение движения точки подвеса в горизонталь
ном направлении, такое что \h(t)\ ^ Η для всех t ^ 0. Номинальная модель
и соответствующий номинальный закон управления определяются так же, как
и в предыдущем примере (при b = 0). Неопределенный член δ удовлетворяет
неравенству
Н<Р1No + «оН + я/с,
где р\ и «о — те же, что и в предыдущем примере. В рассматриваемом здесь
случае р(х) = pi||x||2 + Η/с и эта функция, как легко видеть, не обращает
ся в нуль в х = 0. Выбор η в законе управления (14.41) должен удовлетво
рять η ^ (pilHh + Н/с)/(1 - ко). Положим η{ρη = щ + pi||x||2/(l - κ0), где
77о ^ Я/с(1 — ко). В предыдущем примере мы, не умаляя общности, положи
ли η(0) = 1, что в рассматриваемой здесь ситуации представляется единственно
возможной модификацией закона управления, которую следует сделать для того,
чтобы учесть факт не обращения в нуль члена возмущения h(t) cos^i. Посколь
ку р(0) φ 0, следствие 14.1 неприменимо. С использованием теоремы 14.3 мы
можем лишь заключить, что решения замкнутой системы равномерно предельно
ограничены и соответствующая предельная граница пропорциональна y/ε. Δ
14.2. ЛЯПУНОВСКИЙ СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ
631
14.2.2. Нелинейное демпфирование
Рассмотрим снова систему (14.30) при 6(t,x,u) = Г(Ь,х)6о^,х,и):
х = /(*, х) + G(t, х)[и + Г(*, ж)*0(*, х, w)].
(14.47)
Так же как и ранее, мы будем предполагать, что функции / и G известны,
a So(t,x,u) — неопределенный член. Функция Г(£,ж) предполагается известной,
/, G, Г и <$о — кусочно-непрерывные по t и локально лишицевые по х и и для
всех(t,х,и) е[0,оо)хR
n
x#
р
функций. Предполагается, что δο равномерно
ограничена для всех (t,x,u). Пусть ip(tyx) — номинальный стабилизирующий
закон управления, обеспечивающий глобальную равномерную асимптотическую
устойчивость начала координат замкнутой номинальной системы (14.32). Пред
положим, что существует функция Ляпунова V(t,x)9 удовлетворяющая (14.33)
и (14.34) для всех (t,x) Ε [0, оо) х R
n
, где функции ai, oti и аз принадлежат
классу /Соо- Если известна верхняя граница ||5о(£,х, г/)||, в соответствии с выше
изложенной процедурой можно построить составляющую закона управления υ,
обеспечивающую робастную глобальную стабилизацию. В этом параграфе мы
покажем, что, даже в случае когда верхняя граница δο неизвестна, оказывается
возможным найти компоненту закона управления ν, обеспечивающую ограни
ченность траекторий замкнутой системы. С этой целью положим и = i/)(t, x)+v.
Тогда производная V вдоль траекторий замкнутой системы удовлетворяет нера
венству
v=
%+%
и+Сф) +
%G{v+τδο)
^ -"«(Μ)+
wT{
?+
г<5
°)'
где w
T
= [dV/dx]G. Полагая
ν = -kw\\r(t,x)\\Z, к > 0,
(14.48)
получаем
V<-a8(||x||)-fc|Hlirt + |Hl2||r||2*o,
где ко — неизвестная верхняя граница ||<5о||. Член
-«11|Г||| + |ИЫ|Г||2*й
принимает максимальное значение к^/Ак при ЦгуЦгЦГЦг = ко/2к. Поэтому
F<-a3(|N|2) + §.
Поскольку функция аз принадлежит классу /Соо, производная V всегда отрица
тельна вне некоторого шара. Из теоремы 4.18 следует, что при любом начальном
состоянии x(to) решение замкнутой системы равномерно ограничено. Синтези
рованный по Ляпунову закон управления (14.48) называется нелинейным демп
фированием (nonlinear damping). Сформулируем полученный результат в виде
следующей леммы.
632
ГЛАВА 14
Лемма 14.1. Рассмотрим систему (14.47). Пусть ф(Ь,х) — стабилизи
рующий закон управления для номинальной системы (14.31) и соответствую
щая функция Ляпунова V(t,x) удовлетворяет (14.33) и (14.34) для всех t > О
ихеR
n
и некоторых функций ai, с*2 и as класса /Соо. Предположим, что
неопределенный член δο равномерно ограничен при (£, х, и) Ε [0, оо) х R
n
x RP.
Пусть ν определяется равенством (14.48) и и — ф{Ь^х) + v. Тогда для любого
x(to) e R
n
решение замкнутой системы равномерно ограничено.
Пример 14.7. Рассмотрим скалярную систему
х=х
2
+ и + xSo(t),
где 6o(t) — ограниченная функция от t. Номинальный стабилизирующий закон
управления имеет вид ф(х) = —х
2
—
х, и соответствующая функция Ляпунова
V(x)=х
2
удовлетворяет (14.33) и (14.34) глобально при ai(r) = Oi2(r) =
=аз(г)=г
2
.
Составляющая нелинейного демпфирования (14.48) с к = 1 имеет
видυ= —2х
3
.
Замкнутая система
х=—х
—
2х
3
+ xSo(t)
имеет ограниченное решение вне зависимости от того, насколько велико ограни
ченное возмущение δο, и это обусловлено наличием члена нелинейного демпфи
рования —2х
3
.
Δ
14.3. Бэкстеппинг
Начнем исследование этого метода с рассмотрения частного случая — про
стого интегратора. Рассмотрим систему
Ч = /(Ч)+0(Ч)£
(14.49)
ξ=щ
(14.50)
где [?7,£]т € i?
n+1
—
состояние и и G R — управление. Функции / : D —• R
n
иg:D—>R
n
являются гладкими
20
вобластиDсД
п
, содержащей точку η =
= 0. Также предполагается, что /(0) = 0. Цель заключается в построении закона
управления с обратной связью по состоянию, обеспечивающего стабилизацию
начала координат (η = 0,ξ = 0). Далее будет предполагаться, что функции /
и g известны. Система может рассматриваться как каскадное соединение двух
подсистем (см. рисунок 14.15(a)). Первая подсистема определяется уравнени
ем состояния (14.49), в котором ξ рассматривается в качестве входа, а вторая
подсистема представляет собой интегратор (14.50). Предположим, что подсисте
ма (14.49) может быть стабилизирована гладким законом управления с обратной
связью по состоянию ξ = φ(η), φ(0) = 0, т. е. начало координат системы
V = f(v) + 9(η)Φ(η)
20
Для простоты изложения мы проводим анализ в предположении, что все функции гладкие.
При рассмотрении конкретных задач часто оказывается достаточным предположить существова
ние производных до некоторого порядка.
14.3. БЭКСТЕППИНГ
633
и
Ш
(а)
ξ\
A 9{v)
ШГ
1 л·?)
ν
I
9(v) ННЭ
»
(b) -*W
/
/(·)+»(·¥(·)
/
-Φ
(c)
$fa) Η*Θ—i /
!/(•) + *(·)*(·)
Рис. 14.15. (а) Блок-схема системы (14.49)-( 14.50); (b) та же система с φ(η); (с) бэкстеп-
пинг — введение —φ(η) через интегратор
является асимптотически устойчивым. Предположим также, что нам известна
(гладкая, положительно определенная) функция Ляпунова ν(η), удовлетворяю
щая неравенству
^Ш+9ШШ
< ~W(v), Vry G D,
(14.51)
где \ν{η) — положительно определенная функция. Прибавляя и вычитая д(г))ф(ц)
из правой части (14.49), получаем эквивалентное представление
η=if(v)+дШШ +яШ -ФШ,
которому соответствует блок-схема, изображенная на рисунке 14.15(b). Замена
переменных
Ζ=ξ- φ(η)
приводит к получению системы
ν = if(v) +д{п)ФШ + g(v)z,
634
ГЛАВА 14
которой соответствует блок-схема, изображенная на рисунке 14.15(c). Процедура
перехода от представления системы в виде, изображенном на рисунке 14.15(b),
к представлению, изображенному на рисунке 14.15(c), может рассматриваться
как «бэкстеппинг»
21
функции —φ(η) через интегратор. Производная φ может
быть вычислена, т. к. функции /,диф известны:
Ф=щШ +9Ш)-
Положив υ = и — ф, можно преобразовать систему в каскадное соединение двух
подсистем
V = [f(v) + 9(ν)Φ(ν)] + #(Ф,
z=υ,
сходное с представлением системы, с которого мы начали наше исследование
в этом параграфе, но в последнем представлении первая подсистема имеет
асимптотически устойчивое начало координат при нулевом входе. Эта особен
ность будет использована при построении υ для стабилизации всей системы.
Используя
в качестве функции Ляпунова, получаем
Vc = f^I/fo) + 9(η)φ(η)) + §^<?(Ф + zv <
Выбор
^~
W{T]) +
%9{r})z + ZV
-
ν = ~^9(η) -kz,k> 0,
приводит к неравенству
Vc<~W(V) -kz
2
,
из которого следует, что начало координат (η = 0, z = 0) асимптотически устой
чиво. Поскольку ф(0) = 0, можно заключить, что начало координат (η = 0, ξ = 0)
асимптотически устойчиво. Подставляя выражения для v, z и φ, получаем закон
управления с обратной связью по состоянию:
«=щ\т
+ 9Ш] ~ fj^fo) - *[£ - φ(η)}.
(14.52)
21
«Backstepping» в буквальном переводе — «обратный шаг», «попятный шаг». Метод был пред
ложен П. Кокотовичем и его учениками в 1990 г., хотя аналогичные идеи публиковались и ранее.
В отечественной литературе употребляется также термин «метод обхода интегратора», а для бо
лее общих методов — «итеративный синтез», «пошаговый синтез» [Д29, Д28, Д49]. — Прим. ред.
перев.
14.3. БЭКСТЕППИНГ
635
Если все предположения выполнены глобально и ν(η) радиально неограниченна,
можно заключить, что начало координат глобально асимптотически устойчиво.
Сформулируем полученный результат в виде следующей леммы.
Лемма 14.2. Рассмотрим систему (14.49)-(14.50). Пусть φ(η) — ста
билизирующий закон управления с обратной связью по состоянию для систе
мы (14.49) с ф(0) = 0 и ν(η) — функция Ляпунова, удовлетворяющая (14.51)
для некоторой положительно определенной функции W{j]). Тогда закон управ
ления с обратной связью по состоянию (14.52) стабилизирует начало коорди
нат системы (14.49)-( 14.50) и соответствующая функция Ляпунова имеет вид
V(v) + [£ ~~ Φ{ν)]2/2· Кроме того, если все предположения выполнены глобально
и ν(η) радиально неограниченна, начало координат глобально асимптотически
устойчиво.
Пример 14.8. Рассмотрим систему
Х\=х\-х\+Ж2,
±2=U,
которая принимает вид (14.49)-(14.50) , если положить η = х\ и ξ = х^ Начнем
исследование со скалярной системы
Х\ =х\-х\
+ Х2,
в которой Х2 выступает в качестве входа. Построим закон управления с обратной
связью Х2 = ф(х\), стабилизирующий начало координат х\ = 0. При
Х2=ф{х{)= -х\ - Х\
исключается нелинейный член х\ и мы получаем
22
Х\= —Х\—х\
и V(x\) = x\/2 удовлетворяет
V=—х\—х\^ —х\,V^iGR.
Следовательно, начало координат системы х\ = —х\ — х\ глобально экспонен
циально устойчиво. Для выполнения процедуры бэкстеппинга выполним замену
переменных
Z2=X2~ Ф{Х\) —Х2+Х\+ х\,
которая приводит систему к следующем виду:
Х\= -Х\ —х\ +Z2,
z2 = и+ (1+2#i)(-:ri —xf +Z2).
22
Мы намеренно не исключаем член —х\, т.к. он обеспечивает нелинейное демпфирование.
(См. пример 13.19.)
636
ГЛАВА 14
Используя
Ve(x) = \х\ + \z\
в качестве композитной функции Ляпунова, получаем
Vc =xi(-xi - х?+z2)+z2[u+(1+2xi)(-xi -x\ +z2)\=
= —xf- xf+^2[xi+(1+2xi)(—xi—x?+гг)+u].
Положив
гх= -xi-(1+2xi)(-xi-x\+z2)-z2,
получаем
VQ =Z
XI
X-^ —Z2·
Следовательно, начало координат глобально асимптотически устойчиво.
Δ
Выполнение в предыдущем примере процедуры бэкстеппинга с одним инте
гратором не составило труда вследствие простоты скалярного случая. Для систем
большего порядка этот результат можно использовать путем рекурсивного при
менения описанной выше процедуры бэкстеппинга. Эта идея иллюстрируется
следующим примером.
Пример 14.9. Система третьего порядка
Х\= х\— х\ +Х2,
*2=#3>
±г=и
состоит из системы второго порядка, которую мы рассмотрели в предыдущем
примере, и дополнительного интегратора в канале входа. Применим процедуру
бэкстеппинга аналогично тому, как это было сделано в предыдущем примере.
После выполнения первого шага получаем, что система второго порядка
XI=х\-х\+Х2,
Х2=ХЗ,
где переменная хз рассматривается в качестве входа, глобально стабилизируема
законом управления
хз= —xi- (1+2xi)(xi -х\ +х2) -(х2+х\+х?)=Ф{х\^Х2)
и функция
V(xux2) =\х\ +\{х2+xi+х?)2
является соответствующей функцией Ляпунова. Для выполнения следующего
шага процедуры бэкстеппинга выполним замену переменных
z3=
хг-ф(х\,Х2),
14.3. БЭКСТЕППИНГ
637
в результате чего получим систему
XIх\-
х
\+
Х
2,
Х2 = Ф(ХЪХ2) + *3,
дф, о
^
ч дф.,
ч
Ζ*=
η--^Χ
{Χ'-
Χ'
+Χ2)
--^2
{Φ+ΖΖ)
-
Используя Vc = V + z|/2 в качестве композитной функции Ляпунова, получаем
VP.
+*з
дф
(-23+ф)+
дф
и
-д^{х1-
х
*
+ Х2)
-дТ2
{*
3 +ф)
= —х\ — х\- (Х2 +Х1+ х\)2
+
dv
+Z3
дХ2
дТ1^-
х
'
+х
'
)
-д%^
+ф)+и
Полагая
получаем
tt
=-f£ + l^-^
+
^
+
i£<*
+
*>-*·
z3.
Ус=~
х
\~
х
\-(
х
2+XI+ х\)2
Следовательно, начало координат глобально асимптотически устойчиво.
Δ
Абстрагируясь от частного случая (14.49)-(14.50), рассмотрим систему об
щего вида
V = f(v) + 9(ν)ξ,
(14.53)
(14.54)
где /α и ga — гладкие функции. Если неравенство ga(v,£) Φ О выполнено в рас
сматриваемой области, замена входа
и=
1
9α(η,0
[v>a-fa(V,£)}
(14.55)
преобразует подсистему (14.54) к виду, соответствующему простому интегра
тору ξ = иа. Поэтому, если существуют стабилизирующая обратная связь φ(η)
и функция Ляпунова ν(η), такие что условия леммы 14.2 выполнены для (14.53),
то с использованием этой леммы и выражения (14.55) получаем
и=фс(пЛ)=
(14.56)
638
ГЛАВА 14
где к > О — некоторая константа. При этом
УсЫ) =ν(η)+Ι[ξ- ФШ
2
-
(14-57)
Выражения (14.56) и (14.57) представляют собой соответственно стабилизирую
щий закон управления с обратной связью по состоянию и функцию Ляпунова для
совокупной системы (14.53)-(14.54). Рекурсивное применение процедуры бэкс-
теппинга позволяет получить стабилизирующий закон для треугольных систем
(strict-feedback systems) вида
* = /о(ж) + go(x)zu
z\=
fi(x,zi)+9i(x,zi)z2,
Z2 = /2(^,^1,^2) +^2(^,^1,^2)^3,
4-1 = fk-lfa Zi,...,
Zk-l) + flfc-l(x, Zly . . . ,
Zk-i)zk,
Zk=Л(ж,^1,· · ·,zk)+^(ж,*i,..., zk)u,
гдеx£Rn
,
Zi (i = 1,..., k) — скаляры и fa (г = О,..., к) обращаются в нуль
в начале координат. Использование в определении этих систем термина «тре
угольный» обусловлено тем, что нелинейные функции /^ и ^ в уравнениях для
ii(i = 1,..., к) зависят только от х, z\,...,
z^ т. е. только от переменных со
стояния, по которым осуществляется обратная связь. Далее предполагается, что
в рассматриваемой области выполнено
gi(x,zi,...,Zi) ^0, 1 < г ^ к.
Рекурсивная процедура начинается с рассмотрения системы
х = fo(x) + go(x)zi,
в которой z\ рассматривается в качестве входа. Предположим, что нам извест
ны стабилизирующий закон управления с обратной связью по состоянию этой
системы z\ — фо(х), Фо(0) = 0, и функция Ляпунова Vo(x), такая что в рассмат
риваемой области выполнено неравенство
^[Ш
+ 9о(х)Фо(х)} < ~W(x)
для некоторой положительно определенной функции W(x).B большинстве при
ложений переменная х является скалярной, что упрощает решение задачи ста
билизации. В предположении, что нам известны фо(х) и Vo(x)9 перейдем к си
стематическому выполнению процедуры бэкстеппинга. Во-первых, рассмотрим
систему
х = fo(x) + go(x)zu
Z\ =/l(ff,*i)+0l(s,2i)*2
14.3. БЭКСТЕППИНГ
639
как специальный случай системы (14.53)-(14.54) при
η=х,ξ=Zu и =z2,f =/о,9=90,fa =/i,9a=9i·
Используя (14.56) и (14.57), получаем стабилизирующий закон управления с об
ратной связью по состоянию и функцию Ляпунова:
ф1(х,г1) = ±- -Q^rifo + 9ozi) ~
-Q^9O~h(zi -Φ)-Λ
ν1(Χ9Ζ1) = ν0(Χ) + 1[Ζ1-φ(Χ)]2
.
, fci>0,
Далее, рассмотрим систему
* = fo(x) + 9о(в)*и
h = fi(x,zi) + g!(x,zi)z2,
z2 = /2(ж, zu z2) + 92(x, zi,z2)z3
как специальный случай системы (14.53)—(14.54) при
ηх
z\
, ξ=z%u=z3,f = /0+gozi
/1
0
9i
fa=/2,Pa=#2·
Используя (14.56) и (14.57), получаем стабилизирующий закон управления с об
ратной связью по состоянию и функцию Ляпунова:
(к2 > 0)и
дф,
дх
дф!
dz\
г(/о+0о*1)+ л~(Л +Λ^2)- ъг91 ~
k
2(z2-Ф1)-/2
dVi
dzi'
V2(x,zuz2) = Vi(aj,*i) + i[z2-</>2(^^i)]2
·
Эти шаги процедуры бэкстеппинга последовательно выполняются к раз, в ре
зультате чего получаем для совокупной системы стабилизирующий закон управ
ления с обратной связью по состоянию и = фк(х, z\,...,
zk) и соответствующую
функцию Ляпунова 14(х, zi,..., Zk).
Пример 14.10. Рассмотрим систему с одним входом и одним выходом,
представленную в специальной нормальной форме:
* = /о(х)+0оОФь
zi=z2,
Z%—1
—
Ζ-Г)
zr = 7(ж, z)[u — a(x, 2)],
V= zi,
640
ГЛАВА 14
где х е i?n_r
, Zi(i = l,...,r) — скаляры и 7(x
>^) 7^ 0 Для всех
О^^). Это
представление является специальным случаем представления в нормальной фор
ме (13.16)—(13.18), т. к. уравнение для х имеет вид х = /о(#) + go(x)zi, что явля
ется частным случаем соответствующего уравнения х = fo(x,z) в нормальной
форме. Система является треугольной. Ее начало координат может быть глобаль
но стабилизировано законом управления, полученным с использованием рекур
сивного применения процедуры бэкстеппинга, если могут быть найдены гладкая
функция фо(х) и гладкая радиально неограниченная функция Ляпунова Vo(x),
такие что неравенство
^[fo(x)
+ 9оШо(х)} < -W(x), Vx е R
n
выполнено для некоторой положительно определенной функции W(x). Если си
стема является минимально-фазовой, начало координат системы х = /о (ж) гло
бально асимптотически устойчиво и нам известна функция Ляпунова Vo(x), удо
влетворяющая неравенству
^/о(х) < -W(x), Ух б Rn
для некоторой положительно определенной функции W(x), то можно положить
фо(х) = 0. В противном случае следует выполнить процедуру бэкстеппинга для
фо(х) и соответствующей Vo(x). Из этого следует, что метод бэкстеппинга поз
воляет найти стабилизирующий закон управления для номинимально-фазовых
систем при условии, что разрешима задача стабилизации для нуль-динамики.
Δ
Пример 14.11. Система второго порядка
η=-η+η
2
ξ,
была рассмотрена в примере 13.16, где было показано, что закон управления
и = — к£ при достаточно большом к > 0 может обеспечить полуглобальную ста
билизацию. В рассматриваемом здесь примере будет показано, что с использо
ванием метода бэкстеппинга можно обеспечить глобальную стабилизацию. Рас
смотрим систему
η= -η +Τ72£.
Можно легко показать, что ξ = 0 и при ν${η) = η
2
/2 справедливо
ИспользуяV=Vo+ξ
2
/2—(η2
+ξ
2
)/2, получаем
V=η(-η +η
2
ξ)+ξη= -η
2
+ ξ(η3
+ и).
14.3. БЭКСТЕППИНГ
641
Таким образом, закон управления
и=-η
3
-
/с£, к> О,
обеспечивает глобальную стабилизацию начала координат.
Δ
Пример 14.12. Рассмотрим систему
23
η=η
2
-
ηξ,
аналогичную той, что была исследована в предыдущем примере. В рассматри
ваемом здесь случае уравнение η = η
2
—
ηξ не может быть стабилизировано
законом управления ξ = 0. Тем не менее можно легко показать, что при ξ = η +
+η
2
иνο(η)=η
2
/2 справедливо
^[η2
-η(η +η
2
)]=
-η
4
,νηΕΙΙ.
ИспользуяV=Vo+(ξ-η
-
η2)
2
/2, получаем
V=η(η2
-ηξ) + (ξ-η- η
2
)[η - (1 + 2η)(η2
-
ηξ)} =
=-η
4
+ (ξ-η- ν
2
)[~η
2
+u- (1+2η)(η2
-
ηξ)].
Применяя закон управления
и = (1+ 2η)(η2
-
ηξ)+η
2
-
fc(£-η
-
η2), к>0,
получаем
ν=-η
4
- Η ξ-η-η
2
)2
.
Следовательно, начало координат глобально асимптотически устойчиво.
Δ
В предыдущих двух параграфах мы рассмотрели методы построения зако
нов управления, основанных на методах скользящего режима и ляпуновского
синтеза, и показали, как эти законы управления могут быть использованы для
робастной стабилизации систем с неопределенностями, удовлетворяющих усло
вию согласованности. При использовании метода бэкстеппинга это условие мо
жет быть ослаблено. В качестве иллюстрации этого утверждения рассмотрим
систему с одним выходом
η = Ην)+9(η)ξ + δη(η,ξ),
(14.58)
ξ=fail, ξ)+9α(η,ξ)η +δξ(η,ξ),
(14.59)
23
Рассматривая у = ξ в качестве выхода, можно показать, что эта система не является
минимально-фазовой, т. к. начало координат уравнения нуль-динамики η = η
2
неустойчиво.
642
ГЛАВА 14
определенную в области D с i?n+1
, содержащей начало координат (η = 0, ξ =
= 0),гдеηΕRn
и ξ Ε R. Предположим, что ga(v^) Φ 0 и все
функции
являются гладкими для всех (г/, ξ) Ε Ιλ Пусть /, g, fa и #α известны, и δη и 5ξ —
неопределенные члены. Мы будем также предполагать, что / и /а обращаются
в нуль в начале координат и неопределенные члены удовлетворяют неравенствам
H*i(t?,0ll2<ai|H|2l
1*{(ч,01<а2||ч||2 + аз|С|,
(14.60)
(14.61)
для всех (η, ξ) G D. Неравенство (14.60) определяет класс неопределенностей
δη(η, ξ), верхняя граница которых зависит только от η. Тем не менее это условие
менее ограничительно, чем условие согласованности, которое в рассматриваемом
случае имеет вид δη = 0. Рассмотрим систему (14.58) и предположим, что мы на
шли стабилизирующий закон управления с обратной связью по состоянию этой
системы £ = φ(η), φ(0) = 0, и (гладкую, положительно определенную) функцию
Ляпунова V(г/), такие что неравенство
9V
δη [/(ч) + р(чЖч) + *|(ч,0]<-%11|
(14.62)
выполнено для всех (г/, О G D для некоторой положительной константы Ъ. Из
неравенства (14.62) следует, что η = 0 является асимптотически устойчивой точ
кой равновесия системы
η = /(η)+9(η)Φ(ν)+δη(η,ξ).
Предположим далее, что φ(η) удовлетворяет на D неравенствам
\дф\
|0(ч)|<а4|Н|2,
Θη^а5.
Рассмотрим функцию Ляпунова
νΜξ) = ν(η) + 1[ξ-φ(η)]2
,
(14.63)
(14.64)
производная которой вдоль траекторий системы (14.58)—(14.59) определяется ра
венством
Ht-Φ)fa+ 9aU+δξ- A/ +9ξ+δη)
Полагая
9α *</+*>-£.-/.-*<«-*> , fc>0,
(14.65)
14.3. БЭКСТЕППИНГ
643
и используя (14.62), получаем
*(£ - Φ)2
-
С учетом (14.60), (14.61) и (14.63) можно показать, что неравенство
Ve< -ЦЫЦ +2α6\\η\\2\ξ- Ф\- (к- α3)(ξ-φ)2
=
и„
ΤГ
Lli-^l
b
—αβ
-α6 (fc - аз) L\*-Ф\ \
выполнено для некоторой αβ > 0. Выбрав
к>а3 + -^,
получаем, что неравенство
Vr<
+ \ξ-
выполнено для некоторой σ > 0. Таким образом, мы доказали следующую лемму.
Лемма 14.3. Рассмотрим систему (14.58)-(14.59), в которой неопределен
ность удовлетворяет неравенствам (14.60) и (14.61). Пусть φ(η) — стабили
зирующий закон управления с обратной связью по состоянию для (14.58), удо
влетворяющий (14.63), и ν(η) — функция Ляпунова, удовлетворяющая (14.62).
Тогда закон управления с обратной связью по состоянию (14.65) с достаточно
большим коэффициентом к стабилизирует начало координат системы (14.58)-
(14.59). Кроме того, если все предположения выполнены глобально и функция
ν(η) радиально неограниченна, начало координат глобально асимптотически
устойчиво.
В качестве примера использования метода бэкстеппинга рассмотрим задачу
робастной стабилизации системы
Xi=Xi+i+5<(ж),1^I<П-1},
хп = *у(х)[и - а(х)] + 5л(ж),
(14.66)
определенной в области D с i?
n
, содержащей начало координат х = 0; х =
= [xi,... ,#п]
т
.
Предположим, что j(x) ^0и все функции являются гладкими
для всех х G D. Пусть α и 7 известны, и 5^, 1 < г ^ п, — неопределенные члены.
Номинальная система линеаризуема обратной связью. Мы будем предполагать,
что неопределенные члены удовлетворяют для всех х G D неравенствам
г
\5i(x)\ ^ai^2 \
х
к\, 1^г<η,
(14.67)
fc=l
644
ГЛАВА 14
где неотрицательные константы а^ (г = 1,... ,п) известны. Неравенства (14.67)
выделяют класс неопределенностей, характеризующийся тем, что верхние гра
ницы неопределенностей 5г(х), 1 ^ г ^ η — 1, зависят только от переменных с х\
по Xi, т. е. соответствующие условия на верхние границы представлены в тре
угольной форме. Тем не менее эти ограничения представляются менее ограничи
тельными по сравнению с условием согласованности, которое в рассматриваемом
случае имело бы вид 5* = О, 1 < г < η — 1. Выполняя рекурсивную процедуру
построения закона управления с использованием метода бэкстеппинга, начнем
с рассмотрения скалярной системы
где Х2 выступает в роли входа этой системы и Si(x) удовлетворяет неравен
ству |5i(x)| ^ ai|xi|. В этой скалярной системе неопределенность удовлетворяет
условию соответствия. Начало координат х\ = 0 может быть робастно стабили
зируемо сильной обратной связью Х2 = —k\xi, где к\ > О — достаточно большой
коэффициент. Пусть Vi(x\) = x\j1 — функция Ляпунова. Тогда
У\ = xi[-hxi + Si(x)] ^ -(fci - ai)x\
и начало координат стабилизируемо для всех к\ > а\. Далее, согласно методу
бэкстеппинга, лемма 14.3 применяется рекурсивно, в результате чего мы полу
чаем стабилизирующий закон управления с обратной связью по состоянию. Вы
полнение этой процедуры иллюстрируется следующим примером.
Пример 14.13. Необходимо построить закон управления с обратной связью
по состоянию, обеспечивающий стабилизацию системы второго порядка
Х\—Х2-\- Θ\Χ\ SHI #2,
±2=02^2+
x
l+
и
>
где 01 и 02 — неизвестные параметры, удовлетворяющие неравенствам |0i| ^ a
и |0г| ^ Ь; а и Ь — известные значения верхних границ этих параметров. При
δ\ = 0i#i sin X2 и 02 = 02^2 система принимает вид (14.66). Функция δ\ удо
влетворяет неравенству \Si\ ^ а\х\\ глобально; функция 02 удовлетворяет нера
венству |#21 < Ьр\х2\ на множестве |жг| ^ Р- Начиная выполнение процедуры
с рассмотрения системы
#1 = Х2 + 01^1 sina?25
положим Х2 = <t>i(xi) = —kix\ и Vi(x\) = x\/2. Тогда
Vi = xi</>i(#i) + 9\х\ sin #2 ^ —(&i — а)х\.
Выберем к\ — 1+а и сделаем замену переменных Z2 = #2+(1+
а
)х
ь в результате
чего получим систему
х\ = -(1+а)х\ +Θ\Χ\sinX2+Z2,
i2 = il>i(x) + ^2(^,0) + «,
14.3. БЭКСТЕППИНГ
645
где
i>\ = х\ + (1+ а>)х2> Ψ2=(1+ a)^ixi sin#2+#2^2-
Используя Ус = (x\+Z2)/2 в качестве композитной функции Ляпунова, получаем
Ус < -ж? + *2[ж1 + ^i(s) + ^г(я,0) + it].
Полагая
U= —Х\—ф±(х) —&Z2,
можно полнить оценку
< —ж?+ а(1+ a)|xi|I22I+b^ll^l — ^2·
В множестве
nc=
{xeR
2
\Vc(x)^c}
справедливо неравенство \х2\ ^ Ρ для некоторой р, зависящей от с
24
. В множе
стве Пс справедливо неравенство
Ус<-х\ +a(l+a)|xi||z2|+M
Z
2~i
1
+
a
)xil 1*21 - kz\ ^
^ -^ + (l + a)(a + bp)|#i||z2|
-{k-bp)z%.
Выбор
fc>6p+(l + a)
2
(a + 6p)2/4
гарантирует экспоненциальную устойчивость начала координат
25
и принадлеж
ность множества Ω0 области притяжения. Поскольку выполнение предыдущего
неравенства при любой с > О может быть обеспечено путем выбора достаточно
большого к, полученный закон управления с обратной связью обеспечивает по
луглобальную стабилизацию.
Δ
Пример 14.14. Рассмотрим снова систему
Х\= Х2 + 01#l Sin#2>
±2 = 02#2 +Х1+Щ
где |0i| < а и |02| ^ Ь. В предыдущем примере мы ограничились анализом
этой системы на компактном множестве, что позволило обеспечить полуглобаль
ную стабилизацию для класса нелинейностей, удовлетворяющих неравенствам
линейного роста (14.67). Здесь мы построим закон управления, обеспечивающий
глобальную стабилизацию. Этот результат будет получен с использованием ме
тода, представляющего собой комбинацию бэкстеппинга и метода ляпуновского
24
Для ρ справедлива оценка у/2с{1 + к\).
25
Отметим, что мы пришли к утверждению об экспоненциальной устойчивости, но в лемме
сформулирован результат об асимптотической устойчивости. Чем объясняется этот факт?
646
ГЛАВА 14
синтеза. Выполним все шаги описанной в предыдущем примере процедуры до
тех пор, пока не будет получено неравенство
Ус< —х\ + 32[Ж1+ф\{х) +Ψ2(Χ,Θ)+ и].
В примере 14.13 использовался закон управления и = —х\ — фг(х) — kz2 с боль
шим коэффициентом усиления к, обеспечивающим компенсацию эффектов, свя
занных с наличием в системе неопределенности. Для этого мы потребовали,
чтобы нелинейный член х\ был ограничен линейным членом р\х2\. Здесь мы
положим
и= —х\ —i>i(x)—kz2+ν, к>О,
где дополнительная составляющая закона управления ν подлежит дальнейшему
определению. В этом случае мы имеем
С учетом того что
Vc < -х\ - kz\ + г2[ф2(х,θ) + ν].
fofe(M)| <a(l + a)|ari|+bx|,
положим
Γ -η(Χ)
\-V
2
(x
c)sign(z2),
если v(x)\z2\ > ε,
(x)z2/e,
если 77(0;)j^j < ε,
гдеη(Χ)—щ4-α(1+a)\x\|+длянекоторых770>0иε>0.Приη(Χ)\z2|^ε
выполнено
Ζ2[ψ2(Χ, θ) + ν}^ \ψ2\ \z2\ - η\Ζ2\ < 0;
при 77(x)|z2| < ε выполнено
Г? Ζ2
Ζ2[ψ2(Χ,θ) +
ν)^\η\\Ζ2\--^^^
Тогда
ус^_ж2_Ь2+ε
Это неравенство показывает, что траектория х за конечное время достигает ша
ра Вг радиуса г — кол/ε для некоторого fco > 0. Внутри Вг справедливо нера
венство
Noа(М)| ^ а(1 + a)|xi| + 6r|x2| ^ pi(|xi| 4- \z2\)
для некоторой р\ > 0, не зависящей от ε. В пересечении шара Вг и пограничного
слоя {r?(#)|z2| < ε} справедлива оценка
Vc< -x\-kz\
+ p\\x\\\z2\ + p\\z2^
-
-^Д =
—
7yxl
KZ
2
ix?-pi|a?i||^|H- (
-f
-
P\ \z\
14.3. БЭКСТЕППИНГ
647
Член в скобках может быть сделан неотрицательным путем выбора достаточно
малой ε. Тогда
Vc ^ —7ч#1—kZ2
и, следовательно, начало координат является глобально асимптотически устой
чивым.
Δ
В заключение этого параграфа заметим, что метод бэкстеппинга может быть
использован в применении к системам с несколькими входами. Соответствую
щий метод называется блочным бэкстеппингом. Это оказывается возможным,
если выполнены определенные условия невырожденности. Рассмотрим систему
Ч=/(»7)+
аде,
(14.68)
i = fa(v,t)+Gafa£)u,
(14.69)
гдеηGi?n
, ξGi?m
, иGRm
и т может быть больше единицы. Предположим,
что /,/а,СиСа- (известные) гладкие в рассматриваемой области функции, /
и fa обращаются в нуль в начале координат и (m x т)-матрица Ga невырож-
денна. Предположим также, что подсистема (14.68) может быть стабилизирована
гладким законом управления с обратной связью по состоянию этой системы ξ =
= φ(η), φ(0) = 0, и нам известна (гладкая, положительно определенная) функция
Ляпунова ν(η), удовлетворяющая неравенству
^ΙΗν)+0(η)φ(η)}^-\ν(η)
для некоторой положительно определенной функции W(rj). Используя
Vc = V{V) + \[i- φ{η)]τ[ξ- φ{η)]
в качестве функции Ляпунова для всей системы, получаем
й = ^(/+с
ЭД+|^-*) + к-^ fa + Gau-^U +Gi)
Полагая
получаем оценку
|(/+Gi)_(^G)
r
_
/a_M5_rt
fc>О,
Vc = f£(/ + Оф) -fcfc- φ(η)]Τ[ξ - φ(η)] <
<-π(η)-Η[ξ-φ(η)]τ[ξ-φ{η)],
из которой следует, что начало координат (η — О, ξ = 0) асимптотически устой
чиво.
648
ГЛАВА 14
14.4. Управление на основе пассивности
В главе 6 мы ввели понятие пассивности системы и исследовали это свой
ство в контексте устойчивости систем с обратной связью. Идеи, лежащие в осно
ве метода построения пассивного управления и которые будут изложены в этом
параграфе, являются непосредственным применением результатов главы 6. Од
нако нет необходимости в использовании всех тех деталей анализа, с которыми
мы познакомились ранее, — достаточно напомнить определения понятий пассив
ности и наблюдаемости в нулевом состоянии.
Рассмотрим систему с ρ входами и ρ выходами
26
:
i = /(s,u),
(14.70)
У = Л(х),
(14.71)
где / — локально липшицевая по (ж, и) функция и h — непрерывная по х функ
ция;хеR
n
ииеR
m
.
Предположим, что /(0,0) = 0, т.е. начало координат
х = 0 является точкой равновесия разомкнутой системы; h(0) = 0. Напомним,
что система (14.70)—(14.71) является пассивной, если существует непрерывно
дифференцируемая положительно полуопределенная функция V(x) (называемая
функцией запаса), такая что
uTy^V
= u¥-ffau^
V(x,u) E Rn
xR
m
.
(14.72)
Система является наблюдаемой в нулевом состоянии (zero observable), если не су
ществует решения системы х — f(x, 0), которое оставалось бы постоянно в мно
жестве {h(x) = 0} и было бы отлично от тривиального решения x(t) Ξ 0. В этом
параграфе мы будем предполагать, что функция запаса является положительно
определенной. Основная идея построения пассивного управления сформулиро
вана в следующей теореме.
Теорема 14.4. Если система (14.70)-(14.71)
1) пассивна с радиально неограниченной и положительно определенной функ
цией запаса и
2) наблюдаемой в нулевом состоянии,
то начало координат х = 0 может быть глобально стабилизируемо
27
законом
управления и = —ф(у), где φ — любая локально липшицева функция, такая что
ф(0)=0 иу
Т
ф(у) >0длявсехуφ0.
26
Обычно в книге число входов обозначается через m (см. ниже). По-видимому, следует считать
ρ =га.— Прим. ред. перев.
27
Напомним, что под глобальной стабилизацией автор понимает нахождение регулятора, обес
печивающего глобальную асимптотическую устойчивость замкнутой системы, см. п. 12.1. —Прим.
ред. перев.
14.4 . УПРАВЛЕНИЕ НА ОСНОВЕ ПАССИВНОСТИ
649
ДОКАЗАТЕЛЬСТВО. Используем функцию запаса V(x) в качестве функции
Ляпунова для замкнутой системы
х = /(х,-ф(у)).
Производная функции V удовлетворяет оценке
У=
^Нх,-ф(у))^-у
т
ф(у)^0.
Следовательно, V является отрицательно полуопределенной и V — О, если
и только если у = 0. С учетом свойства наблюдаемости системы в нулевом
состоянии получаем
y(t) Ξ0^ u(t) = 0=> x{t) ΞΞ 0.
Таким образом, из принципа инвариантности следует, что начало координат гло
бально асимптотически устойчиво.
Π
Теорема представляется интуитивно понятной, если рассматривать функцию
запаса в качестве энергии системы. Пассивная система имеет устойчивое начало
координат. Все, что нужно сделать для стабилизации начала координат, — это вве
сти в систему демпфирование, которое обеспечит диссипацию энергии при x(t),
не равном тождественно нулю. В теореме в качестве такого демпфирования вы
ступает функция ф. Исследователь абсолютно свободен в выборе ф. Эта функция
может быть выбрана так, чтобы обеспечить ограничение амплитуды и. Напри
мер, если управление и должно удовлетворять неравенствам \щ\ < &*, 1 ^ г < р,
можно положить фг(у) = ki sa,t(yi) или фг(у) = (2ki/π) arctg(yi)·
Область применения теоремы 14.4 может быть существенно расшире
на, если воспользоваться предложенным в главе 6 преобразованием непассив
ных систем в пассивные. Рассмотрим, например, специальный случай уравне
ния (14.70):
х = f(x) + G(x)u.
(14.73)
Предположим, что существует радиально неограниченная, положительно опре
деленная, непрерывно дифференцируемая функция V(x), такая что
!£/(*) < 0, Vs.
Пусть
У=h(x) =
Тогда система с входом и и выходом у является пассивной. Если, кроме того, она
является наблюдаемой в нулевом состоянии, можно применить теорему 14.4.
650
ГЛАВА 14
Пример 14.15. Рассмотрим систему
Х\=#2,
±2= ~х\ +U.
Пусть V(x) = xf/A + xl/2. Тогда
V =х\х2 —Х2%\+X2U=X2U.
Положиму =Х2изаметим,чтоприи = 0изy(t) =0следуетx(t) =0.Таким
образом, все условия теоремы 14.4 выполнены и закон управления с обратной
связью имеет вид и = —кх2 или и = — (2к/п) arctg(#2) и при любом коэффици
енте к > 0 обеспечивает глобальную стабилизацию системы.
Δ
Свобода при выборе функции выхода, разумеется, является полезным об
стоятельством, однако мы по-прежнему ограничены рассмотрением ситуации,
когда начало координат разомкнутого уравнения состояния должно быть устой
чиво. Мы сможем перейти к рассмотрению более широкого класса систем, если
используем обратную связь для обеспечения пассивности системы. Рассмотрим
снова систему (14.73). Если существуют замена обратной связи
и = а(х) + β(Χ)υ,
(14.74)
и функция выхода h(x), такие что система
х = f(x) + G(x)a(x) + G(x)P(x)v,
(14.75)
У=Цх),
(14.76)
с входом ν и выходом у, удовлетворяет условиям теоремы 14.4, то начало коор
динат глобально стабилизируемо с использованием ν = —ф(у). Использование
замены обратной связи для преобразования непассивной системы в пассивную
известно как пассивизация или пассификация системы
28
.
Пример 14.16. Нелинейные уравнения динамики m-звенного манипулято
ра имеют вид
M(q)q+C(q,q)q+Dq+g(q)=u,
где q — m -вектор обобщенных координат, соответствующих углам между звенья
ми, и — m -вектор управлений и Μ (q) — симметричная матрица инерции, являю
щаяся положительно определенной для всех q Ε Rm
.
Член С(д, q)q соответствует
центробежным силам и силам Кориолиса. Матрица С обладает тем свойством,
что матрица Μ — 2(7 является кососимметричной для всех q,q € Rm
, гдеΜ—
28
В работе [31] показано, что система (14.73) с выходом у = h(x) локально эквивалентна при
замене обратной связи пассивной системе с положительно определенной функцией запаса, если
гапк{[д/1[/]&с](0)(2(0)} = ри нуль-динамика имеет устойчивую точку равновесия в начале коор
динат с соответствующей положительно определенной функцией Ляпунова.
14.4 . УПРАВЛЕНИЕ НА ОСНОВЕ ПАССИВНОСТИ
651
полная производная M(q) по t. Член Dq9 где D — положительно полуопределен
ная симметричная матрица, соответствует вязкому трению. Член g(q), соответ
ствующий гравитационным силам, определяется равенством g(q) = [dP(q)/dq]T
,
где P(q) — полная потенциальная энергия звеньев, обусловленная действием сил
гравитации. Рассмотрим задачу управления, целью которой является построение
закона управления с обратной связью по состоянию, обеспечивающего асимп
тотическое отслеживание выходом q постоянного командного сигнала qr. Пусть
е—q
—
qr. Тогда е удовлетворяет дифференциальному уравнению
M(q)e+C(q,q)e+De+g(q)=и.
Наша цель — стабилизировать систему в точке (е = 0,е = 0), однако следует
заметить, что эта точка не является точкой равновесия разомкнутой системы.
Пусть
и=9(о)~
К
Р6 +ν,
где Кр — положительно определенная симметричная матрица и ν — дополнитель
ная составляющая закона управления, которую следует определить. Подставляя и
в уравнение для ё, получаем
M(q)e +C(q,q)e+De+Kpe =υ.
Рассмотрим функцию
V=\e
T
M{q)e + \e
T
Kve
в качестве функции запаса. Функция V является положительно определенной,
и ее производная удовлетворяет оценке
V=е
т
Мё+|е
т
Ме+е
т
Кре =
=\е
т
(М-2С)ё-e
T
De-е
т
Кре+e
T
v+е
т
Крё <
^e
T
v.
Выбрав в качестве выхода у = е, можно показать, что система с входом υ и вы
ходом у является пассивной с функцией запаса V. Интересно отметить, что пас
сивизирующая систему составляющая обратной связи g(q) — Kpe преобразует
потенциальную энергию системы и она становится равна величине (1/2)е
т
Кре,
имеющей единственную точку минимума в е = 0. Сумма кинетической энергии
и преобразованной потенциальной энергии становится новой функцией запаса.
Приυ—0
y(t) =0^ e(t)=0^
e(t) ΞΟ^- Kpe(t) Ξ0=^> e(t) = 0,
и из этого следует, что система наблюдаема в нулевом состоянии. Таким образом,
эта система может быть глобально стабилизируема обратной связью ν = —0(e),
652
ГЛАВА 14
где φ — любая функция, такая что ф(0) = О и у
т
ф(у)>0длявсехуφ0.Вы
брав ν = —Kde, где Kd — положительно определенная симметричная матрица,
получаем закон управления
и=9{я)~Kv{q-qr) - Kdq,
который имеет вид классического PD-регулятора с членом, компенсирующим
член гравитации.
Δ
Класс пассивизируемых систем включает каскадное соединение двух си
стем, первая из которых является пассивной, а вторая характеризуется тем, что
ее начало координат является точкой равновесия соответствующей разомкнутой
системы. Рассмотрим систему
z = fa(z) + F(z,y)y,
(14.77)
х = f(x) + G(x)u9
(14.78)
У = h(x),
(14.79)
где /α(0) = 0, /(0) = 0 и h(0) = 0. Функции /а, F, / и G предполагаются локаль
но липшицевыми, а функция h — непрерывной. Мы будем рассматривать эту си
стему как каскадное соединение ведущей системы (driving system) (14.78)-(14.79)
и ведомой системы (driven system) (14.77)29
. Мы будем также предполагать, что
представление (14.77)-(14.79) определено глобально, ведущая система пассивна
с радиально неограниченной положительно определенной функцией запаса V(x)
и начало координат системы z = fa{z) устойчиво. Кроме того, мы будем пола
гать, что нам известна радиально неограниченная функция Ляпунова W(z) для
системы z = fa(z)9 которая удовлетворяет неравенству
^/.(*)<o,v*.
Используя U(z, х) — W(z) + V(x) в качестве функции запаса для всей систе
мы (14.77)-(14.79), получаем
«if-Fferii/ + /« = »' " + (^'.»>
При использовании замены обратной связи вида
\dz
29
Ведомая система вида z = fo(z,y) с достаточно гладкой /о может быть представлена в ви
де (14.77), если проложить
/«(*) =/о(*,0) и
F(z,y)=[^(z,sy)ds.
14.4. УПРАВЛЕНИЕ НА ОСНОВЕ ПАССИВНОСТИ
653
получаем
U^y
T
v.
Следовательно, система
z = fa(z)+F(z,y)y,
(14.80)
х = f(x) - G(x) (J£F(Z,
yfj + G(x)v,
(14.81)
у=h(x)
(14.82)
с входом ν и выходом у пассивна с функцией запаса U. Если система (14.80)-
(14.82) наблюдаема в нулевом состоянии, то можно применить теорему 14.4 и по
казать, что начало координат этой системы глобально устойчиво.
Пример 14.17. Вращение твердого тела осуществляется под воздействи
ем трех независимых управляющих моментов, и соответствующая модель имеет
следующий вид
30
:
Μω= -β(ω)Μω +щ
гдеω£R3
—
вектор скорости и ρ 6 i?3
—
кинематические параметры, опреде
ляющие трехмерные матричные представления группы вращения. Матрица S(x)
является кососимметричной и определяется равенством
S(x) =
0-ЖзХ2
хз
0 —xi
—Х2 Х\
0
Μ — положительно определенная симметричная матрица инерции и /з — единич
ная матрица размерности (3x3). Положив у = ω, можно привести эту систему
к каскадному представлению (14.77)-(14.79) с ведущей системой
Μω= -S{UJ)MUO+м,у =ω
и ведомой системой
p=\[h + S<j>) + p(?]u>.
Пусть ν(ω) = (1/2)ωτΜω. Тогда с использованием свойства ωτβ(ω) = 0 можно
показать, что
V =ωτΜω = —ωτβ(ω)Μω +ωτη = у
т
и.
Следовательно, ведущая система пассивна. Неуправляемая ведомая система ρ =
= 0 имеет устойчивую точку равновесия в ρ = 0, и любая радиально неогра
ниченная, положительно определенная и непрерывно дифференцируемая функ-
30
Вывод этой модели рассмотрен в книгах [97] и [151]. Если ε G й3
иηGй - параметры
Эйлера, тоρ =ε /η.
654
ГЛАВА 14
ция W(p) может рассматриваться в качестве соответствующей функции Ляпуно
ва. Таким образом, все предположения выполнены и рассматриваемая система
может быть пассивизирована обратной связью
,τ
v=-{%12lh
+S(P)+PP
T
}} +v.
Полагая W(p) = Ып(1 + р
т
р), к > 0, с использованием свойства p
T
S(p) =О
получаем
[1+frp
J
Нам необходимо установить факт наблюдаемости в нулевом состоянии пассив
ной системы
p=\[h + S{p) + pp
T
)u,
Μω = -Ξ(ω)Μω -kp + v,
y= u.
При υ = 0 выполнено
y(t) Ξθ^> U(t) Ξθ=> U)(t) =0=> p(t) = 0.
Следовательно, система является наблюдаемой в нулевом состоянии и может
быть глобально стабилизируема законом управления
и= —кр—φ(ω),
где φ — любая локально липшицева функция, такая что 0(0) = 0 и у
т
ф(у) >0
длявсехуφ0.
Δ
Можно избежать проверки выполнения свойства наблюдаемости в нулевом
состоянии для всей системы (14.80)—(14.82), если наложить более строгие усло
вия на W(z):
^/а(г)<0, Vz^O и 2^(0) = 0,
(14.83)
из которых следует, что начало координат системы z = fa(z) глобально асимп
тотически устойчиво. Полагая
u=
~(lJ7Fiz
>
y)
) ~ф(у)
>
(1484)
где φ — любая локально липшицева функция, такая что ф(0) — 0 и у
т
ф(у)>0
для всех у φ 0, и используя U в качестве функции Ляпунова для замкнутой
системы, получаем
14.5. НАБЛЮДАТЕЛИ С сильной ОБРАТНОЙ связью
655
Крометого,ИЗV=0следует,чтоz —0,иу —О,и,такимобразом,и—
= 0. Если ведущая система (14.78)-(14.79) наблюдаема в нулевом состоянии, из
условий u(t) = 0 и ?/(£) Ξ 0 следует, что x(t) = 0. Тогда с использованием
принципа инвариантности заключаем, что начало координат (z = 0, х = 0) гло
бально асимптотически устойчиво. Сформулируем полученный результат в виде
следующей теоремы.
Теорема 14.5. Предположим, что система (14.78)-(14.79) является на
блюдаемой в нулевом состоянии и пассивна с радиально неограниченной, поло
жительно определенной функцией запаса. Предположим, что начало коорди
нат системы z = fa(z) глобально асимптотически устойчиво, и пусть W(z) —
радиально неограниченная, положительно определенная функция Ляпунова, удо
влетворяющая (14.83). Тогда закон управления (14.84) глобально стабилизирует
начало координат (z = 0, х = 0).
Пример 14.18. Рассмотрим систему
η=-η +η
2
ξ,
которую мы уже рассматривали в примерах 13.16 и 14.11. Используя у = ξ в ка
честве выхода, можно представить эту систему в виде (14.77)-(14.79). Система
ξ= и, у —ξ пассивна с функцией запаса V(£) =ξ
2
/2. Можно показать, что
она является также наблюдаемой в нулевом состоянии, т. к. у = ξ. Начало ко
ординат системы η = — η глобально экспоненциально устойчиво и соответству
ющая функция Ляпунова имеет вид W^) = η
2
/2. Таким образом, все условия
теоремы 14.5 выполнены, и закон управления с обратной связью по состоянию,
обеспечивающий глобальную стабилизацию системы, может быть выбран в сле
дующей форме:
и= -η
3
-
fcC*>0.
Легко видеть, что этот закон управления совпадает с тем, что был построен с ис
пользованием бэкстеппинга.
Δ
14.5. Наблюдатели с сильной обратной связью
Методы построения нелинейного управления, рассмотренные в этой и преды
дущей главах, позволяют построить закон управления в виде обратной связи по
состоянию, т. е. в предположении, что все переменные состояния доступны для
измерения в режиме реального времени. В некоторых приложениях измерение
всех или некоторых переменных состояния оказывается невозможным вслед
ствие технических или экономических ограничений. Поэтому важно обобщить
рассмотренные ранее методы на случай построения закона управления в виде
обратной связи по выходу. В некоторых специальных случаях при решении этой
задачи возможна непосредственная модификация метода. Подобные ситуации
рассмотрены в упражнениях 14.47 и 14.48. В первом упражнении показано, что,
656
ГЛАВА 14
в случае когда система является минимально-фазовой и имеет относительную
степень, равную единице, можно построить закон управления в скользящем ре
жиме в виде обратной связи по выходу. Во втором упражнении получено пассив
ное управление для системы, имеющей пассивное отображение от входа к про
изводной выхода. В общем случае следует использовать методику динамической
компенсации, позволяющую обобщить методы построения законов управления
с обратной связью по состоянию на случай соответствующих обратных связей
по выходу. Одной из реализаций метода динамической компенсации является
использование наблюдателей, обеспечивающих асимптотическую оценку состо
яния на основе измерений выхода системы. Для некоторых нелинейных систем
разработка подобных наблюдателей является такой же простой задачей, какой
она является в случае, когда система описывается линейной моделью. Предполо
жим, например, что нелинейная система может быть преобразована к виду31
х=Ах+д(у,и),
(14.85)
у=Сх,
(14.86)
где (А, С) — наблюдаемая пара. Особенность этой формы представления заклю
чается в том, что нелинейная функция д зависит только от переменных выхода у
и управления и. Используя наблюдатель вида
х=Ах+д(у,и)+Η(у-Сх),
(14.87)
можно показать, что ошибка оценивания х = х — х удовлетворяет линейному
уравнению
ε=(А- НС)х.
Следовательно, выбрав Η так, чтобы матрица А — НС была гурвицевой, можно
гарантировать асимптотическое стремление этой ошибки к нулю lim^oo x(t) =
= 0. В упражнении 14.49 наблюдатель (14.87) используется для построения за
кона управления с обратной связью по состоянию. Следует отметить, что наблю
датель (14.87) сохраняет свою работоспособность лишь для указанного класса
нелинейных систем, но этим не исчерпывается список его недостатков, глав
ным из которых является то, что он построен в предположении, что нелинейная
функция д известна. Любая ошибка модели функции д скажется на ошибке оце
нивания, получаемой с использованием приведенного выше уравнения для х.
В частности, если наблюдатель реализован в виде
х=Ах+д0(у,и)+Н(у-Сх),
где до — номинальная модель для д, уравнение для х принимает следующий вид:
х=(А- НС)х +д(у,и)-д0{у,и).
31
Необходимые и достаточные условия эквивалентности нелинейной системы представле
нию (14.85)—(14.86) приведены в [124, глава 5]. В этой же работе рассмотрен другой подход к ре
ализации метода динамической компенсации с использованием фильтр-преобразований (filtered
transformation).
14.5. НАБЛЮДАТЕЛИ С сильной ОБРАТНОЙ связью
657
В этом случае становится неочевидным тот факт, что гурвицевость матрицы А —
—
НС сможет обеспечить компенсацию члена возмущения д — до. В этом пара
графе мы предложим специальный метод нахождения коэффициентов усиления
наблюдателя, позволяющий обеспечить робастность этого наблюдателя по отно
шению к неопределенностям модели нелинейной функции. Этот метод, извест
ный как метод построения наблюдателей с сильной обратной связью, применим
для широкого класса нелинейных систем и гарантирует при достаточно больших
коэффициентах усиления наблюдателя, что соответствующий закон управления
с обратной связью по выходу обеспечит те же характеристики замкнутой систе
мы, которые могут быть достигнуты с использованием закон управления с об
ратной связью по состоянию. В параграфе 14.5.1 пример второго порядка рас
сматривается в качестве мотивации идеи применения наблюдателей с сильной
обратной связью. В параграфе 14.5.2 подобный наблюдатель используется при
разработке стабилизирующего закона управления с обратной связью по выхо
ду. После этого будет сформулирован основной результат — принцип разделения
(separation principle), позволяющий разделить процедуру построения этого закона
управления на два этапа. На первом этапе находится закон управления с обратной
связью по состоянию, обеспечивающий стабилизацию системы и обеспечиваю
щий требуемые характеристики замкнутой системы. На втором этапе строится
закон управления с обратной связью по выходу путем замены в построенном на
первом этапе законе управления состояния х на соответствующую его оценку х,
получаемую с использованием наблюдателя с сильной обратной связью. Ключе
вым свойством, позволяющим разделить процедуру нахождения закона управле
ния на вышеуказанные два этапа, является то, что построенное на первом этапе
управление с обратной связью по состоянию должно быть глобально ограничен
ным по х. Наблюдатели с сильной обратной связью могут быть использованы
в задачах управления для систем широкого класса
32
. В параграфе 14.5.3 мы рас
смотрим в качестве примера использование наблюдателей с сильной обратной
связью при построении интегрального управления по выходу.
14.5,1. Мотивирующий пример
Рассмотрим нелинейную систему второго порядка
xi = я?2,
(14.88)
х2 = ф(х,и),
(14.89)
У=хъ
(14.90)
где х — [xi, Х2]т
-
Предположим, что и = ^{х) — локально Липшицев закон управ
ления с обратной связью по состоянию, такой что начало координат х — 0 за
мкнутой системы
xi =Х2,
(14.91)
&2 = Ф(хМ*))
(14.92)
32
Обзор применения наблюдателей с сильной обратной связью в различных задачах управления
приведен в работе [100].
658
ГЛАВА 14
устойчиво. Для того чтобы реализовать этот закон управления с использованием
измерений переменных выхода у, используем наблюдатель
xi = X2 + h1(y-x1),
%2=Фо(х,У)+h2{y- xi),
(14.93)
(14.94)
XI
.
%2.
Xl—Xi
Х2~ &2
Х\= —h\Xi+Х2)
Х2 = -tl2Xl +5(ж,5),
где фо(х, и) — номинальная модель нелинейной функции ф(х, и). Ошибка оцени
вания
х
удовлетворяет уравнению
(14.95)
(14.96)
где 5{х,х) = ф(х^(х)) — фо(х,^(х)). Необходимо найти коэффициенты усиле
ния наблюдателя Η = [/ii,/i2]T
5 при которых выполнено lim^oo #(£) = 0. При
отсутствии члена возмущений δ асимптотическая сходимость ошибки к нулю
обеспечивается выбором Н, при котором матрица
-hi 1
-h2 0
является гурвицевой. В рассматриваемом случае матрица А0 обладает этим свой
ством при любых положительных константах hi и /12. При наличии возмущений
δ коэффициенты Η необходимо выбрать так, чтобы обеспечивалась компенсация
эффектов, связанных с влиянием δ на ошибку слежения х. В идеальном случае
эта задача может быть решена для любого δ, если передаточная функция от δ к х
G0(s) =
s
2
+his+h2
1
8 +hi
тождественно равна нулю. Поскольку это нереализуемо, сделаем величину
supueR\G0(ju)\
произвольно малой путем выбора /12 > hi > 1. В частности,
положив
(14.97)
Oil
OL2
hi = -ρ-,
h2=
-7,
где ai,c*2 и ε, ε <C l — некоторые положительные константы, можно показать,
что
G0(8)
(es)
2
+aies +0.2
ε
ss Λ-OLI
Следовательно, Нте_>о GQ(s) = 0. Свойства робастности наблюдателей с сильной
обратной связью могут быть также исследованы во временной области, если
представить уравнение ошибки (14.95)-(14.96) в виде уравнения с сингулярными
возмущениями. С этой целью определим масштабированные ошибки оценивания
т
XI
ε'V2=Χ2·
(14.98)
14.5. НАБЛЮДАТЕЛИ С СИЛЬНОЙ ОБРАТНОЙ СВЯЗЬЮ
659
Эти новые переменные удовлетворяют уравнениям с сингулярными возмущени
ями
£7)i = -ai77i+772,
εη2 = -а2щ + е5(ж,ж).
(14.99)
(14.100)
Из этих уравнений видно, что, уменьшая ε, можно нивелировать эффект влия
ния δ. Кроме того, можно заметить, что при малой ε масштабированная ошибка
оценивания η является более быстрой переменной по сравнению с переменной х.
Однако 77i(0) имеет порядок 0(1/ε) при #i(0) φ xi(0). Следовательно, выраже
ние для решения системы (14.99)—(14Л00) будет содержать член вида {l/e)e~
at
/£
для некоторой константы а > 0. Эта мода быстро (экспоненциально) убывает
до нуля, но, прежде чем она достигнет достаточно малых значений, она может
привести к образованию при переходном процессе пиков порядка <9(1/ε). На
практике функция (a/e)e~
at
/e
стремится при ε —* 0 к импульсной функции. Это
явление известно как образование пиков переходного процесса. Важно понимать,
что это явление не может быть следствием применения преобразования динами
ки ошибки к виду системы с сингулярными возмущениями с использованием за
мены переменных (14.98). Это явление представляет собой характеристическую
особенность наблюдателя с сильной обратной связью при h2 > h\ ^> 1. Этот
факт может быть доказан с учетом того, что (2,1)-элемент матрицы exp(A0t)
имеет вид
2h2
х/4/12 - h\
e-hit/2 gin
t^Ah2 - h\
приAh2>h\и
-h2
y/hl - 4ft2
exp
hi-y/hl-4/i2
—
exp
hi + yJK{-Ah2
при Ah2 < h\. Амплитуда экспоненциальной моды в первом случае больше ве
личины \fh2, ъ, ВО втором — больше h2/hi. Таким образом, при увеличении hi
и h2/hi амплитуда увеличивается до бесконечности. Для лучшего понимания яв
ления образования пиков рассмотрим результаты компьютерного моделирования
системы
XI=Х2,
&2=Х2+U,
которая может быть глобально стабилизируема с использованием закона управ
ления с обратной связью по состоянию
-х2
XI- Хъ
660
ГЛАВА 14
Соответствующий закон управления с обратной связью по выходу имеет вид
U= —х\ —Xi—Х2-,
Si = X2 + (2/e)(y-xi),
х2=
(l/e
2
)(y-xi).
Коэффициенты усиления наблюдателя выбраны таким образом, чтобы собствен
ные значения матрицы А0 были равны — Ι/ε и —l/ε. На рисунке 14.16 показа
ны результаты моделирования системы, замкнутой вышеприведенными законами
управления с обратными связями по состоянию и по выходу. Закон управления
0.5
0
г, -0.5
*
-1
-1.5
"
2
(
1
0
й·
-
1
-2
-3
0
-100
53
-200
-300
-400
1
1
1
1
•\
\
-'
\
у'
3
12
3
4
.
*-
•'
!
·
-.
^
"/
'
1
1
1
1
3
12
3
4
\
1
-
\
1
\U1
1
1
1
5
,
5
1
6
,
6
1
7
,
7
1—
,
8
,
8
1
1
1
SFB
OFBs=
OFBe=
OFBe=
>
0.1
0.01
0.005
9
10
-
,
9
1
-
-
1
0
0 0.01 0.02 0.03 0.04 0.05 0.06 0 .07 0.08 0 .09 0.1
t
Рис. 14.16. Поведение системы, замкнутой законами управления, реализованными в виде
обратной связи по состоянию (SFB) и в виде обратной связи по выходу (OFB)
с обратной связью по выходу применялся при трех различных значениях кон
станты ε. В качестве начальных значений использовались #i(0) = 0.1, #2(0) =
= #i(0) = £2(0) = 0. Возникновение пиков наблюдается при [х\(0) — #i(0)]/e =
= 0.1/ε, когда константа ε достаточно мала. Из рисунка 14.16 видно, что си
стема демонстрирует интуитивно необъяснимое поведение при уменьшении ε.
Поскольку уменьшение ε должно приводить к увеличению скорости убывания
до нуля ошибки оценивания, можно было бы ожидать, что характеристики пе
реходного процесса системы, замкнутой обратной связью по выходу, прибли
жались бы при уменьшении ε к характеристикам переходного процесса системы,
замкнутой обратной связью по состоянию. Однако на рисунке 14.16 показано по
ведение, отличное от ожидаемого: при увеличении ε переходный процесс в си
стеме, замкнутой обратной связью по выходу, становится более непохожим на
соответствующий переходный процесс в системе, замкнутой обратной связью по
состоянию. Это обусловлено наличием в переходном процессе пиков. На этом
14.5. НАБЛЮДАТЕЛИ С сильной ОБРАТНОЙ связью
661
же рисунке показан сигнал управления и на более коротком отрезке времени,
который, как можно заметить, также характеризуется наличием пиков. Резкое из
менение сигнала управления приводит к резкому изменению переменных состоя
ния объекта управления. Если пиковое значение переменной состояния выйдет за
пределы области притяжения, это может привести к дестабилизации системы. На
рисунке 14.17 показана именно такая ситуация, которая возникла при уменьше
нии константы ε до величины 0.004. Легко видеть, что замкнутая система имеет
0
0.01
0.02 0.03
0.04 0.05
0.06
0.07
0.08
0
-200
-400
-600
2000
1000
0
-1000
Рис. 14.17. Неустойчивость системы, вызванная явлением образования пиков в переход
ном процессе при ε = 0.004
конечное время ухода на бесконечность и ее дестабилизация произошла вскоре
после момента времени t = 0.07.
Для того чтобы ослабить влияние образования пиков на поведение объекта
управления, в законе управления можно применить насыщение, включающееся
при выходе состояния системы из некоторого компактного множества. Насыще
ние в законе управления может быть введено, например, следующим образом:
и=sat(—х\—xi—Х2)·
На рисунке 14.18 показаны результаты моделирования системы, замкнутой за
конами управления с насыщением, реализованными в виде обратных связей по
состоянию и по выходу. На этом рисунке также показан сигнал управления и
на коротком интервале времени. Это управление реализовано с использованием
насыщения, предотвращающего образование пиков. Интервал времени, на протя
жении которого имеет место явление образования пиков, уменьшается с умень
шением значения ε. Состояния х\ и Х2 демонстрируют описанное ранее интуи
тивно ожидаемое поведение: при уменьшении ε переходный процесс в системе,
662
ГЛАВА 14
0.15
0.1
-
0.05
0
-0.05
0.05
О
,-0 .05
-0 .1
4
· ^ν^
""τ-
.
....,.
QT?R
OFB ε=0.1
OFBe=0.01
OFBe=0.005
— *",'.
9
10
1
•
!
•
•
•
I
^v
'
· · '\*~~*
»V
'
LL~* ~^ ~"^
-v·.^^—
-x
/
N
у
,
1
1
1
1
_
,
,
I.
I
53
0
-0.5
-1
0
-____
1
,
2
,
3
,
4
,
5
1
6
1
7
8
9
1
-
0
0.01 0.02 0.03 0 .04 0.05 0.06 0.07 0.08 0.09 0.1
t
Рис. 14.18. Поведение системы, замкнутой законами управления с насыщением, реализо
ванными в виде обратной связи по состоянию (SFB) и в виде обратной связи по выходу
(OFB)
замкнутой обратной связью по выходу, становится более похожим на соответ
ствующий переходный процесс в системе, замкнутой обратной связью по состоя
нию. Заметим, что представленные результаты были получены при ε = 0.001, т. е.
при значении ε, меньшем чем 0.004, когда в системе, замкнутой законом управ
ления без насыщения, возникала неустойчивость. При использовании в законе
управления насыщения замкнутая система не только сохранила устойчивость, но
и продемонстрировала практически идентичные свойства переходных процессов
для двух рассматриваемых случаев применения обратной связи. Интересно отме
тить, что при ε —• 0 область притяжения системы с обратной связью по выходу
стремится к области притяжения системы с обратной связью по состоянию. Это
показано на рисунках 14.19 и 14.20. На первом из этих рисунков показан фазо
вый портрет замкнутой системы при и = sat(—х\ — х\ — Х2)- Эта система имеет
ограниченную область притяжения, содержащуюся внутри замкнутого цикла. Из
второго рисунка видно, что при ε —> 0 пересечение границы области притяжения
при и = sat(—х\ — х\ — хъ) с [х\ — #2)-плоскостью стремится к предельному
циклу.
Поведение системы, показанное на рисунках 14.19 и 14.20, может быть ре
ализовано при любой глобально ограниченной стабилизирующей функции ч(х).
В период образования пиков управление j(x) реализуется с насыщением. По
скольку при ε —• 0 период образования пиков сужается до нуля, при достаточно
малой ε длительность периода образования пиков становится настолько малой,
14.5. НАБЛЮДАТЕЛИ С сильной ОБРАТНОЙ связью
663
Рис. 14.19. Фазовый портрет системы, замкнутой законом управления и = sat(—х\
-XI
- Х2)
Рис. 14.20. Область притяжения системы, замкнутой законом управления с обратной
связью по состоянию (непрерывная линия) и пересечение области притяжения системы,
замкнутой законом управления с обратной связью по выходу, с (хi —#2) -плоскостью при
ε = 0.1 (пунктирная линия) и при ε = 0.05 (штрихпунктирная линия)
что состояние объекта х остается близким к его начальному значению. После
завершения периода образования пиков ошибка оценивания становится равной
величине порядка О (ε) и закон управления *у(х) становится близким к функ
ции *у(х). Следовательно, при ε —> 0 траектории системы, замкнутой обратной
связью по выходу, асимптотически стремятся к соответствующим траекториям
системы, замкнутой обратной связью по состоянию. Глобальная ограниченность
функции j(x) может быть обеспечена путем применения насыщения в законе
управления с обратной связью по состоянию или путем применения насыще
ния в отношении оценок вектора состояния, вышедших за пределы некоторого
компактного множества.
664
ГЛАВА 14
Анализ системы, замкнутой обратной связью по выходу, может быть выпол
нен следующим образом. Рассматриваемая система представляется в виде систе
мы с сингулярными возмущениями
XI=Х2,
х2 = ф(х,ч(х)),
ещ=
-α1η1+η2,
εη2 = -а2щ + eS(x, ж),
где х\ = х\—ег)\ их2 = хъ — Щ- Эволюция медленных переменных (xi, x2) при
ближенно описывается медленной моделью, получаемой при ε = 0. Поскольку
при ε = 0 мы получаем η = 0, медленная модель представляет собой систему,
замкнутую обратной связью по состоянию (14.91)—(14.92). Эволюция быстрых
переменных (771,772) приближенно описывается быстрой моделью
εη=
-а\ 1
-а2 0
def л
η=Α0η,
которую можно получить, если пренебречь членом εδ. Пусть V(x) — функция Ля
пунова для медленной модели и \ν(η) = ητΡ$η — функция Ляпунова для быст
рой модели, где Р$ — решение уравнения Ляпунова Ро А) + AQPQ = —1> Опре
делим множества Ω0 и Σ равенствами Ω0 — {V(x) < с} и Σ = {\¥(η) < ρε
2
},
где константа с > 0 выбрана так, чтобы множество Ω0 находилось во внутренно
сти области притяжения решений системы (14.91)—(14.92). Дальнейший анализ
выполняется в два этапа. На первом этапе показывается, что при достаточно
большой ρ существует ε* > 0, такая что для любой 0 < ε ^ ε| начало коор
динат замкнутой системы асимптотически устойчиво и множество ilcxE яв
ляется положительно инвариантным подмножеством области притяжения. При
доказательстве используется тот факт, что в множестве ficxE величина η име
ет порядок О (ε). На втором этапе показывается, что для любого ограниченного
х(0) и любого х(0) 6 Ω&, 0 < Ъ < с, существуют е2 > 0, такая что для любой
0 < ε < ε\ траектория системы достигает множества ftc x Σ за конечное время.
При доказательстве используется тот факт, что Ω& расположено во внутренно
сти Ω0, а также то, что j(x) является глобально ограниченной функцией. Сле
довательно, существует момент времени Т\ > 0, не зависящий от ε и такой, что
любая траектория, начинающаяся в Ω&, остается в Ω0 для всех t € [0, Ti]. Исполь
зуя тот факт, что η убывает быстрее экспоненциальной моды вида (1/ε)β_α
*/ε,
можно показать, что траектория достигает множества Ω0 х Σ в момент времени,
принадлежащий интервалу [0,Τ(ε)]5 где \ππε->οΤ(ε) = 0. Таким образом, вы
брав достаточно малую ε, можно гарантировать, что Τ (ε) < Т±. Рисунок 14.21
иллюстрирует описанное поведение системы.
Наблюдатель полного порядка (14.93)-(14.94) позволяет получить оценки
(xi,x2), которые используются в законе управления с обратной связью вместо
(xi,x2). Поскольку у — х\ измеряется, в законе управления можно использовать
14.5. НАБЛЮДАТЕЛИ С сильной ОБРАТНОЙ связью
665
V
0(e)
0{\/е)
W1V
»
Ω6
^
Ω0
Рис. 14.21. Иллюстрация быстрого стремления траекторий к множеству Пс х Σ
саму переменную х\ и на соответствующую оценку заменять только перемен
ную #2. При использовании этого подхода анализ замкнутой системы не изменя
ется и можно получить результаты, аналогичные тем, что были получены ранее.
С другой стороны, для получения оценок Х2 можно использовать наблюдатель
редуцированного порядка
w= -h(w +hy)+ф0(х,и),
(14.101)
х2=w +%,
(14.102)
где h = α/ε для некоторых положительных констант а и ε, ε <С 1. Легко видеть,
что наблюдатель редуцированного порядка с сильной обратной связью (14.101)-
(14.102) характеризуется образованием пиков и глобальная ограниченность зако
на управления с обратной связью по состоянию играет ту же роль, которую она
играет в случае использования наблюдателя полного порядка.
На практике наблюдатель с сильной обратной связью представляет собой
приближенный дифференциатор. В этом можно легко убедится, если рассмот
реть специальный случай, когда номинальная функция фо выбрана нулевой и,
следовательно, этот наблюдатель является линейным. В случае наблюдателя пол
ного порядка (14.93)-(14.94) передаточная функция от у к х имеет вид
OL2
(es)
2
+a\es+e*2
в случае наблюдателя редуцированного порядка (14.101)—(14.102) передаточная
функция от у к Х2 имеет вид
,,f
•sприε—>0.
(е/а)з + 1
F
Таким образом, при достаточно малой ε наблюдатель с сильной обратной связью
аппроксимирует на компактном интервале частот производную у.
1 -f (eai/a2)s
s
приε—>0;
666
ГЛАВА 14
Поскольку наблюдатель с сильной обратной связью является приближенным
дифференциатором, можно утверждать, что шум измерения и немоделируемая
высокочастотная динамика сенсоров накладывают ограничения на практически
реализуемый предел уменьшения величины е. Несмотря на наличие этого огра
ничения, существуют приложения, в которых пределы допустимых значений ε
позволяют успешно применить наблюдатели с сильной обратной связью
33
.
14.5.2. Стабилизация
Рассмотрим нелинейную систему с несколькими входами и выходами
х=Ах+Вф(х,z,и),
(14.103)
z = ψ(Χ,Ζ,η),
у=Сх,
(14.104)
(14.105)
(14.106)
гдеие В?—управление,у£Rm
иξGRs
—
измеряемые входы и переменные
хΕRp
и z G Ri формируют вектор состояния. Матрица А, имеющая размер
(р х р), матрица В, имеющая размер (р х т), и матрица (7, имеющая размер
т х р, определяются равенствами
А = blockdiag [Ль ..., Ат], А{ =
РгХрг
0
0
0
0
1
0
•
.
.
1
...
0
0
0
1
0
В = block diag [Бь ..., Вт], Bi =
С — block diag [Ci,
где1<г^ тиρ=р\Л \-рт.
.,Ст], С< = [10
J
PiXl
'"
0]lxpi
Матрицы А, В и С определяют систему, пред
ставляющую собой цепь из т интеграторов. Функции φ, ψ и q предполагаются
локально липшицевыми по своим аргументам при (ж, z, и) Ε Dx x Dz x RP, где
DxсR
p
иDzСRs
—
области, содержащие соответствующие начала координат.
Мы также будем предполагать, что ф(0,0,0) = 0, ^(0,0,0) = 0 и ^(0,0) = 0.
Наша цель заключается в том, чтобы построить закон управления с обратной
связью по выходу, обеспечивающий стабилизацию начала координат.
33
Примеры таких приложений, в том числе асинхронные электрические двигатели и некоторые
механические системы, рассмотрены в работах [3], [47] и [186].
14.5. НАБЛЮДАТЕЛИ С сильной ОБРАТНОЙ СВЯЗЬЮ
667
Двумя основными классами систем, приводящихся к модели (14.103)-
(14.106), являются нормальная форма представления линеаризуемой по входу-вы
ходу системы и модели механических и электромеханических систем, в которых
измерению доступны величины смещения, а их производные (скорости, ускоре
ния и т. д.) не измеряются. Нормальная форма системы с одним входом и одним
выходом имеет вид (13.16)-(13.18). Легко видеть, что эти уравнения принимают
вид (14.103)—(14.105) при х = ξ и z = η.
34
Если у — единственная измеряе
мая переменная, уравнение (14.106) можно опустить. Однако во многих задачах
возможно измерение некоторых переменных состояния в дополнение к тем, что
фигурируют в концах цепей интеграторов. Например, система магнитной под
вески (см. упражнение 1.18) описывается моделью
XI=Ж2,
к
L0axl
^2=
9-^X2-
хз=
m
~
z
2m(a + xi)2
'
1
L(xi)
Loax2X3 .
(а+хгУ
где х\ — положение шара, x<i — его скорость и хз — ток в электромагните. В ти
пичной ситуации измеряется положение шара х\ и ток х%. Эта модель прини
мает вид (14.103)—(14.106) при {х\,Х2) в качестве х-компоненты ижз в каче
стве z-компоненты вектора состояния. Измеряемыми выходами являются у = х\
и С = #з· Другим классом систем, приводящихся к модели (14.103)—(14.106), яв
ляются системы, динамика которых расширена путем добавления нескольких ин
теграторов. В примере 13.8 рассматривалась система, представленная дифферен
циальным уравнением η-го порядка. Ее динамика была расширена с использова
нием т интеграторов в канале управления. Анализ полученной модели состоя
ния показывает, что она имеет вид (14.103)—(14.106), если в качестве компонент
переменной z выбрать состояния т интеграторов, а в качестве компонент пере
менной х — выход и его производные до порядка y(n_1
) включительно. В этом
случае все компоненты вектора измеряются и уравнение (14.106) принимает вид
Для нахождения закона управления с обратной связью по выходу применя
ется двухэтапная процедура. На первом этапе разрабатывается стабилизирующий
начало координат закон управления с обратной связью по состоянию, в котором
используются измерения х и (. После этого строится наблюдатель с сильной
обратной связью, обеспечивающий получение оценок х на основе информации
о у. Закон управления с обратной связью по состоянию представляется в виде
динамической системы вида
θ = Τ(θ,Χ,0,
(14.107)
u = 7(0,s,C),
(U.108)
[
В работе [88, параграф 5.1] рассматривается нормальная форма для нескольких переменных.
668
ГЛАВА 14
где 7
и
Г — локально липшицевы по своим аргументам в рассматриваемой
области функции, глобально ограниченные по х. Кроме того, 7(0? 0>0) — 0
и Г(0,0,0) = 0. Закон управления с обратной связью по состоянию и —
—
7(ж, С) является специальным случаем предыдущего уравнения, если опустить
^-уравнение. Для удобства запишем систему, замкнутую обратной связью по со
стоянию, в следующем виде:
X = /(#),
(14.109)
где X — (x,z,0). Закон управления с обратной связью по выходу выбирается
в следующей форме:
в = Г(М,С),
(14Л1
°)
t* = 7(M,C),
(14-111)
где х определяется с использованием наблюдателя с сильной обратной связью
х= Ах+Вф0{х, С,и)+Н(у-Сак).
(14.112)
Коэффициент обратной связи наблюдателя Η выбирается в виде
α\/ε2α\/ε
Η = block diag [Яь..., Ят], Щ =
oW** ο^/ε* J
(14.113)
где ε — подлежащая определению положительная константа и положительные
константы а* выбираются так, чтобы корни уравнения
& + aia"-
1
+•••+a%_lS +<4=0
располагались в открытой левой полуплоскости для всех г = 1,..., га. Функция
фо(х,С,и) представляет собой номинальную модель функции ф(х^г1и)9 которая
в рассматриваемой области должна быть локально липшицевой по своим аргу
ментам и глобально ограниченной по х. Кроме того, 0о(О> 0> 0) = 0.
Теорема 14.6. Рассмотрим систему (14.103)-(14.106) и закон управления
с обратной связью по выходу (14.110)—(14.112). Предположим, что начало ко
ординат системы (14.109) асимптотически устойчиво и И — область притя
жения ее решений. Пусть S — компактное множество, принадлежащее внут
ренности ΙΖ, и Q— любое компактное подмножество R
p
.
Тогда
• существует ε\ > 0, такая что для любой Q < ε ^ е\ решения
(X(t),x(t))
замкнутой системы, начинающиеся в S x Q, являются ограниченными для
всехt^0;
• длялюбойμ>0существуют е\ >0иТ2 >0,зависящие отμ,такиечто
для любой 0 < ε ^ е\ решения замкнутой системы, начинающиеся в S x Q,
удовлетворяют
\\X(t)\\ < μ и \\x(t)\\ < μ, 4t> T2;
(14.114)
14.5. НАБЛЮДАТЕЛИ С сильной ОБРАТНОЙ связью
669
• для любой μ > 0 существует ε% > О, зависящая от μ, такая что для
любой 0 < ε ^ ε£ решения замкнутой системы, начинающиеся в S x Q,
удовлетворяют
\\X(t) - Xr(t)\\ < μ, Vt ^ 0,
(14.115)
где Afr —решение (14.109), начинающееся в Х(0);
• если f(X) — непрерывно дифференцируема в некоторой окрестности X
и начало координат системы (14.109) экспоненциально устойчиво, то су
ществует е\ > 0 такая, что для любой 0 < ε ^ е\ начало координат
замкнутой системы экспоненциально устойчиво и S x Q — подмножество
ее области притяжения.
ДОКАЗАТЕЛЬСТВО. СМ приложение С.23.
Π
Из этой теоремы следует, что закон управления с обратной связью по выходу
обеспечивает при достаточно малой ε те же характеристики замкнутой системы,
которыми обладает система, замкнутая законом управления с обратной связью
по состоянию. Из этого в свою очередь следуют три вывода в отношении за
кона управления с обратной связью по выходу. Во-первых, этот закон, так же
как и закон управления с обратной связью по состоянию, может обеспечить экс
поненциальную устойчивость. Во-вторых, при использовании этого закона мы
получаем то же компактное множество, содержащееся во внутренности области
притяжения, которое можно указать для системы, замкнутой обратной связью по
состоянию. В-третьих, при ε —> 0 решение X(t) системы, замкнутой обратной
связью по выходу, стремится к решению системы, замкнутой обратной связью
по состоянию. Для простоты изложения сохранение свойства асимптотической
устойчивости при переходе к использованию обратной связи по выходу доказа
но только для случая экспоненциальной устойчивости
35
.
Заметим, однако, что
первые три пункта теоремы: об ограниченности, о предельной ограниченности
и о сходимости траекторий верны и без выполнения предположения об экспо
ненциальной устойчивости.
В качестве следствия этой теоремы можно сформулировать следующее
утверждение. Если закон управления с обратной связью по состоянию обеспе
чивает глобальную или полуглобальную стабилизацию и локальную экспонен
циальную устойчивость, то при достаточно малой ε закон управления с обрат
ной связью по выходу обеспечивает полуглобальную стабилизацию и локальную
экспоненциальную устойчивость.
Пример 14.19. В параграфе 14.1 была разработана непрерывная обратная
связь по состоянию в скользящем режиме
и=—ksatI
-
I,
35
В работе [16] рассмотрен более общий случай, когда начало координат асимптотически, но не
экспоненциально, устойчиво.
670
ГЛАВА 14
где ai = 1, к = 4 и μ = 1, обеспечивающая стабилизацию уравнения маятника
rai
2
0+ raisin 0+к0£
2
в=и
в точке (0 = π, θ = 0). Предположим, что измерению доступна лишь перемен
ная 0. Тогда закон управления с обратной связью по выходу может быть выбран
в виде
где θ и ω — оценки 0 и ω = θ, получаемые с использованием наблюдателя с силь
ной обратной связью
§ = ω+(2/ε)(θ-θ),
ω = φο0,η) + (1/ε2)(θ-θ),
где фо = —a sin θ + си — номинальная модель функции φ = — (go/£)sm0 —
—
(ко/т)в + (1/т£
2
)и и а и с — номинальные значения (до/£) и (1/т£
2
) соот
ветственно; в качестве номинального значения коэффициента трения ко выбрано
нулевое значение. Наблюдатель строится так, чтобы он имел кратные полюса
в — 1/е. На рисунке 14.22 приведены результаты сравнения характеристик систе
мы, замкнутой законом управления с обратными связями по состоянию и выхода
при ε = 0.05 и ε = 0.01. В качестве значений параметров маятника выбраны
следующие величины: т = 0.15, £ = 1.05 и ко = 0.02; в качестве начальных
значений использовались 0(0) = π/4 и ω(0) = 0(0) = ω(0) = 0. Рассмотрим
три версии построенного наблюдателя. В первом случае в наблюдателе исполь
зовались номинальные значения а = 9.81 и с = 10, что соответствует номиналь
ным параметрам т = 0.1 и £ = 1. Во втором случае использовались значения
а = 9.3429 и с = 6.0469, что соответствует действительным значениям пара
метров, т. е. т = т = 0.15 и £ — £ = 1.05. В третьем случае использовался
линейный наблюдатель, который был получен при a = с = 0. Во всех этих слу
чаях можно отметить, что траектории системы, замкнутой обратной связью по
выходу, стремятся при уменьшении ε к траекториям системы, замкнутой обрат
ной связью по состоянию. Можно отметить, что при сравнительно большой ε
использование в уравнении наблюдателя функции фо благоприятно сказывается
на характеристиках системы, если эта функция является хорошей моделью для
функции ф. Однако если это не так, в подобной ситуации лучше использовать
линейный наблюдатель. Важно отметить, что различия между этими тремя вер
сиями наблюдателя уменьшаются при уменьшении ε. Этот результат представ
ляется ожидаемым, т. к. при уменьшении ε нивелируются эффекты, связанные
с неопределенностью модели функции φ.
Δ
14.5.3. Интегральное управление
Рассмотрим систему с одним входом и одним выходом
х = f(x,w) + g(x,w)[u + S(x,u,w)],
у = h(x,w),
14.5 . НАБЛЮДАТЕЛИ С СИЛЬНОЙ ОБРАТНОЙ СВЯЗЬЮ
671
(а)
3.5
3
2.5
θ2
1.5
1
0.5
1^^^
г'
Г'
Ь
—
SFB
·-·
OFB ε=0.05
-
-
OFB е=0.01
.
10
3.5
3
2.5
2
1.5
1
0.5
0
//г
' //'
7'
///
V
')
4
6
Время
10
Рис. 14.22. Сравнение переходных процессов в системе из примера 14.19, замкнутой об
ратной связью по состоянию (SFB) и обратной связью по выходу (OFB). На рисунках (а)
и (Ь) показаны θ и ω = θ для случая использования нелинейного наблюдателя с силь
ной обратной связью при номинальных значениях т и L На рисунке (с) показана θ для
случая использования нелинейного наблюдателя с сильной обратной связью при дей
ствительных значениях т и L На рисунке (d) показана θ при использовании линейного
наблюдателя с сильной обратной связью
гдех ΕRn
—
состояние, и Ε R — управление, у Ε R — управляемый и одновре
менно измеряемый выход nw Ε Rl
—
вектор неизвестных постоянных парамет
ров и возмущений. Функции f,g,hnS
предполагаются достаточно гладкими
по(ж,и)инепрерывнымипоwприхΕDсД
п
, иΕЛиwΕDwСi?
z
,гдеD
и Г)^ — открытые связные множества. Предположим, что система
х=
f{x,w)+g(x,w)u,
y = h(x,w)
имеет относительную степень ρ в D равномерно по w, т.е. для всех (x,w) E
D x Dw выполнено
Lgh(x, w)= ···= LgL
p
r /i(x,w)=0,LgL
p
r /i(x,w)>α>0.
Наша цель заключается в том, чтобы построить закон управления с обратной
связью по выходу, такой что выход системы у асимптотически отслеживает по
стоянный командный сигнал г Ε Dr с i?, где Dr — открытое связное множество.
672
ГЛАВА 14
Рассматриваемая здесь задача представляет собой версию задачи, которую
мы исследовали в параграфе 14.1.4. Отличие заключается в том, что в настоящем
случае мы допускаем зависимость функций / и h от w, в то время как в пара
графе 14.1.4 требовалось, чтобы они не зависели от w. Это ограничение было
необходимо вследствие того, что переменные /г, Lfh,...,
Lpi~ h использовались
при нахождении закона управления с обратной связью по состоянию. В рассмат
риваемом здесь случае нахождения закона управления с обратной связью по вы
ходу эти переменные определяются с использованием наблюдателя с сильной
обратной связью на основании информации об измеряемом выходе у. Поскольку
мы допустили зависимость / от w, член δ\ в / опущен. Мы не будем здесь по
вторять все выкладки, что были проведены в параграфе 14.1.4. Напомним лишь
выражение для обратной связи по состоянию в скользящем режиме (14.29):
[к0е0 + fciei + к2е2 Η h kp-\ep-\ + ер\
и=
—к sat
,
гдее\=у—г
—
ошибка регулирования и переменные с е2 по ер — производные
е±?6 Закон управления глобально ограничен, и значение сигнала в\ доступно че
рез измерения в режиме реального времени. Для реализации этого регулятора
в виде обратной связи по выходу получим оценки переменных с е2 по ер с ис
пользованием линейного наблюдателя с сильной обратной связью. В результате
получаем закон управления с обратной связью по выходу
ео= ei,
fk0eo + fciei + к2ё2 Η h kp-\ep-\ + ёр\
u=—кsatI
I,
ei=e<+i+i^jJ(ei-ei), 1^i<ρ-1,
K= ^J(ei-ei),
где положительные константы с а\ по ар выбраны так, чтобы корни уравнения
s
p
+ ai5p_1
+···+ap_i5+ар=О
имели отрицательные вещественные части. В случае когда рассматриваемая си
стема имеет относительную степень, равную единице (р = 1), наблюдатель
с сильной обратной связью не используется. В условиях предположений, сде
ланных в параграфе 14.1.4, система, замкнутая обратной связью по состоянию,
36
Мы переобозначили параметр пограничного слоя скользящего режима через μ для того, чтобы
сохранить обозначение для параметра наблюдателя ε.
14.6 . УПРАЖНЕНИЯ
673
имеет экспоненциально устойчивую точку равновесия в (z, ео, е) = (0,ёо, 0). Чи
тателю предлагается (упражнение 14.50) проверить, что при достаточно малой
ε закон управления с обратной связью по выходу обеспечивает те же характе
ристики замкнутой системы, которые имеют место при использовании закона
управления с обратной связью по состоянию.
14.6. Упражнения
14.1. Рассмотрим систему
#1=#2+sinxi, ±2=в\х\ +(1+02)и,у =Х\,
где |0i| < 2 и |02| ^ 1/2. Используя метод построения закона управления в сколь
зящем режиме,
(a) найдите непрерывный закон управления с обратной связью по состоянию,
обеспечивающий стабилизацию начала координат;
(b) найдите непрерывный закон управления с обратной связью по состоянию,
обеспечивающий асимптотическое отслеживание выходом y(t) командного
сигнала r(t). При этом предположите, что г, г и г — непрерывные ограни
ченные функции.
14.2. Упрощенная модель подводного транспортного робота, описывающая дина
мику изменения курсового угла, имеет следующий вид [60]:
φ+аф\ф\= т,
где φ — курсовой угол, τ — нормализованный угловой момент, рассматриваемый
как управление, и а — положительный параметр. Необходимо построить закон
управления, обеспечивающий отслеживание углом φ заданного значения фг{Ь)
при условии, что ч/νΟΟ, $r(t)
и
Фг{Р) являются ограниченными функциями от t.
Пусть а = 1 — номинальное значение параметра а.
(a) Используя х\ = φ и Х2 = φ в качестве переменных состояния, и = τ в ка
честве управления и у = φ в качестве выхода, постройте модель состояния
системы.
(b) Покажите, что эта система является линеаризуемой по входу-выходу.
(c) В предположении, что а = а = 1, примените метод линеаризации обратной
связью и постройте соответствующий закон управления с обратной связью
по состоянию, обеспечивающий глобальное асимптотическое отслеживание
заданного командного сигнала.
(d) В предположении, что \а-а\ ^ 0.01 и фг(Ь) = sin2£, покажите, что постро
енный в пункте (с) закон управления обеспечивает асимптотическое отсле
живание с точностью \ф(Ь) — Фг(Ь)\ ^ #ь и оцените величину δ\. Справед
лива ли эта оценка для любых начальных состояний?
674
ГЛАВА 14
(е) В предположении, что \а — а\ < к, где к — известная константа, постройте
закон управления с обратной связью по состоянию, обеспечивающий гло
бальное асимптотическое отслеживание с точностью \ф{Ь) — Vv(*)l ^ 0.01.
14.3 ([176]). Рассмотрим уравнение Ван дер Поля с управлением
х\ =Х2?#2= —ω
2
Χ\+εω(1—μ
2
Χ2)Χ2η,
где ω, ε и μ — положительные константы и и — управление.
(a) Покажите, что при и = 1 существует устойчивый предельный цикл вне
поверхности х\ + Χ^/ω2
= Ι/μ2
и при и = — 1 существует неустойчивый
предельный цикл вне той же поверхности.
(b)Пустьs=х\+Χ^/ω2
—
г
2
, г < l/μ. Покажите, что если ограничить движе
ние системы поверхностью s = 0 (т. е. s(t) = 0), то рассматриваемая модель
сведется к уравнению гармонического осциллятора
2
#1—
х
2->#2=
—
^
#Ъ
решением которого является синусоидальное колебание с частотой о; и ам
плитудой г.
(c) Постройте обратную связь по состоянию в скользящем режиме, обеспечи
вающую стремление всех траекторий в полосе \х\\ < l/μ к многообразию
s = 0 с последующим их удержанием на этом многообразии.
(d) Выполните при ω = μ = ε = 1 компьютерное моделирование системы, за
мкнутой идеальным законом управления в скользящем режиме и его непре
рывной аппроксимацией.
14.4. Рассмотрим систему
#1—#2+axisinxi, X2=bx\x<i+ и,
где а и b — неизвестные константы, о которых известно, что \а — 1| ^ 1 и |Ь —
—
1| < 2. Используя метод построения закона управления в скользящем режиме,
найдите для этой системы непрерывную глобально стабилизирующую обратную
связь по состоянию.
14.5. Уравнение маятника с точкой подвеса, движущейся в горизонтальном на
правлении с изменяющимся со временем, ограниченным ускорением, имеет вид
τη£θ+тдsinθ+Ыв= T/t +mh{t)cos0,
где h — ускорение в горизонтальной плоскости, Τ — момент, рассматриваемый
как управление; другие переменные определены в параграфе 1.2.1. Предполо
жим, что
0.9<I<1.1,0.5<т<1.5,0<к<0.2,\h{t)\<1
и д = 9.81. Необходимо стабилизировать движение маятника в точке 0 = 0
при любых начальных условиях 0(0) и 0(0). Используя метод построения закона
14.6. УПРАЖНЕНИЯ
675
управления в скользящем режиме, найдите для этой системы обратную связь по
состоянию, обеспечивающую предельную ограниченность решений при \θ\ ^
^ 0.01и|0|<0.01.
14.6 ([108]). Рассмотрим систему
Х\—Х\Х2,#2=Х\+U.
(a) Используя метод построения закона управления в скользящем режиме, най
дите для этой системы непрерывную глобально стабилизирующую обрат
ную связь по состоянию.
(b) Можно ли обеспечить глобальную стабилизацию начала координат с исполь
зованием закона управления, полученного с использованием метода линеа
ризации системы обратной связью?
14.7. Рассмотрим систему
Х\= -Xi +th(^2),X2=#2+ХЗ?*3=
и
+ S(x),
где 6(х) — неопределенная функция, которая удовлетворяет неравенству \6(х)\ <
^ р(х) для всех х и некоторой известной функции р. Используя метод построе
ния закона управления в скользящем режиме, найдите для этой системы непре
рывную обратную связь по состоянию, такую что для всех ||а;(0)||оо ^ к реше
ние x(t) ограничено и |xi(t)| предельно ограничено величиной 0.01.
14.8. Система с резервуаром из примера 12.5, снабженная интегратором, имеет
вид
У = -дГ\(и
~
c
Vv)i cr = y-r,
где г — желаемая рабочая точка. Пусть с и А(у) — номинальные модели для с
и А(у) соответственно. Предположим, что нам известны положительные кон
станты£>i>0,Q2>0,£>з^0и0^£4<1>такиечто
Q\ ^Л(у) < £2, \С~С\ ^ £3
А(у)-А(у)
А(у)
< 04-
Используя метод построения закона управления в скользящем режиме, найдите
для этой системы непрерывную обратную связь по состоянию такую, что все
переменные состояния ограничены и \y(t) — г\ стремится к нулю при t —• оо.
14.9. Рассмотрим систему (14.1).
(a) Пусть В — постоянная матрица ранга р. Покажите, что существует невырож
денная (п х п)-матрица М, такая что MB = [0, Ιρ]τ, где 1Р — единичная
(р х р)-матрица. Проверьте, что Т(х) = Мх удовлетворяет (14.2).
(b) Пусть В(х) — гладкая функция от х. Предположим, что В имеет ранг ρ
длявсеххвобластиDсR
n
.
Пусть Δ = span{bi,... ,ЬР}, где
676
ГЛАВА 14
bi,...,bp — столбцы матрицы В. Предположим также, что Δ инволю-
тивно. Покажите, что для любого XQ Ε D существуют гладкие функции
01 (х),... ,фп-р(х) с линейно независимыми в точке XQ дифференциалами
дф\/дх,...
,дфп-р/дх, такие что [дфг/дх]В(х) = О при 1 < г ^ η — р.
Покажите, что можно найти гладкие функции </>n_p+i(x),... ,фп(х) такие,
что отображение Т(х) = [ф\(х),... ,фп(х)]т
является диффеоморфизмом
в окрестности XQ И удовлетворяет (14.2).
Указание: примените теорему Фробениуса
37
.
14.10. Рассмотрим неавтономную систему, представленную в регулярной форме
i =fb(t,η,0 +G(t,x)E(t, x)u + i(f, x, u),
где для всех (t,x) £ [0, oo) x D матрица Е предполагается известной, является
невырожденной и имеет ограниченную обратную и G является положительной
диагональной матрицей с элементами, отделенными от нуля. Предположим, что
существует непрерывно дифференцируемая функция 0(t, 77), </>(£, 0) = 0, такая
что начало координат системы η = /a(t, 77, φ^,η)) + ^(£,77, </>(£, 7?)) равномерно
асимптотически устойчиво. Пусть
-*"ΚΑ-£-£'·Η·
гделибоL=С
-1
, либо L = 0 и G(t,x) — номинальная модель для G(t,x).
Пусть
Α-<'-«>(Α-*-3'·)
+
'-&-
Предположим, что Δ* удовлетворяет неравенству (14.10) с ρ = p(t,x). Положив
s = £—</>(£, η), найдите закон управления в скользящем режиме, обеспечивающий
стабилизацию начала координат. Сформулируйте и докажите теорему, аналогич
ную теореме 14.1.
14.11. Предположим, что выражение (14.13) заменено на следующее:
t* = -/?(*)*(!),
где σ : Д —> Д — непрерывно дифференцируемая, нечетная, монотонно возраста
ющая функция, обладающая свойствами
σ(0) = 0, lima(y) = l и уа(у) > а(1)у2
,\/\у\ ^ 1.
у—>оо
(а) Покажите, что функции а(у) = th(y), а(у) = (2/π) aictg(ny/2) и а(у) =
= у/(1 + \у\) удовлетворяют вышеприведенным свойствам.
См. приложение С.23 — Прим. ред. перев.
14.6. УПРАЖНЕНИЯ
677
(b) Покажите, что если (14.10) выполнено с ко < σ(1) и β выбрана так, что
σ(1) - к0
то
SiSi ^ -9οβο[σ(1) - K0]\si\ при \si\ ^ ε.
(c) Докажите теоремы 14.1 и 14.2 для этого закона управления в скользящем
режиме.
14.12. Замените неравенство (14. 10) на следующее:
ρ
-дг ^ Qi(x) + ^2i4j\vjl VI ^г ^р.
i=i
Пусть /С — (р х р)-матрица с элементами «^·, и предположим, что 1 — К при
надлежит классу М-матриц
38
Из свойств М-матриц следует, что следующие три
условия эквивалентны
39
:
(i) I — /С принадлежит классу М-матриц.
(ii) I — 1С невырожденна, и все элементы матрицы (/ — /С)-1
неотрицательны.
(in) Существует вектор w9 все элементы которого положительны, такой что все
элементы Ъ = (I — K)w положительны.
Пусть ^(ж) ^ ^(х) для всех 1 ^ г ^риа(х)
= (I-/C)_1
[5i(x), · · · >£Р(я)]Т
-
(a) Покажите, что при ^ = — Pi(x)sgn(si), Pi(x) = ai(x) + Wi выполнено sisi ^
^ -bi9o\si\, I < г <Ρ·
(b)Предположим,чтоΣ^=1*4?^ ко<1и^(а;)=д{х)при1<г^ р.
Покажите, что I — 1С принадлежит классу М-матриц и ft (ж) и w могут быть
выбраны так, что в результате мы получаем закон управления (14.11).
14.13. С учетом результатов для «непрерывного» закона управления в скользя
щем режиме, представленных в параграфе 14.1.3, покажите, что существует ко
нечный момент времени Т, возможно, зависящий от ε и начальных состояний,
а также положительная константа fc, не зависящая от ε и начальных состояний,
такие что \y(t) — r(t)\ < ke для всех t^T.
14.14. Выполните упражнение 14.5 с использованием ляпуновского синтеза.
14.15. Выполните упражнение 14.8 с использованием ляпуновского синтеза.
14.16. Используя численные данные для уравнения маятника из парагра
фа 14.1.1, выполните компьютерное моделирование системы, замкнутой законом
управления, построенном в примере 14.5. Определите параметры этого закона
38
Класс М-матриц вводится в лемме 9.7.
39
См. [57]. Это утверждение называют также теоремой Севастьянова-Котелянского, см. [63]. -
Прим. ред. перев.
678
ГЛАВА 14
управления, при которых достигаются те же характеристики замкнутой систе
мы, которые были получены с использованием закона управления в скользящем
режиме. Сравните характеристики обеих замкнутых систем.
14.17. Для каждой из нижеследующих скалярных систем используйте метод
нелинейного демпфирования и постройте закон управления с обратной связью
по состоянию, гарантирующий ограниченность состояния x(t), а также равно
мерную предельную ограниченность с предельной границей μ. Функция 6(t)
предполагается ограниченной для всех t ^ 0, но верхняя граница \6{t)\ неиз
вестна.
(а)х=-х+х
2
[и+S(t)], (b) x=x
2
[l +d(t)]- хи.
14.18. Рассмотрим систему с одним входом и одним выходом, представленную
в нормальной форме (13.16)—(13.18), и предположим, что (13.16) является устой
чивой по входу-состоянию. Пусть &{х) и j(x) — номинальные модели для функ
ций а(х) и 7(ж) соответственно. Предположим, что ошибки модели удовлетво
ряют неравенствам
\l(x)[a(x) - а(х)}\ ^ р0(х),
где функция ро(х) и константа к известны. Пусть r(t) — командный сигнал,
и предположим, что г и его производные до порядка г^ включительно непре
рывны и ограничены. Используя метод Ляпунова, найдите непрерывный закон
управления с обратной связью по состоянию, обеспечивающий асимптотическое
отслеживание выходом у сигнала г с заданной точностью μ, т.е. должно быть
выполнено \y(t) — r(t)\ ^ μ для всех £ ^ Т, где Τ — некоторый конечный момент
времени.
14.19. С использованием интегрального управления выполните предыдущее
упражнение для случая, когда командный сигнал является постоянным. Дока
жите, что ошибка регулирования стремится к нулю.
14.20. Рассмотрим систему
Х\=Х2,#2=U+5{x),
где δ неизвестна, но для нее справедлива оценка \S(x)\ < Pi||#||2 с известной р\.
Пусть и = ф(х) = —х\—Х2 — номинальный стабилизирующий закон управления
и
Г -piW2(w/|H|2),
если pi||x||2||H|2 ^
£
·>
V—<
I -pilMllfaAO»
если pi||a?||2|M|2 < ε
>
где w
T
=2х
т
РВиV(x)=х
т
Рх — функция Ляпунова для номинальной за
мкнутой системы. Применим управление и = —х\ — Х2 + v.
(а) Покажите, что все предположения следствия 14.1 выполнены, за исключе
нием неравенства 14.45), которое справедливо лишь при 770 = 0.
7(х) - 7(я)
у(х)
<*< 1,
14.6 . УПРАЖНЕНИЯ
679
(b) Покажите, что при 6(х) = 2(#i +Ж2) и р\ = 2\/2 начало координат неустой
чиво.
14.21. Предположим, что (14.33)—(14.35) выполнены с || · Цоо- Рассмотрим следу
ющие непрерывные аппроксимации разрывного закона управления (14.40):
Vi=
-^t1x)sgn(wi):
если ^t,x)\wi\ ^ ε,
-V*(t,x)(wi/e)>
если ^t,x)\wi\ < ε,
гдег=1,2,... ,риги
т
= [dV/dx]G(t, x).
(а) Покажите, что
^-сЫИоо) + ]С
*€/ L
,(t,,)Ki-iM!^
где г Ε /, если 77(£,х)|г^| < ε.
(b) Для этого закона управления сформулируйте и докажите теорему, аналогич
ную теореме 14.3.
14.22. Рассмотрим закон управления из упражнения 14.21. Мы хотим дока
зать результат, аналогичный следствию 14.1. Предположим, что аз(||ж||оо) ^
^ф
2
{х), v(t,x) ^770 > 0 и
\Si\^РгФ(х)+«оМ,0^к0<1
при г = 1,2,... ,р. Из этих неравенств следует, что (14.35) выполнено с || · ||оо,
однако следует иметь в виду, что они являются ограничительными, т. к. верхняя
граница для \Si\ зависит только от \v{\.
(a) Покажите, что
ν<-Ф\х) +53J-(1- «о)ч§^т- +РМХ)Ы \ •
(b) Сформулируйте и докажите результат, аналогичный следствию 14.1.
14.23. Перепишем неравенство (14.35) в следующем виде:
\\S(t,x^(t,x)+v)\\2
<:ро+р1ф(х)+Ko\\vh, 0^ «о<1,
где ф(х) = у/аз(\\х\\2)- Пусть TJ(X) = 770 + гцф{х\ где щ > р0/(1 - «о) и щ ^
^ pi/(l — «0)· Рассмотрим закон управления с обратной связью
V=
-[ηο + Г710(ж)](гу/||гу||2),
если ||ги||2 ^ ε,
-fro + тф(х)](ь)/е)у
если ЦгуЦг < ε.
680
ГЛАВА 14
(a) Покажите, что производная функции V вдоль траекторий замкнутой систе
мы (14.38) удовлетворяет оценке
22
V<-ф
2
(х) + |[р0 + РгФ(х)} < -|«з(||ж||2) + ^
+ψ·
(b) Примените теорему 4.18 и получите результат, аналогичный теореме 14.3.
(c) Сравните этот закон управления с (14.41).
14.24. Рассмотрим задачу, исследованием которой мы занимались в парагра
фе 14.2. Предположим, что (14.35) выполнено для 2-нормы, а также то, что вы
полнены (14.44) и (14.46). Покажите, что закон управления
ДТ7·
и=ip(t,х)—ηνο\ w
T
—
- ^—G(t, х)
при достаточно большом коэффициенте η обеспечивает стабилизацию начала
координат.
14.25. Рассмотрим задачу, исследованием которой мы занимались в парагра
фе 14.2. Покажите, что вместо закона управления и = tp(t,x) + ν можно ис
пользовать и = ν, где p(t, x) определяется неравенством
\\S(t,x,u) -ij)(t,x)\\2 < p{t,x) + ^ο|Μ|2, 0 < «о < 1.
14.26. Предположим, что система (14.30) содержит не только удовлетворяющую
условию согласованности неопределенность δ, но и не удовлетворяющую усло
вию согласованности неопределенность Δ, т. е.
х= f(t, х)+A(t,х)+G(t,х)[и+S(t,х,и)].
Предположим также, что в области D С Rn
все предположения теорем 14.3
выполнены, неравенства (14.44)-( 14.46) справедливы и для не удовлетворяющей
условию согласованности неопределенности при некоторой μ ^ 0 выполнено
неравенство ||[<9V/<9x]A(£,x)||2 < μφ
2
(Χ). Пусть и = ф{Ь,х) +ν, где ν определя
ется выражением (14.41). Покажите, что если μ < 1, то закон управления с об
ратной связью обеспечивает стабилизацию начала координат замкнутой системы
при условии, что ε выбрана настолько малой, что выполнено ε < 4(1 — μ)(1 —
-
K>O)VO/PV
14.27. Рассмотрим систему х = /(ж) + G(x)[u + д(х,и)] и предположим, что
существуют гладкие функции ф(х), V(x) и р(х), обращающиеся в ноль в х = 0,
и известная константа к, такие что выполнены неравенства
Cl||x||
2
< V(x) ^ с2\\х\\\ |£[/(*) + С{х)ф{х)\ ^ -сз|М|2
,
||*(ж,^(а;)+«)|| </>(«)+ κοΝΙ, 0 «ξ к0 < 1, \/х е R
n
,Vv6Rp
,
где Cj г = 1,2,3 — положительные константы.
14.6. УПРАЖНЕНИЯ
681
(a) Покажите, что можно построить непрерывный закон управления с обратной
связью по состоянию и = 7 (#)> такой что начало координат системы
x = f(x) + G(x)b(x)+S(xn(x))]
глобально экспоненциально устойчиво.
(b) Примените результат пункта (а) к системе
±1=Х2,Х2=(1+CLl)(Xi+х\) +(1+02)lt,
где а\ и CL2 — неизвестные константы, удовлетворяющие |ai|^l и |а2|^1/2.
14.28. Выполните упражнение 14.1 с использованием бэкстеппинга.
14.29. Выполните упражнение 14.5 с использованием бэкстеппинга.
14.30. Выполните упражнение 14.6 с использованием бэкстеппинга.
14.31. С использованием бэкстеппинга постройте закон управления с обратной
связью по состоянию, обеспечивающий глобальную стабилизацию системы
х\=Х2+a+(xi-a
1
/3)
3
, ±2=х\+и,
где а — известная константа.
14.32 ([108]). Рассмотрим систему
XI=-Х2-\х\ -\х\,
Х2= и.
(a) С использованием бэкстеппинга постройте линейный закон управления с об
ратной связью по состоянию, обеспечивающий глобальную стабилизацию
начала координат.
Указание: не исключайте нелинейные члены.
(b) Постройте глобально стабилизирующий закон управления с обратной свя
зью по состоянию с использованием метода линеаризации системы обрат
ной связью.
(c) Сравните построенные в предыдущих пунктах два закона управления. Ис
пользуя компьютерное моделирование, сравните характеристики замкнутых
систем и величины сигналов управления, применяемых в этих двух случаях.
14.33. Рассмотрим систему
Х\=Х2,Х2—Х\—х\+и.
(а) Постройте гладкий закон управления с обратной связью по состоянию и =
= ф(х), такой что начало координат замкнутой системы глобально экспо
ненциально устойчиво.
682
ГЛАВА 14
(b) Расширьте динамику системы, добавив интегратор в канал входа:
Х\=Х2>Х2=Х\—Х^-\-Ζ,Ζ=V.
Используя бэкстеппинг, найдите гладкий закон управления с обратной свя
зью по состоянию ν = ф(х, г), такой что начало координат замкнутой систе
мы глобально асимптотически устойчиво.
14.34. Рассмотрим систему из упражнения 13.17.
(a) Начав анализ системы с уравнения для х\ и перейдя согласно процедуре
бэкстеппинга к уравнению для Х2, постройте закон управления с обратной
связью по состоянию и = ф(х)9 такой что начало координат (х\ = О, Х2 = 0)
первых двух уравнений глобально экспоненциально устойчиво.
(b) Покажите, что при использовании закона управления с обратной связью,
построенного в пункте (а), начало координат х = 0 всей системы глобально
асимптотически устойчиво.
Указание: используйте свойство устойчивости по входу-состоянию третьего
уравнения.
14.35. Рассмотрим систему
Х1=Х2 + вхЬ
±2= XZ+U, Хз = Х1—Хз,
У= «1,
где θ G [0,2]. Используя бэкстеппинг, постройте закон управления с обратной
связью по состоянию, такой что величина \y — asmt\ предельно ограничена кон
стантой μ, представляющей собой параметр, который может быть выбран произ
вольно малым. Предположите, что |а|<1и||ж(0)||оо^1·
14.36. Выполните упражнение 14.4 с использованием комбинации бэкстеппинга
и ляпуновского синтеза.
14.37. Рассмотрим систему
&1= —XI+#1#2, Х2=X
е
!+#3, Хз=х\+S(x)+U,
где 6(х) — неизвестная (локально липшицевая) функция от х, удовлетворяющая
неравенству \S(x)\ < Щх\\2 для всех х с известной константой к. Постройте
глобально стабилизирующую обратную связь по состоянию.
14.38. Рассмотрим систему из упражнения 14.7.
(a) При δ = 0 и используя бэкстеппинг, постройте глобально стабилизирующий
закон управления с обратной связью по состоянию.
(b) Используя стабилизирующий закон управления из пункта (а) и ляпуновский
синтез, постройте закон управления с обратной связью по состоянию, такой
что для всех ||х(0)||оо ^ k решение x(t) является ограниченным и компо
нента |a:i(t)| предельно ограничена величиной 0.01.
14.39. Рассмотрим систему магнитной подвески из упражнения 1.18 и предполо
жим, что шар подвергается воздействию вертикально направленной возмущаю
щей силы d(t)9 т. е. уравнение системы имеет вид
ту= -ку +тд+F(y,г)+d(t).
14.6 . УПРАЖНЕНИЯ
683
Предположим также, что \d(t)\ ^ do для всех t ^ О, где верхняя граница do
известна.
(a) Рассматривая силу F в качестве управления и используя ляпуновский син
тез, постройте закон управления с обратной связью по состоянию F =
—
l{y->y)<> такой что \у — г\ предельно ограничено величиной μ, где μ —
параметр, который может быть выбран произвольно малым. Найдите другой
закон управления η в виде непрерывно дифференцируемой функции своих
аргументов.
(b) Используя бэкстеппинг, постройте закон управления с обратной связью по
состоянию для управляющего напряжения и, гарантирующий предельную
ограниченность величины \у — г\ константой μ.
14.40. Рассмотрим систему
±!= -хг +х\[х2+S(t)],±2=Щ
где S(t) — ограниченная функция для всех t ^ 0; верхняя граница величины
\S(i)\ предполагается неизвестной. С использованием комбинации бэкстеппинга
и метода нелинейного демпфирования, постройте закон управления с обратной
связью по состоянию, обеспечивающий глобальную ограниченность состояния х
для всех начальных состояний х(0) е R
2
.
14.41. Выполните упражнение 14.40 для системы
хг = -ΧλΧ2 + х\[\ +S(t)], ±2= и.
14.42. Рассмотрим линейную систему х = Ах + Ви и предположим, что суще
ствует положительно определенная симметричная матрица Р, такая что РА +
+А
Т
Р^0ипара(А,В
Т
Р) является наблюдаемой. Постройте глобально ста
билизирующий закон управления с обратной связью по состоянию и = —ф(х),
такой что ||^(ж)|| ^ к для всех х, где к — заданная положительная константа.
14.43. Рассмотрим систему
Х\=Х2,Х2= —х\+Ψ(ν),
где ψ — локально липшицевая функция, удовлетворяющая ^(0) = 0 и иф(и)> 0
для всех и φ 0. Постройте глобально стабилизирующий закон управления с об
ратной связью по состоянию.
14.44. Рассмотрим систему с одним входом и одним выходом, имеющую относи
тельную степень, равную единице, и представленную в глобально определенной
нормальной форме
V=/о(ч,у), У =Κη,у)+α(η,у)щ
где /о(0,0) = 0 и α(η,ρ) > ао > 0. Предположим, что существует (известная)
радиально неограниченная функция Ляпунова W{rj)^ [θ\ν/θη](0) = 0, такая что
684
ГЛАВА 14
[Ο\ν/θη]/ο(η, 0) < 0 для всех η φ 0. Постойте глобально стабилизирующий
закон управления с обратной связью по состоянию.
14.45. Постройте пассивный глобально стабилизирующий закон управления с об
ратной связью по состоянию для системы из примера 13.17.
14.46. Постройте глобально стабилизирующий закон управления с обратной свя
зью по состоянию для системы
х\=-(1+хз)%Ь%2=яз?хз=х\-1+и.
14.47. Рассмотрим систему с одним входом и одним выходом, имеющую отно
сительную степень, равную единице, и представленную в некоторой области,
содержащей начало координат, в нормальной форме
V=/ofa,У),У =Ь(г?,у)+α(η,у)щ
где /о, а и Ь — достаточно гладкие функции, такие что α(η, у) > O,Q > 0, /о(0,0) =
= 0 и 6(0,0) = 0. Предположим, что начало координат системы η = /о(?7,0)
асимптотически устойчиво и существует функция Ляпунова ν(η) такая, что вы
полнены неравенства
«idWIX^XMIMD и ^/o(»j,y)<-a3(NI),v|H|>7(l»l)
для некоторых /С-функций ai, с*2, <*з и 7· Пусть а(у) и Ь(у) — гладкие номиналь
ные модели для а(77, у) и 6(77,2/), такие что а(у) ^ оо > 0, и в рассматриваемой
области выполнено
' Kv, У) НУ) I< Q{V),
(14.116)
|α(τ7,2/) йЫ
где £(у) известна. Выбор о = 1, 6 = 0 возможен.
(а) Покажите, что непрерывный стабилизирующий закон управления в скользя
щем режиме может быть выбран в следующем виде:
НУ)
а(У)
-/ %)sat(f),
где β (у) > £?(у)+/?о и ε и /?о — некоторые положительные константы. В част
ности, покажите, что существуют компактные положительно инвариантные
множества ΩиΩε= {ν(η) ^α(ε), \у\< ε}СΩ, где а —некоторая/С-
функция, такие что каждая траектория, начинающаяся в Ω, достигает Ωε за
конечное время.
(Ь) Покажите, что если начало координат системы η = /о(^,0) экспоненци
ально устойчиво, то при достаточно малой ε начало координат замкнутой
системы экспоненциально устойчиво и Ω является подмножеством области
притяжения.
14.6 . УПРАЖНЕНИЯ
685
(c) Покажите, что (14.116) может быть выполнено на любом компактном мно
жестве с постоянной р.
(d) При каких условиях представленный закон управления обеспечивает полу
глобальную стабилизацию?
(e) Постройте стабилизирующий закон управления с обратной связью по выхо
ду для системы
ХХ= -Xl
-
х^х2=-Х2-x\-U,
Хз=х\-#3+U,у—Х2.
14.48. Рассмотрим систему с ρ входами и ρ выходами
± = /(х,гх), у = h(x),
где / — локально липшицевая функция и h — непрерывно дифференцируемая
функция, такие что /(О,0) = 0 и h(0) = 0. Предположим, что система
х=/(ж,и),у = -faffa
и
)d
= Мж,
и
)
с выходом у пассивна с радиально неограниченной, положительно определенной
функцией запаса V(x), т.е. V ^ и
т
у, и наблюдаема в нулевом состоянии. Пусть
Zi — выход линейной передаточной функции bis/(s + a,i) с входом yi, где а^ и bi —
положительные константы.
(a) Используя V(x) + Y^=i(ki/2bi)zf в качестве функции Ляпунова, покажите,
что обратная связь по выходу щ = — /ад,1 < г ^ р, кг > 0, глобально
стабилизирует начало координат.
(b) Используя V(x) + Y%=i(l/bi) J^ φ%{σ)ασ в качестве функции Ляпунова, где
фг — локально липшицева функция, такая что фг(0) = 0 и афг(а) > 0 для
всех σ ^ 0, покажите, что обратная связь по выходу щ = — фг(гг), 1 < г <р,
стабилизирует начало координат. При каких условиях на фг этот закон управ
ления обеспечивает глобальную стабилизацию?
(c) Используйте результат пункта (а) для обеспечения глобальной стабилизации
маятника
miO+mgsinθ=и
в положении, соответствующем углу наклона θ = δ\, с использованием об
ратной связи в виде функции, зависящей от Θ, но не от Θ.
14.49. Рассмотрим систему (14.85)—(14.86) и предположим, что и = ^(х) — ло
кально липшицевый закон управления с обратной связью по состоянию, обеспе
чивающий глобальную стабилизацию начала координат. Пусть х — оценка состо
яния, полученная с использованием наблюдателя (14.87). Покажите, что обратная
связь по выходу и = *у(х) глобально стабилизирует начало координат (х = 0, х =
= 0) замкнутой системы, если система
х=Ах+д(Сх,j(x —υ))
с входом ν является устойчивой по входу-состоянию.
686
ГЛАВА 14
14.50. Покажите, что полученный в параграфе 14.5.3 закон управления с обрат
ной связью по выходу характеризуется при достаточно малой ε теми же свой
ствами, которыми обладает закон управления с обратной связью по состоянию.
В частности, покажите, что система, замкнутая обратной связью по выходу, име
ет экспоненциально устойчивую точку равновесия в (z, ео, е, ё) = (0, ёо, 0,0).
В следующих семи упражнениях будет рассмотрено несколько специальных
случаев.
14.51. Модель асинхронного электрического двигателя (induction motor) может
быть представлена в следующем виде
40
:
JCJ=kt(K%~hia) - TL,
л
Rr\
\,RrM.
Aa=—7~Aa-ρωΑδΗ
—га,
:
Rr
RrM .
Аь = —γ-Xb + P^Aa + ——гь,
где ω — скорость вращения ротора, Ть — крутящий момент, λα и Хь — компонен
ты вектора магнитного потока через ротор, га и % — компоненты вектора тока
в статоре, Lr и Μ — индуктивность ротора и взаимная индуктивность, Rr —
сопротивление обмотки ротора, J — момент инерции, ρ — число пар контактов
и kt — положительная константа. Крутящий момент Тс может быть выбран в виде
TL = Т0 + φ(ω)9 где φ G [0, оо] — локально липшицева функция, представляющая
собой модель нагрузки при наличии трения, а Т0 — модель нагрузки, не зави
сящая от скорости вращения. Значения силы тока га и ц рассматриваются в ка
честве переменных управления. Необходимо построить закон управления с об
ратной связью, обеспечивающий отслеживание скоростью ω некоторой заданной
скорости вращения ωτ при неизвестном крутящем моменте. В этом упражне
нии мы представим уравнения состояния в полевых координатах (field-oriented
coordinates). Это преобразование разделяет рассматриваемую задачу управления
на две отдельные задачи управления: задачу управления скоростью вращения
ротора и задачу управления магнитным потоком ротора. Преобразование долж
но выполняться в режиме реального времени и при этом используются значения
магнитного потока ротора, также измеренные в режиме реального времени. На
первом этапе мы будем предполагать, что магнитный поток ротора известен. На
следующем этапе решения задачи мы используем наблюдатель для получения
оценок магнитного потока ротора и выполним анализ работоспособности по
строенного закона управления, в котором величина магнитного потока заменена
на ее оценку. Этот анализ будет выполнен с учетом неопределенности сопротив
ления обмотки ротора Rr, которое может существенно изменяться при изменении
температуры ротора в процессе эксплуатации двигателя.
(а) Пусть ρ — угол ориентации вектора магнитного потока ротора и А^ — его
абсолютная величина, т.е. ρ = arctg(A&/Aa) и А^ = л/λ^ + А^. Заменяя
'См., например, [50, приложение С] или [117].
14.6. УПРАЖНЕНИЯ
687
λα и Хь на Xd и ρ и рассматривая эти величины в качестве переменных
состояния, выполните замену переменных га и % на id и iq в соответствии
со следующим равенством:
cosρ sinρ
—
sinρ cosp
(14.117)
и покажите, что модель мотора может быть представлена в виде модели
состояния
3ω = kfXdiq — TL-> ^d
Rrx
RrM.
.
•y-Ad+ -j —id, Ρ
•ρω +
RrMlq
LrXd
при условии, что Ad > 0.
(b) Первые два уравнения вышеприведенной модели состояния не зависят от р.
Поэтому для нахождения закона управления для id и iq мы можем опустить
уравнение для р. Однако, нам по-прежнему необходимо ρ для вычисления га
и ц с использованием преобразования, обратного преобразованию (14.117).
Покажите, что при постоянных ω, iq и λ^ величина ρ будет ограничена.
Объясните, почему неограниченность ρ не нарушает справедливость полу
ченного результата.
(c) Заметим, что крутящий момент, генерируемый мотором, пропорционален
Xdiq- Поэтому мы можем управлять скоростью вращения, если построим ре
гулятор, обеспечивающий отслеживание переменной λ^ желаемого постоян
ного значения магнитного потока Аг с использованием управляющего сиг
нала id- После этого можно найти iq в предположении, что λ^ = Аг. Это
предположение будет обоснованным, если динамика системы управления
магнитным потоком является более быстрой по сравнению с динамикой си
стемы управления скоростью вращения ротора
41
. В этом пункте упражнения
необходимо построить закон управления магнитным потоком. Покажите, что
Ч = {К/М) — k(Xd — Аг), к ^ 0, обеспечивает выполнение указанной цели
управления.
(d) Поскольку величины сил тока га и % должны быть ограничены опреде
ленными максимальными значениями, необходимо предположить, что id
и iq ограничены величинами Id и Iq соответственно. Покажите, что если
Id > Xr/М и 0 < λ^(Ο) < λΓ, то при использовании закона управления
с насыщением
Аг/М - k(Xd- Xr)\
id=Idsat
Id
(14.118)
величина Xd(t) изменяется монотонно от λ^(0) до Аг. Найдите оценку дли
тельности переходного процесса.
41
Это может быть доказано с использованием теории сингулярных возмущений (см. главу 11).
688
ГЛАВА 14
(e) При построении закона управления скоростью вращения предположите, что
αν(£),ωΓ(£) и T0(t) ограничены. Постройте закон управления в скользящем
режиме вида iq = —Iqsa,t(s/e)
с подходящими параметрами s и ε. Найдите
условия, при которых этот регулятор является работоспособным, и оцените
верхнюю границу ошибки слежения.
(f) Предположим, что в дополнение к сделанному выше предположению функ
ция uir(t) удовлетворяет lim^oo ur{b) = ωτ и lim^oo cly(£) = 0. Необходимо
обеспечить нулевую ошибку в установившемся режиме при постоянной Т0.
Используя метод интегрального управления, постройте закон управления
в скользящем режиме вида iq = —Iq sat(s/s) с подходящими параметрами s
и ε. Найдите условия, при которых этот регулятор является работоспособ
ным, и покажите, что он обеспечивает нулевую ошибку в установившемся
режиме.
(g) Предположение о возможности измерения магнитного потока ротора прак
тически невыполнимо. В приложениях магнитный поток обычно оценивают
с использованием наблюдателя вида
ς Rrл
ч,RrM.с
Rrс .
с.RpM.
Αα = —у-Аа — рилъ~\—= —- га,
Ль = ——Хъ+ρωλα
Η—- —г&,
Ajy*
ijip
±Jf
±Jf
где Rr — номинальное значение (или оценка) величины i^. Угол ориентации
магнитного потока ρ и абсолютная величина магнитного потока А^ вычис-
ляются с использованием равенств ρ = arctg(Ab/Aa) и А^ = л/А^ + А^;
величины id и iq определяются с использованием (14.117) при р, вычислен
ном в соответствии с вышеприведенной формулой. Для того чтобы выписать
модель состояния для всей системы, определим ошибки оценивания магнит
ного потока ed и eq равенством
Гed
Используя ω, λ^, р, е^ и eq в качестве переменных состояния, покажите, что
вся система может быть представлена в виде модели состояния:
Jω= kt(Xdiq + eqid - ediq) - TL,
:
Rr>
RspM .
Arf =
-~f-Ad Η f Id,
±jr
L/r
RrMtq
ρ=ρω+
,
jUrAd
Rr
RrMiq
/Дг-ДД
....
.
.
ed=—r-ed+Txeq+
"
(Mid - Xd),
br
IJrAd
\
L/r
J
cos ρ
sin ρ
—
sinρ cosρ
Ад—Aa
Ab—A&
(14.119)
14.6 . УПРАЖНЕНИЯ
689
eq = —г-г-ч
-
-j-eq + —
Miq.
(h) Покажите, что управление магнитным потоком (14.118) позволяет обеспе
чить отслеживание переменной λ^ желаемого значения Хг при условии, что
Id > λΓ/Μ и 0 < λ^(0) < Хг. Покажите также, что
\Mid(t) - Xd(t)\ < (1 + kM)[MId - Xd(0)} exp[-(Rr/Lr)t].
(i) Используя V = (1/2)(e^ 4- e^) и лемму сравнения, покажите, что ||е|| =
=
Vei +
е
ч удовлетворяет оценке
||e(t)|| ^fcie-^ + fe
для некоторых положительных констант 7, &i и &2.
(j) Определите условия, при которых интегральный закон управления в сколь
зящем режиме, полученный в пункте (f), позволяет обеспечить нулевую
ошибку в установившемся режиме.
14.52. Нелинейные уравнения динамики m-звенного манипулятора имеют вид
M(q)q+C(q9q)q+Dq+g(q)=и.
(14.120)
Все переменные определены в упражнении 1.4. Предположим, что М, С и д —
непрерывные функции своих аргументов и
0<Хшу
т
у К:y
T
M(q)y < ХМУ
Т
У, V<z,y e
Rm
,y^0
для некоторых положительных констант Хт и Хм- Необходимо построить за
кон управления с обратной связью по состоянию, такой что q(t) асимптотиче
ски отслеживает желаемую траекторию qr(t), где qr(t), qr{t) и qr(t) непрерывны
и ограничены. В этом упражнении мы построим закон управления в скользящем
режиме. Выберем в качестве поверхности скольжения s = Ле + е = 0, где Л —
положительная диагональная матрица, и пусть
и=M(q)v +L[C(q,q)q+g(q)+M(q)qr -
M(q)Ae],
где Μ, С и д — номинальные модели М, С и д соответственно. Матрица L
выбирается либо нулевой, либо единичной, в результате чего мы получаем два
закона управления.
(а) Покажите, что s удовлетворяет уравнению
s=υ+
&(q,q,qr,qr,qr,v),
иполучитевыражениедляΔ приL=0иL=I.
1Ьр — Jtbp
Rp
ML
690
ГЛАВА 14
(b) В предположении, что
\\M-\q)M(q) - J||oo < ко < 1, V« € Дт
,
(14.121)
покажите, что Δ^ удовлетворяет неравенствам
|Аг|<Р(-)+^θ|Μ|οο>1^ *^ ?^>
где ρ может зависеть от (g, <?, <lrAr, Qr)·
(c) Пусть
^ = -/?(·)sat(si/s),ε>0,1<г^ т,
где β может зависеть от (q,q,<lrAri<ir)· Найдите β, при которой ошибка
регулирования е будет глобально равномерно предельно ограничена. Опре
делите оценку предельной границы в терминах ε.
(d) Какими свойствами обладает закон управления в скользящем режиме при
постоянной /3?
14.53. Рассмотрим уравнение m-звенного манипулятора из предыдущего приме
ра. В этом примере мы построим другой закон управления в скользящем ре
жиме [180], используя свойство кососимметричности матрицы (М — 2С), что
позволит избежать наложения требования (14.121).
(a) Пусть выражение для s совпадает с соответствующим выражением из
предыдущего примера. Используя W = (l/2)s
T
M(q)s
в качестве функции
Ляпунова для s-уравнения, покажите, что
W=s
T
[MKe + С(Ае -qr)-Dq-g -
Mqr + и].
(b) Пусть
и = υ + L[-M(q)Ae - C(q, q)(Ae - qr) + g(q) + M(q)qr],
где L = 0 или L = I, в результате чего мы получаем два различных закона
управления. Покажите, что
W=s
T
[v + Д(д, q, qr, qr, &.)],
иполучитевыражениедляΔприL=0иL=I.
(c) Пусть
ν= -/?(·Μ*/ε), ε>0, φ(ν) ={
у
/^
ПРИ
l^i
2
J}'
w
^
v
'
}
ψκυ)
{У
при ||у||2 < 1,
где β может зависеть от {qA^rArAr)·
Найдите /3, при которой ошибка
регулирования е будет глобально равномерно предельно ограничена. Опре
делите оценку предельной границы в терминах ε.
14.6 . УПРАЖНЕНИЯ
691
Нагрузка
Рис. 14.23. Двухзвенный манипулятор
(d) Какими свойствами обладает закон управления в скользящем режиме при
постоянной /3?
14.54. Модель двухзвенного манипулятора, изображенного на рисунке 14.23, мо
жет быть представлена [171] уравнением (14.120) с
М=
а\ +2а4cosq2 а2 + сцcosq2
а2 + <ΜCOSq2
&3
, С =адsinq2
-Я2
Qi
-(Q1+U2)
0
9=
bicosqi+b2cos(gi+ q2)
b2 cos(^i + q2)
где константы а^(г = 1,2,3,4), b\ и Ъ2 являются положительными и зависят
от масс, моментов инерции и длин звеньев манипулятора, а также от величины
ускорения свободного падения. Пренебрежем эффектом демпфирования и поло
жим D = 0. Пусть номинальными значениями параметров являются следующие
величины:
ai=200.01,а2=23.5,а3=122.5,а4=25,
Ьг = 784.8, 62 = 245.25.
Построим желаемую траекторию
qn(t) = qr2(t) = (π/2)[1 - exp(-5t)(l + 5*)],
соединяющую точку начального положения (qi = 0, q2 = 0) с точкой конечного
положения (gi = π/2, #2 = π/2). Предположим, что управление ограничено:
|wi| ^ 6000 Нм и \и2\ < 5000 Нм. В предыдущих двух примерах мы разработали
четыре различных закона управления в скользящем режиме:
и — — M/?sat(s/e),
и= -Μβ sat(s/ε)+Cq+g+M<?r- МЛе,
ix=
-βφ(8/ε),
и= -βφ(8/ε) +C(c?r- Ле)+д+Mgr - МЛе.
692
ГЛАВА 14
Для простоты изложения предположим, что β является константой.
(a) Используя компьютерное моделирование, выберите параметры Λ, β и ε для
каждого из этих четырех законов управления. При моделировании реализуй
те указанное ограничение величины управляющих сигналов.
(b) Сравните характеристики четырех законов управления при возмущенных
параметрах системы (т. е. в условиях, когда нагрузка неизвестна):
а\ = 259.7, а2 = 58.19, а3 = 157.19, а4 = 56.25,
bi = 1030.1,62 =551.8125.
(c) Предположим, что измерению доступны только углы q\ и q2. Разработайте
наблюдатель с сильной обратной связью и примените его при реализации
закона управления с обратной связью по состоянию. Используя компьютер
ное моделирование, сравните характеристики законов управления с обрат
ной связью по состоянию и по выходу для одного из представленных выше
четырех законов управления.
14.55. Рассмотрим двухзвенный манипулятор из предыдущего примера.
(a) С учетом результатов, представленных в примере 14.16, разработайте пас
сивный закон управления, обеспечивающий перевод манипулятора из поло
жения, соответствующего углам (q\ = 0, q2 = 0), в положение, соответству
ющее углам (qi = π/2, #2 = π/2). Используйте компьютерное моделиро
вание для выбора параметров Кр и К& и сравните полученный результат
с соответствующим результатом для закона управления в скользящем режи
ме из предыдущего упражнения.
(b) Предположим, что измерению доступны лишь углы q\ и q2. Разработайте
наблюдатель с сильной обратной связью и примените его при реализации
закона управления с обратной связью по состоянию. Используя компьютер
ное моделирование, сравните характеристики законов управления с обрат
ной связью по состоянию и по выходу.
14.56. Рассмотрим TORA-систему (трансляционный осциллятор с ротационным
актуатором) из упражнения 1.16. Здесь мы построим пассивный закон управле
ния [146], обеспечивающий глобальную стабилизацию начала координат.
(a) Используя сумму потенциальной энергии (1/2)кт* и кинетической энер
гии (1/2)ντΩ(θ)υ, υ = [0, хс]
т
, в качестве функции запаса, покажите, что
система с входом и и выходом 0 пассивна. Является ли она наблюдаемой
в нулевом состоянии?
(b) Пусть и = —φ\{θ) + w, где ф\ — локально липшицева функция, ф\(0) =
= 0, уфг(у) > 0 для всех у φ 0 и Нт^^о J^ </>i(A)c?A = оо. Используя
V=\ντΩ(θ)ν +\кх\ +f 0i(A)dA,v =
θ
хс
14.6 . УПРАЖНЕНИЯ
693
в качестве функции запаса, покажите, что система с входом w и выходом θ
пассивна. Покажите также, что эта система является наблюдаемой в нулевом
состоянии.
(c) Пусть 02 — любая локально липшицевая функция, такая что 02(0) = 0
и у02 (у) > 0 для всех у Φ 0. Покажите, что закон управления и = — 0i(0) —
—
02 (θ) обеспечивает глобальную стабилизацию начала координат.
(d)ПустьΜ =1.3608кг,т =0.096кг,L =0.0592м,I =0.0002175кгм
2
и к = 186.3 Н/м. Покажите, что закон управления
и = -Upsa,t(Kp0) - Uvsa,t(Kv0)
обеспечивает глобальную стабилизацию для любых положительных кон
стант Up,Uv,Kp и Kv. Выберите Up и Uv так, чтобы из неравенства Up +
+ Uv < 0.1 следовало, что и удовлетворяет ограничению \и\ < 0.1. Эти
четыре константы должны быть выбраны так, чтобы минимизировать дли
тельность переходного процесса. Для этого следует использовать компью
терное моделирование и анализ системы с использованием ее линеаризации.
Характеристическое уравнение для линеаризованной в окрестности начала
координат замкнутой системы имеет вид
1+
^°
2(2,а\
°'
s
2
(s
2
+ /?3)
где
UvKv(m + M)
UpKp
Ρ0=
τ
, Pi=UVKV'
и Δο = Δ(0). Покажите, что характеристический полином является гурви-
цевым, и определите местоположение корней при изменении βο от нуля до
бесконечности.
(e) Используя компьютерное моделирование замкнутой системы с начальными
состояниями 9(0) = π, 0(0) = 0, хс(0) = 0.025 и хс(0) = 0, а также с ис
пользованием результатов пункта (d) о местоположении корней, выберите
константы С/р, Ι/υ, Кр и Kv так, чтобы минимизировать длительность пере
ходного процесса. Эту величину следует сделать приблизительно равной 30
секундам.
(f) Предположим, что измеренению доступна лишь величина Θ. Используя ре
зультаты упражнения 14.48, покажите, что начало координат может быть
глобально стабилизировано законом управления с обратной связью по вы
ходу
u = —Upsa,t(Kpe) — Uvsat(Kvz),
694
ГЛАВА 14
где ε — любая положительная константа, z — выход системы с передаточной
функцией s/(es + 1), входом которой является Θ. Рассматривая эту переда
точную функцию в качестве передаточной функции наблюдателя редуциро
ванного порядка с сильной обратной связью, используйте представленный
в параграфе 14.5 метод для того, чтобы показать, что при ε —» О закон управ
ления с обратной связью по выходу обладает теми же характеристиками,
которыми обладает закон управления с обратной связью по состоянию. Вы
полните компьютерное моделирование замкнутой системы при различных
значениях ε и сравните полученные результаты с результатами, полученны
ми при использовании закона управления с обратной связью по состоянию.
14.57. Рассмотрим TORA-систему из упражнения 1.16. Здесь мы разработаем за
кон управления в скользящем режиме
42
, обеспечивающий стабилизацию начала
координат.
(a) Покажите, что замена переменных
^ , mLsinfl ^
•
, mLOcosθ _
аса
преобразует систему к регулярной форме (14.4)-(14.5).
(b) Используя
(m+M)fcx (
rnL
.
V ,(m+M)2fci 2fc2 2
W=
2mL ("'-^I
8
"
1
^
+
2kmL
*»
+
Τ*'
где к\ и /и2 — положительные константы, покажите, что
ξ=φ(η)1lfkiЫ - J^M
sinry3J cosщ -fc2r/3
обеспечивает глобальную стабилизацию начала координат системы
Покажите, что в качестве поверхности скольжения можно взять
s=θ+&2#—kixc cos0=0.
Заметим, что s не зависит от параметров системы.
(c) Найдите /3(х), при которой закон управления и — — /?(a;)sat(s^t) обеспе
чивает при достаточно малом значении μ глобальную стабилизацию начала
координат.
42
При разработке этого закона управления использовались идеи управления на основе пассив
ности, предложенного в [172].
14.6. УПРАЖНЕНИЯ
695
(d) Выражение для /?(ж), полученное в предыдущем пункте, может быть доста
точно сложным. В целях упрощения закона управления предположим, что β
является положительной константой, и запишем закон управления в виде
п
t Ι θ+ ков— клхссоъв\
u= -/?satI
-β
I,
где положительные константы fci, &2, β и μ являются выбираемыми пара
метрами. Покажите, что при достаточно малом μ этот закон управления ста
билизирует начало координат и гарантирует, что область притяжения вклю
чает компактное множество, содержащее начало координат.
(e) Пусть параметры системы имеют значения, приведенные в пункте (d)
упражнения 14.56. Для выбора параметров закона управления следует ис
пользовать компьютерное моделирование и анализ системы с использова
нием ее линеаризации. Характеристическое уравнение для линеаризованной
в окрестности начала координат замкнутой системы имеет вид
где
1+
-*>
;2;л
=0
'
β(τη + Μ)
mLki
к
70=
-τ
,71=к2+—гт7,72~
μΔ0 '
1Х
* т+М*" т+М'
кк2
k(I+mL
2
)
73
= ^Тм>
74=
До
'
А
°
=
т
'
Покажите, что характеристический полином является гурвицевым, и опре
делите местоположение корней при изменении 7о от нуля до бесконечности.
Сравните полученные значения корней с соответствующими результатами
из упражнения 14.56 и прокомментируйте ту роль, которую играет член
—kixccos9 при выборе s.
(f) Используя компьютерное моделирование замкнутой системы с начальным
состоянием 0(0) = π, 0(0) = 0, жс(0) = 0.025 и хс(0) = 0, а также с ис
пользованием результатов пункта (е) о местоположении корней, выберите
параметры fei, к2, β и μ так, чтобы минимизировать длительность переход
ного процесса. Эту величину следует сделать приблизительно равной 4 се
кундам. Сравните этот результат с соответствующим результатом из упраж
нения 14.56.
(g) Предположим, что измерению доступны лишь 0 и хс. Используя метод ана
лиза, представленный в параграфе 14.5, покажите, что при достаточно ма
лых μ и ε начало координат может быть стабилизировано законом управле
ния с обратной связью по выходу вида
п
t (z + к2в — fcixccos0\
w= -/3sat I
-β
J,
696
ГЛАВА 14
где z — выход передаточной функции s/{es + 1) с входом 0, соответству
ющей наблюдателю редуцированного порядка с сильной обратной связью.
Покажите, что при ε —> 0 закон управления с обратной связью по выходу
обладает теми же характеристиками, которыми обладает закон управления
с обратной связью по состоянию. Выполните компьютерное моделирова
ние замкнутой системы при различных значениях ε и сравните полученные
результаты с соответствующими результатами для управления с обратной
связью по состоянию.
ПРИЛОЖЕНИЕ А
Математический обзор
Евклидово пространство
Множество векторов х = [#i,..., хп]
т
размерности п, где х\,...,
хп—ве
щественные числа, определяет евклидово пространство размерности п, обознача
емое R
n
.
Евклидово пространство размерности один состоит из всех веществен
ных чисел и обозначается R, Для векторов в R
n
определена их сумма — вектор,
компонентами которого являются суммы соответствующих компонент складыва
емых векторов. Векторы могут умножаться на скалярную величину, и компонен
ты соответствующего вектора представляют собой произведения этой скалярной
величины и соответствующих компонент умножаемого вектора. Скалярное про
изведение двух векторов х и у определяется как х
т
у = ΣTM=1 ХгУг-
Векторные и матричные нормы
Норма ||я|| вектора х — это вещественная функция, обладающая свойствами
• ||х||^0длявсеххеR
n
и||ж||=0,еслиитолькоеслих=0.
• ||х+у||<||х||+||у||длявсехх,уеR
n
.
• ||аж||=|а|||я||длявсеха ЕRихΕi?n
.
Второе свойство известно как неравенство треугольника. Рассмотрим класс р-
норм, определяемых равенствами
INIp=(kir + ---+ k»l
p
)1/p
, I^P<OO
и
ЦжНоо = тах|ж»|.
г
Тремя наиболее часто используемыми нормами являются ||o;||i, ЦхЦоо и евкли
дова норма
ΙΝ|2 = (|Χ1|2
+···+ΚΙ
2
)1/2
= (Λ)1/2
·
Все р-нормы эквиваленты в том смысле, что если |Н1<х
и
1Н1/з
—
две различные р-
нормы, то существуют положительные константы с\ и С2, такие что
Cl|N|a < \\Χ\\β <C2||x||a
698
ПРИЛОЖЕНИЕ А
длявсехх£Rn
.
Для 1-, 2-, и оо-норм эти неравенства принимают следующий
вид:
Nh < Mi < УЯМЬ, ||ж||оо < 1Mb ^ v^Nloo, ||ж||оо < Iklli < ^IMIoo·
Важным результатом является неравенство Гельдера
\хТ
у\ ^Nlpllyllg» \ +\ =1,
выполненное для всех х £ i?
n
, у£Rn
.
Очень часто мы применяем при анализе
лишь те свойства норм, которые могут быть получены из трех основных свойств,
которыми обладает любая норма. В этих случаях нижний индекс ρ опускает
ся, что указывает на возможность использования в соответствующем выражении
любой из р-норм.
Матрица А размерности (га х п) с вещественными элементами определяет
линейное отображение у = Ах из R
n
вR
m
.
Индуцированная р-норма матрицы А
определяется равенством
1
\\Ах\\
\\А\\Р =
SU
Pиη
Р
= „max, ЦЛя||р>
хфъ \\х\\р 1М1р=1
которое при ρ = 1,2 и оо может быть представлено в виде
771
||A||i = max^iloiil, ||А||2 = [Xm^(AT A)}1/
2
,
3
г=1
п
ЦАЦоо = max> |o<j|,
где Атах(ЛтА) — максимальное собственное значение матрицы А
Т
А. Ниже при
ведены некоторые полезные свойства индуцированных матричных норм для ве
щественных матриц А и В размерности (шхп)и(пх £) соответственно:
-Ул||оо < 1И1|2 < V^WAWoo, -i=IHIIi < 1И1Ь < ^1И11ь
-v/n
Vm
И|2 < VPIIiPlloo, \\AB\\P < μ||ρ||Β||ρ.
Топологические концепции в R
n
Сходимость последовательностей. Последовательность векторов #о> #ъ · · •>
х^,... в R
n
, обозначаемая {х&}, называется сходящейся к вектору-пределу х, ес
ли
H^fe—ж||—>0прик—>оо,
sup обозначает точную верхнюю грань; inf обозначает точную нижнюю грань.
МАТЕМАТИЧЕСКИЙ ОБЗОР
699
что эквивалентно тому, что для любой ε > 0 существует целое число Ν, такое
что
\\хк-х\\<е9
Vk^N.
Символ «V» означает «для всех». Вектор х является предельной точкой после
довательности {х&}, если существует подпоследовательность {xk}, которая схо
дится к х, т. е. если существует бесконечное подмножество К множества неотри
цательных чисел, такое что {хк}кек сходится к х. Ограниченная последователь
ность {хк} в R
n
имеет по крайней мере одну предельную точку в R
n
.
После
довательность вещественных чисел {гк} называется возрастающей (монотонно
возрастающей или неубывающей), если гк < r^+iVfc. Если гк < Гк+ъ эта после
довательность называется строго возрастающей. Убывающие (монотонно убыва
ющие или невозрастающие) и строго убывающие последовательности определя
ются аналогичным образом при гк ^ Тк+\. Возрастающая последовательность
вещественных чисел, являющаяся ограниченной сверху, сходится к веществен
ному числу. Аналогично убывающая последовательность вещественных чисел,
являющаяся ограниченной снизу, сходится к вещественному числу.
Множества. Подмножество S С Rn
называется открытым, если для любого
вектора х Ε S можно найти ε-окрестность х
N{x,e) = {zeR
n
\\\z-x\\
<ε},
такую что N(x,e) С S. Множество S является замкнутым, если и только если
его дополнение в R
n
открыто. Аналогично S является замкнутым, если и только
если каждая сходящаяся последовательность {хк} с элементами из S сходит
ся к некоторой точке, принадлежащей 5. Множество S является ограниченным,
если существует г > О, такое что ||х|| ^ г для всех х Ε S. Множество S явля
ется компактным, если оно замкнуто и ограничено. Точка ρ является граничной
точкой множества 5, если любая окрестность ρ содержит по крайней мере од
ну точку из S и по крайней мере одну точку, не принадлежащую множеству S.
Множество всех граничных точек множества S, обозначаемое через dS, называ
ется границей множества 5. Замкнутое множество содержит все свои граничные
точки. Открытое множество не содержит своих граничных точек. Внутренностью
множества S является множество S — dS. Открытое множество равно своей внут
ренности. Замыкание множества 5, обозначаемое через 5, равно объединению S
и его границы. Замкнутое множество равно его замыканию. Открытое множе
ство S является связным, если каждая пара точек из S может быть соединена
траекторией, целиком лежащей в S. Множество S называется областью, если
оно является объединением открытого связного множества с некоторыми, ни од
ной, или всеми его граничными точками. Если область не содержит ни одной из
его граничных точек, то такая область называется открытой областью. Множе
ство S является выпуклым, если для любых х, у е S и любого вещественного
числа 0,0 < θ < 1 выполнено 0х+(1-% <Е S. Если хеХ С Rn
ny eYСRm
,
то говорят, что (х,у) принадлежит множеству-произведению X х Υ С Rn
xR
m
.
Непрерывные функции. Функция /, отображающая множество S\ в мно
жество 5г, обозначается через / : S\ —> S2. Функция / : R
n
—>R
m
называется
700
ПРИЛОЖЕНИЕ А
непрерывной в точке ж, если f(xk) —> f(x) при ж& —• х. Аналогично / является
непрерывной в ж, если для любой ε > 0 существует δ > 0, такая что
11*-у|К*=Ч1/0«0-/Ы11<е·
Символ «=>» означает «влечет, следует». Функция / является непрерывной на
множестве S, если она непрерывна в каждой точке S; эта функция является
равномерно непрерывной на S, если для любой ε > 0 существует δ > 0 (за
висящая только от ε), такая что это неравенство выполнено для всех ж, у £ S.
Заметим, что равномерная непрерывность определяется на множестве, а непре
рывность определяется в точке. В случае равномерной непрерывности фигури
рующее в определении неравенство для δ выполнено во всех точках указанного
множества. Очевидно, что если / равномерно непрерывна на множестве S, то
она непрерывна на S. Обратное утверждение в общем случае неверно. Одна
ко если S — компактное множество, то свойства непрерывности и равномерной
непрерывности на S эквивалентны. Функция
(ai/i + α2/2)(·) = ai/i(·) + α2/2(·)
является непрерывной для любых двух скалярных величин а\ и a<i и любых
двух непрерывных функций /i и /2. Если 5i,52 и 5з — любые множества
и /i: S\ —> 52 и /2: #2 —» #3 — некоторые функции, то функция /2°/i · Si —
>
S3,
определяемая выражением
(/2°/i)(.)=/2(/lO),
называется композицией функций f\ и /2. Композиция двух непрерывных функ
ций является непрерывной функцией. Если S С Rn
и/:S—»Д
т
, то множество
точек /(ж) при х € S называется образом S при отображении / и обозначается
через /(S). Если / — непрерывная функция, определенная на компактном мно
жестве S, то /(S) компактно и, следовательно, непрерывная функция на компакт
ном множестве ограничена. Более того, если / — вещественнозначная функция,
т. е. / : S —• R, то существуют точки ρ и q из компактного множества 5, такие
что /(ж) < /(р) и /(ж) ^ /(g) для всех х € S. Если / — непрерывная функция,
определенная на связном множестве S, то /(S) связно. Функция /, определен
ная на множестве S, является взаимно-однозначным отображением на S, если
прих,у еSихφувыполненоf(x)φf(y).Если/ :S—>i?m
—
непрерывная
взаимно-однозначная функция на некотором компактном множестве S С i?n
,то/
имеет непрерывную обратную функцию /
_1
на /(S). Композиция / и /
_1
яв
ляется тождественным отображением, т.е. f~
1
(f(x)) =х. Функция/ :R —• R
n
называется кусочно-непрерывной на интервале J С R, если для любого ограни
ченного подынтервала Jo С J функция / является непрерывной для всех х G Jo,
за исключением, возможно, конечного числа точек, в которых / имеет разрыв.
Более того, в каждой точке разрыва хо существуют предел справа lim^o f(xo +
+ К) и предел слева lim^_,o f(x
o — h), т. е. функция имеет конечный скачок в XQ.
МАТЕМАТИЧЕСКИЙ ОБЗОР
701
Дифференцируемые функции. Функция / : R
цируемой в точке х, если существует предел
R называется дифферен-
/'(*) lim
/i->0
f(X +
h)-f(x)
h
Предел f(x) называется производной функции / в точке х. Функция / : R
n
—•
—>R
m
называется непрерывно-дифференцируемой в точке хо, если частные про
изводные dfi/dxj (1 ^ г ^ га, 1 < j ^ η) существуют и непрерывны в XQ. Функ
ция / является непрерывно дифференцируемой на множестве S, если она непре
рывно дифференцируема в каждой точке множества 5. Для любой непрерывно
дифференцируемой функции / : R
n
—> R вектор-строка df/dx
определяется
равенством
?1
дх
д£_
' дхп
Градиент функции, обозначаемый через V/(x), определяется равенством
Для любой непрерывно дифференцируемой функции / : R
n
—>R
m
матрица Яко
би (якобиан) [df/dx] представляет собой (га х п) -матрицу, элементами которой
являются dfi/dxj, где г — номер строки и j — номер столбца. Предположим, что
SСRn
открыто, / отображает S в R
m
,
функция / непрерывно дифференцируе
ма в хо Ε 5, функция g отображает открытое множество, содержащее f(S), в R
k
,
и g является непрерывно дифференцируемой в /(#о). Тогда отображение h мно
жестваSвR
k
,
определенное равенством h(x) = g(f(x)), является непрерывно
дифференцируемым в хо и его матрица Якоби определяется с использованием
цепного правила
dh
дх X—XQ
дд_
df /=/(*о)
а/
дх =XQ
Теоремы о среднем значении и о неявной функции
Если х и у — две различные точки в i?n
, то отрезок прямой L(x,y), соеди
няющий х и у, определяется равенством
L(x,у)={z\z=вх+(1- %,0<θ<1}.
Теорема о среднем значении
Предположим, что / : R
n
— > R — непрерывно дифференцируема в каждой
точке х открытого множества S С Rn
.
Пустьхиу—дветочкиизSтакие,что
отрезок прямой L(x,y) является подмножеством S. Тогда существует точка z,
принадлежащая L(x, у), такая что
НУ)- No д£
дх
(у- х).
702
ПРИЛОЖЕНИЕ А
Теорема о неявной функции
Предположим, что / : R
n
xR
m
—>R
n
непрерывно дифференцируема в каж
дой точке (х, у) открытого множества S С Rn
xR
m
.
Пусть (XQ, уО) — точка в 5,
в которой /(хоуУо) = 0 и матрица Якоби [д//9х](#о>2/о) невырожденна. Тогда
существуют окрестности U С Дп
иVСЛт
точек хо и ?/о соответственно, такие
что для любой у eV уравнение /(х, у) = 0 имеет единственное решение х eU.
Более того, это решение имеет вид х = д(у), где # — непрерывно дифференци
руемая в точке у = уо функция.
Доказательства этих двух теорем, а также других фактов, изложенных ранее
в этом приложении, могут быть найдены в любом учебнике по математическому
анализу
2
.
Неравенство Г^онуолла-Беллмана
Лемма АЛ. Пусть λ :[а,Ь] —•> R—непрерывная функция иμ :[а,6]—• R —
непрерывная и неотрицательная функция. Если некоторая непрерывная функция
у : [а, Ь] —• R удовлетворяет неравенству
y(t) < X(t) + / μ(8)ν(8)α8
Ja
при a ^t ^b, то на том же интервале выполнено
y(t) < \{t) + / λ(5)μ(5)βΧΡ Γ Ζ" μ{τ)α7
В частности, если X(t) = λ, то
y(t) ^ Aexp / μ(τ)6?τ .
Если, кроме того, μ(£) = μ ^ 0, mo
3/(t) ^ Аехр[д(*-а)].
ДОКАЗАТЕЛЬСТВО. Пусть z(t) = /^ /x(s)y(s)ds и v(i) = z(£)+A(£)-?/(£) ^ 0.
Тогда функция z является дифференцируемой и
i = μ(*)ν(*) = μ(φ(*) + μ(*)λ(*) - /х(ф(*).
Это равенство представляет собой скалярное линейное уравнение, и его переход
ная функция имеет следующий вид:
ds.
</>(£, 5) = ехр / M(r)dT
2
См., например, [10]. Прим. ред. перев.
—
На русском языке имеется достаточное количе
ство прекрасных учебников математического анализа. Можно рекомендовать, например, курсы
Г. М. Фихтенгольца, В. И . Смирнова, Г. И . Шилова.
МАТЕМАТИЧЕСКИЙ ОБЗОР
703
Поскольку z (а) = 0, получаем
z(t) = / 0(i, δ)[μ($)λ(δ) — μ(5)ν($)](Ζ5.
./α
Член
неотрицателен, и поэтому
-/α
s(£) < / exp / μ(τ)α,7
Ja
LJs
//(s)A(s)c?S.
Из неравенства y(£) ^ A(t)+z(£) следует утверждение леммы для общего случая.
В частном случае, когда \(t) = λ, получаем
/μ(β)exp /
Ja
US
μ(τ)ατ ds =
"Г^{
ехр
[/м(т
Н}"
5
= - jexp / μ(τ)ατ\
/ μ(τ)<2τ
= —1+exp
Из этого равенства следует утверждение леммы для случая, когда λ постоянна.
Случай, когда и λ и μ являются постоянными функциями, может быть доказан
путем интегрирования.
Π
ПРИЛОЖЕНИЕ В
Сжимающее отображение
Рассмотрим уравнение вида х = Т(х). Будем говорить, что решение х* это
го уравнения является неподвижной точкой отображения Т, поскольку отобра
жение Τ переводит точку х* в эту же точку. Классическим методом нахождения
неподвижной точки является метод последовательного приближения. Рассмот
рим начальный вектор х\ и вычислим x<i — T(x{). Продолжая эту процедуру,
получаем последовательность векторов xu+i = Т(х^). В теореме о сжимающем
отображении устанавливаются достаточные условия для существования непо
движной точки х* для отображения х = Т(х), а также достаточные условия
сходимости последовательности {xk} к точке х*. Эта теорема представляет со
бой мощное средство анализа, используемое при доказательстве существования
решения уравнения вида х = Т(х). Она справедлива не только в случае, ко
гда Τ является отображением одного евклидова пространства в другое, но также
и в случае, когда Τ является отображением банаховых пространств. Мы будем
использовать формулировку теоремы о сжимающем отображении именно для
этого общего случая. Начнем с определения банаховых пространств
1
.
Векторные пространства. Линейное векторное пространство X над по
лем R — это множество элементов х, у, z,...,
называемых векторами, такое что
для любых двух векторов х, у £ X определена сумма х + у, такая что х 4-
+у£Χ,х4-у
—
у+х, (х+у)+z—х+(у+z),исуществуетнулевой
векторО£X,такойчтох+0= хдлявсехх £X.Крометого,длялюбых
чисел а,/3 £ R определено умножение на скалярную величину ах, такое что
ах£X,1·х=х,0·х
—
О,(αβ)Χ=а(/?х),а(х+у)=ах+осуи(а+/?)х=
= ах+/?хдлявсехх,у£X.
Нормированное линейное пространство. Линейное пространство X явля
ется нормированным линейным пространством, если для любого вектора х £ Χ
существует вещественнозначная функция ||х||, называемая нормой, которая удо
влетворяет условиям
• ||х||^0длявсеххΕXи\\х\\==0,еслиитолькоеслих=0.
• ||х+2/||^||х||+\\у\\длявсехх,у£X.
• ||ах||=\а\\\х\\длявсехα£Дих£Л\
всеобъемлющее исследование свойств банаховых пространств может быть найдено в любом
учебнике по функциональному анализу, например, в [121, глава 2]. Прим. ред. перев.
—
См. также
курс А. Н. Колмогорова и С. В. Фомина [Д36].
СЖИМАЮЩЕЕ ОТОБРАЖЕНИЕ
705
Если из контекста неясно, какая норма || · || используется — норма на X или норма
наД
п
, — мы будем писать || · ||#, указывая на то, что используется норма на X.
Сходимость. Последовательность в нормированном линейном пространстве
{xk} ΕX сходится к х G X, если
||#fc—#||—>0прик—»оо.
Замкнутое множество. Множество S С X замкнуто, если и только если
любая сходящаяся последовательность с элементами из S имеет предел в S.
Последовательность Коши. Последовательность {#&} G X называется по
следовательностью Коши, если
\\xk ~
х
т\\ —» 0при/с,га—>оо.
Каждая сходящаяся последовательность является последовательностью Коши, но
не наоборот.
Банахово пространство. Нормированное линейное пространство X являет
ся полным, если каждая последовательность Коши в X сходится к некоторому
вектору в X. Полное нормированное линейное пространство называется банахо
вым пространством.
Пример В.1. Рассмотрим множество всех непрерывных функций /: [а, Ь] —>
—* jRn
, обозначаемое через С[а,Ь]. Это множество образует векторное простран
ство на Д. Сумма х+у определена равенством (x+y)(t) = x{i)+y{i). Умножение
на скаляр определено равенством (ax)(t) = ax(t). Нулевой вектор — это функ
ция, тождественно равная нулю на [а, Ь]. Определим норму:
\\х\\с= max ||ж(<)||,
*€[о,Ь]
где норма в правой части равенства — это любая из р-норм на R
n
.
Очевидно,
что \\х\\с ^ 0 и норма равна нулю только для нулевого вектора. Неравенство
треугольника следует из неравенства
max \\x(t) + y(t)\\ ^ max[||x(t)|| + ||y(t)||] < max ||x(t)|| + max \\y(t)\\.
Кроме того,
тах||аж(£)|| = max|a|||a:(i)|| = |a|max ||x(t)||,
где все максимумы вычислены на [α, b]. Следовательно, множество С [а, Ъ] с нор
мой ||||с представляет собой нормированное линейное пространство. Оно также
является банаховым пространством. Для доказательства этого утверждения необ
ходимо показать, что каждая последовательность Коши в С [а, Ь] сходится к век
тору из С[о,Ь]. Предположим, что {х^} — последовательность Коши в С[а,Ь].
Для любого фиксированного t G [a,b] выполнено
\\Xk(t) ~ Xm(t)\\ ^ \\Хк ~ Sm||c -* 0 При Л,Ш -» ОО.
706
ПРИЛОЖЕНИЕ В
Таким образом, {х&(£)} — последовательность Коши в R
n
.
НоR
n
с любой р-
нормой является полным, т.к. из сходимости следует покомпонентная сходи
мость и R полное. Поэтому существует вещественный вектор х(£), к которому
сходится последовательность: Xk(t) —• x(t). Таким образом, доказана поточечная
сходимость. Далее мы покажем, что эта сходимость равномерна по t Ε [α, b]. Для
любой ε > 0,выберем число Ν, такое что \\xk — хт\\с <
ε/% пР
и
к,т > N. Тогда
при к > N выполнено
\\*k(t) ~ X(t)\\ < \\xk(t) - Xm(t)\\ + \\xm(t) - X(t)\\ ^
< \\Xk - Xm\\c + \\Xm(t) ~ x(t)\\.
При достаточно большом т (возможно, зависящем от t) каждый член в пра
вой части этого неравенства становится меньше ε/2 и, следовательно, ||xfc(£) —
—
x(t)\\ < ε при к > N. Таким образом, {х^} сходится к х равномерно по
t Ε [α, Ь). Для завершения доказательства необходимо показать, что x(t) непре
рывна и {xk} сходится к х по норме С[а,Ь]. Для доказательства непрерывности
рассмотрим неравенство
\\x(t+δ)- x(t)\\ <||х(*+δ)- xk(t +i)||+
+ \\xk(t + 6)-xk(t)\\ +
\\xk(t)-x(t)\\.
Поскольку {xk} равномерно сходится к x, для любой ε > 0 можно найти до
статочно большое fc, такое что первый и третий члены в правой части этого
неравенства становятся меньше ε/З. Т.к. функция Xk(t) непрерывна, мы можем
выбрать достаточно малую δ, такую что второй член в предыдущем неравенстве
становится меньше ε/З. Поэтому x(t) — непрерывная функция. Сходимость хк
к х по норме || · ||с непосредственно следует из равномерной сходимости.
Δ
Теорема В.1 (о сжимающем отображении). Пусть S — замкнутое под
множество банахового пространства X, и пусть Τ — отображение S в S.
Предположим, что
\\Т(х)-Т(у)\\<р\\х- у\\,Ух,у еS,0<ρ<1.
Тогда
• существует единственный вектор х* Ε S, удовлетворяющий равенству
х* = Т(х*);
• вектор х* может быть получен с использованием метода последователь
ных приближений, начинающихся с любого вектора из S.
ДОКАЗАТЕЛЬСТВО. Выберем произвольный х\ Ε S и определим последова
тельность {хк} формулой Xk+i = T(xk). Поскольку Τ отображает S в 5, выпол
нено Xk Ε S для всех к ^ 1. На первом шаге доказательства мы покажем, что
{хк} — последовательность Коши. Из неравенства
||х*+1-хл|| = ||Г(жл)-Г(а:л_1)||<
^р\\хк - Xk-i\\ <р
2
\\хк-1
~ Хк-2\\ ^
^Р
к
~
1
\\%2 - х\\\
СЖИМАЮЩЕЕ ОТОБРАЖЕНИЕ
707
следует, что
\\Xk+r ~ Хк\\ ^ ll^fc+r - Sfc+r-1|| + lkfc+r-1
-
Я*;+г-2|| Η l· \\Xk+l ~ Sfcll ^
< [Pk+r
~
2
+P
k+r
~
3
+···+P
fc_1
]lk2 - xi\\ ^
^
A· —1 \~^
7II
li
Ρ
II
II
<p 2^PI^2-^I|| = ~—
\\x2-x1\l
i=0
P
Правая часть этого неравенства стремится к нулю при к —> оо. Таким образом,
рассматриваемая последовательность является последовательностью Коши. По
скольку X является банаховым пространством, справедливо
Xk—х*GXприк—>оо.
Более того, поскольку S замкнуто, х* Ε S. Покажем, что х* = Т(х*). Для любого
Xk = T(xfc_i) выполнено
||х* - Т(х*)|| ^ ||х* - хк\\ + \\хк - Т(х*)|| ^ ||х* - хк\\ + р\\хк-1
-
х*Ь
При достаточно большом к правая часть этого неравенства становится произ
вольно малой. Таким образом, ||х* — Т(х*)|| = 0, т.е. х* = Т(х*). Осталось
показать, что х* — единственная в S неподвижная точка отображения Т. Пред
положим, что х* и у* — две неподвижные точки. Тогда
\\х* -V*\\ = \\T(x')-T(y')\\^p\\x*
- у*\\.
Поскольку ρ < 1, получаем х* = у*.
Π
ПРИЛОЖЕНИЕ С
Доказательства
С.1. Доказательства теорем 3.1 и 3.2
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 3.1. Заметим, что если x(t) — решение урав
нения
х = f(t,x), x(t0) = #о,
(C.l)
то
x{t) = х0 + / f(s,x(s))ds.
(C.2)
Обратно, если x(t) удовлетворяет (С.2), то x(t) удовлетворяет (С.1). Таким обра
зом, исследование вопроса о существовании и единственности решения диффе
ренциального уравнения (С.1) эквивалентно исследованию вопроса о существо
вании и единственности решения интегрального уравнения (С.2). Рассмотрим
правую часть (С.2) как отображение с непрерывной функцией х : [to, ti] —» R
n
в качестве аргумента. Обозначив это отображение через (Px)(t), можно перепи
сать (С.2) в следующей форме:
x(t) = (Px)(t).
(C.3)
Заметим, что (Px)(t) — непрерывно по t. Решение (С.З) представляет собой непо
движную точку отображения Р, сопоставляющего х функцию Рх. Существова
ние неподвижной точки уравнения (С.З) может быть установлено с использо
ванием теоремы о сжимающем отображении. Для этого необходимо определить
банахово пространство X и замкнутое множество S С X, такие что Ρ отобража
ет S в S и является сжимающим на S. Пусть
X = C[to,to + δ] с нормой 11x11^= max \\x(i)\\
te[to,to+S]
и
S={хGXΙ||ж—хо\\с<г},
где г — радиус шара В и δ — положительная константа, которую следует опре
делить. Мы ограничим выбор δ условием δ ^ t\ — to, при выполнении которого
[to, to + δ] С [to,ti]. Заметим, что \\x(t)\\ обозначает норму на R
n
, а||ж||с—
С.1. ДОКАЗАТЕЛЬСТВА ТЕОРЕМ 3.1 и 3.2
709
норму на X. Кроме того, В — шар вR
n
,
aS— шар вX.По определению Ρ
отображает X в X. Для того чтобы показать, что оно отображает S в 5, запишем
(Px)(t)-x0=
/ f(s,x(s))ds
= / [f(s,x(s)) - f(s,x0) + f(s,x0)]ds.
Jto
Jto
Вследствие того что / кусочно-непрерывна, функция /(£,#о) ограничена на
[t0, ti]. Пусть
h= max ||/(*,ж0)||.
te[t0M]
С учетом условия Липшица (3.2), а также того факта, что для любой х е S
выполнено
||s(t)-x0||<r, Vt€[io,f0 + <4,
получаем
\\(Px)(t) - хо\\ < [ [\\f(s,x(s))-f(s,x0)\\
+ ||/(β,*0)||]ω <
^ /[L\\x(s)-x0\\+h]ds^ J(Lr+h)ds =
JtQ
Jto
= (t-t0)(Lr +h)^S(Lr+h)
\\Px - xo\\c = max ||(Px)(t) - x0|| < S(Lr 4- Λ).
Следовательно, выбор δ ^ r/(Lr + /i) гарантирует, что Р отображает S в S. Для
того чтобы показать, что Ρ является сжимающим отображением на 5, положим
х, у е 5 и рассмотрим
II Г*
II
||(PaO(t) - (Py)(t)\\ = / [/(β,φ)) - /(*,y(*))]<fa
11*/to
< Γ||/(β,Χ(β))-/(β,»(β))||ω
«/to
/ L\\x(s) - y(s)\\ds < / dsi||a; - 2/||c.
«/to
*/*ο
Поэтому
||Px-Py||c ^L5||x-y\\c <p||a-</||cприi<£.
Таким образом, выбор р < 1 и i ^ p/L гарантирует, что отображение Р явля
ется сжимающим на S. С использованием теоремы о сжимающем отображении
заключаем, что если δ выбрана так, что выполнено
d^mmltx-to, Lr
r
^h,^\ прир<1,
(С.4)
710
ПРИЛОЖЕНИЕ С
то (С.2) будет иметь единственное решение в S. Это заключение не является за
вершением доказательства, т. к. нам необходимо установить факт единственности
решения для всех непрерывных функций x(t), т. е. единственность в X. Оказыва
ется, что любое решение (С.2) из X лежит в S. Для того чтобы в этом убедиться,
заметим, что, поскольку x(to) = хо расположена внутри шара В, любое непре
рывное решение x(t) должно принадлежать В на некотором интервале времени.
Предположим, что x(t) покидает шар В, и пусть to + μ — момент времени, когда
x(t) впервые пересекает границу В. Тогда
\\x(to + μ) -zoll =r.
С другой стороны, для всех t < to + μ выполнено
\\x(t) - хо|| < [ [\\fM*))
~ /(*,*о)|| + Wf{8,xo)\\]d8 <
Jto
< / [L||x(s)-x0|| +h}ds < / (Lr + h)ds.
Jto
Jto
Поэтому
r=\\x(to4-μ)- xo\\<(Lr+Κ)μ=>μ^
r
,
>δ,
Lr+η
т.е. решение x(t) не может покинуть множество В на протяжении интервала
времени [to, to 4- δ] и, следовательно, любое решение из X лежит в S. Таким
образом, единственность решения из 5 влечет единственность в X.
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 3.2. Идея доказательства основана на том,
чтобы показать, что константу δ из теоремы 3.1 можно выбрать независимо от
начального состояния XQ. ИЗ (С.4) ВИДНО, ЧТО зависимость δ от начального состо
яния обусловлена наличием константы h в члене r/(Lr + ft). Поскольку в рас
сматриваемом случае условие Липшица выполнено глобально, г можно выбрать
произвольно большой. Поэтому для любой конечной ft можно выбрать доста
точно большую г так, чтобы было выполнено r/(Lr + ft) > p/L. Тогда (С.4)
упрощается:
δ<min<t\—to,γ >прир<1.
Если t\ — to ^ ρ/L, можно выбрать δ = t\ — to и доказательство завершено.
В противном случае выберем δ так, чтобы было выполнено δ < p/L. Разделим
интервал [io^i] на конечное число подынтервалов длиной δ ^ p/L и последова
тельно применим теорему 3.1
1
.
Π
С.2. Доказательство леммы 3.4
Верхняя правая производная D
+
v(i) определяется равенством
D+
v(t) =lim sup —
£—,
'Заметим, что начальное состояние на каждом из подынтервалов, скажем х\9 будет удовлетво
рять неравенству ||/(£,:n)|| ^ h\ для некоторой конечной h\.
C.2. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 3.4
711
где limsupn_,oc (предельная верхняя граница) для последовательности веще
ственных чисел {хп} — это вещественное число у, удовлетворяющее следующим
двум условиям:
• для любой ε > 0 существует целое число JV, такое что из η > Ν следует
хп <у+ε;
• для определенных ε > 0 и т > 0 существует целое число η > т, такое что
хп >у-ε.
Первое утверждение означает, что в конце концов все члены последовательности
становятся меньше у Л- е. Второе утверждение означает, что бесконечно мно
го членов последовательности превосходят у — е. Одним из свойств limsup
2
является то, что если zn ^ хп для каждого η = 1,2..., то limsupn^00zn ^
< limsupn_,00xn. Из этого свойства видно, что если \v(t + h)' — v(t)\/h ^
< g(t, /i), V/i E (0, b] и lim^0+ g(t, h) = go(t), то D+v(t) ^ g0(t).
Для доказательства леммы 3.4 рассмотрим дифференциальное уравнение
* = /(*,*) +λ, z(to) = uo,
(C.5)
где λ — положительная константа. Из теоремы 3.5 следует, что на любом ком
пактном интервале [to, ti] для любой ε > 0 существует δ > 0 такая, что если
λ < δ, то (С.5) имеет единственное решение z(t, λ), определенное на [to, t{\ и
\z(t,X)-u{t)\
< ε, Vt Ε [t0,ti].
(C.6)
Утверждение 1: v(t) ^ z(t, λ) для всех t Ε [to,h].
Это утверждение может быть доказано от противного. Если оно неверно, то су
ществуют моменты времени а,Ь G (to, ti], такие что υ (а) = z(a,\) и v(t) >
>z(t,λ)приa<t ^b. Тогда
v(t) -υ(α)>z(t, λ)- z(a,λ),VtΕ(α,Ь],
и из этого следует, что
L>+u(a) ^ i(a, λ) = /(a, z(a, λ)) + λ > /(a, ν(α)),
что противоречит неравенству D+
v(t) ^ f(t,v(t)).
Утверждение 2: v(t) ^ w(t) для всех t Ε [to, ti].
Это утверждение также может быть доказано от противного. Если оно неверно,
то существует момент времени а Е (to, ti], такой что υ (а) > и(а). Полагая ε =
= [υ(а) — и(а)]/2 и используя (С.6), получаем
υ(а)—z(a,λ)=υ(α)—и(а)+и(а) —z(a,λ)>ε,
что противоречит утверждению 1.
2
См. [10, теорема 12-4].
712
ПРИЛОЖЕНИЕ С
Таким образом, мы показали, что v(t) ^ u(t) для всех t e [to,ti]. Поскольку
это верно на любом компактном интервале, можно заключить, что это неравен
ство выполнено для всех t ^ to. Если оно оказалось невыполненным, пусть
Τ < оо — первый момент времени, когда это произошло. Тогда v(t) ^ u(t) для
всех t Ε [to,T) и, по непрерывности, v(T) = u{T). Следовательно, мы можем
расширить область, где выполнено это неравенство, до интервала [Τ, Τ+Δ] неко
торой Δ > 0. Однако это противоречит утверждению о том, что Τ — это первый
момент времени, когда неравенство оказалось нарушенным.
С.З. Доказательство леммы 4.1
Поскольку функция x(t) ограничена, с использованием теоремы Больцано-
Вейерштрасса
3
можно показать, что она имеет точку сгущения при t —» оо и,
следовательно, положительное предельное множество L
+
не пусто. Для лю
бойу£L+
существует последовательность t^ U —» оо при г —> оо, та
кая что x(U) —> у при г —> оо. Поскольку x(U) ограничено равномерно
по г, предел у ограничен, т. е. L
+
ограничено. Для доказательства замкнутости
L+
предположим, что {уi} Ε L+
—
некоторая последовательность, такая что
уi—>уприг—>оо,идокажем,чтоуΕL+
. Для любого г существует последова
тельность {£г?}> *i/ —> оо при j —> оо, такая что x(Ug) —> yi при j —> оо. Постро
им специальную последовательность {тг}. Для последовательностей Ьц выберем
Т2 > *12, такую что ||х(г2) - 2/21| < 1/2, тз > ii3, такую что ||х(т3) - уз\\ < 1/3
итакдалееприг=4,5,— Разумеется,Т{—>ооприг—>оои||ж(тг)—Уг||<1Д
для любого г. Далее, для любой ε > 0 существуют положительные целые числа
Ν\ и А^2, такие что
ИтО-одН < |,Уг > ΛΓΧ и Hj/i-уЦ < |,Уг > iV2.
Первое неравенство следует из \\х{тг) —у%\\ < 1/г, а второе — из существования
предела yi ^> у. Тогда справедливо неравенство
\\х(тг)-у\\ <ε, VO^r = max{JVi,JV2},
из которого следует, что xfa) —• у при г —> оо. Таким образом, L
+
замкнуто.
Это доказывает тот факт, что множество L
4
" компактно, т. к. мы доказали его за
мкнутость и ограниченность. Для доказательства инвариантности множества L
+
предположим, что у Ε L+
и 0(£; ?/) — решение (4.1), проходящее через у в момент
t = 0, т.е. ф(0;у) = у. Покажем, что ф(^у) Е L+
, \/t £ R. Существует последо
вательность {U}, U —> оо при г —• оо, такая что x(ti) —> у при г -^ оо. Запишем
х(£г) = 0(^г5 яо)> где хо — начальное состояние для решения x(t) в момент t = 0.
Из единственности решения следует, что
0(t + i»; ж0) = <£(*; Ф(и\хо)) = ф{Ь\ x(U)),
3
См. [10].
C.4 . ДОКАЗАТЕЛЬСТВО ЛЕММЫ 4.3
713
где при достаточно большом г выполнено t + U ^ 0. Из непрерывности следует,
что выполнено равенство
lim <f>(t + tnxo) = lim ф{Ь;х{и)) = <t>(t\y),
г—>оо
г—>оо
которое показывает, что ф(Ь; у) G L+
.
Наконец, для того чтобы показать, что x(t) —> L
+
при t —> оо, используем
рассуждение от противного. Предположим, что это неверно. Тогда существует
ε > 0 и последовательность {^}, U—> оо при г—» оо, такая что dist(x(^), Ь
+
)> ε.
Поскольку последовательность х(^) ограничена, она содержит сходящуюся под
последовательность Χ(η) —> х* при г —* оо. Точка х* должна принадлежать L
4
"
и в то же время должна находиться на расстоянии ε от L
+
, что невозможно.
С.4. Доказательство леммы 4.3
Определим ip(s) равенством
ip(s)= inf V(x) при0^s^г.
*<||ж||<г
Функция ^() является непрерывной, положительно определенной и возрастаю
щей. Более того, V(x) ^ V>(IMI) при 0 ^ ||х|| ^ г. Однако ψ(·) не обязательно яв
ляется строго возрастающей. Пусть a±(s) — /С-функция, такая что ai(s) < Ar0(s)
при0<к<1.Тогда
У(ж) ^ V(INI) > ai(||x||) при ||х|| < г.
С другой стороны, определим 0(s) равенством
φ(δ)= supV(ж)при0^s^г.
\\х\\^а
Функция ф(·) является непрерывной, положительно определенной и возраста
ющей (не обязательно строго возрастающей). Более того, V(x) < <КН#||) при
||х|| < г. Пусть d2(s) — /С -функция, такая что c*2(s) ^ кф(з) при Λ > 1. Тогда
V(x) < </>(NI) < а2(||ж||) при ||х|| < г.
ЕслиD=R
n
Ъ V(x) радиально неограниченна, определения для ip(s) и ф(з)
изменяются на следующие:
ψ(δ)= inf V(x), ф(з)= supV(x) приs>0.
Функции ^ и 0 являются непрерывными, положительно определенными, возрас
тающими, и
гР(\\х\\) < V(x) < 0(||х||), Vx € Дп
.
Функции ai и с*2 могут быть выбраны так же, как это было сделано ранее. По
скольку V(x) является радиально неограниченной, 4p(s) и </>(s) стремятся к бес
конечности при s —> оо. Следовательно, мы можем выбрать функции ai и с*2 из
класса /CQO·
714
ПРИЛОЖЕНИЕ С
С.5. Доказательство леммы 4.4
Поскольку α(·) является локально липшицевой, уравнение имеет единствен
ное решение для любого начального состояния уо ^ 0. Вследствие того что
y{i) < 0 при y(t) > 0, решение обладает свойством y(t) ^ уо Для всех t ^ to.
Поэтому это решение ограничено и может быть продолжено для всех t ^ to.
Интегрируя, получаем
_
fy
_ dx_=
fdT
Jyo Φ) Jto
Пусть b — положительное число, такое что b < а. Определим
Jb ос(х)
Функция 77(у) является строго убывающей и дифференцируемой на (0,а). Более
того, limy_>o г](у) = оо. Существование этого предела следует из двух фактов.
Во-первых, решение дифференциального уравнения y(t) —• 0 при t —> оо, т.к.
y(t) < 0 при y(t) > 0. Во-вторых, предел y(t) —> 0 достигается лишь асимпто
тически при t —> оо, т. к. в конечный момент времени это не может произойти
вследствие единственности решения. Пусть с = — limy^a η (у) (в качестве с мо
жет выступать оо). Область значений функции η равна (—с, оо). Поскольку η —
строго убывающая, ее обратная η~λ
определена на (—с, оо). Для любого уо > 0
решение y(t) удовлетворяет
V(y(t)) ~ Vivo) = * — по
следовательно,
y(t) = r)~
1
(v(yo) + t-t0).
С другой стороны, если уо = 0, то y(t) = 0, т. к. у = 0 — точка равновесия.
Определим функцию a(r, s) равенством
0,
г=0.
Тогда y(t) = a(yo,t — to) для всех t ^ to и уо ^ 0. Функция σ является непре
рывной, т.к. и ?7 и η~
1
являются непрерывными в своих областях определения
η 1(х) = 0. Эта функция является также строго возрастающей по г
для каждого фиксированного s, т. к.
9г
а(г)
и строго убывающей по s для каждого фиксированного г, т. к.
—a(r,s) = -a(a(r,s)) < 0.
Кроме того, a(r, s) —• 0 при 5 —> оо. Таким образом, σ принадлежит классу
/С£-функций.
<т(г, s)
-
C.6. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 4.5
715
С.6. Доказательство леммы 4.5
Равномерная устойчивость. Предположим, что существует /С-функция а,
такая что
||ar(i)|| < a(||x(io)||), Vt > io > О,V||яг(*0)|| < с
Для любой ε > О положим <5 = min{c,a
_1
(e)}. Тогда при ||ж(*о)|| < δ получаем
||*(«)|| < a(\\x(to)\\) < α(δ) < «(a"») = ε.
Далее, предположим, что для определенной ε > 0 существует δ = δ (ε) > О, такая
что
||ж(*о)|| <<*=И|я(*)|| <ε, Vi^i0·
При фиксированной ε обозначим через δ (ε) супремум по всем возможным δ(ε).
Функция ~δ(ε) является положительной и неубывающей, но не обязательно непре
рывной. Выберем некоторую /С-функцию С(г), такую что £(г) < kS(r) при
О<к<1.Пустьа(г) =С
_1
(г)· Тогда а(г) принадлежит классу /С. Пусть с =
= linv-xxj^r). Для определенного ж(*о)> Н#(^о)|| < с, положим ε = а(||ж(£о)||).
Тогда ||ж(*о)|| < δ (ε) и
||x(i)||<e = ^11^)11).
(С.7)
Равномерная асимптотическая устойчивость. Предположим, что суще
ствует КХ-функция /?(г,«), такая что выполнено (4.20). Тогда справедливо нера-
венство
||Ζ(*)|Κ/?(||*(*0)||,0),
из которого следует, что х = 0 равномерно устойчиво. Более того, при ||ж(£о)||<
с
решение удовлетворяет
\\x(t)\\^p(c,t-t0).
Из этого неравенства следует, что x(t) —> 0 при t —» оо равномерно по io· Пред
положим, что х = 0 равномерно устойчиво и х(£) —> 0 при t —> оо равномер
но по io; покажем, что существует /С£-функция /3(r, s), для которой выполне
но (4.20). Вследствие равномерной устойчивости существует константа с > 0
и /С-функция а, такие что для любой г Ε (0, с] решение x(t) удовлетворяет
||s(t)|| < a(\\x(to)\\) < a(r), Vi > io,V||*(to)|| < г.
(С.8)
Более того, для определенной 77 > 0 существует момент времени Τ — Τ(η, г) ^ 0
(зависящий от ?7 и г, но не зависящий от to), такой что
||х(*)|| <η, Vt>t0 + T(r),r).
Пусть Г(г7, г) — инфимум по всем возможным Τ (η, г). Функция Τ (η, г) является
неотрицательной и невозрастающей по η, неубывающей по г и Τ(η, г) = 0 для
всех η ^ α (г). Пусть
W
M = | fT{s,r)ds
+fp Tfo.r)+J.
Функция Wr (77) является положительной и обладает свойствами:
716
ПРИЛОЖЕНИЕ С
• для каждой фиксированной г функция Wrfy) является непрерывной, строго
убывающей и Wrfy) —> 0 при η —> оо;
• для каждой фиксированной η функция Wr(rj) является строго возрастающей
по г.
Положим Uг = W~
l
, Тогда Ur также обладает вышеприведенными свойствами
для Wr и, кроме того, T(Ur(s),r) < Wr(Ur(s)) = s. Поэтому
\\x(t)\\ ^Ur(t-to), Vt^t0y\\x{t0\\ <r.
(C.9)
С использованием (С.8) и (С.9) заключаем, что
||х(*)|| < y/<*(\\x(to)\\)Uc(t-to), Vi > t0y\\x(t0)\\ < с.
Таким образом, неравенство (4.20) выполнено при /3(r, s) = y/a(r)Uc(s).
Глобальная равномерная асимптотическая устойчивость. Если (4.20)
выполнено для всех x(to) Ε Rn
, то, как и в предыдущем случае, можно по
казать, что начало координат глобально равномерно асимптотически устойчиво.
Для доказательства обратного утверждения заметим, что в рассматриваемом слу
чае функция δ(ε) обладает дополнительным свойством: δ(ε) —• оо при ε —> оо.
Следовательно, можно выбрать /С-функцию а так, чтобы она принадлежала клас
су /Соо и для всех x(to) £ Rn было выполнено неравенство (С.7). Более того,
неравенство (С.9) выполнено для любой г > 0. Пусть
ф(г, s) = min < a(r), inf Up(s)
I
pe(r, oo)
Тогда
||x(t)|| ^ip(\\x(t0)lt-t0),
Vt^t0,\/x(t0)eR
n
.
Если бы функция ф принадлежала классу /СС, доказательство было бы заверше
но. Однако в общем случае это условие не выполнено, и поэтому мы должны
определить функцию
которая является положительной и обладает следующими свойствами:
• для любой фиксированной s ^ 0 функция (j)(r,s) является непрерывной
и строго возрастающей по г;
• для любой фиксированной г ^ 0 функция 0(r, s) является строго убываю
щейпо5истремитсякнулюприs—уоо;
•
С.7. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 4.16
717
Тогда
ИО||<0(||ж(«о)1М-*о), Vt^to^x(t0)eR
n
.
(С.10)
Из (С. 10) и глобальной версии неравенства (С.7) получаем
||a(t)|| ^ ^(Mto)\m\\x(to)\\,t-t0),
Vt ^ i0,Vz(io) G Дп
.
Таким образом, неравенство (4.20) выполнено глобально при /?(r,s) =
=
у/а(г)ф(г,з).
С.7. Доказательство теоремы 4.16
Нахождение функции Ляпунова выполняется с использованием леммы Мас-
сера [125]. Начнем с ее формулировки и доказательства.
Лемма С.1. Пусть д : [0, оо) —> R — положительная, непрерывная, строго
убывающая функция, такая что g(i)—>0 при t—>оо. Пусть h: [0,оо) —> R —
положительная, непрерывная, неубывающая функция. Тогда существует функ
ция G(t), такая что
• G(i) и ее производная G'(t) принадлежат классу /С и определены для всех
• Для любой непрерывной функции u(t), удовлетворяющей неравенству 0 ^
^ u(t) < g(t) для всех t ^ 0, существуют положительные константы к\
и &2, не зависящие от и, такие что
роо
роо
/ G{u{t))dt < кг; / G'(u{t))h(t)dt ^ к2.
Jo
Jo
ДОКАЗАТЕЛЬСТВО ЛЕММЫ С.1. Поскольку фикция g(t) является строго
убывающей, можно найти последовательность £п, такую что
Л)^,
п=1,2,....
Эта последовательность используется для определения функции ry(i):
(a) ηψη) = 1/п.
(b) Между tn и in+i функция r/(i) линейна.
(c) На интервале 0 < t ^ ti, ?7(i) = (ti/t)
p
,
где ρ — достаточно большое
положительное целое число, такое что производная т/(£) имеет положительный
скачок в t\, т. е. //(ijf) < rf(tf).
Функция η{{) является строго убывающей и при t^ t\ выполнено g(t)< ry(i).
Приt—» О
4
" функция r/(i) неограниченно возрастает. Обратная функция для ?7(t),
обозначаемая через 77
-1
(s), является строго убывающей функцией, неограничен
но возрастающей при s —> 0
+
. Очевидно,
718
ПРИЛОЖЕНИЕ С
для любой неотрицательной функции u(t) ^ g(t). Определим
h(r]
1
(s))
Поскольку η~
1
является непрерывной и h — положительной, H(s) является
непрерывнойна0<s<ооиη~
1
(β)—•ооприs—>0
+
.
Следовательно, H(s)
является /С-функцией на [0, оо). Тогда интеграл
G(r) = / H(s)ds
Jo
существует, функции G(r) и С (г) = Η (г) принадлежат классу /С и определены
на [0, оо). Пусть u(t) — непрерывная неотрицательная функция, такая что u(t) ^
^ g(t). Имеем
G>(i)) = «р[-^(«Щ £
vw;
Мт
1
^*))) Μ*)
Таким образом,
/ G'(u(t))h(t)dt < /
XL
/•00
/»ii
/ G'(u(t))h{t)dt^ / G'(g(t))h(t)dt + l^k2.
Jo
Jo
Из этого неравенства следует, что второй интеграл в формулировке леммы огра
ничен. В отношении первого интеграла имеем
Jti
Лх Л) Λ(η Ч5))
При 0 ^ s ^ ry(i) получаем
-Ч
_1
(в) < -*·
Следовательно,
Г**) expl-r?"
1
^)],^T
(t)
е-* ,
е"*
,^
е-*
У„
мо)
ds
<У0 щ
а8
= щ^^
КО)
при t^t\. Тогда
/»оо
/»ii
/»оо
_^
/ G(u(t))dt < / G(ff(i))cft + / f-rdt
< fci.
Jo
Jo
Jti
h
W
Поэтому первый интеграл в формулировке леммы ограничен. Доказательство
леммы закончено.
Π
C.7 . ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 4.16
719
Для доказательства теоремы положим
/
оо
G(U(T;t,x)\\2)dT,
где </>(т;£,#) — решение, начинающееся в (£, х), и G — некоторая /С-функция,
которая должна выбираться с использованием леммы СЛ. Для этого получим
оценку сверху для
1=Г
с
'
(||
*>ж^
т
·
В доказательстве теоремы 4.14 мы видели, что из предположения ||5//<9х||2 ^ L,
выполняющегося равномерно по t, следует, что ||0ж(т;^х)||2 ^ exp[L(r — t)].
Поэтому
Щ
дх
^
€
^
/
оо
G'(U(T;t,x)\\2)eML(r-t)}d
/
ОО
G'(^(||x||2,T-i))exp[L(r-i)]d·
/*оо
/ G,(/?(lkll2,5))exp(L5)d5.
Рассматривая функции /3(ro, s) и exp(Ls) в качестве функций g и h из леммы СЛ,
получаем функцию G, принадлежащую классу /С и удовлетворяющую лемме.
Следовательно, интеграл
роо
J0
def
С(No||2, ^)) exp(Le)<fc « α4(||*||2)
ограничен для всех ||ж||2 ^ г*о равномерно по х. Более того, он представляет
собой непрерывную и строго возрастающую функцию от ||х||2, т.к. /?(||x||2,s)
является /С-функцией по ||ж||2 для любой фиксированной s. Таким образом, щ
принадлежит классу /С, что доказывает последнее неравенство в утверждении
теоремы. Далее, рассмотрим
/
оо
G(U(r;t,x)\\2)dT ^
< f°G(/J(||s||2,T-t))dr= /°°σ(/3(||Χ||2|β))ω^α2(||Χ||2).
Из леммы С Л следует, что последний интеграл ограничен для всех \\х\\2 ^ ^о·
Функция Q.2 принадлежит классу /С. В доказательстве теоремы 4.14 мы видели,
что из предположения \\df/dx\\2 ^ L, выполняющегося равномерно по t, следу
ет, что ||0(τ;£,#)||2 ^ ЦжЦг ехр[—L(r — t)]. Поэтому
/
ОО
/OO
GiWxhe-W -^dT = J G(\\x\\2e~
Ls
)dS >
f(ln2)/L
>J
G{\\xb)ds ψθφ\Χ\\2)^
ai(\\xh).
720
ПРИЛОЖЕНИЕ С
Очевидно, ai(||#||2) принадлежит классу /С. Следовательно, V удовлетворяет
неравенству
<*i(\\xh)<V(t,x)^a2(\\xh)
для всех ||ж||2 ^ го. Наконец, производная V вдоль траекторий системы имеет
вид
% + %f{t,x)
= -G{\\x\\2) +
+ / ^{\\ф\\2)^-[фг{т-Хх)
+ фх(т^х)/(^х)}ат.
Jt
\\Ф\\2
Поскольку
получаем
&(т;*,ж) + фх(т]Ь,х)/(Ь,х) Ξ0, Vr^ t,
f + f/(M) = -G(No)·
Следовательно, три неравенства в утверждении теоремы выполнены для всех
II#||2 ^ 7*0· Заметим, что вследствие эквивалентности норм можно использовать
аналогичные неравенства для любой из р-норм. Если система является автоном
ной, решение зависит только от г — £, т. е. ф(т] £, х) = ψ(τ — t\ x). Поэтому
/
оо
/»оо
G(U{T-t;x)\\2)dT = J
G{U{s;x)h)ds,
т.е.Vнезависитотt.
С.8. Доказательство теоремы 4.17
Для любого решения x(t) уравнения
х = f{x), x{0) =x0e RA,
(СП)
в результате замены переменной времени t на г = /0(1 + ||/(a:(s))||)ds система
принимает следующий вид:
Тт = ттш\\
тШшт=щ
'
(СЛ2)
где х(т) = x(t), т. е. переменная t выражена через т. Начало координат является
асимптотически устойчивой точкой равновесия системы (С. 12) и RA — ее область
притяжения. Если V(x) — функция Ляпунова для (С. 12), удовлетворяющая
^7(х) ^ -W{x)
C.8 . ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 4.17
721
для некоторой положительно определенной функции W(x), то
|£/(z) = (1 + \\f(x)\\)^J(x)
< -(1 + \\f(x)\\)W(x) < -W(x),
т.к. 1 + ||/(х)|| ^ 1. Поэтому достаточно построить функцию Ляпунова
для (С.12). Анализ (С.12) — более простая задача, т.к. из свойства ||/|| ^ 1 сле
дует, что эта система не уходит на бесконечность за конечное время при t < 0.
В оставшейся части доказательства мы будем исследовать систему (С.12), кото
рую перепишем в следующей форме:
х = /(*),
(С13)
т. е. опустив надчеркивание вжи используя х для обозначения производной по т.
Из леммы 8.1 известно, что RA является открытым множеством. При RA φ
ΦRn
обозначим через F дополнение RA В Rn
.
Для любой х £ RA определим
JlMI,;
ш(х)=max{\\x\lΔ9 / ^ч - Δ,
'
.
},
(С.14)
ν/
ли
lh
dist(x,F) dist(0,F)J'
V
;
еслиRAφДп
, ии(х) =\\x\\9еслиRA=R
n
.
Легко показать, что и(х) явля
ется положительно определенной и локально лишицевой функцией. Поскольку
dist(:r, F) —> 0 при х, стремящемся к 8RA> то выполнено и(х) —> оо при х,
стремящемся к <9Дд. Более того, при го = (l/2)dist(0, F) имеем
mf{\\x-y\\} > inf{|M| - \\х\\} > inf{|M| -r0}, V\\x\\^r0.
yeF
yeF
yeF
Следовательно,
dist(x,F) ^ dist(0,F) - ±dist(0,F) = ±dist(0,F), V||x|| ^ r0.
Поэтому ш(х) — \\x\\ для всех ||х|| ^ r$.
Лемма С.2. Решение системы (С. 13) удовлетворяет неравенству
u>(x(t)) ^ 0(u>(x(Q)),t), V* ^ 0,Vx(0) е RA,
(С.15)
где /3(r, s) — КС-функция, определенная для всех г ^ 0, 5 ^ 0, такая что
/?(г, 0) — Коо-функция.
ДОКАЗАТЕЛЬСТВО ЛЕММЫ С.2. Покажем, что для любой константы г>0
существует константа Ъ = b(r) > 0, такая что решение системы (С. 13)
с о;(ж(0)) ^ г удовлетворяет oj(x(t)) ^ b для всех t ^ 0. Предположим, что это
не выполнено. Тогда существует последовательность решений x^\t) системы
(С. 13) и константы U, такие что ш(х^
г
\0)) ^ г, г=1,2,3,... иu;(xW(^)>г,г =
= 1,2,3, — Пусть Т* — супремум всех Τ > 0, таких что функции х^(£), г =
= 1,2,3,... являются конечными для всех t G [0, Τ], т. е.
Т* = sup{r ^ 0|lim sup{ max {u>(x®(t))} < оо}.
(С.16)
г—юо O^t^T
722
ПРИЛОЖЕНИЕ С
Рассмотрим случаи Т* < оо и Г* = оо по отдельности. При Т* < оо пред
положим, что Ti — последовательность положительных констант, такая что для
любого г ^ 1 решение системы (С. 13) удовлетворяет неравенству
ш(х(0))^г=»u(x(t)) <г+1,V0^t<2т*.
(С.17)
Эта последовательность не пуста вследствие непрерывности x(t). Всегда можно
выбрать Ti,такие чтоТ* >TI> т<2 >··· иИт^-юоτ* = 0.Пусть x^
lil
\t) — по
следовательность всех функций x^\t),
таких что и(х^(Т* — TI)) > 1. Функции
х(
1,г
)(£) образуют бесконечную последовательность. Для того чтобы убедиться
в этом факте, предположим, что 1\ — множество индексов г, таких что x^\t) не
принадлежит последовательности x^
l
\t). Из выбора т\ следует, что
u>(x®(t))<2приТ*- η ^t<Г*+тьУгеI.
(C.18)
Если в последовательности х(
1,г
)(£) имеется лишь конечное число функций
xW(£), то из (С. 18) следует, что
lim sup { max
{w(aW(t))}}<oo,
(C.19)
г->оо 0<t^T*+ri
но это противоречит определению Т* (С. 16). Таким образом, последовательность
x^^(t) является бесконечной. Пусть x^
2,l
\t) — последовательность всех функ
ций х(
1,г
)(£), таких что и>(х(
1,г
\Т* — тг)) > 2. Можно повторить представленные
выше рассуждения и показать, что последовательность x^
2,t
\t) также является
бесконечной. Продолжая эту процедуру, можно увеличивать семейство подпосле
довательностей до тех пор, пока не будет получена последовательность
x^\t),
такая что
а;(х«(Т* - ri)) > j, V j = 1,2,3,..., Vi = 1,2,3,....
(C.20)
Поскольку ||xW(0)|| ^ ы(х^(0)) < г и ||/(x)|| ^ 1, решения xW(i) принадле
жат компактному множеству {||x|J ^ r + T} для любого 0 < Τ < Τ*. Таким
образом, последовательность u(x^\t)) ограничена на интервале t e [0,Т] рав
номерно по г. Из последовательности xW (t) можно выделить подпоследователь
ность х^(£), которая равномерно сходится на интервале [0,Т], 0 < Τ < Τ*,
к решению x(i)9 определенному при t G [0,Т*). Из (С.20) и с учетом того, что
lim^ooTz = 0, можно заключить, что \imt^T* ш(х(Ь)) = оо. Аналогично при
Т* = оо решение х^(£) принадлежит компактному множеству {||х|| ^
г
+^} Для
любого Τ > 0. Следовательно, можно выделить подпоследовательность xW(t),
которая равномерно сходится на интервале [0,Т] к решению x(t), определенно
му при t G [0, оо) и ΠπΙ^οοΟ^Χ^)) = оо. Таким образом, мы показали, что
существует константа Т*, 0 < Т* ^ оо, и решение x(t), такие что ш(х(0)) < г
и пт£_>т* u;(x(t)) = оо. Однако это невозможно, т.к. х(0) G Дд. Поэтому можно
заключить, что для любой г > О существует 6 = 6(г) > 0, такая что решение
системы (С. 13) при u;(x(0)) ^ r удовлетворяет неравенству <j(x(t)) < b для всех
C.8 . ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 4.17
723
t ^ 0. В качестве b(r) может быть выбрана некоторая возрастающая функция
от г, которая, вследствие устойчивости начала координат, обладает свойством
b(r)—• 0приг—•0.Болеетого,b(r)—>ооприг—» оо,т.к.b(r)^ г.Можно
найти /CQO-функцию а(г), такую что b(r) ^ а(г) для всех г ^ 0. Таким образом,
решение системы (С. 13) удовлетворяет неравенству
u)(x(t)) ^ а(ш(х(0)))7 Vt > 0,Va;(0) G ДА.
(C.21)
С другой стороны, для любых положительных констант г и η можно показать,
что существует момент Τ = Τ(η, г) > 0, такой что
ш(х(0)) <r=> u(x(t)) <v,Vt^ Т.
(C.22)
Действительно, если бы это утверждение было неверным, то тогда существо
вала бы последовательность решений x^\t) системы (С. 13) и констант т*, для
которых выполнялись бы следующие условия:
lim τ{ = оо, и{х®(0)) $ξ г и u>(x®(Ti)) ^ η.
г—юо
Однако из (С.21) видно, что для любой положительной константы δ < α~Χ(η)
каждое решение системы (С.13) при ш(х(т)) ^ δ удовлетворяет tj(x(t)) < η
для всех t ^ т. Следовательно, ш(х^{Ь)) ^ δ при 0 < t ^ Т{. Поскольку
ш(х(
ъ
\ь)) ^ а(г) для всех t ^ 0, из последовательности #W(t) можно выбрать
подпоследовательность x^\t), которая равномерно сходится на каждом интер
вале [0, Т] при 0 < Τ < оо. Функция x(t) — lim^oo x^(t) является решением
системы (С.13), для которого выполнено неравенство ш(х{Ь)) ^ δ для всех t ^ 0.
Однако это невозможно, т.к. х(0) Ε RA- Таким образом, Τ(η,τ) существует. По
вторяя рассуждения, которые были сделаны при доказательстве леммы 4.5 (для
случая глобальной равномерной асимптотической устойчивости), можно, исполь
зуя (С.21) и (С.22), показать, что существует /С£-функция /3(r, s), /3(r, 0) ^ а(г),
такая что выполнено (С. 15).
Π
Пусть ф(Ь;х) — решение системы (С.13), начинающееся вхв момент вре
мени t = 0. Поскольку величина ||/(ж)|| ограничена, <j>(t\x) определено для всех
t < 0. Более того, поскольку множество RA является инвариантным (по лем
ме 8.1), </>(t;x) Ε RA ДЛЯ всех t < 0. Определим функцию д : RA —» R равен
ством
д(х) = Ы{шNo;х))}.
(С.23)
По определению
д(ф(*,х)) < д(х), Vi ^ 0,Vx Е Дл,
(C.24)
a~
l
(uj(x)) ^ #(ж) ^ о;(ж), Vx Ε Дд.
(С.25)
Первое неравенство в (С.25) справедливо, т.к. из (С.21) следует, что и(х) ^
^ а(и(ф(Ь;х))), Vt ^ 0. Покажем, что функция #(ж) является локально липши-
цевой при х Ε RA,X Φ 0. Это эквивалентно тому, что функция д(х) является
724
ПРИЛОЖЕНИЕ С
липшицевой на компактном множестве Η = {х Ε RA\CI ^ ш{х) ^ сг}, где
С2> с\> 0. Из неравенства (С. 15) следует, что
с\ ^ш(х) ^P(u(<l>(t;x)),-t), V* <0,\/яЕЯ.
Пусть Т\ удовлетворяет /3(2с2, Т\) = ci. Тогда для всех t < —Т\ выполнено
Р(2с2,Т1) = а < /3(o;(0(i;x)),-t) < ^(^х)),^).
Следовательно,
o;((/>(i;x)) ^ 2с2 ^ 2и>(я) ^ 2$(ж), Vi < -TbVx Ε Я.
Из этих неравенств видно, что для всех х Ε Η инфимум, фигурирующий в опре
делении д(х)9 достигается на интервале [—Ti,0]. С учетом того что функция
ф(Р,х) является липшицевой по х на Η для любого компактного интервала вре
мени (см. теорему 3.4), а также из того факта, что функция ω является локально
липшицевой на Дд, следует, что функция д(х) является липшицевой на Н. За
метим, что это рассуждение перестает быть верным при с\ = 0, и поэтому мы не
можем показать, что функция д(х) является локально липшицевой в окрестности
точки х = 0. Однако д(х) непрерывна для всех х Ε RA, Т. К. д(0) = 0, д(х) ^ ш(х)
(см. (С.25)) и вследствие того, что функция и>(х) является непрерывной.
Определим функцию V : RA —> R равенством
V(x) = sup |^(i;a;))i±||.
(С.26)
Используя (С.24) и (С.25), можно показать, что
a^iuix)) < д(х) < У(х) ^ 2д(х) < 2CJ(X).
(C.27)
Докажем, что функция V(x) является локально липшицевой при х Ε RA,% φ 0,
показав, что V(x) является липшицевой на Η = {х Ε -RAI^I ^ и)(х) ^ сг} при
0 < с\ < С2. Используя (С. 15) и (С.25), получаем для всех х Ε Η
0(0(*;*О)уйг ^
2ω
^
Χ^
<
2
NoШ) < 2/3(o2,t).
Пусть Т2 > 0 удовлетворяет равенству 4/?(с2,Т2) = a
_1
(ci). Тогда для всех
t^T2:
Таким образом, супремум в определении V"(x) достигается на интервале [0,Т2].
Повторив анализ, который был проведен в отношении функции д(х)9 можно по
казать, что V(x) является липшицевой на Н. Поскольку V(0) = 0, из (С.27)
следует, что V(x) является непрерывной для всех х Ε RA- Далее, покажем, что
C.8 . ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 4.17
725
V{x{t)) является убывающей вдоль решения системы (С. 13). Т.к. V(x) являет
ся лишь локально липшицевой, ее производная вдоль решения системы (С. 13)
может быть вычислена по формуле
У(х) = Нт sup
±-[У(ф(Ъх))-У{х)].
h—o+ ">
(C.28)
При x φ О выберем г > ш(х). С учетом свойств /С£-функций можно найти
функцию 7г(р), определенную при 0<р<ооиО<г<оо, такую что для
каждой фиксированной г она является непрерывной и убывающей по р, а для
каждой фиксированной ρ — возрастающей по г, причем выполнено неравенство
4/?(г,7г(р)) ^
а
~
1
(р/%) Для
всех
0 < ρ < оо. Пусть ho таково, что u(</>(t;x)) ^
^ (1/2)и(х) для всех t G [0, ho]. Выберем h Ε [0, ho]. Тогда
V(<j>(h; х)) = sup {g{4>(t; <f>(h; *)))\±f } - sup {fl(#t + Λ; *))γ^ } ·
Используя неравенства
14-9t
д(Ф(г + h\s))y!fj < M<K* +
ft
;x)) <
2
/5Ия),* + Λ) <
2
/^* +
fe
)>
можно показать, что для всех t + h ^ jr(u)(x)) выполнено
дт + Ъх))\±^-
< \а-\\и{х))
< Ια^Μ^*))) < \v(<^h;x)).
Следовательно, супремум в определении V(</>(h;x)) достигается в момент вре
мени £', удовлетворяющий условию t' + h ^ ητ{ω(Χ)). Поэтому
V(<t>(h; x)) = д{ф{1' + h; x))^j-
=
= дNo+Ъх))
^V(x) 1-
+*+,
h
h
(1 + 2t'+ 2h)(l +1')
€
Полагая
2[1 + 7г(Цх)]2
_
Vr(s) =
2[l + lr(s)?
при s > 0 и ητ(0) = 0, можно показать, что функция ηΓ(δ) принадлежит классу
/CQO И
Ъ(х) < -Ι?τ(ω(«)).
726
ПРИЛОЖЕНИЕ С
Посколььсу предыдущее неравенство выполнено для всех г > UJ{X)9 ОНО также
выполнено и при rj(s) = supr>s77r(s), т.е. V(x) ^ — Щ{и{х)) для всех х Φ 0.
Определим
г2в+1
η(β)= /
r)r(s)dr
J2s
при 5 > 0 и ?7(0) = 0. Функция ry(s) является непрерывной и положительно
определенной на [0, оо) и 77(5) < ?7(s). Следовательно,
V(x) < -η(α;(α)), Vx eRA,x^
0.
(C.29)
Функция V"(x) удовлетворяет всем условиям теоремы 4.17, в том числе требо
ванию гладкости этой функции, которое может быть доказано с использованием
следующих двух лемм, которые приведены здесь без доказательства.
Лемма С.З. Пусть D — открытое подмножество R
n
,
и предположим,
что существуют локально липшицевы функции Φ : D —> R, g : D —> R
n
и непре
рывная функция ψ : D —• R, такие что производная Ф(х) вдоль траекторий
системы х = д(х) удовлетворяет Ф(х) ^ ф(х) для всех х G D. Тогда для любых
непрерывных функций μ : D —• (0, оо) и ν : D —• (0, оо) существует гладкая
функция Φ :D —> R, такая что \Ф(х) —Ф(ж)| ^ /х(#) иФ(#) ^ ^(ж) + ^(х) для
всеххΕD.
ДОКАЗАТЕЛЬСТВО ЛЕММЫ С.З. См. [118, теорема В.1].
Лемма С.4. Пусть D С Rn
—
открытая область, содержащая начало
координат и Φ : D —• [0, оо) — локально липшицева, положительно определенная
функция, такая что Ф{х) является гладкой при х φ 0. Тогда существует /CQQ-
функция σ, являющаяся гладкой на (0, оо), такая что σ^ (г) —• 0 при г —> 0
+
Элл каждого г = 0,1,..., сг'(г) > 0 для всех г > 0, и функция Φ (ж) = а(Ф(х))
является гладкой на D.
ДОКАЗАТЕЛЬСТВО ЛЕММЫ С.4. См. [118, лемма 4.3] (с заменой Rn
на
открытую область D).
Продолжим доказательство. Применим лемму С.З при D = RA~ {0}, Φ (ж) =
=
V(x), g(x) = f(x), ф{х) = -η(ω(Χ)), μ(Χ) = (1/2)а-
1
(о;(х)), и(х) =
= (1/2)η(ω(Χ)) и найдем функцию V{x), являющуюся гладкой на RA — {0}
и удовлетворяющую условиям
ai(u(x)) < V(x) < &2{ω{ρη) и У(х) ^ -α3(ω(α;)),
где ai(r) = (l/2)a
_1
(r) и Й2(г) = Ъг + (1/2)а
-1
(г) — /Соо-функции и аз (г) =
= (1/2)77(7*) является непрерывной и положительно определенной на [0, оо). Да
лее, применим лемму С.4 при D = Д^, Φ = V и найдем /С^-функцию σ, та
кую что V(#) = a(V(x)) является гладкой на RA- Легко показать, что функции
а* (г) = a(ai(r)),i
—
1,2, принадлежат классу /С^, функция
аз(г) = аз(г)
min
σ'(£)
iG[o;i(r),Q2(r)]
C.9 . ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 4.18
727
является непрерывной и положительно определенной на [0, оо), а также выпол
нены неравенства
oti(u>(x)) ^ V(x) ^ а2(и>(х))
и
V(x)=a'{V(x))V. (х) < -a'(V{x))a3(u;(x)) < -аг(и(х)).
Функция V удовлетворяет всем условиям теоремы 4.17. Тот факт, что для любой
с > О множество {V(x) < с} является компактным подмножеством RA, следует
из неравенства {V(x) ^ с} С {ш(х) ^ aj"
1
(c)}.
С.9. Доказательство теоремы 4.18
Эта теорема сводится к теореме 4.9 при μ = 0. Поэтому представленное
здесь доказательство использует некоторые идеи и терминологию, используемые
в доказательстве теоремы 4.9. Пусть ρ = а±(г). Тогда α2{μ) < ρ и а2(||ж(£о)||) ^
^ р. Пусть гу = α2(μ). Определим Ω$>τ/ = {х £ Br|V(i,x) ^ 77} и Ω^ρ = {жЕ
G Br\V(t,x) ^р}. Тогда
Б,,Сik,v С{ai(||x||)< г/}с{аг(\\х\\) ^ р}=Вг СD
и
Ω^)7?с Ω^ρСjBrс D.
Множества Ω^ρ и Ω^ характеризуются тем, что любое решение, начинающееся
в одном из этих множеств, не может покинуть это множество, т. к. производная
V(t, x) отрицательна на его границе. Поскольку
а2(||х(*о)||) < Ρ => x(to) G Ω*0,ρ,
можно заключить, что x(t) G Ω^ρ для всех t > £о- Решение, начинающееся
в Ω^ρ, должно достигнуть Ω^η за конечное время, т. к. в множестве {Ω^ρ ~ Ω*)Τ?}
производная V удовлетворяет неравенству
V(t,x) < -fc<0,
где константа к = mm{W^(x)} вычислена на множестве {μ ^ ||ж|| ^ г}, содер
жащем {Ω^ρ — Ω^η}. Из предыдущего неравенства следует оценка
V(t,x(t)) < V(t0,x(to)) - k(t -t0)<p-
k(t - t0),
которая показывает, что V(t, x(t)) сводится к ту на интервале времени [to, £о + (Р~
—r?)/fc]. Для решения, начинающегося внутри Ω^η, неравенство (4.43) выполнено
для всех t ^ to, т.к. Ω^η С {αα(ΙΜΙ) ^ α2{μ)}· В случае когда решение начина
ется внутри Ω^ρ, но вне Ω^)7?, предположим, что to + Τ — момент времени, когда
решение впервые достигает Ω^η. Для всех t G [to, to + Τ] выполнено
V < -W3(x) < -аз(||ж||) < -a3(a^(V)) ^
-a(V),
728
ПРИЛОЖЕНИЕ С
где аз и а — некоторые /С-функции. Существование аз следует из леммы 4.3.
Аналогично тому, как это было сделано в доказательстве теоремы 4.9, можно
показать, что существует /С£-функция σ, такая что
V(t,x(t)) ^a(V(t0,x(to)),t-t0),
Vte[to,to + T\.
Определив /?(r, s) = a^
1
(a(a2(r), s)), получаем
||x(*)|| <No(Ш*-*>), Vt€[io,*o + r].
ЕслиD=i?n
, функция аз и, следовательно, функция β могут быть выбраны не
зависящими от р. Если ai принадлежит классу /Соо, этому же классу принадле
жит и функция а2 и значение а^"
1
(р) может быть сделано произвольно большим
путем выбора достаточно большой р. Следовательно, любое начальное состояние
x(to) может быть включено в множество {||ж|| ^ а^"
1
(р)}.
С.10. Доказательство теоремы 5.4
Утверждение теоремы 5.4 справедливо, если £2-коэффициент усиления ра
вен β11ρω€# ||G(ja;)||2. Пусть с\ — £2-коэффициент усиления и С2 =
su
Pu;e# H^O'aOlh· Известно, что с\ ^ С2. Предположим, что с\ < С2, и пусть
ε = (с2 — ci)/3. Тогда для любого и е £2? |М|£2 ^ Ъ получаем \\у\\с2 ^
с
2—
— 3ε. Мы придем к противоречию, если построим сигнал iz, ||u||£2 ^ 1, такой что
||у||£2 ^ С2—2ε. Нахождение такого сигнала упрощается, если мы определим сиг
налы на всей вещественной оси R. При этом мы не умаляем общности, т. к. (см.
упражнение 5.19) £2~коэффициент усиления остается неизменным вне зависимо
сти от того, определены ли сигналы на [0, оо) или на R. Выберем a>o £ R, такую
что ||G(ja;o)||2 ^ С2 — ε. Пусть ν Ε Ст
—
нормированный собственный вектор
{υ*ν = 1), соответствующий максимальному собственному значению эрмитовой
матрицы <^(-ju;o)G(ju;o). Следовательно, V*G
T
(-JUO)G(JLO0)V = \\G(JUQ)\\1.
Запишем ν в виде
ν = [aie^\a2e^
2
,... ,ame^TM]
T
,
где константа a* £ R такова, что 0* 6 (—π,0]. Выберем константы 0 ^ β{ ^ сю
так, что вг = —2tg-1
(a;o/A) и β% — °°,
если
#г = 0. Определим (га х 1)-
передаточную функцию H(s):
H(s)
β\ -8
P2~S
βτη-s]
ai-τ — —,a2~5—•—,
...,am-— •—
βλ+S /32+5
/3m+5,
где (/?i — s)/(A + s) заменяется на 1, если ^ = 0. Можно показать, что H(joj$) —
= υиH
T
(—juj)H(juj) = Σ^! af = υ*ν = 1 для всех ω e R. Рассмотрим ua(t)
как выход H(s), входом которой является скалярная функция
*<*>
=
(1+е^) (£)V46-
'
2/σcos(a,oi)
'
σ>°' *
Gβ
·
СП. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 6.1
729
Можно показать, что Ζσ G £2 и ||^σ||/:2 = I.
4
Следовательно, ησ е C<i и ||гга||£2 < 1.
Преобразование Фурье для za(t) имеет вид
ад*)
=(
Ц—|(^
V4
Ге-(—о)
2
- /4 + β-(ω+^)»σ/4] ^
\1+e-^o
0
"/
2
у Vz)
L
J
Пусть 2/σ (i) — выход G(s)9 если в качестве входа используется ua(i). Преоб
разование Фурье для ya(t) определяется равенством Υσ^ω) = G(ju>)Ua(juj) =
= G(ju)H(ju))Za(j(jij). По теореме Парсеваля:
1 Ζ*00
\Ш\с2 = ^] ΖΖ{-3ω)Ητ(-3ω)βτ{-3ω)β{3ω)Η{]ω)Ζσ{3ω)<1ω =
=±J
^Ητ{-3ω)Οτ{-3ω)0{]ω)Η{3ω)\Ζσ{3ω)\2αω.
Используя
/ \1/2
1ЗДо;)|2 5* Ч^Т ( ^ ) И"""°
)V/2
+ е"(—о)
2
-/2 Hf ^H,
1+e
-a
W2V^/
L
J
получаем
1Ы||2 ^ ^/°°
&(4")&(4ω)ανω)Η{1ω)ψσ{ω)αω.
Полагая σ —> оо, можно сконцентрировать спектр частот ψσ(ω) вблизи частот
ω = ±и>о.
5
Следовательно, правая часть предыдущего неравенства стремится
приσ—>оок
HT(-jw0)GT(-joj0)G(ju;o)H(jiJo)
= ||G(ia;o)||i ^ (с2 -ε)2
.
Поэтому можно выбрать конечную константу σ достаточно большой, так чтобы
Ι|2/σ||£2 ^
с
2 — 2ε. Однако это противоречит неравенству ||2/σ||/:2 ^ c<i — 3ε. Из
этого противоречия следует, что с\ — c<i.
СП. Доказательство леммы 6.1
Достаточность. Поскольку G(s) является гурвицевой, существуют положи
тельные константы δ и μ* такие, что вещественные части полюсов всех эле
ментов G(s — μ) меньше —δ для всех μ < μ*. Для того чтобы показать, что
G(s) является строго положительно вещественной, достаточно доказать для всех
4
3десь в качестве £2-нормы используется \\z\\
2
C2=/^ z
T
(t)z(t)dt.
5
ψσ{ω) стремится к π[δ(ω — ωο) + δ(ω + ωο)] при σ —• оо, где δ(·)
—
дельта-функция.
730
ПРИЛОЖЕНИЕ С
ω G R положительную полуопределенность G(JUJ — μ) + G
T
(—ju> — μ). Пусть
{А, Б, G, D} — минимальная реализация для G(s). Тогда
G(s-μ)-D+G(s/-μ/-A)-1
J3=
= £>+C(s/-Ay^sl -A)(sl-μ/-Α)-λΒ=
= D+C(sl-Α)~
1
(μΙ+5/-μΙ
-
A){si-μ/-А)'
1
В=
= β(8)+μΝ(8),
(C.30)
где
N(s) =C(sl - A)-\sI - μ/- A)~
l
B.
Поскольку А и (А + μ/) — гурвицевы матрицы равномерно по μ, то существует
&о > 0, такая что
σ^Ν^ω) + N
T
(-ju)} <fc0,Vu; G Д.
(С.31)
Более того, существует Μτηω-,00ω
2
Ν^ω). Следовательно, существуют fci > 0
и ω\ >0, такие что
^Vmax[7V(jo;) + N
T
(-ju)} ^киVИ^ал.
(С.32)
Если G(oo) + G
T
(oo) является положительно определенной, то существует σο >
0, такая что
^min[G(ja;) + GT(-JLJ)} > σ0, Vo; G Д.
(С.ЗЗ)
Из (С.30), (С.31) и (С.ЗЗ) следует, что
(?mm[G(ju> - μ) + G
T
(-JLV -μ)]^σ0- μ*ο,Vu;GД.
Выбор μ < σο/fco гарантирует положительную определенность G(ja; — μ) +
+G
T
(—ja; — μ) для всех ω GД.Если G(oo) + G
T
(oo) вырождена, из третье
го условия леммы следует, что G{JUJ) + G
T
{—ju) имеет q сингулярных значе
ний, таких что ππΙω-^οοσ^α;) > 0, (ρ — q) сингулярных значений, таких что
lim^^oo σ{(ω) = 0 и Шп^-юо ω
2
σ%{ω) > 0. Поэтому существуют σ\ > 0 и о>2 > 0,
такие что
^Vmin[G(ju;) + G
T
(->;)]^ ab VИ ^ a;2.
(C.34)
Из (С.30), (С.32) и (С.34) следует, что
^Vmin[G(ju; - μ) + GT(-JCL> - μ)] > σ\ - μ/ci, V |ω| > ω3,
(C.35)
где ω% = max{a;i,a;2}. На компактном интервале частот [—о;з,о;з] выполнено
amin[G(j") + GT
("^)] > σ
*>°·
(C
·
36
)
Следовательно, из (С.30), (С.31) и (С.36) получаем
<rmin[G(ju - μ) + G
T
(-ju - μ))^σ2- μ&ο,V\ω\^ω3.
(C.37)
СП. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 6Л
731
Выбор μ < min{ai/fci,a2//i:o} гарантирует положительную определенность
G(ju>—μ)+G
T
(—ju —μ)длявсехωΕR.
Необходимость. Предположим, что G(s) является строго положительно ве
щественной. Существует μ > О, такая что G(s — μ) положительно вещественная.
Следовательно, G(s) является гурвицевой, положительно вещественной и
G(ju) + G
T
(-ju)
^ 0,\/ωΕД.
Поэтому
G(oo) + G
T
(oo) > 0.
Пусть {Л, В, С, Л} — минимальное представление для G(s). Из леммы 6.3 сле
дует, что существуют Р, L, Ж и ε, удовлетворяющие (6.14)-(6Л6). Пусть Ф(я) =
= (si —Л)-1
.
Получаем
G(e)+G
T
(-s) =D+D
T
+СФ(5)Б+Б
Т
ФТ(-5)СТ
.
Подставим вместо С и D + £)т
соответствующие выражения, полученные из
(6.15) и (6.16). Тогда
G(s)+G
T
(-s) =W
T
W +(£ТР+W
T
L)$(s)B +
+B
T
$T(-s)(PB
+L
T
W)=
=W
T
W+W
T
L<f>(s)B + B
T
$T(-s)LTW
+
+Б
т
Фт(-5)[-Л
т
Р - ΡΛ]Φ(β)β.
Используя (6Л 4), получаем
G(s) +G
T
(-s) = [WT
+B
T
$T(-s)LT][W
+ £Ф(*)В] +
+eB
T
$T(-s)P$(s)B.
Из этого равенства видно, что G(JUJ) + G
T
(—ju) является положительно опре
деленной для всех ω Ε R, т. к. если бы она была вырожденной при некоторой
частоте ω, существовала бы точка х Ε Ср
, хφ0,такаячто
(x*)
T
{G(ju) + G
T
(-jw)]x
= 0=>
=» (Χ*)τΒτΦτ(^ω)ΡΦ^ω)ΒΧ
= 0^Вх
=0.
Кроме того,
(a:*)
T
[GM+G
T
(-ju)]x = 0 =•
=• (a:*)
T
[W + I^(->;)B]T[W + L#(jo;)B]a; = 0.
Поскольку Вх = 0, из предыдущего уравнения следует, что Wx = 0. Следова
тельно,
(x*)
T
[G(s) + G
T
(-s)]x = 0, V*.
732
ПРИЛОЖЕНИЕ С
что противоречит предположению о том, что det[G(s) + G
T
(—s)] не равен тожде
ственно нулю. Далее, если G(oo)+G
T
(oo) является положительно определенной,
доказательство завершено. В противном случае пусть Μ — любая матрица пол
ногорангаρ х(р- q),такая чтоM
T
(D+D
T
)M=M
T
WTWM = 0. Тогда
WM=0K
MT[G(JUJ) + G
T
(-ju))M = M
T
BT$
T
(-ju)(LTL
+ εΡ)Φ(]ω)ΒΜ.
Заметим, что ВМ имеет полный ранг по столбцам. В противном случае суще
ствует ж^О, такая что ВМх = 0. Положив у = Мх, получаем равенство
yT[G(ju>) + G
T
(-ju)]y =0,УωеЯ,
которое противоречит положительной определенности G(JOJ) + G
T
(—JUJ). Кроме
того,
lim U;2M
T
[G(JUJ) + G
T
(-ju)]M = M
T
BT{LTL + εΡ)ΒΜ,
ω— -юо
Из того факта, что ВМ имеет полный ранг по столбцам, следует положительная
определенность M
T
BT(LTL + εΡ)ΒΜ.
С.12. Доказательство леммы 6.2
6
Достаточность. Предположим, что существуют Ρ = Р
т
>0,LиW,удо
влетворяющие (6.11Н6.13). Используя V(x) = x
T
Px в качестве функции Ляпу
нова для системы х = Ах, а также учитывая (6.11), можно показать, что начало
координат системы х = Ах устойчиво. Следовательно, А не имеет собственных
значений в области Re[s] > 0. Пусть Ф(в) = (si — А)~
г
.
Тогда
G(s)+G
T
(s*)=D+D
T
+СФ(в)В+Б
Т
ФТ(5*)СТ
.
Подставляя вместо С и D + D
T
их выражения, полученные с использованием
(6.12) и (6.13), получаем
G(s)+G
T
(s*) =W
T
W+(ВТР +W
T
L)$(s)B + В
т
Фт(з*)(РВ + L
T
W)=
=W
T
W+Ж
Т
ЬФ(5)Б + Б
Т
ФТ(5*)£Т
^+
+В
т
Фт(ОК* + 5*)Р - А
Т
Р - РА]Ф(з)В.
Используя (6.11), имеем
G(s)+G
T
(s*) = [WT
+B
T
$T(s*)LT][W + £Φ(β)Β] +
+(s + 8*)БТФ
Т
(5*)РФ(5)Б.
(С.38)
6
B настоящее время существует несколько доказательств леммы Якубовича-Калмана (частот
ной теоремы). Изящные доказательства, основанные на идеях выпуклости и двойственности в экс
тремальных задачах (S-процедуры) предложены А.Ранцером [Д93] и Т.Ивасаки [Д81]. Подробнее
о современных трактовках и обобщениях леммы см. [Д26]. — П рим. ред. перев.
С Л 2. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 6.2
733
Из этого равенства следует, что для всех s в Re[s] ^ 0 выполнено G(s) -f
+ (^(s*) ^ 0. Тогда для любой ω, при которой ju; не является полюсом какого-
либо элемента G(s), матрица G(ju>) + GF(—ju)) является положительно полу
определенной. Осталось показать, что G(s) удовлетворяет третьему условию
определения 6.4. Предположим, что ja;o — полюс порядка га некоторого эле
мента G(s). Тогда для любого комплексного вектора х размерности ρ значения
величины (x*)
T
G(s)x на полуокружности произвольно малого радиуса ρ с цен
тром в juo удовлетворяют
(x*)
T
G(s)x « (х*)
Т
К0хр-
т
е^
тв
,
-| <θ<§.
Поэтому
pmRe[(x*)
T
G(s)x]
« Re[(x*)
T
K0x] cos τηθ + 1т[(х*)
т
ад sinra<9.
Легко видеть, что при га > 1 выражение в правой части может иметь любой знак,
но из (С.38) следует, что оно принимает только отрицательные значения. Следо
вательно, га должно быть ограничено единицей. При га = 1, выбирая θ вблизи
—π/2, 0 и π/2, получаем 1т[(х*)
Т
Кох] = 0 и Re[(z*)
T
lfo#] ^ 0. Следовательно,
Ко — положительно полуопределенная эрмитова матрица.
Необходимость. Сначала приведем доказательство для специального случая,
когда матрица А является гурвицевой. После этого доказанный частный случай
будет обобщен на ситуацию, когда А может иметь собственные значения на мни
мой оси.
Частный случай. Ниже будет использован результат о спектральном разло
жении, который мы приведем здесь без доказательства.
Лемма С.5. Пусть собственная рациональная матричная передаточная
функция U(s) размера (р х р) является положительно вещественной и гурви
цевой. Тогда существует собственная рациональная матричная передаточная
функция V(s) размера г х р, такая что
U(s)+U
T
(-s) =V
T
(-s)V(s),
(C.39)
где г — нормальный ранг матрицы U(s) + U
T
(—s), т. е. ранг над полем рацио
нальных функций от s. Кроме того, rank V(s) = г при Re[s] > 0.
ДОКАЗАТЕЛЬСТВО. СМ. [214, теорема 2].
Π
Предположим, что G(s) является положительно вещественной и гурвице
вой. Напомним, что {A, B,C,D} — минимальная реализация для G(s). Из лем
мы С.5 следует, что существует матричная передаточная функция V(s) размера
(г х р), такая что выполнено (С.39). Пусть {F, G, if, J} — минимальная реали
зация для V(s). Матрица F является гурвицевой, т.к. V(s) гурвицева. Можно
показать, что {—F
T
,#
T
,-G
T
,J
T
} — минимальная реализация для V
T
{—s). По
этому
Mi,Bi,Ci,X>i}
F
0
НТН
-F
T
G
[JTH
-G
T
],J
T
J\
734
ПРИЛОЖЕНИЕ С
представляет собой реализацию каскадного соединения V
T
(—s)V(s). Проверив
выполнение условий управляемости и наблюдаемости, а также с учетом свойства
mnkV(s) = г при Re[s] > 0, можно показать, что эта реализация минималь
на. Ниже приведена проверка свойства управляемости;
7
свойство наблюдаемости
проверяется аналогично. Итак, с использованием
/
О
H(sl - F)-
1
I
sI-F G
-ΗJ
sI-F
G
0 tf(5/-F)-
1
G +JJ
sI-F
G
можно показать, что
rwkV(s) = r,VRe[s] > О О rank
О
sI-F G
-ΗJ
V(s)\
:nF + r,VRe[s] > 0,
где ηρ — размерность F. Докажем свойство управляемости (Ai,B\) от против
ного. Предположим, что (Ai,Bi) неуправляема. Тогда существуют комплексное
числоλивекторwGС
пр+Г
, разделенный на два подвектора пр и г, такие что
(w*1fF + (w*2)
T
HTH = X(w*1f,
-(w*2)
T
FT
= X(w*2f,
(wl)TG + (w*2)
T
HTJ =0.
(C.40)
(C.41)
(C.42)
Уравнение (C.41) показывает, что Re[A] > 0, т.к. F является гурвицевой;
из (С.40) и (С.42) следует, что
[КГ К*)
т
я
т
]XI-F G
-Н
J
= 0=>rankV(A) < r,
что противоречит свойству rank V(s) = г при Re[s] > 0. Таким образом, пара
(А1, В\) управляема.
Рассмотрим уравнение Ляпунова
KF+F
T
K=
-Н
Т
Н.
Поскольку пара (F, Н) наблюдаема, оно имеет единственное положительно опре
деленное решение К. Этот факт доказывается в упражнении 4.22. Используя
преобразование подобия с матрицей
/0
КI
7
При этом используется тот факт, что V
T
(—s) не имеет нулей в полюсах функции V(s).
C.12 . ДОКАЗАТЕЛЬСТВО ЛЕММЫ 6.2
735
получаем альтернативную минимальную реализацию для V
T
(—s)V(s):
42,i?2,C2,i>2} =
Г
-
\F01
0-F
T?
ГG
KG+
7
HTJ}, [^H + G
T
K-G
T
],J
T
J}.
С другой стороны, {—A
T
,C
T
,—B
T
,D
T
} — минимальная реализация для U
T
(—s).
Поэтому
{Дз,Яз,С3,2>з} = {
АО
О-А
т
В
с
т , [С -BT],D
+D
T
}
является реализацией параллельного соединения U(s) + U
T
(—s). Поскольку соб
ственные значения матрицы А расположены в открытой левой полуплоскости,
а собственные значения матрицы of — А
т
—
в открытой правой полуплоско
сти, можно легко показать, что эта реализация является минимальной. Таким
образом, с учетом (С.39) {Л2>#2>С2,2М и {^з>^з>Сз,£>з} ~~
эквивалентные
минимальные реализации одной и той же передаточной функции. Поэтому соот
ветствующие матрицы имеют одинаковые размеры и существует невырожденная
матрица Т, такая что
8
А2 = ТАгТ-\В2
=ТВ3,С2 =С3Т~\JTJ =D+D
T
.
Матрица Τ должна быть блочно-диагональной. Для того чтобы в этом убедиться,
рассмотрим соответствующее разложение
Г=
Тц Т\2
?21 Т22
Тогда матрица Т\2 удовлетворяет уравнению
FT12 + Т12А
Т
=0.
Умножая слева на exp(Ft) и справа на exp(AT
t), получаем
0 = exp(Ft)[FT12 + Т12А
Т
] exp(AT
t) = -^[exp(Ft)T12
exp(AT
t)}.
Следовательно, exp(F£)Ti2 exp(AT
t) постоянна для всех t > 0. В частности,
поскольку ехр(0) = /, имеем
Т12 = exp(Ft)T12 exp(AT
t) ->0приt->оо.
Поэтому Т\2 = 0. Аналогично можно показать, что Т21
матрица Тц невырожденна и
F = TnATu\G
=TnB,J
T
H+G
T
K=СТЦ1
.
0. Следовательно,
8
См. [35, теорема 5-20].
736
ПРИЛОЖЕНИЕ С
Определим
Ρ = T^KTn,L
=НТи,W=J.
Можно легко показать, что Р, L и W удовлетворяют равенствам
РА+А
Т
Р=-L
T
L,PB=C
T
-
LTW, W
T
W=D+D
T
.
Таким образом, частный случай доказан.
Общий случай. Предположим, что А имеет собственные значения на мни
мой оси. Существует невырожденная матрица Q, такая что
QAQ-
1
А0О
ОAn
,QB
Во
Вп
, CQ =[CQСп],
где AQ такова, что ее собственные значения расположены на мнимой оси и Ап
такова, что вещественные части ее собственных значений отрицательные. Пере
даточная функция G(s) может быть представлена в виде G(s) = Go(s) + Gn(s)9
где GQ(S) = CQ{SI — AQ)~
1
BO такова, что все ее полюса расположены на мнимой
оси, и Gn(s) = Cn(sl—An)~
l
bn+D такова, что все ее полюса расположены в от
крытой левой полуплоскости. Таким образом, полюса Go(s) являются простыми,
и соответствующие матрицы вычетов являются эрмитовыми и положительно по
луопределенными. Благодаря наличию этих свойств матрицу Q можно выбрать
так, чтобы
А)+4о=0, Со=В%.
(С.43)
Для того чтобы в этом убедиться, заметим, что Go(s) может быть записана в сле
дующей форме:
m
G0(s) =J*b+£ ~Y^(
F
is
+
H
i)=
III
= ko+E
%=\
1
j->
.
J-
D*
1ЦΗ
•—:—Щ
S+JUJi
s-ju>t
где FQ — положительно полуопреденная симметричная матрица и Ri — положи
тельно полуопреденные эрмитовы матрицы. Если для каждого из членов суммы
в предыдущем выражении найдется минимальная реализация, для которой вы
полняется свойство (С.43), то это параллельное соединение будет являться ми
нимальной реализацией для Go(s), обладающей тем же свойством. В этой связи
достаточно рассмотреть только члены (l/s)Fo и [l/(s
2
+ uf)](F{S + Щ). Если
го = rankFo, то (1/S)FQ имеет минимальную реализацию размерности го вида
{О, N0, N£}, где F0 = Ν$Ν0. ЕСЛИ η = rank Д», то [l/(s
2
+ u?)](FiS + Щ) имеет
минимальную реализацию размерности 2г^, определяемую матрицами
О Шг1
-ωΛ О
Mi2
С,= [М£ Aig],
С. 13. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 7Л
737
где
МЦ=±(Ν> +Λ/?),Mi2= -UNi -JV*),Ri={Щ)ТЩ.
Очевидно что {Ai,Bi,Ci} обладает свойством (С.43). Поскольку Gn(s) явля
ется положительно вещественной и гурвицевои матрицей, из результатов для
рассмотренного ранее частного случая следует, что существуют матрицы Рп —
= Рп>О,Ln иW,такиечто
РпАп +А
т
пРп=-L^Ln, РПБП=Cl -L
T
nW, W
T
W=D+D
T
.
Легко показать, что
P=Q
2
IО
ОРп
Q,L=[ОLn]Q
и W удовлетворяют равенствам (6.11)—(6.13).
С.13. Доказательство леммы 7.1
Начнем с того, что представим бесконечное число уравнений (7.20) во вре
менной области. Рассмотрим пространство S всех полуволновых симметричных
периодических сигналов с собственной частотой ω, обладающих конечной энер
гией на любом конечном интервале. Сигнал у Ε S может быть представлен в виде
ряда Фурье
y(t)= Σ
akexp(jkut),
^
\ak\
2
< оо.
к нечетные
к нечетные
Определим норму на S равенством
η2π/ω
/0
ρ2π/ω
=£/ y\t)dt=2 Σ
JУ)
I
l^fcl
2
.
к нечетные
Пространство S с такой нормой является банаховым. Определим gk{t — т) равен
ством
9k{t - τ) = ^{G(jku) exjp[jk(jj(t - τ)] + G(-jku) exp[-jkuj(t - τ)]}.
При нечетных индексах га и к > 0 получаем
ρπ/ω
9k(t ~ г) exp(jmujT)dT =
iG(jfcu;) exp(jfca;£),
если га = /с,
G(—jku)exp(—jkut)1 если га = —А;,
(С.44)
0,
если |га| φ к.
ГJo
738
ПРИЛОЖЕНИЕ С
Определим линейное отображение д и нелинейное отображение дф на S равен
ствами
ηπ/ω
9У
ηπ/ω
Ι
Σ 9k(t - r)y(r)dr,
к нечетные, к>0
ρπ/ω
дфу =
Σ >9k(t ~ т)ф(у(т))<1т,
к нечетные, fc>0
где
y(t)= ]Г akexp(jkut)
и i/>(y(t)) =
^
ckexp(jkujt).
к нечетные
к нечетные
Используя (С.44), можно показать, что
ду= Σ
G(jku)akexp(jkut),
к нечетные
дфу=
^
G(jku)ckexp(jkut).
к нечетные
С учетом этих определений можно сформулировать условие существования по
луволнового симметричного периодического сигнала:
У = -дфу-
(С.45)
Равенство (С.45) эквивалентно (7.20). Для того чтобы отделить влияние высших
гармоник от влияния первой гармоники, определим отображение Pi
Р\У = У\ — Q>\ exp^'cji) + ~a\ exp(-jut) = 2Re[ai exp(jut)]
и отображение Р^
Phy=yh=y-yi=
Σакex
P(Jfca;
*)·
к нечетные; \к\^1
Не умаляя общности, можно положить а\ = a/2j и, следовательно, yi(t) =
= a smut. Решение уравнения (С.45) эквивалентно решению системы (С.46)
и (С.47)
Vh = -Pkg1>(Vi+Vh),
(C.46)
У1 = -Р19Ф(У1+Ун).
(С.47)
Анализируя значения правой части (С.47), можно заметить, что это уравнение
эквивалентно (7.35). Член ошибки 5Ф, определяемый в соответствии с (7.36),
удовлетворяет
Р19ФУ1 - Р19Ф(У1 + Ун) = 2Re[G0'")aii*exp(jut)}.
(C.48)
С. 13. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 7.1
739
Таким образом, для получения оценки 5Ф необходимо найти оценку для у^ что
будет сделано с использованием теоремы о сжимающем отображении (т.е. не
находя решение (С.46) в явном виде). Прибавив [Рнд(Р + <х)/2]ун к обеим частям
равенства (С.46), перепишем его в следующем виде:
I + PhgP±^\yh
=
-Phg Ф(У1 + Ун)
TT-Vh
(С.49)
Рассмотрим линейное отображение К = I + Ρπ9{β + ос)/2 в левой части (С.49).
Это отображение S в S. Для любого z б S, определенного равенством
Ζ(*)
=
Σ hey^{jkut),
к нечетные
рассмотрим линейное уравнение Кх = z и найдем его решение х в S. Предста
вивхввиде
x(t)=Σ
dkexp(jkut),
получаем
I + Phg?-^
)x=xi+
к нечетные
Σ
/снечетные,|/с|т^1
1 + P±^G(jku>) dkexp(jku>t).
Следовательно, линейное уравнение Кх = z имеет единственное решение, если
inf
к нечетные, \к\ф1
1+
•GO'M ^о.
(С.50)
Другими словами, условие (С.50) гарантирует, что линейное отображение К име
ет обратное. Это условие выполнено, если ω £ Ω, т. к. левая часть (С.50) может
обращаться в нуль, только если ρ(ω) — 0. Обозначим обратное отображение
для К через К~
г
и с учетом Ридуг = 0 перепишем (С.49) в виде
Ун = -К^РндШуг
+ Ун) γ- (2/1+Ун)]= Tyh.
Мы намерены применить теорему о сжимающем отображении к уравнению уъ, =
= Tyh- Очевидно, Τ отображает S в S. Необходимо проверить, что Τ представ
ляет собой сжатие на S. Для этого рассмотрим
Ту(2) _ Ту(1) = к-
1
Рнд[фт{У1
+у<
2
>)-фтЫ+»
(1))],
где
h(y) = Ф(у) тг-У -
740
ПРИЛОЖЕНИЕ С
Пусть
Фг(уг + У
{2)
)~Фт{У1+у
(1)
)=Σ
ек ex
P0'^t).
к нечетные, \к\^1
Тогда
\\Ту®-ТуМ\\* = 2
£
/с нечетные, \к\ф1
ОЦкш)
<<
sup
\к нечетные, \к\ф1
l+[(/? + a)/2]G(jb)
! + [(/? + a)/2]G(jku)
Ы2
<
\фг(У1 + У(2)) - ФтЫ + У(1))
Вследствие ограничения на угол наклона графика ф, имеем
^
Фт(У1 + 2/(2)) - ФтЫ + У(1))
G(jkw)
β-α
V® ~ У{1)
Более того,
к нечетные, \к\^1 | 1 + [(/? +
a)/2]G(jku>)
где ρ(ω) определена в (7.38). Следовательно,
1
(β-*
^
РН'
Ту(2)-ТуМ
^
Поскольку
1
[β-α
у(2)_у(1)
ρ{ω)
<1, ΥωΕΩ,
можно заключить, что при ω Ε Ω отображение Τ является сжимающим. Тогда
из теоремы о сжимающем отображении следует, что уравнение yh = Tyh имеет
единственное решение. С учетом того что Т(—у\) — 0, перепишем уравнение
Ун=Tyh ввиде
Vh=
Tyh-T(-yi).
Тогда
Поэтому
\M<+J^)\\VH\\ +
-±(^I*
\Ы\ <
ρ(ω)\ 2
α[(β-α)/2}/ρ(ω)
=
1 - [(β - α)/2]/ρ(ω) ρ(ω) - [(β - α)/2]
β-α
ρ(ω)
α[{β - α)/2]
2σ{ω)α
СЛ4. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 7.4
741
и, следовательно, выполнено (7.40). Для доказательства выполнения (7.41) при
бавим к обеим частям (С.47) Pigtpyi:
2/1 + Р19ФУ1 = Ргд[ФУ1 - Ф(У1 + Ун)]-
Вычисляя нормы обеих частей (С.51), получаем неравенство
\1 + Сиш)Ща)\а < |G(ja;)| (^) \Ы\ < |G(j«)kHa,
с использованием которого вычисляем оценку
(С.51)
w
+ Ща)
1 + G(jw)*(a)
G(jw)
< σ(ω),
\G(ju>)
которая завершает доказательство леммы.
С.14. Доказательство теоремы 7.4
Если в доказательстве леммы 7.1 положить Р\ = 0 и Р^ = /, то отоб
ражение Τ остается сжимающим при ω Ε Ω. В этом случае г/ = у^ = 0 —
единственное решение уравнения yh = Ту^. Это доказывает, что не существует
полуволновых симметричных периодических решений с собственной частотой
ω Ε Ω. Из необходимости выполнения условия
G{ju>)
+ Φ(α) <σ(ω)
следует, что полуволновые симметричные периодические решения с собствен
ной частотой ω Ε Ω' не существуют, если соответствующая окружность ошибки
не пересекает геометрическое место точек — Ф(а). Таким образом, нам осталось
рассмотреть третий пункт теоремы, в котором утверждается, что для любого пол
ного пересечения, определяющего Г, существуют полуволновые симметричные
периодические решения с собственной частотой (ω, а) Ε Г. При доказательстве
этого утверждения используется следующий результат из теории степеней отоб
ражений.
Предположим, что задана непрерывно дифференцируема функция φ : D —>
—» i?n
, гдеDСRn
—
открытое и ограниченное множество. Пусть ρ Ε Rn
—
некоторая точка, такая что ф(х) = ρ для некоторой х внутри D, но ф(х) Φ ρ на
границе 3D множества D. Мы хотим показать, что уравнение ф(х) = ρ имеет
решение в D, где ф{х) — возмущение ф(х). Это можно сделать с использованием
теории степеней отображений, согласно которой при определенных условиях ни
одно из подобных решений не покидает D при указанном возмущении φ функ
ции ф, т. е. ни одно из решений не достигает границы dD. Предположим, что для
742
ПРИЛОЖЕНИЕ С
каждого из решений Xi € D уравнения ф(х) = ρ матрица Якоби [дф/дх] невы-
рожденна. Определим степень отображения φ в ρ относительно множества D
равенством
а(ф, D,p) =
^2
si
Sn\
det дф
дх
(Хг)
Заметим, что если ф(х) φ ρ \/ х G D9 то степень равна нулю. Степень отображе
ния обладает следующими двумя основными свойствами
9
:
• Если а(ф, D,p) φ О, то ф(х) = ρ имеет по крайней мере одно решение в D.
• Еслиη:Dх[0,1]—•R
n
является непрерывной и η(Χ, μ) φ О для всех
х £ dD ивсех μ G[0,1], то с%(·, μ),D,p] равна для всех μ е [0,1].
Второе свойство известно как свойство гомотопической инвариантности степе
ни d.
Вернемся к доказательству теоремы и определим на Г
φ(ω,α) = Φ(α) +
G(juY
Рассматривая вещественную и мнимую часть комплексной переменной φ в каче
стве элементов вектора размерности два, φ можно интерпретировать как отобра
жениеизГвД
2
. По предположению, уравнение φ(τν, а) = 0 имеет единственное
решение (ω5, as) в Г. Якобиан φ по (ω, α) в (ω5, αθ) имеет вид
da
Φ(β)
-*
2
(ae){£Re[G(ja;)]}
-9*(ae){£jm[G(ju,)]}
Этот якобиан не вырожден при условии, что
da
Φ(α)
a=as
^0; £lm[G(ja;)]
ω=ω3 J
*o.
Таким образом,
d(^,r,0)
Необходимо показать, что уравнение
1
±1.
φ(ω,α) =
G(i")
+ Φ(α)-5Φ(ω,α) =0
(C.52)
имеет единственное решение в Г. Для этого достаточно показать, что
d(0,r,O)^O.
Доказательство этих свойств приведено в работе [26].
СЛ5. ДОКАЗАТЕЛЬСТВО ТЕОРЕМ 8.1 и 8.3
743
Определим при μ е [0,1]
η(ω,α,μ) = (1— μ)φ(ω, α)+ μφ(ω, а) = φ(ω, а) —μ5Φ(α;,α),
т.е.η =φприμ=0иг/=φприμ=1.Можнопоказать,что
>σ{ω), V(o;,a) G 0Γ.
(С.53)
Например, если в качестве границы выбрать а = а\, то с использованием рисун
ка 7.20 можно заключить, что левая часть неравенства (С.53) является длиной
отрезка, соединяющего соответствующую условию а = а\ точку в геометриче
ском месте точек для — Ф(а) с точкой на годографе 1/G(JUJ) при ω\ ^ ω ^ α>2· По
построению, первая точка расположена вне (или на) окружности ошибки с цен
тром в последней точке. Поэтому длина отрезка, соединяющего эти две точки,
должна быть больше радиуса (или равна радиусу) окружности ошибки, т. е. σ(ω).
Используя (С.53), с учетом (7.41) получаем
\η(ω,α,μ)\ > \φ(ω,α)\ -μ|5Ψ(α;,α)| =
—
μ|5Φ(α;,α)| ^ σ(ω) — μσ(ω).
Таким образом, при всех 0 ^ μ < 1 правая часть последнего неравенства поло
жительна и, следовательно, η(ω, α, μ) φ 0 на дТ при μ < 1. Не умаляя общности,
можно предположить, что η(ω,α,1) Φ 0 на <9Г, т.к. равенство в этом случае
означает, что мы нашли искомое решение. Таким образом, из свойства гомотопи
ческой инвариантности для d следует, что
<1{ф,Г,0) = (Цф,Г,0)ф0.
Поэтому (С.52) имеет решение в Г. Доказательство теоремы завершено.
С.15. Доказательство теорем 8.1 и 8.3
Ключевым приемом, используемым при доказательстве этих двух теорем,
является применение теоремы о сжимающем отображении, которое выполняется
практически аналогично в каждом из соответствующих доказательств. Во избе
жание повторений мы выделим ту часть доказательств, которая касается исполь
зования теоремы о сжимающем отображении, в отдельную лемму. Формулировка
этой леммы сходна с формулировкой теоремы 8.1, но имеет одно дополнительное
утверждение, которое потребуется при доказательстве теоремы 8.3.
Лемма С.6. Рассмотрим систему
y=Ay+f(y,z),
(C.54)
z=Bz+g(y,z),
(C.55)
Ф(о) +
G(H
Ф(о) +
G(ju>)
744
ПРИЛОЖЕНИЕ С
гдеу£Rk
,
zΕRm
,
собственные значения матрицы А имеют нулевые ве
щественные части, собственные значения матрицы В имеют отрицательные
вещественные части и /, g — дважды непрерывно дифференцируемые функции,
которые вместе со своими первыми производными обращаются в нуль в начале
координат. Тогда существуют δ > О и непрерывно дифференцируемая функция
η(ν), определенная для всех \\у\\ < δ, такие что z = 77(2/) является центральным
многообразием для (С.54)-(С55). Более того, если \\g(y,Q)\\ ^ Щу\\р для всех
\\у\\^ г, гдеρ >1иг > 0,то существует с>0, такая что \\г}(у)\\^ с|М1р
·
ДОКАЗАТЕЛЬСТВО. Существование центрального многообразия может быть
легко доказано, если решения на этом многообразии определены для всех t G R.
В общем случае центральное многообразие для (С.54)-(С55) может быть опре
делено лишь локально, т. е. решение на этом многообразии может быть определе
но лишь на интервале [0,11) С R. Поэтому при доказательстве используется сле
дующая идея. Мы рассмотрим некоторое модифицированное уравнение, иден
тичное (С.54)-(С55) в окрестности начала координат, но имеющее некоторые
полезные глобальные свойства, гарантирующие то, что решение на централь
ном многообразии будет определено для всех t. Доказательство существования
центрального многообразия будет проведено для модифицированного уравнения.
Поскольку оба уравнения совпадают в окрестности начала координат, представ
ленное доказательство существования центрального многообразия будет верно
для первоначального уравнения локально.
Пустьφ :R
k
- > [0,1] — гладкая (непрерывно дифференцируемая бесконеч
ное число раз) функция,
10
такаячтоψ(у)=1при\\у\\<1иф(у)=0при
\\у\\^2.Приε>0определимF иG:
F(y, z)=f(уф(§),z); G(y,z)=g (уф(§), z).
Функции F и G являются дважды непрерывно дифференцируемыми; вместе со
своими первыми частными производными они являются глобально ограниченны
ми по у, т. е. при ||г|| < к\ эти функции ограничены для всех у е R
k
.
Рассмотрим
модифицированную систему
y=Ay+F(yyz),
(C.56)
z=Bz+G(y,z).
(C.57)
Докажем существование центрального многообразия для (С.56)-(С57). Пусть X
—
множество всех глобально ограниченных, непрерывных функций η: R
k
-^> R
m
.
10
В скалярном случае (к — 1) примером такой функции является следующая: φ (у) = 1 при
\у\^1,ф(у)=Опри\у\&2и
Ф(У) =
l
~\J ехр
(J^T Jехр
(2^х )
dx ПрИ
*
<
'
У
'
<2
'
где
6=
/ ехр
(^)
ехр
(2^)^·
С. 15. ДОКАЗАТЕЛЬСТВО ТЕОРЕМ 8.1 и 8.3
745
Это множество является банаховым пространством, если ввести норму
supyeRk \\η(ν)\\· Пусть S С X — множество всех непрерывно дифференциро
ванных функций η: R
k
—> i?
m
, таких что для всех х,у € Rk
Ч(0)=0, §(0)=0,
\Ш\\ < сь
< с2,
9гу
5г/
< Ы\у-х\\
\дук
ду
где ci > 0, С2 > 0 и сз > 0. Для доказательства замкнутости S рассмотрим
некоторую сходящуюся последовательность щ(у) в S и покажем, что 77(2/) =
= Нпц-юо^у) принадлежит 5. При доказательстве этого утверждения необхо
димо показать, что η^) является непрерывно дифференцируемой. После этого
утверждение леммы может быть доказано от противного. Поскольку свойство
непрерывной дифференцируемости может быть доказано покомпонентно, сдела
ем это для скалярной η. Пусть ν — произвольный вектор Bi?fc
, ||г;||=1,иμ—
некоторая положительная константа. Из теоремы о среднем значении следует,
что
дт1'
щ(у + μν) - тц(у) =-^(у + αψυ)μυ,
dm
Vj(y + μν) ~ Vj(y) = -щ(У + ^μν)μυ,
где 0 < ai < 1 и 0 < cxj < 1. Прибавляя и вычитая соответствующие члены,
получаем следующее уравнение:
%/ ч дЩ(ч
μν=
&Пг, ч %/
,
ч
μν
μυ+
+ЫУ + μυ) - Vj(y + μν)] - [щ{у) - Vj(y)].
При заданной ε > 0 найдем достаточно большие целые числа го и jo, такие что
ε2
SUP \ЫУ) ~ Vj{y)\\ < Т7Г-
yeR
k
ibC3
для всех г > io и j > jo- Это возможно, т.к. {т^} является сходящейся последо
вательностью. Используя предыдущее неравенство и
|*ω-|*<»+ο«Η μ?; < с3садх
2
|М|2
< β3μ
2
при^=гилиj,
746
ПРИЛОЖЕНИЕ С
можно показать, что
<2ε3μ+
8β3μ*
Полагая μ = ε/(Acs), получаем
dm,
ч
&Пз, ч
<ε.
Таким образом, дщ/ду — последовательность Коши в банаховом пространстве
глобально ограниченных, непрерывных функций, действующих из R
k
вR
k
, иона
сходится к некоторой непрерывной функции J (у). Кроме того, η^) является
дифференцируемой и θη/ду = J(y).
11
Для заданной η Ε S рассмотрим систему
y = Ay + F(y^(y)),
z = Bz + G(y,v(y)).
(С.58)
(С.59)
Вследствие ограниченности 7/(у) и [θη/ду], правая часть (С.58) является гло
бально липшицевой по у функцией. Поэтому для любого начального состояния
?/о £ Rk уравнение (С.58) имеет единственное решение, определенное для всех t.
Обозначим это решение через y(t) = π(£; уо? Η)·>
г
де π(0; г/о> η) = yol это решение
параметризовано фиксированной функцией η. Уравнение (С.59) является линей
ным по z, и его решение имеет вид
z(t) = exp[B(t - T)]Z(T) +
+ J exp[B(t - A)]G(TT(A - r; y(r), η), η(π(Χ - τ; у(т), τ/)))</λ.
Умножим обе части этого равенства на ехр[—B(t — τ)], перенесем интегральный
член в другую часть и сделаем замену переменной интегрирования λ на s = λ —
—
т. В результате получаем
z(r) = exp[-B(i - r)]z(t) +
+ / βΧρ(-Β5)σ(π(β;2/(τ),η),7/(π(β;2/(τ),τ/)))ω.
Это выражение справедливо для любого ε Ε R. В пределе i —*
— оо интегральный
член имеет вид
J—с
exp(-£s)G(7r(s; г/(т), т?), 77(TT(S; г/(т), ту)))^
(С.60)
п
См. [111, теорема 9.1].
C.15. ДОКАЗАТЕЛЬСТВО ТЕОРЕМ 8.1 и 8.3
747
и корректно определен, поскольку η ограничена, G глобально ограничена по π
и В гурвицева. Перепишем выражение (С.60), заменив у(т) на у и обозначив его
через (Ρη)(ν):
{Ρη)(ν)= [ exp(-Bs)G(K(s;y,V),V(n(s;y,V)))ds.
{CM)
С использованием этого определяющего равенства можно записать
eMB(t-r)}[z(T)-(PV)(y(r)))
=
=z(t)-/
exp[-B(s - t + r)]G(n(s; у(т), η), τ?(π(«; у (τ), v)))ds.
J —OO
Подставляя ξ = s — t + тв интеграл, с учетом π(ξ +1 — τ; у(т), ту) = π (ξ; y(£), ry),
получаем
exp[B(t - T)][Z(T) - (Pv)(y(r))} = z(t) - (Pv)(y(t)).
Из этого равенства следует, что если z(r) = (Ргу)(?/(т)), то z(t) = (Ргу)(г/(£)) для
всех t e R. Следовательно, z = (Pry) (у) определяет инвариантное многообразие
для (С.58)-(С59), параметризованное η. Рассмотрим (С.56)-(С57). Если 77(2/) —
неподвижная точка отображения (Pry)(у), т. е.
V(y) = (Pf/)(y),
то z = 77(2/) — центральное многообразие для (С.56)-(С.57). В этом можно убе
диться следующим образом. Во-первых, с использованием свойств η G S и того
факта, что у = О является точкой равновесия (С.58), с учетом (С.61) можно по
казать, что
(Рт7)(0) = 0; ^(0) = 0.
Во-вторых, поскольку z = (Рту) (у) — инвариантное многообразие для (С.58)-
(С.59), (Pry) (у) удовлетворяет дифференциальному уравнению в частных произ
водных
JL(Pv)(y)[Ay + F(y, (Ρη)(ν))] = Β(Ρη)(ν) + G(y, (Pr?)(y)).
Если 77(2/) = (Pry)(у), то ry(y) удовлетворяет тому же дифференциальному урав
нению в частных производных и, следовательно, это равенство определяет цен
тральное многообразие для (С.56)-(С57). Осталось показать, что отображение
(Ρη) имеет неподвижную точку. Это будет сделано с использованием теоремы
о сжимающем отображении. Необходимо показать, что отображение Ρη отобра
жает S в себя и является сжимающим отображением на S. Из определений F и G
748
ПРИЛОЖЕНИЕ С
следует, что существует неотрицательная непрерывная функция ρ(ε), ρ(0) = О,
такая что
\\F(y,z)\\^£p(e);
\\G(y,z)\\^ep(e);
f<->
дв
ду (l/>«)
< ρ(ε);
< /»(e);
f<->
f<->
^ p(e),
^ρ(ε)
(C.62)
(C.63)
длявсеху£RkиzeД
т
,
\\z\\ < ε. Посколысу собственные значения матри
цы В имеют отрицательные вещественные части, существуют положительные
константыβ иС,такиечтоприs^О
|exp(-J3s)|| <Cexp(/?s).
(С.64)
Поскольку собственные значения матрицы А имеют нулевые вещественные ча
сти, для любой а > О существует положительная константа Μ (α) (которая может
стремитьсякооприа—>0),такаячтоприsΕR
|exp(j4s)|| < Af(a)exp(a|s|).
(С.65)
Для доказательства того факта, что Ρη отображает S в себя, необходимо пока
зать, что существуют положительные константы ci, c<i и сз такие, что если т){у)
является непрерывно дифференцируемой и удовлетворяет
ItoMKci;
9η, ч
< c2;
ду[у)
ду[х) ^c3\\y-x\\
длявсехх,уΕRh
, το (Ρη)(υ) является непрерывно дифференцируемым и удо
влетворяет тем же неравенствам. Непрерывная дифференцируемость (Рф(у)
непосредственно следует из (С.61). Для проверки выполнения неравенств ис
пользуем оценки для F и G, определяемые неравенствами (С.62) и (С.63). В ре
зультате получаем, что с\ должна быть выбрана так, чтобы было выполнено
0.5ε < с\ < ε. Используя (С.64) и оценки для G и гу, из (С.61) получаем
\\(Pv)(y)\\ < /°
J —ос
fJ—ос
|exp(-Ss)||||G||cte< /
Сexp(/3s)ep(e)ds
Сер(е)
Верхняя граница для (Ρη)(^) будет меньше с\, если выбрать ε достаточно ма
лой. Пусть %(i;2/,r/) — матрица Якоби для 7r(i; у, 77) по у. Она удовлетворяет
уравнению в вариациях
-(f)+(f)(l %> 7Гу(0;у,г7) =7,
где
9F
ду
) = (^)(^;у^)^(^;у^))).
C.15. ДОКАЗАТЕЛЬСТВО ТЕОРЕМ 8.1 и 8.3
749
Выражения для dF/dz и δη/ду записываются аналогично. Следовательно, при
ду J \dzj \ду/
ny(s;y^)ds.
nyfaViV) =exp(At) -
-
j ехр[А(*-в)]Г(
Используя (С.65) и оценки для F и η, получаем
\\ny(t;y^)\\ ^ Μ (α) exp(-ai) +
+ J M(a)exp[a(e-t)](l +
c2)p{e)\\ny(s;y,v)\\ds.
Умножая обе части на exp(a£) и используя неравенство Гронуолла-Беллмана,
получаем
12
К(*;у,*/)|| <М(а)ехр(-т*),
где 7 = ос + M(a)(l + с2)р(е). Используя эту оценку, а также (С.64) и оценки
для G и η, вычислим оценку для [д(Р^(у)/ду]. Из (С.61) получаем
д(Ру)(у) =
Тогда неравенство
|а(р»7)(у)
/:-«-> [(f)+(f)(1) Ky(s;y,v)ds.
ду
€ / Cexp(/?s)(l + С2)р(е)М(а) exp(-7s)ds =
J—ос
С(1 + с2)р(е)М{а)
/3-7
справедливо при условии, что ε и α являются настолько малыми, что вы
полнено β > 7· При достаточно малой ε эта оценка матрицы Якоби для
(Ρη)(υ) может быть сделана меньше с2. Для доказательства липшицевости яко
биана [д(Р^(у)/ду] с константой Липшица сз заметим, что матрицы Якоби
[dF/ду], [dF/dz], [dG/dy] и [9G/d^] удовлетворяют неравенствам Липшица
§£(„,;)-f(*,«,) < L[||2/-x|| + ||2-ги||
12
Поскольку нижним пределом в интеграле является £, мы в действительности используем дру
гую версию неравенства Гронуолла-Беллмана: если
y(t) < X(t) + J μ(8)ν(8)α8,
y(t) ^ X(t) + / A(s)/i(s)exp / μ(τ)<£τ ds.
750
ПРИЛОЖЕНИЕ С
длявсехх,у еR
k
и z,w G Βε. При ε < ε* для некоторой ε* > 0 можно выбрать
константу Липшица L независимой от ε. Более того, одну и ту же константу L
можно использовать для всех четырех матриц Якоби. Используя эти неравенства,
а также неравенство Гронуолла-Беллмана, можно повторить представленные ра
нее рассуждения и показать, что
1Ку(*; У> ν) - %(*; я, ν)II ^ £i ехр(-2т*)||у - х\\
длявсехх,у еR
k
иt^0,гдеLi=[(1+сг)
2
!/ + р{е)с^]Мъ{а)/^.
Используя
последнее неравенство, можно показать, что при β — 2η > 0 выполнено
^(ν).ψ>(Χ)
ду
ду
^CLi(27-a)„
^
М(/?-27)
||У
'
Выберем α и ε настолько малыми, что выполнено β — 2η > β/2. Тогда
^ [Ь2+
р(е)Ьгсз]\\у-х\1
«*»<,)_*£>(,)
<9г/
<9у
где L2 и Z/3 не зависят от ε и сз- При сз > 1/2 можно выбрать ε настолько ма
лой, что 1/2 + ρ(ε)Ι/3θ3 < сз. Таким образом, мы показали, что при достаточно
малой с\ и достаточно большой сз отображение Ρη действует из S в S. Для
доказательства того факта, что это отображение является сжимающим на 5, рас
смотрим две функции 771(2/) и 772(2/)» определенные на S. Пусть 7Ti(£) И π2(£) —
соответствующие решения (С.58), начинающиеся в у, т.е.
щ(Ь) = 7r(*;y,77i), г = 1,2.
Используя оценки (С.62) и (С.63), можно показать, что
||·^(7Γ2,772(π2)) -^(я-1,ш(7Г1))|| ^ (1 + 02)ρ(ε)||7Γ2-7Ti||+ρ(ε) sup ||r/2-r/i||,
yeR
k
Ι|σ(π2,τ72(π2))-σ(π1,η1(π1))|| < (1 + ο2)ρ(ε)||π2 - πΧ|| + ρ(ε) sup Ц7&-771Ц.
2/GHfe
Из (С.58) видно, что ||π2 — 7ri || удовлетворяет
||π2(*) - 7ri(t)|| < / M(a)exp[a(s
-
t)]\p(e) sup Ц772 - m\
Jt
yeR
k
+(1 + ο2)ρ(ε)||π2(5) - пг(з)\\]аз ^
-Μ(α)ρ(ε) sup \\η2 - m\\ exp(-otf) +
yeR
k
+
^
+ / (7 - a)exp[a(s - t)]||7r2(s) - ni(s)\\ds,
С. 15. ДОКАЗАТЕЛЬСТВО ТЕОРЕМ 8.1 и 8.3
751
где 7 = OL + М(а)(1 + С2)р{е) и 7ri(0) = π2(0). Умножая это неравенство на
ехр(а£) и используя неравенство Гронуолла-Беллмана, можно показать, что
||π2(*) -TTIWII < ^Μ(α)ρ(ε) sup \\η2 - тц\\ esxp(-yt).
yeR
k
Используя это неравенство в
(РТЙ)(У) - (Рт)(у) = /
exp(-£s)[G(7r2,772^2)) - G^i,fn(^))]ds,
«/—сю
получаем
||(Р%)(!/)-(Рт)МИ< Г С^
в
[(1 + Р2)р(е)|К2(в)-^(а
t/—СО
+
+ρ(ε) sup ||%-»7i||]d5 ^
y€Rk
< (7ρ(ε) sup Цг/2-mll х
yeR
k
II
/
X
Й+/oo
e
^
(1+С2
)^
М
И^)
е
"
7
^
5
^ ь sup 11%-mil»
yeR
k
где
6= Cp(e) I
η-a
/3 a(/3-7)
При достаточно малой ε можно гарантировать, что Ь < 1 и, следовательно, Рг/
является сжимающим отображением на 5. Таким образом, из теоремы о сжи
мающем отображении следует, что отображение Ρη имеет неподвижную точку
в5.
Предположим, что \\д(у, 0)|| ^ &||у||р
·
Функция G(y,0) удовлетворяет той
же оценке. Рассмотрим замкнутое подмножество
Y={v€S\\\V(y)\\^c4\\y\\Ph
где С4 — некоторая положительная константа, подлежащая определению. Для за
вершения доказательства леммы необходимо показать, что неподвижная точка
отображения Ρη расположена в Υ. Это будет иметь место, если мы сможем по
казать, что константа с^ может быть выбрана так, что Ρη отображает Υ в себя.
Используя оценку (С.63) для G, получаем
\\G(vMv))\\ < \\G(y,0)\\ + \\G(y,V(y))-G(y,0)\\ < Щу\\р
+ Р(е)\Ш1
Поскольку в множестве Υ выполнено ||ry(y)|| ^ С4||у||р
,то
\\G(y,v(v))\\^[k + CAp(e)}\\y\\>.
752
ПРИЛОЖЕНИЕ С
Используя эту оценку в (С.61), имеем
\\(Ρη)(υ)\\< [ Cexptfs)[k + c4p(e)}\\n(s;y,VWds.
J—oo
Поскольку 7г(£; 0,ту) = 0 и \\πυ(^ у,η)\\ ^ М(а) ехр(—yb), так же как и в доказа
тельстве леммы 3.1, можно показать, что при t ^ О выполнено
\\n(t;y^)\\ <М(а)ехр(-т*)|М|.
Таким образом,
при условии, что ε и α выбраны настолько малыми, что β — ρη > 0. Выбрав
достаточно большую С4 и достаточно малую ε, получаем с$ < с±. Поэтому (Ρη)
отображает Υ в себя. Доказательство леммы завершено.
Π
Доказательство теоремы 8.1
ДоказательствоследуетизлеммыС.6приА =Ai,Б =А2,/ =#iид=
Доказательство теоремы 8.3
Определим /х(у) = h(y) — ф(у). С учетом того что Af(h(y)) = 0 и М{ф{у)) =
= 0(||у||р), где M{h{y)) определено в (8.11), можно показать, что д(у) удовле
творяет дифференциальному уравнению в частных производных
^(y)[Aiy + Ν(ν,μ(ν))] - Α2μ(ν) - Q{y^{y)) = 0,
(С.66)
где
N(y,z) = gi(y,<f>(y) + z)
Q(y,z) = 92(У,Ф(У) + z)- 92(у,Ф{у)) +ЩФ(у)) ~
—д -(у)[9ЛУ,Ф(у) + z)~ 9i(v,<Kv))]-
Функция μ(?/), удовлетворяющая (С.66), определяет центральное многообразие
для уравнения (С.54)-(С.55) при А = А\, В = А2, f = N и д = Q. Кроме того,
в этом случае
<2(у,0)=Щф(у)) = О(\\у\П
СЛ6. ДОКАЗАТЕЛЬСТВО ЛЕММЫ 8.1
753
Следовательно, из леммы С.6 следует, что существует непрерывно дифферен
цируемая функция μ(?/) = 0(||у||р), удовлетворяющая (С.66). Поэтому h(y) —
—
ф(у) = 0(\\у\\р). Редуцированная система имеет вид
y = Aiy + gi(y,h(y)) =
= My + fli(y,Ф(у)) + gi(y,h(y)) - дг(у,ф(у)).
Поскольку д\ является дважды непрерывно дифференцируемой и ее первые част
ные производные обращаются в нуль в начале координат, в некоторой окрестно
сти начала координат выполнено
dgi,
у.
OilMI + AalNI-
Из теоремы о среднем значении следует, что
9и{у,Ку)) ~ 9и(у,ФШ
= -^(У,С(У))[КУ) ~ Ф(У)Ъ
где
IICMII < \Ш\\ + \Ш\\ < h\\y\\p
^ tolMI
при \\у\\ < 1. Поэтому
\ЫУ,НУ))-91(УЖУ))\\ < ЫУ\\ \Ш\\ = о(1МГп),
что завершает доказательство теоремы.
Π
С.16. Доказательство леммы 8.1
Для доказательства инвариантности множества RA необходимо показать,
что
хеRA=>х(з)
d
=Ф(з\х)еRA,VSеR.
Поскольку
<f>(t;<l>(s\x)) = <£(t + *;x),
очевидно, что Нт$_»оо ф(Ь\ x(s)) = 0 для всех s e R. Следовательно, RA является
инвариантным. Для доказательства того факта, что RA открыто, выберем любую
точку ρ G RA И покажем, что каждая точка в окрестности ρ принадлежит RA.
Пусть Τ > 0 настолько велико, что ||0(Т;р)|| < α/2, где а настолько мала, что
открытая область ||а?|| < а заключена в RA- Рассмотрим окрестность ||х — р\\ < Ъ
точки р. Вследствие непрерывной зависимости решения от начальных состояний,
можно выбрать Ь настолько малой, что для любой точки q в окрестности ||ж —
—
ρ|| < Ь решение в момент времени Τ удовлетворяет неравенству
\\ф{Т;р)-ф(Т;д)\\<%.
754
ПРИЛОЖЕНИЕ С
Тогда
\\ф(Т;д)\\ < \\ф(Т;д)-ф(Т;р)\\ + \\ф(Т;р)\\ < а.
Из этого неравенства следует, что точка ф(Т; q) расположена внутри Дд. Следо
вательно, решение, начинающееся в q, стремится к началу координат при t —> оо.
Таким образом, q £ RA И множество RA является открытым. Читателю предла
гается показать (упражнение 8.13), что множество RA является связным. Утвер
ждение о границе для RA следует из следующей леммы.
Лемма С.7. Граница открытого инвариантного множества является ин
вариантным множеством, и, следовательно, она формируется траекториями.
ДОКАЗАТЕЛЬСТВО. Пусть Μ — открытое инвариантное множество и х —
его граничная точка. Существует последовательность хп G М, которая сходится
к х. Поскольку Μ является инвариантным множеством, решение ф(Ь\ хп) при
надлежит Μ для всех t e R. Последовательность </>(£; хп) сходится к ф{^ х) для
всех t G R. Таким образом, </>(£;#) является предельной точкой Μ для всех t.
С другой стороны, </>(£; х) £ М, т. к. х является граничной точкой М. Поэтому
решение ф{Ц х) принадлежит границе Μ для всех t.
Π
С.17. Доказательство теоремы 11.1
Рассмотрим нередуцированную задачу, представленную уравнениями (11.10)
и (11.11) в (х, у)-переменных. Тогда оценку ошибки для z можно непосредствен
но получить с использованием замены переменных (11.9). Пусть у принадлежит
открытой области Dy, где (11.9) отображает Dx x Dy в Dz. При анализе (11.12)
с медленно изменяющимися t и х мы используем свойство равномерной экс
поненциальной устойчивости (11.15) пограничной (быстрой) модели. Неравен
ство (11.15) справедливо лишь при х £ DX9m, следовательно, для его использова
ния необходимо убедиться в том, что медленно меняющаяся переменная х всегда
принадлежит Dx. Это представляется правдоподобным, т.к. решение х редуци
рованной задачи (11.8) принадлежит S, компактному подмножеству Dx. В этом
случае, если ошибка ||х(£,е) — x{t)\\ имеет порядок Ο(ε), то при достаточно ма
лой ε переменная х будет принадлежать Dx. Для доказательства справедливости
оценки ||x(i,e) — ж(£)|| = 0(ε) мы используем специальную технику
13
.
Если
Вхф i?n
, пусть Ε — дополнение Dx в R
n
.
Определим
k = iinf{||ж -y\\\xeS,у
еЕ}>0.
ЕслиDx =R
n
, в качестве к можно выбрать любую положительную константу.
Множества
S1 = {xeR
n
\ dist(x,S)<к/2} и S2={хеR
n
\ dist(x, S) < к}
13
Аналогичный метод используется при доказательстве теоремы о центральном многообразии.
(См. приложение С. 15.)
C.17 . ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 11.1
755
являются компактными подмножествами множеств Dx и S С S\ С #2. Пусть φ :
Rn
— > [0,1] — некоторая гладкая (непрерывно дифференцируемая бесконечное
число раз) функция, такая что ф(х) = 1, если х принадлежит Si, и ф(х) = О,
если х расположена вне S2.
14
Определим F иС равенствами
F(t, х, у, ε) = /(*, <р(х),у + Λ(*, ^(α;)), ε),
(С.67)
G(t,x,y,e) = g(t,ip(x),y + h(t,ip(x)),e) - e-^(t,tp(x)) -
-e|£(t, ¥>(s))/(t, v(x),» + Λ(«, *>(*)), 6),
(C.68)
где (p(x) = (x—ξο)<Κ#)+£ο· Можно легко показать, что для всех х е R
n
величина
<р(х) ограничена и принадлежит Dx, т. к. множество Dx выпукло. При х G S\
получаем ip{x) = х и, следовательно, функции F и / идентичны. Аналогичное
утверждение справедливо и для функций G и д — e[(dh/dt) + (dh/dx)f]. Можно
показать, что для всех (t,x,y,s) Ε [0,£i] х Д
п
х Ω1 х [0,εο], где Ω1 — любое
компактное подмножество Dyy справедливы следующие утверждения:
•
F и G и их первые частные производные по ε непрерывны и ограничены.
• F(t, х, у, 0) имеет ограниченные первые частные производные по (х, у).
• G(£,x,y,0) и [dG(£,x,y,0)/<9y] имеют ограниченные первые частные про
изводные по (t, ж, у).
Рассмотрим модифицированную задачу с сингулярными возмущениями
x = F(t,x,y,e), x(t0)=£(e),
(C.69)
гу = G(t,*,y,£), y(t0) = τ/(ε) - Λ(*ο,ξ(ε)).
(C.70)
Модифицированная задача (С.69) и (С.70) идентична исходной задаче (11.10)
и (11.11) при х е Si. Множество Si было выбрано с таким расчетом, что решение
x(t,e) будет всегда принадлежать Si. Этот расчет представляется оправданным,
т. к. x(t) £ S. Пограничная модель
% = G(t,x,y,0)
(C.71)
имеет точку равновесия в у = 0. Поскольку
G(t, х, у, 0) = g(t, ч>(х), у + h(t, у>(ж)), 0)
для любой фиксированной х Ε Rn
, пограничная модель (С.71) может быть пред
ставлена в форме пограничной модели (11.14) с <р(ж) е Dx в качестве фикси
рованного параметра. Поскольку неравенство (11.15) выполнено равномерно по
Существование φ доказано в лемме 6.2 из главы 23 в [111].
756
ПРИЛОЖЕНИЕ С
фиксированному параметру, очевидно, что решения уравнения (С.71) удовлетво
ряют тому же неравенству для всех жей\т.е.
Ilvtoll <fc||»(0)||exp(-7r),V||y(0)|| <po,V(i,x) € [0,*i] xR
n
^r > 0. (C.72)
Редуцированная задача для (С.69) и (С.70) имеет вид
i = F(t,x,0,0), ж(«о) = &.
(C73)
Эта задача идентична редуцированной задаче (11.8) при х е Si. Поскольку (11.8)
имеет единственное решение x(i), определенное для всех t Ε [to,ti] и x(t) £ 5,
очевидно, что x(t) является единственным решением уравнения (С.73) при
t G [to, ti]. Продолжим доказательство теоремы для модифицированной задачи
с сингулярными возмущениями (С.69) и (С.70). После этого мы покажем, что
при достаточно малой ε решение x(t,e) системы (С.69)-(С70) принадлежит Si.
Из этого будет следовать, что исходная и модифицированная задачи имеют совпа
дающие решения, что доказывает теорему для исходной задачи (11.10) и (11.11).
Рассмотрим пограничную модель (С.71). Поскольку [dG/dy] имеет ограни
ченные первые частные производные по (t,x) и G(t,x,0,0) = 0 для всех (£,ж),
матрицы Якоби [dG/dt] и [dG/dx] удовлетворяют
dG
dt
<Li
dG
дх
<
L
2\\y\\
Учитывая эти оценки и (С.72), с использованием леммы 9.8 можно заключить,
что существует функция Ляпунова Vi(t,x,y), удовлетворяющая
ci\\y\\2
<Vi(t,x,y)^c2\\y\\2
,
Ща&х.у,0)^-сз\\
dVi
ду
<с4||у||;
dVi
dt
^съ\\у\\2
·
dVi
dx
ocelli/112
(C.74)
(C.75)
(C.76)
длявсеху€{||у||<ро}и(t,x) €[0,ii]xR
n
.
Производная Vi вдоль траекторий
системы (С.69)^(С.70) определяется равенством
ъ=Щ°^
х
^
£
)+
^
+
εду
flVj dVi
dt
дх
idVi
ду
F(t,x,y,e)
=
= ^G(t,x,y,0)
+ ^[G(t,x,y,e)-G(t,x,y,0)}
+
Используя (С.75) и (С.76) и оценки
\\F(t,x,y,e)\\ ^ ко; \\G(t,x,y,e) - G(t,x,y,0)\\ ^
ei
3,
C.17 . ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 11.1
757
получаем
Vi < -f ||у||2
+ cALz\\y\\ + <%||»||
2
+ Фо\\у\\2
Таким образом, если в некоторый момент времени t* ^ to выполнено \\y(t*, ε)\\ <
Poy/ci/c2 = μ, то решение y(t,e) будет удовлетворять экспоненциально убыва
ющей оценке
•a(t-t*
\\y(t,e)\\ < М\/с2/с1 ехр
+ ε£, Vt^i*,
(C.77)
где а = сз/4с2 и δ = 2с2С4£з/с1Сз. С другой стороны, y(to,e) = η(ε) -
—
h(to> £(ε)) = Vo — h(to, £0) + Ο (ε) и 770 — h(to, ξο) принадлежат Ωυ, компактному
подмножеству области притяжения пограничной модели
^ = G(io,&,»,0) = 5(io,io,tf + M*o.io),0).
(C.78)
Из обратной теоремы Ляпунова 4.17 следует, что существует функция Ляпуно
ва Vo(y), такая что в области притяжения выполнено неравенство
^(*0,&,У + М«о.Ы.О) < -W0(y),
где Wo(y) — положительно определенная функция и {Vo(y) ^ с} — компактное
подмножество области притяжения для любой с > 0. Выберем со так, чтобы Ω^
принадлежало внутренности множества {Vo(y) ^ со}. Производная Vb вдоль тра
екторий всей системы (С.69)-(С.70) определяется равенством
Vo = l^G(t,x,y,e)
=
= l^G(to,ξο,У, 0) + \η£[G(t,x,у,ε) - G(t0,ξο,у, 0)].
Можно показать, что для всех (£,у) £ [to,to + εΤ] х {Vo(y) < со} неравенство
Vo^l[-W0(y) + ao£(l + T)}
справедливо для некоторой ао > 0. Из теоремы 4.18 следует, что существует
εΙ > 0 такая, что при 0 < ε < ε| решение y(i,s) удовлетворяет неравенству
||y(t,ε)|| < /?(μ2, (t - to)/ε) + ρ(ε(1 + Τ))
758
ПРИЛОЖЕНИЕ С
на интервале [to, to 4- εΤ], где β — /С£-функция, ρ — /С -функция и μ2 — некоторая
положительная константа. Выберем Τ настолько большим, что β(μ2,Τ) < μ/2.
После этого выберем ε* < ε£ настолько малой, что ρ(ε*(1 + Τ)) < μ/2. Тогда
при ε < ε* решение y(t,e) удовлетворяет
\\y(t,ε)\\ <μ1 +μ/2 при te [to, t0+ εΤ] и \\y(t0 + εΤ,ε)|| < μ, (C.79)
где μ1 = /?(μ2,0). Тогда из (С.77) и (С.79) следует
-
a(t - to)
\\y(t,e)\\ <: fciexp
+ ε5, Vt^to,
(C.80)
для некоторой fci > 0.
Рассмотрим (С.69). Переписав правую часть в следующей форме:
F(t, ж,у,ε)= F(t, x, 0,0)+[F(t, х,у,ε)- F(t, яг,0,0)],
можно рассматривать (С.69) в качестве возмущения редуцированной систе
мы (С.73). Член возмущения в скобках удовлетворяет
||F(i,x,</,£)-F(t,x,0,0)|| ^||F(t,x,^)-F(t,*,y,0)|| +
+ ||F(i,x,y,0)-F(i,x,0,0)||<
^ Ь4^-ЬЬ5||у|| <
< θλε + 02ехр
к
-
-
где #i = Ζ/4 + ^5^ и 02 = L$ki. Определим
u(t,e) = x(t,e) — x(t).
Тогда
η&ε)=ξ(ε)-ξ{0)
+ / [^(5,φ,ε),</(5,ε),ε) - F(e,s(*),0,0)]de =
«/to
= ξ(ε) - ξ(0) + / [F(s, x(e, ε),y(e, ε),ε) - F(s, φ, ε),0,0)]ω +
Jto
+ / [F(s,x(5,s),0,0)-F(s,S(s),0,0)]ds
«/to
Jto
IKi,e)|| <fc2e+ / <0is + 02exp
-
a(s - to)
•ds + / L6||w(s,e)||ds <
Jt0
€ k2e+ [M*I-*O) + ^| +У ^6||«(β,ε)||ω
С17. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 11.1
759
С использованием леммы Гронуолла-Беллмана получаем оценку
\\x{t,e) -x{t)\\ <efe[l + *i -to]exp[L6(*i -*o)],
(C.81)
из которой следует оценка ошибки для х. Кроме того, можно заключить, что при
достаточно малой ε решение x(t,e) определено для всех t Ε [to, ^i]*
Для доказательства справедливости оценки для у рассмотрим (С.70), пред
ставленное во временном масштабе т:
dv
—
= G(t0 + ετ, x(t0 + ετ,ε),у,ε).
Пусть у(т) — решение пограничной модели
^ = G(to,£o,tf,0), 2/(0) = щ- Л(*0,Со)
и
ο(τ,ε) =у(т,е)-у(т).
Дифференцируя обе части по г и подставляя выражения для производных у и у,
получаем
^
= G(t0 + ετ, x(t0 + ετ, ε), </(τ, ε), ε) - G(t0,6, ν(τ), 0).
Прибавим и вычтем G(to + ετ, x(io + ετ, ε), ν, 0). В результате имеем
^
= G(*,:c,v,0)+AG,
(C.82)
ατ
где£=t0+ετ,ж=x(t0+ετ,ε),AG=ΔΧ+Δ2+Δ3и
ΔΧ = G(*,х,у,0)- G(i,х,у,0)- G(t,Χ,ν,0),
Δ2 = G(t, Χ,у,ε)- G(t, Χ,у,0),
A3 = G(*,x,£,0)-G(*0,£o,£,0).
Можно показать, что
II^IKM^ +fcslNHyll,l|A2||^eL3
||Δ3|| ^ Lx\t - to| ||y|| + L2\\x - &|| ||y|| «Ξ {LIST + L2ea + L2erfco)||y||,
где fej, A^, и а — некоторые неотрицательные константы. Выполнив выкладки,
которые привели ранее к (С.80), можно показать, что
||у(т)|| ^ к1е~
ат
,
Vr^0.
(С.83)
760
ПРИЛОЖЕНИЕ С
Следовательно,
||ДС|| < k4\\v\\
2
+ AfcfcilMI*"
0
"" +eL3+earful +r)e"
QT
^
< k4\\v\\
2
+ hhWvWe-^ + εα2,
(CM)
где а\ = max{Z/2a, L\ + L2ko} и a2 = L3 + aifci max{l, 1/α}. При получении
этого неравенства мы использовали тот факт, что (1 + т)е~
ат
^ тах{1,1/α}.
Уравнение (С.82) может рассматриваться как возмущение уравнения
^ = G(t,a?,v,0),
(C.85)
ат
которое по лемме 9.8 имеет функцию Ляпунова Vi(t,x,v)9 удовлетворяю
щую (С.74)-(С76). Вычисляя производную V! вдоль траекторий системы (С.82)
и используя оценку (С.84), получаем
< с5||»||
2
+ с6*о1М12
-
ψ |М|2
+ flMKfcllMI2
+ *5*ilM|e-" + εα2).
При ||ν|| < сз/4с4^4 и 0 < ε < сз/4(с5 + с^ко) получаем
Vi < -§N|2
+ ^||^||
2
e— + c,a2\\v\\ <
< -|(*α " Afce-^JVi + 2fccv^,
где fca = C3/4C2,fc&= 04^5^1/201 иfcc= C4d2/2y/ci. Положив VF = лАТ, имеем
£>
+
W(T) < -(ка - kbe~
ar
)W + екс,
где £>
+
W(r) — верхняя правая производная W по т. С использованием принципа
сравнения (лемма 3.4) можно заключить, что
W(T) < ^(r,0)W(0) +ε / ф(т,а)ксаа,
Jo
где
[-Г*-
0(г,σ)=exp - / (ка- fcbe
_aA
)dA и |0(τ,σ)|<ν"Ω9(τ
"
σ)
для некоторых кд,ад > 0. Используя тот факт, что ν(0) = О (ε), можно заклю
чить, что υ(τ) = О (ε) для всех τ ^ 0. Это доказывает утверждение о том, что
решение системы (С.69)-(С70) удовлетворяет
x(t,ε)- x(t) =Ο(ε), y(t,ε)- у(|) =Ο(ε)
C.18. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 11.2
761
для всех t Ε [toih] при достаточно малой ε. Поскольку x(t) Ε S, существует
настолько малая ε\ > О, что #(£,ε) Ε S± для всех t Ε [to, ti] при всех ε < ε£.
Следовательно, x(t^) и y(t^)
—
решения (ll.lO)-(ll.ll). Из (11.9) и с учетом
липшицевости h по х получаем
z(t,ε)- h{t,x(t)) - у(I) =y(t,ε)-у (f)+h(t, x(t, ε))- h(t, x(t)) =
= 0(ε).
Наконец, поскольку £(т) удовлетворяет (С.83) и
<ε, Va(i-to)^elni Jj,
член y(t/e) будет иметь порядок О (ε) равномерно на [t&,ti], если ε настолько
мала, что выполнено
Доказательство теоремы 11.1 завершено.
С.18. Доказательство теоремы 11.2
Доказательство этой теоремы аналогично доказательству теоремы 11.1. От
метим лишь два ключевых момента, представляющих отличия этих двух доказа
тельств. Во-первых, в теореме 11.2 х принадлежит Dx. Во-вторых, эти доказа
тельства различаются методом проведения анализа ошибки х—х. Доказательство,
модифицированное с учетом первого отличия, выполняется с использованием
функции Ляпунова V для редуцированной системы, а анализ указанной ошибки
осуществляется с использованием свойств устойчивости этой системы.
Используя функцию Ляпунова V, мы покажем, что х принадлежит компакт
ному множеству {H^i(x) < с} для всех t ^ to, и поэтому нам не нужно применять
усечение х с использованием функции ф(х)9 как это было сделано в доказатель
стве теоремы 11.1. Функции F и G, как и ранее, определены равенствами (С.67)
и (С.68), но с <р(х), замененной на х. Эти функции обладают теми же свойствами,
установленными ранее для всех (£,х,у, Ε) Ε [0, оо) х {Wi(x) ^ с} х Qi x [0,εο].
Более того, [dF/dx](tyx,0,0) липшицева по х равномерно по t. Для всех х Е
Ε {Wi(x) ^ с} можно повторить представленные ранее рассуждения и показать,
что y(t, ε) удовлетворяет (С.80). Следовательно,
V<-W3(x) +&6ε+ fc7exp ~
a
(*~*°) #
С учетом ξο Ε {И^(ж) ^ рс} можно показать, что существует момент времени
Т\ > О, не зависящий от ε, такой что при достаточно малой ε решение x(t,e) E
exp
-
a(t -10)
762
ПРИЛОЖЕНИЕ С
Ε {И^(х) ^ с} для всех t e[to,to + Ti]. При t^to + T\ экспоненциальный член
ехр[—a(t — to)/ε] имеет порядок 0(ε). Таким образом,
V ^ -W3(x) + 1ς8ε.
Используя это неравенство, можно показать, что V отрицательна на границе
V(t,x) = с. Поэтому x(t^) e {Wi(x) < с} для всех t ^ to.
Для получения оценки ошибки приближения u(t,e) = x(t,e) — x(t) рас
смотрим (С.69) как возмущение редуцированной системы (С.73) и вместо лем
мы Гронуолла-Беллмана используем метод Ляпунова с учетом экспоненциальной
устойчивости начала координат системы (С.73). Процедура выполнения этого
анализа аналогична той, что использовалась при доказательстве теоремы 11.1,
и поэтому ее изложение будет кратким. Ошибка и удовлетворяет уравнению
и=F(t,и,О,0)+AF,
(С.86)
где
AF=[F(t,х+щ0,0)-F(t,ж,0,0)-F(t,и,0,0)]+
+ [F(t,x,i/,e)-F(t,x,0,0)].
α(* - *о)
Можно показать, что
\\AF\\ < fc4|N2
+ fc5NII|a|| + fc6exp
Система (С.86) рассматривается как возмущение уравнения
u = F(i,u,0,0).
+ ε&7·
(С.87)
Поскольку начало координат (С.87) экспоненциально устойчиво, по теореме 4.14
существует функция Ляпунова V(t, и). При этом ее производная вдоль решений
(С.86) имеет вид
^=1
+
1^°.<»
+
1^«
^ -сз|М|2
+ C4IHI <fc4lMI2
+ ЫЫ\ \\х\\ + кбвхр
a(t - t0)
+ ε&7
При 11 it 11 < сз/2с4^4 выполнено
V ^-2\ka-
kbe-
a{t
-
to)
]V+2<ε%€+ kdexp
-
a(t -10)
V&
C.19. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 12.1
763
для некоторых fca, а > О и &ь,fcc,kd ^ 0. Применяя принцип сравнения, получаем
W(t)^ci>(t,to)W(0) +
гдеW=vV и
ffa*)\екс + kd exp
ds,
\<j>{t,s)\ < ν"^-*
ο), σ>0,fcp>0.
Поскольку u(to) = Ο (ε) и
у.
ехр[—σ(£ — 5)] exp
a(s - *o)
ds = Ο(ε),
можно показать, что W(i) = 0(ε) и, следовательно, τ/(£,ε) = 0(ε). Дальнейшее
доказательство проводится аналогично тому, как это было сделано в доказатель
стве теоремы 11.1. Заметим, что анализ пограничной системы в этом доказатель
стве справедлив для всех τ ^ 0.
С.19. Доказательство теоремы 12.1
Выполним анализ замкнутой системы (12.45) с использованием результатов
параграфа 9.6, рассматривая ее как медленно меняющуюся систему. Посколь
ку в представленном доказательстве зависимость от w не играет никакой ро
ли, запишем д(Х, р, w) в виде д(Х, р). Можно показать, что д(Х, р) непрерывно
дифференцируема в открытой области Ox x Dp и Xss(oi) и Ams(a) — непре
рывно дифференцируемы в Dp. Поскольку Ams(a) гурвицева для всех a Ε Dp,
она также является гурвицевой равномерно по а для всех a Ε S (компактное
подмножество Dp). Следовательно, Ams
удовлетворяет всем предположениям
леммы 9.9 при а Ε S. Пусть Pms
= Pms(a) — решение уравнения Ляпунова
PmsAms + A%lsPms = -I. Используем V(XS, a) = XjPmsX8 в качестве функции
Ляпунова для системы с фиксированной переменной планирования Χδ = д(Х$ +
+ Xss(a),a). Из леммы 9.9 следует, что ν(Χδ,α) удовлетворяет (9.41), (9.43)
и (9.44). Единственное, что осталось проверить, — это условие (9.42). Система
с фиксированной переменной планирования может быть переписана в следую
щей форме:
Χδ = Ams(a)Xd + Ад(Х&, a),
где
\\Ад(Х6,а)\\2 = \\g(X6 + Xss(*),a)-Ams(a)Xs\\2
^ ^\\Χδ\\2
2
в некоторой открытой области {ЦД^Цг < т{\. Таким образом, производная функ
ции V вдоль траекторий системы Х$ = д(Х$ + Xss(oi)^a) удовлетворяет при
||Д^||2 < l/(4c2^i) неравенству
ν^-\\Χδ\\1 + 2β2^\\Χδ\\1^-ΗΧδ\\1
764
ПРИЛОЖЕНИЕ С
Поэтому существует г > О, такая что V(Xs,a) удовлетворяет (9.41)-(9.44) для
всех (λ$,α) е {ЦД^Цг < г} х S. Тогда утверждения теоремы 12.1 следуют из
теоремы 9.3.
С.20. Доказательство теоремы 12.2
Для исследования замкнутой системы (12.58)—(12.59) используем метод ана
лиза медленно меняющихся систем, представленный в параграфе 9.6, и метод
анализа устойчивости систем с сингулярными возмущениями, представленный
в параграфе 11.5. Поскольку в этом доказательстве зависимость от w не играет
никакой роли, запишем (12.58)—(12.59) в следующей форме:
х =д(х,Р)+N(PNo - Ф(*>р)1,
(С88)
εθ = -Φ + φ(Χ,ρ).
(С.89)
При ε = О получаем редуцированную систему X = д(Х,р), анализ которой
был выполнен при доказательстве теоремы 12.1 с использованием квадратичной
функции Ляпунова XjPmsXs- Можно показать, что ф(Х, р) является непрерывно
дифференцируемой в открытой области Dx x Dp. Замена переменных
y = X-Xss(p), Ζ = υ-φ(Χ,ρ)
приводит систему (С.88)-(С89) к виду
Fix
У =9(У+Xjj>),ρ)+Ν(ρ)Ζ -η^ρ,
(C.90)
εΖ = -Ζ- е^\д{У + *ss(p), ρ) + Ν(ρ)Ζ] - ε^ρ.
(CM)
Используя V = y
T
Pmsy + (1/2)ΖΤΖ в качестве функции Ляпунова для систе
мы (С.90)-(С.91), получаем оценку
V= -У
Т
У+
+2УтРтз
9(У + Х»(р), Р) - Ams(p)y + N(p)Z - η^ρ +
+У
Т
ftPms(p)
-\Z
T
Z-Z
T
{%t[g(y + Xss(p),p) + N(p)Z] + Щ <
< -\\У\\1 - hWtt +
С
^У\\1 + °211У1Ы|Я||2 + сз1|У||2||р||2 +
+с4||У|||||р||2 + сб||2||| + свИ|2|И|2,
справедливую в некоторой окрестности начала координат для некоторых поло
жительных констант С{. Ограничиваясь при выполнении анализа системы рас
смотрением некоторой окрестности, в которой выполнено \\У\\2 ^ С7 ^ l/(4ci),
C.21. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 13.1
765
получаем новую оценку
V < -i|Mli - ±\\Z\\l + (с3\\У\\2 + с4с7\\У\\2 + сб||2||2)||р||2
\\УЬ
\\zh
1/4
с2/2
[ -с2/2 1/(2ε) - с5
\\УЬ
Ц2||2
Выбрав ε* настолько малой, что (2 х 2)-матрица в предыдущем выражении явля
ется положительно определенной для всех 0 < ε < ε*, получаем окончательную
оценку
ν^-2αν + 2/?Λ/ν||ρ||2
для некоторых положительных констант а и β. Следовательно, W = VV удовле
творяет неравенству
D+W ^-aW + β\\ρ\\2.
Доказательство теоремы завершается применением леммы сравнения.
С.21. Доказательство теоремы 13.1
При доказательстве используются понятия скобок Ли и инволютивных рас
пределений, введенных в параграфе 14.3, а также понятие полной интегрируемо
сти. Невырожденное распределение Δ на D с генераторами Д,..., Д называется
полностью интегрируемым, если для любой точки XQ € D существует некоторая
ее окрестность N и η — к вещественных гладких функций hi(x),...,
hn_fc(x),
такие что
dhj
дх
fi(x) =0,VI^г<к и
l^j^n-k
и вектор-строки dh\(x),...,
dn-k(x) линейно независимы для всех х G D, где
ад=| =
dh
dh
dxi'" '' дхп
называется дифференциалом h. Ключевым результатом дифференциальной гео
метрии является теорема Фробениуса,
15
в которой утверждается, что невырож
денное распределение является полностью интегрируемым, если и только если
оно является инволютивным.
Сформулируем две вспомогательные леммы.
ЛеммаС.8.Длявсехх ΕDилюбыхцелых чисел киj,такихчток >0
uO^j^p
—
к — 1, выполнено
τ rkhi ^J°>
0^j + k<p-l,
Ь
а^дЧ^
х
) ~\ (-lyLgL^hix) ф0, j +k= p-l.
(C.92)
^Доказательство этой теоремы приведено, например, в книге [88].
766
ПРИЛОЖЕНИЕ С
ДОКАЗАТЕЛЬСТВО. Доказательство будет выполнено с использованием ме
тода математической индукции по j. При j = О (С.92) выполнено по определе
нию относительной степени системы. Предположим, что (С.92) выполнено при
некотором j, и докажем справедливость этого равенства при j + 1. Из тождества
Якоби (упражнение 13.8) следует, что равенство
Цт
х
(х)
=
L
f^4
x
)-
L
pLfX(x)
выполнено для любой вещественной функции λ и любых векторных полей / и β.
Положив λ = Lhh и β = adig, получаем
Заметим, что первый член в правой части обращается в нуль, т. к.
j + HUp-Uj + k<p-U LfLadJgL
k
fh(x)
=0.
Более того, справедливо
(Kj + fc+Kp-1,
iyLgL
p
f-
l
h{x)
^0, j+к+1=ρ-1,
вследствие предположения о выполнении (С.92) при j. Таким образом,
L
ad^g
Lk
fh(
X
) ~ { (-1)3+1 LgL^hk
OO' + HKp-l,
х)φ0, j+к+1=ρ-1.
Доказательство леммы завершено.
Лемма С.9. Для любой х е D
• вектор-строки dh(x), dLfh(x),...,
dl^
-
/i(#) линейно независимы;
• вектор-столбцы #(х), adfg(x),...,
абК~ #(#) линейно независимы.
ДОКАЗАТЕЛЬСТВО. Выполнено
d/i(x)
L dL^hix) J
р(ж) ... ad£ ^(я)
Lp/i(x)
Ladfgh(x)
LgLfh(x)
LgL
p
flh{x)
*
^ad£-
2
pLfh(x)
ad^g
h
(x)
a
C.22. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 13.2
767
Из предыдущей леммы следует, что матрица в правой части предыдущего равен
ства имеет вид
О
Оо
О
о*
О
о
где о обозначает ненулевой элемент. Таким образом, эта матрица невырожденна,
что доказывает утверждение леммы, т. к. если любые две матрицы в левой части
равенства имеют ранг меньше р, то их произведение должно быть вырожденным.
Π
Из леммы С.9 следует, что ρ ^ η. Перейдем к доказательству теоремы 13.1.
Доказательство случая ρ = η следует из первого пункта леммы С.9, возможная
переформулировка которого гласит, что матрица [дТ/дх] невырожденна. Обра
тимся к рассмотрению случая ρ < п. Распределение Δ = span{^} невырож
денно, инволютивно и имеет размерность единица
16
. По теореме Фробениуса, Δ
является полностью интегрируемым. Следовательно, для любой хо £ D суще
ствуют ее окрестность ^ип-1 гладких функций ф\(х),...,
фп-\{х) с линейно
независимыми дифференциалами, такие что
Ьдфг(х) Опри1<г^ η-1, VxeNi.
,L*
2
h могут рас-
Поскольку
LgL)h{x) = 0при0<г^р-2
и dh(x),...,
dLpf h(x) линейно независимы, функции /i,.
сматриваться как часть этих η — 1 функций. В частности, пусть эти функ
ции соответствуют функциям </>n_p+i,... ,0n_i. Поскольку LgL
p
fh{x)φ0,
вектор-строка dLpf h(xo) линейно независима по отношению к вектор-строкам
d0i(a?o), · · · >#n-i(#o). Поэтому
rank ЭТ
дхЫ) = п=>
дТ
^т-(жо) невырожденна
и существует окрестность ЛГ2 точки хо, такая что отображение Т(х), суженное
на ЛГ2, является диффеоморфизмом на АГ2. Положив Ν = Ν\ Π Л/^, завершаем
доказательство теоремы.
С.22. Доказательство теоремы 13.2
Система
х=f(x)+g(x)u
Заметим, что любое невырожденное распределение размерности единица является инволю-
тивным.
768
ПРИЛОЖЕНИЕ С
является линеаризуемой обратной связью, если и только если существует доста
точно гладкая функция h(x), такая что система
х=f(x) +д[х)и, у =h(x)
имеет относительную степень η в Д) С D, т. е. h(x) удовлетворяет
LgL)h(x) = 0при0^г<п-2 и LgL
n
flh{x) φО,Ух€D0.
(C.93)
Таким образом, для доказательства теоремы необходимо показать, что существо
вание h(x), удовлетворяющей (С.93), эквивалентно условиям 1 и 2.
Необходимость. Предположим, что существует h(x), удовлетворяющая
(С.93). Из леммы С.9 следует, что rank<? = п. Тогда V невырожденно и име
ет размерность η — 1. Из (С.92) при к = О и ρ = η получаем равенство
Lgh(x) = Ladfgh(x) = · ·. = Ladn-2gh(x) = О,
которое может быть переписано в следующей форме:
dh(x)\g(x),adfg(x),...
,adj~
2
g(x)] = 0.
Из этого равенства следует, что V полностью интегрируемо и, следовательно (по
теореме Фробениуса), инволютивно.
Достаточность. Предположим, что условия 1 и 2 выполнены. Тогда V невы
рожденно и имеет размерность η — 1. Из теоремы Фробениуса следует, что су
ществует h(x), удовлетворяющая равенству
Lgh(x) = Ladfgh{x) = · · · = Ladn-2gh(x) = 0.
С использованием тождества Якоби (упражнение 13.8) можно показать, что
Lgh(x) =LgLfh(x) = · · · = LgL
n
f2h{x) = 0.
Кроме того,
dh{x)Q(x) = dh{x)[g{x),adfg{x),...,a(Pf1g{x))
= [0,...
,0,Ladn-igh(x)}.
Поскольку rank С/ = η и dh(x) Φ 0, должно выполняться неравенство
L dn-i h(x) φ 0. Используя тождество Якоби, можно показать, что LgL
n
f~
l
h{x)^
fУ
J
Φ 0, что завершает доказательство теоремы.
С.23. Доказательство теоремы 14.6
Для выполнения анализа заменим уравнение динамики наблюдателя на эк
вивалентное с масштабированной ошибкой оценки
C.23. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 14.6
769
где1<г^гаи1^j<pi.Следовательно,х =х —0(ε)η, где
V = [чп,..., ЩР1,..., гутЬ ·. ·, Vmpm]
T
>
D(e) = block diag[Db ..., Z?TO],
Di=
dmg[e
pi
- \...,l]PiXpi.
Замкнутая система может быть представлена в виде
х = Ах +В0(ж,г,7(0,ж - £>(е)*7,С))»
i = ^(ж, *, 7(0, ж - £>(ε)τ/, О),
0 = Г(0,х-ВДт7,С),
εη = А0Г7 + еВ5(х, z, 0,0(ε)η),
где
i(x, г,0, £>(ε)τ/) = 0(ж, г, 7(0, ж, О) - Фо(*> С, 7(0, я, О)
и (1/ε)-Αο = Ζ)_1
(ε)(^ — HC)D(e) — гурвицева (ρ х р)-матрица. Для удобства
перепишем систему в компактном виде системы с сингулярными возмущениями
X = F(X,D(e)V),
(C.94)
εη = Α0η + εΒΑ(Χ, Ω(ε)η),
(C.95)
где F(X,0) — f(X). Начальными состояниями являются Х(0) = (x(0),z(Q),
0(0)) е S и х(0) е Q. Таким образом, получаем η(0) = Γ)~
1
(ε)[α;(0) - £(0)].
Полагая в (С.95) ε = 0, имеем гу = 0, и редуцированная система
X=f(X)
(СМ)
представляет собой не что иное, как систему, замкнутую обратной связью по
состоянию. Для получения пограничной модели выполним замену переменной
времени г = t/ε и положим в полученной системе ε = 0. В результате этого
получаем
d
V
л
Тг
=
Λοη-
Поскольку начало координат системы (С.96) асимптотически устойчиво и ΤΖ —
его область притяжения, из обратной теоремы Ляпунова 4.17 следует, что су
ществуют гладкая, положительно определенная функция V(X) и непрерывная,
положительно определенная функция U(X), определенные при всех X е TZ, та
кие что
V{X) ->ооприX ->дП,
2£f(x)^-u(x), \/хеп,
и для любой с>0 множество {V(X)^c}
является компактным подмножест
вом TZ. Пусть S — любое компактное множество, принадлежащее внутренности 1Z.
770
ПРИЛОЖЕНИЕ С
Выберем положительные константы бис так, чтобы с > b > maxxesV(X).
Тогда
sсΩ6 = {v(x) o}cfic = {v(x) <с}стг.
Для пограничной системы функция Ляпунова \¥(η) = ητΡοη, где Ро — положи
тельно определенное решение уравнения Ляпунова Ро А) + ALQPO — —I, удовле
творяет неравенствам
(р0)1М12
< win) < Amax(P0)IMI2
,
^Λ>»Κ-ΝΙ
2
,
где ||·II
=
II * II2· Вследствие эквивалентности норм, достаточно провести дока
зательство выполнения (14.114) и (14.115) для 2-норм. Пусть Σ = {νν(η) ^ ρε
2
}
и Λ = Ω0 х Σ. Вследствие глобальной ограниченности функций F и Δ по х для
всехXGΩ0иηGRp
имеем
\\F(X,D(£)V)\\^h,
\\A(X,D(s)V)\\^k2,
где к\ и кч — положительные константы, не зависящие от ε. Более того, для
любой 0 < ε < 1 существует Li, не зависящая от ε, такая что для всех (Χ, η) Ε А
илюбой0<ε^εвыполнено
\\F(X,D(e)V)-F(X,0)\\^Li\\ril
Далее будет всегда предполагаться, что ε < ε. Покажем, что существуют положи
тельные константы р и е\ (зависящие от р), такие что компактное множество Λ
положительно инвариантно для любой 0 < ε ^ е\. Для этого необходимо пока
зать, что
V^-U(X)+eks
и
W < -\\Ы\2
+ 2\\η\\ ||Ро|| ||В||*2 < ~\Ы\2
+ 2Ы1 ||Д>||*2
для всех (Χ,η) <Е Λ, где кг = Ь1Ь2>/о/Х^{Щ,
\\PQ\\ = Amax(P0), ||B|| = 1
и 1/2 — оценка сверху для ||c?vy<?A?|| на Ω0. Полагая ρ = 16к
2
\\Ро\\
3
и ei = /?/&з>
где /? = min<vG5Qc U(X), можно показать, что для любой 0 < ε < е\ выполнено
V < 0 для всех (ДГ, ту) <Е {V(X) = с}хЕи W < 0 для всех (ДГ, 77) £Ω0Χ{Ι^(τ7) =
= £>ε
2
}. Следовательно, множество Λ является положительно инвариантным.
Далее, рассмотрим начальное состояние (Х(0),х(0)) Е S x Q. Можно по
казать, что соответствующая начальная ошибка 77(0) удовлетворяет ||г7(0)|| ^
^/6(^max-i) ддд некоторой неотрицательной константы к9 зависящей от S и Q,
где ртах = max{pi,... , рт}· Поскольку Х(0) принадлежит внутренности Ω0,
можно показать, что неравенство
\\х(г)-х(о)\\^кгг
(С.97)
C.23. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 14.6
771
выполнено, если X(t) G Ωβ. Таким образом, существует конечный момент време
ни То, не зависящий от ε, такой что X{t) Ε Qc для всех t € [0, То]. На протяжении
этого интервала времени выполнено
W < -±\\η\\2
-
±\\η\\2
+ 2k2\\P0\\ \\η\\ ^ -±\\η\\2
при \¥(η) > ρε
2
,
W(V) > ρε
2
=> \\Ρο\\ \\η\\2
> 16Α;2
2
||Ρο||3ε
2
о |Μ| > 4&2||Ρ0||ε.
Поэтому
W{v{t))
^ ε2(Ρ11-1) ех?(-<пФ),
(С.98)
где σ\ = 1/(2||Ρο||) и σ2 = &
2
||Ρο||· Выберем ε^ > 0 настолько малой, что
для всех 0 < ε ^ ε2· Заметим, что ε^ действительно существует, т.к. Τ (ε)
стремится к нулю при ε —• 0. Следовательно, \ν(η(Τ(ε))) < ρε
2
для любой
0 < ε < ε2» Выбор ε\ = ππη{ε,ε1,ε2} гарантирует, что для любой 0 < ε ^ ε£
траектория (X(t), ry(t)) достигает Λ в течение интервала времени [0, Τ(ε)] и оста
ется в этом множестве для всех t ^ Τ (ε). Таким образом, траектория является
ограниченной для всех t > Τ(ε). С другой стороны, при t e [0,Τ(ε)] траектория
ограничена, т. к. выполнены неравенства (С.97) и (С.98).
Далее, докажем (14.114). Нам известно, что для любой 0 < ε ^ ε\ решения
принадлежат множеству Λ для всех t ^ Τ(ε), где Λ имеет порядок О (ε) в на
правлении переменной η. Таким образом, можно найти ε% = ε^(μ) < ε\, такую
что для любой 0 < ε < ε$ справедливо
||q(t)|| ^ μ/2, W > Τ(ε3) = Γ(μ).
(C.99)
С учетом того факта, что V ^ —U(X) + ε&3 для всех (Χ, η) е Λ, можно заклю
чить, что
V ^ -\и(х)
при X 0 {С/(ДГ) < 2Α;3ε
d
= i/(e)}.
(С.100)
Поскольку CZ(A') является положительно определенной и непрерывной, мно
жество {U(X) ^ Κε)} является при достаточно малой ε компактным. Пусть
со (ε) = тахи(Х)^„(е){У(Х)}; со (ε) — неубывающая и lime^0co(e) = 0. Рас
смотрим компактное множество {V(X) ^ οο(ε)}. Выполнено {U(X) < Κε)} С
{У(Л') ^ co(ε)}. Выберем ε± = ε±(μ) ^ ε\ настолько малой, что для всех ε ^ ε±
множество {U(X) ^ Κε)} является компактным, множество {V(A') ^ ^ο(ε)}
принадлежит внутренности Ω0 и
{V(*) <<*(ε)} С {||*К μ/2}.
(С.101)
772
ПРИЛОЖЕНИЕ С
Тогда для всех X G Ω0, таких что X $. {V(X) ^ со (ε)}, получаем неравен
ство, аналогичное (СЛ00). Поэтому можно заключить, что множество {V(X) ^
^ со (ε)} х Σ является положительно инвариантным и любая траектория в Ω0 х Σ
достигает {νΓ(Λ') ^ ^(ε)} х Σ за конечное время. Другими словами, если вы
полнено (С. 101), то существует конечный момент времени Τ = Τ(μ), такой что
для любой 0 < ε ^ ε4 выполнено
\\X(t)\\ <μ/2. Vt^f.
(C.102)
Положим εξ = εξ (μ) = πηη{ε3,ε4} и Т2 — Τ2{μ) = max{T,T}. Тогда (14.114)
следует из (С.99), (С. 102), х = х- Ω{ε)η и ||Ζ>(ε)|| = 1.
Для доказательства (14.115) разделим интервал [0, оо) на три подынтерва
ла [0,Τ(ε)], [Т(г),Гз] и [Тз,оо) и покажем, что на каждом из них выполне
но (14.115). Из предельной ограниченности X(t) (см. (14.114)) и асимптотиче
ской устойчивости начала координат системы (С.96) можно заключить, что су
ществует конечный момент времени Тз ^ Τ (ε), не зависящий от ε и такой, что
для любой 0 < ε ^ εξ выполнено
\\X(t) - Xr(t)\\ ^ μ, Vf ^ Т3.
(С.103)
С учетом (С.97) можно утверждать, что неравенство
\\X(t)- *(0)||< Μ
выполнено на интервале [0, Τ(ε)]. Аналогично можно показать, что неравенство
\\Xr(t) - Х(0)\\ <fci*
выполнено на том же интервале. Следовательно,
\\X(t) - Xr{t)\\ ^ 2&1Γ(ε), Vt e [0,Γ(ε)].
Поскольку Τ (ε) —> 0 при ε —> 0, существует 0 < ε$ < εξ, такая что для любой
0<ε^ε5выполнено
||*(t) - ХтШ ^ μ, V* € [0,Γ(ε)].
(С.104)
На интервале [Τ(ε),Τ3] решение X(t) удовлетворяет
X = F(^,D(e)i7(i)) при ||*(Г(е)) - Л^(Г(е))|| < ii(e),
где Ω(ε)η имеет порядок О (ε) и ^(ε) —• 0 при ε —> 0. Таким образом, используя
теорему 3.5, можно заключить, что существует 0 < εβ ^ εξ, такая что для любой
0<ε<εβвыполнено
||*(t) - ХгШ\ <μ,Vte [Γ(ε),Γ3].
(С.105)
Пусть ε£ = πυη{ε5,ε6}. Тогда (14.115) следует из (С.103)-(С105).
C.23. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 14.6
773
Наконец, в предположении, что начало координат системы (С.96) экспонен
циально устойчиво, с использованием обратной теоремы Ляпунова 4.14 мож
но показать, что существует непрерывно дифференцируемая функция Ляпунова
V\{X), удовлетворяющая в шаре Вг с TZ неравенствам
h\\x\\
2
< vx{x) ^ 62||Af
dVi
дХ F(*,0)<-63||<*f
dVi
дХ
< h\\X\\
при некоторых положительных константах г,Ь\,Ь2,Ь$ и Ъ±. С учетом локальной
липшицевости F и Δ, а также того факта, что F(0,0) = 0 и Δ(0,0) = 0, можно
показать, что композитная функция Ляпунова ^(А",т/) = Vi(X) + \¥(η) удовле
творяет
V2< -У
Т
ЯУ,
где
Q=
-ft
ft
(!/*)-& J'
У = 11*11
и Pi и /?2 — некоторые неотрицательные константы. Матрица Q является по
ложительно определенной при достаточно малой ε. Следовательно, существует
окрестность Μ начала координат, не зависящая от ε, и εγ > 0, такие что для
любой 0 < ε ^ ε-j начало координат является экспоненциально устойчивым
и любая траектория в Λ/" стремится к началу координат при t —> оо. Из (14.114)
следует, что существует ε% > 0, такая что для любой 0 < ε ^ ε8 решения,
начинающиеся в S x Q, достигают N за конечное время. Следовательно, для
любой 0 < ε ^ ε\ = πηη{ε7,ε8} начало координат является экспоненциально
устойчивым H5XQ- подмножество области притяжения.
Библиографические комментарии
При работе над этой книгой в качестве основных работ в области тео
рии обыкновенных дифференциальных уравнений использовались книги Хирша
и Смейла (Hirsch and Smale) [81], Хейла (Hale) [75] и Миллера и Мишела (Miller
and Michel) [135]; в области теории устойчивости — Хана (Hahn) [72], Красовско-
го (Krasovskii) [107] и Руша Абетса и Лалуа (Rouche, Habets and Laloy) [154]; так
же использовались книги Видьясагара (Vidyasagar) [201] (первое издание) и Сю
и Мейера (Hsu and Meyer) [85]. Соответствующие ссылки по различным темам
перечислены ниже для каждой из глав. Приложения, посвященные обзору об
щих математических результатов и сжимающему отображению, подготовлены на
основе соответствующих приложений в книгах Берцекаса (Bertsekas) [27] и Лью-
енбергера (Luenberger) [121]. Более полное изложение вопросов, рассмотренных
в этих приложениях, читатель сможет найти в других книгах по математическому
анализу. Мы использовали для этого книгу Апостола (Apostol) [10]. В числе дру
гих стандартных книг следует упомянуть книги Рудина (Rudin) [157] и Ройдена
(Royden) [156].
Глава 1, Цепь с туннельным диодом и генератор с отрицательным сопро
тивлением взяты из книги [39]. Описание системы «масса на пружине» основано
на работах [134] и [184]. Модель Хопфилда для нейронной сети введена в [82]
и [131]. Пример адаптивной системы управления основан на результатах [168].
Полезно прочитать интересную книгу [187], посвященную нелинейным систе
мам и хаосу.
Глава 2. Классические результаты для систем второго порядка, рассмот
ренных в параграфах 2.1-2.4, могут быть найдены практически в любой книге
по анализу нелинейных систем. Наше изложение близко соотносится с превос
ходной книгой [39]. Результаты параграфа 2.5 основаны на [149]. Параграф 2.6
основан на книгах Хирша и Смейла [81, главы 10 и 11], Гукенхеймера и Холм
са [70, параграф 1.8] и Строгаца (Strogatz) [187]. Изложение теории бифуркаций,
рассмотренной в параграфе 2.7, основано на [70] и [187].
Глава 3. Материалы параграфов 3.1-3.3 являются стандартными и могут
быть найдены в той или иной форме в любом учебнике по обыкновенным диффе
ренциальным уравнениям. Текст параграфа 3.1 очень близко соотносится с [201];
результаты параграфов 3.2 и 3.3 основаны на [81] и [43]. Принцип сравнения
сформулирован в соответствии с работами [75], [135] и [213].
Глава 4. Книги [72], [107] и [154] являются основными в области теории
устойчивости Ляпунова. Стиль изложения в параграфе 4.1 соответствует рабо
те [81]. Доказательство теоремы 4.1 взято из книги [81, параграф 9.3], а дока
зательство теоремы 4.3 основано на [72, параграф 25], [75] и [135]. Принцип
БИБЛИОГРАФИЧЕСКИЕ КОММЕНТАРИИ
775
инвариантности в параграфе 4.2 изложен так же, как в оригинальной работе
Ла-Салля [112]. ДбказателБство леммы 4.1 основано на [154, приложение III].
Применение принципа инвариантности при анализе нейронной сети выполне
но стандартным образом и может быть найдено в [82]. Наше изложение этого
результата основано на [163]. Обобщение примера 4.11 рассмотрено в [42]. Ре
зультаты для не зависящих от времени линейных систем из параграфа 4.3 взяты
из [35]. Доказательство теоремы 4.6 взято из [94]. Доказательство теоремы 4.7
о линеаризации основано на работе [155, параграфы 1.6 и 1.7], в которой так
же приведено тщательное исследование случая, когда линеаризованная систе
ма имеет по крайней мере одно собственное значение в правой полуплоскости,
а остальные ее собственные значения расположены на мнимой оси. Доказатель
ство леммы 4.3 взято из [72, параграф 24Е]. Формулировка и доказательство
леммы 4.4 основано на [72, параграф 24Е] и [181, лемма 6.1]. Доказательство
леммы 4.5 взято из [72, параграф 35] (локальный результат) и из [118] (глобаль
ный результат). Доказательства теорем 4.8 и 4.9 основаны на идеях, представлен
ных в [72, параграф 25] и [154, параграф 1.6]. Результаты параграфа 4.6 основаны
на [201]. Доказательства обратных теорем Ляпунова основаны на следующих ра
ботах: теорема 4.14 — [107, теорема 11.1]; теорема 4.16 — [135, параграф 5.13]
и [72, параграф 49] и некоторые идеи из [83]; теорема 4.17 — [109] и [118]. До
казательство теоремы 4.18 основано на [135, теорема 9.14] и [45]. Концепция
устойчивости по входу-состоянию была введена в работе Сонтага [181], в ко
торой были доказаны основные результаты в этой области. (См. [182].) Наше
изложение близко соотносится с великолепной книгой [108].
Глава 5. Исследование свойств ^-устойчивости в параграфах 5.1 и 5.2 ос
новано на [53] и [201]. Результаты параграфа 5.3 о /^-коэффициенте усиления
основаны на [199], а также на статьях [209] и [77], [79], посвященных диссипа-
тивным системам. Доказательство теоремы 5.4 основано на [53, параграф 2.6],
[200, параграф 3.1.2] и [220, параграф 4.3]. Изложение результатов, связанных
с теоремой о малом коэффициенте усиления, основано на книге [53] и на ста
тье [192]. Пример 5.14 взят из [192].
Глава 6. Теория пассивности рассмотрена в нескольких работах, вклю
чая [77], [78], [172], [31], [108], [192] и [201]. Развернутое исследование поло
жительно вещественных передаточных функций и применение леммы о положи
тельной вещественности выполнено в [6]. Доказательство леммы 6.1 основано
на [190] и [206]. Доказательства лемм 6.2 и 6.3 основаны на [4].
Глава 7. Теории абсолютной устойчивости посвящено большое количество
работ по теории управления. С исторической точки зрения важной работой яв
ляется книга [85, параграфы 5.9 и 9.5]. Наше изложение кругового критерия
и критерия Попова основано на [85, параграф 9.5 и глава 10], [201], [174, па
раграфы 8.6-8.9 и приложение Н] и [138]. Всеобъемлющее изложение теории аб
солютной устойчивости может быть найдено в [140]. Метод описывающей функ
ции детально изложен в [18] и [85, главы 6 и 7]. Наше изложение в параграфе 7.2
следует [128, глава 5]. Доказательство леммы 7.1 взято из [130]. Доказательство
теоремы 7.4 основано на [130] и [25]. Анализ ошибок близко соотносится с кни
гой [174, приложение G], из которой также взят пример 7.14.
776
БИБЛИОГРАФИЧЕСКИЕ КОММЕНТАРИИ
Глава 8. Результаты параграфа 8.1 в значительной мере основаны на кни
гах [34] и [70]. Доказательства теорем 8.1 и 8.3 взяты из [34, глава 2]. Доказатель
ство теоремы 8.2 с использованием теории Ляпунова проще, чем доказательство
этого результата в [34]. Мирослав Крстич (Miroslav Krstic) представил для этой
книги следствие 8.1. Доказательство леммы 8.1 основано на [72, параграф 33].
Пример 8.10 взят из [210]. Существует обширная литература, посвященная оцен
ке области притяжения. Некоторые методы решения этой задачи описаны в [28],
[37], [65], [80], [133] и [143]. Доказательство леммы 8.2 взято из книги [152,
стр. 211]. Доказательство теоремы 8.5 основано на [168, теорема 1.5.2]. Обсуж
дение устойчивости периодических решений в параграфе 8.4 основано на [72,
параграф 81], [135, параграф 6.4] и [75, параграф VI.2]. Естественным обобще
нием этого результата является метод отображения Пуанкаре, описанный в [81,
глава 13] и [70, параграф 1.5]; см. также второе издание настоящей книги.
Глава 9. Результаты параграфов 9.1 и 9.2 основаны на обширной литерату
ре по теории робастного управления. Отметим, однако, что основными работами
в этой области являются [72, параграф 56] и [107, параграфы 19 и 24]. Анало
гичные результаты представлены в [43, параграф Ш.З] для случая, когда номи
нальная система является линейной, но результаты в этой работе получены без
использования теории Ляпунова и основаны на использовании свойств фунда
ментальных матриц. Случай не обращающихся в нуль возмущений рассмотрен
в [72] и [107] как случай наличия «постоянно действующего возмущения». Ре
зультаты для этого случая также связаны с концепцией тотальной устойчивости
(см. [72, параграф 56]). Метод сравнения, изложенный в параграфе 9.3, основан
на использовании леммы сравнения в литературе по теории управления. Резуль
таты параграфа 9.5 об устойчивости взаимосвязанных систем в значительной
мере основаны на обзорной статье [11], а также на монографиях [175] и [132].
Пример для нейронной сети взят из [131]. Исследование медленно меняющихся
систем основано на [53, параграф IV.8], [201], [105, параграф 5.2] и [83]. Лем
ма 9.8 представляет собой лемму 2 из [83], адаптированную для частного случая
экспоненциальной устойчивости.
Глава 10. Метод возмущений, представленный в параграфе 10.1, изложен
в классической форме. Детальный обзор этого метода приведен в [98] и [141].
Асимптотические результаты в теоремах 10.1 и 10.2 представляют собой адапта
цию результатов [84] о системах с сингулярными возмущениями. Параграф 10.3
основан на [75, параграф 3.4]. Изложение метода усреднения в параграфе 10.4 ос
новано на [166], [75, параграф V.3], [73, параграф 3.5] и [70, параграфы 4.1 и 4.2].
Пример маятника с колеблющейся точкой подвеса взят из [194]. Применение ме
тода усреднения для слабо нелинейных колебательных систем, рассмотренное
в параграфе 10.5, основано на [75, стр. 183-186]. Изложение метода усреднения
для общего случая в параграфе 10.6 основано на [166], [75, параграф V.3] и [168,
параграф 4.2].
Глава 11. Изложение метода сингулярных возмущений близко соотносит
ся с работой [105]. При доказательстве теорем 11.1 и 11.2 использовались идеи
из [83]. Мы не рассмотрели вопрос о нахождении приближений высокого поряд-
БИБЛИОГРАФИЧЕСКИЕ КОММЕНТАРИИ
777
ка. Эти результаты могут быть найдены в [84], [29] или в [145]. Статьи [83], [84]
и [29] включены в книгу [104]. Пример 11.11 взят из [194]. Обобщения этого при
мера рассмотрены в [68]. Доказательства теорем 11.3 и 11.4 основаны на [160].
Глава 12. Метод линеаризации, представленный в параграфе 12.2, описан
почти в каждой книге по нелинейному управлению. Использование интеграль
ного управления, описанное в настоящей книге, также является стандартным,
однако результаты, представленные в параграфе 12.4, были получены следуя ра
ботам [86] и [91]. Настройка обратной связи, представленная в параграфе 12.5,
основана на [114] и [96], а также на [15] и [159].
Глава 13. Материалы этой главы, посвященной методу линеаризации обрат
ной связью, основаны в значительной мере на книге [88]. Вводный параграф 13.1
основан на [185, глава 10]. Результаты по локальной стабилизации и слежению
основаны на [88, глава 4]. Результаты по глобальной стабилизации были пред
ставлены с использованием работ многочисленных авторов. Статьи [30], [46],
[119], [161], [188] и [196] и книги [88], [108], [124] и [172] позволят читате
лю ознакомится с основными результатами в области глобальной стабилизации,
включая не только рассмотренные в этой книге методы, но также и более об
щие задачи, основанные на использовании метода бэкстеппинга, рассмотренного
в параграфе 14.3. Примеры 13.16, 13.17 и 13.19 взяты из [30], [188] и [62] соот
ветственно.
Глава 14. Параграф, посвященный управлению в скользящем режиме, ос
нован на книгах [198] и [180], а также на статьях [52] и [215]. Анализ непре
рывной аппроксимации законов управления со скользящим режимом основан
на [55]. Метод построения законов управления с использованием функции Ляпу
нова изложен следуя работам [45], [19] и [185, глава 10]. См. также работу [44],
в которой дан обзор использования функции Ляпунова при построении законов
управления для неопределенных нелинейных систем. Задачи робастной стаби
лизации, рассмотренные в параграфе 14.2.1 известны также как минимаксные
задачи. Метод нелинейного демпфирования, рассмотренный в параграфе 14.2.2,
основан на [108, параграф 2.5]. Результаты параграфа, посвященного бэкстеп-
пингу, также основаны на [108], а также на работах [153] и [179]. Книга [108]
содержит всеобъемлющее описание процедуры бэкстеппинга, а также ее исполь
зования при построении адаптивных законов управления для нелинейных си
стем. Метод бэкстеппинга является рекурсивным и позволяет понизить степень
сложности нелинейных систем. Другими рекурсивными методами являются ме
тоды форвардинга (forwarding) и интерлейсинга (interlacing) [153], [172], а также
метод построения композитного управления для систем с сингулярными возму
щениями [105]. Результаты, касающиеся построения управления на основе пас
сивности, основаны на книгах [172] и [199]. Многочисленные примеры примене
ния этого метода для управления физическими системами могут быть найдены
в [120] и [146]. Параграф, посвященный наблюдателям с сильной обратной свя
зью, основан на работах [56] и [16].
Другие работы, на которые мы ссылались в процессе изложения материалов
этой книги, представлены в списке литературы.
Список литературы
[1] D. Aeyels and J. Peuteman. A new asymptotic stability criterion for nonlinear time-
varying differential equations. IEEE Trans. Automat. Contr., 43: 968-971, 1998.
[2] J. K. Aggarwal. Notes on Nonlinear Systems. Van Nostrand Reinhold, New York, 1972.
[3] B. Aloliwi, H. K. Khalil, and E. G. Strangas. Robust speed control of induction motors.
In Proc. American Control Conf, Albuquerque, NM, 1997. WP16:4.
[4] B. D. O. Anderson. A system theory criterion for positive real matrices. SIAMJ. Control,
5:171-182, 1967.
[5] B. D. O. Anderson, R.R.Bitmead, С R. Johnson, Jr.,
P. V Kokotovic, R.L.Kosut,
Ι. Μ. Υ. Mareels, L.Praly, and B.D.Riedle. Stability of Adaptive Systems. MIT Press,
Cambridge, MA, 1986.
[6] B. D. O. Anderson and S. Vongpanitlerd. Network Analysis and Synthesis: A Modern
Systems Theory Approach. Prentice-Hall, Englewood Cliffs, NJ, 1973.
[7] A. A. Andronov, A. A. Vitt, and S.E.Khaikin. Theory of oscillators. Dover, New York,
1966. [А.А.Андронов, А.А.Витт и С. Э. Хайкин. Теория колебаний. 2-е изд.
—
М.: Физматгиз, 1959.]
[8] А. М. Annaswamy. On the input-output behavior of a class of second-Order nonlinear
adaptive systems. In American Control Conference, pages 731-732, 1989.
[9] P. J. Antsaklis and A. N. Michel. Linear Systems. McGraw-Hill, New York, 1997.
[10] T.M. Apostol. Mathematical Analysis. Addison-Wesley, Reading, MA, 1957.
[11] M.Araki. Stability of large-scale nonlinear systems-quadratic-Order theory of
composite-system method using M-matrices. IEEE Trans. Automat. Contr., AC-23:129-
141, 1978.
[12] B.Armstrong and СCanudas de Wit. Friction modeling and compensation. In
W.Levine, editor, The Control Handbook, pages 1369-1382. CRC Press, 1996.
[13] D.K.Arrowsmith and CM.Place. Ordinary Differential Equations. Chap- man and
Hall, London, 1982.
[14] R. B. Ash. Real Analysis and Probability. Academic Press, New York, 1972.
[15] K.J.Astrom and B. Wittenmark. Adaptive Control. Addison-Wesley, Read- ing, MA,
second edition, 1995.
[16] A.N.Atassi and Η. Κ. Khalil. A separation principle for the stabilization of a class of
nonlinear systems. IEEE Trans. Automat. Contr., 44:1672-1687, 1999.
[17] D. P. Atherton. Stability of Nonlinear Systems. John Wiley, New York, 1981.
[18] D. P. Atherton. Nonlinear Control Engineering. Van Nostrand Reinhold, London, student
edition, 1982.
СПИСОК ЛИТЕРАТУРЫ
779
[19] В. R.Barmish, M. Corless, and G.Leitmann. A new class of stabilizing controllers for
uncertain dynamical systems. SIAM J. Control iy Optimization, 21:246-255, 1983.
[20] T. Basar and P. Bernhard. HoQ-Optimal Control and Related Minimax Design Problems.
Birkhauser, Boston, second edition, 1995.
[21] R. Bellman. Introduction to Matrix Analysis. McGraw-Hill, New York, second edition,
1970. [Беллман Р. Введение в теорию матриц: пер. с англ. 2-е изд. —
М.: Наука,
1976.]
[22] R.E.Bellman, J.Bentsman, and S.M.Meerkov. Vibrational control of nonlinear
systems: Vibrational controllability and transient behavior. IEEE Trans. Automat. Contr.,
AC-31:717-724, 1986.
[23] B. W. Bequette. Process Dynamics: Modeling, Analysis, and Simulation. Prentice Hall,
Upper Saddle River, NJ, 1998.
[24] A.R.Bergen, L.O.Chua, A.I.Mees, and E.W.Szeto. Error bounds for general
describing function problems. IEEE Trans. Circuits Syst., CAS- 29:345-354, 1982.
[25] A. R. Bergen and R. L. Frank. Justification of the describing function method. SIAM
J. Control, 9:568-589, 1971.
[26] M.Berger and M.Berger. Perspectives in Nonlinearity. W.A.Benjamin, New York,
1968.
[27] D. P. Bertsekas. Dynamic Programming. Prentice-HaU, Englewood Cliffs, NJ, 1987.
[28] F. Blanchini. Set invariance in control-a survey. Automatica, 35:1747-1767, 1999.
[29] V.F.Butuzov, A. B. Vasileva, and M. V Fedoryuk. Asymptotic methods in the theory
of ordinary differential equations. In R. V. Gamkrelidze, editor, Mathematical Analysis,
volume 8 of Progress in Mathematics, pages 1-82. Plenum Press, New York, 1970.
[В.Ф.Бутузов, А.Б.Васильева, М.В.Федорюк. Асимптотические методы в тео
рии обыкновенных дифференциальных уравнений. Итоги науки и техн. Сер. Мат.
анал. -
Т.5. ВИНИТИ, 1967.]
[30] С. I. Byrnes and A. Isidori. Asymptotic stabilization of minimum phase non- linear
systems. IEEE Trans. Automat. Contr., 36:1122-1137, 1991.
[31] C.I.Byrnes, A.Isidori, and J.C.Willems. Passivity, feedback equivalence, and the
global stabilization of minimum phase nonlinear systems. IEEE Trans. Automat. Contr.,
36:1228-1240,1991.
[32] С I. Byrnes, F. D. Priscoli, and A. Isidori. Output Regulation of Uncertain Nonlinear
Systems. Birkhauser, Boston, 1997.
[33] F. M. Callier and С A. Desoer. Multivariable Feedback Systems. Springer- Verlag, New
York, 1982.
[34] J. Carr. Applications of Centre Manifold Theory. Springer-Verlag, New York, 1981.
[35] С. Т. Chen. Linear System Theory and Design. Holt, Rinehart and Winston, New York,
1984.
[36] H. D. Chiang, M. W. Hirsch, and F. F. Wu. Stability regions of nonlinear autonomous
dynamical systems. IEEE Trans. Automat. Contr., 33:16-27, 1988.
780
СПИСОК ЛИТЕРАТУРЫ
[37] Η. D. Chiang and J. S. Thorp. Stability regions of nonlinear dynamical sys- terns: a
constructive methodology. IEEE Trans. Automat. Contr., 34:1229- 1241, 1989.
[38] J. H. Chow, editor. Time-Scale Modeling of Dynamic Networks with Ap- plications to
Power Systems. Number 46 in Lecture Notes in Control and Information Sciences.
Springer-Verlag, New York, 1982.
[39] L. O. Chua, С A. Desoer, and E. S. Kuh. Linear and Nonlinear Circuits. McGraw-Hill,
New York, 1987.
[40] L. O. Chua and Y. S. Tang. Nonlinear oscillation via Volterra series. IEEE Trans. Circuits
Syst., CAS-29: 150-168, 1982.
[41] С Μ. Close and D. K. Frederick. Modeling and Analysis of Dynamic Systems. Houghton
Mifflin, Boston, second edition, 1993.
[42] M.A.Cohen and S.Grossberg. Absolute stability of global pattern formation and
parallel memory storage by competitive neural networks. IEEE Trans. Syst. Man,
Cybern., 13:815-826, 1983.
[43] W. A. Coppel. Stability and Asymptotic Behavior of Differential Equations. D. С Heath,
Boston, 1965.
[44] M. Corless. Control of uncertain nonlinear systems. J. Dyn. Sys. Measurement and
Control, 115:362-372,1993.
[45] M. Corless and G. Leitmann. Continuous state feedback guaranteeing uniform ultimate
boundedness for uncertain dynamic systems. IEEE Trans. Automat. Contr., AC-
26:1139-1144,1981.
[46] J. M.Coron, L.Praly, and A.Teel. Feedback stabilization of nonlinear sys- terns:
sufficient conditions and Lyapunov and input-output techniques. In A. Isidori, editor,
Trends in Control, pages 293-347. Springer-Verlag, New York, 1995.
[47] A. M. Dabroom and Η. Κ. Khalil. Output feedback sampled-data control of nonlinear
systems using high-gain observers. IEEE Trans. Automat. Contr., 46, 2001.
[48] M.A.Dahleh and I.J.Diaz-Bobillo. Control of Uncertain Systems: A Linear
Programming Approach. Prentice Hall, Upper Saddle River, NJ, 1995.
[49] E. J. Davison. The robust control of a servomechanism problem for linear time-invariant
multivariable systems. IEEE Trans. Automat. Contr., AC- 21:25-34, 1976.
[50] D. M. Dawson, J. Hu, and Т. С Burg. Nonlinear Control of Electric Machin- ery. Marcel-
Dekker, New York, 1998.
[51] R. A. Decarlo. Linear Systems. Prentice-HaU, Englewood Cliffs, NJ, 1989.
[52] R. A. DeCarlo, S. H. Zak, and G. P. Matthews. Variable structure control of nonlinear
multivariable systems: A tutorial. Proc. of IEEE, 76:212-232, 1988.
[53] С A. Desoer and M. Vidyasagar. Feedback Systems: Input-Output Properties. Academic
Press, New York, 1975. [Дезоер Ч., Видьясагар М. Системы с обратной связью:
вход-выходные соотношения. — 1983.]
[54] J.C.Doyle, К.Glover, P.P.Khargonekar, and B.A.Francis. State-space solutions to
standard #2 and HQQ control problems. IEEE Trans. Automat. Contr., 34:831-847,
1989.
СПИСОК ЛИТЕРАТУРЫ
781
F. Esfandiari and Η. Κ. Khalil. Stability analysis of a continuous implementa- tion of
variable structure control. IEEE Trans. Automat Contr., 36:616-620, 1991.
F. Esfandiari and H.K. Khalil. Output feedback stabilization of fully lineariz- able
systems. Int. J. Contr., 56:1007-1037, 1992.
M. Fiedler and V. Ptak. On matrices with nonnegative off-diagonal elements and positive
principal minors. Czech. Math. J., 12:382-400, 1962.
A. F. Filippov. Differential equations with discontinuous right-hand side. Amer. Math.
Soc. Translations, 42:199-231, 1964. [Филиппов А. Ф. Дифференциальные уравне
ния с разрывной правой частью. — М: Наука, 1985.]
А. М. Fink. Almost Periodic Differential Equations. Number 377 in Lecture Notes in
Mathematics. Springer-Verlag, New York, 1974.
T. I. Fossen. Guidance and Control of Ocean Vehicles. John Wiley& Sons, New York,
1994.
B.A.Francis. A course in #oo control theory, volume 88 of Lect. Notes Contr. InfSci.
Springer-Verlag, New York, 1987.
R.A.Beeman and P. V. Kokotovic. Optimal nonlinear controllers for feed- back
linearizable systems. In Proc. American Control Conf, pages 2722-2726, Seattle, WA,
1995.
F. R. Gantmacher. Theory of Matrices. Chelsea Publ., Bronx, NY, 1959. [Гантмахер
Φ. P. Теория матриц. 5-е изд. ФИЗМАТЛИТ, 2004.]
F. М. Gardner. Phaselock Techniques. Wiley-Interscience, New York, 1979.
R. Genesio, M.Tartaglia, and A.Vicino. On the estimation of asymptotic stability
regions: State of the art and new proposals. IEEE Trans. Automat. Contr., AC-30:747-
755, 1985.
S. T.Glad. On the gain margin of nonlinear and optimal regulators. IEEE Trans.
Automat. Contr., AC-29.615-620, 1984.
G.H.Golub and С F. Van Loan. Matrix Computations. The John Hopkins University
Press, Baltimore, 1983. (Имеется русский перевод: Голуб Дж.Х., Ван Лоун Ч.Ф.
Матричные вычисления. — М.: Мир 1999.)
J. Grasman. Asymptotic Methodsfor Relaxation Oscillations andApplica- tions. Number
63 in Applied Mathematical Sciences. Springer-Verlag, New York, 1987.
M.Green and D.J.N.Limebeer. Linear Robust Control. Prentice Hall, Englewood
Cliffs, NJ, 1995.
J.Guckenheimer and P.Holmes. Nonlinear Oscillations, Dynamical Systems, and
Bifurcations of Vector Fields. Springer-Verlag, New York, 1983. [Гукенхеймер Дж.,
Холмс П. Нелинейные колебания, динамические системы и бифуркации вектор
ных полей. -
М.-Ижевск, РХД, 2002 г.]
V Guillemin and A. Pollack. Differential Topology. Prentice-HaU, Englewood Cliffs,
NJ, 1974.
[72; W. Hahn. Stability of Motion. Springer-Verlag, New York, 1967.
782
СПИСОК ЛИТЕРАТУРЫ
[73] A. Halanay. Differential Equations'. Stability, Oscillations, Ητηβ Lags, vol- ume 23 of
Mathematics in Science and Engineering. Academic Press, New York, 1966.
J. Hale and H. Kocak. Dynamics and Bifurcations. Springer-Verlag, New York, 1991.
J. K. Hale. Ordinary Differential Equations. Wiley-Interscience, New York, 1969.
P.Hartman. Ordinary Differential Equations. Wiley, New York, 1964. [Хартман Ф.
Обыкновенные дифференциальные уравнения. — Μ.: Мир, 1970.]
D. Hill and P. Moylan. The stability of nonlinear dissipative systems. IEEE Trans.
Automat. Contr., AC-21:708-711, 1976.
D. J. Hill and P. J. Moylan. Stability results for nonlinear feedback systems. Automatica,
13:377-382, 1977.
D. J. Hill and P. J. Moylan. Dissipative dynamical systems: basic input- output and state
properties. J. of The Franklin Institute, 309:327-357, 1980.
H.Hindi and S.Boyd. Analysis of linear systems with saturation using convex
optimization. In Proc. IEEE Conf. on Decision and Control, pages 3081-3086, Tampa,
FL, 1998.
M. W. Hirsch and S. Smale. Differential Equations, Dynamical Systems, and Linear
Algebra. Academic Press, New York, 1974.
J. J. Hopfield. Neurons with graded response have collective computational properties
like those of twO-state neurons. Proc. of the Natl. Acad. Sci. U.S.A., 81:3088-3092,
May 1984.
F. С Hoppensteadt. Singular perturbations on the infinite interval. Trans. Amer. Math.
Soc, 123:521-535, 1966.
F. C. Hoppensteadt. Properties of solutions of ordinary differential equations with small
parameters. Comm. Pure Appl. Math., 24:807-840, 1971.
J. С Hsu and A. U. Meyer. Modern Control Principles and Applications. McGraw-Hill,
New York, 1968. [Сю Д., Мейер А. Современная теория автоматического управле
ния и ее приложения. — М.: Машиностроение, 1972.]
J.Huang and W.J.Rugh. On a nonlinear multivariable servomechanism problem.
Automatica, 26:963-972, 1990.
P. A. Ioannou and J. Sun. Robust Adaptive Control. Prentice Hall, Upper Saddle River,
NJ, 1995.
A. Isidori. Nonlinear Control Systems. Springer-Verlag, Berlin, third edition, 1995.
A. Isidori. Nonlinear Control Systems Π Springer-Verlag, London, 1999.
A. Isidori and A. Astolfi. Disturbance attenuation and H^ control via mea- surement
feedback in nonlinear systems. IEEE Trans. Automat. Contr., 37:1283-1293,1992.
A.Isidori and C.I.Byrnes. Output regulation of nonlinear systems. IEEE Trans.
Automat. Contr., 35:131-140, 1990.
A.Isidori, S.S.Sastry, P.V.Kokotovic, and C.I.Byrnes. Singularly perturbed zero
dynamics of nonlinear systems. IEEE Trans. Automat. Contr., 37:1625-1631,1992.
СПИСОК ЛИТЕРАТУРЫ
783
[93] Ζ. P. Jiang, A. R. Teel, and L. Praly. Small gain theorem for ISS systems and applications.
Mathematics of Control, Signals, and Systems, 7:95-120, 1994.
T. Kailath. Linear Systems. Prentice-Hall, Englewood Cliffs, NJ, 1980.
R.E.Kalman and J.E.Bertram. Control system analysis and design via the "second
method" of Lyapunov, parts I and II. Journal of Basic Engineering, 82:371-400, 1960.
I. Kaminer, A. M. Pascoal, P. P. Khargonekar, and Ε. Ε. Coleman. A velocity algorithm
for the implementation of gain scheduled controllers. Automatica, 31:1185-1191,1995.
T. R. Kane, P. W. Likins, and D. A. Levinson. Spacecraft Dynamics. McGraw- Hill, New
York, 1982.
J. Kevorkian and J. D. Cole. Perturbation Methods in Applied Mathematics. Number 34
in Applied Mathematical Sciences. Springer-Verlag, New York, 1981.
H. K. Khalil. Stability analysis of nonlinear multiparameter singularly per- turbed
systems. IEEE Trans. Automat. Contr., AC-32:260-263,1987.
H. K. Khalil. High-gain observers in nonlinear feedback control. In H. Nijmei- jer and
T. I. Fossen, editors, New Directions in Nonlinear Observer Design, volume 244 of
Lecture Notes in Control and Information Sciences, pages 249-268. Springer, London,
1999.
P. P. Khargonekar, I. R. Petersen, and M.A.Rotea. #oo-Optimal control with state
feedback. IEEE Trans. Automat. Contr., 33:786-788, 1988.
H.W.Knobloch and B. Aulbach. Singular perturbations and integral mani- folds.
J. Math. Phys. Sci., 18:415-424, 1984.
P. Kokotovic and M.Arcak. Constructive nonlinear control: a historical perspective.
Automatica, 37:637-662, 2001.
P. V. Kokotovic and Η. Κ. Khalil, editors. Singular Perturbations in Systems and Control.
IEEE Press, New York, 1986.
P. V. Kokotovic, H.K. Khalil, and J. O'ReiUy. Singular Perturbations Methods in
Control: Analysis and Design. Academic Press, New York, 1986. Repub- lished by
SIAM, 1999.
M. A. Krasnoselskii and A. V. Pokrovskii. Systems with Hysteresis. Springer- Verlag,
Berlin, 1989. [Красносельский Μ. Α., Покровский А. В. Системы с гистерезисом. —
Москва: Наука, Главная редакция физико-математической литературы, 1983.]
N. N. Krasovskii. Stability of Motion. Stanford University Press, Stanford, 1963. [Kpa-
совский H. H. Некоторые задачи теории устойчивости движения. — Μ.: Физматгиз,
1959.]
Μ. Krstic, I. Kanellakopoulos, and P. Kokotovic. Nonlinear and Adaptive Control
Design. Wiley-Interscience, New York, 1995.
J. Kurzweil. On the inversion of Lyapunov's second theorem on stability of motion.
Amer. Math. Soc. Transl, Ser.2, 24:19-77, 1956.
H. Kwakernaak and R. Sivan. Linear Optimal Control Systems. Wiley- Interscience,
New York, 1972. [Квакернаак, X. Сиван Р. Линейные оптимальные системы управ
ления. — Μ.: Мир, 1977.]
784
СПИСОК ЛИТЕРАТУРЫ
[111] S. Lang. Real and Functional Analysis. Springer-Verlag, New York, third edition, 1993.
[112] J. P. LaSalle. Some extensions of Lyapunov's second method. IRE Trans. Circuit Theory,
CT-7:520-527, 1960.
[113] J. P. LaSalle. An invariance principle in the theory of stability. In J. K. Hale and
J. P. LaSalle, editors, Differential Equations and Dynamical Systems, pages 277-286.
Academic Press, New York, 1967.
[114] D.A.Lawrence and W.J.Rugh. Gain scheduling dynamic linear controllers for a
nonlinear plant. Automatica, 31:381-390, 1995.
[115] S. Lefschetz. Differential Equations: Geometric Theory. Wiley-Interscience, New York,
1963. [Лефшец С. Геометрическая теория дифференциальных, уравнений. — М.:
ИЛ, 1961]
[116] S. Lefschetz. Stability of Nonlinear Control Systems. Academic Press, New York, 1965.
[Лефшец С. Устойчивость нелинейных систем автоматического управления. —М.:
Мир, 1967.]
[117] W. Leonard. Control of Electrical Drives. Springer, Berlin, second edition, 1996.
[118] Y.Lin, E. Sontag, and Y.Wang. A smooth converse lyapunov theorem for robust
stability. SI AM J. Contr. Optim., 34:124-160, 1996.
[119] Z.Lin and A. Saberi. Robust semi-global stabilization of minimum-phase input-Output
linearizable systems via partial state and output feedback. IEEE Trans. Automat. Contr.,
40:1029-1041,1995.
[120] R. Lozano, B. Brogliato, O. Egeland, and B. Maschke. Dissipative Systems Analysis and
Control: Theory and Applications. Springer, London, 2000.
[121] D. G. Luenberger. Optimization by Vector Space Methods. Wiley, New York, 1969.
[ 122] D. G. Luenberger. Introduction to Linear and Nonlinear Programming. Addison-Wesley,
Reading, MA, 1973.
[123] I.M.YMareels and D.J.Hill. Monotone stability of nonlinear feedback systems.
J. Mathematical Systems, Estimation and Control, 2:275-291, 1992.
[124] R.Marino and RTomei. Nonlinear Control Design: Geometric, Adaptive 8 Robust.
Prentice-Hall, London, 1995.
[125] J. L.Massera. Contributions to stability theory. Annals, of Mathematics, 64:182-206,
1956.
[126] I. D. Mayergoyz. The Preisach Model for Hysteresis. Springer-Verlag, Berlin, 1991.
[127] S. M.Meerkov. Principle of vibrational control: Theory and applications. IEEE Trans.
Automat. Contr., AC-25:755-762, 1980.
[128] A. I. Mees. Dynamics of Feedback Systems. Wiley, New York, 1981.
[129] A.I.Mees. Describing functions: ten years on. IMA J.Applied Mathematics, 32:221-
233, 1984.
[130] A.I.Mees and A.R.Bergen. Describing functions revisited. IEEE Trans. Automat.
Contr., AC-20:473-478, 1975.
СПИСОК ЛИТЕРАТУРЫ
785
131] A.N.Michel, J. A.Farrel, and W.Porod. Qualitative analysis of neural networks. IEEE
Trans. Circuits Syst., 36:229-243, 1989.
132] A. N. Michel and R. K. Miller. Qualitative Analysis of Large Scale Dynamical Systems.
Academic Press, New York, 1977.
133] A. N. Michel, N. R. Sarabudla, and R. K. Miller. Stability analysis of complex dynamical
systems. Circuits Systems Signal Process, 1:171-202, 1982.
134] R.E.Mickens. Introduction to Nonlinear Oscillations. Cambridge University Press,
London, 1981.
135] R.K.Miller and A.N.Michel. Ordinary Differential Equations. Academic Press, New
York, 1982.
136] R.K.Miller and A.N.Michel. An invariance theorem with applications to adaptive
control. IEEE Trans. Automat. Contr., 35:744-748, 1990.
137] N. Minorsky. Nonlinear Oscillations. Van Nostrand, Princeton, NJ, 1962.
138] J.B.Moore and B.D.O. Anderson. Applications of the multivariable Popov criterion.
Int. J. Control, 5:345-353, 1967.
139] K. S.Narendra and A. M. Annaswamy. Stable Adaptive Systems. Prentice- Hall,
Englewood Cliffs, NJ, 1989.
140] K.S.Narendra and J.Taylor. Frequency Domain Methods for Absolute Sta- bility.
Academic Press, New York, 1973.
141] A.H.Nayfeh. Introduction to Perturbation Techniques. Wiley, New York, 1981. [Най-
фэ А. Введение в методы возмущений. — Μ.: Мир, 1984.]
142] H.Nijmeijer and A.J. van der Schaft. Nonlinear Dynamic Control Systems. Springer-
Verlag, Berlin, 1990.
143] E.Noldus and M.Loccufier. A new trajectory reversing method for the estimation of
asymptotic stability regions. Int. J. Contr., 61:917-932,1995.
144] H. Olsson. Control Systems with Friction. PhD thesis, Lund Institute of Technology,
Lund, Sweden, 1996.
145] R. E. O'Malley. Singular Perturbation Methods for Ordinary Differential Equations.
Springer-Verlag, New York, 1991.
146] R.Ortega, A.Loria, P.J.Nicklasson, and H.Sira-Ramirez. Passivity-based Control of
Euler-Lagrange Systems. Springer, London, 1998.
147] B. E.Paden and S. S. Sastry. A calculus for computing Filippov's differential inclusion
with application to the variable structure control of robot manipu- lators. IEEE Trans.
Circuits Syst., CAS-34:73-82, 1987.
148] M. A.Pai. Power System Stability Analysis by the Direct Method ofLyapunov. North-
Holland, Amsterdam, 1981.
149] T.S.Parker and L.O.Chua. Practical Numerical Algorithms for Chaotic Systems.
Springer-Verlag, New York, 1989.
150] R. V.Patel and M.Toda. Qualitative measures of robustness for multivariable systems.
In Joint Automatic Control Conference, number TP8-A, 1980.
786
Список ЛИТЕРАТУРЫ
[151] W. R. Perkins and J. B. Cruz. Engineering of Dynamic Systems. John Wiley, New York,
1969.
[152] V. M. Popov. Hyperstability of Control Systems. Springer-Verlag, New York, 1973. [По
пов В. М. Гиперустойчивость автоматических систем. — М.: Наука, 1970.]
[153] Z. Qu. Robust Control of Nonlinear Uncertain Systems. Wiley-Interscience, New York,
1998.
[154] N. Rouche, P.Habets, and M.Laloy. Stability Theory by Lyapunov's Direct Method.
Springer-Verlag, New York, 1977. [Руш Н., Абетс П., Лалуа М. Прямой метод Ляпу
нова в теории устойчивости. — М.: Мир, 1980.]
[155] N. Rouche and J. Mawhin. Ordinary Differential Equations. Pitman, Boston, 1973.
[156] H. L. Royden. Real Analysis. Macmillan, New York, 1963.
[157] W. Rudin. Principles of Mathematical Analysis. McGraw-Hill, New York, third edition,
1976. [Рудин У. Основы математического анализа. — Μ.: Мир, 1966.]
[158] W. J.Rugh. Linear System Theory. Prentice-Hall, Upper Saddle River, NJ, second
edition, 1996.
[159] W. J. Rugh and J. S. Sharnma. Research on gain scheduling. Automatica, 36:1401-1425,
2000.
[160] A. Saberi and H.Khalil. Quadratic-type Lyapunov functions for singularly perturbed
systems. IEEE Trans. Automat. Contr., AC-29:542-550, 1984.
[161] A. Saberi, P. V. Kokotovic, and H. J. Sussmann. Global stabilization of partially linear
composite systems. SI AM J. Control 8 Optimization, 28:1491- 1503, 1990.
[162] M. Safonov. Stability and Robustness of Multivariable Feedback Systems. MIT Press,
Cambridge, MA, 1980.
[163] F.M. A.Salam. A formulation for the design of neural processors. In Inter- national
Conference on Neural NetworL·, pages I-173-1-180, July 1988.
[164] I. W. Sandberg. On the Z/2-boundedness of solutions of nonlinear functional equations.
BellSys. Tech. J., 43:1581-1599, 1964.
[165] I. W. Sandberg. Global inverse function theorems. IEEE Trans. Circuits Syst., CAS-
27:998-1004, 1980.
[166] J.A.Sanders and F.Verhulst. Averaging Methods in Nonlinear Dynamical Systems.
Number 59 in Applied Mathematical Sciences. Springer-Verlag, New York, 1985.
[167] S. Sastry. Nonlinear Systems: Analysis, Stability and Control. Springer, New York, 1999.
[168] S. Sastry and M. Bodson. Adaptive Control. Prentice Hall, Englewood Cliffs, NJ, 1989.
[169] S. Sastry, J. Hauser, and P. Kokotovic. Zero dynamics of regularly perturbed systems are
singularly perturbed. Systems Contr. Lett., 13:299-314, 1989.
[170] P. W. Sauer and M. A. Pai. Power System Dynamics and Stability. Prentice- Hall, Upper
Saddle River, NJ, 1998.
[171] L. Sciavicco and B. Siciliano. Modeling and Control of Robot Manipulato rs. McGraw-
Hill, New York, 1996.
СПИСОК ЛИТЕРАТУРЫ
787
[172] R. Sepulchre, M. Jankovic, and P. Kokotovic. Constructive Nonlinear Control. Springer,
London, 1997.
[173] D. Shevitz and B. Paden. Lyapunov stability theory of nonsmooth systems. IEEE Trans.
Automat. Contr., 39:1910-1914, 1994.
[174] D. D. Siljak. Nonlinear Systems. Wiley, New York, 1969.
[175] D.D. Siljak. Large Scale Dynamic Systems: Stability and Structure. North- Holland,
New York, 1978.
[176] H. Sira-Ramirez. Harmonic response of variable-structure-controlied van der Pol
oscillators. IEEE Trans. Circuits Syst., CAS-34:103-106, 1987.
[177] H. Sira-Ramirez. A dynamical variable structure control strategy in asymp- totic output
tracking problem. IEEE Trans. Automat. Contr., 38:615-620, 1993.
[178] G.R. Slemon and A. Straughen. Electric Machines. Addison-Wesley, Reading, MA,
1980.
[179] J. J. E. Slotine and J.K.Hedrick. Robust input-Output feedback linearization. Int.
J.Contr., 57:1133-1139, 1993.
[180] J. J. E. Slotine and W. Li. Applied Nonlinear Control. Prentice Hall, Engle- wood Cliffs,
NJ, 1991.
[181] E. D. Sontag. Smooth stabilization implies coprime factorization. IEEE Trans. Automat.
Contr., 34:435-443, 1989.
[182] E. D. Sontag. On the input-to-state stability property. European J. Control, 1, 1995.
[183] E. D. Sontag and Y.Wang. On characterizations of the input-to-state stability property.
Systems Contr. Lett., 24:351-359, 1995.
[184] S. С Southward. Modeling and Control of Mechanical Systems with Stick-Slip Friction.
PhD thesis, Michigan State University, East Lansing, 1990.
[185] M. W. Spong and M. Vidyasagar. Robot Dynamics and Control. Wiley, New York, 1989.
[186] E.G.Strangas, H.K.Khalil, B.Aloliwi, L.Laubinger, and J.Miller. Robust tracking
controllers for induction motors without rotor position sensor: anal- ysis and
experimental results. IEEE Trans. Energy conversion, 14:1448-1458, 1999.
[187] S. H. Strogatz. Nonlinear Dynamics and Chaos. Addison Wesley, Reading, MA, 1994.
[188] H.J. Sussmann and P. V. Kokotovic. The peaking phenomenon and the global
stabilization of nonlinear systems. IEEE Trans. Automat. Contr., 36:424-440, 1991.
[189] F.L. Swern. Analysis of oscillations in systems with polynomial-type nonlin- earities
using describing functions. IEEE Trans. Automat. Contr., AC-28:31-41, 1983.
[190] G. Tao and P. A. Ioannou. Strictly positive real matrices and the Lefschetz- Kalman-
Yakubovitch lemma. IEEE Trans. Automat. Contr., 33:1183-1185, 1988.
[191] A.Teel and L.Praly. Tools for semiglobal stabilization by partial state and output
feedback. SI AM J. Control 8 Optimization, 33, 1995.
[192] A.R.Teel, T.T.Georgiou, L.Praly, and E.Sontag. Input-Output stability. In W.Levine,
editor, The Control Handbook. CRC Press, 1995.
788
Список ЛИТЕРАТУРЫ
[193] A. R. Teel and L. Praly. Results on converse lyapunov functions from class /C£
estimates. In Proc. IEEE Conf. on Decision and Control, pages 2545-2550, Phoenix,
Arizona, 1999.
[194] A. N. Tikhonov, A. B. Vasileva, and V.M.Volosov. Ordinary differential equations. In
E.Roubine, editor, Mathematics Applied to Physics, pages 162-228. Springer-Verlag,
New York, 1970.
[195] A.Tonnelier, S.Meignen, H.Bosch, and J.Demongeot. Synchronization and
desychronization of neural oscillators. Neural NetworL·, 12: 1213-1228, 1999.
[196] J. Tsinias. Partial-state global stabilization for general triangular systems. Systems Contr.
Lett., 24:139-145, 1995.
[197] V.Utkin, J.Guldner, and J.Shi. Sliding Mode Control in Electromechanical Systems.
Taylor& Francis, London, 1999.
[198] V. I.Utkin. Sliding Modes in Optimization and Control. Springer-Verlag, New York,
1992. [Уткин В. И. Скользящие режимы в задачах оптимизации и управления.
—
М.: Наука, 1982.]
[199] A. van der Schaft. L,2-Gain and Passivity Techniques in Nonlinear Control. Springer,
London, 2000.
[200] M. Vidyasagar. Large Scale Interconnected Systems. Springer-Verlag, Berlin, 1981.
[201] M. Vidyasagar. Nonlinear Systems Analysis. Prentice-HaU, Englewood Cliffs, NJ,
second edition, 1993.
[202] T.L.Vincent and W.J.Grantham. Nonlinear and Optimal Control Systems. Wiley-
Interscience, New York, 1997.
[203] A.Visintin. Differential Models of Hysteresis. Springer, Berlin, 1994.
[204] J. V. Wait, L. P. Huelsman, and G. A. Korn. Introduction to Operational Am- plifiers.
McGraw-Hill, New York, 1975.
[205] C.-J. Wan, D. S. Bernstein, and V. T. Coppola. Global stabilization of the oscillating
eccentric rotor. In Proc. IEEE Conf on Decision and Control, pages 4024-4029,
Orlando, FL, 1994.
[206] J. T. Wen. Time domain and frequency domain conditions for strict positive realness.
IEEE Trans. Automat. Contr., 33:988-992, 1988.
[207] S. Wiggins. Introduction to Applied Nonlinear Dynamical Systems and Chaos. Springer-
Verlag, New York, 1990.
[208] J. С Willems. The Analysis of Feedback Systems. MIT Press, Cambridge, MA, 1971.
[209] J. С Willems. Dissipative dynamical systems, part I: general theory. Arch. Rat. Mech.
Anal., 45:321-351, 1972.
[210] J. L.Willems. The computation of finite stability regions by means of open Lyapunov
surfaces. Int. J. Control, 10:537-544, 1969.
[211] H.H.Woodson and J.R.Melcher. Electromechanical Dynamics, Part I.- Discrete
Systems. John Wiley, New York, 1968.
СПИСОК ЛИТЕРАТУРЫ
789
[212] F. F. Wu and С. A. Desoer. Global inverse function theorem. IEEE Trans. Circuit Theory,
CT-19:199-201, 1972.
[213] T.Yoshizawa. Stability Theory By Liapunov's Second Method. The Mathematical
Society of Japan, Tokyo, 1966.
[214] D. C.Youla. On the factorization of rational matrices. IRE Trans. Information Theory,
IT-7:172-189, 1961.
[215] K.D.Young, V.I.Utkin, and U.Ozguner. A control engineer's guide to sliding mode
control. IEEE Trans. Contr. Syst. Tech., 7:328-342, 1999.
[216] J.Zaborszky, G.Huang, B.Zheng, and T.C.Leung. On the phase portrait of a class
of large nonlinear dynamic systems such as the power system. IEEE Trans. Automat.
Contr., 33:4-15, 1988.
[217] G. Zames. On the input-Output stability of nonlinear time-varying feedback systems,
part I. IEEE Trans. Automat. Contr., AC-11:228-238, 1966.
[218] G. Zames. On the input-Output stability of nonlinear time-varying feedback systems,
part II. IEEE Trans. Automat. Contr., AC-11:465-477, 1966.
[219] G. Zames. Feedback and optimal sensitivity: model reference transformations,
multiplicative seminorms, and approximate inverses. IEEE Trans. Automat. Contr., AC-
26:301-320, 1981.
[220] K. Zhou, J. С Doyle, and K. Glover. Robust and Optimal Control. Prentice Hall, Upper
Saddle River, NJ, 1996.
[221] V. I.Zubov. Methods of A.M. Lyapunov and Their Application. Noordhoff, Groningen,
The Netherlands, 1964. [Зубов В. И. Методы А. М. Ляпунова и их применение.
Изд-во ЛГУ, 1957.]
Дополнение.
Обзор работ по нелинейным системам
Теория управления нелинейными системами за последние два десятилетия
развивалась, пожалуй, быстрее, чем другие области теории управления и в на
стоящее время, судя по числу докладов на крупнейших международных конфе
ренциях, доминирует в теории управления. В книге X. Халила дается всеобъем
лющее и достаточно сбалансированное представление о современном состоянии
этой теории. В то же время ряд заслуживающих внимания работ последних лет,
прежде всего ряд отечественных работ, не нашли отражение в книге. Краткий
библиографический обзор некоторых работ приведен ниже
17
.
Анализ систем. Анализ системы начинается с исследования существования
и единственности решений, а также устойчивости систем. Ряд классических ре
зультатов по условиям существования и устойчивости колебаний для систем 2-го
порядка приведен в главе 2 книги X. Халила. В работах Г. А. Леонова и его учени
ков на основе использования функций ляпуновского типа получены обобщения
классических критериев орбитальной устойчивости Пуанкаре и Дюлака на си
стемы произвольного порядка, а также обобщение теоремы Андронова-Витта об
асимптотической орбитальной устойчивости. Изучено также понятие устойчи
вости по Жуковскому, занимающее промежуточное место между устойчивостью
по Пуанкаре (орбитальной) и устойчивостью по Ляпунову [Д39, Д41]. Частот
ные условия существования и устойчивости состояний равновесия и колебаний
в импульсных системах получены в [Д22]. Отметим, что частотные методы ис
следования показали высокую эффективность для систем, представимых в виде
линейной части и нелинейности в цепи обратной связи (см. рис. 7.1), часто на
зываемых системами Лурье.
Подход к нелинейным колебаниям на основе понятий периодических дви
жений и предельных циклов доминировал в теории и в многочисленных при
ложениях в течение нескольких десятилетий, начиная с работ А.А.Андронова
и его школы. Однако полученные к настоящему времени условия существова
ния и устойчивости периодических колебаний зачастую оказываются слишком
ограничительными. Например, даже в классической задаче о предельных цик
лах в линейной системе с реле условия существования глобально устойчивого
предельного цикла получены лишь недавно и требуют численной проверки на
бора линейных матричных неравенств (LMI) [Д80]. С другой стороны, все чаще
17
Автор Дополнения приносит извинения за возможные проявления субъективности в оценках
и составлении списка дополнительной литературы.
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ ПО НЕЛИНЕЙНЫМ СИСТЕМАМ
791
в природе и технике наблюдаются движения более общего характера, чем пери
одические. Например, в теории так называемых фазовых систем, описывающих
динамику электрических машин, систем фазовой автоподстройки частоты, так
товых генераторов представляют интерес непериодические движения, при кото
рых часть координат меняется периодически, а другая часть — монотонно. Та
кие движения называются циклами второго рода. В книгах [Д21, Д41] изложены
эффективные частотные условия существования и устойчивости таких движе
ний. Получены также условия фазовой синхронизации — режима, при котором
разности нециклических координат фазовых подсистем стремятся к конечному
пределу [Д42, Д40]. Ключевым инструментом исследования являются функции
ляпуновского типа и лемма Якубовича-Калмана (Калмана-Якубовича-Попова,
см. Леммы 6.2, 6.3 в книге X. Халила).
Важный класс задач связан с изучением вынужденных колебаний нелиней
ных систем под влиянием непериодических, но ограниченных внешних воз
действий. В частности, существование единственного и глобально асимптоти
чески устойчивого ограниченного решения в системе х = F(x,t) означает,
что в системе имеется единственный предельный рабочий режим. Это свой
ство называется конвергентностью [Д27]. Стандартным достаточным услови
ем конвергентности является условие Демидовича: равномерная отрицательность
всех собственных чисел симметризованной матрицы линеаризованной системы
dF(x,t) |
дх
dF(x,t)
.τ
дх
. Частотный критерий конвергентности был получен в ра
боте [Д74]. Новые критерии и применения можно найти в работах [Д78, Д92].
Однако требование конвергентности тоже может оказаться слишком жест
ким: в частности, при наличии локальных неустойчивостей. Наиболее широ
ким из известных понятий колебательности является так называемая колебатель
ность по Якубовичу [Д76, Д41]. Напомним, что система х = F(x,t) называется
колебательной по Якубовичу по выходу ψ = η( х), если для почти всех хо Ε Rn
решения x(tyxo) системы ограничены и для почти всех начальных условий вы
полнено:
lim ij;(x(t,xo))
< lim
ip(x(t,xo)).
t-Ч-оо
i-»+oo
Решения колебательной системы могут иметь нерегулярный, в том числе хао
тический характер. В. А. Якубовичем был получен частотный критерий коле
бательности для систем Лурье [Д76]. Условия колебательности для соединения
двух нелинейных систем получены в [Д32] с использованием двух функций Ля
пунова.
Еще одно направление исследований связано с понятием частичной устой
чивости. Специальным случаем этого свойства является устойчивость по части
переменных, систематически изучавшаяся В. В. Румянцевым и его последовате
лями начиная с 1957 года [Д20, Д59, Д60]. В книге [Д49] на языке функций Ля
пунова даны условия частичной устойчивости по отношению к некоторой функ
ции состояния системы (теорема 2.14). Одним из важных применений частичной
устойчивости являются задачи синхронизации и анализа синхронных режимов,
792
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ по НЕЛИНЕЙНЫМ СИСТЕМАМ
где состояния или выходы двух или нескольких подсистем изменяются согласо
ванно. Следует отметить, что свойство устойчивости по отношению к функциям
было введено еще в 1892 году в основополагающей работе А.М.Ляпунова, где
оно, однако, не было исследовано.
В книге интенсивно используется знаменитая лемма Якубовича-Калмана,
называемая также леммой Калмана-Якубовича-Попова или частотной теоремой,
см. леммы 6.1-6.3. О современных трактовках и обобщениях и применениях лем
мы см. [Д26, Д51]. Неточность, имеющуюся в формулировке леммы 6.1, легко
устранить с помощью формулируемой ниже «полувырожденной» версии частот
ной теоремы, установленной В. А. Якубовичем в 1966 г. [Д21, Д75].
Введем следующие обозначения (через Re К обозначается эрмитова часть
матрицы: Re К = (К + К*)/2):
П(и\ - \-(
НА
+
Л
*
Я
+
Д
)~(
На
+
Ь
)]
Ч^)-[
-(На + Ъ)*
ρJ'
π(λ) = ρ + 2Re (6*(λ/η - Α)-λα) + α*(λ*/η - Α*)"
1
Λ(λ/η - Α)'
1
α,
гдеΗ =Я*—(ηΧп)-матрица,R =R*— (ηхп)-матрица,р =ρ* — (mх т)-
матрица, а,Ь—(пх т)-матрицы, λ — комплексное число. Пусть т = mi + Ш2,
где mi, гп2 — целые числа, и пусть матрицы ρ, π, а разбиты на блоки следующим
образом:
7Гп 7Г12
\JT21 7Г22^
,а=
.
а
2.
ИPV2=Р21=О»Р22=0.
Теорема [Д75]. Пусть А — гурвицева матрица, рц ^ 0 и гапкаг = Ш2.
Для существования матрицы Η = Н* такой, что Q(H) ^ 0 и rankQ = η -f mi,
необходимо и достаточно, чтобы
(1) π(Ζα;) > 0 для всех вещественных ω\ (г
2
= —1),
(2) lim ш
2
(к22(ш) - Ж2\{ш) π^(τω) п^гш)) > 0.
Отметим, что при rri2 — 0 теорема превращается в «невырожденную» ча
стотную теорему, а при mi = 0 превращается в лемму 6.3. При mi = 0, С =
= 0 она устанавливает, что необходимым и достаточным условием разрешимости
матричных неравенств НА + А* Н < 0, На = — Ь является строгая положитель
ная вещественность передаточной матрицы b(XIm — А)~
1
а.
С ростом сложности систем все большую роль в их анализе играют числен
ные методы. Наряду с классическими задачами статического и динамического
анализа — построения установившихся режимов и траекторий, все чаще возни
кают задачи анализа более сложного поведения: бифуркационный анализ, оценка
ляпуновских показателей, энтропии, размерности и других характеристик нели
нейной динамики систем. Вопросам численного анализа динамических систем
посвящены книги [Д8, Д46, Д77, Д88, Д90]. Эффективные численные методы
решения задач анализа и синтеза линейных и нелинейных систем разработаны
на основе аппарата линейных матричных неравенств (LMI) [Д11, Д73].
Р\\ Pvi
Р21 Р22
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ по НЕЛИНЕЙНЫМ СИСТЕМАМ
793
Задачи синтеза. Задачи синтеза являются центральными для теории управ
ления. Прежде всего следует упомянуть о работах по оптимальному синтезу,
которому в книге уделено мало внимания. В 1950-1960-х годах оптимальные
системы находились на гребне интереса исследователей, во многом благодаря
работам Л. С. Понтрягина, А. А. Телеграфов и их последователей. В последние
годы в мировой литературе оптимальным системам уделяется меньше внима
ния, и дело здесь, видимо, в том, что их реализация требует достаточно полной
и точной информации о модели объекта, а для нелинейных объектов еще и зна
чительного объема вычислений. Кроме того, трудности возникают из-за много
критериальноеTM реальных задач синтеза. Для более или менее сложных систем
эти препятствия часто становятся непреодолимыми. Тем не менее методы опти
мального управления продолжают развиваться, идя по пути решения указанных
проблем. Требование знания модели объекта может быть ослаблено, если строить
схемы, оптимальные на классе объектов, т. е. робастные. Робастные алгоритмы
управления механическими системами были разработаны Ф. Л. Черноусько и его
учениками [Д72], см. также [Д34]. Эффективным подходом к заданию неопреде
ленностей является метод эллипсоидов, в котором считается, что неопределен
ные параметры принадлежат эллипсоиду, характеризующемуся своим центром
и матрицей главных осей [Д71, Д85]. Такой подход позволяет также рассматри
вать задачи с неполными измерениями. Среди недавних книг по оптимальному
управлению следует отметить [Д2, Д9, Д47].
Одним из подходов к решению задач управления по выходу (управле
ния с неполными измерениями) является использование наблюдателей. В книге
Х.Халила описывается синтез управления на основе наблюдателей с большим
коэффициентом усиления. Однако имеются и другие методы: дифференциально-
геометрический [Д38], на основе скользящих режимов [Д4], каскадный [Д37].
Новая форма нелинейных наблюдателей, предложенная В. О. Никифоровым [Д89,
Д49], использована для синтеза систем синхронизации и управления колебатель
ными процессами [Д7, Д31].
Однако применение наблюдателей — не единственный подход к решению
задачи управления по выходу. Среди других отметим метод вспомогательных
фильтров [Д14, Д15] и метод шунтирования [Д4], в которых размерность допол
нительных динамических звеньев на единицу меньше, чем относительная сте
пень объекта управления, т. е. может быть существенно меньше, чем в системах
с наблюдателями.
Эффективным способом решения задач управления по выходу является ме
тод пассификации, изложенный в параграфе 14.3, см. также [Д55, Д49]. Вариант
этого метода для нелинейных систем класса Лурье в адаптивном и неадаптивном
вариантах, основанный на необходимых и достаточных условиях пассификации
линейных систем, предложенных в [Д66, Д67], с успехом применялся к реше
нию различных задач управления полетом, оценивания, синхронизации, см. об
зор [Д6].
Ляпуновский синтез, пассификацию, управление в скользящем режиме
и некоторые другие подходы можно рассматривать в рамках единой схемы, на-
794
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ по НЕЛИНЕЙНЫМ СИСТЕМАМ
зываемой методом скоростного градиента (СГ) [Д4, Д49, Д68]. Метод СГ пред
писывает изменять управляющее воздействие в направлении, противоположном
скоростному градиенту — градиенту от скорости изменения целевой функции
в силу уравнения объекта (более общо — в направлении, образующем тупой угол
со скоростным градиентом). Для объектов управления, описываемых моделями
состояния х = F(x,u,t) и целей управления Q(x(t),t) —> 0 при t —> оо, где
Q(x, i) ^ 0 — целевая функция, алгоритм скоростного градиента в конечной фор
ме имеет вид и = —7^(VW<2)> где Q = dQ/dt + dQ/dxF(x,u,t)) φ(ν)τν > О
при у ф О, 7 > 0 — скалярный или матричный коэффициент усиления. В частном
случае систем, не зависящих от времени, алгоритм СГ совпадает с алгоритмом
теоремы 14.4. Можно показать, что по отношению к выходу, задаваемому век
тором скоростного градиента, объект при естественных условиях оказывается
пассифицируемым, т. е. метод СГ обеспечивает стабилизацию объекта.
Из книг на русском языке следует упомянуть учебники [Д1, Д38], ши
роко использующие геометрический подход, а также книгу СВ. Емельянова
[ДЗО], где излагаются топологические подходы к исследованию широкого круга
нелинейных задач, базирующиеся на понятиях степени отображения, вращения
векторного поля, топологического индекса. Среди недавно выпущенных отме
тим отечественные учебники [Д10, Д48, Д53] и переводной учебник [Д25]. Из
немногих направлений, где отечественная наука в последние годы имеет прио
ритет, следует отметить управление стохастическими нелинейными колебаниями
[Д82, Д83, Д84, Д61, Д94] и синергетический подход [Д35].
На практике все чаще применяются интеллектуальные системы управления,
в частности, нейросетевые и нечеткие системы. Хотя за рубежом поток лите
ратуры по этим направлениям не иссякает уже много лет, количество книг на
русском языке до сих пор исчисляется единицами [Д45, Д57, Д63]. По адаптив
ному управлению нелинейными системами, наоборот, книг в России в последние
годы издано больше, чем в других странах [Д31, Д49, Д52, Д64].
Новые направления. Перечислим некоторые новые направления в области
нелинейных систем, появившиеся в последние несколько лет.
Управление хаосом. Кибернетическая физика. Одним из важных откры
тий второй половины XX века стала возможность возникновения в нелинейных
детерминированных системах нерегулярных, хаотических колебаний. Известны
различные математические определения хаоса. Однако большинство из них вы
ражает близкие по типу свойства динамических систем, связанные со «сверхчув
ствительностью» к начальным условиям: даже сколь угодно близкие траектории
с течением времени расходятся на конечное расстояние, т. е. прогноз траектории
на длительное время оказывается невозможен. Оказалось, что системы и моде
ли, описывающие хаотическое поведение, встречаются во многих областях науки
и техники, и в ряде случаев являются более подходящим инструментом описания
нерегулярных колебаний и неопределенности, чем стохастические, вероятност
ные модели. Достаточно заметить, что широкий класс хаотических систем —
это хорошо известные генераторы псевдослучайных чисел. Тем более удиви
тельной оказалась обнаруженная в 1990 г. Э. Оттом, Ч. Гребоджи и Дж. Йорке
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ по НЕЛИНЕЙНЫМ СИСТЕМАМ
795
возможность существенного изменения свойств хаотической системы при помо
щи весьма малого изменения ее параметров [Д91]. В частности, было показано
путем компьютерного моделирования, что достаточно малым изменением пара
метра системы можно хаотическую траекторию преобразовать в периодическую
и наоборот, если изменять параметр с учетом изменения текущего состояния си
стемы, т. е. в контуре обратной связи. В последующих публикациях эффект был
подтвержден экспериментально и указаны области его приложений: лазеры, си
стемы связи, химические технологии, медицина (лечение аритмии и эпилепсии).
Парадоксальность вывода (хаос нельзя прогнозировать, но им можно управлять)
вызвала взрыв интереса исследователей и породила лавину публикаций, демон
стрирующих возможность существенного изменения свойств разнообразных ха
отических систем в природе и технике при помощи относительно небольших
изменений параметров или внешних воздействий. По данным Science Citation
Index, к концу 1990-х годов по этой тематике публиковалось более чем 300 статей
в год в рецензируемых журналах, а общее число публикаций перевалило за 3000.
Более подробный обзор работ по управлению хаосом можно найти в [Д5, Д69].
Управление хаосом — это только одно из направлений в области на стыке ки
бернетики и физики, привлекающей все больше внимания начиная с 1990-х. К
другим относятся управляемая синхронизация, оптимизационная термодинами
ка, управление пучками частиц, управление квантовыми системами [Д69, Д70].
Область получила название «кибернетическая физика» — исследование физиче
ских систем кибернетическими методами.
Управление и оценивание в сетях. Слияние теорий управления, вычислений
и связи. В последнее время в литературе наблюдается интерес к управлению
сетями взаимосвязанных физических систем. Примерами таких задач являют
ся управление пространственно распределенными предприятиями, включая сети
материально-технического снабжения и реализации готовой продукции; управ
ление группой транспортных средств, строем летательных аппаратов, коллекти
вом роботов и т. д. Внедрение подобных систем обусловлено бурным развитием
информационно-коммуникационных средств, в том числе беспроводных систем
связи и беспроводных датчиков. Растет также интерес к моделированию сетей
и управлению биологическими, биохимическими и социальными сетями, моле
кулярными кластерами и т. д. В то же время из-за сложности объектов управле
ния и возникающих целей управления координация действий в распределенных
системах и сетях становится все более сложной проблемой. Дополнительные
трудности обусловлены ограничениями на обмен информацией между подси
стемами, необходимостью учета ограниченной пропускной способности каналов
связи [Д79, Д87]. Новые задачи требуют одновременного рассмотрения аспектов
теории управления, теории информации и численных методов, а также физи
ки (статистической механики). Разрабатываемые сетевые встраиваемые системы
все чаще называются киберфизическими системами, поскольку часть их ком
понентов является объектами реального мира, а другая часть — виртуальными,
информационными объектами. Киберфизическая система интегрирует способно
сти к вычислениям, связи и хранению информации с мониторингом и/или управ-
796
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ ПО НЕЛИНЕЙНЫМ СИСТЕМАМ
лением объектами физического мира и должна делать это надежно, безопасно,
эффективно и в реальном времени [Д86].
К сожалению, нет возможности перечислить здесь все новые направле
ния в области нелинейных систем. Многие новые результаты обсуждаются на
международном семинаре «Устойчивость и колебания нелинейных систем» им.
Е.С.Пятницкого, проводимом раз в два года в Москве Институтом проблем
управления. Основные труды семинара публикуются в журнале «Автоматика
и телемеханика».
Дополнительный список литературы
[Д1] Аграчев Α. Α., Сачков Ю.Л. Геометрическая теория управления.
—
М.:
Физматлит, 2005.
[Д2] Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление.
2-е изд. -
М.: Физматлит, 2006. [ДЗ, Д4]
[ДЗ] Андреев Ю. Н. Управление конечномерными линейными объектами. — М.:
Наука, 1976.
[Д4] Андриевский Б. Р., Фрадков А. Л. Избранные главы теории автоматического
управления с примерами на языке MATLAB. — СПб.: Наука, 1999.
[Д5] Андриевский Б. Р., Фрадков А. Л. Управление хаосом: методы и приложе
ния. I. Методы // Автоматика и телемеханика. — 2003. — No 5. — С. 3-45. II.
Приложения // Автоматика и телемеханика. — 2004. — No 4. — С. 3-34.
[Д6] Андриевский Б. Р., Фрадков А. Л. Метод пассификации в задачах адаптив
ного управления, оценивания и синхронизации // Автоматика и телемеха
ника. -
2006. -
No11. -
С. 3-37.
[Д7] Андриевский Б. Р., Никифоров В. О., Фрадков А. Л. Синхронизация нели
нейных непассифицируемых систем на основе адаптивных наблюдателей
// Автоматика и телемеханика. — 2007. — No 7. — С. 74-89.
[Д8] Арсеньев Д. Г., Иванов В.М., Кореневский М.Л., Адаптивное управле
ние в стохастических методах вычислительной математики и механики. —
СПб.: Наука, 2005.
[Д9] Арутюнов А. В., Магарил-Ильяев Г. Г., Тихомиров В.М. Принцип макси
мума Понтрягина. Доказательство и приложения. — М.: Факториал Пресс,
2006.
[Д10] Афанасьев В.Н., Колмановский В. Б., Носов В. Р. Математическая теория
конструирования систем управления (3-е изд.). — М.: Высшая школа, 2002.
[Д11] Баландин Д. В., Коган Μ. Μ. Синтез законов управления на основе линей
ных матричных неравенств. — М.: Физматлит, 2007.
ДОПОЛНИТЕЛЬНЫЙ список ЛИТЕРАТУРЫ
797
[Д12] Барбашин Е.А., Красовский Н.Н. Об устойчивости движения в целом //
Докл. АН СССР. -
1952. -
Т.86,No3. -
С. 453-456.
[Д13] Бесекерский В. Α., Попов Е.П. Теория систем автоматического управле
ния. 4-е изд. — СПб.: Профессия, 2004.
[Д14] Бобцов А. А. Синтез закона управления для стабилизации нелинейной си
стемы по измерениям выхода // Изв. РАН. ТиСУ. — 2004. — No 3. — С. 40-45.
[Д15] Бобцов Α. Α., Николаев Н. А. Синтез управления нелинейными системами
с функциональными и параметрическими неопределенностями на основе
теоремы Фрадкова. -
2005. -
No1. -
С. 118-126.
[Д16] Бобылев Н.А., Красносельский A.M., Красносельский М.А. Устойчи
вость периодических колебаний и возможность их построения методом
гармонического баланса // Автоматика и телемеханика.
—
1989. -
No5.
-
С. 179-181.
[Д17] Бобылев Η. Α., Бурман Ю.М., Коровин С. К. Оценки погрешности метода
гармонического баланса // Автоматика и телемеханика.
—
1992. — No6.
—
С. 3-15.
[Д18] Боголюбов Н.Н., Митропольский Ю.А. Асимптотические методы в тео
рии нелинейных колебаний. — М.: Наука, 1974.
[Д19] Васильева А. Б., Бутузов В.Ф. Асимптотические методы в теории сингу
лярных возмущений. — М.: Высшая школа, 1990.
[Д20] Воротников В. И., Румянцев В. В. Устойчивость и управление по части
координат фазового вектора динамических систем: теория, методы и при
ложения. — М.: Научный мир, 2001.
[Д21] Гелиг А.Х., Леонов Г. Α., Якубович В. А. Устойчивость нелинейных си
стем с неединственным состоянием равновесия.
—
М.: Наука, 1978.
[Д22] Гелиг А.Х., Чурилов А.Н. Колебания и устойчивость нелинейных им
пульсных систем. — СПб.: Изд-во СПбГУ, 1993.
[Д23] Гелиг А. X., Зубер И. Е., Чурилов А. Н. Устойчивость и стабилизация нели
нейных систем. — СПб.: Изд-во СПбГУ, 2006.
[Д24] Гольдфарб Л. С. О некоторых нелинейностях в системах регулирования //
Автоматика и телемеханика.
—
1947. — Т. VIII. — No 5. — С. 349-383.
[Д25] Гудвин Г. К., Гребе С. Ф., Сальгадо М. Э. Проектирование систем управ
ления: классическое ПИД-управление. Синтез в пространстве состояний;
Цифровые и гибридные системы управления и др. Бином. — Лаборатория
знаний, 2004.
798
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ ПО НЕЛИНЕЙНЫМ СИСТЕМАМ
[Д26] Гусев СВ.,
Лихтарников А.Л. Очерк истории леммы Калмана-По-
пова-Якубовича и S-процедуры // Автоматика и телемеханика.
—
2006 —
No 11.-С. 159-174.
[Д27] Демидович Б. П. Лекции по математической теории устойчивости.
—
М.:
Наука, 1967; 2-е изд. МГУ, 1998.
[Д28] Дружинина М. В., Никифоров В. О., Фрадков А. Л. Методы адаптивного
управления нелинейными объектами по выходу. Обзор // Автоматика и те
лемеханика.
-
1996. -
No2. -
С. 3-33.
[Д29] Дружинина М.В., Фрадков А. Л. Методы скоростного градиента и ско
ростной разности в задаче нелинейного управления: пошаговый синтез //
Дифференциальные уравнения. -
1994. -
Т.30. -
No 11.
-
С. 1861-1867.
[Д30] Емельянов С. В., Коровин С. К., Бобылев Н. А. Методы нелинейного ана
лиза в задачах управления и оптимизации. — М.: УРСС, 2002.
[Д31] Ефимов Д. В., Робастное и адаптивное управление нелинейными колеба
ниями. -
СПб.: Наука, 2005.
[Д32] Ефимов Д. В., Фрадков А. Л. Условия колебательности по Якубовичу для
нелинейных систем. В кн.: Нелинейные системы. Частотные и матрич
ные неравенства. Под ред. А.Х.Гелига, Г.А.Леонова, А.Л.Фрадкова. —
М.: Физматлит, 2008. -
С. 303-318.
[Д33] Зеликин М. И. Оптимальное управление и вариационное исчисление. —
М.: УРСС, 2004.
[Д34] Каюмов О. Р. Глобально управляемые механические системы.
—
М.: Физ
матлит, 2007.
[Д35] Колесников А. А. Синергетические методы управления сложными систе
мами: теория системного синтеза. — М.: КомКнига, 2006.
[Д36] Колмогоров А. Н., Фомин С. В. Элементы теории функций и функциональ
ного анализа. 6-е изд. — М.: Наука, 1989.
[Д37] Краснова С. Α., Уткин В. А. Каскадный синтез наблюдателей состояния
динамических систем. — М.: Наука, 2006.
[Д38] Краснощеченко В. И., Крищенко А. П. Нелинейные системы: геометриче
ские методы анализа и синтеза.
—
М.: Изд-во МГТУ им. Н. Э. Баумана,
2005.
[Д39] Леонов Г. А. Хаотическая динамика и классическая теория устойчивости
движения. — М.-Ижевск: РХД, 2006.
ДОПОЛНИТЕЛЬНЫЙ список ЛИТЕРАТУРЫ
799
[Д40] Леонов Г. Α., Фазовая синхронизация. Теория и приложения // Автоматика
и телемеханика.
—
2006. — No 10. — С. 47-85.
[Д41] Леонов Г. Α., Буркин И. М., Шепелявый А. И. Частотные методы в теории
колебаний. -
СПб.: Изд-во СПбГУ, 1992.
[Д42] Леонов Г. Α., Смирнова В. Б. Математические проблемы теории фазовой
синхронизации. — М.: Наука, 2000.
[Д43] Лурье А. И., Постников В. Н. О теории устойчивости систем управления //
Прикладная математика и механика, 8(3), 1944.
[Д44] Лурье А. И. Некоторые нелинейные задачи теории автоматического регу
лирования. — М.: Гостехиздат, 1951.
[Д45] Макаров И. М., Лохин В. М., Манько С. В., Романов М. П. Искусственный
интеллект и интеллектуальные системы управления. — М.: Наука, 2006.
[Д46] Маланин В., Полосков И. Случайные процессы в нелинейных динамиче
ских системах. Аналитические и численные методы исследования.
—
М.
Ижевск: РХД, 2002.
[Д47] Матвеев А. С, В. А. Якубович В. А. Оптимальные системы управления:
обыкновенные дифференциальные уравнения. Специальные задачи: Учеб.
пособие. -
СПб.: Изд-во СПбГУ, 2003.
[Д48] Мирошник И. В. Теория автоматического управления. Нелинейные и оп
тимальные системы. — СПб.: Издательский дом «Питер», 2005.
[Д49] Мирошник И. В., Никифоров В. О., Фрадков А. Л. Нелинейное и адап
тивное управление сложными динамическими системами.
—
СПб.: Наука,
2000.
[Д50] Моисеев Н.Н. Математические задачи системного анализа.
—
М.: Наука,
1981.
[Д51] Нелинейные системы. Частотные и матричные неравенства. Под ред.
А. X. Гелига, Г. А. Леонова, А. Л. Фрадкова.
—
М.: Физматлит, 2008.
[Д52] Никифоров В. О. Адаптивное и робастное управление с компенсацией воз
мущений. — СПб .: Наука, 2003.
[Д53] Пантелеев А. В., Бортаковский А. С, Руденко Е. А. Нелинейные системы
управления: описание, анализ и синтез. — М.: Вузовская книга, 2008.
[Д54] Первозванский А. А. Курс теории автоматического управления.
—
М.: На
ука, 1986.
800
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ ПО НЕЛИНЕЙНЫМ СИСТЕМАМ
[Д55] Полушин И. Г., Фрадков А. Л., Хилл Д. Д. Пассивность и пассификация
нелинейных систем (обзор) // Автоматика и телемеханика. — 2000. — No 3
—
С. 3-37.
[Д56] Поляк Б. Т., Щербаков П. С. Робастная устойчивость и управление.
—
М.:
Наука, 2002.
[Д57] Поляхов Н. Д., Приходько И. А. Нечеткие системы управления. Учебн. по
собие. -
СПб.: Изд СПбГЭТУ «ЛЭТИ», 2003.
[Д58] Попов Е. П. Прикладная теория процессов управления в нелинейных си
стемах. — М.: Наука, 1973.
[Д59] Румянцев В. В. Об устойчивости движения по отношению к части пере
менных // Вестн. Моск. ун-та — 1957. — No 4. — С. 9-16.
[Д60] Румянцев В. В., Озиранер А. С. Устойчивость и стабилизация движения по
отношению к части переменных. — М.: Наука, 1987.
[Д61] Ряшко Л. Б. Стабилизация стохастически возмущенных нелинейных коле
баний // Автоматика и телемеханика.
—
2007. — No 10. — С. 155-165.
[Д62] Смирнов В. И. Курс высшей математики. В пяти томах. —
1974.
[Д63] Терехов В. Α., Ефимов Д. В., Тюкин И.Ю. Нейросетевые системы управ
ления: Учеб. пособие для вузов. — М.: Высш. школа, 2002.
[Д64] Тюкин И. Ю., Терехов В. А. Адаптация в нелинейных динамических си
стемах. -
М.: Изд-во ЛКИ, 2008.
[Д65] Фихтенгольц Г. М. Основы математического анализа. В 2-х частях. — СПб.:
Изд-во Лань, 2006.
[Д66] Фрадков А. Л. Синтез адаптивной системы стабилизации линейного ди
намического объекта // Автоматика и телемеханика.
—
1974.
—
No 12.
—
С. 96-103.
[Д67] Фрадков А. Л. Квадратичные функции Ляпунова в задаче адаптивной ста
билизации линейного динамического объекта // Сибирский математиче
ский журнал. -
1976. -
Т.17. -
No12. -
С. 436-445.
[Д68] Фрадков А. Л. Схема скоростного градиента в задачах адаптивного управ
ления // Автоматика и телемеханика.
—
1979. — No 9. — С. 90-101.
[Д69] Фрадков А. Л. Кибернетическая физика: принципы и примеры.
—
СПб.:
Наука, 2003.
[Д70] Фрадков А. Л. О применении кибернетических методов в физике // Успехи
физических наук. -
2005. -
Т.175. -
No2. -
С. 113-138.
ДОПОЛНИТЕЛЬНЫЙ СПИСОК ЛИТЕРАТУРЫ
801
[Д71] Черноусько Ф.Л. Оценивание фазового состояния динамических систем.
Метод эллипсоидов. — М: Наука, 1988.
[Д72] Черноусько Ф.Л., Ананьевский И. М., Решмин С. А. Методы управления
нелинейными механическими системами. — М.: Физматлит, 2006.
[Д73] Чурилов А. Н., Гессен А. В. Исследование линейных матричных нера
венств. Путеводитель по программным пакетам. — СПб.: Изд-во С.-Петерб.
ун-та, 2004.
[Д74] Якубович В. А. Метод матричных неравенств в теории устойчивости нели
нейных регулируемых систем. I. Абсолютная устойчивость вынужденных
колебаний // Автоматика и телемеханика. — 1964. — Т. 25. — No 7. — С. 1017-
1029.
[Д75] Якубович В. А. Периодические и почти-периодические предельные режи
мы регулируемых систем с несколькими нелинейностями // ДАН СССР. —
1966. -
Т. 171. -
No3. -
С. 533-536.
[Д76] Якубович В. А. Частотные условия автоколебаний в нелинейных системах
с одной стационарной нелинейностью // Сиб. мат. журн. —
1973. — Т.14. —
No5.-С. 1100-1129.
[Д77] Acary V., Brogliato B. Numerical Methods for Nonsmooth Dynamical Systems,
Springer, 2008.
[Д78] van den Berg R.A., Pogromsky A.Y, Leonov G.Α., Rooda J.Ε. Design of
convergent switched systems. In: Lecture Notes in Control and Information
Sciences 336: Group Coordination and Cooperative Control, pp. 291-311.
Springer-Verlag, 2006.
[Д79] Fradkov A. L., Andrievsky B., Evans R. Synchronization of Nonlinear Systems
under Information Constraints // Chaos, 2008, V.18, Is. 3, 037109, 1-6.
[Д80] Goncalves J., Megretski A., DahlehM. Global Stability of Relay Feedback
Systems // IEEE Trans. Autom. Control, 2001, 46(4): pp. 550-562.
[Д81] Iwasaki, Т., MeinsmaG., FuM. Generalized S-procedure and Inite frequency
ΚΥΡ lemma. Mathematical Problems in Engineering // 2000, 6, pp. 305-320.
[Д82] Kovaleva A. Optimal Control of Mechanical Oscillations. Springer-Verlag. NY,
1999.
[Д83] Kovaleva A. Upper and lower bounds of stochastic resonance and noise-induced
synchronization in a bistable oscillator // Physical Review E, 74, 011126 , 2006.
[Д84] Kovaleva, Α.; Akulenko, L. Approximation of Escape Time for Lagrangian
Systems With Fast Noise // IEEE Trans. Autom. Control, 2007, V. 52, 12,
pp. 2338 -2341.
802
ДОПОЛНЕНИЕ. ОБЗОР РАБОТ ПО НЕЛИНЕЙНЫМ СИСТЕМАМ
[Д85] Kurzhanski A.B., Valyil. Ellipsoidal Calculus for Estimation and Control.
Boston, MA: Birkhauser, 1996.
[Д86] Lee E.A. Cyber-Physical Systems: Design Challenges. In: 2008 11th IEEE
Symposium on Object Oriented Real-Time Distributed Computing (ISORC),
2008, pp. 363-369.
[Д87] Matveev A. S.,
Savkin A. Estimation and Control over Communication
Networks. Birkhauzer, 2008.
[Д88] Naifeh A.,
Balachandran, B. Applied Nonlinear Dynamics. Analytical,
Computational and. Experimental Methods. Wiley, 1995.
[Д89] NikiforovV.O.,
Robust High-order Tuner of Simplified Structure. //
Automatica 1999, 35 (8), pp. 1409-1415.
[Д90] Nusse E.N.,
YorkeJ.A.,Hunt В.С., Kostelich E.J. Dynamics: Numerical
Explorations. Springer, 1997.
[Д91] Ott E., Grebogi C, Yorke J. Controlling chaos // Phys. Rev. Lett. 1990, V. 64.
No11. pp. 1196-1199.
[Д92] Pavlov Α., van de WouwN., NijmeijerH. Uniform Output Regulation of
Nonlinear Systems: a Convergent Dynamics Approach. Birkhauser, 2006.
[Д93] Rantzer, A. On the Kalman-Yakubovich-Popov lemma. Systems & Control
Letters. 1996, 28, 1, pp. 7-10.
[Д94] Ryashko L.B. Exponential mean square stability of stochastically forced
invariant manifolds for nonlinear SDE // Stochastics and dynamics. 2007, V. 7,
No. 3, pp. 389-401.
Сентябрь 2008 г., Санкт-Петербург
Александр Фрадков
Условные обозначения
def
тождественно равно
приближенно равно
определяется как
< (>) меньше (больше)
^ (^) меньше (больше) или равно
<С (^>) существенно меньше (больше)
V для всех
Ε принадлежит
С подмножество
—> стремится к
=> следует
Ф> эквивалентно если и только если
Σ суммирование
Π произведение
\а\ абсолютное значение скалярной величины а
\\х\\ норма вектора х
\\х\\р р-норма вектора х
\\А\\Р индуцированная р-норма матрицы А
max максимум
min минимум
sup супремум, точная верхняя грань
inf инфимум, точная нижняя грань
Rn
евклидово пространство размерности η
Д. шар{хеR
n
|||х||^ г}
Μ замыкание множества Μ
дМ граница множества Μ
dist(p, Μ) расстояние от точки ρ до множества Μ
f : Si —> 52 функция /, отображающая множество 5i
в множество 5г
/2 ° Л композиция двух функций
/_1
(·) обратная функция для функции /
/'(·) первая производная вещественной функции /
£>+/(·) верхняя правая производная
V/ вектор-градиент
а/
дх
матрица Якоби
у первая производная у по времени
у вторая производная у по времени
804
УСЛОВНЫЕ ОБОЗНАЧЕНИЯ
Lfh
[f,9\
adhg
diag[ab...,an]
block diag[Ai,..., An]
AT(x
T
)
P>0
Re[z] или Rez
lm[z] или Imz
"z или z*
sat(·)
sign(-)
O(-)
Δ
Π
fxxl
г-я производная у по времени
производная Ли функции h вдоль
векторного поля /
скобка Ли векторных полей / и д
[/, acfc
-1
д](523) — повторная скобка Ли
диагональная матрица
с диагональными элементами а\,...,
ап
блочно-диагональная матрица с
диагональными блоками А\...,
Ап
транспонирование матрицы А (вектора х)
максимальное (минимальное) собственное
значение симметричной матрицы Ρ
положительно определенная матрица Ρ
положительно полуопределенная матрица Ρ
вещественная часть комплексной
переменной z
мнимая часть комплексной
переменной z
комплексное сопряжение комплексной
переменной z
комплексное сопряжение комплексной
матрицы Ζ
функция насыщения
функция знака
обозначение порядка величины
знак окончания примера
знак окончания доказательства
см. ссылку [хх] в списке литературы
Предметный указатель
Яоо -норма, 221
#оо-управление, 221, 504
М-матрица, 383
/^-устойчивость
—
моделей состояния, 212
—
определение, 207
—
при малом входном сигнале, 212
—
с конечным коэффициентом усиле
ния, 207
—
связь с пассивностью, 256
—
теоремы, 213, 217, 219
£2-коэффициент усиления, 220
/^-пространство, 206
ε-связи, 413
«Бэкстеппинг», 590, 632
RLC-цепь, 199, 247, 414, 452, 467, 488
Автомобильная подвеска, 454
Автономная система, 3
Адаптивное управление, 17, 136, 347,
467
Аппроксиматор производной, 527, 665
Асимптотическая устойчивость
—
глобальная
определение, 127
теоремы, 128, 134, 140
—
глобальная равномерная
определение, 157
теоремы, 160, 165
—
инвариантного множества, 352
—
область, 126
—
равномерная
определение, 157
теоремы, 159, 345
—
точки равновесия
определение, 115, 157
теоремы, 118, 133, 146, 325, 480
Асинхронный двигатель, 686
Банахово пространство, 705
Биохимический реактор, 35, 88
Бистабильная цепь, 49
Бифуркация, 5, 72
—
с нулевым собственным значением,
74
—
Хопфа, 77
—
вилка, 75
—
глобальная, 79
—
гомоклиническая, 80
—
локальная, 79
—
седло-узла, 74
—
транскритическая, 74
Быстрая мода, 462
Быстрое многообразие, 472
Векторное поле, 37, 543
Векторное пространство, 704
Возмущение
—
без структуры, 366
—
исчезающее в начале координат, 361
—
не исчезающие в начале координат,
368
—
периодическое, 422
—
постоянно действующее, 762
—
со структурой, 366
Вращающееся твердое тело, 192, 276,
653
Генератор с отрицательным сопротив
лением, 12, 58, 66, 82
Гидравлическая система, 33, 34, 516
Гистерезис, 21, 51
Градиент, 701
Градиентная система, 196
806
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Гурвицева матрица, 141
Гурвицева передаточная функция, 252
Динамический множитель, 272
Дискретная система, 204
Диссипативная система, 277
Диффеоморфизм, 541
—
глобальный, 541
Дифференциал, 765
Дифференцируемость решений, 102
Евклидово пространство, 697
Жесткая пружина, 10
Задача Лурье, 281
Задача слежения, 503, 577, 612
Идентификация, 447
Индекс Пуанкаре, 71
Интегральное управление, 403, 508,
511,521,616,670
—
робастность, 511
Интегратор-бэкстеппинг, 632
Каскадная система, 190
Каузальное (причинное, неупреждаю-
щее) отображение, 207
Квазиустановившаяся модель состоя
ния, 449
Колебание, 57
—
гармоническое, 4
—
почти-периодическое, 4
—
релаксационное, 61
—
субгармонические, 4
Композиция функций, 700
Конечное время ухода решений на бес
конечность, 4, 96
Консервативная система, 85
Кривая Попова, 295
Критерий
—
Бендиксона, 70
-Попова, 292, 316
векторный, 293
Круговой критерий, 281, 287
—
векторный, 281
Круиз-контроль, 82
Кусочно-линейный анализ, 12
Лемма
—
Барбалата, 342
—
Калмана-Якубовича-Попова, 255
—
Массера, 717
—
о положительной вещественности,
254
Линеаризация, 52, 145, 170, 175, 204,
505
—
по всем переменным состояния, 556
—
по входу-выходу, 542
—
точная, 538
Линеаризуемость системы по входу-
состоянию, 541
Линейная система
—
нестационарная, 164, 200, 346, 377,
395,431,443
—
стационарная, 139
Линейное векторное пространство, 704
—
нормированное, 704
Ляпуновский синтез, 620
Матрица
—
Якоби, 54, 701
—
собственная, 252
Медленная мода, 462
Медленная модель, 449
Медленно меняющаяся система, 388
Медленное многообразие, 471
Метод
—
Красовского, 193
—
Ляпунова
задача регулирования, 503
задача слежения, 503, 577, 612
пассивное управление, 648
первый, 146, 170
управление в скользящем режиме,
589
управление по выходу, 497
управление по состоянию, 497
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
807
управление с наблюдателем, 500,
507, 657
—
бэкстеппинга, 632
—
возмущений, 405
на бесконечном интервале, 417
обоснование применимости, 412
—
гармонического баланса, 297
—
индексов, 71
—
описывающей функции (метод гар
монического баланса), 297
обоснование, 306
—
переменного градиента, 124
—
последовательного
приближения,
704, 706
—
сингулярных возмущений, 62, 448
—
сравнения, 372
—
усреднения, 61, 426
общий, 440
применение в задачах идентифика
ции, 447
применение к слабо нелинейным
осцилляторам, 436
Минимально-фазовая система
—
линейная, 549
—
нелинейная, 551
Многообразие, 322
—
быстрое, 472
—
инвариантное, 322
—
медленное, 471
аппроксимация, 471
—
скольжения, 592
—
центральное, 323
аппроксимация, 327
Множество, 699
—
внутренность, 699
—
граничные точки, 699
—
замкнутое, 699, 705
—
замыкание, 699
—
инвариантное, 132
—
компактное, 699
—
односвязное, 70
—
открытое, 699
—
положительно инвариантное, 132
—
положительно предельное, 132
—
предельное, 132
—
связное, 699
Модель
—
Хопфилда, 14, 83
—
состояния, 2
Мягкая пружина, 9
Наблюдатель с сильной обратной свя
зью, 527, 655
—
редуцированного порядка, 665
Настроечные переменные, 515
Настройка обратной связи, 515
Неавтономная система, 3
Нейронная сеть, 14, 83, 137, 385
Нелинейное демпфирование, 576, 631
Нелинейность
—
без памяти (безынерционные), 19
—
гистерезис, 21
—
зона нечувствительности, 20
—
квантования, 20
—
кусочно-линейная, 300
—
люфта, 23
—
насыщения, 19
—
с нулевой памятью, 19
—
секторная, 246
—
сигмоидальная, 15
—
сигнум-функция, 19
—
статическая, 19
Немоделируемая быстрая динамика,
232, 469, 486, 595
Неподвижная точка отображения, 704
Непрерывность решений, 98
—
на бесконечном интервале, 378
Неравенство
—
Гёлдера, 93, 211
—
Гамильтона-Якоби, 223
—
Коши-Шварца, 401
—
Янга, 494
—
треугольника, 697
Неравенство
(лемма) Гронуолла-
Беллмана, 702
Неустойчивая
—
точка равновесия, 115, 157
Неустойчивость точки равновесия
808
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
—
определение, 115
—
теоремы, 129, 146, 194
Неустойчивый
—
предельный цикл, 61
—
узел, 40, 43, 54, 56
—
фокус, 42, 54
Норма, 206, 697, 704
—
векторая, 697, 704
—
матричная индуцированная, 698
Нормальная форма, 551
—
специальная, 585, 639
Нормированное линейное простран
ство, 704
Нуль-динамика, 551
Область, 699
—
притяжения, 126
—
притяжения
(асимптотической
устойчивости), 126, 331, 356
оценка, 335
Обратная связь
—
динамическая, 498
—
статическая, 498
Обратные теоремы, 142, 167, 172, 176,
392
—
определение, 171
Обратный маятник, 29, 536, 582
Ограниченность
—
определение, 179
—
теорема, 182
Окрестность, 699
Орбита, 37
—
периодическая (замкнутая), 57
Осциллятор
—
Ван дер Поля, 13, 59, 438, 473, 674
—
Вена-Бриджа, 83
—
гармонический, 58, 65
—
химический, 87
Открытая область, 699
Относительная степень
—
линейной системы, 252, 546
—
нелинейной системы, 544
Отображение Пуанкаре, 422
«Паразитные» параметры, 450
Пассивизация системы путем замены
обратной связи, 652
Пассивная система, 244
Пассивное управление, 648
Пассивность, 240, 249
—
строгая, 250
Пассивность системы
—
при обратной связи по выходу, 245,
249
—
при прямой связи по входу, 244, 249
—
строгая по входу, 244, 249
—
строгая по выходу, 245, 249
—
строгая по состоянию, 249
Передаточная функция
—
положительно вещественная, 251
—
строго положительно вещественная,
251
Переход Джозефсона, 26
Периодическая орбита, 57
—
устойчивость, 351
Периодическое решение (нетривиаль
ное), 57
Плоскость состояний, 37
Поведение
—
глобальное, 3
—
качественные характеристики, 39
—
количественные характеристики, 39
—
локальное, 3
—
множественность режимов, 4
Поверхность Ляпунова, 119
Поверхность уровня, 119
Пограничная система, 459
Пограничный интервал, 459
Пограничный слой (в скользящем ре
жиме), 598, 606
Подводный транспортный робот, 673
Подпространство точек равновесия, 44
Поле направлений, 37
Полная интегрируемость, 765
Последовательность Коши, 705
Предельная ограниченность
—
определение, 179
—
теорема, 182
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
809
Предельная точка, 699
Предельные циклы, 4, 57
Преобразование контура, 270
Принцип
—
(лемма) сравнения, 105
—
внутренней модели, 503
—
инвариантности, 131
—
редукции, 325
Принцип разделения, 657
Производная, 701
—
верхняя правая, 106, 710
Производная Ли, 543
Распределение, 559
—
инволютивное, 559
Регулирование, 503
Регулярная форма, 603
Редуцированная система (модель), 324,
449
Робастность, 230, 369, 469, 486, 575,
589, 605, 622, 641
Робот-манипулятор, 25, 194, 276, 561,
650, 689
Ряд Тейлора, 408
Седловая точка, 42, 54, 63
Секторное условие (секторная нели
нейность), 246
Сепаратриса, 49
Синхронный генератор, 26, 581
Система
—
«груз-пружина», 9, 28, 84, 195
—
«хищник-жертва», 84
—
TORA (Трансляционный осциллятор
с ротационным актуатором), 30
—
без потерь, 244, 249
—
в треугольной форме, 638
—
второго порядка, 37, 436
—
магнитной подвески, 32, 534, 586,
682
—
с сингулярными возмущениями, 47
Система с обратной связью
—
анализ, 229, 260
—
анализ в частотной области, 279
—
корректно определенная, 229, 261
—
с большим коэффициентом усиле
ния, 451, 488, 609, 628, 644
Система с сингулярными возмущения
ми
—
анализ устойчивости, 476
—
линейная, 490, 491
—
многопараметрическая, 494
—
стандартная модель, 449
Система, линеаризуемая заменой об
ратной связи, 538
—
определение, 541
—
характеризация, 560
Система, наблюдаемая в нулевом со
стоянии, 257
Скалярное произведение, 697
Скобка Ли, 558
Собственное значение (медленное,
быстрое), 39, 462, 490
Собственное отображение, 541
Собственный
вектор (медленный,
быстрый), 39
Соединение систем, 190, 381
Спектральное разложение, 733
Стабилизация, 498
—
бэкстеппинг, 632
—
в области, 502
—
глобальная, 502, 567
—
локальная, 502
—
на основе линеаризации, 505
—
на основе ляпуновского синтеза, 620
—
на основе обратной связи по выходу,
501, 655, 666
—
на основе пассивного управления,
648
—
на основе сильной обратной связи,
609, 628
—
на основе точной линеаризации, 566
—
на основе управления в скользящем
режиме, 602
—
полуглобальная, 502
—
робастная, 589
Структурно-устойчивая точка равнове
сия, 46, 58
810
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Сухое (кулоновское) трение, 10, 84
Существенно нелинейные явления, 3
Существование и единственность ре
шений, 90
—
глобальные теоремы, 96, 97
—
локальные теоремы, 91
—
максимальный интервал, 95
Сходимость, 698, 705
Теорема
—
Зубова, 356
—
Ла-Салля, 133
—
Ляпунова об устойчивости, 118
—
Парсеваля, 221
—
Пуанкаре-Бендиксона, 64
—
Тихонова, 461
на бесконечном интервале, 465
—
Фробениуса, 765
—
Четаева, 129
—
о малом коэффициенте усиления,
229
—
о неявной функции, 701
—
о сжимающем отображении, 706
—
о среднем значении, 701
—
о центральном многообразии, 321,
324
Теоремы
—
Барбашина-Красовского, 128, 134
—
Ляпунова о неустойчивости, 194
—
инвариантности, 343, 345
—
о пассивности, 260
Теория Флоке, 200
Точки равновесия, 3
—
гиперболические, 47
—
изолированные, 3
—
континуум, 3
—
множественность, 4, 48
—
типы, 43, 55, 56
Точная грань
—
верхняя, 698
—
нижняя, 698
Точная линеаризация, 538
Траектория, 37
—
замкнутая, 57
Трансляционный (поступательный) ос
циллятор с ротационным актуатором
(ТОРА), 30
Трение, 9
—
вязкое, 10
—
отрицательное, 28
—
покоя, 10
—
сухое, 10, 84
Управление в скользящем режиме, 589
—
непрерывное, 597, 606
Управление с наблюдателем, 500, 507,
657
Управление с обратной связью
—
бэкстеппинг, 632
—
интегральное управление, 403, 508,
511,521,616,670
—
настройка обратной связи, 515
Управление с сильной обратной свя
зью, 451, 488, 609, 628, 644
Уравнение
—
Ван дер Поля, 13, 59, 410, 413, 438,
473, 544, 552, 674
—
Гамильтона-Якоби-Беллмана, 196
—
Дуффинга, 10, 183, 447
—
Льенара, 13, 195
—
Ляпунова, 142, 196, 393, 396
в методе переменного градиента,
124
для систем с сингулярными возму
щениями, 476, 494
—
Матьё, 446
—
Риккати, 196, 397
—
Рэлея, 305, 446
—
выхода, 2
—
гармонического баланса, 300
—
маятника, 5, 48, 52, 55, 117, 122, 131,
150, 199
—
обратного маятника, 29, 536, 582
—
состояния, 2
свободное, 2
Условие
—
Липшица, 89, 91, 96, 99
глобальное, 91
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
811
локальное, 91
—
линейного роста, 568
—
согласованности, 575, 589
Усредненная система, 428
Устойчивая
—
матрица, 141
—
точка равновесия, 115
Устойчивость
—
L, 207
—
абсолютная, 281
—
асимптотическая, 115, 157
—
в конечной области, 281
—
в терминах «вход-выход», 205
—
возмущенной системы, 360
—
дискретной системы, 204
—
инвариантного множества, 352
—
линейной системы, 139, 164
—
определение, 115, 157
—
периодического решения, 349, 354
—
периодической орбиты, 351
—
по входу-состоянию, 185
локальная, 203
определение, 185
теорема, 186
—
равномерная, 157
—
сохранение при отображении, 147
-теоремы, 118, 140, 159
—
экспоненциальная, 158, 162
Устойчивость по Ляпунову, 114
—
автономные системы, 115
—
неавтономные системы, 154
—
связь с пассивностью, 256
—
связь с устойчивостью
«вход-
выход», 212
Устойчивость типа
«ограниченный
вход - ограниченный выход», 208
Устойчивый
—
предельный цикл, 61
—
узел, 40, 43, 54, 56
—
фокус, 42, 54
Фаза
—
достижения, 592
—
скольжения, 592
Фазовая плоскость, 37
Фазовый портрет, 38, 62
Функция
—
Ляпунова, 119
для соединения систем, 381
квадратичная, 121
квадратичного типа, 367
композитная, 382, 478
типа функции энергии, 135
функция энергии, 117
—
Ляпунова-Лурье, 293
—
без памяти, 19
—
взаимно-однозначная, 700
—
дифференцируемая, 701
—
запаса, 249
—
класса К, 151
—
класса KL, 151
—
кусочно-непрерывная, 700
—
насыщения, 19
—
непрерывная, 699
—
обратная, 700
—
описывающая, 300
—
отрицательно определенная, 120, 162
—
отрицательно полуопределенная, 120
—
положительно определенная, 120,
162
—
положительно
полуопределенная,
120
—
равномерно-непрерывная, 700
—
радиально неограниченная, 128, 162
—
сигмоидальная, 15
—
сигнум-, 19
—
убывающая, 162
Хаос, 4
Центр, 42
Цепь
—
с туннельным диодом, 7, 48, 55, 76,
83
—
фазовой синхронизации, 27, 104
Чаттер, 594, 625
Чувствительность, 102
812
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Эквивалентная линеаризация, 300
Эквивалентное управление, 604
Эквивалентный коэффициент усиле
ния, 300
Экспоненциальная устойчивость
—
определение, 158
-
теоремы, 162, 175, 345, 362, 374, 390,
402,425,431,442,484,493
Электродвигатель постоянного тока, 31
—
с управлением током в обмотке воз
буждения, 32,492, 535, 545, 553, 564,
587
—
с управлением током якоря, 32, 450
Эффект Страйбека, 10
Явление образования пиков, 570, 659
Явление скачка, 61
Хассан К. Халил
НЕЛИНЕЙНЫЕ СИСТЕМЫ
Дизайнер Л. Н. Загуменова
Технический редактор А. В. Широбоков
Компьютерный набор и верстка А, В. Моторин
Корректор Г. Г. Тетерина
Подписано в печать 20.02.2009. Формат 70 х 90 1/16.
Печать офсетная. Усл. печ. л. 67,08. Уч. изд. л. 65,32.
Гарнитура Таймс. Бумага офсетная No1. Заказ No0052
АНО «Ижевский Институт компьютерных исследований»
426034, г. Ижевск, ул. Университетская, 1.
http://shop.rcd.ru E-mail: mail@rcd.ru Тел./факс: (+73412) 500-295
Отпечатано в ГУП УР «Ижевский полиграфический комбинат»
426039, г. Ижевск, Боткинское шоссе, 180.