/
Текст
Ю. И. АНДРЕЕВ
УПРАВЛЕНИЕ
КОНЕЧНОМЕРНЫМИ
ЛИНЕЙНЫМИ
ОБЪЕКТАМИ
1ау!£^й^ехп1Чйй
’”СГ" '
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
Москва 1976
6ф6.5
А 65
УДК 62-50
Управление конечномерными липой ны ми объектами,
Ю. Н. Андреев. Главная редакция физико-математической
литературы издательства «Наука», 1976, 424 стр.
Книга посвящена важной проблеме теоретичесной и техниче-
ской Кибернетики — теории синтеза систем управления для линей-
ных объектов с конечномерным пространством состояний.
С помощью аппарата линейиых векторных пространств изло-
жены основные результаты теории модального управления н теории
оптимальных обратных связей в системах с квадратичным критерием
качества. Главным образом рассмотрены детерминированные систе-
мы с непрерывным временем. Значительное внимание уделено вы-
числительным аспектам теории. Наряду с теоретическими положе-
ниями книга содержит примеры и задачи, которые подробно иллю-
стрируют возможности теории при решении конкретных задач
аналитического конструирования регуляторов.
Кинга адресована инженерам и научным работникам, специали-
зирующимся в области исследования и конструирования систем
управления. Она может быть полезна аспирантам и студентам стар-
ших курсов соответствующих специальностей.
Илл. 52. Библ. 90 назв.
Юрий Николаевич Андреев
УПРАВЛЕНИЕ КОНЕЧНОМЕРНЫМИ ЛИНЕЙНЫМИ ОБЪЕКТАМИ
М., 1976 г., 424 стр. с илл.
Редакторы А. X- С лебедянский, А. А. Могилевский
Техн, редакторы А. П. Колесникова, С, Я- Шкляр
Корректор В. П. Сорокина
Сдано в набор 2/П-1976 г. Подписано к печати 24<УГ 1976 г. Бумага SixlOS1/».
Физ. иеч. л. 13,25 Условн. печ. п. 22,26 Уч.-изд. л. 21,72 Тираж 4300 экз.
Т- 11049 Цена книги 2 р. 06 Заказ № 458
Издательство «Наука»
Главная редакция физико-математической литературы
117071, Москва, н-71, Ленинский проспект, 15
2-я типография издательства «Наука». Москва, Шубинский пер., 10
30501-090 п,
А 053(02)-7б 153"76
(g) Главная редакция
физико-математической литературм
издательства «Наука», 1976
ОГЛАВЛЕНИЕ
Предисловие.............................................. 7
Глава I. Линейная алгебра................................. 9
§ 1. Кольцо и поле........................................ 9
Алгебраическая операция (9). Определение к примеры
колец (10). Операции в кольце (11). Поле. Свойства опе-
раций в поле (16). Попе вещественных чисел (17). Зада-
чи (18).
§ 2. Матрицы и действия над ними......................... 18
Обозначения и терминология (18). Сложение и -умноже-
ние (20). Кольцо квадратных матриц (21). Многочлены
от матриц (23). Транспонирование (25). Обратная мат-
рица (26). Клеточные матрицы (27). Матричная запись
систем линейных уравнений (29). Задачи (30).
§ 3. Определитель квадратной матрицы........................ 31
Определение детерминанта (31). Свойства определите-
лей (33). Определитель произведения матриц (38). Вы-
числение обратной матрицы (40). Алгоритм Гаусса (42).
Задачи (44).
§ 4. Ранг матрицы. Системы линейных уравнений .... 45
Линейная зависимость (45). Ранг матрицы (46). Теорема
Крон ев ера — Капелям (49). Фундаментальная система ре-
шений (52). О численном решении линейных систем (53).
Задачи (55).
§ 5. Характеристический и минимальный многочлены мат-
рицы ........................................................ 55
Подобные матрицы (55). Характеристический многочлен
матрицы (56). Теорема Кэли — Гамильтона (58). Мини-
мальный многочлен (59). Сопровождающая матрица много-
члена (60). Задачи (61),
§ 6. Линейные векторные пространства.......................... 61
Линейное пространство и модуль (61). Линейная зависи-
мость (64). Размерность и базис (65). Замена базиса (67).
Линейные подпространства (68). Задачи (72).
§ 7. Линейные преобразования н их матрицы..................... 73
Линейные операторы (73). Матрицы линейных операто-
ров (74). Ранг и дефект линейного оператора (77). Линей-
ные операторы в R71 (79). Обратный оператор (81). Соб-
ственные векторы (82). Треугольная форма матрицы (84).
Задачи (86).
1*
4
ОГЛАВЛЕНИЕ
§ 8. Евилидовы пространства. Квадратичные формы .
Скалярное произведение (87). Ортогонализация базиса
(89). Сопряженный оператор (90). Самосопряженные опе-
раторы (91). Линейные уравнения (95). Матрица Грама
(96). Квадратичные формы (98). Задачи (100).
Глава П. Линейные дифференциальные уравнения . .
§ 9. Однородная система. Существование и единственность
решения...................................................
Единственность решения (101). Конечномерность простран-
ства решений (102). Фундаментальная матрица (104). Пере-
ходная матрица (105). Теорема о существовании решения
(106). Ряд Пеано для переходной матрицы (ПО). Задачи (111)
§ 10. Свойства переходной матрицы. Формула Коши . . .
Формула О стр о гр адского — Лиувилля (112). Правило ком-
позиции (113). преобразование координат (114). Неоднород-
ное уравнение (115). Сопряженное уравнение (117). Стацио-
нарный случай (119). Перечень свойств переходной матри-
цы (121). Способы построения переходной матрицы (122).
Задачи (125).
§ 11. Линейные системы с периодическими коэффициентами
Преобразование Ляпунова. Приводимые системы (128). Тео-
рема Еругнна (128). Теорема Ляпунова — Флоке (130).
Периодические решения однородной системы (131). Перио-
дические решения неоднородной системы (132). Задачи (137).
§ 12. Линейные матричные уравнения........................
Матричная формула вариации постоянных (139). Сопряжен-
ное уравнение (140). Оценка квадратичного фуниционала
(141). Матричное уравнение A'V -j- VA = — TV (144). Об-
суждение (146). Задачи (147).
§ 13. Численное решение стационарных уравнений ....
Скалярное уравнение (149). Точность аппроксимации (152).
Алгоритм решения уравнения х (() = Ах(/> (153). Устой-
чивость вычислений (154). Неоднородное уравнение (155).
Обсуждение (158). Задачи (158),
Глава ПТ. Устойчивость движения линейных объектов .
§ 14. Описание линейных объектов в пространстве состояний
Определение линейной системы (160). Понятие состояния (164).
Уравнения состояния и передаточная функция (166). Зада-
чи (172),
§ 15. Устойчивость........................................
Устойчивость движения по Ляпунову (174). Устойчивость
и переходная матрица (176). Устойчивые стационарные мат-
рицы (177). Критерий Рауса — Гурвица (178). Нестацио-
нарные матрицы (181). Устойчивость приводимых систем
(182). Равномерная асимптотическая устойчивость (184).
Задачи (185).
§ 16. Второй метод Ляпунова...............................
Теорзма Ляпунова (186). Геометрический смысл метода (190).
Функции Ляпунова нестационарной системы (190). Зада-
чи (Ю5).
87
101
101
112
127
139
149
160
160
174
186
ОГЛАВЛЕНИЕ
5
§ 17. Функции Ляпунова и оценка качества переходного
процесса................................................... 196
Оценка длительности переходного процесса (196). Оценка
квадратичного отклонения (197). Обсуждение (197). Чис-
ленное решение уравнения Ляпунова (198). Задачи (200).
§ 18. Постановка задач управления.......................... 200
Задача программного управления (201). Задача регулиро-
вания (201).
Глава IV. Линейная обратная связь.......................... 205
§ 19. Управляемость и достижимость......................... 205
Понятие управляемости (205). Управляемость системы с ну-
левой матрицей А (207). Критерий управляемости (211).
Критерий достижимости (216). Линейные периодические
системы (218). Задачи (219).
§ 20. Стационарные объекты................................. 220
Критерий управляемости (220). Задача финитного управле-
ния (224), Эквивалентность управляемости и достижимости
(227). Задачи (228).
§ 21. Понятие обратной связи............................... 229
Закон управления (229). Стационарный управляемый объект
(230). Нестационарные объекты (231). Задача (235).
§ 22. Канонические представления........................... 235
Замена базиса в пространстве состояний (235). Вычисление
матрицы преобразования (237). Каноническое представление
системы с одним входом (239). Канонические представления
системы с многими входами (243). Задачи (248).
§ 23. Обратная связь «по состоянию» в стационарных си-
стемах .................................................... 249
Система с одним входом (349). Система с многими входа
ми (253). Задачи (258).
Глава V. Идентификаторы состояния.......................... 259
§ 24. Наблюдаемость и идентифицируемость................... 260
Основные положения (260). Критерий неидентифицируемости
(262). Задача точной оценки состояния (284), Дуальность
задач управления и задач оценки состояния (267). Задачи (271)
§ 25. Асимптотические идентификаторы п-го порядиа . . 271
Простейший идентификатор (272). Асимптотический иденти-
фикатор для системы с одним выходом (274). Асимптотический
дифференциатор (279). Система с многими выходами (280).
Задачи (281).
§ 26. Идентификаторы Люенбергера........................... 282
(п — 1)-мерный асимптотический идентификатор для системы
с одним выходом (282). Алгоритм построения (п — 1)-мер-
ного идентификатора (285). Идентификаторы Люенбергера
для системы с многими выходами (286). Матричное уравне-
ние ТА — DT = S в теории идентификаторов (291). Еще
один способ построения (п — р)-мерного идентификатора
(295). Задачи (297).
Глава VI. Модальное управление............................. 299
§ 27. Конструкция регуляторов.............................. 300
Применение n-мерных идентификаторов (300). Алгоритм
вычисления коэффициентов регулятора для системы с одним
6
ОГЛАВЛЕНИЕ
входом (303). Фильтр Налмана (305). Использование иден-
тификатора Люенбергера (307). Стабилизация неустойчивого
объекта 4-го порядка (310). Задачи (315)
§ 28. Управление отдельными модами........................ 315
Модальная управляемость (316). Управление одной и двумя
модами (317). Итерационное построение модального управ-
ления (321), Задачи (323).
§ 29. Интегральная обратная связь......................... 324
Аддитивная помеха в канале измерения (325). Постоянное
возмущение на входе (328). Интегральная обратная связь
для многомерного объекта (329). Управление по возмуще-
нию (332). Задачи (334).
§§ 30 . Модальное управление распределенной системой . . 335
Аппроксимация распределенной системы с помощью конеч-
ного числа мод (335) Стабилизация неустойчивой распре-
деленной системы (337) Задачи (341).
31. Следящая система.................................... 341
Постановка задачи (342) Точная компенсация помехи (344).
Слежение за командным сигналом (345). Физически реализуе-
мая следящая система (348). Задача (357).
Глава VH. Квадратичный критерий качества.................. 358
§ 32. Минимизация в евклидовых пространствах .... 360
Минимальная длина вектора, принадлежащего заданной гипер-
плоскости (360). Минимальная норма решения линейной
системы (361). Минимизация квадратичной формы на реше-
ниях линейной системы (363). Задачи (364),
§ 33. Задачи со свободным конечным состоянием системы 365
Уравнение Риккати (365). Задача о регуляторе нулевого
состояния (367) Явный вид решения уравнения Риккати
(372). Преобразование координат (373), Задача о регуля-
торе выхода (374), Задачи (376).
§ 34. Терминальное управление............................. 378
Минимум нормы терминального управления (878) Общий
случай терминальной задачи (382). Оптимальная следящая
система (385). Задачи (387).
§ 35. Стационарные системы................................ 389
Алгебраическое уравнение Риккати (389). Явный вид реше-
ния стационарного уравнения Риккати (393) Единственность
оптимального управления (394) Стационарные регуляторы
(395). Задачи (398)
5 36. О решении уравнения Риккати......................... 400
Локальные условия существования решения уравнений Рик-
кати (400). Канонические уравнения (403). Существование
решения на полубесконечном интервале (406). Численное
интегрирование уравнения Риккати на конечном временном
интервале (408). Итерационное решение алгебраического
уравнения Риккати (409). Задачи (410).
Послесловие............................................... 413
Указания на литературные нсточинкн........................ 417
Литература................................................ 418
Предметный указатель...................................... 422
ПРЕДИСЛОВИЕ
Началом настоящей работы послужили лекции по
теории управления, прочитанные автором для сотрудников
лаборатории автоматизации института «Теплопроект» в
1972—73 гг. Значительное влияние как на подбор мате-
риала, так и на характер его изложения оказали работы
Р. Калмана и книги [52, 55, 81].
Схема изложения теории управления линейными объек-
тами принципиально отличается от принятой в традици-
онных курсах.
Главное внимание уделено той части линейной теории,
в которой используются только конечномерные простран-
ства состояний, а в качестве управляющих воздействий
выбираются непрерывные функции времени. Автор стре-
мился построить изложение основных фактов, используя
только тот минимум математических понятий, который обу-
словлен решаемыми прикладными задачами. По существу
вся теория сводится к подробному разъяснению понятий
конечномерной линейной алгебры и таких понятий, как
состояние, идентификатор состояния, обратная связь по
состоянию. Доказательства основных результатов теории
предельно просты. Как правило, они сводятся к выбору
соответствующего базиса в конечномерном пространстве
состояний. Вместе с тем в рамках этого подхода получено
решение задач, имеющих большое практическое значение.
К ним относится задача конструирования динамических
- обратных связей, обеспечивающих заданное размещение
полюсов замкнутого объекта на комплексной плоскости.
Возможность решения этой задачи для стационарного
линейного объекта обеспечивается наличием у него свойств
управляемости и идентифицируемости и не зависит от чис-
ла входов и выходов, а также от сложности его внутренней
структуры. Более того, вычислить структуру и все коэф-
фициенты такого регулятора по заданным динамическим
свойствам объекта — подчас более простая задача с точки
зрения объема вычислений, чем задача исследования ди-
намических свойств разомкнутого объекта. Безусловно,
такое «простое» решение задачи синтеза связано с опреде-
ПРЕДИСЛОВИЕ
ленной идеализацией реальных объектов. Тем не меиее
эти результаты имеют очень важное значение при реше-
нии задач конструирования конкретных систем управ-
ления.
Значительное внимание в книге уделено вычислитель-
ным методам. Приведены эффективные алгоритмы числен-
ного решения основных уравнений линейной теории: ал-
горитм вычисления матричной экспоненты, алгоритм ре-
шения матричного уравнения Ляпунова и матричного
уравнения Риккати, алгоритмы аналитического конструи-
рования модальных и оптимальных регуляторов.
В работе отсутствуют обычные темы линейной теории
регулирования: частотные методы, метод корневого годо-
графа, свойства преобразований Лапласа, передаточные
функции и их связь с частотными характеристиками и т. п.
Это, конечно, не означает, что автор считает эти методы
устаревшими или малоэффективными. Имеется целый
ряд важнейших проблем теории регулирования, для ре-
шения которых наиболее эффективны именно эти методы.
О содержании книги можно судить по подробному ог-
лавлению.
Приведенные в тексте задачи можно разбить на три
категории: 1) простые упражнения, решение которых не
должно вызывать затруднений, если понят основной текст
параграфа; 2) ‘задачи, путь решения которых ясен из
основного текста, но для получения ответа требуется про-
вести подчас не совсем короткие и не совсем простые вы-
кладки (для решения некоторых из таких задач требуется
составить программу для ЦВМ); 3) задачи типа дополни-
тельных теорем, доказательство которых может потребо-
вать привлечения дополнительных сведений. В виде таких
задач иногда вводятся новые темы, которые в последую-
щих параграфах подробно разбираются в основном тексте.
Книга ориентирована главным образом па специали-
стов по автоматическому регулированию и студентов соот-
ветствующих специальностей, знакомых с классическими
методами теории регулирования. Однако изложение до-
ступно для начального ознакомления с предметом.
Нумерация формул, теорем и рисунков принята своя
для каждого параграфа.
Автор выражает глубокую благодарность М. А. Ай-
зерману за ряд ценных критических замечаний.
а
ГЛАВА I
ЛИНЕЙНАЯ АЛГЕБРА
Основная цель, которой подчинено содержание этой
главы, ввести и подробно разъяснить понятия и факты ли-
нейной алгебры, используемые в теории конечномерных
линейных управляемых систем.
Здесь изложены основы алгебры матриц, теории линей-
ных уравнений, основные факты относительно линейных
операторов, действующих в линейных векторных прост-
ранствах, элементы теории евклидовых пространств и
необходимые в дальнейшем сведения о квадратичных
формах.
§ 1. Кольцо и поле
Основным объектом, с которым нам предстоит иметь
дело, будет матрица. Так называют прямоугольную
таблицу, составленную из некоторых элементов. Эти эле-
менты чаще всего обычные числа. Нам, одиако, встретятся
матрицы, элементами которых будут непрерывные функ-
ции, многочлены, матрицы. Будем обозначать множество
чисел или объектов другой природы, из которого мы бу-
дем черпать элементы матриц, буквой К. Прежде чем
приступить к изучению свойств’матриц необходимо опи-
сать алгебраические свойства множества К.
Алгебраическая операция. Пусть задано множество
К объектов произвольной природы а, Ь, с, . . которые
мы будем называть элементами множества К. Мы скажем,
что в множестве К определена алгебраическая операция,
если указан закон, по которому любой паре элементов а,
b из этого множества, взятым в определенном порядке,
ставится в соответствие единственцый элемент с того же
мдощестда,
10
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. 1
Алгебраическая операция может и пе обладать свойст-
вом коммутативности: если паре элементов а, b ставится
в соответствие элемент с, то паре элементов 6, а может
оказаться доставленным в соответствие другой элемент d.
Следует обратить внимание на то, что в определении ал-
гебраической операции содержится требование однознач-
ности и выполнимости операции для любых двух эле-
ментов множества К.
Примерами алгебраических операций служат операции
сложения и умножения на множестве целых чисел. Опе-
рация сложения, определенная на множестве нечетных чи-
сел, не является алгебраической операцией, так как ре-
зультат этой операции не принадлежит исходному множест-
ву К, например, 1 1 = 2 — четное число. Не будет
алгебраической операцией и операция деления на мно-
жестве вещественных чисел, так как деление на нуль
невозможно.
Определение и примеры колец. Мы будем рассматри-
вать множества с двумя алгебраическими операциями,
которые мы будем называть сложением и умножением.
Вообще говоря, эти операции могут и не быть сложением
и умножением в обычном смысле. Важно, чтобы обе они
удовлетворяли определению алгебраической операции.
Определение 1. Множество К называется коль-
цом, если в нем определены две алгебраические опера-
ции — сложение и умножение, которые удовлетворяют
следующим аксиомам:
1. Сложение коммутативно: а + b = b -f- а.
2. Сложение ассоциативно: а -)- (Ь -|- с) = (а 4- Ь) с.
3. Если а, b — элементы К, то уравнение a -j- х = b
разрешимо в К.
4. Умножение ассоциативно: {аЬ)с ~ а (be).
5. Операции сложения и умножения связаны зако-
ном дистрибутивности: a (b -f- с) = аЪ + ас, (6 т с) я =
= Ьа сд.0 *)
Обычно такое кольцо называют ассоциативным
кольцом. Если умножение в кольце коммутативно: ab = Ьа
для любых а и b из К, то кольцо называется коммутатив-
*) Знак «0» ставится в конце определения, доказательства
теоремы и т. д.
I 1] КОЛЬЦО И ПОЛЕ 11
додеЗ В коммутативном кольце второе из равенств аксио-
вд $ является следствием первого.
Хкажем примеры колец.
1, Простой пример числового кольца — множество
цеМЫ1 чисел с обычными операциями сложения и умно-
жения. Очевидно, это коммутативное кольцо. Множество
целых положительных чисел не будет кольцом, так как
не выполняется аксиома 3 определения кольца.
2. Рассмотрим множество К функций действительного
Переменного непрерывных на отрезке f0 £г Сум-
ма й произведение двух функций из К будут также непре-
рывными функциями. Следовательно, сложение и умно-
жение непрерывных функций будут алгебраическими опе-
рациями, определенными в К. Поскольку для этих опе-
раций выполняются условия 1—5, множество К образует
кольцо, притом коммутативное, так как умножение функ-
ций подчиняется коммутативному закону.
3. Все многочлены от одного переменного с произволь-
ными числовыми коэффициентами относительно обычных
операций сложения и умножения многочленов образуют
коммутативное кольцо.
4. Ассоциативное, но некоммутативное, кольцо обра-
зуют все квадратные матрицы одного порядка с произ-
вольными числовыми элементами (о сложении и умноже-
нии матриц см. § 2).
5. Все четные числа образуют кольцо относительно опе-
раций сложения и умножения.
Операции в кольце. Рассмотрим теперь простейшие
свойства алгебраических операций в кольце. Начнем со
следствий, вытекающих из законов ассоциативности. Из
этих законов непосредственно следует, что произведение
и сумма для любого конечного числа элементов кольца
определяются однозначно и не зависят от первоначального
Распределения скобок. Например, можно говорить о про-
изведении четырех элементов кольца abed, так как все
пять возможных способов вычисления этого произведения
((ad) с) d, {а (дс)) d, a ((be) d), a (b (cd)), (ab) (cd)
ДйЮТ один и тот же результат. Действительно, каждое сле-
ДУЮЩее произведение получается из предшествующего не-
Г родственным применением закона ассоциативности 4.
Же, очевидно, справедливо и для операции сложения.
12 ЛИЙЕЙНАЯ АЛГЁБРА Lt Л. t
По индукции легко показать, что это свойство справедли-
во для любых п элементов кольца, т. е. справедливо
Предложение 1. Во всяком произведении п
элементов кольца К: а1а3 . . . ап и во всякой сумме п эле-
ментов кольца К: + % + • • • + ап ск°бки можно рас-
ставлять произвольно, сохраняя порядок следования эле-
ментов. Q
Так как сложение подчиняется коммутативному зако-
ну, то порядок следования слагаемых в сумме двух или
нескольких элементов не является существенным. Что
касается произведения двух или нескольких элементов,
то оно уже зависит от порядка следования сомножителей,
так как умножение, вообще говоря, не подчиняется ком-
мутативному закону.
Свойство ассоциативности умножения позволяет ввести
следующее понятие целой положительной степени эле-
мента кольца.
Определение 2. п-й степенью (п — целое по-
ложительное число) элемента а назовем произведение п
одинаковых сомножителей аа. . . а и будем обозначать
ее через ап. Сам элемент а будем рассматривать как а1. 0
Нетрудно проверить, что для целых положительных
степеней элементов кольца справедливы обычные правила
действий со степенями:
атап = апат = а™+п, (ат)п = атп,
а если кольцо коммутативно, то выполняется правило
(ab)n = апЬп.
Докажем для примера последнее равенство
anbn = (аа.. .а) (bb.. .Ь),
п раз п раз
в силу коммутативности можно изменить порядок сомно-
жителей и получить
(ab).(ab)...(ab) = (ab)n.
п раз
Рассмотрим теперь следствия аксиомы 3. Пусть b —
некоторый элемент кольца. По условию 3 существует эле-
мент с такой, что b + с = Ь. Назовем элемент с кольца
К нулевым элементом или нулем. Покажем, что нулевой
J 11 I КОЛЬЦО И ПОЛЕ 13
элемент единствен. Пусть — тоже нуль. Тогда ct 4~ с =
=? Cjl и одновременно с 4- ~ с. Отсюда видно, что
С1 =[С. Нуль кольца К обозначим через 0. Понятно, что
нулевой элемент кольца ие обязательно совпадает с числом
0. ДЛя кольца непрерывных на отрезке t функ-
ций, рапример, нулевой элемент кольца — функция, тож-
дественно равная нулю при t В кольце квад-
ратных матриц нулевым^ элементом будет матрица, все
элементы которой равны нулю. Мы доказали следующее
Пре дложение 2. Всякое кольцо К обладает
единственным элементом, называемым нулевым элемен-
том кольца, сумма которого с любым элементом а этого
кольца совпадает с а; а + 0 = а для всех а из К. 0
Рассмотрим уравнение а + я = 0, которое согласно
аксиоме 3 имеет решение. Покажем, что это решение един-
ственно. Действительно, пусть и х2— два корня этого
уравнения, т. е. а + — 0 и = 0. Прибавим
к обеим частям первого равенства элемент х2, тогда
(а + #i) + х2 = н0» с Другой стороны, {а + xi) + —
— (а ar2) + xi ~ 0 + Xi = х1. Следовательно, х2 = хг.
Единственность доказана. Единственное решение уравне-
ния а + х ~ 0 называют элементом, противоположным
л, и обозначают (—а). Мы доказали
Предложение 3. Во всяком кольце для любого
элемента а существует однозначно определенный противо-
положный элемент (—а), удовлетворяющий равенству
а + (—а) = 0. 0
После определения нуля и противоположного элемента
нетрудно показать, как решается уравнение а х ~ Ъ.
Если к обеим частям прибавим (—а), то в результате
получим (—а) + а + х = Ъ 4~ (—а) или, так как
(—а) -ф а = 0, х = Ъ + (—а). Выражение b 4~ (—а)
принято обозначать (Ь — а) и называть разностью эле-
ментов Ъ и а. Таким образом, из аксиомы 8 следует, что
в кольце всегда однозначно выполнимо вычитание. Оче-
видно, что а — а —0, 0 — а ~ — а.
Если в кольце К вычитание всегда возможно, то отно-
сительно деления этого сказать нельзя, так как мы нигде
ие требовали, чтобы уравнения ах = Ъ и ха = Ъ были
разрешимы.
14
ЛИНЕЙНАЯ АЛГЕБРА
(ГЛ. I
Кроме нуля, в кольце К может существовать (но йожет
и не существовать) элемент, известный под названием
единицы кольца.
Определение 3. Единицей кольца К назы-
вается такой элемент е ф 0, для которого ае = ей = а
для любого элемента а из К. Q I
Нетрудно показать, что если в кольце К единица
существует, то она единственна. Пусть, например, есть
две единицы в кольце К: и е. Тохда eeL = ег и одновре-
менно ere = еех ~ е. Значит, е = et. В кольце с единицей
можно ввести понятие нулевой степени элемента, положив
по определению аи = е (0 — число). В кольце с единицей
правила действия со степенями будут, таким образом,
справедливы при любых целых неотрицательных показа-
телях п.
Примеры колец с единицей: 1) кольцо целых положи-
тельных чисел, 2) кольцо непрерывных функций. Еди-
ничным элементом является в этом кольце функция / (Z)
= 1 при Zo t
Кольцо четных целых чисел является примером
кольца, которое не содержит единицы.
Обратимся к аксиоме 5 — закону дистрибутивности.
Это единственная аксиома в определении кольца, которая
связывает операции сложения и умножения. В форму-
лировке этой аксиомы участвует сумма двух слагаемых.
Это свойство, однако, распространяется по индукции на
любое конечное число членов (аг + а2 + . . . + «п) & ’
== atb + й2д -f- . . . -f- anb при любом п. Более того,
по индукции легко доказать общее правило перемноже-
ния двух сумм
ai + а2 + . . . Н- ак) т Ь2 + . . . 4- Ьп) =
= аД + а2Ьг -J- . . . + + агЬ2 + . • . + akbn.
Порядок следования слагаемых произволен, но если коль
цо не коммутативно, мы не можем переставлять сомно-
жители в произведении агЬ3
Во всяком кольце распределительный (дистрибутив-
ный) закон остается в силе и для операции вычитания:
a (b — с) = ab — ас, (b — с) а ~ Ьа — са
для любых а, Ь, с из кольца.
I l КОЛЬЦО И ПОЛЕ 15
Пфлучим, например, первое равенство. По определению
разности имеем с + (6 — с) = Ь. Умножим обе части
этого равенства на а, тогда а (с + (& — с)) ~ ab =
= ас Ь а (6 — с). Из последнего равенства мы видим, что
й (Ъ -- с) = ab — ос.
Пользуясь дистрибутивностью операции вычитания,
покажем, что произведение двух элементов кольца равно
нулю, если равен нулю один из элементов. В самом деле,
а-0 ~ й(6 — b) = аЪ — ab ~ 0, 0*а = (b — b)a = ba — Ъа --- 0.
Обратное, однако, не всегда верно. Если произведение
двух элементов равно нулю, то сомножители могут и не
равняться нулю: ab ~ 0 при а 0 и Ъ ф 0. Такие эле-
менты а, Ъ кольца называются его делителями нуля. На-
пример, в кольце непрерывных на отрезке [0, 11 функций
делителями нуля будут функции
f о
А(С = t
I U
/,(«) = { о
при
при
при
О < t < 0,5,
0,5 < г < 1,
при 0,5 1.
Очевидно, что Д (г) ф 0 и /а (t) у=0 (0 здесь не чис-
ло нуль, а нулевой элемент кольца — функция, тож-
дественно равная нулю при и в то же время
А (*)/, (t) = 0-
Свойство дистрибутивности вычитания позволяет про-
верить справедливость следующих правил знаков при
умножении:
(—a) b ~ —ab, а (—b) = —ab, (—а) (—b) == ab.
Действительно, проверим, например, второе правило
а (— &) - а (0 — б)-- а-0 — ab — — ab.
Таким образом, алгебраические операции в произвольном
кольце обладают многими привычными свойствами оиера-
Ц£й над числами.
Есть, однако, и существенные отличия операций в
Произвольном кольце и в числовых системах. Мы указали
следующие, наиболее важные: 1) в произвольном ассо-
.. Платинном кольце умножение может быть некоммутативно,
16
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
поэтому, например, формула anbn = (ab)n не верпа, вооб-
ще говоря, в таком кольце, 2) может не существовать эле-
мента, выполняющего функцию единицы кольца, 3> опе-
рация деления может быть вообще не выполнима, 4)
произведение ненулевых элементов (делителей нул^) мо-
жет равняться нулевому элементу кольца. Заметим еще,
что мы определили степень элемента кольца только для
целых положительных чисел.
Поле. Свойства операций в поле. Обратимся к одному
особому классу колец.
Определение 4. Коммутативное кольцо, в кото-
ром уравнение ах — b разрешимо при любых а О
(т. е. выполнимо деление на любой элемент, кроме ненуле-
вого), называется полем. Q
Если в кольце единица могла и не существовать, то
в поле она всегда существует и единственна. Доказывает-
ся это в точности так же, как мы доказывали существова-
ние и единственность нулевого элемента в кольце. Дослов-
ное повторение доказательства возможно потому, что соот-
ношения а^-с = аиае~а отличаются только знаком
операции, и изменения в доказательствах будут состоять
лишь в замене терминов: сложения — умножением, нуле-
вого элемента — единичным элементом, противоположно-
го элемента — обратным элементом.
Таким образом, для поля справедливо следующее
Предложение 4. 1. В поле всегда существует
и единствен единичный элемент такой, что ас = еа - - а
для любого а из поля.
2. Для каждого ненулевого элемента поля существует
и единствен элемент а'1 такой, что а~*а = оа~] = е,
называемый элементом, обратным относительно а.
При этом (а-1)-1 — а.
3. Для любого элемента а, отличного от нуля, и любого
целого положительного числа п имеет место равенство
(а~1)п = (а71)"1. Эти равные между собой элементы обозна-
чаются через а~п. Q
В поле справедливы любые обычные операции с дробя-
ми. Так, решение уравнения ах = b (а =/= 0) можно запи-
сать в виде (а-1) ах = х = а~гЬ = b/а. Действия с сим-
волом Ъ/а ничем не отличаются от обычных операций с дро-
бями, а именно: — = — тогда ц только тогда, когда Ьс = ад
J кольцо И ПОЛЕ 17
(а 0, с 0), — 4т (правило сложения) (а 0,
с =/=Ю), “ “г ~ (пРавиЛ0 умножения) (а 0, с #= 0),
-L: “ (правило деления) (а 0, с 0, d 0).
Правила действий со степенями
! атап - апат = а***, К')" = атп, (^&)п = апЬп
справедливы для всех целых тип.
В отличие от кольца поле не содержит делителей нуля.
Если произведение элементов поля ab равно нулю, то
по меньшей мере один из сомножителей а или b равен
нулю. Действительно, пусть а 0, тогда, умножив обе
части равенства ab ~ 0 на а1, получим 6 = 0.
Примеры 1. Полем является совокупность рацио-
нальных чисел, совокупность вещественных чисел (это
поле обозначается буквой R), совокупность комплексных
чисел (обозначается буквой С).
, 2. Построим пример конечного поля из двух элементов
а2, определив операции сложения и умножения следую-
щим образом:
сложение ах 4~ ~ а2, 4- % = а3 Ч- аа = а3;
умножение агаТ = alt а±а2 = а2, а2а2 = аа.
Тогда, очевидно, ах является единицей поля, а а2 — его
нулем, и легко проверить, что все аксиомы выполняются.
3, Полем будет совокупность дробно-рациональных
функций с действительными коэффициентами [29]
Поле вещественных чисел. Помимо того, что множество
вещественных чисел является полем, оно обладает еще
рядом замечательных свойств, которые для поля, вообще
говоря, не обязательны. Чтобы аксиоматически описать
множество вещественных чисел, необходимо заметить, что
Вто — поле, элементы которого удовлетворяют следую-
Щим аксиомам.
/ Аксиома упорядоченности, Любые два
^Вещественных числа а и b удовлетворяют одному и только
одному из трех соотношений: а 6, а = 6, а Ь. При
атом, если а<Ьи&<с, тоа<с (транзитивность сдой-
упорядоченцости). ___—- —
Б 3 / 31 с [ gig-; -г v
i
18
ЛИНЕЙНАЯ АЛГЕБРА
[ita i
i
Аксиома Архимеда. Каково бы ни было
число а, существует целое число п такое, что п t> а.
Аксиома непрерывности. Для всякой
системы вложенных отрезков существует хотя бы одно
число, которое принадлежит всем отрезкам данной систе-
мы. Q
Напомним, что система числовых отрезков 1аа, 6Х],
[а2, 62], . . [а„, 6П], . . . называется системой вложен-
ных отрезков, если
^"П fa'i ^1*
Обратите внимание, что многие факты линейной алгеб-
ры справедливы не только для поля вещественных чисел,
но и вообще для любых полей, или даже для любых (как
правило, коммутативных) колец.
Задачи. 1. Составляют ли кольцо числа вида и - Ь У’Цац h--
целые)? Является ли это множество полем?
2, Содержит ли делители нуля кольцо многочленов степени ие
выше я?
3, Является ли множество целых чисел, кратных данному чис-
лу п 0, с обычными операциями сложения и умножения кольцом?
полем?
4. Докажите, что множество пар целых чисел (т, п) с операция-
ми, заданными равенствами (ти nJ -f- (т2, п2) = (^ J- пг -ф-
-4- nJ (пъ>, nJ— (т.т», n,nj, является кольцом. Укажите
делители нуля в этом кольде.
5. Образуют ли кольцо всевозможные полиномы вида а0
п
+ <hncos тх, где ат — действительные числа?
7П=1
6. Покажите, что в кольце с единицей коммутативность сложе-
ния вытекает из остальных аксиом кольца.
7. Докажите, что коммутативное кольцо с конечным числом
элементов, не содержащее делителей нуля, в котором имеется более
одного элемента, является полем.
§ 2. Матрицы и действия над ними
Обозначения н терминология. Система элементов мно-
жества К, расположенная в виде прямоугольной таблицы,
содержащей т строк и п столбцов, называется матрицей
над К. В качестве множества К мы будем рассматривать
некоторое кольцо. Элементы множества К мы будем назы-
вать числами и обозначать либо малыми греческими бук-
вами се, б, у, . . ., либо малыми латинскими буквами
<21
МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ
19
а Ь\ с,... Обычная запись прямоугольной матрицы:
«п а12 ... а1п
Я21 ^22 , . . С(2П1
атп1 ат2 • • ^тп
где ai3 — обозначение элементов из К- Иногда использу-
ют сокращенную запись | а131|, || а[3 j| mil, [а13], [aI3]mn.
Мы будем использовать для записи матриц квадратные
скобки.
При обозначении элемента матрицы ai3- первый индекс
всегда будет обозначать номер строки, в которой распо-
ложен элемент, а второй индекс будет соответствовать
Номеру столбца.
Если число строк равно числу столбцов матрицы
= п, то матрица называется квадратной, а число т —
Ш ™рядком-
Матрицу, состоящую из одного столбца, называют
хфосто столбцом или вектором-столбцом, а матрицу,
состоящую из одной строки,— строкой или вектором-
строкой. Число элементов в строке называют длиной
строки.
Матрицы мы будем обозначать заглавными буквами ла-
ринского алфавита А, В, С, ... Для обозначения столбцов
строк будем использовать малые латинские буквы
Ь, . . ., X, . . .
WY Две матрицы называют равными, если у них равны
^^ответственно числа строк и столбцов и если равны все
Вен. стоящие на соответственных местах этих матриц.
Матрица, все элементы которой равны нулю, назы-
ся нулевой матрицей и обозначается 0. Если желают
(ать число строк и столбцов в нулевой матрице, то
Ут Omni [0]mn.
Квадратную матрицу, у которой все элементы, распо-
«Укенные вне главной диагонали, равны нулю (элементы,
«(^положенные на главной диагонали, имеют одинаковые
Ж
20
ЛИНЕЙНАЯ АЛГЕБРА
1ГЛ. I
индексы i = у), называют диагональной-.
diag [au, а22,
'ап 0
0 Я 22
^ пп] “ ' - *
0 0
Сложение и умножение. Для матриц с элементами из
кольца, имеющих одинаковые размеры, естественным об-
разом определяют сложение. Суммой таких матриц А п В
называют матрицу С, элементы которой равны суммам
соответствующих элементов матриц Л и В:
— tzt j —|- btj.
Из определения суммы матриц непосредственно следу-
ет, что
А + В = В + А, А -г- (В -t- С) = (А + В) -|- С.
Кроме того, поскольку элементы матриц являются
элементами кольца, то имеет место свойство, аналогичное
свойству 3 определения кольца: каждое матричное урав-
нение А X = В имеет единственное решение.
Свойства операции сложения естественным образом
распространяются на случай любого числа слагаемых.
Определение 1. Пусть заданы две матрицы
А = [а,,]тга и В ~ причем число столбцов пер-
вой из них равно числу строк второй. Тогда матрица С,
составленная из элементов
п
СН — + • • • + ЩпЬп} ~ 2 а^из>
fc-1
называется произведением А на В и обозначается ЛВ.0
Согласно этому определению элемент матрицы произ-
ведения С, стоящий в i-й строке и в у-м столбце, равен
сумме произведений соответственных элементов i-й стро-
ки матрицы А и у-го столбца матрицы В. Например, при
умножении матриц
ли юз; i’ll
&21 Й22 _ _
i>12 ' big : Г Си
622 i &23 : 1 fS1
('12
Гзз fsa
ria:
элемент с13, стоящий в первой строке и в третьем столбце
матрицы результата, будет равен сумме произведений
соответственных элементов 1-й строки матрицы А и 8-го
МАТРИЦЫ Й ДЕЙСТВИЯ ЙАД НИМИ
21
j
столбца матрицы В:
с1з = а11Р1з + а1а\з-
Умножение двух квадратных матриц одного порядка
всегда выполнимо. Умножение же прямоугольных матриц
выполнимо только тогда, когда число элементов в строке
первой матрицы равно числу элементов в столбце второй
матрицы.
Умножение матриц обладает свойством ассоциатив-
ности*.
А (ВС) = (АВ) С.
Это свойство доказывается непосредственной проверкой
результата операций справа и слева для произвольных
матриц А, В, С размеров (п X т), (т х X I) соот-
ветственно. Ассоциативность матричного умножения имеет
место, таким образом, для любых, не обязательно квад-
ратных матриц.
Из свойства ассоциативности следует, что произве-
дение матриц А, В, С, . . D, записанных в определен-
ном порядке, не зависит от способа расстановки скобок.
Непосредственной проверкой доказывается и свойство
дистрибутивности матричных операций сложения и умно-
жения
' (А + В) С = АС 4- ВС, С (А + В) = СА + СВ.
Кольцо квадратных матриц. Если рассматривать квад-
ратные матрицы одного порядка с элементами из некото-
рого кольца, то введенные операции сложения и умно-
жения матриц являются такими алгебраическими опера-
Циями, для которых выполнены все, как следует из рас-
смотренных выше свойств этих операций, аксиомы кольца.
*Таким образом, справедливо
г; Предложение 1. Совокупность квадратных
Матриц одного порядка над произвольным ассоциативным
Кольцом является ассоциативным кольцом относительно
Матричных операций сложения и умножения. Q
> Совокупность прямоугольных матриц при п ф т не
Может быть кольцом (почему?) относительно введенных
операций сложения и умножения.
В дальнейшем мы будем предполагать, что кольцо К,
которому принадлежат элементы матрицы (мы условились
22
ЛИНЕЙНАЯ АЛГЕБРА
(ГЛ. I
называть эти элементы числами), имеет единицу. Тогда
кольцо квадратных матриц также обладает единицей.
Единица кольца матриц совпадает с матрицей, все диаго-
нальные элементы которой равны 1 *), а остальные —
нулю. Эту матрицу мы будем называть единичной и обоз-
начать буквой
1 0 ... О’
О 1 ... о
О О . . 1J
Непосредственным вычислением устанавливаются ра-
венства
АЕ = ЕА = А
для любой квадратной матрицы А.
Нулем этого кольца является нулевая матрица.
Рассмотрим некоторые свойства кольца квадратных
матриц:
1. Кольцо матриц некоммутативно, так как для
квадратных матриц операция умножения не обладает
свойством коммутативности. Например,
|О 17 Г1 07 ГО 07 Г1 07 ГО 17 _ ГО 17
[о oj [о о] ” [о о] ’ [о oj [о 0J — [о oj ‘
Если АВ = ВА, то матрицы А и В называются переста-
новочными.
2. Как и в любом -другом кольце, вводится понятие
н-й стенени квадратной матрицы (н — целое неотрица-
тельное число). При этом А° = Et А1 = А. Справедливы
обычные правила действий со степенями:
= Ат+п, (Ат)п =
Таким образом, все натуральные степени одной и той же
матрицы перестановочны между собой. Если матрицы А и
В перестановочны, то для любого натурального п имеем
(АВ)п = АпВп.
Справедлива и более общая формула: если матрицы А и
В перестановочны, то любые их натуральные степени так-
*) Так в дальнейшем будет обозначен единичный элемент ис-
ходного кольца К.
| 2]
МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ
23
же перестановочны:
АтВп = ВпАт
jajiK любых натуральных тип.
Доказательство этих формул было проведено при изу-
чении свойств кольца в § 1.
3. Кольцо квадратных матриц имеет делители нуля.
Например,
ГО 11 Г1 О'] го от
Lo oj Lo oJ“Lo oj-
Матрицы слева являются делителями нуля в кольце
квадратных матриц второго норядка.
4. Как и в обычном кольце, свойства ассоциативности
сложения и умножения и закон дистрибутивности 5 спра-
ведливы для любого числа элементов.
5. Определена и единственна операция вычитания и
справедливы все обычные правила знаков.
* Многочлены от матриц. Введем операцию умножения
Матриц на число, (Будьте внимательны! Числом мы назы-
1 Кем элемент исходного кольца К.)
Определение 2. Чтобы умножить число а на
Йтрицу А, или матрицу А на число а, нужно умножить
а а все элементы матрицы А. Например,
««аа
аа
22
а11
а
21
й121 а = Гйи°
«22J L«al«
fl- jo Л
«И«.
Если кольцо, из которого берутся элементы матрицы,
оимутативно, то справедливо равенство аА — Аа для
юбой матрицы А и любого а из К. В случае некоммута-
явности кольца (если, например, элементы матрицы сами
Являются матрицами) может оказаться, что аА ф- Аа.
Тратите внимание, что операция умножения матрицы на
[ело и операция умножения прямоугольных матриц не
уходят под определение алгебраической операции (по-
му?).
Ясно, что для каждой матрицы А над кольцом К и
яких элементов а, Ъ того же кольца К имеют место соот
тения:
1. А1 = 1-4 = А;
2- 0-4 — 4.0 — 0mn, o0mn = 0m7l а = 0mn;
3. а (ЬА) = (ab) А, (Аа) b ~ A (ab)-
24
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
4. (а 4- Ъ) А = аА 4- ЬА, А (а + Ь) = Аа 4- АЬ-,
5. (—1) А — — А, (— а) А ~ — аА,
которые непосредственно следуют из аксиом кольца.
Определение умножения матриц на числа вместе с опре-
делением натуральной степени квадратной матрицы поз-
воляют ввести важное понятие многочлена от квадратной
матрицы. Пусть
Ф (X) = апХл 4- otn-iX71-1 4- ... 4- ахХ 4- оц
— какой-нибудь многочлен от буквы X, коэффициенты
которого я0, . . ., ап принадлежат кольцу К. Если А —
квадратная матрица над К, то выражение
я^А 4" &n-iA 1 4"... 4~ ®iA 4~ = ф (-^)
называется значением многочлена ф (X) при X = А, или
просто многочленом от матрицы А.
В силу законов ассоциативности и дистрибутивности
произведение двух многочленов ф (Л) и ф (Л) одной и той
же матрицы всегда определено. Однако, чтобы выполня-
лись обычные правила действий с многочленами, необхо-
димо предположить, что кольцо К коммутативно. Для
ассоциативного кольца, например, произведение двух
многочленов от матрицы
Ф (А) = а^А + я0£ и ф (А) = М 4- М
имеет вид
Ф (А) ф (А) = (М 4- я0Е) (М + р0Е) =
= «хАрМ 4- сххАроЕ 4- a0£pjA 4- a0Z?p0£ =
= «хАрхА 4- ахАро 4- аорх4 4- аоРо#;
последнее преобразование можно выполнить в силу того,
что единица в кольце коммутирует с любым элементом
кольца.
Если же предположить, что кольцо К коммутативно,
то сложение и умножение многочленов от матриц выпол-
няются по правилам, справедливым для обычных много-
членов. Например,
Ф (А) 4* Ф С4) 7~ 4- <XjA 4“ • • 4- апАп) 4-
4- (Ро^ + РМ 4- - . • + Рп^4п) =
— («о 4~ РоХХ + («х Ч- Pi) • 4- («п + Pn) -4”»
Ф (А)-ф.(А) = aopft£ 4-(«орх + «хро) А 4- , . . 4- «nM*”’
J 21
г МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ
25
В случае коммутативного кольца К легко проверить
Предложение 2. Многочлены от одной и той
же матрицы перестановочны друг с другом-.
<р (Л) ф (Л) = ф (Л) <р (Л).
Транспонирование* Пусть дана прямоугольная матри-
ца с элементами из коммутативного кольца. Матрица,
которая получается из А заменой строк столбцами, назы-
вается транспонированной по отношению к Л и обозна-
чается А'. Если
В дальнейшем штрихом всегда будем обозначать пере-
ход к транспонированной матрице. В частности, если,
днапример, х — матрица-столбец, то через х' будем обо-
значать матрицу-строку. Это обозначение мы часто будем
Использовать для записи компонент вектор-столбца в
строку, т. е. х' = [хг, х2, . . ., где х — столбец.
Для произвольных матриц Л, В с элементами из ком-
1пиутативного кольца имеют место следующие правила
^Транспонирования:
Ж, (а А + bB)f = аЛ' + ЪВ',
ж =в'а'>
Жгде а, b — какие-либо числа. Докажем второе равенство.
жЭлемент, стоящий в z-й строке и /-м столбце матрицы
Ж|ЛБ)\ равен элементу, стоящему в /-й строке и в г-м столб-
Цце матрицы АВ (по определению транспонирования), т. е.
^авен
ajlPli Н~ aj2^ai 4" 4“
Й»де tXjj, — элементы матриц Л, В. Но это выражение
Совпадает с суммой произведений элементов z-й строки
Матрицы В' на соответственные элементы j-го столбца
|иатрицы Л', поэтому (АВ)' — В'А'.
I Доказанное свойство по индукции распространяется
Ша любое число сомножителей, В случае произведения
дррех матриц, например, имеем
| (АВС)' = (А (ВС))' - (ВС)'А' = С'В'А'.
26 ЛИНЕИНАН АЛГЬЬРЛ Н'Л.
Еще раз подчеркнем, что эти правила транспонирования
справедливы для произвольных (не обязательно квадрат-
ных) матриц.
Предложение 3. Матрица, полученная при
транспонировании произведения матриц, равна произве-
дению транспонированных сомножителей, расположен-
ных в противоположном порядке, 0
Если матрица А равна А', то она называется симмет-
рической матрицей.
Для любой прямоугольной матрицы А очевидно опре-
делено умножение АА'. Более того, матрица АА' является.
квадратной симметрической матрицей. Действительно,
(Д')' = А по определению транспонированной матрицы,
и значит,
(АА')' = (А')'А' -= АА'.
Обратная матрица. Квадратная матрица А над кольцом
К называется обратимой, если существует квадратная
матрица А"1, для которой выполнены соотношения
ДА"1 = Д“1Д = Е.
Матрица А-1 в этом случае называется обратной к А или
обращением матрицы А.
Если обратная матрица существует, то она единствен-
на. Действительно, пусть имеются две обратные матрицы
А-1 и ДД тогда ДА-1 = Д~*Д = Е и ДА^1 = Д^Д =
= Е. Умножая, например, первое равенство слева на
Д1\ получим
Д^ДА"1 = А?Е = Ai1,
но так как Ay1 А = Е, имеем А'1 = АД. Непосредственно
из определения следует, что (А-1)-1 = А.
Если квадратные матрицы А, В с элементами из ком-
мутативного кольца обратимы, то их произведение также
обратимо и справедливо равенство
(А/ДИ = B~iA~i, (1)
которое легко проверяется непосредственно. Так как
(AS) (S’U"1) = Е, (В^А^) (АВ) = Е, то (АВ)'1 -
= Формула (1) напоминает формулу для транспо-
нирования произведения матриц. По индукции это свойст-
| 2] МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ
27
во легко распространяется на любое число сомножителей.
Справедливо
Предложение 4. Обращение произведения мат-
риц равно произведению обращений сомножителей, распо-
ложенных в противоположном порядке. Q
Для каждой обратимой матрицы А наряду с нату-
ральными степенями А° = Е, А1 = А, А2 = АА,. . . .
можно рассматривать целые отрицательные степени,
считая по определению
А'2 = A-iA-1, Л’3 = А-М-М’1, . . .
Из этого определения и определения обратной матрицы
следует, что нравила действий со степенями
АтАп = Ат^п, (Ат)п = А"171
справедливы для любой обратимой матрицы при любых
целых (не обязательно положительных) числах т, п.
Рассмотрим теперь связь операций транснонирования
и обращения. По правилу транспонирования произведе-
ния двух матриц имеем
(ЛА-1)' = (А-М)' = (А_*)'А' - А' (А^у = Е.
Отсюда следует, что
ИТ1 = М’1)'.
Таким образом, при транспонировании обратимой матри-
цы получается снова обратимая матрица.
Клеточные матрицы. Разобьем какую-нибудь матрицу
А системой вертикальных и горизонтальных прямых
иа части. Эти части можно рассматривать как матрицы
низших порядков, из которых сама матрица А построена
как из элементов. Они называются клетками матрицы А,
а сама матрица А, разбитая определенным образом на
клетки, называется клеточной матрицей.
Одна и та же матрица может быть разбита на клетки
различными способами. Например,
Й11 : °12
а21 : «22
Asi : «32
«13’
ааз
«зз.
ан «12 : «13
«21 «аа : «аз
_ «л «за лзз„
28
ЛИНЕЙНАЯ АЛГЕБРА
1ГЛ. I
Удобство разбиения на клетки состоит в том, что основ-
ные операции над клеточными матрицами совершаются
по тем же правилам, как н над обыкновенными.
В самом деле, пусть некоторая матрица А каким-то
способом разбита на клетки А//:
~Лц
Я12
Лщ
Ат1 Лт2
Л mn_
Умножая все клетки на число а, мы умножим на а все
элементы матрицы А. Следовательно,
аА =‘
IГ аЛп
а Ли . . аЛ1п
.а лт1
^Лт2 ^ЛШ7г
Пусть В — какая-либо матрица, разбитая на такое же
число клеток, что и А:
Ви Ви . . В1п
В =
.Втх • • В)-пп_
Предположим, кроме того, что соответственные клетки
матриц А и В имеют соответственно равные числа строк
и столбцов. Чтобы сложить матрицы А и В, надо, согласно
определению, сложить их соответственные элементы. Од-
нако то же самое произойдет и в том случае, если мы
сложим соответственные клетки этих матриц. Поэтому
'Ли 4- Ви Лп -I- Z?i2 . . . ЛХп 4-
А В =
_ л,П14- втх лт2 4- вт2 .,, л?Т!П 4~ втп
Перейдем теперь к умножению клеточных матриц.
Рассмотрим матрицы
'Ли
А =
_ л mi
Вп . . - #1р
Ain
в =
Л тип
Bni . . . ВпР _
разбитые на клетки А$>, В^ таким образом, что число
столбцов клетки Ау равняется числу строк клетки B#
(i = 1, 2, . . ., т, 7=1,2,.. ., п, к = 1, 2, . , р). При
этом условии выражения
~ АцВ^ + AtyB^ 4~ **• -b A-in^ni;
§ 2]
МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ
29
имеют смысл. Легко показать, что
Сп .. С1Р
АВ =
C'ml - . Втр
т. е, что матрицы, разбитые надлежащим образом па клет-
ки, можно перемножать обычным путем.
Квадратные матрицы чаще всего приходится разбивать
на клетки так, чтобы диагональные клетки также были
квадратными. Если две квадратные матрицы разбиты на
клетки таким образом, что их клетки, стоящие на диаго-
нали, — квадратные и размеры соответствующих диаго-
нальных клеток совпадают, то это разбиение удовлетво-
ряет как условиям, при которых возможно поклеточное
сложение, так и условиям, которые необходимы для воз-
можности их умножения в качестве клеточных матриц.
Клеточная матрица вида
~Ап 0 ... О “
, _ 0 Лза ... О
Л — ,
J о Апп~
где Аи, Л22, . • А„п — квадратные клетки, а 0 — нуле-
вые матрицы соответственных размерностей, называется
клеточно-диагональной. Вместо этого говорят также, что
А распадается на части Ап, Л22, . . ., (или А являет-
ся распавшейся матрицей), или, что А есть прямая сумма
матриц Ап, А22, . . ., Апп. Символически:
А = Лц ф А22 Ф Ф Апп.
Операции над распавшимися матрицами приводятся
к операциям над их диагональными клетками. Отсюда сле-
дует, что если ф (X) — некоторый многочлен и А — кле-
точно-диагональная (распавшаяся) матрица, то
Ф(А) =
Ф(Лп) 0 ... о
О Ф (Лза) ... О
О 0 ф (-4пп)_
Матричная запись систем линейных уравнений. Мат-
ричные обозначения позволяют в компактной форме
30
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
записать систему линейных уравнений вида
Д11 Ч- а12 ^2 + • • Ч- а1п =
®21 Ч- ®2Э ^9 Ч" • • • 4“ ®2« = б2,
4“ ®тв3^2 Ч" • • • 4“ ^тп^п = ^т-
Если обозначать через А ~ [a;j] матрицу коэффициентов
этой системы, через х — матрицу-столбец (n X 1), х' =
= Dr1} х2, . . хЧ (штрих всюду означает транспониро-
вание), а через b — матрицу-столбец (т X 1), b' = [blt
b2, . . &т], то матричная запись приведенной системы
уравнений имеет вид
Лх = Ь.
Если т = п и матрица А имеет обратную Л~\ то умножая
это уравнение слева на Л-1, получим его решение в виде
х = Л'1!). Вычисление столбца решений х сводится, та-
ким образом, к вычислению обратной матрицы Л"1 и выпол-
нению матричного умножения Ч‘Ь.
Задачи. 1. Покажите, что произведение диагональных матриц
является диагональной матрицей.
2. Какие из этих умножений выполнимы:
1Ж [°оШЬ
Г1 01 Г5
[О 1] L 0 , [12 3] 6 ?
_7_
Выпишите результат.
3. Вычислите <р (Л), если
л=[5 з].
4. Покажите, что (Ап)' — (Л')п.
ГО 11
5, Вычислите Л"1, если А = Н
6. Выпишите матрицы системы линейных уравнений
Ж1 Ч- Ч- #3 = &V
~ ь2.
7. Покажите, что произведение двух клеточно-диагональных
матриц есть клеточно-диагональнаи матрица.
S 3]
ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ
31
8. Сформулируйте правило вычисления элементов матриц (АВ)' t
(АВ)~1, если элементы матриц А н В принадлежат произвольному
ассоциативному кольцу.
9. Вычислите Ап, если:
cos ж - sina<
sin г cos ж
А 1
б) л= о х
о о
О’
1
х
§ 3. Определитель квадратной матрицы
Определение детерминанта. Рассмотрим квадратную
матрицу А n-го порядка над коммутативным кольцом
К. Поставим этой матрице в соответствие число (элемент
кольца К), которое может быть вычислено по элементам
матрицы А с помощью операций умножения, сложения и
вычитания, согласно следующему определению.
Определение 1. Детерминантом (определите-
лем) матрицы порядка п 1 называется число
det А = 2 (—
fc=i
Где M1Jt — детерминант матрицы порядка (п — 1), полу-
ченной из А вычеркиванием первой строки и А:-го столбца.
Детерминант матрицы первого порядка совпадает с ее
единственным элементом. Q
Вычислим, пользуясь этим определением, детерми-
нант матрицы второго порядка
det А - det “1 = 1>И‘ Ц+1“мам =
= Й11Й22 —’ ®12®21"
Для матрицы третьего порядка имеем, аналогично,
flu
а га
дзз
013
0-23
ЛЗЗ.
ли
det Й21
_Я31
+ (-l)W12detf,m + (—1)3+1а13 det ГЯ21 йзз1 =
Ф к ’ La31 «33 J ' ' [«31 033 J
— «11(^22^33 Й23Й32) — fll2(a21ff33 — Аг23а31)4’Й1з(Й21«Зп—Я22«31)-
= (— det Г*22 +
4 ' L<iaa «33J '
32
ЛИНЕЙНАЯ АЛГЕЁРА
[ГЛ. I
Определитель Ма называется дополнительным минором
элемента a1Jf. Кроме обозначения det Л, используют обозна-
чение |А|. В дальнейшем будем пользоваться обоими спо-
собами обозначения детерминанта (определителя).
Введенное определение конструктивно. Оно дает про-
цедуру (алгоритм) вычисления определителя матрицы
любого порядка. Для дальнейшего удобно ввести еще
одно определение детерминанта. Прежде чем сделать это,
опишем некоторые вспомогательные понятия.
Рассмотрим набор п чисел натурального ряда 1,2,...
. . п. Всякий набор тех же чисел, расположенных в Дру-
гом порядке Sj. . . ., sn, называется перестановкой.
Перестановку 1, 2, 3, . . ., п называют основной.
Всего, очевидно, имеется к! перестановок. Назовем
беспорядком или инверсией в некоторой перестановке по-
ложение, при котором два числа и s? расположены друг
относительно друга не так, как в основной перестановке
(т. е. большее число левее меньшего). Например, в пере-
становке 23154 три инверсии (2 левее 1, 3 левее 1, 5 левее 4).
Перестановки называют четными, если число инвер-
сий четное, и нечетными, если это число нечетное.
Теперь все подготовлено к тому, чтобы ввести
Определение 2. Детерминантом матрицы
п-го порядка называется алгебраическая сумма и! сла-
гаемых всевозможных произведений п элементов матрицы,
взятых по одному и только по одному из каждой строки и
каждого столбца, т. е. слагаемых вида я1и .
Слагаемое берется со знаком плюс, если перестановка
— четная, и со знаком минус в противном
случае. Q
Можно показать, что определение 2 эквивалентно
определению 1. Мы не будем доказывать соответствую-
щую теорему (см., например, 135]), по при выводе свойств
определителя будем использовать оба определения.
Прежде чем приступить к описанию свойств определи-
телей, установим некоторые свойства перестановок.
Назовем перемену местами элементов в переезановке
транспозицией.
Лемма. Всякая транспозиция меняет четность
перестановки. ф
Доказательство. Лемма очевидна, если пере-
ставляемые символы стоят рядом. Пусть переставляемые
§ 3] ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ
33
символы расположены произвольно:
. . . (X •
. . . р кг кг . . . кта. . .
Будем последовательно переставлять а с klt к2, . . кт, 0»
При этом мы совершим (т + 1) транспозиций рядом стоя-
щих символов. После этого будем переставлять £ последо-
вательно с кт, km-i, . . При этом совершим т транс-
позиций рядом стоящих символов. Всего мы совершили
(2m 4- 1) транспозиций. Так как 2m 4-1 — нечетное
число, лемма доказана.
Следствие. Пусть имеется слагаемое детер-
Минанта a1S1a2s2 . . . ап$п. Для того чтобы определить
слагаемого, можно не располагать сомножители в по-
%№$ке возрастания первых индексов. Пусть эти множители
Расположены произвольно, т. е. слагаемое имеет вид
v^tarit, . . . Qrntn- Можно пользоваться следующим пра-
1ом: если обе перестановки т\г% . . . rnu ZXZ3 . . . tn имеют
'Маковую четность, то берем знак плюс, а если разную,
— минус. Q
Действительно, если четности перестановок совпадают,,
переставив в слагаемом сомножители так,чтобы переста-
ла гр-^. . . гп была основной, мы подвергнем переста-
ли одинаковому числу транспозиций. Следовательно*
;илу леммы, перестановки будут иметь одинаковую
ность. Так как основная перестановка четная, то чет-
i будет и другая перестановка. Слагаемое надо брать
знаком плюс. Аналогично доказательство случая раз-
i четности перестановок.
Свойства определителей. 1. Детерминант не меняется
I транспонировании матрицы:
|Л| = |4'|.
I
Е Рассмотрим слагаемое левого детерминанта а181я.№ . . .
, . anS^. При транспонировании матрицы множители в
|ом слагаемом снова окажутся в разных строчках и раз-
&х столбцах, но оии будут по другому занумерованы:
цйад. . . а-зпп- Знак тоже будет один и тот же, так как
I в обоих случаях определяется четностью перестановки
.8п. 0
Ю. Н. Андреев
34
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Это свойство свидетельствует о равноправии строк и
столбцов. Поэтому в дальнейшем будем говорить только
о строках детерминанта.
2. Если в матрице переставить местами две строки, то
определитель изменит знак:
«ii ai2 ... ain
t ajl aj2 * * * a3n
ajl ai2 «jn
flil ai2 ' * ' ai2
При перестановке строк каждое слагаемое детерминанта
войдет в правую матрицу с неизменной перестановкой
вторых индексов (номера столбцов) и с измененной пере-
становкой первых индексов (номера строк). Причем это
изменение заключается в одной транспозиции, меняю-
щей согласно лемме четность перестановки. Следователь-
но, все слагаемые изменяют свой знак.
3. Если матрица имеет две одинаковые строки, то ее
детерминант равен нулю.
Действительно, переставим одинаковые строки. Тог-
да det А — —det А, следовательно, det А = 0.
4. Если какая-нибудь строка квадратной матрицы со-
стоит из нулей, то определитель этой матрицы равен нулю.
Согласно определению 2 в каждое слагаемое войдет
хотя бы один элемент нулевой строки, и значит, все сла-
гаемые будут нулями.
5. Свойство линейности определи-
теля. Имеют место равенства
я)
ail + ail ai2 + ai2 ' • • ain + ain
ail Gi2 ’ ‘
ail °i2 ‘ ‘ * ain
б)
‘ ' ' ^am = ail аг2 ’ * * ain •
5 g] ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ
35
равенство а) прямо следует из того, что
ttlst * • 4“ • * * ^пзп =
= Ц1Я1 . . • • • • Яп&п 4“ ®1Sj * •
Аналогично доказывается и свойство б).
6. Определитель не изменится, если к какой-нибудь
его строке прибавить другую строку, умноженную на
некоторое число, т. е. справедливо равенство
4- • ajn 4-
аП • • ajn
Разложим левый определитель по свойству 5. Тогда
первый определитель в этом разложении будет совпадать
с правым, а второй будет равен нулю, так как у него будут
две одинаковые строки.
7. Для квадратной матрицы А порядка п имеет место
равенство
| М | = %п| Л
которое является прямым следствием свойства линейно-
сти 56).
8. Разложение детерминанта по
строке н столбцу. Так как в любое слагаемое
детерминанта входит один элемент i-й строки, то можно
записать равенство
[ А ] = ДцДх + О-гъАгЗ 4“ * * - 4“ ainAin>
называется алгебраическим дополнением, или адъюнк-
том к элементу а^. Аналогичную формулу можно напи-
сать для элементов /-го столбца.
М } Согласно определению 1 А1Г( = (— где Mllt —
дополнительный минор элемента Аналогичное соот-
ношение справедливо для любого алгебраического допол-
нения, именно
Ац = (-I)i+Ww, (AM)
где M\j — дополнительный минор элемента а^, равный
по определению детерминанту матрицы порядка (п — 1),
2*
36
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. Г
получаемой после вычеркивания из матрицы А z-й строки
и /-го столбца.
Докажем формулу (AM). Переставим i-ю строку мат-
рицы на первое место. При этом придется выполнить
(j — 1) перестановку строк. Значит, определитель умно-
жится на (— I)*-1 и алгебраическое дополнение элемента
й-ij будет равно
Av = (-!)’->(-
Доказано следующее
Предложение 1. Для каждой матрицы А
порядка п при произвольном i (1 z п) имеет место
формула
det А = 2
J=i
и при любом j (1 п) — формула
det А = 2 0
Эти формулы называются формулами разложения де-
терминанта соответственно по строке и столбцу.
Докажем еще справедливость формулы
п
2 ацАм -- 0 при i ф k, (1)
i=i
которую словами можно передать так:
Произведение элементов любой строки определителя
на соответственные алгебраические дополнения другой
строки раяио пулю. Действительно, написанное выраже-
ние совпадает с детерминантом матрицы, у которой z-я и
к-я строки совпадают и равны [afl, ai2, . . ., а1та], а опреде-
литель такой матрицы равен нулю в соответствии со свой-
ством 3. Аналогичная (1) формула справедлива и для
разложения детерминанта по элементам произвольного
столбца. Именно,
п
2 Aj; = 0 При к Ф j. (2)
S з]
ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ
37
9. Определитель полураспавшейся
матрицы. Квадратная матрица называется полурас-
пасшейся, если ее можно разбить на 4 клетки так, чтобы
на диагонали стояли квадратные матрицы, а одна из
двух других матриц целиком состояла из нулей. Иначе
говоря, матрица А — полураспавшаяся, если она имеет
один из следующих двух видов:
"1 г г
Лц ! Q 4ц : 412
4ах : Лзэ ’ 0 j Лзэ
Предложение 2. Определитель полураспав-
шейся матрицы равен произведению определителей ее
диагональных клеток.
Для матрицы 2-го порядка это утверждение очевидно,
так как
I ац
I О
012 I «11
«22 } } «21
О
«22
= ЛцЙ22-
Считая утверждение истинным для матриц (п — 1)-го по-
рядка, докажем, что оно верно и для произвольной полу-
распавшейся матрицы А. Пусть эта матрица имеет вид
А = [аН] = Р11
L гз
41а-!
4.22 J ’
где Ап и А23— квадратные матрицы порядка s и г (s + г ~
= и). Разложим определитель матрицы А по элементам
первого столбца:
| А [ = ОцМп — л21М21 + . . . + (—1)5+Ч1^з1-
Так как все миноры Мц являются определителями полу-
распавшихся матриц, то в силу индуктивного предполо-
жения опн равны произведению определителей диагональ-
ных клеток этих матриц. Одна из этих клеток совпадает
для всех миноров с матрицей Л22, другая — с мииором
матрицы Дп, который мы будем обозначать Отсюда
следует:
[ Л I = <ГцЛ?ц I ^4.22! — а21Л?21 I ^-23 | 4~. •(—I ^22 I =
--- («11^11 — «21^21 + • • + J -^22 I =
~ I ^11 I I ^22 I' О
38
ЛИНЕЙНАЯ АЛГЕБРА
[гл. I
Следствие. Определители полу распавшейся и
клеточно-диагональной матриц вида
-Ли Л12...
О Л 22. . - А^п
_ О 0 . . . А
пп
~Ац 0 ... О -
О -4 22 ... О
Lo o...^nnJ
равны произведению определителей диагональных клеток
этих матриц.
Для доказательства следствия достаточно заметить,
что последовательное разбиение этих матриц на 4 клетки
сводит задачу к предыдущей.
Замечание 1. Определение детерминанта квад-
ратной матрицы годится и для случая произвольного ас-
социативного (не обязательно коммутативного) кольца.
При этом остаются справедливыми, например, свойства
4, 5а), 9. Доказательство остальных свойств детерминанта
по существу связано с коммутативностью кольца К.
Определитель произведения матриц. Справедлива
Теорема 1. Определитель произведения квадрат-
ных матриц (с элементами из коммутативного кольца К)
равен произведению определителей этих матриц.
Доказательство. Пусть даны две квадрат-
ные матрицы А и В порядка п. Тогда на основании свойст-
ва 9 определителей справедливо равенство
' ^пп
Выполним следующие преобразования над матрицей спра-
ва. Эти преобразования по свойству 5 не меняют величи-
ны определителя. К 1-й строке прибавим элементы (п 1)
строки, умноженные на ап, элементы (п -]- 2)-й строки, ум-
женные на л12, и т. д., элементы 2/г-й строки, умноженные
на я1п. В результате получится матрица, у которой пер-
вые п мест первой строки будут заполнены нулями,
а остальные п мест заполнены произведениями первой
ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ
39
S з]
строки матрицы А па столбцы матрицы В, Теперь в полу-
ченной матрице аналогичные операции проделаем со
2-й, 3-й, . . п-й строками, чтобы получить равенство
0 . . 0 • 2
М1|в|= 0 . . о /-J пг гп
-1 . . 0 Ьи Ь1п
0 . . -1 пх
Чтобы привести этот определитель к полураспавшемуся
виду, меняем местами 1-й и (n -f- 1)-й 2-й и (п -f- 2)-й, ...
. .п-й и 2н-й столбцы. В результате получим равенство
Д||В| = (—1)" 2Я1А1- • • 2 “1А1 0
0 -1 ... о 0... -1
Заметим, что верхняя ненулевая клетка совпадает с мат-
рицей АВ. Вычисляя определитель полу распавшейся
матрицы, получим требуемое утверждение:
| л II В I = (-1)" (-000 АВ I = I АВ [. О
Результат теоремы естественным образом распростра-
няется на любое конечное число матриц. Например,
| АВС | = | АВ |[ С [ - | А || В |( С
В частности, для любой матрицы А
| Ак | = | А |* (к = 0, 1, 2, . . .).
Поскольку транспонирование не меняет определителя
матрицы, справедливо тождество
| А | | В | - | АВ | = | А'В | = | АВ’ | - | А’В’ |.
40
линейная алгебра
1ГЛ. I
Вычисление обратной матрицы. Воспользуемся теперь
введенным понятием определителя для изучения свойств
обратной матрицы.
Пусть А — квадратная матрица. Заменим в матрице
А каждый элемент его алгебраическим дополнением и
полученную матрицу транспонируем. Получившаяся в
результате матрица называется присоединенной для А
и обозначается Д*. Итак, по определению А* = [A;j
где Ajj — алгебраическое дополнение элемента а(3-. Из
этого определения следуют важные соотношения
АА* = А*А = | А | Е,
где Е — единичная матрица. Действительно, на диаго-
нали матриц АА* и А*А будут стоять члены вида
п
2 а^Ац, равные определителю | А | по свойству 8 опре-
делителя. Все остальные элементы этих матриц будут
нулями в соответствии с формулами (1) и (2) свойства
8 определителя.
Докажем теперь теорему о существовании обратной
матрицы.
Теорема 2. Квадратная матрица А с элемента-
ми из коммутативного кольца К с единицей тогда и толь-
ко тогда имеет обратную матрицу с элементами из К,
когда определитель | А | обратим в кольце К. Если обратная
матрица существует, то ее определитель равен обратной
величине определителя заданной матрицы.
Необходимость. Пусть для А существует
обратная матрица А~' с элементами из кольца К. Тогда
по теореме 1 имеем
|ЛЛ->| = |4| |4-*| = |£| = 1.
Отсюда следует, что элемент кольца | А | имеет обратный,
именно [ А I”1 = | Л1], и этот обратный элемент тоже
принадлежит кольцу К, так как обратная матрица состоит
из элементов кольца К.
Достаточность. Пусть определитель [ А | име-
ет в кольце К обратный) А I"1. Тогда, умножив равенство
Л/1* = А*А = |А
g 3] ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ Ц
слева на ] А |~\ получим
| А р АА* = | А | -М*4 = | А | | А | Е = Е,
откуда следует, что
А'1 = [ А | Л*. О
Следствие. Матрица А с элементами из неко-
торого поля имеет обратную тогда и только тогда, когда
ее определитель не равен нулю. 0
Доказанная теорема, таким образом, утверждает, что
для каждой квадратной матрицы А, определитель которой
обратим в кольце, существует обратная матрица Л'"1, эле'
менты которой bi}- вычисляются по формуле
= | А |
где Лц — алгебраическое дополнение элемента a}i матри-
цы Л.
Пример 1. В кольце целых чисел только эле-
менты 4-1 и —1 имеют обратные. Поэтому целочислен-
ная квадратная матрица тогда и только тогда имеет об-
ратную целочисленную матрицу (т. е. обратную матрицу
с элементами из кольца целых чисел), когда определитель
заданной матрицы есть либо 1. либо —1.
Пример 2. Рассмотрим систему линейных урав-
нений
«и (t) «i (t) 4- «тз (0 ъ (0 = Ъг (t),
«21 (0 ^2 (*) 4- «22 (0 ^2 (0 =--= Ь,2 (/),
коэффициенты которой являются элементами кольца
функций, непрерывных иа отрезке [£0, J-J. Матричная за-
пись приведенной системы имеет вид
Л (/) х (f) = Ь (0.
Элемент кольца непрерывных функций / (t) имеет в этом
кольце обратный в том и только в том случае, если f (Z) Ф О
ни в одной точке t0 По доказанной теореме
данная система уравнений имеет непрерывное решение
тогда и только тогда, когда [ A (t) | Ф 0 ни в одной точке
#0 t 0 Решение запишется в этом случае в виде
х (t) = Л-1 (О Ь 0.
42
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Интересно отметить, что определитель | A (t) | может иметь
обратный даже в том случае, когда ни один из элементов
«9 (/) не обратим. Примером является матрица коэффи-
циентов, представленная иа рис. 3.1. Читателю предла-
гается вычислить для этого примера решения (7) и
х2 (/), пользуясь формулой для обратной матрицы (при-
нять ъг (0 --- = !)•
Алгоритм Гаусса. Вычисление обратной матрипы с по-
мощью формулы А~1 — | А | -1А* не является эффектив-
ным с точки зрения требуемого объема вычислений. Рас-
смотрим один из эффективных алгоритмов вычисления
обратной матрицы — алгоритм Гаусса. Этот алгоритм
позволяет, кроме того, получить решение любой] линей-
ной алгебраической системы уравнений.
Рассмотрим систему линейных уравнений Ах— Ь,
где А — матрица т X п. коэффициенты которой являют-
ся элементами некоторого поля. Эти уравнения запишем
в развернутом виде:
^12^2 4“ • • • 4~ ~ >
Й22^2 4“ + — ^2?
4“ ^т2^2 4“ • 4“ ^тАп ~ •
§ 3] ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ 43
Если все коэффициенты при неизвестных какого-либо
i-ro уравнения равны нулю, а Ь; ф 0, то система решения
не имеет. Поэтому можно предположить, что по крайней
мере один из коэффициентов в первом уравнении отличен
от нуля. Поменяем нумерацию неизвестных так, чтобы
ап 0. Вычислим и умножим все члены первого
уравнения на «71- Затем вычтем из всех последующих
уравнений — 2-го, 3-го, . . ., т-го первое уравнение, ум-
ноженное соответственно на а21, а31, . . ., ат1. После этого
наша первоначальная система будет равносильна системе
Ж1 + «12®а + +
(^22^2 4“ ' 4“ «Wn = ^2?
^«12^3 + • » 3“ атп$п —
Поступая аналогичным образом с последующими (т — 1)
уравнениями этой системы и т. д., будем продолжать про-
цесс вычислений до тех пор, пока не получим одну из трех
ситуаций:
а) на каком-то этапе заключим, что система решения
не имеет;
б) получим систему вида
Ж1 Ц- tti2'r2 + • • ^15'^8 3“ s+brs+l 4~ ' ’ 4~
,Г3 4" . . ’ 4“ а2, s+l^j+1 4- • • 1 4“ >
4* as, s+i^s+i 4" • > Vn —
в) получим систему вида
Ж1 4“ а12ж2 4- а13ж3 + • - * 4- а1пжп ~ ^1’
ж2 4- П23ж3 4“ • • • 4“ — p2i
жп-1 4- ^-1, пжп
%п =
В случае б) выразим xs из последнего уравнения че-
рез «свободные неизвестные» xs+1, яв+2, . . хп, кото-
рые могут принимать произвольные значения. Говорят,
что решение в данном случае зависит от (п — s) произ-
вольных постоянных. В случае в), подставляя хп =
44
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
в (п — 1)-е уравнение, вычислим далее, подставляя
н хп в (п — 2)-е уравнение, получим значение хп_2
и т. д. В этом случае мы получим вполне определенные
значения для всех неизвестных х2, . . хп.
Поскольку решение системы п уравнений с п неизвест-
ными сводится к вычислению обратной матрицы, то мето-
дом Гаусса можно эффективно вычислять обратную мат-
рицу. Пусть дана матрица А. Напишем систему уравне-
ний Ах = b и выразим все неизвестные хх, х2, . . хп
через элементы Ьг, b2t . . ., bn. Эти формулы имеют вид
= <хц&1 + ... + Uinbn (i = 1, 2,..п).
Так как из Ах = b следует х = Aab, то матрица
и будет искомой обратной матрицей.
Замечание. Алгоритм Гаусса, вообще говоря, не
годится для вычисления обращения матрицы с элемента-
ми из кольца, поскольку в кольце даже для ненулевых
элементов может не существовать обратных. Поэтому, на-
пример, приведенный выше пример 2 нельзя решить с
помощью алгоритма Гаусса. В подобных ситуациях необ-
ходимо вычислить обратную матрицу, пользуясь ее оп-
ределением А-1 = | А ] Ч*. При этом нам придется вы-
полнить только одну операцию деления: вычислить | А | -1.
Обратную матрицу можно построить, как нетрудно по-
казать, с помощью алгоритма Гаусса, если решить п си-
стем линейных уравнений вида Ах — ej, где — i-й
столбец единичной матрицы. При этом i-й столбец матри-
цы А-1 будет решением системы Ах — е^. Иногда этим
соображением удобно пользоваться для нахождения об-
ратной матрицы.
Задачи. 1. Сформулируйте еще два определения детерминанта,
отличающиеся от данных в тексте.
2. Вычислите определители матриц:
a2 -J- 1 аЗ ау
ар 1 рт
ау ЗТ Та +1
'sin а cos а 1“
sin р cos р 1
_sin Т cost 1.
3. Найдите максимальное значение, которое может принимать
определитель 4-го порядка, если все его элементы числа ±1.
4. В какой перестановке чисел 1,2, . . п число инверсий наи-
большее и чему оно равно?
5. Имеет ли обратную матрица A (t) с элементами из кольца
функций, непрерывных на отрезке [О, 1]? Элементы матрицы A (i):
—5^—2, й13 (Ц — 3t2 — 1, <гза (t) — 2 — t, «21 (t) = i2—1.
41 РАНГ МАТРИЦЫ 45
§ 4. Ранг матрицы. Системы линейных уравнений
Понятие определителя будет использовано для опреде-
ления важнейшей числовой характеристики произвольной
прямоугольной матрицы — ранга матрицы. Всюду в этом
параграфе исходное кольцо К является полем.
Линейная зависимость. Напомним, что строки (столб-
цы) одной и той же длины п являются матрицами одинако-
вого размера, которые можно складывать между собой и
умножать на числа в соответствии с введенными правила-
ми действий с матрицами.
Определение 1. п строк (столбцов) одинаковой
длины х3, . . хп называются линейно независимыми,
если из равенства
aixi 4- aixa • * • апх« = О
следует = аа = . . . ~ ап == 0. В противном случае,
т. е. если существует п чисел одновременно не равных
нулю и таких, что выполнено равенство а^Ч-а^Ч- ...
... -г otnxn = 0, система п строк (столбцов) х1} х2, , . .
. . ., х„ называется линейно зависимой. 0
Линейную комбинацию, все коэффициенты которой
равны нулю, принято называть тривиальной. С помощью
этого термина определение линейной зависимости можно
сформулировать так.
Система строк (столбцов) линейно зависима, если су-
ществует равная нулю нетривиальная линейная комби-
нация этих строк (столбцов). Система строк (столбцов)
линейно независима, если только тривиальная линейная
комбинация этих строк (столбцов) равна нулю.
Сформулируем ряд простых предложений, связанных
с введенным понятием.
Предложение 1. Система из п строк (столб-
цов) п 1 линейно зависима тогда и только тогда, когда
хотя бы одна из строк (один из столбцов) является линей-
ной комбинацией остальных.
Необходимость. Если система линейно зави-
сима, то хотя бы один из коэффициентов в равенстве с^Х] +
4- а2х3 4- * . + а„хп = 0 отличен от нуля. Пусть ctf
gfe 0, тогда можно записать
46
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ, I
т. е. i-я строка (столбец) является линейной комбинацией
остальных.
Достаточность. Если какая-то строка (стол-
бец) есть линейная комбинация остальных строк (столб-
цов), то выполнено равенство xz = ctxxx Д- . . . Ц- а^хп,
а это и есть линейная комбинация п строк (столбцов),
причем не все коэффициенты в этой комбинации — нули
(например, = 1). Q
Предложение 2. Система строк (столбцов), ко-
торая содержит нулевую строку (нулевой столбец), явля-
ется линейно зависимой.
; Нулевая строка (столбец) является линейной комби-
нацией остальных строк (столбцов). Значит, согласно
предложению 1 система с нулевой строкой (с нулевым
столбцом) линейно зависима.
Предложение 3. Если некоторые из строк
(столбцов) хх, . . хг (г<^ п) составляют сами по себе ли-
нейно зависимую подсистему, то и вся система хх, х3, . . .
. . хп линейно зависима.
Действительно, если существует равная нулю нетри-
виальная линейная комбинация некоторых из строк (столб-
цов) хх, х2, . . ., хп то добавив к ним остальные строки
(столбцы) с нулевыми коэффициентами, получим равную
нулю нетривиальную линейную комбинацию всех строк
(столбцов).
Предложение 4. Любые строки (столбцы), вхо-
дящие в линейно независимую систему, сами по себе образу-
ют линейно независимую систему.
В самом деле, если бы часть строк (столбцов) линейно
независимой системы была бы линейно зависима, то сог-
ласно предыдущему предложению была бы линейно за-
висима и вся данная система строк (столбцов).
Предложение 5. Если строка (столбец) х яв-
ляется линейной комбинацией строк (столбцов) х1? х2, . . .
. . ., хг, то она (он) является также линейной комбинацией
любой системы строк (столбцов), содержащей хх, х2, . . .
• * !
Для доказательства к данной линейной комбинации
достаточно добавить недостающие строки (столбцы) с ну-
левыми коэффициентами.
Ранг матрицы. Пусть дана} произвольная матрица
А (т X п). Выберем в этой матрице к строк и к столбцов,
А 41
РАНГ МАТРИЦЫ
47
где, конечно, к не превосходит наименьшее из чисел
т, п.
Определение 2. Детерминант, составленный из
элементов, стоящих на пересечении выбранных строк и
столбцов, называется минором прямоугольной матрицы А.
Определение 3. Наивысший порядок г отлич-
ных от нуля миноров матрицы А называется рангом мат-
рицы А.
Определение 4. Любой отличный от нуля ми-
нор порядка г называется базисным минором., а строки и
столбцы, на которых он расположен, называются базис-
ными строками и столбцами. 0
Ясно, что базисный минор может быть не один
Теорема 1 (о базисном миноре). Пусть в пря-
моугольной матрице А (т X п) ранга г выбраны любые г
базисных строк (столбцов). Тогда любая другая строка
(столбец) матрицы есть линейная комбинация выбранных
строк (столбцов).
Доказательство. Не ограничивая общности,
можно считать, что базисный минор расположен в левом
верхнем углу матрицы
Знаком «?» здесь и в дальнейшем обозначаются элементы
матрицы, не представляющие интереса. Так как утверж-
дение теоремы доказывается совершенно аналогично для
всех строк и столбцов, мы докажем, например, что (г +
-Ь 1)-я строка матрицы А (п X т) есть линейная комби-
нация первых г строк. Рассмотрим следующую систему
линейных алгебраических уравнений:
4“ 4* •• • 4" = ат+\,ъ
®12ж1 4" а22ж2 4“ 4" ®г2жг = (1)
4- 4-... 4- аГтхг — Дг+1, г. j
Согласно условию теоремы определитель этой системы от-
личен от нуля, поэтому решенце системы существует.
48
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ, 1
Прибавим теперь к (гЦ- 1)-й строке матрицы А первые г строк
той же матрицы, умноженные соответственно на числа
(—х^, (—(—з>), удовлетворяющие (1), и обозна-
чим новые элементы через а'г+1а, а'г+1^2, . . <^ц)П^ Из
(1) следует, что а;+1,х — = . . . = — 0. Пред-
положим, что не все остальные числа новой (г -р 1)-й
строки равны нулю. Пусть, например, =# 0 для не-
которого к г. Согласно пятому свойству определителей
(§ 3), имеем
аи - %г
вТ1 агг ,irlt
йг+1, 1 • • • аг+1, г йг+1, ft
йц ... й1т аГ1 arr ftrft 0 ... 0 &
Раскладывая определитель, стоящий справа, по послед-
ней строке, находим
Полученное соотношение противоречит условию, что ранг
матрицы А равен г. Значит, Лг+i,» может быть только
нулем. Итак, новая (г Ц- 1)-я строка матрицы целиком со-
стоит из нулей, а это значит, что исходная (г-|~1)-я строка
матрицы А есть линейная комбинация первых г строк той
же матрицы. Q
Следствие 1. Число линейно независимых строк
произвольной матрицы равно числу линейно независимых
столбцов этой матрицы и равно рангу матрицы.
Следствие 2. Если определитель квадратной
матрицы равен нулю, то по крайней мере одна из его строк
{один из столбцов) является линейной комбинацией
остальных строк (столбцов). Q
При вычислении ранга матрицы удобно пользоваться так
называемыми элементарными преобразованиями матриц.
Определение 5. Элементарными преобразова-
ниями матриц являются следующие преобразования: 1) пе-
рестановка столбцов (строк), 2) отбрасывание ненулево-
го общего множителя элементов данного столбца (строки),
§ 4]
РАНГ МАТРИЦЫ
49
3) прибавление к одному столбцу (строке) другого столб-
ца (строки) с произвольным множителем, 4) зачеркивание
столбца (строки), состоящего из одних нулей, 5) зачерки-
вание столбца (строки), являющегося линейной комбина-
цией других столбцов (строк). Q
В качестве простого упражнения предлагаем читателю
доказать
Предложение 6. Элементарные преобразова-
ния не меняют ранга матрицы. Q /
Напомним, что приведенный в предыдущем разделе
алгоритм Гаусса использует лишь элементарные преоб-
разования матрицы, и поэтому его можно применять для
вычисления ранга матрицы и для нахождения ее базисно
го минора.
Теорема Кронекера — Капелли. Займемся изучением
структуры решений систем линейных уравнений.
Систему линейных уравнений Лх = Ь, где А — мат-
рица размеров (?iXm), назовем совместной, если она имеет
хотя бы одно решение, и несовместной в противном случае.
Заметим, что сама запись системы есть не что иное, как
запись того факта, что столбец правых частей Ь' = 1&х,
62, . . системы есть линейная комбинация столбцов
матрицы той же системы, взятых соответственно с коэф-
фициентами jcj, х2, . . ., хт. Поэтому для того, чтобы си-
стема была совместной, необходимо и достаточно, чтобы
столбец правых частей был линейной комбинацией столб-
цов матрицы А системы. Матрица
гам ••
ап1 ' ‘ " апт
Ьп
называется расширенной матрицей системы Лх = Ь.
Напомним, что в случае системы из п уравнений с п
неизвестными, когда определитель матрицы системы отли-
чен от нуля, система имеет единственное решение, кото-
рое вычисляется по формуле х = Л-1Ь, или, если подроб-
но выписать формулы для всех компонентов вектора х,
в виде
А.
1 = 1,2,..., п, (2)
2 det А ’ ’ * ’ ' 7
где через обозначен детерминант матрицы, получаемый
50
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
из матрицы А заменой i-ro столбца столбцом свободных
членов Ь. Формулы (2) называют^формулами Крамера,
или правило^ Крамера.
Перейдем к исследованию общего случая. Основным
результатом является
Теорема 2 (Кронекера — Капелли). Для того
чтобы система линейных алгебраических уравнений была
совместной, необходимо и достаточно, чтобы ранг рас-
ширенной матрицы равнялся рангу матрицы системы.
Достаточность. Пусть ранг матрицы А ра-
вен рангу матрицы А. Выберем в матрице А любой базис-
ный минор. Согласно условию теоремы минор будет ба-
зисным и для матрицы А. Но тогда столбец правых час-
тей есть линейная комбинация базисных столбцов матри-
цы А. Следовательно, он будет линейной комбинацией
всех столбцов матрицы А, т. е. система совместна.
Необходимость. Пусть система совместна.
Предположим, что ранг матрицы А равен г. Ясно, что ранг
матрицы А не может быть меньше г. Докажем, что он ра-
вен г. Для этого достаточно показать, что все миноры по-
рядка г Ц- 1 матрицы А равны нулю, так как в этом слу-
чае будут равны нулю и все миноры большего порядка.
Выберем в матрице А произвольный минор порядка г Ц-
+ 1- Если он не содержит столбца правых частей системы,
то этот минор равен нулю, в силу того, что ранг матрицы
А равен г. Предположим, что выбранный минор содержит
элементы столбца матрицы правых частей. Не ограничи-
вая общности можно считать, что этот минор таков:
Oil Оц. 61
Д
г+1 ~
Йг1 агг ЬТ
аг+1, 1 • • • аг+1, г ^г+1
Возможны два случая: либо в первых г столбцах этого
минора не содержится ни одного базисного минора матри-
цы А, либо содержится хотя бы один базисный минор.
В первом случае, разложив минор по элементам последнего
столбца, убедимся в том, что он равен нулю, так как все
алгебраические дополнения элементов последнего столб-
ца’ будут нулями. Во втором случае первые г столбцов
матрицы А являются базисными, и по теореме 1 все оо
'§ 41 РАНГ МАТРИЦЫ 51
/
тальные столбцы матрицы А ость линейные комбинации
базисных столбцов. Кроме того, условие совместности си-
стемы означает, что последний столбец расширенной мат-
рицы А есть линейная комбинация столбцов матрицы Л,
и поэтому он есть линейная комбинация лишь первых г
ее столбцов. Отсюда вытекает, что последний столбец ми-
нора Дг+1 есть линейная комбинация остальных его столб-
цов, и на основании пятого свойства определителя мы
заключаем, что сам минор равен нулю. Q
Система линейных алгебраических уравнений называ-
ется однородной, если все элементы правых частей равны
нулю. Система, не являющаяся однородной, называется
неоднородной.
Однородная система всегда совместна, так как опа за-
ведомо имеет решение = х2 — . . . = хп — 0. Это ре-
шение называется тривиальным. Ранг матрицы лю-
бой системы не может быть по определению больше, чем
число неизвестных, поэтому, учитывая теорему Кронеке-
ра— Капелли, легко установить справедливость следую-
щих утверждений.
Пр едложение 7. Для того чтобы система ли-
нейных уравнений имела единственное решение, необходимо
и достаточно, чтобы ранг матрицы системы был равен
числу неизвестных.
Пр едложение 8. Для, того чтобы однородная
система имела ненулевое решение, необходимо и достаточ-
но, чтобы ранг матрицы системы был меньше числа неиз-
вестных. о
Сумма любого решения системы Ах = Ь с любым ре-
шением однородной системы Ах = 0 снова будет решени-
ем системы Ах = Ь. Действительно, пусть Ах0 = Ь и
Ахг = 0. Тогда А (х0 + xj = Ах0 -}- AXj b L 0 — Ь.
Докажем теперь обратное утверждение. Каково бы ни бы-
ло решение х системы Ах = Ь, оно всегда представимо в
виде х = х + х0, где х — частное решение системы Ах =
= Ь, а х0 —решение однородной системы. Пусть х — ре-
шение Ах Ь. Вычтем из этого уравнения уравнение Ах =
= Ь. Тогда получим А (х — х) = 0. Это равенство оз-
начает, что х — х является решением однородной системы.
Обозначим это решение через х0. Тогда х — х = х0, от-
куда х = х0 + х. Общее решение — это символ (формула),
содержащий все решения системы. Мы доказали следующее
52
ЛИЛЕЙНАЯ АЛГЕЙРА
Щл. i
Предложение 9. Общее решение совместной си-
стемы уравнений Ах ~ b имеет вид х = х ф- х0, где х —
некоторое частное решение этой системы, а х0 — общее
решение соответствующей однородной системы Лх = О,
Фундаментальная система решений. Найдем общее ре-
шение однородной системы Лх = 0.
Рассмотрим матрицу Л коэффициентов однородной си-
стемы Лх = 0. Пусть ее ранг равен г, а базисный минор
расположен в верхнем левом углу. Заметим, что послед-
ние т — г уравнений можно отбросить, так как они яв-
ляются линейными комбинациями первых г уравнений.
Запишем эти г уравнений в виде
^11г1 3“ - • • 3“ а1т^г = а1, г+1*тг+1 — ... — Ujm,Xmt
^21*^1 3“ • • • 3~ и2г^г = — ^2, r+l^r+l — . • • — a2m%mi
Un3'! 3“ • 3~ Urr£r — — a?, r+l^r+l — ... — UrmXm.
Поло-жим сперва ,rr+I = 1, zr+2 = . . . == xm = 0.
Тогда систему можно решить по правилу Крамера и по-
лучить столбец решений х^> — 1, 0, 0, . . .
. . ., 0}. Далее положим яг+1 = 0, жг+2 = 1, .гг+3 - . . .
. . . == ят = 0, и, решив полученную систему, найдем
единственное решение хФ = {я[а\ я3(2), . . ж(2), 0, 1,
0, . . 0}. Продолжая вычисления, получим (т — г)-е
решение
х(тя-г) = {^г), 4т~г), •. > 0, 0, ..., 1}.
Покажем теперь, что всякое решение однородной си-
стемы может быть получено в виде линейной комбинации
вычисленных решений хЮ, . . х(т-г\ В самом деле,
пусть
С = (fl, С2, • • •, cr, Сг+1, ..ст)
— какое-либо решение системы Лх = 0. Покажем, что
оно представимо в виде с = ^хд^ ф- . . . ф- Am_r x(m-r).
Для этого рассмотрим некоторое вспомогательное реше-
ние X* = с — Cr+ixW — ег+2х<2> — ... — стх(т-?К X*
является решением системы Лх = 0, поскольку это ли-
нейная комбинация решений этой системы. Заметим да-
5 4 ] ТАНГ МАТРИЦЫ 53
лее, чтох*имеет вид х* — , . . ., .z’r , 0, 0, . . ., 0).
(Щ-г)
Докажем, что и первые г компонент решения х* тоже
суть нули. Для этой цели подставцм решение х* в систему
Ах — 0. В результате получим
+ . . . + й-гг^т — О»
Ч” . . . “t~ drt^r = 0.
Эти тождества могут удовлетвориться только пулевым
набором, ибо детерминант соответствующей системы —
не нуль и ее решение единственно. Итак, все компоненты
х* суть нули. Значит,
с == Cr+1x(D -Ь ... + Стх(т~г\
что и утверждалось. О
Заметим, что полученные при доказательстве теоремы
решения (их число т — г) линейно независимы. Эта си-
стема решений называется нормальной фундаментальной.
системой решений.
Вообще всякая конечная совокупность решений систе-
мы Ах = 0 такая, что, во-первых, всякое решение систе-
мы выражается в виде линейной комбинации элементов
этой совокупности и, во-вторых, никакое из решений пост-
роенной совокупности не является линейной комбинацией
остальных решений этой совокупности, называется фунда-
ментальной системой решений.
Таким образом, общее решение линейной системы
Ах =. b выражается формулой
X --- X г CjxW + ... 4- c™_rxfm-r\
где х — некоторое частное решение неоднородной систе-
мы, а хЮ, . . г> — фундаментальная система реше-
ний однородной системы. Наиболее простой вид имеет
нормальная фундаментальная система решений.
О численном решении линейных систем. Красота и строй-
ность теории линейных уравнений обманчива. Вычисле-
ние решений за приемлемое время, при ограниченной точ-
ности задания чисел в машине и при конечной точности
вычислений, связано со значительными трудностями. Об-
. ратимся к примерам.
54
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
1. Если для решения уравнения Лх = Ь воспользо-
ваться правилом Крамера, а определитель | А [ вычислять
как сумму и! произведений, каждое по п сомножителей,
то нетрудно подсчитать, что при скорости 10е умножений
в секунду для решения системы 16-го порядка потребует-
ся более 8 лет. Если для решения этой системы использо-
вать алгоритм Гаусса, который требует порядка п3 ум-
ножений, то при той же скорости вычислений решение бу-
дет получено за время, меньшее 0,1 сек.
2. Определитель матрицы
“О 1 О
О 0 1
0~
0
О 0 0
2~n 0 0
1
0_
равен 2~N, и потому решение уравнения Лх = Ь существу-
ет и единственно при любом В то же время при доста-
точно большом число 2~n будет воспринято машиной
как нуль, и система уже не имеет ни одного решения при
b 0. Таким образом, малые изменения коэффициентов
системы могут приводить к потере всех решений.
3. Решим систему [43]
0,0001^! + X, = 1,
4- % = 2,
используя алгоритм Гаусса и выполняя арифметические
операции на машине с плавающей запятой с тремя деся-
тичными знаками. Если взять на первом шаге в качестве
ненулевого элемента 1-й строки коэффициент при х1? то
получим
[ 0,0001яд -р х2 = 1,
[ — 10000^2 = —10000, откуда ха = 1, хх = 0.
Если в качестве ненулевого элемента 1-й строки взять на
первом шаге коэффициент при х2, то имеем j ’ *
( + х2 = 2,
I х3 = 1, откуда х2 = 1, жх>;1.
Точное решение, округленное до указанных десятичных
цифр: ,rt = 1,00010, х2 = 0,99990.
5 5]
ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН МАТРИЦЫ
55
Приведенные примеры иллюстрируют некоторые труд-
ности, связанные с практическим вычислением решений
линейных уравнений. Эти трудности возрастают с ростом
порядка решаемой системы. На практике решают линей-
ные системы с 1000 и более неизвестных.
Задачи. 1. Вычислите ранг матриц
"10 10 0"
4 4-| 0 110 1
4 4]’ 0 1 0 0 0’
1о 0 1 О 0.
"2 5 3 0"
4 2 6 1
771 10,5 2
_0 3 0 4_
2. Выпишите нормальную фундаментальную систему решений
для систем уравнений:
f Х1 -ф- Ха -|- XI = 0 , Г Х1 — Х2 + ХЗ — Хб = 0 ,
( хэ хз = О, ( х& хб = 1.
3. При каком условии три прямые йхх -ф- Ъгу q = 0,
агх с2 = 0, аэх -ф- Ь3у -ф- с3 = 0 проходят через одну точку?
4. Докажите, что с помощью элементарных преобразований
строк квадратную матрицу можно привести к «треугольному» виду,
когда все ее элементы снизу от главной диагонали равны нулю.
§ 5. Характеристический и минимальный
многочлены матрицы
Будем рассматривать квадратные матрицы порядка п
с элементами из некоторого поля К.
Подобные матрицы. Матрица А называется подобной
матрице В, если существует такая неособенная матрица
X, что А = Х~1ВХ. В этом случае также говорят, что А
получается преобразованием матрицы В при помощи X,
Умножая это равенство слева на X и справа на X-1, по-
лучим
В = ХАХ-1 = (Х-1)-МХч.
Таким образом, из подобия А с В вытекает подобие В с
А. Далее, если
А = Х~1ВХ, В = Y^CY,
то подстановкой получим
А = X^Y^CYX = (YXY'C (YX).
56
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ I
Следовательно, две матрицы, подобные третьей, подобны
между собой. Наконец, каждая матрица, очевидно, по-
добна самой себе.
Укажем некоторые свойства подобных матриц.
1. Для того чтобы преобразовать с помощью матрицы
X сумму матриц, достаточно преобразовать с помощью X
каждое слагаемое. В самом деле,
(Дх 4- л2 |- ... + Л)Х =
_ Х-^Х + X-LA2X I . . . +
2. Для того чтобы преобразовать с помощью матрицы
X произведение матриц, достаточно преобразовать с по-
мощью X каждый сомножитель. Действительно,
Х~гАгХХ^А2Х . . . Х-МД - X-1 (ЛГЛ2 • • А)
3. Для того чтобы преобразовать степень матрицы,
достаточно преобразовать основание степени
X~lAmX = (X-М Х)т;
при m 0 имеем предыдущий случай. Если же т <0,
то пусть к = —т. Тогда
X~MmX = Х~г (Л-W -= (Х-Ч^Х)* - (Х-МХ)-* =
- (Х-МХ)т.
4. Преобразованное значение многочлена от матрицы
равно значению многочлена от преобразованной матрицы,
иными словами
X~*f (А)Х = /(Х~МХ).
Эта формула непосредственно вытекает из свойств 1—3,
так как значение многочлена от А получается из Л с по-
мощью операций возведения в степень, умножения на чис-
ло и сложения.
Характеристический многочлен матрицы. Матрица
[КЕ — Л], где А - независимая переменная, называется
характеристической матрицей для А. Ее определитель
<р (X) = | КЕ - А [ (ХМ)
называется характеристическим многочленом матрицы А.
Наивысшую степень относительно X в этом многочлене бу-
дет иметь произведение диагональных элементов
(Аг ®ц)(А (Хзд) ... (A
§ 5] ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН МАТРИЦЫ 57
Все остальные, входящие в состав определителя произве-
дения имеют степень не выше (п — 2). Это следует из то-
го, что если один из сомножителей этого произведения
будет —- ац (i /), то это произведение не будет содержать
множителями (А — аи), (X — ал-) и будет, следовательно,
степени не более (п — 2). Таким образом, ф (X) = (X —
— аы) • * • (А — ftnn) + члены степени не выше (п — 2)
или ф (А) = А” — (ап -Н а23 + • • + ann)An-1 + . . .
Сумма диагональных элементов матрицы называется ее
следом:
след А = Sp А = (ап + а22 + • • • + «пп)-
Последняя формула для ф (А) показывает, что степень ха-
рактеристического многочлена равна порядку матрицы,
старший коэффициент характеристического многочлена
равен 1, а коэффициент при А™-1 равен следу матрицы, взя-
тому с обратным знаком. Полагая в формуле (ХМ)А = О,
мы получим
<р(0)= I - 4| = (-1)"| А |.
ф (0) — свободный член характеристического многочлена.
Он равен определителю матрицы, умноженному на (—1)п,
где п — порядок матрицы.
Теорема 1. Характеристические многочлены по-
добных матриц равны друг другу.
Доказательство. Пусть
А = Х~гВХ.
Тогда для характеристического многочлена матрицы А
получим
| ХЕ - А | = | ХЕ - Х-'ВХ | = | X-1 (АЯ - В)Х | =
= ] X"1 || ХЕ - В || X | .
При последнем преобразовании мы воспользовались тео-
ремой о детерминанте произведения квадратных матриц.
Определители | X-1 | и | X | взаимно обратны и их произ-
ведение равно единице. Поэтому
| ХЕ - В | = | ХЕ - А |. 0
Из этой теоремы, в частности, вытекает, что подобные
матрицы имеют одинаковые следы и определители, так
58
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
как след и определитель матрицы, взятые с надлежащими
знаками, являются коэффициентами ее характеристическо-
го многочлена.
Равенство характеристических многочленов — необ-
ходимое, но, вообще, говоря, не достаточное условие по-
добия матриц. Например, характеристические многочлены
матриц
МИ]. МП]
равны, однако А не может быть подобна Et так как для
любой матрицы X имеем Х~гЕХ = Е.
Корни характеристического многочлена называются
характеристическими числами, или собственными значе-
ниями, или собственными числами матрицы А.
Из следствия на стр. 38 следует
Предложение 1. Характеристические много-
члены распавшейся и полураспавшейся матриц, равны про-
изведению характеристических многочленов их диагональ-
ных клеток. Q
Если лолураславшаяся матрица А состоит из клеток
степени 1, то А называют треугольной матрицей. Собствен-
ные значения треугольной матрицы очевидно равны ее
диагональным элементам.
Теорема Кэли — Гамильтона. В § 2 мы любому мно-
гочлену ф (X) ставили в соответствие матрицу <р (Л), на-
званную значением многочлена <р (X) при X = 4. Если
ф (4) = 0, говорят, что А есть корень ф (X).
Теорема 2 (Кэли — Гамильтона). Каждая квад-
ратная матрица является корнем своего характеристиче-
ского многочлена.
। Доказательство. Пусть А — квадратиан ма-
трица. Обозначим через В присоединенную матрицу для
характеристической матрицы (ХЕ — 4] (см. определение
присоединенной матрицы в § 3).
Элементы матрицы В обозначим через (г, / = 1,
2, . . *, п). Эти элементы являются адъюнктами определи-
теля | ХЕ — А | и поэтому представляют собой многочле-
ны от X, степень которых не превосходит (п — 1). Пусть
§ 5]
ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН МАТРИЦЫ
59
Составим вспомогательные числовые матрицы
С С'
р21 р22 • • • р ап
□(?с) о(Ю о(к*)
Р?ц Ртг2 " " " Enn
Тогда матрицу В можно будет, очевидно, представить в
следующем виде:
В = Bw 4- ь#(1) + • • + Х^В^.
По основному свойству присоединенных матриц
В (кЕ - Л) = | кЕ - А | Е. (1)
Здесь J кЕ — А [ — характеристический многочлен мат-
рицы А, который мы обозначим ср (X). Пусть
<р (А) = а0 - аД 4- кп.
Теперь равенство (1) можно переписать более подробно:
(В(0) + ХВ(1) -4 ... 4- V^5n-1) (кЕ — Л) -
" (^о 4~ 4- - 4- 14* ) Е,
Раскрывая скобки и приравнивая коэффициенты при рав-
ных степенях X, получим
-;в<’>л - Ь^Е,
- В^А 4- Я(0) =
— В® А + В{1) =&Е,
= а^гЕ,
В[п~1} = Е.
Умножим эти равенства справа первое на Е — Л°,
второе — на Л1, третье — на Л2 и т. д., последнее —
на Л”-1, и правые и левые части этих равенств сложим.
Справа мы получим (р (Л), а слева — нулевую матрицу.
Значит,
0=’аоЕ + агА 4- а2Л2 + . . . + Л11 ср (Л). О
Минимальный многочлен. Среди всевозможных нену-
левых многочленов f (А), корнем которых является мат-
рица Л, есть ненулевой многочлен цаинцзшей степени
60
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
со старшим коэффициентом, равным 1. Он называется мини-
мальным многочленом матрицы.
Предложение 2. Каждая матрица А имеет
только один минимальный многочлен.
Доказательство, Если бы существовало два
различных минимальных многочлена ф^ (А) и ф2 (А), тог-
да разность ф1 (X) — ф2 (А) была бы ненулевым многочле-
ном, корнем которого является матрица Л, а степень это-
го многочлена меньше, чем степень ф7 (X) И ф3 (А). 0
Предложение 3. Всякий многочлен f (А), кор-
нем которого является матрица А, делится без остатка
на минимальный многочлен ф (А) этой матрицы.
Доказательство. Пусть верно обратное, т. е.
/ (А) = ф (А)? (А) — г (А)
иг(А)^ 0. Подставим в это тождество матрицу А:
f (4) = 0 = (4)? (Л) + г (4),
так как ф (Л) = 0, то г (Л) = 0, но степень г (Л) меньше
степени делителя ф (Л). Таким образом, г (Л) — ненуле-
вой многочлен, корнем которого является матрица А и
степень которого меньше степени минимального многочле-
на. Это противоречит определению минимального много-
члена. Q
Следствие. Л/аномальный многочлен матрицы
является делителем ее характеристического многочлена. 0
Сопровождающая матрица многочлена. Матрица
0 1 0 ... О "
00 1 ... о
О О О ... 1'
обладает замечательным свойством. Ее характеристический
многочлен совпадает с нормированным (с коэффициентом
1 при старшем члеие) многочленом n-го порядка, коэффи-
циенты которого расположены в нижией строке этой мат-
рицы с обратными знаками. Таким образом,
(р (А) = А" + а1Ак*1 -(-.•+ «n_jA + ап | КЕ А [ .
Убедимся в справедливости этого равенства. Для этого
удобнее всего раскрыть определитель | кЕ — А | по эле-
6]
ЛИНЕЙНЫЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА
61
ментам последней строки согласно свойству 8 определи-
теля:
— 1 0 ... О О
О К —1 ... О О
О 0 0 ... л -- 1
ап-1 ап-2 «г ^+«1
=М-1)П_1 (-1ГЧ
+ (- I)"'/. (- 1)"+2 + «„^2 (- I)"’3 (- 1)"+3 + . ..
... + (- е-1 + ... + (X + он) V*’1 =
— X -р а,Х 4* • • 4~ Лп-jX 4“ — <Р (^)*
По заданному нормированному многочлену сопровож-
дающая матрица строится крайне просто. В ее нижней
строке располагаются п коэффициентов характеристиче-
ского многочлена, элементы, расположенные справа от ди-
агональных, равны единице, а остальные элементы мат-
рицы — нули. Эта матрица и ее транспонированная мат-
рица будут играть важную роль в дальнейшем.
Задачи. 1. Показать, что если в прямой сумме переставить
слагаемые, то новая сумма будет матрицей, подобной старой сумме.
2. Вычислить характеристические многочлены и собственные
значения матриц
' 2 4 О'
0 3 2
.001.
~ а Ъ с
О d 0
0 0г
3. Доказать, что след (Ай) = след (ВА), след (А 4* В) —
след А 4- след В.
4. Показать, что характеристический многочлен матрицы АВ
совпадает с характеристическим многочленом матрицы В А.
5. Доказать, что любая квадратная матрица А подобна своей
транспонированной А'.
6. Найдите ошибку в рассуждении. Так как <р (X) = | ХЕ — А |,
тоф(А)=|АЯ — А | — [ 0 | = 0, и следовательно, справедлива
теорема Коли -- Гамильтона.
§ 6. Линейные векторные пространства
Линейное йространство и модуль. Для прямоугольных
матриц одинакового размера определены алгебраическая
операция сложения и операция умножения на числа (эле-
менты некоторого кольца или поля), которая не является
алгебраической. Изучение строения таких множеств име-^
ет важное значение для всех дальнейших построений.
62
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Определение 1. Пусть дана некоторая сово-
купность R элементов произвольной природы х, у, z, . ..,
в которой задана алгебраическая операция «сложе-
ния». Пусть, далее, задано некоторое поле К и определе-
на операция «умножения» элементов из R на элементы
поля К, которые мы будем называть числами. Умножение
всегда выполнимо и однозначно для любых элементов х,
у, z из R и любых чисел а, р, у из К. Совокупность эле-
ментов R будем называть линейным векторным простран-
ством над полем К, если операции «сложения» и «умноже-
ния» элемента из R на число из К удовлетворяют следую-
щим требованиям (аксиомам, постулатам):
1. х 4- у = у х.
2- (х4-У) + г = Х + (У+ z)-
3. Если у, z — элементы R, то уравнение у 4- х = z
разрешимо в R.
4. 1 • х = х.
5. а фх) = (<хЗ) х.
6. (а -)-В)х = ах4- ^х.
7. а(х + у) = ах + ау.
Элементы множества R мы будем называть векторами. Q
Определение 2. Если в определении 1 линей-
ного пространства поле К заменить кольцом К с единицей,
то получим определение модуля над кольцом К. 0
Поскольку всякое поле является кольцом, то всякое
линейное пространство является модулем. Обратное, во-
обще говоря, не верно. Модуль может и не обладать свой-
ствами линейного пространства.
Первые три аксиомы линейного пространства совпа-
дают с первыми тремя аксиомами в определении кольца.
Поэтому доказательство существования в линейном про-
странстве единственного нулевого элемента и единствен-
ного элемента, противоположного заданному, в точности
совпадает с приведенным в § 1 доказательством аналогич-
ных утверждений для кольца. Будем обозначать нулевой
элемент линейного пространства числом 0, т. е. точно так
же, как и нулевой элемент поля К, участвующего в опре-
делении линейного пространства. По смыслу формул
всегда будет ясно, какой нуль имеется в виду.
Линейное пространство над полем вещественных чи-
сел принято называть вещественным линейным пространг
ством и обозначать буквой R. Линейное пространство
§ 6] ЛИНЕЙНЫЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА 63
над полем комплексных чисел называют комплексным и
обозначают буквой С.
Мы будем обозначать векторы строчными латинскими
буквами, а числа, как правило, греческими.
Сумму векторов х и (—у) обозначают х — у и называ-
ют разностью векторов х и у.
Легко видеть, что для любого вектора х выполнено ра-
венство Ох = 0. В самом деле,
Ох — Ох 4- х — х ~ (1 0) х — х = 0.
Отметим также, что произведение любого числа на ну-
левой вектор равно нулевому вектору, поскольку
а . 0 — а (х — х) - ах — ах = 0.
Если ах = 0, то либо а = 0, либо х = 0. Действитель-
но, пусть Тогда можно умножить данное равенство
на а-1 и получить 1-х = 0.
Выражение вида 4" 4“ апх„ называ-
ют линейной комбинацией векторов х1} х2, . . ., хп с коэф-
фициентами а1} а2, . . ., ап.
Приведем несколько примеров линейных пространств.
1. Множество вещественных чисел по отношению к
обычным операциям сложения и умножения будет веще-
ственным векторным пространством. В этом примере век-
торы пространства и элементы ноля принадлежат одному
н тому же множеству (и те н другие — просто веществен-
ные числа).
2. Существует линейное пространство, состоящее из
одного элемента. Такое пространство называется нулевым.
Единственный элемент является нулем этого пространства
и противоположным самому себе элементом.
3. Множество многочленов от X степени п над не-
которым полем К с установленными в нем обычными опе-
рациями сложения многочленов и умножения многочлена
на число образует, как нетрудно проверить, линейное
пространство над полем К.
4. Совокупность направленных отрезков (векторов) на
плоскости с обычными операциями сложения векторов
и умножения их на числа является векторным простран-
ством.
5. Совокупность бесконечных последовательностей
(a:i, #2, . . ., а?п, . . .), в которой операции определены
64
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
естественным образом:
(Жр Хп, • ‘ Ч- (Уи р2> ‘ * > Уп1 • •)
= (^1 + Ун + г/2, . . .),
а (ж1( &2, . . . . .) — (axlf ат2, . . атп, . . .),
как нетрудно проверить, представляет собой линейное
пространство.
Линейная зависимость. По аналогии с соответствую-
щими определениями для строк и столбцов матрицы оп-
ределим линейно независимую и линейно зависимую си-
стемы векторов в линейном пространстве.
Определение 3. Векторы х1? Xj, . . ,, хп из ли-
нейного пространства R называются линейно зависимыми,
если существуют такие числа из поля К а1} аа, . . ап,
не равные нулю одновременно, что
а1х1 Ч* СС2Х2 4“ • - • Ч* ®яхп = 0.
В случае, если не существует подобной линейной зависи-
мости, векторы xt, х2, . . ., хп называются линейно незави-
симыми.
Если векторы xn Xj, . . х„ линейно зависимы, то один
из векторов может быть представлен в виде линейной
комбинации остальных. Так, например, если 4-
4- а2х.2 4- ... 4- «А = 0 и а, 0, то
Относительно линейно зависимых и линейно незави-
симых систем векторов справедливы те же положения, ко-
торые были доказаны для систем линейно независимых
строк и столбцов в § 4.
Приведем формулировки соответствующих утвержде-
ний. Предлагаем читателю в качестве упражнения полу-
чить доказательства этих утверждений.
Предложение 1. Система из п 1 векторов
линейно зависима тогда и только тогда, когда хотя бы один
из векторов есть линейная комбинация остальных.
Предложение 2. Если в систему входит нуле-
вой вектор, то она линейно зависима.
Предложение 3. Если некоторые из векторов,
входящих в систему, сами по себе образуют линейно зави-
симую подсистему, то вся система линейно зависима.
§ б] ЛИНЕЙНЫЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА 65
Предложение -4 Каждая подсистема линейно
независимой системы сама линейно независима.
Размерность и базис. Введем теперь важные определе-
ния размерности и базиса линейного пространства.
Определение 4. Линейное пространство R
называется конечномерным, а число п — числом измере-
ний этого пространства, или его размерностью (пишут
dim R -= н), если в R существует п линейно независимых
векторов, в то время как любые н - 1 векторов из R ли-
нейно зависимы. Если же в пространстве можно найти ли-
нейно независимую систему из любого числа векторов,
то пространство называется бесконечномерным. Q
Мы будем иметь дело главным образом с конечномерны-
ми пространствами.
Определение 5, Система из п линейно незави-
симых заданных в определенном порядке векторов еп
е2, . . ., в «-мерном пространстве называется базисом
этого пространства. Q
Из этого определения следует, что из одной и той же
системы векторов можно получить разные базисы, по-раз-
ному нумеруя векторы.
Пусть векторы ех, е2, . . ., еп образуют базис «-мер-
ного векторного пространства R, а х — произвольный
вектор этого пространства. Тогда векторы х, ех, е2, , .
. . ., линейно зависимы (ибо число их равно п + 1)
авх 4- ард + ... + апеп = О,
где по крайней мере одпо из чисел а0, а1? . . ап отлично
от нуля. Однако в данном случае а0 0, так как векторы
ей, . . ., еи не могут быть связаны линейной зависимос-
тью. Поэтому
х —- #161 т2е2 4~ • • • 4*
где Xi =---™ (z = 1, 2, , . л) (xi — числа]).
ао
Заметим, что числа хп однозначно определя-
ются заданием вектора х и базиса е1( е2, . . ., еа. В самом
деле, если имеется другое разложение для вектора
х = 4- ^2еа 4- ... 4- ^пеп,
то, вычитая это разложение почленно из предыдущего, по-
лучим
(^1 — ?1) е1 + (а — ?z) 4" (^П — ?п) = О,
з Ю Н Андреев
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
66
откуда в силу линейной независимости векторов базиса
следует
- ₽i) = (а - и = • • = о»- ₽а -- о,
т. е.
#1 == ^2’ • РГ!.
Числа zlf ж2, . . хп называются координатами вектора
х в базисе elf е2, . . еч (или но базису е1ч е2.....еп).
Если
11 п
х = 2 ^1. У =- 2
1=1 1=1
ТО
п п
х т у = 2 У^)е” ах =- 2 |ХС;еь
i=l i=l
т. е. координаты суммы векторов получаются почленным
сложением соответствующих координат слагаемых век-
торов, а при умножении вектора на число а все координа-
ты вектора умножаются на это число.
Таким образом, основное значение базиса линейного
пространства состоит в том, что линейные операции в про-
странстве, вначале заданные абстрактно, становятся обыч-
ными линейными операциями с числами — координатами
векторов относительно выбранного базиса.
Пусть т векторов «-мерного пространства
п
Xfc = 2 (Ь- U, ..т)
i—1
линейно зависимы, т. е. + а2х2 + . . а,л;г, ~ О,
где по крайней мере одно из чисел а1? а2. . . не рав-
но нулю.
Если вектор равен нулю, то все его координаты равны
нулю. Поэтому приведенное векторное равенство эквива-
лентно следующей системе скалярных равенств:
а1ж11 4“ <Хгж12 + ... + ат%1т ~ О?
Я1®21 4~ ^2^22 4~ • • 4“ = О?
4“ ^2^п2 4” • * - 4- ^т-^пт ~ О*
§ 6] ЛИНЕЙНЫЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА 67
Эта система однородных уравнений относительно а£,
сс2, . . .. ат, согласно теореме Кронекера - Капелли (см.
§ 4), имеет ненулевое решение тогда и только тогда, когда
ранг матрицы коэффициентов меньше числа неизвестных,
т. е. меньше т. Поэтому равенство этого ранга числу т
является необходимым и достаточным условием для ли-
нейной независимости векторов хх. х2, . . хт. Таким об-
разом, имеет место следующая
Теорема 1. Для того чтобы векторы х3, х2, . . .
. . ., хт были линейно независимы, необходимо и достаточ-
но, чтобы ранг матрицы, составленной из координат этих
векторов в произвольном базисе, был равен числу векторов
т. 0
Замена базиса. Если в н-мерном пространстве даны два
базиса е15 е2, . . ., ert и f1€ f2, . . fn, то можно разложить
каждый вектор базиса Г2, . . fn по базису еь е2, . . .
• - м еп:
п
ft = 2 Рпе> (i - 1, 2, ..n). (1)
j=i
Координаты р^ можно записать в виде квадратной матри-
цы порядка п
- Р11 Р12 ... PYn -
„ Р21 Г*? • • • Р2П
Рщ Рп2 ‘ ‘ ‘ Рпп
Столбцы матрицы — это координатные столбцы векторов
fit fa, • , fn» по базису е1; е2, . . ., еп. Поэтому столбцы
матрицы Р — линейно независимые и det Р 0.
Определение 6. Матрицу, г-й столбец которой
есть координатный столбец вектора по базису е1т е3, . . .
. . ., е,(. назовем матрицей, перехода от базиса е]; еа, . . .
. . .. е,, к базису fj, f3, . . Q
Равенство (1) можно переписать в матричных обозна-
чениях
[fl fo •• fn] 1е1 - -- е„]Р,
или
f = еР.
з*
88
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Умножая обе части этого равенства на матрицу Р 1 спра-
ва, мы получим
е = fP1.
Отсюда следует, что Р~г будет матрицей перехода от бази-
са i\, f2, *, fn к базису е1? е2, . . еп.
Предложение 5. Пусть задан базис еп е2, . . .
. . еп. Каждая матрица Р с детерминантом, не равным
нулю, служит матрицей перехода от базиса еп е2, . . еп
к некоторому базису fI? f2, . . fn.
Действительно, если det Р Ф 0, столбцы матрицы Р
линейно независимы. Они служат координатными столб-
цами п линейно независимых векторов, которые и состав-
ляют нужный иам базис. Q
Вычислим, как связаны между собой компоненты одно-
го и того же вектора в двух базисах е15 . . еп;
Рассмотрим вектор х и обозначим через аир его коорди-
натные столбцы в базисах ей f. Это означает, в частности,
что х = fp. Подставим сюда выражение f через е и матри-
цу перехода Р от базиса е к базису f. Мы получим х =
= еРр. Но, с другой стороны, х = еа. Сравнивая два
последних выражения, в силу единственности координат-
ного столбца имеем
а = Рр.
Подробнее эта формула может быть переписана в виде
что вектор, равный сумме любого числа векторов, лежа-
щих в одной и той же плоскости, принадлежит этой плос-
кости. В произвольном линейном пространстве роль мно-
жеств, обладающих свойствами, подобными указанному
свойству плоскости, играют линейные подпространства.
Определение 7. Непустое подмножество Н(
линейного пространства называется подпространством,
если оно само образует линейное пространство по отноше-
g 6] ЛИНЕЙНЫЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА 69
пию к определенным в R операциям сложения и умноже-
ния на число. 0
Иначе говоря, Rx Q~ R есть подпространство, если из
хе R„ jeRi следует, что ах 4- (Зу ее Rx при любых а
и р-
Во всяком линейном пространстве R имеется подпрост-
ранство, состоящее из одного нуля,— нулевое подпрост-
ранство. С другой стороны, все R можно рассматривать как
свое подпространство.
Пусть дано некоторое множество М векторов в линей-
ном пространстве R. Обозначим через Rx совокупность
всевозможных линейных комбинаций, каждая из которых
составлена из конечного числа векторов, принадлежащих
М. Нетрудно проверить, что множество Rx является под-
пространством в R. Так построенное подпространство Rx
называется линейной оболочкой множества М.
Предложение 6. Каждое подпространство
пространства конечной размерности является линейной
оболочкой конечного числа ве.кторов. 0
Доказательство оставляем читателю в качестве упраж-
нения.
Рассмотрим два подпространства Rx и R2 одного ли-
нейного пространства R.
Определение 8. Суммой подпространств Rt и
R2 назовем множество всех векторов, которые можно пред-
ставить в виде хх 4- х2, где хх и х2 принадлежат соответ-
ственно подпространствам Rx и R2. Обозначение суммы:
Ri +ЕЧ- О
Сумма подпространств является подпространством.
Действительно, если у и х лежат в Rx 4“ R3, то су-
ществуют гекторы хх и ух в Rx и векторы х2 и у2 в R2 та-
кие, что х — хх 4- ха, у — У1 4“ у2. Отсюда имеем
х 4- у = (хх 4- У1) 4- (х2 4- у2),
и при любом а, кроме того, ах — ахх 4- ах2. Поскольку
хх 4- Ух и ахх находятся в Rx, а х2 4- Уз и ах2 находятся
в R3, мы видим, что х 4- у и ах принадлеягат сумме
Ri 4“
Сумму подпространств можно определить и как ли-
нейную оболочку мноя;ества всех векторов, которые
принадлежат хотя бы одному из суммируемых подпро-
странств.
70
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Определение 9. Назовем пересечением подпро-
странств Rj и R2 и обозначим Rx р| R2 множество векто-
ров, которые принадлежат одновременно обоим подпрост-
ранствам. 0
Предложение 7. Пересечение Rx Q R3 есть
подпространство.
Действительно, если векторы хну лежат в Ri П R3,
то они лежат и в Rlf и в R3. Поэтому вектор х + у и век-
тор ах при любом а также лежат и в Rx, ив R2, а следова-
тельно, н в R, П R3. О
Пусть Rx и R3 —два подпространства в пространстве
конечной размерности. Рассмотрим в их сумме Rx + R2
следующую систему векторов. Если пересечение Rx р|
П Ro — не нулевое пространство, то возьмем базис ех, . . .
. . ., efc в RL П R3 и дополним его векторами . . ., fn
до базиса в Йхи векторами gt, . . gm до базиса в R2, Ес-
ли же Ri П R2 — нулевое пространство, то просто берем
объединение базиса в Rx и базиса в R2. Каждый вектор
в R, + R2 является линейной комбинацией выбранных
нами векторов. Это следует из того, что х -- хх х2, где
хх лежит в Rj. а х2 - в R2. Тогда хх разлагается по векто-
рам fx, . . ., fR, en . . е», a x2 — по векюраме,. . . ., ek,
Теперь покажем, что рассматриваемая система векто-
ров линейно независима. Возьмем какую-нибудь линей-
ную комбинацию этих векторов
п fc т
2 "4" Н- Ts£is “ 0.
i=l 2=1 s=i
т
Вектор х = 2 Ts-s лежит в R3. Но, очевидно,
3=1
п к
х = 2 ЗзРй
i—1 j=i
и поэюму х лежит и в Rx. Таким образом, вектор х должен
находиться в пересечении Rx р| R2. Отсюда можно заклю-
чить, что а} а, . . . - ап = 0 и ух = у2 = . . . =
Tm " 0. В приведенной линейной комбинации остаются
т'олмю члены рхех -й р2е2 4- . . . 4~ если Rx f] R2 =/=
Ф 0. и их коэффициенты равны нулю, так как векторы
§ б] ЛИНЕЙНЫЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА
71
ер е2, . . ., <?*• линейно независимы. Мы показали, что си-
стема векторов fp . . fn; en . . efc; gn . . g^ является
базисом в подпространстве Rx : R2. Отсюда вытекает
следующая
Теорема 2. Размерность суммы двук подпрост-
ранств равна сумме их размерностей минус размерность
их переселения.
Доказательство. В самом деле, размерность
Rx равна п 4- А', размерность R2 равна А: + т, размерность
Rx П R3 есть k, а размерность суммы Rx + R2, как пока-
зано выше, равна к Д- п + т. Q
Если пересечение подпространств В, и R2 — нулевое
пространство, то сумма Rx -|- Rs называется прямой сум-
мой. Размерность прямой суммы равна сумме размернос-
тей слагаемых. Базис в прямой сумме состоит из векторов
Г1? . . ., fn, gx, . . ., gm, где . . ., fn — базис в R1; ag1? . . .
. . . ., gm — базис в R2. ^Отсюда следует, что каждый век-
тор в прямой сумме разлагается в сумму векторов хх из
Rx и х2 из R2 единственным образом. Для обозначения
прямой суммы используют знак ф или ф.
Понятия суммы, пересечения и прямой суммы легко
могут быть перенесены на любое конечное число подпро-
странств.
П римеры. Назовем три векторных пространства,
которые понадобятся нам в дальнейшем.
1. Совокупность всевозможных систем п вещественных
чисел (иногда говорят: совокупность n-ок вещественных
чисел) х = [жх ж2, . . . лп], где сложение и умножение оп-
ределяются формулами
Х2 . . . Хп] + [ух у2 ... уп\ =
= + У1 + Уч • • . хп + yj,
а [жх х2 ... яД = [ат-j а.т2 . . . а.сп],
является н-мерным векторным пространством и обозна-
чается символом Вте.
2. Обозначим С”1 [£0. /Д множество m-ок, элементы ко-
торых являются непрерывными функциями времени, оп-
ределенными на интервале h- Мы будем записы-
вать элементы пространства С/" [i0, £Х1 как вектор-столбцы
72
ЛИЙЕЙНДЯ АЛГЕЁрД
1гл. I
в виде
‘ I/! (/) "
U(i) =
U
7П
или u'(0 =
Легко проверить, что С171 [£0, tj образует линейное прост-
ранство, если определить операции сложения и умноже-
ния на скаляры естественным образом:
«(О Ч- V (0 -
ui (0 + (О
и О -г г (О
L 171 ' 1 1 171 \ ' J
яи (г) =
'awi(Z)
Пространство С™ Йог ij является бесконечномерным про-
странством.
3. Пусть Rпхт — множество матриц размером (п X
X т) чад полем вещественных чисел. Используя опреде-
ление сложения матриц и умножения их на числа, полу-
чим линейное векторное пространство пад полем вещест-
венных чисел. Это пространство (n X т)-мерно. Заметим,
что пространство Rn является частным сличаем простран-
ства И?гХ™ при т ~ 1.
Задачи. 1. Укажите какой-нибудь базис в пространствах: R”.
R2XS, R1.
2. Найдите размерность линейного подпространства, натянуто-
го на векторы а = [1 3 2 1]; й = [4 6 5 4]; с = [3 74 3].
3. Образует ли совокупность векторов на плоскости, начала
которых находятся в начале координат, а концы — в пределах пер-
вой четверти, линейное пространство (с обычными операциями)?
4. Рассмотрите совокупность Р одних положительных вещест-
венных чисел. Введите операции по следующим правилам: под «сло-
жением» двух чисел будем понимать их обычное умножение, а под
произведением элемента г е Р на вещественное число А будем по-
нимать (обычное) возведение в степень % числа г. Является ли Р с
указанными операциями линейным пространством? Если да, то ка-
кова размерность этого пространства?
5. Является ли линейным пространством совокупность всех
векторов из Rn таких, что их координаты удовлетворяют условию
*1 + - • + Хг О?
6. Доказать, что сумма S линейных подпространств R( и R2
тогда и только тогда будет прямой суммой, когда хотя бы один век-
тор х S однозначно представляется в виде х = х, х2, где х, с
ЕЕ R|, Х2 ЕЕ R2.
7. Линейные оболочки векторов {/2-|- 1, £ “ ~г f, 1}, {t2, обра-
зуют подпространства пространства многочленов степени п 2.
Укажите базис в пересечении и в сумме этих подпространств.
£ 7J
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
73
8* Какую размерность имеет пространство комплексных чисел,
заданное над полем вещественных чисел? Укажите базис этого про-
странства.
9. Докажите, что размерность пересечения п подпространств
не превосходит минимальной из размерностей этих подпространств.
§ 7. Линейные преобразования и их матрицы
Задание отображения одною линейного пространства
в другое означает задание некоторой функции, «аргумен-
тами» которой являются элементы одного линейного про-
странства, а «значениями» — элементы другого линейного
пространства.
Линейные операторы. Пусть даны два линейных про-
странства X и Y. Рассмотрим отображение линейного
пространства X в линейное пространство Y; общепринятое
обозначение такого отображения X -> Y. Если это ото-
бражение переводит вектор х пространства X в вектор у
пространства Y, то мы будем писать у = .Л (х), или коро-
че: у - Л х, или х у.
Отображение Л называют линейным преобразованием,
или линейным оператором, или морфизмом, если оно удов-
летворяет двум условиям:
1. Л (х + )) = Л (х) 4- Л (у) для любых х, у из X.
2. Л (ах) ’ сбЛ (х) для любого xi“ X и любого чис-
ла а.
Так как в дальнейшем мы будем иметь дело только с
линейными операторами, то слово «линейный» чаще всего
будем опускать.
В равенстве у = Лх вектор у называют образом век-
тора х, а вектор х — прообразом вектора у. Совокупность
всех прообразов называется областью определения опера-
тора Л, а совокупность всех образов — областью значе-
ний. Для области значений используют обозначение:
range Л.
По самому определению оператора область его опре-
деления есть все пространство X, область же его значений
есть подпространство пространства Y. Мы пока ничего
не говорим о размерности X и Y. Они могут быть как ко-
нечномерными, так и бесконечномерными.
Рассмотрим примеры. 1. Оператор, который каждому
вектору х пространства X ставит в соответствие нулевой
вектор пространства Y, является очевидно линейным
74
ЛИНЕЙНАЯ АЛГЕБРА
1ГЛ. I
оператором. Его область значений есть нулевое подпрост-
ранство.
2. Поставим в соответствие каждому вектору х прост-
ранства X этот же вектор х. Мы получим линейный опе-
ратор Е, действующий из X в X. Этот оператор называется
тождественным или единичным оператором. Его область
значений есть все пространство X.
3. Если каждому вектору х поставить в соответствие
вектор ах, то это линейный оператор. Он называется ска-
лярным оператором.
4. Рассмотрим соотношение
ь
х ( В (?) п (?) dt. (1)
V»
где В (?) — матрица размеров (и X ?«), составленная из
непрерывных на отрезке ?0 t функций, а и (?)т-мер-
ная непрерывная вектор-функция u (?) ЕЕ С"1 [?0, ?-J. Ин-
тегралом от матрицы, по определению называется матри-
ца, составленная из интегралов элементов матрицы. Ана-
логично определяется производная от матрицы. Таким
образом, по определению, если A (?) -= (?)]mxn, т0
h ti
JlTlXn at L JlTlXn
Приведенное соотношение (1) является линейным опера-
тором, который ставит в соответствие каждому элементу
и (?) пространства Cm [?ft, элемент х пространства Rn.
Символически В: С171 [?„, /J —> R”, или и (?) - > х. Этот
линейный оператор действует из бесконечномерного про-
странства Cm [?0, £jJ в п-мериое R”.
Матрицы линейных операторов. Пусть есть линей-
ный оператор, отображающий пространство R"b m-мерное
пространство R171, т. е. R —> Rm. Выберем некото-
рый базис в R ‘ {fT, f2, . . fm} и базис в R” {е1т е2, . . .
. . еге}. Вектор е2 переводится оператором ,А в некото-
рый вектор пространства R171, который, как и любой
вектор этого пространства, можно разложить по базисным
векторам
+ "* + атп1?т*
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
75
§ 7]
Аналогично оператор А действует и на остальные базис-
ные векторы пространства Rn:
4" + АпЭ'т-
lA'^n — ®ln^"l 4“ ^2тЛ2 4" •* * + ^т4иг
Эти формулы можно записать короче:
m
^ei ~ 2 / = 1, 2, . . .. п.
i—i
Коэффициенты а;; (£ = 1,2, . . т; j =1, . . «) опре
деляют некоторую матрицу А из т строк и п столбцов:
"оси И12 . .-а1п-
Д __ asi ааз ' • • Я2п
_Ятп1 йт2 ‘ ' amn_
которая называется матрицей оператора .А в базисах (е}
и {f}. Столбцами этой матрицы по построению служат
координаты векторов A&i, . А&п относительно базиса
{fl, • -W-
Простой проверкой устанавливается, что если в про
странстве Rn задан произвольный вектор х, координаты
которого относительно базиса {е} обозначим через {jclt
ccg, . . жп} и Лх = у, то координаты вектора у относи-
тельно базиса {f1: f2, . . вычисляются по формуле
у Ах, где А — матрица оператора А относительно ба-
зисов {е}, {f}. Таким образом, матрица А полностью опре-
деляет оператор А при фиксированных базисах в прост-
ранствах R” и R171. Строить эту матрицу тоже чрезвычай-
но просто, ее столбцы суть координатные столбцы векторов
Aelt . . А?п в базисе {fn . . ., fm). Это правило часто
будет использоваться в дальнейшем для вычисления мат-
риц операторов в различных базисах.
Легко проверить, что любая прямоугольная матрица
А размером (m X п) задает некоторый линейный оператор
А : R -> R171, действующий из «-мерного пространства
Rn (с фиксированным базисом) в «i-мерное R171 (с фикси-
рованным базисом). Тем самым между линейными опера-
торами, действующими из пространства Rn в пространство
76
ЛИНЕЙНАЯ АЛГЕЙГА
[ГЛ. 1
R171, и {т X п) матрицами, составленными из элементов
поля К, устанавливается взаимно-однозначное соответ-
ствие.
Пример 1. Рассмотрим линейное пространство
многочленов от t степени ^3 с коэффициентами из число-
вого поля К. Это пространство R4. Оператор дифференци-
рования ~ относит каждому многочлену из R4 некоторый
многочлен степени па единицу меньше. Таким образом,
этот оператор отображает RJ > R3, т. е. : R1 -> R3.
Оператор дифференцирования является линейным опе-
ратором, так как
^-(ф(0 + Ч>(0) = ^1-Т: =
Выберем в пространстве R4 базис {1, t, i2, i3}, а в про-
странстве R3 — базис {1, t, £2}. Построим матрицу опера-
тора дифференцирования в этих базисах. В столбцах этой
матрицы, согласно указанному правилу, стоят координа-
ты векторов
4<!)’ 4<'3)’
записанные в базисе {1, t, t2},
имеет вид
поэтому матрица оператора
А -
‘О 1
О о
о о
о о
2 О
О 3
Пример 2. Пусть дан оператор Л, действующий
из В3 в R3, н его матрица в некотором базисе равна А.
Пусть, далее, в пространстве R3 выбран вектор Ь, такой,
что векторы b, АЬ, А2Ь линейно независимы. Построим
матрицу оператора ,Д в базисе {Ь, ЛЬ, Л2Ъ}. Столбцами
этой матрицы согласно правилу будут координаты век-
торов {ЛЬ, Л2Ь, Л3Ь}, записанные в базисе {Ь, ЛЬ, Л2Ь}.
Вектор ЛЬ имеет в этом базисе координаты (0, 1, 0), век-
тор Л2Ь — координаты (0, 0, 1), а вектор Л3Ь можно
выразить как линейную комбинацию векторов Ь, ЛЬ,
Л2Ь, воспользовавшись теоремой Кэли — Гамильтона,
которая утверждает, что матрица Л является корнем свое-
го характеристического многочлена. Характеристический
§ 7]
ЛИПКЙИЫК ПРЕОГ.РАЗОВАШТП
7?
многочлен А запишем в виде
Фа (М — А3 1- о^л? И- а2Х, а3.
Таким образом, Л3 - ос,.!2 -|- а2Д -|- а,3Е — 0. Умножая
это матричное равенство справа на вектор Ь, получим
Д3Ь = —cq/Pb — а,ЛЬ — а3Ь, и значит, координаты век-
тора Л3Ь в базисе {Ь, ЛЬ, Л2Ь} имеют вид {—а3, а2,
—(Xj}. Матрица Л в новом базисе имеет вид
'о о
— аз
— аз
А — 1 о
01 - - ai
Точно такие же рассуждения можно провести и в «-мер-
ном случае (см. задачу 6).
Ранг и дефект линейного оператора. Пусть jl — ли-
нейный оператор, определенный в пространстве R1 с ба-
зисом е1? е2, . . е„. Область значений линейного опе-
ратора есть подпространство L, именно — линейная обо-
лочка векторов (докажите это).
Размерность подпространства L определяется числом ли-
нейно независимых векторов среди ,Аеп, или,
что то же самое, рангом матрицы, элементы столбцов ко-
торой совпадают с координатами этих векторов, т. е.
рангом матрицы оператора. Так как ранг матрицы опе-
ратора не зависит от выбора базисов (почему?), то раз-
мерность подпространства значений оператора зависит
только от самого оператора. Мы будем называть размер-
ность подпространства значений рангом оператора jl и
обозначать это число через гА или rank Л- Наряду с
подпространством значений мы рассмотрим совокупность
векторов х g= Rn, удовлетворяющих равенству ^х = 0.
Эта совокупность векторов является подпространством и
называется ядром оператора (ker ^). Размерность пА
ядра называется дефектом оператора Д. Если мы обра-
тимся к соответствующему координатному равенству
Лх = 0, то легко понять, что дефект оператора равен
числу решений фундаментальной системы решений этой
однородной системы уравнений, т. е. п — гА. Отсюда
следует гА + «д = !'а п — га = п- Таким образом, раз-
мерность ядра и размерность области значений в сумме
дают размерность пространства.
А.
78
ЛИНЕЙНАЯ АЛГЕБРА
1ГЛ. I
Рассмотрим теперь простейшие операции над операто-
рами.
Пусть даны три пространства Rn, R ‘, Rs и два линей-
ных оператора A-' -> R * и ЗВ: R171 -> R3. Произве-
дением операторов .А и называется оператор ото-
бражающий R -> В и такой, что при любом xfER
^х = ЗВ (Ах).
Произведение операторов записываются так: $ =
Из линейности операторов ЗВ и А вытекает линейность
оператора Выберем в пространствах Rn и Rm, Rs про-
извольные базисы {е}, {q}, {г} и обозначим через А, В, С
матрицы операторов Л, ЗВ, в данных базисах. Они
имеют размерность (т X га), (s X гаг), (s X га) соответст-
венно. Тогда операторным равенствам у = Ах, z = ЗВу,
z ~ будут соответствовать координатные (матричные)
равенства
у = Ах, z = By, z = Сх.
Из первых двух равенств находим
z -= By = В (Ах) = = В Ах,
что означает С — В А. Таким образом, матрица произве-
дения операторов равна произведению матриц операторов.
Аналогично легко показать, что матрица суммы опе-
раторов равна сумме матриц операторов, а оператору
аА> где а - некоторый скаляр, соответствует матрица аА.
Рассмотренные операции вскрывают глубокую связь
между линейными операторами и прямоугольными мат-
рицами. Если мы пишем операторное равенство у = Ах,
то формально можем считать, что у и х суть векторы-
столбцы, А — прямоугольная матрица, а выражение
Ах есть произведение двух прямоугольных матриц. Бо-
лее того, если в действительности А есть сложная функ-
ция других операторов, сводящаяся к сложению опера-
торов, умножению операторов и умножению операторов
на число, то мы снова можем считать А матрицей, являю-
щейся функцией той же структуры от составляющих
матриц.
Столь глубокая связь между матрицами и операторами
позволяет при изучении последних широко пользоваться
всеми элементами теории матриц.
§ 7)
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
79
Линейные операторы в Rrt. Линейный оператор, ото-
бражающий «-мерное пространство Rn само в себя, мы
будем называть просто линейным оператором в Rn. Над
линейными операторами в R'1 имеют место все рассмо-
тренные выше операции.
Сумма двух линейных операторов в Rn, а также про-
изведение такого оператора па число — снова линей-
ные операторы в Rn. Умножение двух таких линейных
операторов всегда выполнимо, и произведение нх есть
снова линейный оператор в R”. Поэтому нетрудно уста-
новить, что линейные операторы в R' образуют кольцо.
Выбор базиса в пространстве R71 устанавливает взаимно-
однозначное соответствие (такое соответствие называется
изоморфизмом или изоморфным соответствием') между
кольцом линейных операторов в R1 и кольцом квадрат-
ных матриц «-го порядка с элементами из поля К.
Рассмотрим теперь, как изменяется матрица опера-
тора при замене базиса в пространстве R71. Пусть в R'1
наряду с базисом {Bi, е2,. . .,еп} задан базис^, f3,. . fn}.
Тогда имеют место соотношения
у. =
У/ =
где Ар — матрица оператора в базисе {еп . . еп}, а
А; — соответственно в базисе {Г}. Пусть матрица пере-
хода от базиса {е) к базису {f) равна Р, т. е.
Ус =
хс = Рхр
тогда имеем у(, = Л(хе, Ру/ = ЛеРхт; умножая послед-
нее равенство слева на Р”1, получим yf Р_1ДеРх^
т. е. Af — Р^А^Р. Патрицы, связанные последним от-
ношением, мы определили как подобные матрицы. У этих
матриц равны характеристические многочлены.
Таким образом, мы доказали важное
Предложение 1. Две матрицы, соответствую-
щие одному и тому же линейному оператору в R71 при
различных базисах, подобны между собой, причем матри-
ца Р, связывающая эти матрицы, совпадает с матрицей
преобразования координат при переходе от первого базиса
ко второму. Q
80
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. 1
Другими словами, линейному оператору в R’ отве-
чает класс подобных между собой матриц. Эти матрицы
представляют данный оператор в различных базисах.
Но мы уже описали выше процедуру записи оператора w
в различных базисах пространства R'1. Сравним эти два
подхода на примере.
Пример 3. Пусть дана матрица оператора .4 = j
Г 1 I Г 0 I
и даны два вектора et = 2 , = 3 в простран-
стве R2, координаты которых соответствуют тому же
базису, в котором представлена матрица А. Возьмем эти
векторы в качестве нового базиса и вычислим матрицу опе-
ратора А в этом базисе. Ее столбцы суть координатные
столбцы векторов Лег и Ле2. Вычислим эти векторы:
Теперь нужно найти координаты этих векторов по бази-
су е(. е2:
Координаты вектора Лел суть {2, —вектора Ле2 —
{3, —2}. Значит, матрица А в базисе {ег, е2} имеет вид
2 3'
_А _2 •
3
Обратите внимание, что нам не понадобилось определять,
какие векторы выбраны в пространстве R” в качестве ба-
зиса. Важно лпшь, чтобы А и е1? е2 были записаны в одном
и том же базисе.
Рассмотрим второй способ. Он заключается в прямом
вычислении А — Р~*АР, где Р — матрица перехода к
базису (ер е2}, в столбцах которой стоят координаты
§ 1]
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
81
векторов ег по старому базису. Значит,
p-i
Г 1 0 1
При втором способе нам пришлось вычислить обратную
матрицу и выполнить 23 умножений. При первом способе
объем вычислений значительно меньше. Здесь нам по-
прежнему не было необходимости определять, какой же
был базис в пространстве R2, относительно которого мат-
рица А имела первоначальный вид, так как для того, что-
бы выписать матрицу перехода к этому базису, нужно
только знать координаты новых базисных векторов по
старому базису. Координаты первоначальных базисных
векторов по новому базису расположены в столбцах мат-
рицы /г!.
Обратный оператор. Продолжим изучение линейных
операторов в R'. Поскольку ранг оператора равен рангу
матрицы этого оператора, записанной в произвольном ба-
зисе, то всем операторам, ранг которых совпадает с раз-
мерностью пространства, соответствуют неособенные мат-
рицы. Эти операторы называются неособенными или не-
вырожденными операторами. Дефект невырожденного
оператора равеп нулю, а ядро состоит только из нулевого
вектора. Поскольку для такого оператора любой вектор х
связан взаимно-одпозначным соответствием с вектором у
по формуле у = ./Zx. то и для каждого у определен един-
ственный вектор х, который можно рассматривать как
образ элемента у. Определенный таким образом оператор
называется обратным оператором и обозначается *4-1.
Таким образом, если для неособенного оператора справед-
ливо равенство у = ^х, то по определению х =
Нетрудно показать, что если в R' фиксирован базис и опе-
ратору '^4 соответствует в этом базисе матрица Л, то опе-
ратору Л'1 будет соответствовать матрица Л-1,
82
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ I
Собственные векторы. Пусть в линейном пространстве
Rn задан оператор Л- Подпространство ДУ пространства R"
называется инвариантным относительно оператора Л,
если из х г- ./У следут Л* ЗЕ-ЗР. В частности, тривиальные
подпространства — нулевое, и все пространство является
инвариантным для всякого линейного оператора. Нас бу-
дут интересовать, конечно, нетривиальные подпростран-
ства. Особую роль играют одномерные инвариантные под-
пространства оператора Л Если Л — одномерное инва-
риантное подпространство, то любой вектор х из Л' опе-
ратор Л переводит в вектор Хх. т. е. Л х = Хх. Ненулевой
вектор х, удовлетворяющий этому равенству для некото-
рого числа X, называется собственным вектором операто-
ра Л‘ Число X из этого равенства называется собствен-
ным числом или собственным значением оператора Л-,
соответствующим собственному вектору х. Совокупность
всех собственных значений называется спектром оператора.
Нетрудно понять, что с обет ней нм ми векторами пуле-
вого оператора, тождественного оператора и скалярного
оператора будут все векторы пространства RH. Эти опе-
раторы имеют лишь по одному собственному числу, рав-
ному соответственно 0, 1 и а.
Теорема 1. Собственные векторы х1? ха,. . хт
оператора Л с попарно различными собственными значе-
ниями Xj, Х2,. - Хт линейно независимы.
Доказательство. Теорему докажем индукцией
по числу т. Очевидно, что она верна при т = 1. Пусть
она верна для всяких (т — 1) собственных векторов опе-
ратора Л, но не верна для векторов хъ х3.хт. Тогда
между этими векторами имеется линейная зависимость
(Х1Х1 4- «гха 4-... -б а,пх1п = 0, (2)
где, например, 04 У"- 0, Применяя к этому равенству опе-
ратор Л* получаем
alXiXj + «3Х2Ха 4“ 4" ^т^тхт — О- (3)
Умножая равенство (2) на Xm и вычитая из (3), получим
а1 (Х1 Х7П) X! 4" • 4" ®т-1 (Хщ-! — Хт) х„,. 1 = О,
Отсюда по индуктивному предположению следует, что все
коэффициенты должны быть равны нулю. В частности,
§ 7] ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ &3
«1 (At — Am) - 0, что противоречит условию: О,
Xi Am. Следовательно, векторы х1} х2, . . хт линей-
но независимы. 0
Следствие. В п-мерном пространстве линейный
оператор не может иметь более п собственных векторов
с попарно различными собственными значениями.
Выясним вопрос о существовании собственных значе-
ний и собственных векторов. Выберем в пространстве В*1
базис {е}. и пусть А есть матрица оператора .Д в этом ба-
зисе. Тогда операторному равенству
= Ах
однозначно соответствует матричное равенство
Ах = Ах,
или
(Я — AZ?) х — 0.
Рассматривая полученное соотношение как однородную
систему линейных алгебраических уравнений, мы заклю-
чаем, что для того, чтобы оператор <Л имел собственные
векторы, необходимо и достаточно, чтобы система
(Я — х = 0
имела ненулевые решения, для чего, в свою очередь, не-
обходимо и достаточно, чтобы определитель [Л — А£| рав-
нялся нулю, т. е. собственные значения должны удовлет-
ворять характеристическому уравнению |Л— ЛZs | - 0.
Это уравнение согласно основной теореме алгебры [10]
имеет по меньшей мере один корень, вообще говоря, ком-
плексный. Следовательно, всякий линейный оператор,
действующий в комплексном линейном пространстве, т. е.
в пространстве, в котором исходное поле К есть поле ком-
плексных чисел, имеет по меньшей мере один собственный
вектор. Чтобы вычислить координаты этого вектора,
необходимо решить систему линейных уравнений
[А — А* А] х -0,
где А* — корепь уравнения | А — АА | = 0. Если оператор
Действует в вещественном линейном пространстве, то он
может и не иметь ни одного собственного вектора.
ЛИНЕЙНАЯ АЛГЕБРА
1ГЛ. Г
Напомним, что у подобных матриц характеристиче-
ские многочлены совпадают и что | А | и SpA являются ин-
вариантами.
Треугольная форма матрицы. Если квадратная матри-
ца имеет попарно различные собственные значения Х1;
Х2, . . ХЛ, то соответствующие этим значениям собствен-
ные векторы линейно независимы по теореме 1. Тогда
с помощью матрицы Р-1, в столбцах которой стоят эти век-
торы, матрицу А преобразованием подобия А = РАР~1
можно привести к диагональному виду. На главной диаго-
нали А будут располагаться собственные числа матрицы А.
В том, что матрица А в базисе из собственных векторов,
которые мы обозначим а1т ап, имеет диагональный
вид, легко убедиться непосредственно. Действительно,
пользуясь правилом (см. стр. 75) вычисления матрицы
оператора в новом базисе, имеем аг = Аа^ = А,гаг, где
а, i-й столбец матрицы А.
Для матрицы А с произвольным набором собственных
чисел существует базис, в котором опа имеет треугольную
форму. Об этом свидетельствует
Теорема 2. Для любой вещественной квадратной
матрицы А существует неособенная матрица Р такая,
что матрица P~fAP имеет треугольную форму. На глав-
ной диагонали этой матрицы расположены ее собственные
значения Xi, а2,- • ^п, а элементы, расположенные под
главной диагональю, равны нулю.
Доказательство. Используем индукцию, на-
чав с двумерного случая. Пусть Хг — характеристическое
число матрицы А, а сг —соответствующий этому числу
собственный вектор. Рассмотрим преобразование подобия
для матрицы А с помощью невырожденной матрицы Р,
первым столбцом которой является вектор сР Так как
Acj = а вектор в базисе (сх, аД имеет координа-
ты (Хх, 0), то
[Xi ail
л •
О agj
Так как матрицы Л и Р~*АР подобны, то они имеют оди-
наковые собственные значения и, следовательно, Л2 =
= а2‘
Предположим теперь, что для матрицы А /<-г'о поряд-
ка существует невырожденная матрица Рь такая, что
§
ЛпИЕЙНШЁ ПРЕОБРАЗОВАНИЯ
85
Вк = Р^АР, имеет треугольную форму, и докажем, что
тогда к треугольной форме приводится и матрица порядка
{к + 1).
Пусть c-j — собственный вектор матрицы порядка
{к + 1), соответствующий характеристическому числу
Выберем векторы а15 а.,,. . так, чтобы система
векторов cj, ах, а2,. . а,; была бы линейно независима.
Выберем в качестве преобразования Pt матрицу, столбцы
которой Ci, аь а2,. . а^. Тогда непосредственной про-
веркой, как и в двумерном случае, убеждаемся, что
Ai
Р?АРг = О
О
где Вк — матрица /ого порядка, а через * здесь и далее
обозначены, возможно, ненулевые элементы. Поскольку
характеристическое уравнение правой части имеет вид
-Х£| =0,
то характеристическими числами матрицы Вк являются
величины л3, Х3,. . ., Лй+1, т. е. к остальных характери-
стических чисел матрицы Л. По предположению индукции
существует неособенная матрица Рк такая, что
Построим теперь матрицу
P\+i следующим образом:
86
ЛИНЕЙНАЯ АЛГЕБрА
[ГЛ, I
Тогда матрица PjPk+1 является искомой матрицей преоб-
разования А к треугольной форме. Действительно,
(ZVW’ 4(Р,Р,+1) = РЙ1(Р7‘4Р1)Р»+1 =
“Xi * . . . *
%2 • • *
О
Задачи. 1. Постройте базис в
ратора
области значений и в ядре опе-
го
1 0'
4 1
О О
А =
О
о
d2
2. Выпишите матрицу оператора дифференцирования —,
dl2,
ствующего в пространстве R4 многочленов степени не выше
_Ё!_
di2 ;
К4 -» R4,
дей-
3-й,
в базисе {1, t, f2, i3}. Постройте матрицу того же оператора, действую-
щего из R4 -> R2, выбрав в качестве базиса пространства IV век-
торы {1 t, А-
3. Вычислите матрицу оператора
ГО
1
1
1
1
1
О
А = 1
_1
в базисе Xi = [1, 1, 1], хг =- [0, 1, 1]. хз = [0, 0, 1].
4, Пусть {Ах, Аа, . . — характеристические числа квадрат-
ной матрицы А, причем все не равны нулю. Вычислите характери-
стические числа матрицы /I3.
5. Постройте базис пространства решений системы
2ж1 —- 3^2 xs — #4=0,
-j- 5л:3 — 2а\. ад = 0.
6, И yen. ф (л) = Xn + ctpV1^1 -ф ... + % — характеристиче-
ский многочлен матрицы Л и пусть существует веитор b такой, что
векторы Ь, ЛЬ, /12Ь, . . ,4П-1Ь линейно независимы. Запишите мат-
рицу А в базисе из этих векторов.
7. Укажите пример линейного оператора в вещественном прост-
ранстве R2, не имеющего ни одного собственного вектора.
8. Докажите, что если А — треугольная матрица n-го порядка,
все диагональные элементы которой равны нулю, то Ап = 0.
ЕВКЛИДОВЫ ПРОСТРАНСТВА
87
§ 81
§ 8. Евклидовы пространства. Квадратичные формы
Скалярное произведение. В линейном пространстве от-
сутствует понятие, аналогичное понятию длины вектора
обычного трехмерного геометрического пространства. Дли-
ну вектора линейного пространства можпо определить
с помощью понятия скалярного произведения.
Определение 1. Пусть в вещественном линей-
ном пространстве R каждой паре элементов х, у постав-
лено в соответствие вещественное число, обозначаемое
<х, у>, т. е. задано отображение <х, у> : X R'-R1, и
пусть при этом выполнены следующие требования:
1. (х, у)> = <(у, х> (коммутативность).
2. <Хх, у> = X <х, у> (однородность).
3. <х -1- у, 1>У — <х, z)> <у, z)> (дистрибутивность).
4. <(х, х)> 0, причем равенство имеет место тогда и
только тогда, когда х = 0 (дефинитлость).
Тогда говорят, что в линейном пространстве R задано
скалярное произведение. Q
Определение 2. Вещественное линейное про-
странство с заданным скалярным произведением назы-
вается евклидовым пространством (н-мерным евклидовым
пространством, если линейное пространство п-мерпо).©
Рассмотрим примеры скалярных произведений в ли-
нейных пространствах.
1. Пусть R'1 — вещественное линейное пространство
всевозможных вектор-столбцов высоты п и пусть
х' = [жх, ж3,. . ., у' = [j/j, г/21. . ., yj
— два вектора этого пространства. Тогда функция <(х,
у> = + х2у.2 -у . . . 4- хпуп], ИЛИ, короче, <х,
уУ = х' у, удовлетворяет всем аксиомам скалярного про-
изведения. Полученное n-мерпое евклидово пространство
обозначают Ert.
2. В линейном бесконечномерном пространстве Ст [£0,
ZjJ вектор-функций, непрерывных на отрезке t С,
введем скалярное произведение по формуле
о
<u(Z), v(0> = f u'(0v(0^.
Полученное бесконечномерное евклидово пространст-
во будем обозначать С«п [^, ^]. Справедливость аксиом
88
ЛИНЕЙНАЯ дЛГЕБГА
[ГЛ. I
скалярного произведения 1—4 вытекает из известных
свойств определенных интегралов.
3. В линейном (n X т)-мерпом пространстве матриц
размеров (n X т), обозначенном нами RnXm, скалярное
произведение можно ввести по формуле
<Л, #> = 22 Аз tr '£ = Sp А'В = След А’В.
1=1 3 =1
Пользуясь свойствами следа матрицы (см. задачу 3
§ 5), легко проверить, что все аксиомы скалярного про-
изведения удовлетворяются. Полученное (и X ^-мер-
ное пространство обозначим через Enxm. Q
Пользуясь аксиомами скалярного произведения, до-
кажем важное неравенство
< х, У>2 < <х> х> <У> У>> (КВ)
которое называется неравенством Коши — Буняковского.
Напишем очевидное неравенство
< ах 4- у, ах Ц- у> > О,
или
а2 <х, х> + 2а <х, у> Ц- <у, у> > 0.
Чтобы выполнялось это неравенство, дискриминант квад-
ратного трехчлена должен быть неположителен (условие
отсутствия у квадратного трехчлена действительных раз-
личных корней), т. е.
[<х, У>]2— <х> х> <у, у><0,
или
< х, у>2< <Х, х> <у, у>.
Пользуясь понятием скалярного произведения, введем
понятие длины или нормы вектора линейного евклидова
пространства по формуле
INH /<х, xf.
Из аксиом скалярного произведения вытекают следующие
свойства нормы:
1- |х| = Ь<х, х>>0.
2. |«| = |а||х||.
I 8]
ЕВКЛИДОВЫ ПРОСТРАНСТВА
§9
3. (| х 4- у f| <1 flx[| + ЦуЦ (неравенство треугольника).
Неравенство 3 является прямым следствием неравенства
Коши — Буняковского. Действительно,
|| X 4- у |]2 -- <х 4- у, X 4- у> - <х, х> -4 2 (X, у> -4 <у, у> <
< (IIхII +1! УII)2 - <х> х> + 2 V <х> х> <У» У> + <У> У>>
так как по неравенству Коши — Бупяковского
<х> У>2<<х, Х><У, У>-
Часто в линейном пространстве вводят норму незави-
симо от скалярного произведения, полагая по определе-
нию, что || х (/) || — числовая функция, удовлетворяющая
аксиомам 1, 2, 3.
Линейное пространство, в котором определена норма
вектора, называется нормированным пространством.
Ортогонализация базиса. Рассмотрим вопрос ортого-
нализации базиса евклидова пространства.
Определение 3. Два элемента евклидова про-
странства называются ортогональными, если <(х, yf> = 0. Q
Из этого определения и свойства 4 скалярного произ-
ведения следует
Предложение 1. Только нулевой вектор ортого-
нален каждому вектору евклидова пространства.
Доказательство. Если <х, у> = 0 для всех у,
то, положив у- х, имеем <(х, xf> = 0, что возможно в силу
аксиомы 4 только для нулевого вектора. 0
Элемент евклидова пространства, длина (норма) ко-
торого равна единице, называется ортом.
Если х Ф 0, то вектор х° = является ортом. Дей-
ствительно,
h"I - У<цх| Ц0
К<*, х> _ II xii 1
11*11 ьа
Теорема 1 (об ортонормированием базисе). В п-
мерном евклидовом пространстве существует базис из
взаимно ортогональных элементов единичной длины —
ортонормированный базис.
Доказательство. Возьмем какой-нибудь ба-
зис fn f2,. . ., fn и положим: е° = р^. Будем искать е
в виде е2 = f3 — ссе® и а выберем так, чтобы <(е2, е£> = 0.
90
ЛиИеййая АЛГЕБРА
[ГЛ. 1
Так как <е>, е®> =- <f2 — ае”, — <(2. е”> — а <е® с®> — 0,
то достаточно взять а = <fa, е?>. Найденный вектор
е3 0, так как в противном случае мы получили бы, что
векторы и f2 линейно зависимы. Положим е* — —у .
Продолжим это построение. Ищем е3 = Г3 — ре? — уе^
где р и у подберем так, что <е3, = 0, <е3, 0.
Умножая выражение для е3 скалярно сначала на е’’,
о
а затем на е2, найдем, что
Р = Оз> eiX 7 = е°>,
причем е3 у= 0, так как в противном случае fx, f2, f3 были
бы линейно зависимы. Продолжая этот процесс, мы найдем
систему взаимно ортогональных векторов е®, е°,. . .
. . е® единичной длины. Эта система ортов линейно неза-
висима. Действительно, допустим противное, т. е. пусть
cqe® + а.2&2 ccse° “п6» - 0 и, напрнмер,
as 0. Умножив это равенство скалярно на
е!, получим <е®, е®> = 0, т. е, е° = 0. Это противоречие
доказывает, что система е?, . . . , е** является базисом.
Процесс построения базиса приведенным способом на-
зывается ортогонализацией базиса. Q
Сопряженный оператор. Пусть заданы два евклидовых
пространства Y и X. Оператор ^*, действующий из Y
в X, называется сопряженным по отношению к оператору
действующему из X в У, если для любых векторов
х Е X, у ЕЕ Y выполняется равенство
<^Х, у> = <х,
Заметим, что это определение справедливо для любых (не
обязательно конечномерных) евклидовых пространств.
Теорема 2. Для всякого линейного оператора
Е" —> Ет существует сопряженный оператор и притом
только один. Если в пространствах Е™ и Е" выбраны орто-
нормированные базисы {е?..... <£} и $,. . ., f®} и опе-
ратор Л записывается с помощью матрицы А в этих ба-
зисах. то сопряженный оператор будет записываться с
помощью транспонированной матрицы Л'.
5 8]
ЕВКЛИДОВЫ ПРОСТРАНСТВА
91
Доказательство. То. что сопряженный опе-
ратор существует и записывается с помощью транспони-
рованной матрицы, следует из соотношения
(у, 4х> - у'4х = (4'у)' X = <4'у, х>,
справедливого для любой вещественной (n X т)-матрицы
А и любых векторов х “ Е'г, у е Е™.
Единственность сопряженного оператора получается
сразу, если предположить противное. ©
Рассмотрим примеры сопряженных операторов в трех
пространствах со скалярным произведением:
1. В Еп согласно теореме 2 сопряженному оператору
соответствует транспонированная матрица исходного опе-
ратора.
2. Пусть В (/) — (п X иг)-матрица функций, непре-
рывных на Ио, и u(£) - элемент пространства
С™ Uo, /Д, тогда
н
L(u) = j
ta
есть лииейиый оператор, действующий из пространства
С™ fzo, Zj в Еп.
Непосредственное вычисление показывает, что соп-
ряженный оператор L* (х) имеет вид
L* (х) = B'(t), так что u (Z) — B'^t) х.
3. Пусть А и X — матрицы (п X п). Тогда L (X) =
= А1 X + ХА есть линейный оператор, действующий
в Епхп. Нетрудно показать, что сопряженный оператор
£*(Х) имеет вид
L* (У) = AY + УА.
Самосопряжённые операторы. Линейный оператор в
Е”, совпадающий со своими сопряженным, называется
самосопряженным оператором. Согласно теореме 2 сим-
метричному оператору в ортономированном базисе соот-
ветствует симметрическая матрица.
Симметрическая матрица обладает рядом замечатель-
ных свойств, часто используемых в дальнейшем.
Теорема 3. Все собственные значения симметри-
ческой матрицы вещественны.
92
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Доказательство. Пусть X — собственное чис-
ло матрицы А, вообще говоря, комплексное, и пусть х —
собственный вектор, соответствующий X, тоже, вообще го-
воря, комплексный. Умножим i-ю строку системы уравне-
ний [А— ХТДх = 0 на число Лг, комплексно сопряженное
i-й компоненте вектора х, и сложим все строки о той систе-
мы уравнений. Воспользовавшись далее симметричностью
матрицы Л, получим равенство
^112’13'1 4“ й12 4“ ^2^1) + • 4- aij (*4^i 4~ 4“ • •
• • 4" апп^п^п — Хо (ж^! 4- Ж2^2 4- . . . 4~ ^п^п)-
Левая часть этого равенства — вещественное число, коэф-
фициент при Хо справа — тоже вещественное число, при-
чем не равное нулю, следовательно, Хо — вещественное
число. Q
Ясно, что вещественному собственному числу Хо сим-
метрической матрицы А соответствует вещественный соб-
ственный вектор, координаты которого определяем, ре-
шая систему линейных уравнений [Л - Хо£] х = 0.
Чтобы пойти дальше, введем ряд вспомогательных по-
нятий.
Пусть R является подпространством в Еп. Совокупность
всех элементов z ЕЕ ЕД ортогональных ко всем эементам
из R, называется ортогональным дополнением к подпро-
странству R. Обозначим это ортогональное дополнение
через Q.
Пр едложение 2. Q является подпространством
в Е71.
Доказательство. Обозначим через г элемент
из подпространства R, а через z — любой элемент ортого-
нального дополнения Q. Если г> = 0, то <Xz, г> = 0.
Далее, если <Х, г> = 0 и <z3, г> =0, то и <аг 4~ ®2, г> =
= 0. Отсюда следует, что при zx Е Q и z.2 e Q имеет место
z, z2 Е Q. О
Предложение 3. Пусть В^ — к-мер ное под-
пространство в пространстве Еп. Тогда размерность его
ортогонального дополнения Q равна п — к.
Доказательство. Выберем ортоиормирован-
ный базис в Е” {е”, . . ., е°} и пусть {f17 1‘.2. . . —
некоторый базис в Rft. Очевидно, что z (Е Q тогда
и только тогда, когда <z, ^ > = 0, <z, f2> = О...
§ 8]
ЕВКЛИДОВЫ ПРОСТРАНСТВА
93
. . . <z, --0. Запишем эги равенства в базисе {е®, <4 . .
. - - ₽”}•
/i^i 4* + • - • 4" /п^п = О'
/j^^i + /23^2 4- • 4“ ~ 0,
/i^3i + /F^a 4~ • • 4* /п ~ 0-
Здесь — координаты вектора по ба-
зису ех, е2, . . ел- Мы получили относительно z л ин ей-
нуто однородную систему уравнений, матрица которой име-
ет ранг /с, ибо векторы f1? f3,. . fk линейно независимы.
Пространство решений этой системы (п — Аг)-мерно. Сле-
довательно, размерность ортогонального дополнения Q
равна (п - к). 0
Докажем теперь основной факт теории самосопряжен-
ных преобразований.
Теорема 4. Всякое самосопряженное преобразование
в пространстве Еп обладает орто нормированным бази-
сом собственных векторов, и, следовательно, всякая веще-
ственная симметрическая матрица подобна диагональ-
ной вещественной матрице, и матрица преобразования
подобия вещественна.
Док а за тел ьст в о. Если все корни характери-
стического уравнения различны, то утверждение теоремы
сразу следует из теорем 2 и 1 § 7. Пусть корпи кратные.
Докажем теорему* по индукции. Если пространство Ел
одномерно, то утверждение теоремы очевидно. Предполо-
жим, что оно справедливо для (п — 1)-мерного евклидова
пространства, и докажем, что оно справедливо тогда и
для н-мериого пространства. Пусть и х° — соответ-
ственно некоторое собственное значение и некоторый нор-
мированный собственный вектор преобразования <Д-
Рассмотрим одномерное подпространство ах® и ортого-
нальное дополнение к нему Q, которое согласно пред-
ложению 3 (п — 1)-мерно. Покажем, что преобразование
Л переводит Q в себя. Пусть z eQ, t. е. <Х = 0,
тогда <Лк, х°> = <z, Лх®> = <z, = К. <z, х°> —
= 0, и значит» Лъ GE Q. По индуктивному предположе-
нию преобразование ,4 в (п— 1)-мерном подпространстве
94
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Q имеет ортонормированный базис х?. х?,. . .. х®-1 соб-
ственных векторов. Добавив к этому базису нормирован-
ный вектор х®» мы получим ортонормированный базис
векторов во всем пространстве Ert. Q
Пусть А — произвольная симметрическая веществен-
ная (п X л)-матрица. Всегда можно считать, что в неко-
тором ортонормированием базисе оиа описывает некоторое
преобразование .Л. Пусть х®, х^,. . х* — ортонорми-
рованный базис из собственных векторов преобразования
Согласно доказанной теореме матрицу А можно при-
вести с помощью преобразования подобия к диагональному
виду. Обозначим через U соответствующую матрицу пре-
образования. Тогда
U~lAU --
О . . . О '
и ... о
о v
где Xi, Хг,. , Лп — собственные числа матрицы А, при-
чем каждое собственное значение выписано столько раз,
какова его кратность. Заметим, что матрица U обладает
одной важной особенностью. По определению в столбцах
этой матрицы стоят координаты векторов базиса {х”,
х§, . . х°> по базису {е?, . . е®}. Так как оба ба-
зиса ортонормированы, то
UU' = Е.
Матрицы, удовлетворяющие этому условию, называются
ортогональными матрицами. Пусть С7"1 — обратная мат-
рица для ортогональной матрицы U. Тогда в силу усло-
вия UU' = Е имеем С7-1 = U' для всякой ортогональ-
ной матрицы U.
Результат теоремы 4 используем для доказательства
простого, но важного для пас факта.
Теорема 5. Линейное пространство R'1 предста-
вимо в виде прямой суммы области значений и ядра любого
самосопряженного линейного оператора, или, что то же
самое, всякой вещественной симметрической матрицы А.
Символически это можно записать так\
Rn = range А ф ker А.
< Sj ЕВКЛИДОВЫ ПРОСТРАНСТВА 95
Доказательство. Пусть симметрическая ве-
щественная матрица А имеет ранг г. Тогда в области зна-
чений матрицы А согласно теореме 3 существует базис из г
собственных векторов {f17 , , fr}. Выберем теперь ка-
кой-либо базис {ех..ert_r} в ядре матрицы А. Пока-
жем, что если х принадлежит области значений матрицы
А, то ни одна из его ненулевых компонент не лежит в яд-
ре матрицы А. Пусть х S range А и х = x1f1 — . . . +
+ .'Гг fr и пусть одновременно Ах = 0. Тогда
Ах = А (.Tj.fi Ч- ~ .<'1АС1 -{-... 4- хгА1г —
= . 4- аДД.,
где s 0 г, причем все числа Ац 0, I — 1,2,. . . , а, зна-
чит, все числа . , х^ суть нули, так как в противном
случае мы имели бы нетривиальную линейную зависи-
мость векторов f1T . . . , fr, Значит, ни одни из ненулевых
векторов, принадлежащих области значений А, не содер-
жится в ядре А. 0
Требование симметричности матрицы А существенно.
Для несимметрической матрицы это утверждение уже
неверно, хотя сумма размерности области значений и яд-
ра матрицы по-прежнему равна размерности простран-
ства п.
Пример.
вектор х = Щ лежит в ядре матрицы А, так как Ах = 0.
Одновременно этот вектор лежит в области значений этой
матрицы, так как, например, при у' = [1, 1] имеем
Ау х.
Лкшейные уравнения. Каждую систему из п линейных
уравнений с п неизвестными можно рассматривать как
одно уравнение вида Ах = b в «-мерном евклидовом про-
странстве Ел, где Ь — заданный вектор, А — матрица
п X п, х — искомое решение. Так как сопряженное ли-
нейное преобразование в Еп задается матрицей А', то уравне-
ние А'у = с называют сопряженным уравнением.
В евклидовом пространстве основные результаты от-
носительно разрешимости уравнения Ах = Ь можно сфор-
мулировать следующим образом.
96
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ-J
Теорема 6. Чтобы уравнение Лх = b было раз-
решимо при любом векторе Ь, необходимо и достаточно,
чтобы выполнялось одно из эквивалентных условий: а) од-
нородное уравнение Ах = 0 имеет только тривиальное
решение, б) сопряженное уравнение Дгу = с разрешимо при
любом с.
Если уравнение Ах = b ие разрешимо при любом Ь,
то оно имеет решение для тех и только для тех векторов Ь,
которые удовлетворяют равенству ^Ь, у*^> — 0, где у* —
любое решение однородного сопряженного уравнения, или,
другими словами, решение существует только для векто-
ров Ь, ортогональных всем решениям однородного сопря-
женного уравнения. 0
Для доказательства теоремы, которое предлагается
провести читателю, достаточно воспользоваться резуль-
татами § 4, сформулировав их на языке линейных опе-
раторов.
Матрица Грама. Пусть в евклидовом пространстве,
конечномерном или бесконечномерном, задана система
векторов <flf fn>. Матрица, составленная из по-
парных скалярных произведений этих векторов,которая
имеет вид
“<fi, fi> <fi, . <Ь. fn> “
Г= <f2, fl> <f2, f2> <f-2, f„>
называется матрицей Грама этой системы векторов. Оп-
ределитель этой матрицы называется определителем
Грама. Б силу коммутативности скалярного умножения
матрица Грама удовлетворяет условию Г = Г' и, сле-
довательно, является всегда симметрической матрицей.
Если f2,. . ., — базис пространства Еп, то
скалярное произведение двух векторов хну, имеющих
в этом базисе координатные столбцы х' — f^,..., я:п], у' —
= (Ун- • УпЪ можно записать в виде
я п
<х, у> = 2
i=l 2—1
Пользуясь свойствами 2, 3 скалярного произведения,
§ В] ЕВКЛИДОВЫ ПРОСТРАНСТВА. 97
получим
11
\Х, J = X Гу.
i, j=l
Если базис {f} ортонормирован, то Г = Е и <х, у> =
= х'у. Пусть в пространстве Еп заданы два базиса {е}
и {О> связанных между собой матрицей перехода Р. Рас-
смотрим элемент матрицы Грама базиса {f}
П П* 71
" \ 2 & 2 &ilei^ = 2 е/У
А=1 J=1 к, I
Совокупность этих равенств при всех i, j' ~ 1, 2,. . ., п
равносильна матричному равенству
Гу = РТеР.
Пусть базис {е} ортонормирован. Тогда Ге = Е и
Г/ = Р'Р. Применяя теорему о детерминанте произведе-
ния матриц, получим
det — del Р' det Р -• (det Р)2 0.
Поскольку базис {f} произволен, то доказано
Предл о ж е н и е 4. Детерминант матрицы Гра-
ма любого базиса строго положителен. Q
Это утверждение может быть усилено следующим об-
разом.
Теорема 7. Пусть ха, х2,- . хк — произвольные
векторы в евклидовом пространстве. Тогда детерминант
матрицы Грама этих векторов положителен, если век-
торы линейно независимы, и равен нулю, если они линейно
зависимы. Отрицательным определитель Грама никогда
не бывает.
Доказательство. Первое утверждение сразу
следует из предложения 4, так как, если векторы хх, х2,...
. . ., хк линейно независимы, то их можно рассматривать
как базис в своей линейной оболочке (другими словами,
в подпространстве, натянутом на векторы xt,. . ., х&).
Если же векторы хг, х2). . х^ линейно зависимы, то
выполнено равенство а;Х; 4- . . . а^хй = 0,
и не все ct; (i = 1, 2,. . ., к) суть нули. Умножая это ра-
венство скалярно на каждый из векторов ха, х3,. . х&,
4 Ю. Н. Андреев
98
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
мы придем к системе лииейиых уравнений
ai <Xi, хг> 4" • • • 4 = О’
<Х1 <Х^, Х1)> -р . . . 4" ай \ХЬ Х4 — О?
которой удовлетворяют коэффициенты о^, а2,. . afr.
Так как эта система имеет нетривиальное решение, де-
терминант ее матрицы должен равняться нулю. 0
Заметим, что неравенство Коши —Вуняковского яв-
ляется простым следствием этой теоремы при к = 2.
Квадратичные формы. Пусть в «-мерном линейном
пространстве Rn каждому элементу поставлено в соот-
ветствие число к (х). Тогда говорят, что в линейном про-
странстве определена функция
fc(x): ГГ-R1.
Определ ение. Пусть в вещественном я-мериом
пространстве, быть может евклидовом, определена веще-
ственная функция к (х), которая в некотором базисе е17
ва,. . еп записывается однородным многочленом второго
порядка относительно координат вектора х по базису {е}:
к (х) ’ + 2а12л1л2 4 2ai3$i%3 4 • • •
• • • 4 2а1пЯ]Яп 4" ... 4 ^nn^ni
где ац — фиксированные вещественные числа. Приведен-
ный многочлен второго порядка можно компактно записать
с помощью симметрической матрицы А, составленной из
его коэффициентов [яг>]пхп> в виде
&(х) = х'Лх = (х, 4х).
Такую функцию к(х) называют квадратичной формой,
заданной на элементах линейного пространства R, а мат-
рицу в определении квадратичной формы — матрицей
квадратичной формы.
Говорят, что квадратичная форма к (х) положительно
определена в пространстве Rn, если для любого ненуле-
вого вектора x G R’1 имеет место неравенство
к (х) = х'Лх )> О*
§ 8]
ЕВКЛИДОВЫ ПРОСТРАНСТВА
99
Если для любого х GE Rfl выполняется неравенство
к (х) = х'4х> О,
то такая форма называется неотрицательно определенной,
или положительно полуопределенной. Аналогично опре-
деляют отрицательно определенную и неположительно
определенную квадратичные формы. 0
Поскольку квадратичная форма полностью опреде-
ляется заданием матрицы А, то говорят также о положи-
тельно определенной матрице А, неотрицательно опре-
деленной матрице н т. д.
Приведем без доказательства критерий положитель-
ной определенности квадратичных форм.
Теорема 8 (критерий Сильвестра). Для того что-
бы квадратичная форма х'Ах была положительно опреде-
лена, необходимо и достаточно, чтобы все главные миноры
матрицы А были положительны, т. е. чтобы выполнялись
неравенства
О,
«П ‘ • Л1п
• • Ап =
о. о
1 ап1' ' ' апп
Для оценок значений квадратичной формы часто поль-
зуются следующим результатом.
Теорема 9. Если А — вещественная симметри-
ческая матрица, а V (А) и Х+ (А) — ее минимальное и
максимальное собственные значения соответственно, то
для всех х G RTI имеет место неравенство
(А) х'х = (A) fl х j|2 х'Ах V (A) fl х [|а = V (А) х'х
и существуют значения х такие, что равенства слева и
справа достигаются.
Доказательство. Рассмотрим задачу поиска
экстремума функции / (х) ~ х'Ах (х' х)-1 для х =£0,
Необходимое условие экстремума состоит в равенстве
нулю частных производных по компонентам вектора х.
Дифференцирование / (х) дает
Ах — р (х) х = 0, р (х) = х'Ах (х'х) х.
4*
100
ЛИНЕЙНАЯ АЛГЕБРА
[ГЛ. I
Так как р, — скаляр, то необходимое условие может быть
выполнено лишь в том случае, когда р является собствен-
ным значением матрицы А, а х — соответствующим этому
собственному значению собственным вектором. Поскольку
А — симметрическая матрица, то все ее собственные зна-
чения вещественны и среди них найдутся максимальное
А+ (Л) и минимальное А- (Л) собственные значения. Поль-
зуясь определением р, мы видим, что равенства в условии
теоремы выполняются. 0
Задачи. 1. Покажите, что если А — треугольная матрица, то
обратная матрица Л"1 — тоже треугольная и иа ее диагонали стоят
величины, обратные собственным числам матрицы А.
2. Докажите, что если А — положительно определенная мат-
рица, то выражение х'Лу, где х, у — два любых вектора в Rn, удов-
летворяет всем аксиомам скалярного произведения.
3. Если А и В — квадратные матрицы, то неравенство А ~^> В
понимают обычно в том смысле, что матрица А - - В положительно
определена. Пусть А и В — положительно определенные симметри-
ческие матрицы. Покажите, что А — В > 0 тогда и только тогда,
когда В"1 - А~2 > 0.
4. Постройте пример, показывающий, что если А — В > О (Л
и В — положительно определенные симметрические матрицы), то
не обязательно Л2 —- В2 >> 0.
5, Проверьте равенство
, . ч , [0 х'1
х А ’х = — det I 1.
[х А]
6. Пусть А н В — симметрические положительно определен-
ные матрицы. Покажите, что если Ап Аа, . . ., А^ — собственные
числа матрицы А, записанные в убывающем порядке, и 02, . . ,
...,6П — собственные числа матрицы А -р- В, 02 0П,
то pi — Ai 0 при всех [=1,2........л.
7. Пусть А — неотрицательно определенная матрица. Покажи-
те, что х'Лх равно нулю тогда и только тогда, когда Лх = 0. (Ука-
зание. Рассмотрите (х -j- Ау)гЛ (х Ц- Ау) для — со < А <
<Г -f- сю, у'Лу — 0 и Ау ф 0.)
8. Докажите, что уравнение Лх = Ь, где Л — матрица (п X
X гп), разрешимо при любой правой части тогда и только тогда,
когда уравиение А'х — 0 имеет лишь тривиальное решение.
ГЛАВА II
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ
Материал этой главы является той основой, на которой
построено изложение теории линейных динамических си-
стем, Нас будет интересовать главным образом структура
решений и в значительно меньшей степени техника интег-
рирования конкретных уравнений. В связи с этим основ-
ной темой будет исследование свойств переходно!! матрицы
системы линейных дифференциальных уравнений.
§ 9. Однородная система. Существование
и единственность решения
Рассмотрим однородную систему уравнений
х (Z) = A (Z) х (t). (ЛО)
Здесь A (/) — матрица п X га, составленная из непрерыв-
ных функций. На два основных вопроса требуется полу-
чить ответ в первую очередь: 1) существует ли решение
этого уравнения, проходящее через заданную точку х0
в момент времени £0?, 2) если такое решение существует,
то является ли оно единственным? Ответы на оба вопроса
положительны.
Поскольку вопрос существования связан с конструк-
тивным построением решения, которое (построение) нель-
зя реализовать, вообще говоря, с помощью элементарных
функций, мы начнем со второго, более простого вопроса.
Единственность решения. Итак, предположим, что
решение уравнения (ЛО) существует. Тогда справедлива
следующая
Теорема 1 (о единственности решения). Если
A (t) — матрица п X п, элементы которой непрерывные
102 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ, II
функции времени, определенные на интервале £0
0 £ < 4, то имеется единственное решение системы (ЛО),
которое определено на интервале t £х и прини-
мает значение х0 при t = f0.
Доказательство. Предположим противное.
Пусть хг и х.2 — два различных решения уравнения
х (0 = Л (0 х (0 и Х1 (?0) = х.3 (f0) =Хо. Пусть ж (0 =
= хх (0 - х2 (0, тогда z (0 — A (0 z (0 и z (z0) = 0.
Учитывая скалярное неравенство
гё + г.1 + ... + Д) = A [х'г] = 2г' («)Л (() =
-2 2 (0 аа (0 zi (0
2=1
П П
<231! zi (*) !l2 ю*х I МО1 II ч (0 К
г=1 J—1
< llz (OIIa 2raa max 1^(01
ij
и обозначив через 1] (0 коэффициент при] z (г) [J2 в послед-
нем выражении, можем записать
(II г (OF)-Л Wk WII2 <0.
Если это неравенство умножить на положительный коэф-
фициент
р (0 = exp J ц (о) da],
to
то результат можно выразить так:
4 [р(0|г(0|я1 <0.
Интегрируя, получаем для всех t0 t tt неравенство
р (0 h (0 F - р (*о) II z (М f < о,
или, так как z (Zo) 0, р (г) |[ z (г) )|3^ 0. Поскольку коэф-
фициент р (0 положителен, то, значит, z (г) = 0. Отсюда
Х1 (t) = Ха (0 для всех Zo t Zr 0
Конечномерность пространства решений. Рассмотрим
теперь свойства множества решений линейного диффе-
§ 91
ОДНОРОДНАЯ СИСТЕМА
103
ренциального уравнения х (0 — A (0 х (0. Сначала
заметим, что если функции хх (0 и х2 (0 являются реше-
ниями этого дифференциального уравнения, то их ли-
нейная комбинация тоже является решением. Действи-
тельно, если хх (0 = A (0 Xi (0 и х3 (0 = A (0 х2 (0,
то «1Х! (I) + сс2ха (t) = atA (t) xT(l) + а2^(£)хг (0 =
= A (0 (a1x1 (0 + a2x2 (0), и функция z (0 = ад (0 4-
4- сс2х2 (0 является решением. Это справедливо, конечно,
и для линейных комбинаций п решений хх(0,. . . ,хп (0.
Таким образом, для возможных решений уравнения х (0 =
= А (0 х (0 выполнены аксиомы линейного простран-
ства. Это пространство напоминает нам пространство
Ст' [0, 0], составленное из «-мерных вектор-функций, не-
прерывных при 0 <0 t 0. Вообще говоря, пространство
С” ItQ, 0] является бесконечномерным. Множество реше-
ний линейного уравнения х (0 = А (0 х (0 оказывается
конечномерным (именно «-мерным) линейным простран-
ством. Этот факт следует из доказанной выше единствен-
ности решения дифференциального уравнения. Согласно до-
казанной теореме каждому вектору начальных условий
соответствует одно и только одно решение дифференциаль-
ного уравнения, и тем самым устанавливается взаимно-
однозначное соответствие между пространством R1' и
множеством решений уравнения (ЛО).
Теорема 2. Множество всех решений уравнения
(ЛО) образует «-мерное векторное пространство над по-
лем вещественных чисел.
Доказательство. Аксиомы линейного про-
странства легко проверяются непосредственно. Остано-
вимся на доказательстве конечномерности пространства
решений. Попутно получим способ построения базиса
в этом пространстве.
Пусть еп еа,. , ,, — базис в R и пусть вектор xt- (0
является решением (ЛО) при начальном условии xf (0) =
~ ez (г = 1, 2,. . ., «). Покажем, что набор решений х; (0
является базисом пространства решений. Действительно,
векторы Xj (0 линейно независимы, так как в противном
случае нашлись бы числа ах, а2,. . ., ап, не все являю-
щиеся нулями и такие, что аххх(0 4- . . . 0- апх„(0 = 0
при всех 0 0, в частности, при t = 0 имело бы
место равенство
«1X1. (0) + . -. -ф- а„хп (0) = ахех 0- ... -j- апеп = 0,
104 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
которое противоречит линейной независимости векторов
(ej.
Пусть теперь х (Z) — решение уравнения (ПО)
и пусть х (Iq) = е, где е — какой-либо ненулевой
вектор в Rn. Так как {ер. . — базис, то е — ~
+ . . . + апет1 и аг — не все нули. Но тогда oqxj (г) —
4- ... 4- (£) является решением уравнения (ЛО)
с начальным условием е. Так как решение при фиксиро-
ванном начальном условии единственно, то х (г) •=
= apq (i) 4- ... 4- anxn (г) и система функций (xz (£)}
(i = 1,2,. . ., п) действительно является базисом в про-
странстве решений. Q
Фундаментальная матрица. Пользуясь доказанным
свойством множества решений уравнения (ЛО), введем
следующее важное.
Определение 1. Матрица X (Z) размеров (я Хи)
называется фундаментальной матрицей системы х (Z) =
-Л (t) х (£) тогда и только тогда, когда в ее столбцах
стоят п линейно независимых решений этой системы. Q
Определитель любой фундаментальной матрицы назы-
вают определителем Вронского. Согласно теореме 2 оп-
ределитель Вронского нс обращается в нуль ни в одной
точке интервала 0 t tr, и, следовательно, фунда-
ментальная матрица при любом значении t является не-
особенной матрицей. Поскольку каждый столбец этой
матрицы удовлетворяет дифференциальному уравнению
(ЛО), то, значит, сама матрица X (£) удовлетворяет диф-
ференциальному матричному уравнению
X (t) = A (I) X (0,
с начальным условием X (f0) = Хо, где Хо — неособен-
ная вещественная матрица. Справедливо и обратное ут-
верждение.
Если X (Z) удовлетворяет этому матричному урав-
нению и является неособенной матрицей при всех
^1, то все столб!<ы ее линейно независимы и, сле-
довательно, X (Z) — фундаментальная матрица. Таким
образом, доказано
Предложение 1. Матрица X (г) является фун-
даментальной матрицей уравнения х (£) = А (J) х (Z) тог-
да и только тогда, когда X (Z) удовлетворяет матричному
дифференциальному уравнению X (Z) = A (i) X (£) при
§ 0] ОДНОРОДНАЯ СИСТЕМА 1Q5
начальном условии X (£0) = Хо, где Хо — неособенная ве-
щественная матрица, &
Это свойство можно принять в качестве определения
фундаментальной матрицы.
Переходная матрица. Поскольку определитель фунда-
ментальной матрицы X (Z) не обращается в нуль ни в од-
ной точке, то при любом1фиксированпом^г0 существует
обратная матрица X"1 (i0)|n имеет смысл
Определение 2. Если X (г) — какая-либо
фундаментальная матрица уравнения (ЛО), то
Ф («, г0) = х (<).х-‘(«о)
для всех tQ называется переходной матрицей
уравнения (ЛО), или переходной матрицей, соответствую-
щей матрице A (I). О
Непосредственно из определения вытекают следующие
свойства переходной матрицы:
1- Ф (*», АО = х (г0) х-‘ (г0) = е.
2. | Ф (г, г0)| 0 ни при каких /0 t, (t.
3. Ф"1 (I, Zo) = Ф (t0, t). Действительно,
Ф^1 (г, м = [X (о х-1 (z0)Г1 = [X'1 (^о)]-1 [X (0]-i =
4 = X (^)X~i (Z) = Ф (i0) Z).
Заметим, что переходная матрица — это такая фунда-
ментальная матрица, которая удовлетворяет начальному
условию X (i0) = Е. Поэтому согласно предложению 1
переходную матрицу можно определить как решение мат-
ричного дифференциального уравнения
Ф («, Q = А (г) Ф (г, г0), Ф (г0, /0) = Е.
Рассмотрим один из способов построения перех одной мат-
рицы. Напомним, что обратную матрицу можно построить,
если решить п систем лилейных уравнений
Ач = blt Ач ~ Ъ2, ..Ач --- Ьп,
где bi = [1, 0,. . ., 0], Ь = [0, 1,. . ., 0],. . bn =
= [0, 0,. . ., 1], и составить из полученных столбцов ре-
шений z2,. . ., Zn матрицу [z1; za>. . .. zn] = Z (см.
§ 3). Тогда AZ = E и, значит, Z = A~‘. Точно таким же
способом можно построить переходную матрицу для
уравнения (ЛО). Предположим, что решение этого урав-
нения найдено для следующих начальных условий
106 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
в момент t0:
xi («о) = ИД- • 0], х2 (*о) = [0Л,- • •, 01” • Хп(*о) =
- [0,0,. . 1].
Обозначим полученные решения через Фг (Z, z0) и соста-
вим матрицу
Ф ^о) = [®1 (^, ^о)э Фа (^, А)),- • •’ Фп (£» ^о)Ь
Нетрудно видеть, что полученная матрица является пере-
ходной матрицей, так как в ее столбцах стоят линейно
независимые решения н Ф (t0, t0) — Е. Продолжим анало-
гию с линейным уравнением Ат> = Ь. Если А~* — об-
ратная матрица для А, то решение этого уравнения при
любом векторе b имеет вид z = л1-1Ь. Нетрудно убедиться,
что если х0 — произвольный вектор начальных условий,
то вектор ф(£, г0) х0 является решением уравнения х(1) =
— Л(£)х(£) и, значит, любое решение однородного уравне-
ния выражается через переходную матрицу. Поэтому, изу-
чая свойства переходной матрицы, мы тем самым изучим
структурные свойства решений линейного однородного
уравнения. В дальнейшем будет показано, что решение
неоднородного уравнения тоже можно легко получить,
зная переходную матрицу.
Теорема о существовании решения. Заметим, что су-
ществование решения уравнения (ЛО) эквивалентно су-
ществованию переходной матрицы. Решение этого урав-
нения не выражается, вообще говоря, в элементарных
функциях. Это относится, например, к такому простому
на первый взгляд уравнению
£ (t) у- (a -J- Ь sin t) х (t) = 0.
Поэтому, чтобы доказать существование решения (ЛО),
нам придется построить это решение с помощью некоторой
итерационной процедуры и доказать ее сходимость. При
этом нам потребуется доказывать сходимость последова-
тельности временных матричных функций. Напомним
необходимые понятия.
Определение 3. Последовательность скаляр-
ных функций времени хг (t), х2 (Z),. . . , определенных
прн t0 t называется сходящейся, если существует
функция х (г), определенная при t <£ такая, что
S 9]
ОДНОРОДНАЯ СИСТЕМА
107
при любом фиксированном t из указанного отрезка число-
вая последовательность (Z)} сходится к х (t). 0
Определение 4. Последовательность функций
0)} сходится равномерно при Zo t 0 tr, если суще-
ствует функция х (£) такая, что для любого е О най-
дется номер N (е) такой, что для всех i ;> N выполняется
неравенство
sup |тД/) — Ж(£) | < S.
Определение 5. Ряд скалярных функций вре-
мени, определенных на отрезке t является
сходящимся, если последовательность его частичных сумм
сходится. Этот ряд называется равномерно сходящимся,
если последовательность его частичных сумм сходится
равномерно. Ряд называется абсолютно сходящимся, если
он остается сходящимся в том случае, когда все его члены
заменяются абсолютными величинами. 0
Обозначим через Эц (М) ij-й элемент матрицы М.
Определение 6. Последовательность матриц
Мх, Мй, М3,. . ., элементы которых есть функции вре-
мени, сходится равномерно на отрезке г0 t 0 если
каждая скалярная последовательность (Afi), Эц
(Л72),. . Эц (Л/л). . . сходится равномерно. 0
Теорема 3(о существовании решения). Пусть
А (?) — квадратная матрица, элементы которой — не-
прерывные функции времени, заданные на отрезке 0
0 10. 0 Ряд, составленный из матриц М\:, к ~ 0, 1,
2,. . ., заданных рекурсивно равенствами
i
Мо = Е, = J А (6) Mk_t (б) de,
io
сходится равномерно на этом интервале. Если обозначить
сумму этого ряда Ф (t, i0), то для t0 0 t << tt
Ф («, {„) = А (Z) Ф (Z, /<,), Ф (Zo, Z„) = Е,
и решение уравнения^ (() = A (I) х (£), проходящее в мо-
мент t0 через точку х0, равно Ф (I, i0) х0.
Доказательство. Для того чтобы доказать,
ОС*
что матричный ряд 2 Л/*сходится, необходимо доказать,
fc=0
108 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
что сходится ряд 2 (М) при всех 1 <: I, ] п.
А’=1
Напомним, что ряд непрерывных скалярных функций
Ху (0 - И х2 (0 определенных на отрезке Zo t
4^ ty, сходится абсолютно и равномерно, если существует
последовательность положительных констант с( таких,
что для любого t0 t справедлива оценка |тг (Z)|
с;, а ряд сг сходится (критерий Вейсрштрасса из ана-
лиза). Обозначим максимум элементов А (г) через
т] (£) = max|^j(Z)|.
ij
Пусть далее у (f) определена как интеграл от Г| (Z):
t
7 (О = j т] (<5) tZ<5.
to
Если А и В — матрицы размеров га X га, то имеет место
очевидное неравенство
| (АВ) | га max | (4) | max | (В) |.
ij ij
Используя это неравенство, легко получим следующую
оценку для всех г и / для матрицы ЛД:
Эц А>)] —
- 3^ |J A (ох) J А (ог)... J A (ofc) d(5ft ... tb3 dot] =
== Эц Г I ( ... А (бу) A (6.,)... .4 (6].) ...d<32 dGy I <
r0 '/D J
f ’1 nh‘71 fe_ f-
j ra^H](c1)p(5s)...T](6?c)dc;/c...dcJ1 = ^l-^-.
to to to
Последнее равенство получено с помощью последователь-
ного применения легко проверяемой формулы
у'1'-1 (с) ц (б) de = .
to
S 9]
ОДНОРОДНАЯ СИСТЕМА
109
Таким образом, каждый член ряда
оо
2 «„)],
k’=0
при всех 1 I, / 0 п не больше соответствующего члена
ряда
1 + т (О + "21 Н----3j---г • • •
Однако этот ряд сходится, так как он может быть записан
в виде
. 1 . 1 Г f . , naY2 (£) , n3T3 (i) , 1
p + «T(o+-4rL+-4r2 +
= 1 - Л- + Ж exp („T (<)).
Поэтому каждый элемент Эц нашего матричного ряда тоже
сходится, и, следовательно, ряд матриц сходится рав-
номерно и абсолютно. Обозначим сумму этого ряда через
ф (t, г0) и вычислим производную по t:
^-ФС,
= А(«)Ф(«, у.
Поскольку как дифференцируемый (первоначальный) ряд,
так и ряд, получаемый почленным дифференцированием,
сходятся равномерно, то дифференцирование законно, и
мы видим, что Ф (i, t0) удовлетворяет матричному диффе-
ренциальному уравнению, приведенному в условии тео-
ремы. Остается только показать, что Ф (г, 0 х (t0) удов-
летворяет уравнению х (г) = A (Z) х (г). Ясно, что
Ф (£0, to) х0 ~ х0, поскольку Ф (Zo, t0) = Е. Таким обра-
зом, предполагаемое решение удовлетворяет нужным на-
чальным условиям. Дифференцирование по времени дает
[Ф((, /„) х„] = Ф(/, (0)х„ = Л(0Ф'((, (|)^
отсюда ясно, что Ф (Z, t0) х0, действительно, решение.0
НО ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Ряд Пеано для переходной матрицы. Формулу
Ф(Мо) =
t t at
= fo У 4 foi) foi fo J 4 (^i) J 4 (62) foi 4- ..(РП)
to fa
полученную при доказательстве теоремы 3, называют
рядом Пеано. Эту формулу можно получить формально
следующим образом. Пусть к (I) = A (t) х (t). Это урав-
нение равносильно интегральному уравнению
t
х (0 = х («о) + $ 4 (<5Г) х (61) d^.
to
Заменяя здесь х (о^) суммой
41
х (6i) = х (Q 4- j А (о2) х (б2) (Ь2,
tD
будем иметь
t t t
X (() = х (Zo) + J 4 (<5i) X (Zo) foi 4- J A (cSi) foi J A (<s8) x (s2) fo2.
to to to
Повторяя эту процедуру неограниченное число раз, по-
лучим формальное представление решения в виде ряда
Пеано.
Рассмотрим два простых следствия теоремы 3.
Следствие 1. Если А (0 — скаляр (матрица
размером 1 X 1), то ряд Пеано можно просуммировать и
t
Ф (0 tQ) = exp 4 (б) fo].
Следствие 2. Если А — постоянная матрица, то
Ф (t, to) = eA(t-ta)t
Доказательство. Так как постоянную А
можно вынести за знак интеграла, то ряд Пеано в этом
случае принимает вид
t t а,
Ф(0 £0) = Е + A J foi + 42^ fo2foi + . ..
§ 9]
ОДНОРОДНАЯ СИСТЕМА
111
После вычисления всех интегралов имеем
Ф (Л /0) - Е + A (t - /0) + A2 (t - t0)2/2! + . . .
. . . + (t - t0)n/nl + . . .
Этот ряд по определению обозначают через eA(J~te\ имея
в виду его аналогию с рядом экспоненты.
Пример. Рассмотрим уравнение простого осцилля-
тора £ (t) + х (t) = 0. Обозначая хг — х и х% =
получим уравнения движения системы в матричном виде,
Гал (01 _ Г О lj (01
[яа (oJ [— 1 OJ (01
Переходная матрица для этой системы удовлетворяет
уравнению
Фц(00) Фхз (00)1 Г 0 11ГФи(Мо) Ф1з(Мо)
Фа (00) Фзз(00)_ |_—1 oj[o3i(i,0) Фаз (О О)
при начальном условии Ф (£0, £0) = Е.
Ряд для вычисления Ф (/, f0) в этом примере легко сум-
мируется потому, что А — постоянная и, кроме того,
1-1 £
А1 = (—1) 3 4 Для i нечетных и Аг = (—1)2£ для
i 2 четных. Простое вычисление показывает, что
(Ъ it t X _ Г cos (* — м sin V ~
sin {t — to) cos (t — to)J
Задачи. 1. Найти переходную матрицу для
Г° *1 Г-1
А W=]_0 t J ’ л(0 = |_ 0 — 1] '
2. Пусть А — постоянная матрица. Найдите переходную мат-
рицу Ф*(£, 0) для нестационарной линейной системы
*(*) = /(«) Ax(t),
где / (t) — непрерывная функция времени.
3. Найдите переходную матрицу для системы
Г®1 (01 = Г— 2<Н I Гагг (01
[ia (0J“[ 3e-t — 2е "*] (01 ’
4. Пусть А — постоянная матрица размером 2 X 2 и пусть
х (0 = Ах (0- Известно, что если х'(0) = Н, —3], то х'(0 = 1₽~3(,
—Зе~3(], и если х'(0) = [1, 1], то х'(0 = Р(- ее] Определите пере-
ходную матрицу системы н матрицу А,
112 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
5. Пусть А — постоянная матрица 2 X 2 и пусть х (/) ~ Ax(S).
Известно, что если х'(0) = [1, 1], то x'(t) = (е~1 (2 sin t-J- cost),
e~l (cos t — 3 sin t)]. и если x'(0) = (1, —2J, то x'(t) ~ (cos t —
— sin I), —2 cos t(e~*)]. Определите переходную матрицу системы и
матрицу А.
6. Покажите, что несингулярная квадратная матрица Ф (. •),
зависящая от двух аргументов и дифференцируемая по каждому нз
них, является переходной матрицей, если Ф (t0, t0) = Е и матрица
-^рФ(/, to) | Ф (t, t0)
зависит только от t.
7. Является лн множество решений уравнения .f-(t) -j- х (f) =
= 1, О С t со, линейным векторным пространством?
§ 10, Свойства переходной матрицы. Формула Коши
Продолжим изучение свойств переходной матрицы.
Формула Остроградского — Лиувилля. Напомним сле-
дующее определение. Следом квадратной матрицы назы-
вается сумма ее диагональных элементов
TZ
Sp (Л) == след (Л) = tr(4) = 2 а”-
i=i
След матрицы Л (f) и определитель переходной матри-
цы связаны удивительной формулой.
Теорема 1. (Остроградского — Лиувилля). Если
Ф (t, Zo) — переходная матрица системы х (t) =
= Л (£) х (£), то
t
det Ф (t, f0) = exp ГJ tr Л (<5) dal , (ОЛ)
‘to J
Доказательство. Если обозначить через
алгебраическое дополнение /’/ со элемента матрицы Ф,
то по свойству 8 определителя (см, § 3) для любого / спра-
ведливо равенство
п
бе(Ф = 2
»--i
Так как Лг-у по определению от Фг-? не зависит, то
® (det®) - А„.
§ 10]
СВОЙСТВА ПЕРЕХОДНОЙ МАТРИЦЫ
113
Вычислим теперь полную производную по времени от
det Ф:
4- det Ф (t, t0) = 2 2 Г^7 det Ф (t, *„)! Фи (t, t0) =
j=i L й J
П п
= 22 4уф„(«, «о).
i-1 j =1
Обозначим через Ф* (t, t0) присоединенную матрицу
для матрицы Ф (t, tg). Напомним, что для построения при-
соединенной матрицы необходимо каждый элемент исход-
ной матрицы заменить его алгебраическим дополнением
и полученную матрицу транспонировать. Основное свой-
ство присоединенной матрицы выражается равенством
(см. § 3)
Ф* («, г0)-Ф (г, г0) = det Ф (г, q-e.
Воспользовавшись этим обозначением и замечая, что
2 2 л«фо, t0) = tr [Ф*(t, t0)<i>(t, Qi,
г-1 3=1
получим
del Ф (t, t0) — tr [Ф* (t, t0) Ф («, to)].
Вспоминая, что Ф (t, t0) = A (t) Ф (t, £0), tr (ABC) =
= tr (BCA), пмеем *
det Ф (t, £0) = tr [Ф* (/, tg) A (t)<& (t, f0)] =
= 1г[Ф'(М0)Ф(М0)Л(г)] = tr [det Ф(«, k) EA («)] =
= det®(£, tg) tr [ A (t)].
Интегрирование этого равенства с учетом условия
ф Q = Е дает формулу (ОЛ). О
Правило композиции. Важное свойство переходной
матрицы заключается в том, что она удовлетворяет сле-
дующему функциональному уравнению:
Ф (t, t„) = Ф (t, уф (У to). (ПК)
114 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Это уравнение называют правилом композиции для пере-
ходной матрицы. Воспользуемся для доказательства этого
правила определением переходной матрицы Ф (t, ?0) =
= X (?)Х~Т (?0). Непосредственная проверка дает
ф (I, 1„) = х (ОХ-1 ((„) = х (ОХ-1 (УХ (О)Х-1 ((„) =
= Ф (!, у Ф («„ «.).
Диаграммы, которые иллюстрируют альтернативные
линейные преобразования, называются коммутативными
диаграммами. Для правила композиции такая диаграм-
ма приведена на рнс. 10.1. Она свидетельствует о том,
что из состояния х0 можно перейти в состояние либо
с помощью линейного преобразования Ф (t, ?0), либо
последовательно применяя два линейных преобразования:
сначала Ф (?lf ?0), переводящее х0 в некоторое промежу-
точное состояние xj , и далее преобразование Ф (?, ?4,
переводящее х{ в требуемое состояние xv Мы и в даль-
нейшем будем пользоваться коммутативными диаграмма-
ми для иллюстрации формул подобного типа.
Преобразование координат. Если уравнение х (t) ~
= Л (?) х (?) имеет переходную матрицу Ф (?, ?0) и сде-
лана невырожденная замена переменной z (?) = Р (t) х (?),
| Р (?) | 0 при всех ?, то как преобразуется переходная
матрица?
Предположим, что Р (?) и Р'1 (?) существуют, и про"
ведем указанное преобразование переменных:
z (?) = Р (?) х (?) -J- Р (?)х (?) == [Р (?) А (?) 4 Р (?)]*(?) =
= IP (?) Л (0Р-1 (?) 4 Р (?) Р-1 (?)1 z (?).
S io]
СВОЙСТВА ПЕРЕХОДНОЙ МАТРИЦЫ
115
Кроме того,
х (0 = Фа (*, tQ) х0 = Р~* (?) z (?) = Р' (?) =
~ & 1 (^) Ф[РАР~1+РР-^^>(^°) Х°’
Нами доказана
Теорема 2. Если Р (?) дифференцируема и сущест-
вует р-1 (?), то
Фа (t, Q = Р-1 (?) Ф^р^рр-ч (Л М Р (М- О
Как и в предыдущем случае, этот результат удобно
представить в виде коммутативной диаграммы, приведен-
ной на рис. 10.2.
Р&)
Ф(РАР’У+РР^]1?’^
Рис. 10.2.
Неоднородное уравнение. Рассмотрим теперь решение
неоднородного уравнения
х (?) - А (?) х (?) + f(?). (ЛН)
Снова полезно провести аналогию с линейными алгебраи-
ческими уравнениями. Вспомним, что общее решение
уравнения Лх = b состоит из двух частей: частного реше-
ния этого уравнения и элемента х, принадлежащего ядру
матрицы Л, т. е. удовлетворяющего однородному урав-
нению Лх = 0. Другими словами, оно является суммой
частного решения х2 и решения однородного уравнения
х2. Перепишем уравнение (ЛН) в виде
[DE - A (OJ х (0 = f ((), D = А .
116 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Отличие от алгебраических уравнений состоит в необхо-
димости вводить начальные условия. Эти начальные усло-
вия жестко фиксируют решение однородного уравнения,
которое нам уже известно, х (t) = Ф (t, i0)x0. Остается
найти частное решение неоднородного уравнения. Если
Л — 0, то имеем
x(t) = f(O.
и, интегрируя, получим
it
х (Q — х (?0) J f (о) ds.
io
Преобразуем теперь уравнение (ЛН), введя замену пере-
менной z (£) = Ф (tQ, t)x (0, где Ф (i0, t) — переходная
матрица для Л. Это преобразование исключает зависимые
переменные справа и дает
z(t) = Ф-1 (t, Q f (0 = Ф (О, Of (О-
Отсюда сразу получим
t
Z (0 - Z (f0) \ Ф («0, о) f (о) ds
to
и далее
t
X (t) = ф (О 0) [х («о) + J Ф («о, 0) f (<5) =
'о
-- Ф (t, ta) Хо Н- J Ф (t, о) f (о) ds,
to
Полученное равенство называют формулой Коши или
формулой вариации постоянных. Проделанные вычисления
позволяют сформулировать следующее утверждение.
Теорема 3 (формула Коши). Если Ф (t, t0) — пере-
ходная матрица для х (i) = Л (£) х (£), то единственное
решение уравнения (ЛН) при начальном условии х (t0) =
= х0 дается формулой
t
х (i) = Ф (f, ta) х0 ф J Ф (?, о) f (о) do. (ФК)
to
§ 10] СВОЙСТВА ПЕРЕХОДНОЙ МАТРИЦЫ Ц7
В стационарном случае Ф (t, t0) — еА(-^ и эта форму-
ла имеет вид
t
х (?) = e4(f^x0 -|- (a) do. 0
(в
Заметим, что единственность решения (ФК) доказывается
немедленно. Если х (?) и у (?) — два решения, удовлет-
воряющие одним и тем же начальным условиям, то
X (0 — У (О = (?) [х (?) — у (?)]; X (?0) — у (?0) = 0.
А мы доказывали уже (теорема 1 § 9), что в этом случае
X (?) — у (?) = 0 и, значит, х (?) = у (?). *
Пример 1. Рассмотрим неоднородное дифферен-
циальное уравнение
х = / (?), х (0) = Жо, х (0) = л?0,
которое можно представить в виде системы двух уравне-
ний
'и p)j _ ’0 1’ Гжч (?)1 . ГО
>2(?)J [0 (oj 11.
Вычисление переходной матрицы немедленно дает
Ф((,о) = = [j
Используя формулу Коши, получим общее решение си-
стемы
к((:0Г(О’г(оГ,О)]+5к
или
t
х (?) = х (0) 4- tx (0) -г ? (? — о) / (б) do. 0
о
Сопряженное уравнение. При исследовании линейных
преобразований в евклидовых пространствах мы опреде-
лили сопряженное преобразование, связанное с данным
преобразованием как преобразование, которое обеспе-
чивает равенство скалярных произведений (у, L (х)>
и (х, L* (у)) (см. § 8). Определение сопряженного
уравнения для линейного дифференциального уравнения
/ (0-
118 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
основано на тех же соображениях. Пусть линейное од-
нородное дифференциальное уравнение определено в ев-
клидовом пространстве. Линейное однородное дифферен-
циальное уравнение для вектора р (t), принадлежащего
тому же евклидову пространству, является уравнением,
сопряженным уравнению для х (0, если при любых на-
чальных значениях скалярное произведение решения х (t)
и решения р (0 постоянно.
Теорема 4. Сопряженное уравнение, соответству-
ющее уравнению х (0 = Л (0 х (0, имеет вид
Р(0 —А' (0 р (0.
Доказательство. Вектор р (0 является со-
пряженным вектору х (0 тогда и только тогда, когда
(х, р> = (р, х> = const или р'х = const.
Дифференцируя скалярное произведение <р, х>, по-
лучим
[Р' (0 х (0J = Р' (0 х (0 + р' (0 х (0 =
= [р' (0 Л (0 х (0 — р' (0 Л (0 х (0] =
= р'(0 [Л (0 — Л (0] х(0 = 0. 0
Вариационные задачи, общая теория двухточечной
граничной задачи, существование и единственность пе-
риодических решений — исследование всех этих вопро-
сов связано с исследованием свойств сопряженных урав-
нений.
Основное свойство сопряженного уравнения заключа-
ется в том, что оно представляет решение исходного диф-
ференциального уравнения в обратном времени. Это по-
казывает следующая
Теорема 5. Если Ф (t, £0) — переходная матрица
для х (0 = Л (0 х (0, тогда Ф' (£0, 0 будет переходной
матрицей для сопряженной системы р(0 =—Л'(0р(0.
Доказательство. Продифференцируем ра-
венство Ф -1 (i, 0) Ф (0 0) = Е по времени:
= [4 ф-1 С’ ф (Мо) + ф’1 («, «о) 4- ф (Мо) =
=[4(°>А м]ф (f • *»)•
§ 10] СВОЙСТВА ПЕРЕХОДНОЙ МАТРИЦЫ Ц9
Поскольку матрица Ф (t, Q — неособенная, имеем
ИЛИ
4 {Ф-1 (Мо)}' = - мг.
Используя свойство переходной матрицы Ф-1 (t, tQ) =
= Ф С#о, t), получим
4 {ф («о, «»'=- а (о ф' (<о, о. о
Дифференциальное уравнение х Л (?) х (?) на-
зывается самосопряженным, если для всех t имеет место
равенство Л (?) = — A' (?). Такие системы очень важны
при изучении проблем механики. Гармонический осцил-
лятор — наиболее простой пример самосопряженного
уравнения
ап (01 _ Г 0 11 {^1 (01
ж2 (о] [—1 oj 1^2 (0J
Переходная матрица самосопряженной системы обладает
замечательным свойством. Она является ортогональной
матрицей.
Теорема 6. Если Ф - переходная матрица са-
мосопряженной системы, то Ф' (?, ?0) Ф (?, ?0) — Е для
всех t и tt.
Доказательство. Чтобы проверить ортого-
нальность Ф' (?, ?0) в случае, когда система х (?) =
= A (?) х (?) — самосопряженная, заметим, что посколь-
ку А (?) = — А' (?), то
4 [Ф' (t, М ф (t, („)] = Ф' ft, t„) [A' (t) + A (t)J Ф ((, t„) = 0.
Значит, Ф' (?, ?0) ф (?, t0) = const, но по определению
переходной матрицы Ф' (?0, ?0) = Е, следовательно,
Ф' (Ч, ?0) Ф (?0, ?0) = Е,
и требуемый результат получается сразу. 0
Стационарный случай, В случае, когда Л — постоян-
ная матрица, бесконечный ряд для переходной матрицы
120 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. И
принимает вид
Ф(М0)^ + Л(г-*0) + Л2(?-г0)2/2! 4- . . .=еА^.
Из следствия 2 теоремы существования следует, что этот
ряд абсолютно сходится для любой вещественной квадрат-
ной матрицы Л.
Заметим, что несмотря на внешнюю простоту выраже-
ния для переходной матрицы в стационарной системе,
вычисление функции еАг может оказаться сложной зада-
чей.
Рассмотрим ряд полезных свойств матричной экспо-
ненты.
1. Если А — диагональная матрица,
Л --
* ан.. .0 -
_ 6 •••‘W
то
о -
/пп
Это свойство очевидно следует из определения еА.
2. Если Р — какая-то неособенная квадратная мат-
рица, то
еР“‘АР = р~1еАР'
Действительно, по определению имеем
еР~‘АР = Е + p-iAp ц_ [р-МРр/2! -р . . . = Р~1[Е +
+ А + А2/2! 4- . . . ]Р.
3. Справедливо правило
Тем не менее, вообще говоря, неверно, что еАеБ =-- еА+Б,
Это равенство выполняется лишь в том случае, если мат-
рицы А и В перестановочны, т. е. АВ = В А.
4. eA,t --
Это сразу следует из доказанных в § 2 формул
(4 -г В)' = (А' + В'У (Л')п = (Л'У-
5. Дифференцирование матричной экспоненты по вре-
мени осуществляется по обычному правилу дифференци-
рования экспоненты
4(ел1)=^(£+^+^+...) =
= 4 + АЧ 4- 4- ... = AeAt = eAiA.
СВОЙСТВА ПЕРЕХОДНОЙ МАТРИЦЫ
121
§ ЮЗ
Последнее равенство справедливо в силу того, что квадрат-
ная матрица коммутирует с любым своим многочленом.
Перечень свойств переходной матрицы. Здесь будет
приведена сводка всех доказанных свойств переходной
матрицы. О значении этого понятия в различных вопро-
сах теории линейных систем свидетельствует число тер-
минов, используемых для обозначения матрицы Ф (t, tQ).
Вот некоторые из них: матрицант [13], нормированная
фундаментальная матрица [38], матрица Грина, матри-
ца Коши [19], нормированная интегральная матрица,
резольвентное ядро [25], фундаментальная матрица [27].
Замечание. Выше все элементы матрицы A (t)
уравнения х (t) = A (t) х (t) были заданы н непрерывны
в отрезке tQ t Часто, однако, приходится иметь
дело с областью определения в виде открытого интервала
< t <Z причем чаще всего этот интервал может быть
не ограничен с одной стороны или с обеих сторон. Если
интервал <z t <Z tY ограничен, то доказанные теоремы
будут верны для любого конечного отрезка 1й в t
К — в, где 8 - как угодно малое положительное число,
и значит, в этом смысле они будут справедливы для всего
интервала < t <Z К- В случае бесконечного интервала
— оо < t <Z -[- оо, теоремы § 10 справедливы для любого
конечного интервала — М <4 t Л/, как бы велико ни
было число М, и в этом смысле они будут справедливы
для всего интервала (—00,4-00). Все перечисляемые
ниже свойства переходной матрицы выполняются при
любых f0, t, принадлежащих области определения матри-
цы A (t). Q
Итак, для уравнения х (i) = A (t) х (t), х (t0) = х0
существует и единственна матрица Ф (i, f0) такая, что
решение можно записать в виде х (i) = Ф (/, <0) х0. Эта
матрица обладает следующими свойствами:
1. Ф (£0, t9) = Е при любом
2 Ф (t, t0) = Ф (t, 4) Ф (Ч, *о) ПРИ любых t, t9.
3. det Ф (f, tQ) =/= 0 при любых (t,
4. Ф (t, t0) = X (t)X~x (tQ), где X (t) — любая фунда-
ментальная матрица уравнения (ЛО).
5. Ф -‘(i, t0) = Ф (t0, t).
6. Матрица Ф (t, tQ) удовлетворяет уравнению
Ф (t, t0) = A (t) Ф (t, Q, Ф (t^ t0) = E.
122 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ II
7. Матрица Ф t) удовлетворяет сопряженному
уравнению
& (t«, t) = — А' (0 Ф' (t„, 0, Ф («<,, «„) = Е.
t
8. det Ф(£, = exp^ tr А (о) doj .
9. При преобразовании координат z (t) = Р (t) х (0
переходная матрица Фа (t, t9) системы х (t) = A (t) х (t)
преобразуется по формуле
Фа (i, Q = Р-1 (0 Ф[РАР^,рР_1] Р (*о).
Свойства Г-9 выполнены при любых t$. Не обязатель-
но, чтобы t0 <z Л
В стационарном случае имеют место свойства:
10. Ф (t -у- t0) = Ф (t, t0) Ф (tls ^о)-
11. Ф (t, ZG) = — eAi e~Ato.
Из последнего свойства, в частности, следует, что
в стационарном случае достаточно вычислить матрицу
Ф (£, t0) при значении t0 = 0, т. е. вычисить eAt. Чтобы
получить переходную матрицу Ф (t, £0)> достаточно за-
менить t разностью (t — t0). Стационарная система не
меняет своих свойств при сдвиге времени.
Способы построения переходной матрицы. 1. Если
каким-либо способом найдено общее решение дифферен- «
циального уравнения, то, чтобы получить переходную
матрицу, достаточно вычислить столбцы решений при
следующих начальных условиях: х° = [1, 0, . . ., 0],
X? = [0, 1, . . , 01, , . £ = [0, 0......11.
2. Переходную матрицу можно получить с помощью
моделирования уравнения х (0 == A (t) х (0 на электрон-
ной или другой модели. Это соответствует эксперимен-
тальному осуществлению способа 1. Действительно,
поставим на модели начальные условия: х® — 1, 23 =
=-0, . . Хп = 0. Тогда на выходах интеграторов мы
получим функции Фи(0, Ф31 (t), . . Фщ (0, которые
являются элементами первого столбца переходной матри-
цы. Продолжая эксперимент для начальных условий $ ==
= 0, х2 ~ 1, . . хп = 0, получим элементы второго
столбца переходной матрицы и т. д. Заметим, что метод
§ 10] СВОЙСТВА ПЕРЕХОДНОЙ МАТРИЦЫ 123
моделирования является общим. Он работает в тех слу-
чаях, когда другие методы не дают результата.
3. Переходную матрицу можно строить, суммируя
ряд, полученный при доказательстве теоремы 3 § 9. В ста-
ционарном случае этот метод часто приводит к требуемому
результату.
4. Переходную матрицу можно вычислять, интегри-
руя одно из матричных уравнений (свойства 6 и 7 переход-
ной матрицы). Этот метод удобен при вычислении переход-
ной матрицы на ЭВМ. Часто более удобным оказывается
интегрирование сопряженного уравнения (свойство 7)
в обратном времени. 0
При построении переходной матрицы следует исполь-
зовать хорошо развитые методы решения систем дифферен-
циальных уравнений. Известно, что в стационарном слу-
чае переходную матрицу можно построить в замкнутой
форме с помощью элементарных функций.
5. Для решения обыкновенных дифференциальных
уравнений широко используется аппарат преобразования
Лапласа. Этот аппарат можно непосредственно использо-
вать для вычисления переходной матрицы следующим
образом. Обозначим через X (х (£)) = х (р) преобразова-
ние Лапласа функции х (£). Тогда из теории этого преобра-
зования известно, что если х (t) дифференцируема, то
£(х(£)) = р^(х(£)) — х0 = рх(р) —х0, где хо = х(О).
Рассмотрим стационарную однородную систему
x(t) = Лх(0, х(0) = х0,
и ее преобразование Лапласа
рх(р) — х0 - Лх(р).
Тогда
рх (р) — Ах (р) = х0, или [р£ — Л]х(р) = х0.
Слева стоит характеристическая матрица матрицы А,
Которая является неособенной при всех р Хг, где X; —
характеристические числа матрицы А. Значит, выраже-
ние х (р) — [р7? — Л]’1 х0 имеет смысл при всех р %г.
Взяв обратное преобразование, найдем
х(«) = Ж-1 [х(р)] = ЗГ1 {[р£ — Лрхо} =
124 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Последовательность вычислений такова:
1. Вычислить элементы обратной матрицы [рЕ — А]-1.
2» С помощью таблиц обратного преобразования Лап-
ласа найти элементы переходной матрицы
eAi = Ж'1 ЦрЕ - ApV О
При м е р 2. Пусть
А =
Р
[рЕ-АГ1^
— з 1
р~ 2] ’
Пользуясь таблицей обратного преобразования Лапласа,
получим
г
2
3e-3t -р 5est
8
Пример 3. Для системы
переходную матрицу проще всего вычислить, воспользо-
вавшись формулой Ф (I, 0) = eAt. Ряд экспоненты в этом
случае имеет только два ненулевых члена eAt = Е + At;
так как Ар = 0 при р 2, имеем
:н: ;н; г
Пример 4. Пусть уравнения системы имеют вид
0 "
о
#SS _
"п (t)“
п (t)
(0_
«11
0
0
«22
0
'Ж1 (*)
Ж2 (t)
_Я78 (*)_
Столбцы переходной матрицы получим, решая эти урав-
нения при начальных условиях х01 = [1, 0, 0], х03 =
§ 10]
СВОЙСТВА ПЕРЕХОДНОЙ МАТРИЦЫ
125
= [0, 1, 0], х03 = [0, 0, 1]:
” eaut
О
о
о
О
Ф(£, 0) -
о
О
Пример 5. Рассмотрим
нестационарную систему
x(i) =
t
2
t2
х(£),
£>0.
Одна нз фундаментальных матриц
вид
этой
системы имеет
Вычислим
и переходную матрицу
1
to
1
I3
l0
4_
lo J
Ф(М0) = Х(0Х-1 (А>) =
1
f0
t
to
_ ts
I3 *
(2
'о -
£ (t) — (4j (0 Ц-
Задачи. 1. Покажите, что для системы i (0 — (4j(0 4-
Ц- 4а(0)х (0, где (0 — диагональная матрица, а элементы мат-
рицы А 2 (0 неотрицательны при всех t0, каждый элемент соот-
ветствующей переходной матрицы Ф 0, г0) неотрицателен.
2. Покажите, что если х (0 и z (0 — два решения дифферен-
циального ураввения предыдущей задачи и если Xi (i0) z< (f0)
нри всех г, то xi (0 zi (0 при всех г и при всех t t0.
[О 11
I ,
— 1 01
покажите, что
sin (t-f- t0) = cos t sin i0 -f- sin tcos #0.
4. Найдите переходную матрицу для
— г3
а) 4(0 =
Г 0 1
, />0, б) 4(0 = 1 а л
' ’ 12 - (3 2t
0
2
t
Г
О
_1
t
0
1
I -
126 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
5. Пусть отображение Cn [r0, Cn [f0, tj задано формулой
i
у (t) = J Ф (t, a) f (б) d<s,
t0
где Ф (t, а) — переходная матрица. Вычислите сопряженное преоб-
разование.
6. Покажите, что если A (t) = ~~ A'( — t) для всех г, то матрица
Ф (t, t0) и матрица Ф (t0, i) имеют одни и те же собственные числа.
7. Вычислите переходную матрицу системы
х («) = e~AtBeAlx (t),
где А и В — постоянные матрицы.
8. Пусть
п
у (г) = а'еА(Ь = s*n + Рк cos 2лМ).
fc=i
Найдите соответствующие векторы а, b и матрицу А.
9. Покажите, что
t
J eAad<3= A-1 [eAl — £],
о
где А — постоянная неособенная матрица.
10. Решение одномерного уравнении диффузии
dz (£, г)
at
52z (t, х)
№ '
0<ж<1; t>0
с граничными условиями z (#, 0) = z (t, 1) = 0 имеет вид z (t, х) =
ОО
= 2 уп (t) sin 2лпх. Выпишите бесконечномерную систему диффе-
ренциальных уравнений для функций уп (#). Найдите соответствую-
щую переходную матрицу.
И, Пусть граничные условия уравнения х (t) = А (#)х (t) за-
даны частично при t = t0 и частично при t = и пусть эти не пол-
ностью заданные векторы граничных условий х (t0), х (^) связаны
уравнением
Гх (t0) 4 Gx (tx) = g.
Каким условиям должны удовлетворять матрицы F и G, чтобы су-
ществовало единственное решение дифференциального уравнения?
Вычислите вектор начальных условий для этого решения.
12. Покажите, что в первом приближении по е
det [Е + еА («)] = Е 4- е tr A («),
Ф (# 4- е, t0) = Ф (t, t0) 4- еА (#)Ф (t, t0).
Используя эти факты, докажите теорему 1.
§ 11] СИСТЕМЫ С ПЕРИОДИЧЕСКИМИ КОЭФФИЦИЕНТАМИ 127
13. Согласно данному определению самосопряженного диффе-
ренциального уравнения, его матрица должна удовлетворять усло-
вию Л(£) = —Л'(0- Если Длл матрицы X(t) это условие не выпол-
няется, то оно, вообще говори, может быть выполнено для матрицы
Р-1Л (t)P, где | Р | =f= 0. Каким необходимым и достаточным усло-
виям должна удовлетворять матрица А (Z), чтобы
[р-1 x(i)p] = - [р-ида]'?
14. Найдите линейное нестационарное дифференциальное урав-
нение, переходная матрица которого имеет следующие элементы:
а) Фи ((, (») = 0,2 [4 (yj + (^)2] ,
Фп(Мо)=О,4Ц«в)*'г-^Г3],
Ф21 (t, *о) = 0,4 [(«о)7’ — ф"3],
Фг.(Мо)=О,2[(^),/! + 4(4)3'
if io
6) On(i, io) = — H -}- In y
t
Ф15 (t, io) = t In — ,
1 to
Ф21 (t, to)=-^-lnr,
t
Ф22 (t. to) = 1 4- In — ,
§ 11. Линейные системы
с периодическими коэффициентами
В приложениях линейные периодические уравнения
часто возникают при линеаризации нелинейных систем
в окрестности их периодических решений.
Периодические линейные уравнения являются про-
стейшим и довольно хорошо изученным классом неста-
ционарных уравнений.
Однако в отличие от стационарного случая даже здесь
получить явное решение не всегда возможно. Вместе
с тем: периодичность матрицы A (t) влечет за собой неко-
торые структурные свойства переходной матрицы, и на
этом мы остановимся подробнее.
Функцию /(f), определенную на всей числовой оси,
назовем периодической с периодом Т, если / (t 4~ Т) —
= / (0 для всех t. Согласно этому определению любая
постоянная величина (даже 0) является периодической
функцией. Ясно, что всякая функция периода Т является
периодической с периодом 2ТУ ЗТ и т. д. Поэтому период
определяется неоднозначно. Если мы в дальнейшем го-
ворим о периоде, то имеем в виду какой-нибудь период.
Рассмотрим периодическую однородную систему
X (0 = A (t) X (t), A (t + Т) ~ А (0. (ЛПО)
128 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ, II
Пусть Ф (t, tQ) — переходная матрица этой системы. За-
метим, что периодичность матрицы A (t) влечет за собой
периодичность переходной матрицы Ф (7 + Т, /0 + Т) =
= Ф (f, t0). Это, например, сразу следует из дифферен-
циального уравнения
Ф (t, t0) = А (О Ф (*, Ф (t0, Q - Е.
Преобразование Ляпунова. Приводимые системы.
Уравнение (ЛПО) принадлежит, как будет показано ниже,
к таким нестационарным уравнениям, которые можно
с помощью невырожденного линейного преобразования
z (£) = L (£)x (t) свести к стационарному уравнению
Этот класс нестационарных уравнений
очень важен для приложений. Например, исследование
устойчивости для таких систем иногда можно свести
к исследованию устойчивости стационарной системы.
Рассмотрим необходимые и достаточные условия приво-
димости системы х (£) = A (t) x(f) к стационарной системе.
Определение 1. Преобразование z (t) = L (t) x (t)
называется преобразованием Ляпунова, L (£) называется
матрицей Ляпунова, если выполнены следующие условия:
1. L (t) и L (t) ограничены на интервале [f0, со].
2. Существует постоянная величина т такая, что
О <т | det L (t) | для всех t ЕЕ сю]. О
Постоянная неособенная матрица L является, очевид-
но, матрицей Ляпунова. Если А — постоянная матрица
с вещественными характеристическими числами, то
и e~At будут, как легко видеть, матрицами Ляпунова.
Определение 2. Однородная линейная систе-
ма х (t) = A (t) х (i) называется приводимой, если с по-
мощью преобразования Ляпунова она может быть преоб-
разована в линейную систему z (t) = Bz (t), где В —
постоянная матрица. Q
Приведем необходимые н достаточные условия приво-
димости линейной нестационарной системы.
Теорема Еругина. Теорема 1. Линейная система
х (t) = А (£)х (t) приводима тогда и только тогда, когда ее
переходная матрица представима в виде
Ф (t, ?0) — L (t) exp [В (t — £0)] L'1 (t0),
где L (t) — матрица Ляпунова, В — постоянная матрица.
§ 11] СИСТЕМЫ С ПЕРИОДИЧЕСКИМИ КОЭФФИЦИЕНТАМИ 129
Необходимость. Пусть рассматриваемая си-
стема приводима и существует матрица Ляпунова L (t)
такая, что уравнение системы относительно новой пере-
менной z (?) = Л 1 (?) х (?) имеет вид z (?) — Въ (?). Пе-
реходная матрица этого уравнения ехр [В (? — ?0)],
и значит,
х (?) = L (?) z (?) = L (?) z (?о) =
= L (?)е«(^ (?0) х (?0).
Достаточность. Пусть переходная матрица
системы х (?) -== А (?) х (?) представима в виде, указанном
в условии теоремы. Непосредственной проверкой убедим-
ся, что преобразование координат z (?) = L~y (?) х (?),
где L-1 (?) = епа,а'' (?0) Ф (?0, ?), приводит к стацио-
нарной системе. Действительно,
z (?) = [Л"1 (?) L (?) 4- L-1 (?) A (t)L (?) Jz (?) -
= {[BL1 (?) - L-1 (?)Л (?)] L (?) +
4- L'1 (?) A (?) L (?)} z (?) = Bz (/).
Первую строку мы записали на основании результата
gW tg)
Рис. 11.1.
теоремы 2 § 10. Вторая получена после вычисления про-
изводной L-1 (?). При этом мы воспользовались формулами
А ев<!-'*> = Вев“-'">, Ф('«. О = -Ф(«о. 0 A(t). Q
a t
Теорема Еругина иллюстрируется коммутативной диа-
граммой, представленной на рис. 11.1.
Пример 1. Пусть х (?) = eAt Be~At х (?). Рассмот-
рим замену z (?) = е~А: х (?) (?) х (?). Тогда преоб-
5 Ю H Андреев
130 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [гл. II
разованная матрица системы А согласно теореме 3 § 10
примет вид
А = РАР1 + РР~1 = е-^е^Ве-^е^ — Ae~AteAt = В — А.
Значит, z (t) — (В — A) z (t) и z (t) = e(B-A>(*-Wz (t0).
Отсюда сразу получим искомую декомпозицию переходной
матрицы, о которой говорится в теореме Еругина:
х (7) = P(t)z(t) = eA/e(B-AKt“/»)z (^0) = eA£e(B_AH(*we-A(x (£0).
Теорема Ляпунова — Флоке. Вернемся к периоди-
ческой однородной системе (ЛПО). Приводимость такой
системы следует из доказанной теоремы. Достаточно
определить постоянную матрицу В формулой Ф (Г, 0) =
= ехр (ВТ). Такая матрица В всегда существует, так
как переходная матрица Ф (Г, 0) --- неособенная, а лю-
бая неособенная матрица С мо;кет быть представлена
в виде С — ехр В (см. [22]).
Определим матрицу Ляпунова формулой Л-1 (t) =
= Ф (t, 0) е-в£, тогда Ф (£, 0) = Л-1 (t) eBt, Ф (0, t^) =
= Ф-1 (£0, 0) = e~SttL (£0) и, наконец, Ф (t, ?0) =
= Ф (*, 0)Ф (0, t0) = L-1 (t) eW-^L (г0). Это и есть де-
композиция переходной матрицы, требуемая теоремой
Еругина.
Заметим, что матрица Л-1 (t) = Ф (tt 0) e~Bt является
периодической. Действительно,
L-1 (t 4- Г) = Ф (t 4- Г, 0) ехр [— В (t 4- Т)] =
= Ф (I + Г, Т) Ф (Т, 0) ехр (— ВТ) ехр (—Bt) =
= Ф (t + Г, Т) ехр (— ВТ) =
= Ф (?, 0) ехр (— Bt) = L~Y (t).
Переход от 1-й строки ко 2-й следует из формулы Ф (tt ?0) =
= Ф (t, а) Ф (а, ?0). 3-я строка следует из 2-й по оп-
ределению матрицы Ф. 4-я получается с использованием
факта периодичности переходной матрицы Ф (t Д-
т Г) = Ф (£, £0). Проделанные вычисления приводят
к следующему результату.
Теорема 2. (Ляпунова — Флоке). Линей-
ная, система (ЛПО) с непрерывной периодической матри-
цей A (t ц- Т) = A (t) приводима. Соответствующая мат-
рица Ляпунова L является периодической L (t) —
= £(*4- Л-О
§ 111 СИСТЕМЫ С ПЕРИОДИЧЕСКИМИ КОЭФФИЦИЕНТАМИ 131
Пример 2. Рассмотрим линейную периодическую
систему
Г 1 01
х(£) ~ , х (i).
v ! [sm t 1J v '
Легко видеть, что векторы Xj (£) = [ef, —е* cos d,
Xa (t) = [0, являются линейно независимыми решения-
ми и, следовательно, матрица
— фундаментальная матрица. Вычислим переходную мат-
рицу системы
Ф («,(„) = Х(0 X"1 ((„)
gt-t.
(costo — cost) ei-i“
0
Постоянная матрица В в условиях теоремы Еругина опре-
делится равенством
Г 1 °1
Ф(2л, 0) = еВз", откуда В = 1 J *
Г 1 01 Г 1 01
£-!(/) = ф(/, 0) e-Bf = . . . , L(f0)= t , J,
х \ > [1 — COS t 1 J ’ 4 [cos to — 1 1J
Z-1 (£) и L (t) — периодические функции. Декомпозиция
переходной матрицы, о которой говорит теорема Еругина,
имеет вид
Ф ((, (о)
1
1 — cos t
01 Г
1J 0
е( *• 1 — cos to
•0
0 1
0
1
Периодические решения однородной системы. Хотя
переходная матрица системы (ЛПО) является периоди-
ческой Ф (t + Г, tQ + Т) = Ф (Л £0), отсюда не следует,
что Ф (£ + Т, Q = Ф (t, (0), и, значит, решение х (г) =
= Ф (t, t9) х (i0) будет периодическим только в специаль-
ных случаях. Соответствующие условия дает
Теорема 3. Для того чтобы решение системы
(ЛПО) было периодическим с периодом Т, необходимо
и достаточно, чтобы вектор начальных условий принад-
лежал ядру преобразования \Е — Ф (£0 -г- Г, £0)]. Здесь
В — единичная матрица.
5*
132 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Доказательство. Если существует периоди-
ческое решение, то оно удовлетворяет условию
х (£fl + Т) = х (£0) = Ф (£0 4- Т, t0) х (t0),
которое выполняется при любом tQ. Это условие можно
переписать так:
[Е — Ф (£0 4” io)l Хо — 0.
Обратно, если х0 лежит в ядре указанного в условии
теоремы преобразования, то, выбирая этот вектор в ка-
честве начального условия, получим периодическое ре-
шение. Q
Следствие 1. Если ранг \Е — Ф (i0 + Г, «„)) =
~ н, то система (ЛПО) имеет только тривиальное пе-
риодическое решение х (t) = 0, так как в этом случае
ядро преобразования состоит только из нулевого вектора.
Следствие 2. Для того чтобы сопряженная си-
стема р (t) = — A' (t) р (Z) имела периодическое решение
периода Т, необходимо и достаточно^ чтобы вектор на-
чальных условий р (£&) лежал в ядре преобразования [Е -
— ф' (*0 -г Л *о)]-0
Доказательство аналогично доказательству теоремы 3.
Пример 3. Рассмотрим переходную матрицу ли-
нейного осциллятора & (/) + х (t) = 0:
(Т) (t t \ - Г cos (f — м sin (f — Ml
I’ °' [—sin(t—to) cos(t— to)J •
Оператор [E — Ф + 2л, £0)J является нулевым, и сле-
довательно, ядру этого оператора принадлежат все нену-
левые векторы начальных условий. Система при любых
начальных условиях имеет решение периода 2л.
Пример 4. Рассмотрим переходную матрицу пе-
риодической системы примера 2. Нетрудно видеть, что
ранг линейного преобразования [Е — Ф {t{) 4- 2л, ;0)1
равен 2, и следовательно, система имеет только тривиаль-
ное периодическое решение. 0
Периодические решения неоднородной системы. Бу-
дем рассматривать системы вида
х(£) = A (t) х (£) + f (0,
A (t + Т) = А (0, I(t + Г)в 1 (0- (ЛПН)
§ 11] СИСТЕМЫ С ПЕРИОДИЧЕСКИМИ КОЭФФИЦИЕНТАМИ 133
Как и в случае однородною уравнения, из периодич-
ности функций A (t), f (i) не следует периодичность ре-
шения. Его может ие существовать даже при A (Z) = 0.
Например, уравнение £ (t) = 1 + sin t, х (0) = 0 имеет
решение
х (t) — 1 -р t — cos t Ф х (t + 2л).
Займемся сначала вопросом существования периодичес-
ких решений (ЛПН). Основные результаты содержит
Теорема 4. Пусть Ф (t, i0) — переходная мат-
рица, соответствующая матрице А (0. Решение уравне-
ния (ЛПН) тогда и только тогда можно представить
в виде
х (Z) - хп (0 -4- Ф (i, t0) [Xq — Xi],
где xn (f) имеет период Т, a xt — постоянный вектор,
когда
to4-T
5 p'(6)f(<5)d<5 = 0 (1)
te
для каждого п-вектора р (о), который имеет период Т
и является решением сопряженного уравнения
Р (0 = - A' (t) р (0-
Доказательство. Равенство (1) называется
условием ортогональности.
Прежде чем доказать теорему, напомним известный
факт линейной алгебры. Линейное уравнение Лх = Ь,
где А квадратная матрица порядка п, имеет решение тог-
да и только тогда, когда всякое решение сопряженного
однородного уравнения А'х = 0 ортогонально вектору
b (см. § 8, теорема 2).
Решение уравнения (ЛПН) дает формула Коши, кото-
рую можно записать в виде
t
х (£) = Ф (/, £0) [х0 + J Ф з) f (б) do] .
ii>
Если существует периодическое решение, то выполнено
условие х (i) = х (i -г Т) при любых ;в1 и в частно-
сти, при t = t0. х (to) для этого решения обозначим через
хх. Тогда из формулы Коши следует, что хх удовлетворяет
134 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ II
уравнению
£о4-Г
хх = ф(£0 + Т, i0) [xj. + J Ф(£0,б)Т(б)(7б].
<0
Умножая это равенство слева на матрицу
Ф + Т) = Ф^1 (г0 4- г, ;0)}
получим эквивалентное уравнение
А.4-Т
[Ф(£о,£о -|-Г) —£]Х1 -= Ф(*о,з)Т(с)<Ь.
to
Вектор справа в этом уравнении обозначим через q. Сог-
ласно приведенной нами теореме линейной алгебры это
уравнение имеет решение тогда и только тогда, когда
вектор q ортогонален всем решениям однородной системы
[Ф (t0, tQ 4- Г) — -ЕТро = 0.
Но решениям этого уравнения соответствуют согласно
следствию 2 теоремы 3 периодические решения сопряжен-
ной системы. Другими словами, если р0 является решением
этого уравнения, то р (о) = Ф (£0, о) р0 имеет период Т.
Таким образом, необходимым и достаточным условием
существования частного периодического решения уравне-
ния (ЛПН) является условие
fo-J-T
РоЧ = Ро $ Ф (*о> з) f (б) Аз = 0,
*0
которое совпадает с условием ортогональности (1), так
как ,
pi Ф («о, о) = р' (о).
Таким образом, доказано, что условие ортогональности
необходимо и достаточно для того, чтобы существовал
вектор х, такой, что решение, проходящее через хх в мо-
мет tG, было бы периодйческим.
Если такое Xj существует, то обозначим соответству-
ющее периодическое решение через хп (£). Тогда
t
хп (i) — Ф (t, tQ) xt + J ф (£, б) f (б) d<s.
§ 11] СИСТЕМЫ С ПЕРИОДИЧЕСКИМИ КОЭФФИЦИЕНТАМИ 135
Воспользовавшись этим равенством, формулу Коши для
решения, проходящего в момент tQ через х„, можно запи-
сать в виде
х (0 = Ф (t, t«) х„ + [х„ У) - Ф {I, i„) X,] =
= Хп (0 + ф(«, to) [Х„ — X,].
Значит, если выполняется условие ортогональности, то
решение представимо в виде, требуемом условием теоре-
мы. Верно и обратное. Пусть решение можно записать
в виде суммы частного периодического решения и реше-
ния однородного уравнения. Тогда существует вектор
х&, именно ха = Xj, такой, что общее решение является
периодическим, и значит, выполняется условие ортого-
нальности. о
Имеется ряд специальных случаев, в которых данная
теорема имеет более простой вид и ее результаты легче
интерпретировать. Приведем два таких результата, кото-
рые сформулируем в виде следствий.
Следствие 1. Если однородное уравнение имеет
только тривиальное периодическое решение, то решение
(ЛПН), которое проходит через х0 при t — £0, может
быть единственным образом представлено в виде
х (0 = хп (0 + Ф (*, t9) Ixo — х1к
где хп (£) периодично и дается формулой
t
ХП (0 - Ф (С to) хх 4- j Ф (С б) f (б) do,
to
а
U-f-T
х1 = [Ф(«0,^4-Т)-Ег1 j O(^,6)f(6)d6.
to
Доказательство. Согласно следствию 1 тео-
ремы 3 однородное уравнение имеет тривиальное решение
тогда и только тогда, когда ранг матрицы [Ф (t0, to 4- Т) -
— равен п. В этом случае существует обратная матри-
ца [Ф (t0, to + Т) — -ST1, и уравнение
to-f-T
[Ф (to, tn 4~ 7) — Е] Х1 = § Ф (£q, б) f (о) da
to
136 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИИ [ГЛ. TI
имеет единственное решение
fo+T
Х1 = [Ф(*0, t0 -Ь Г) — А]"1 5 Ф(*о,б)1 (б)^б.
to
Отсюда сразу получаем требуемое утверждение. 0
Следствие 2. Если А — постоянная матрица
и у нее нет чисто мнимых собственных чисел, то решение
(ЛПН), которое проходит через х() при t = 0, можно
выразить единственным образом в виде
х(0 xn(Z)~ ехр(Л0[Хо — xn(O)J,
t
хл (0 — eAixt 4* j) eA(t~aA (б) da,
о
где
t
xi ~ (е~Л* — Е]~2 jj (a) da.
о
Доказательство в точности совпадает с доказатель-
ством следствия 1, если заметить, что в случае, когда
А не имеет чисто мнимых корней, оператор [е~А* — Е]
имеет полный ранг. 0
Пример 5. Рассмотрим гармонический осцилля-
тор с периодической возмущающей силой
км-: :к:з+[,;>] 'с+г.,.,,,.
Какие дополнительные ограничения нужно наложить на
/ (£), чтобы существовало периодическое решение?
Так как данная система является самосопряженной,
имеем
Гр1(<Н Г о iipum
L>3 P)J L~ 1 О] [pa (0j
Условие ортогональности принимает вид
2я
• Г Г coss sins'] Г О'], Г
P°J [— sins COSgJl/(6)J 6 ~~ [
§ 11] СИСТЕМЫ С ПЕРИОДИЧЕСКИМИ КОЭФФИЦИЕНТАМИ 137
а это в свою очередь требует, чтобы
\ /(о) cos б do = \ /(б) sin б (7б = 0.
fl о
Отсюда следует, что периодическое решение будет в том
случае, когда ряд Фурье функции / не имеет первой гар-
моники.
Задачи. 1. Покажите, что если L (0 — матрица Ляпунова, то
Д-1 (0 — тоже матрица Ляпунова,
2, Если L1 (0 и Ь2 (0 — матрицы Ляпунова, то L (0 =
• L2 (0 — тоже матрица Ляпунова.
3. Покажите, что z = ?Afx — преобразование Ляпунова, если
А = —А'.
4. Вычислите переходную матрицу (f, i0) для системы
Г — 1 +cos г 0 1
*(0 = „ . х(0,
(_ 0 —* -у- LOS t J
Так как система имеет период 2л, то Ф (t, to) можно записать в виде
Ф 0, ?0) = Z-00 еВ^ L (М.
Проведите эти вычисления.
5. Найдите преобразование Ляпунова, приводящее скалярное
уравнение
£ (0 = х (0 sin t
к стационарному виду.
6. Рассмотрите уравнение х (0 = 4х (0 b при b=const. При
каких условиях существует постоянное решение при подходя-
щих х0?
7. Выпишите декомпозицию Ляпунова для переходной матрицы
линейного осциллятора.
8. Определите, имеет ли каждая из следующих систем периоди-
ческое решение периода 2л, и если да, то единственны ли они?
138 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
9. Выпишите решение системы
ГО 11 Г 0 1
*(') = 9 Jx(0 + о J-
_—2 —2J LsintJ
проходящее при t — 0 через точку [1,1] — xq, и виде, требуемом
теоремой 4. Каким начальным условиям при t — 0 удовлетворяет
частное периодическое решение?
10. Каким необходимым и достаточным условиям должна удов-
летворять матрица А, чтобы ехр (40 была бы периодической?
11. Найдите любое решение уравнения С’—ехр К для следую-
щих матриц С:
а)
я2 0 1
.0 ₽3]’
Г cos i sin il
б) I
I— sin £ cos t
[ch t sh Л
sh t ch tj *
12. Покажите, что общее решение уравнения
i (0 ц (0 Ъ (0 4- у (0ж (0 = 0,
П (*+ П = Л (0, V (*+ Л = У (О
можно записать в виде
х (0 = apt (£)cXlf 4- 0Ра (0е>,я<’
где Лц — действительные, а (0 и (0 имеют период Т. пли
в виде
х (0 = apj (0₽Х£ 4- (0сХ£,
где Z — действительное, а щ (0 и р2 (0 имеют период Т.
13. Покажите, что уравнение х (0 4~ i (0 4” * (0 = sin nt—1:
а) не имеет периодических решений при п — 1;
б) имеет единственное периодическое решение периода 2л/п
для п — 2. 3, . .
в) имеет два параметрических семейства периодических реше-
111
НИИ кдля п —- — —
2 о 4
14. Для системы х (0 = Ах (0 4~ b sign (sin 0 проведите де-
композицию в соответствии с теоремой Еругина при соответствую-
щих предположениях относительно матрицы А.
15. Пусть А(0 имеет период f (0 — период Г2. Покажите,
что если все решения х (0 = А (0 х (0 стремятся к нулю при t
со, то существует вектор g периода Т2 и матрица Р (0 периода
Т\ такие, что общее решение уравнения х (0 = А (0 х (0 4 f (0
имеет виц
Х(0 = Ф(£, t0^ 4- Р (0g (0,
§ 121 ЛИНЕЙНЫЕ МАТРИЧНЫЕ УРАВНЕНИЯ 139
16. Обще? решение уравнения к (/) •=- Ах (Ц f (f), где А =
= const, If (t) ~ f (z 4~ 2Л)> имеет вид
[sin il [ch (t tu) sh (t — tn)!
+ , ' / 'hxo —Xll.
cost] [sh (t— tri) ch(t — г»)]
Найдите матрицу А п функцию f (t), если известно, что f (to) =
§ 12. Линейные матричные уравнения
В § 10 уже встречались матричные дифференциальные
уравнения. Например, переходная матрица была опреде-
лена как решение матричного дифференциального урав-
нения
Ф (Z, Zo) = A (Z) Ф (t, t0), Ф t0) = Е.
В данном разделе рассмотрим решения линейных матрич-
ных дифференциальных уравнений вида
X (£) (Z) X (Z) 4~ X (£) А2 (Z) “|" F (Z) (ЛМ)
и обсудим некоторые вопросы, связанные с приложениями
таких уравнений.
Матричная формула вариации постоянных. Сначала
заметим, что уравнение (ЛМ) можно записать в виде си-
стемы линейных дифференциальных уравнений. Если все
матрицы в (ЛМ) имеют размерность п х п, то размерность
вектора решений будет и2. Ясно, что все предыдущие
результаты, полученные для линейных дифференциаль-
ных уравнений вида х (Z) = A (Z) х (t) -j- f (Z), будут
справедливы н для уравнения (ЛМ), записанного в вектор-
ной форме. Поэтому, в частности, нет нужды доказывать
теоремы о существовании и единственности решения урав-
нения (ЛМ). Однако, поскольку в приложениях часто
приходится иметь дело с уравнениями, записанными
в виде (ЛМ), а эквивалентное векторное уравнение имеет
матрицу размером (и2 х п2), для дальнейшего будет удоб-
нее не приводить матричное дифференциальное уравнение
к обычной векторной записи, а получить решение в мат-
ричной форме.
Теорема 1 (матричная формула вариации постоян-
ных). Если Фг (Z, Zo) — переходная матрица для уравнения
х (Z) = (Z) х (Z), а Фа (Z, Zjj) — переходная матрица
140 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. It
для уравнения х (I) = А2 (t) х (£), то решение уравне-
ния (ЛМ) с начальным условием X (£0) дается формулой
t
х (() - Ф1 (t, i0) X (tQ) Фз (/, io) + j Ф1 (*, б) F (б) ф; (i, б) de.
Доказательство. Дифференцируя это выра-
жение по t и используя равенства фх (i, £0) - А1 (()•
•Ф1 (t, Q и Ф2 (t. Q = А[ (i) Фа (t, i0), получим
X (i) = ?li (i) Ф1 (i, t0)X (*0)Ф3 (t, io) -I™
t
•4- -^i (0 ^Ф1(Л з) F (б) Ф2(£, б) da -|“ ФД£, t(j)X(^о)Фз(^ Ао)^а(^) И"
fo
t
+ J Ф1 (t, 3) F (б) Ф; (t, 6) A (i) da + F (t).
fo
Поэтому X (i) удовлетворяет дифференциальному урав-
нению (ЛМ). Легко проверить, что начальные условия
тоже выполняются. Q
Сопряженное уравнение. Множество квадратных мат-
риц порядка п, как было показано в § 6, образует вектор-
ное пространство RnXn. Вводя в этом пространстве ска-
лярное произведение по формуле
п п
<ху> = 22 *иУа = *г(ГХ) = tr(XK),
<=1 ;=1
получают евклидово пространство, обозначаемое через
ЕпХп. р[0 аналогии с векторным линейным уравнением
назовем сопряженным такое матричное дифференциаль-
ное уравнение, решение которого Р (£) при любом t удов-
летворяет условию
<Х (О, Р (i)> = tr (Xf (i) P (i)) = const,
где X (i) — решение однородного уравнения
X (i) = Ai (i) X (i) + X (i) A2 (t)-
Пользуясь этим определением, имеем
о - 4 tr (X' (I) р (/)) = tr (X' (t) P (1) + X' (0 P (/)) =
= tr (X-(0 A[ (/) P(t) + АДо X' (Z) P (t) + X' (0 P (0).
§ 121
Линейные матричные уравнения
141
Последнее равенство справедливо в силу уравнения
X' (?) - х' (?) Аг (?) + л; (?) X' (?).
Вспоминая теперь, что tr (АВ) = tr (В А) и tr (Л + В) =
= tr Л + tr В, мы видим, что
О - tr {X' (t) [Р (t) + Л; (t) Р (?) + Р (?) Л2 (?)]}.
Поскольку это условие должно выполняться при любых
X (?), Р (t). имеем уравнение для Р (t):
p(ty - - л; (о р и - р (о а2 (<), (мс)
называемое сопряженным уравнением. Сформулируем ре-
зультат проделанных вычислений.
Теорема 2. Если определить скалярное произве-
дение матриц X (?) и Р (?) в виде (X (?), Р (?)> =
-• tr (Р‘ (?) X (?)), то уравнение (МС) будет сопряжен-
ным для однородного матричного уравнения
X (?) Лг (?) X (?) + X (?) Л2 (?). О
Как будет ясно из дальнейшего, уравнения вида (МС)
играют важную роль в теории управления лилейными
системами. Здесь рассмотрим одно из приложений этого
уравнения.
Оценка квадратичного функционала. Пусть для ка-
кого-либо решения х (?) системы х (?) = Л (?) х (?) тре-
буется оценить величину интеграла
h
J = J х' (?) И7 (?) х (?) dt,
to
где И7 (?) — некоторая матрица п X п, составленная из
непрерывных при ?о ^4 ? ^ ?i функций времени. Выра-
зим величину J через начальные условия х (?0). Посколь-
ку в силу уравнения движения х (?) = Ф (?, ?0) х (?0),
имеем
h
J = J х,(?о)Ф'(?,?о)И/(?)Ф(?, ?o)x(?o)d? - х'(?0)У (?о,?1)х(?о).
142 .Дийеййый ДпФферейцпалёные уравнения [гл. И
Здесь использовано обозначение
fi
v (to, ?i) = J Ф' (t, to) W (?) Ф (?, ?0) dt.
h
Таким образом, искомая величина J является квадра-
тичной формой от х (?0), а V (?0, ?х) — матрица этой ква-
дратичной формы. Если известна переходная матрица
Ф (t, ?0), то постоянную матрицу V (?0, можно вычис-
лить. воспользовавшись последней формулой. Есть, од-
нако, и другой способ вычисления V (?0, ?г). Можно свести
эту задачу к задаче интегрирования линейного матрично-
го уравнения. Заменяя ?0 на t и дифференцируя выраже-
ние для V (?, ?х) по ?, получим
fi
4F V = ЧГ $ ф/ (°’ W (°)ф (°’ 4/0 =
t
= — А' (?) V (?, ?i) — V (?, ?i) А (?) - W (?).
Из определения V (?, ?х) следует, что V (?1? ?х) -- 0.
Добавляя эти граничные условия к дифференциальному
уравнению, получим прямой способ вычисления J. За-
метим, что это -- дифференциальное уравнение с гранич-
ным условием, заданным яе в начальный момент времени
?0, а в момент окончания переходного процесса. Таким
образом, справедлива
Т е о р е м а 3. Если V (?, ?г) яв <яется решением урав-
нения
- А' (0 V(t, 0) - V (t, 0) A(t) -W (0,
V (?i, ?г) м 0,
a x (?) — решение системы x (?) — A (?) x (?) при
% ?i, ni0 справедлива формула
h
x' (?) IT (?) x (?) dt = x' (?0) V (/», ?x) x (?ft).0
f«
Обратите внимание, что дифференциальное уравнение
для рт (?, ?г) совпадает с уравнением (МС) при ТУ (?) = 0,
Л; - 4J
ЛИНЕЙНЫЕ МАТРИЧНЫЕ УРАВНЕНИЯ
143
§ 12]
Случай постоянных матриц А и W наиболее важен
на практике. При этом дифференциальное уравнение для
F (С становится стационарным:
= — A'V(t,ti} — V А — W, (1)
и его решение можно представит ь в явном виде в тех слу-
чаях, когда существует решение матричного линейного
уравнения
A'V -F VA + W = 0. (2)
Дейсюптельпо, обозначим решение этою уравнения через
V1 и введем в (1) замену переменной ЧГ — V — Vt. Легко
проверить, что уравнение для Т будет иметь вид
4 T (6 Ы = - А'Т ((, (J - Т (/,«,) А, V(1„ <,) - - V,.
Воспользовавшись формулой теоремы 1, немедленно по-
лучаем явное выражение для матрицы V (С 0). Именно,
v (*, ti) = Fi — exp [А' (0— t)]Vl exp Г4 (tL — 0].
Из этой формулы, в частности, следует, что если
ехр [Л (0— 01—<-()ирп0 —сю. то оценка интеграла У на
полубесконечном интервале (0, оо) сводится к решению
линейного матричного алгебраического уравнения A'V 4~
4* VA -г И’ 0 относительно матрицы V и подсчету
величины J ио формуле J — х' (0) Vx (0).
Замечание. Рассмотрим теперь задачу оценки
интеграла
н
Г = j р' (0 W (0 р (0 dty
где р (0 — решение сопряженного уравнения
р (0 =- - А' (0 р (о, р (0) - р0.
Воспользовавшись тем, ч то р (0 = Ф' (0, /) р0, запишем
иптеграл в виде
у* p0V (^о, р0 = J РоФ (f0, 0 W (0 Ф' (t0, 0 ро dt.
t0
144 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Заменяя £й на t и дифференцируя матрицу F (£, по-
лучим, как и ранее, дифференциальное уравнение
Г (С ix) ~ А (0 F (t, tj) -4- Г (I. i}) А' (f) — И' (t),
7(/„ «,) = 0. (3)
Обратите внимание, что это уравнение при W (I) = О
является сопряженным уравнением для уравнения тео-
ремы 3. Ойо будет играть в дальнейшем важную роль.
Особый интерес будут для нас представлять случаи, когда
уравнения (1) и (3) имеют положительно определенное
решение.
Матричное уравнение A'V 4- V А- — TF- Основные
свойства этого уравнения впервые были изучены А. М. Ля-
пуновым в связи с исследованием устойчивости движений
динамических систем. Подробная теория подобных урав-
нений приведена в книге Ф. Р. Гантмахера «Теория мат-
риц». Для наших целей будет достаточно следующего
простого результата.
Теорема 4. Для того чтобы матричное уравне-
ние
АХ + Х4' = - W (4)
имело единственное решение при любой вещественной мат-
рице IF, необходимо и достаточно, чтобы собственные
числа (г = 1, 2, . . п) матрицы А удовлетворяли
неравенствам, А,г 3- \? =/= О при всех 1 г, j <; п.
Доказательство. Согласно теореме 2 § 7 для
всякой матрицы А существует неособенная матрица Т,
вообще говоря, комплексная, такая, что матрица ТА Т~х =
--= В ииеет треугольную форму (все элементы матрицы В,
расположенные под главной диагональю, равны нулю,
а на главной диагонали стоят собственные значения мат-
рицы Л).
Умножим данное матричное уравнение слева на Т
и справа на Г' и проведем несложные преобразования:
Т (АХ 4- ХА') Г = ТАХТ' 4 ТХА'Т' =
= (ТАГ-1)(ГХГ) + ТХТ'Т"ГА'Г = — TWT'.
Замечая, что (Г"1) - (Г-1)', (FW) = (ТАГ”1)' =
= В\ и вводя обозначение Z ~ ТХТ\ придем к уравне-
нию
BZ + ZB’ -- - TWT',
§ 12} ЛИНЕЙНЫЕ МАТРИЧНЫЕ УРАВНЕНИЯ 145
где В — треугольная матрица. Эго уравнение, очевидно,
эквивалентно исходному. Рассматривая это уравнение
как систему линейных уравнений и выписывая п2 X п2-
матрицу этой системы (оставляем читателю эти вычисле-
ния в качестве простого упражнения на закрепление пра-
вила умножения матриц), замечаем, что эта матрица —
треугольная и на ее диагонали стоят числа 4- Xj),
1 г, /X л. Следовательно, определитель этой матрицы,
равный произведению диагональных элементов, обраща-
ется в нуль тогда и только тогда, когда выполнено ра-
венство Лг- — при каких-либо, может быть и рав-
ных, значениях 1 г, / п, Q
Замечание 1. Требования, предъявляемые тео-
ремой к собственным числам матрицы А, легко интерпре-
тировать геометрически. Ее собственные значения не
должны располагаться на комплексной плоскости сим-
метрично относительно начала координат и не должны
быть равны нулю. Поэтому если, например, все собствен-
ные числа располагаются строго слева от мнимой оси —
в этом случае матрица А называется устойчивой матри-
цей,— то уравнение АУ 4“ =- — И7 имеет единствен-
ное решение.
Замечание 2. Если матрица 1У — симметри-
ческая (PF — W'), то решение У уравнения АУ 4- VA' =
—- — ру тоже будет симметрической матрицей, поскольку
в этом случае
(АУ 4- VA')' = Г/Г + АУ' = AV' 4- V'A' = W
и уравнение для У совпадает с исходным уравнением. 0
Если матрица А устойчива, то единственное, в силу
замечания 1, решение уравнения A'V 4~ VA 4- W — О
удовлетворяет равенству теоремы 3
ео
х' (0) Ух (0) = f х' (t) Wx (/) dt,
о
в котором интеграл справа — сходящийся (почему?).
Вспоминая теперь, что в стационарном случае х (t) =
— еЛ( х (0) и =s= еА'*, имеем
ео
х' (0) Ух (0) = х' (0) (J eA,iW$Atdtj х (0).
о
Отсюда сразу следует
146 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. П
Теорема 5, Если матрица А устойчива, то един-
ственное решение уравнения A'V 4- VA =- — W можно
представить в виде сходящегося интеграла
V = J eA,t]¥eAidVQ
о
Пример. Оценим величину
do
= (i? (t) + Л (ty)dt для уравнения
о
л =[_“_*]. Л(0) = 1,
интеграла J ~
х (£) - Ах ((), где
^(0) = 2.
Собственные числа матрицы А отрицательны. Матрица V7,
соответствующая данному интегралу, совпадает с единич-
ной матрицей. Поэтому уравнение для V имеет следую-
щий вид:
О 111 ьц ыгЗ . Г»п
— 2 — 3J [V21 222 J L^21
Поскольку W' = И7, имеем
1
^2 2 ' ~2~J
1’13
&12 — V21 ~-------’ V11 ~
Обсуждение. Дифференциальные матричные уравнения
(1), (3) н алгебраическое матричное уравнение Ляпунова
0) играют важнейшую роль в дальнейшем. Напомним,
как они были получены в этом разделе. Рассматривалась
задача о вычислении значения функционала
а
J ~ J x'(f) W (£)x(£) dt
to
вдоль решения уравнения х (0 = A (t) х (?)• Оказалось,
что величина J может быть выражена через начальные
условия х (Q н некоторую матрицу V (?0, 4) 15 виде квад-
ратичной формы J = х' (£0) V (Zo, /г) х (^о), причем мат»
§ 12] Линейные Мчтуичные уравнения 147
рица V (t0, tj) является решением матричного дифферен-
циального уравнения (1) (теорема 3). Если заменить в ин-
теграле t9 на t, то в силу теоремы 3 или непосредственным
вычислением устанавливаем, что
4г = IMW Я)х((» =
Полная производная по времени от рассматриваемого
функционала равна —W (?). Если интервал времени,
в котором рассматривается движение системы, является
полубесконечным оо) н если матрица А удовлетворяет
условию exp А (I — t0) —> 0 при t —> оо, то решение наз-
ванной задачи сводится к решению линейного матричного
алгебраического уравнения (2). Нетрудно видеть, что
если матрица W (f) строго положительно определена при
всех t0 t нанрнмер W (£) = £, то j характери-
зует величину «среднеквадратичного» отклонения траек-
тории движения от нуля, так как в этом случае
и
J = J || х (£) Ц2 dt.
ц
Тогда на любом конечном интервале [t0, tj решение диф-
ференциального уравнения (1) для V (£0, существует
и является положительно определенной функцией, стро-
го монотонно убывающей по времени. Если же матрица
W (t) не является положительно определенной, а, напри-
мер, неотрицательно определена, то соответствующая мат-
рица V (£0, ij) будет иметь полный ранг только в специаль-
ных случаях. Здесь нужны специальные требования к паре
матриц [Л (0» W (?)]. Исследования этих задач состав-
ляют основное содержание следующих трех глав. Если
уравнения (1), (3) рассматриваются на полубесконечном
интервале времени (t0, сю), а это — важнейший практи-
чески интересный случай, то они вообще могут не иметь
ограниченного решения. Случаи, когда эти уравнения
имеют положительно определенные ограниченные реше-
ния, будут подробно исследованы в дальнейшем.
Задачи. 1. Вычислите значение интеграла в приведенном при-
мере, проинтегрировав уравнения движения. Сравните оба способа.
Какой ив вих выгоднее при более высоком порядке матрицы Л?
148 Линейные дифференциальные уравнения (гл. п
2. Выпишите векторное уравнение, эквивалентное уравнению
X(i) = A (t)X (0 4- X (ф4' (0+ F(t)
в случае, когда A, F имеют размер 2X2.
3. Для системы х (t) = Лх ((), где
"20—1 0
_ 3 4 0 —1
7 = 1 0 3 0’
_0 1 3 5 ~
вычислите матрицы Аг, А2 эквивалентного матричного уравнения
X (t) — АГХ (0 4- X (t)4a, где X (t) имеет размер 2X2.
4. Для стационарного матричного уравнения X (£) — АХ (t),
где матрица А устойчива, покажите, что если IV = W' — постоян-
ная матрица, то
do
У — tr (X' (t)WX (/)) dt =- tr (Х(О)П(О)),
о
где V — постоянная матрица. Найти уравнение для V.
5, Пусть А и В — квадратные матрицы. Покажите, что мат-
ричное уравнение А V 4* = И7 относительно неизвестной матри-
цы V имеет решение тогда и только тогда, когда tr (Р'ТГ) = 0 для
любой Р, удовлетворяющей уравнению А'Р 4- РВ — 0. (Указа-
н и с. Рассмотрите соответствующий линейный оператор в про-
странстве Е'1ХП.)
С>. Имеет ли уравнение Л'Р4“ = — И' единственное ре-
шение, если
W — ненулевая вещественная матрица, если А — матрица системы
оР.г- „
*г + ^ = 0?
8. Рассмотрите систему i (t) -j- (г) -4- x (t) — 0 при t 0,
d 0. x (0) ;> 0, x (0) > 0. Покажите, что величина
do
J [x2 (t) 4* & (t)1 dt
/Г+^ „ X (0)
достигает минимума при a = • гДе *
9. В условиях задачи 7 вычислите величину J, если х (0) — 1
*(0) = 0,5, d = 4-
§ 1э] численное решение стационарных Уравнений 149
10* Вычислите значение а, при котором функционал J =
оо
= [а:3 (I) -|- з2 (t)ldf достигает минимума на решениях уравнения
№
9 5
г (0 + 2ж (0 +-^i (0 (0 = 0,
£ (0) 0, * (0) = а, а;(0) = 1.
11. Для условий задачи 10 найдите точку х (0), (0), х (0),
лежащую в плоскости х (0) + / (0) i (0) = 1, для которой J =
= min.
§ 13. Численное решение стационарных уравнений
В этом параграфе рассмотрен один эффективный алго-
ритм вычисления матричной экспоненты. Несмотря на
то, что ряд для функции eAt сходится абсолютно и равно-
мерно при любых t, численное определение значений этой
функции не просто. Особые трудности возникают при
большой размерности матрицы Д, при наличии у А поло-
жительных или значительно отличающихся по модулю
собственных значений. Поэтому алгоритмы вычисления
матричной экспоненты с помощью ЦВМ важны для при-
ложений. Мы не станем перечислять различные методы
решения этой задачи и откажемся от подробного обсуж-
дения этого вопроса. Остановимся лишь на одном из воз-
можных методов.
Скалярное уравнение. Начнем с геометрической ин-
терпретации метода в скалярном случае. Рассмотрим
уравнение
А (?) — Ах (0,
где A 0. Будем считать, что начальное условие задано
при t ~ 0. Поскольку система — стационарная, это не
мешает общности рассуждений.
Вычислим решение в точке f A по заданному зна-
чению в нулевой момент времени х (0). Простейший спо-
соб заключается в суммировании ряда для экспоненты
ДА A h?
X (h) = х (0) + х (0) + х (0) + .. . (*)
1Й0 ЛПЙГЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. 11
Этот ряд сходится абсолютно и равномерно (теорема 3,
§ 9) при любых Д, Л. При вычислении на машине необ-
ходимо ограничиться п членами этого ряда. При этом
ошибка в определении х (/г) будет иметь порядок О (hn).
Этот естественный путь решения задачи не является,
однако, самым эффективным. Можно указать следующие
«недостатки» этого метода: 1. Если используется конеч-
ный отрезок ряда, то вычисления не буд^т устойчивыми
при любых h. Для обеспечения устойчивости А должно
быть достаточно малым. 2. Для получения точности ж О (hn)
необходимо вычислять п членов ряда. 3. Метод исполь-
зует информацию только о производных в точке t = О,
в то время как интуитивно понятно, что поведение функ-
ции можно предсказать более точно, если использовать
данные о производных в точке t = h.
Попытаемся улучшить этот алгоритм. Для наглядно-
сти ограничимся двумя первыми членами ряда (*) Тогда
приближенное решение х (h) имеет вид
х (Д) ~ х (0) + Ahx (0) = [14- Ah] х (0). (1)
Примем теперь, что начальные условия заданы в точке
t = h, и вычислим решение в точке t — 0. Ряд экспоненты
в этом случае имеет вид
ас(О) х (h) — х (Д) 4- х (h) 4---- (**)
Если использовать для вычисления х (А) это уравнение,
ограничившись первыми двумя членами ряда, то получим
х (Л) = [1 — 4Д]-1 х (0)* (2)
Информацию об обоих уравнениях (*), (**) можно ис*
пользовать, вычислив полусумму значений х (Д), рассчи-
танных по формулам (1), (2). Соответствующая формула
после элементарных преобразований имеет вид
x(h) = [1 — - ^(0). (3)
Однако этот способ совместного использования уравне-
ний (*), (**) для вычисления значения х (h) не является
наиболее эффективным. Гораздо более точную аппрокси-
мацию решения можно получить следующим образом.
Вычтем из уравнения (*) уравнение (♦*) и определим
§ 13] ЧИСЛЕННОЕ РЕШЕНИЕ СТАЦИОНАРНЫХ УРАВНЕНИЙ 151
х (h) из полученного уравнения. Если ограничиться пер-
выми производными, то получим формулу
* (Л) “ [1 - [1 + * (0). (4)
Геометрический смысл формулы (4) состоит в том, что мы
приравниваем площадь трапеции со сторонами х (0),
х (0) + Ahx (0) и площадь трапеции со сторонами х (А),
х (/ь) — Ahx (fe) и находим из этого условия х (h). Геомет-
рический смысл формул (1) — (4) ясен из рис. 13.1.
Сравним эти формулы с точки зрения объема вычисле-
ний: (1) — 1 сложение. 2 умножения; (2) — 1 сложение,
2 умножения, 1 деление; (3) — 2 сложения, 3 умножения,
1 деление; (4) — 2 сложения, 2 умножения, 1 деление.
Отметим, что формула (4) требует на одно умножение
меньше, чем формула (3). Наконец, сравним эти формулы
еще с одной точки зрения. Как они ведут себя при боль-
ших значениях h? Простое исследование показывает,
что коэффициент справа, меньший по модулю, чем едини-
ца, будет получаться при любом шаге Столько в формулах
(2), (4). Вычисления до этим формулам устойчивы при
152 ЛИНЕЙНЫЕ дифференциальные уравнения [гл и
любых значениях h, так как возникающие в процессе вы-
числений или в задании начальных данных ошибки будут
на каждом шаге умножаться на коэффициент по модулю,
меньший единицы. Для обеспечения устойчивости формул
(1), (3) необходимо позаботиться о том, чтобы h было дос-
таточно мало.
Точность аппроксимации. Сравним формулы (1) -
(4) на простом примере. Пусть Л = — 0,5, h = 1, х (0) =
= 1. Табличное значение функции е-0»3 = 0,606531. При
использовании приближенных вычислений по формулам
(1) — (4) получим
(1) х (1) = fl—0,5]-1 - 0,5000,
(2) х (1)= [1 + 0,5г1-1 = 0,666(6),
(3) х(1) - [1 4-0,5]~1Г1-0,2^0,5]-1 - 0,5833,
(4) х (1) = [1 + 0,25 -1 [1-0,251 = 0,6000.
Более высокая точность, полученная в случае исполь-
зования формулы (4), связана с тем, что, как будет по-
нятно в дальнейшем, формула дает значение х (/г) с точ-
ностью до величины порядка О (/г-3).
При выводе формул (1) — (4) мы ограничились первы-
ми двумя членами рядов (*), (**). Чтобы получить более
точную аппроксимацию, необходимо рассмотреть боль-
шее число членов. Для пяти членов ряда получим следую-
щую формулу, аналогичную формуле (4):
*(Ь) = р—Г + -Г--12-+-®-] х
„ Г, . hA , №Л* , ЛМ» , ЛМ‘1 ,п. ,с.
Хр+— + —+ чт+'48“.г;<0)' <5>
Эта формула по построению обеспечивает точность аппро-
ксимации решения порядка О (/г5). Существует, однако,
более простая формула, дающая ту же точность аппрокси-
мации, о чем свидетельствует
Теорема 1. Формула
х (h) = [12—6^Л + ЬМ2]’1 И2 + 6М + AM2] х (0) (6)
аппроксимирует решение уравнения х = Ах в точке
t = h с точностью до величины порядка О (А5).
Доказательство. Рассмотрим отношение пра-
вых частей формул (5) и (6). Раскрытие скобок и при-
§ 13] ЧИСЛЕННОЕ РЕШЕНИЕ СТАЦИОНАРНЫХ УРАВНЕНИЙ
ведение подобных членов немедленно дает
х (Л) (формула (а)) 12 ф-Л3 Л3 + О (Л5) __ ,
х (Л) (формула (6)) 12 ф- ЛМ» + О (h6) " ± " u V7 MJ
Точно таким же способом можно убедиться, что фор-
мула (4) дает аппроксимацию х (k) с точностью до О (Л3).
Алгоритм решения уравнения х (/) = Ах (£). Пусть
А — матрица п X п. Формулы (*) и (*#) останутся спра-
ведливыми. так как ряд матричной экспоненты совпадает
по форме с рядом обычной экспоненты. Сохраняются,
как нетрудно проверить, и формулы (1) — (5), а также
доказательство теоремы 1. Это является следствием того
факта, что квадратные матрицы являются элементами
кольца, и потому при замене скаляра А матрицей А не-
обходимо лишь внимательно следить за порядком сомно-
жителей, поскольку кольцо матриц некоммутативно, и за
выполнимостью операции деления, так как не всякая мат-
рица имеет обратную. Поэтому, используя формулу (6),
можно построить следующий алгоритм решения дифферен-
циального уравнения х = Ах:
х (t + h) - eAhx (t) ~ Ax (t), (7)
где
eAt ~ A = [12E - QAh + А2/г2]-1 [12E + 6АЛ + A2*2],
причем точность аппроксимации x (t -|- h) составит О (h5).
Если необходимо вычислить х (/) в последовательные мо-
менты времени t = ih, где I = 1, 2, . . ., то расчеты сво-
дятся к умножению полученного на предыдущем шаге
вектора х (/) на матрицу Л.
Поскольку формула (7) содержит операцию обращения
матрицы, необходимо убедиться в том, что эта матрица —
неособенная. Если матрица А устойчива, т. е, все ее ха-
рактеристические числа имеют отрицательные веществен-
ные части, то справедлива
Теорема 2. Если матрица А устойчива, то мат-
рица С = [12Е — 6А/г + A2h2] — неособенная при лю-
бом h 0.
Доказательство. Воспользуемся теоремой
о треугольной матрице. Пусть А= РТР'1, где Т — тре-
угольная матрица. Тогда матрица С преобразуется к виду
С = Р [12Е - QTh + П2] Р'1.
154 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Ла диагонали матрицы [12Е — §Th Ц- Т12^2] стоят соб-
ственные числа матрицы С, равные
М = [12 -6М+
Поскольку при любом i Re 0, то все Хг- имеют поло-
жительные вещественные части и, значит, матрица С яв-
ляется неособенной. Больше того, это положительно оп-
ределенная матрица. Q
Если матрица А не является устойчивой, то, вообще
говоря, могут существовать такие значения h, при кото-
рых обращение в формуле (7) ие существует. Однако
в этом случае всегда можно выбрать достаточно малое
h с тем, чтобы матрица [12£ — QAh -|- Л2й2] имела обрат-
ную. Это следует из того, что lim [12Е — 6Лй + A2k2] =
= 12Е при
Устойчивость вычислений. Вычисления по формуле (7)
считаются устойчивыми, если все характеристические
числа матрицы располагаются внутри единичного круга
комплексной плоскости (см., например, [17, [18]). В слу-
чае устойчивой матрицы А имеет место следующий факт:
Теорема 3. Если А —устойчивая матрица, то
все характеристические числа матрицы А = [12Е —
— 6ЛА Л2&2]-1 [12А1 -[- QAh + A2h2] по модулю меньше
единицы.
Доказательство. Воспользуемся теоремой
о треугольной форме матрицы. Пусть А = РТР~\ где
Т — треугольная матрица, все элементы которой, рас-
положенные под главной диагональю, равны нулю, а на
диагонали размещены собственные числа матрицы А.
Подставляя матрицу А в формулу для Л и воспользовав-
шись формулами
PEP-i = Е, (РТР~*)2 = РТ2Р~\ (РХР-'У1 = РХ^Р~1,
получим после элементарных алгебраических преобразо-
ваний
Л = Р [12£ - QTh, + 7’W1 [12Е + QTh + T2h2] Р~\
Поскольку матрица Тг — треугольная, то треугольными
будут матрицы [12Е — QTh + T2h2] и [12Е -|- QTh +
+ T2h2]. Рассмотрим матрицу [12Е — QTh Т12^2]-1. Она
будет треугольной, как обращение треугольной матрицы,
§ 13] ЧИСЛЕННОЕ РЕШЕНИЕ СТАЦИОНАРНЫХ УРАВНЕНИИ }55
а на ее главной диагонали будут стоять обратные величи-
ны собственных чисел матрицы [122? — QTh + T2h2] (см.
задачу 1, § 8). Следовательно,
[12£ — 6Г-Ь
Г 1#
12 — + Х3Ла
12 - 6V* + Фа
12-6V + *-n^-
(Здесь через * обозначены, возможно, ненулевые элемен-
ты матрицы). Отсюда сразу следует, что на диагонали
треугольной матрицы (она равна произведению двух
треугольных матриц) расположены числа
12 +
12 — 6X^4-Х?Аа '
Но все эти числа по модулю меньше единицы при лю-
бом h 0 0 в силу того, что все характеристические числа
X;- имеют отрицательные вещественные части. 0
Таким образом, все сказанное о преимуществах фор-
мулы (4) в скалярном случае сохраняется и для матрич-
ного уравнения х = Лх, по крайней мере для устойчи-
вых матриц А.
Неоднородное уравнение. Способ получения формул
типа (4), (6) остается без изменения для уравнения х (Z) =-
— Лх (i) + Bu (i). Пусть выбрано некоторое значение
h 0. Разложение функций х (i + h) и х (/) в ряд по
степеням h имеет вид
х(< + й) = х(<) + х(0 4- +
+ 4«(0 + О(А5).
X (0 = X (< + й) - 4г х (t + й) + х (t + й) -
—зГ х "Ь + “аг х (0 + 0 (й6)*
156 ЛИНЕЙНЫЕ? ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. II
Вычтем, как и раньше, из первого уравнения второе, раз-
решим полученное уравнение относительно х (i + h),
заменим все производные, воспользовавшись уравнением
х (/) = Лх (t) + Ви (£), отбросим члены порядка О (&5)
и члены х (£) (проверьте, что отбрасывание этих чле-
нов не увеличивает ошибки аппроксимации). Тогда по-
лучим формулу, аналогичную формулам (4), (6), дающую
решение неоднородного уравнения, с точностью до вели-
чин порядка О (№):
X(t+h) = [е-X
+[£-4-а+4А2-<лТх
х{р+4А+4л’+4лз14Вп«+
+[£-44+4A2-4^]4BH(*+fc)+
+[£+4-4+4А2]4в“«-
_[я - -|-л+4 <«+*)+[«+« +
+—r]4B“(z++М •
(8)
Здесь можно было бы воспользоваться результатом тео-
ремы 1 и заменить множитель перед х(£) матрицей Л
формулы (7). Однако эта замена не упрощает вычис-
лений, поскольку множители перед u(i) и и (t т h) дол-
жны сохранить порядок h:i для обеспечения точности
О (Л5).
Формулы (7), (8) содержат трудоемкую с точки зрения
вычислений операцию — обращение матрицы. Поэтому
нельзя априори оценить эффективность этих формул
в сравнении с методами, пе содежащими этой операции
(например, метод Рунге — Кутта, суммирование ряда (♦)
и т. д.) Опыт, однако, показывает, что.выигрыш, полу-
чаемый за счет повышенной точности формул (7), (8)
§ 13] ЧИСЛЕННОЕ РЕШЕНИЕ СТАЦИОНАРНЫХ УРАВНЕНИЙ 157
и за счет обеспечиваемой этими формулами устойчивости
вычислений при любых h вполне компенсирует те вычис-
лительные трудности, которые связаны с обращением мат-
рицы. Хорошей иллюстрацией служит численный пример,
приведенный в работе Дэвисона [57].
Пример. Решение уравнения
х (t) = Их (£) + /?и (t), х (0) = 0.
где u (Z) — ступенчатое возмущение u (t) =1 при t 0,
а матрицы А и В имеют следующие элементы: А = [afJ,
где
i = 1,2,.. . ,н,
<ц+1,1 0,005^-!, г = 1,2,.. ., п — 1,
Щ, г+1 = 0,01, 1 = 1,2,.. ., п — 1,
Опг - — 0,02, г = 1,2,.. ., п — 2,
ат = 0,002, 1 = 1,2,.. ., п — 2,
А: = 1,17 при п = 70, к = 1,25 при п = 50, к — 1,45
при п = 30, к = 3,0 при п = 10, В = [5J, где bt = 0
при I = 1, 2, . . п — 1, Ьп = 1, осуществлялось по
формуле (8).
В табл. 1 приведен расход машинного времени при
решении этой задачи данным методом, методом Рунге —
Кутта и стандартным методом Кранка-— Никольсона
[56]. Автор работы [57] назвал алгоритм формулы (8)
обобщенным методом Кранка — Никольсона.
Таблица 1 [57]
Пирицин матрицы Метод Рунге—Кутта Стандартный метод Кранка— Никопьоона [56] Формула (8)
п -10 40 жн 3 сек 0,2 сек
rt —30 360 мин* 33 сек 2,2 сек
п — 50 900 мин* 90 сек 10 сек
п —70 1800 мин* 180 сек 26 сек
Отмеченные знаком * времена были оценены, а не изме-
рены в эксперименте.
158 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. II
Шаг в методе Рунге — Кутта выбирался всегда макси-
мально возможным по условию обеспечения устойчивости
вычислений. Во всех случаях точность вычислений была
не менее 4 значащих цифр.
Обсуждение. Отметим основные черты алгоритма (7).
1. Формула (6) дает корректное решение задачи при
любых h (а не только при h —> 0) при t —> оо. Учитывая
этот факт и то обстоятельство, что формула (6) дает ап-
проксимацию порядка О (№), можно надеяться, что реше-
ние уравнения х (I) = Лх (I) 4- (0 будет сравнитель-
но точным при больших значениях h. Поэтому, если же-
лаемая точность невелика (скажем, 0,1%), а это часто
имеет место, то можно значительно сократить расход
машинного времени, выбирая большие значения h.
2. Требуемый объем памяти при решении однородно-
го уравнения составляет Зп-2. Для неоднородного урав-
нения 5гс2. Это более жесткие требования, чем те, ко-
торые предъявляют стандартные методы, основанные на
суммировании ряда (*) — 2п2 или метода Рунге — Кут-
та — п2.
3. Алгоритм устойчив и сходится при любых h в том
случае, если матрица А устойчива. Это, конечно, не озна-
чает, что в случае неустойчивой матрицы А этот алгоритм
будет работать плохо. В этом случае следует обратить
особое внимание на выбор h.
4. Основное время в этом алгоритме занимает опера-
ция обращения матрицы А. Поэтому важен выбор эффек-
тивного алгоритма решения этой задачи.
В § 3 нами был приведен алгоритм Гаусса, который
может быть использован для вычисления обратной мат-
рицы.
Замечание. Изложенный здесь метод вычисле-
ния значения экспоненты имеет давнюю историю. Впервые
его применял Эйлер, который получил формулы (4), (6),
раможив функцию е? в бесконечную дробь. Тогда форму-
лы (4), (6) представляют собой соответственно вторую
и третью подходящие дроби для этой бесконечной дроби.
Подробно этот метод описан в книге [45]. Для матричной
экспоненты формулы типа (6) применены в работе [57].
В дальнейшем алгоритм (6) будет применен для решения
алгебраического уравнения Ляпунова и для решения диф-
ференциального уравнения Риккати.
§ 13] ЧИСЛЕННОЕ РЕШЕНИЕ СТАЦИОНАРНЫХ УРАВНЕНИЙ 459
Задачи. 1. Покажите, что формула
120 + 60АЛ 4- 12АЧа + W
Х W 120 — 60АЛ 4 12АаЛа — А3Л» х
аппроксимирует решение уравнения х = Ах с точностью до вели-
чин порядка О (h7).
2. Докажите теоремы типа теоремы 2 и теоремы 3 для формулы
задачи 1.
3. Приведите формулу (8) к удобному для программирования
виду, воспользовавшись тем, что
и (г) = а0 -р -|- ct2i2 -|- <М3 -j- a4i4
при I 0 и и (i) = 0 при t < 0.
4. Упростите формулу (8) в случае u(f)=conA, воспользовав-
шись формулой теоремы 1 так, чтобы порядок аппроксимации реше-
ния был О ((Л5).
ГЛ АВА 1П
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ
ЛИНЕЙНЫХ ОБЪЕКТОВ
В этой главе мы приступим к изучению задач управ-
ления. Основной задачей, решаемой управляющим уст-
ройством, является задача обеспечения устойчивости
движения управляемого объекта. Смысл этого требования
в том, что объект должен сохранять работоспособность
при действии различного рода посторонних возмущений.
Установить, является ли движение данного объекта ус-
тойчивым даже в том случае, когда известны уравнения
движения объекта и эти уравнения линейны, вообще го-
воря, очень сложно. Например, задача исследования
устойчивости линейного объекта, уравнение которого
имеет сравнительно простой вид
х (t) + (а + b sin t) я (t) = О,
требует уже привлечения расчетов на ЦВМ.
Основной темой этой главы будет прямой метод Ля-
пунова. Этот мощный метод исследования применим для
решения широкого круга вопросов теории управления.
В согласии с планом этой работы мы ограничимся рас-
смотрением только линейных систем и только алгебраи-
ческих методов исследования вопросов устойчивости
в таких системах, оставляя без внимания имеющиеся эф-
фективные частотные методы решения этих задач. В конце
главы обсуждаются постановки задач аналитического
конструирования систем управления.
§ 14. Описание линейных объектов
в пространстве состояний
Определение линейной системы. Основным объектом
исследования в дальнейшем будет «линейная системам или
«линейный объект». Этими словами мы будем обозначать
$ 141 ОПИСАНИЕ ЛИНЕЙНЫХ ОБЪЕКТОВ 161
систему линейных дифференциальныv уравнений вида
х(0 = Л(0х(О + ^(О«('), 1 (ЛС)
У (О - C(i)x(i). J
В этих соотношениях х (/), u (г), у (() — векторы размер-
ности п, т, р соответственно; и (г) называется входом
системы, управлением, управляющим воздействием} у (() —
выход системы, вектор выходных переменных, выходная
величина} х (() — состояние системы, вектор фазовых ко-
ординат, траектория движения системы или решение
(системы дифференциальных уравнений). u(t) — это что-
то, что мы можем изменять по нашему усмотрению, чем
мы управляем, что мы выбираем; у (г) — следствие этих
изменений, наблюдаемое на выходе системы.
Матрицы А (г), В (i), С (t) имеют размерность п X п,
п X т, р X п соответственно. Элементы этих матриц —
непрерывные функции времени.
Соотношение у (() — С (i) х (() назовем уравнением
наблюдения линейной системы или уравнением выхода.
Замечание. Уравнения выхода записывают
иногда в более общем виде:
у (/) = Сх (?) -э Z)u (?), (1)
где дополнительный член Du (t) отражает прямую связь
(не динамическую) выхода со входом. Все результаты,
полученные для (ЛС), легко обобщаются для уравнения
наблюдения (1). Q
Если матрицы системы (ЛС) от времени не зависят, то
такая система называется стационарной.
Многие вопросы теории управления, связанные с изу-
чением математического объекта, заданного соотношениями
(ЛС), не имеют аналогов в теории обыкновенных диффе-
ренциальных уравнений. Однако, прежде чем изучать
математические свойства этого объекта, необходимо вве-
сти терминологию и соответствующие понятия, которые
устанавливали бы связь этой математической модели и
реальных систем управления, изучаемых инженерными
дисциплинами.
Множество значений вектора х (?) называется прост-
ранством состояний и обозначается X. Для системы (ЛС)
X совпадает с п-мерпым пространством К".
6 IO Н Андреев
tfi2
устойчивость движения обьектов
[ГЛ. ТГ1
Вектор х (t) называется состоянием системы в момент
времени t, а координаты этого вектора относительно ка-
кого-либо базиса, выбранного в пространстве состояний,
называют переменными состояния.
Через Т обозначим множество моментов времени, для
которых рассматривается движение (ЛС). Обычно Т сов-
падает с отрезком или с полуинтервалом
t0 <4 t <4 оо.
Пространство пар (£, х (£)) называют обычно простран-
ством событий или фазовым пространством [24]. Точка
(£, х (£)) называется событием или фазой системы (ЛС).
Пространство событий представляет собой множество
Т X X.
Если задана точка в пространстве событий (£0, х (£0))
и задано управление и (t) для £ £0, то решение уравне-
ния х (£) = A (£) х (i) 4 В (t) н (£) дается формулой
Коши (см. § 10). Это решение можно рассматривать как
отображение вида
х(i; ta, х0, u(i)): 71xT1xXxfi->X.
Здесь — пространство входных воздействий. Везде в
дальнейшем в качестве входных воздействий рассматри-
ваются непрерывные функции времени. Поэтому в каче-
стве Q мы возьмем пространство Ст [£0, Напомним,
что С™" [г0, fj — пространство m-ок непрерывных функ-
ций. Это пространство является бесконечномерным.
Введем еще множество мгновенных значений управ-
ляющих воздействий U. В качестве этого множества бу-
дет рассматриваться пространство К171. Заметим, что в
качестве множества мгновенных значений управлений
мы рассматриваем, вообще говоря, неограниченное мно-
жество.
Говорят, что входное воздействие и (£) переносит,
переводит, изменяет, преобразует состояние х0 (или со-
бытие (£0, х0) в состояние х (t; £0, х0, и (£)) (или в событие
(t; х (t; £0, х0, и (£))). Говоря о движении системы, мы
будем иметь в виду изменение во времени ее состояния,
т. е. функцию х (t, t0, х0, и (£)). Размерность линейной
системы равна размерности ое пространства состояний,
т. е. размерности пространства R”.
Резюмируя сказанное, дадим определение математи-
ческого объекта, изучаемого в дальнейшем.
§ 14] ОПИСАНИЕ ЛИНЕЙНЫХ ОБЪЕКТОВ 163
Определение 1. Линейной системой с непре-
рывным временем называется система, описываемая соот-
ношениями (ЛС), где х (£) е Rn, u (i) Rm, у (i) Rp
при любом t (= T; A (£), В (£), C (i) — матрицы размер-
ности n x n, n X m, p X n соответственно, составленные
из непрерывных функций времени, и (() — непрерывная
функция времени. Q,
Поскольку бесконечномерные и дискретные системы
здесь не рассматриваются, то в дальнейшем будем поль-
зоваться термином линейная система или термином ли-
нейный объект для обозначения линейной, конечномерной,
динамической системы с непрерывным временем.
Отметим основные моменты идеализации реальных
физических систем, допущенные в этом определении.
1. Предполагается, что все матрицы системы A (t),
В (i), С (г) точно известны. В реальных системах это вы-
полняется редко. Как правило, можно говорить лишь о
большей или меньшей степени точности задания этих мат-
риц, а не об их точном знании. Итак, рассматриваются
только детерминированные системы.
2. Мы рассматриваем линейные уравнения. Реальные
системы описываются, как правило, нелинейными урав-
нениями. Однако исследование линейных систем имеет
важное значение по следующим причинам: а) имеется
много динамических систем, движение которых описыва-
ется с помощью линейных уравнений, — это линейные
электрические цепи, механические системы, изучаемые в
классической механике, линейные объекты регулирова-
ния и т. д.; б) линейная теория имеет законченный вид,
разработаны достаточно эффективные численные методы
решения линейных задач; в) с помощью линейной теории
можно изучать нелинейные динамические системы в окре-
стности их номинальных траекторий. Таким образом, ли-
нейная теория Служит основой для изучения нелинейных
систем.
3. Поскольку в качестве управляющих воздействий
рассматриваются непрерывные функции времени и (7) ЕЕ
С= С"1 [г0, fj, то это значит, во-первых, что управляющие
воздействия в системе могут быть больше любой наперед
заданной конечной величины, во-вторых, что не допуска-
ются скачки в управляющих воздействиях. В реальных
системах управление всегда ограничено и часто допу-
6*
164
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ ПТ
стимы управляющие воздействия типа скачков (переклю-
чений и т. п.).
Несмотря на подобную идеализацию свойств реаль-
ных систем, теория управления линейными системами
приводит к результатам, имеющим непосредственное
практическое применение.
Понятие состояния. Вектор х (г0) содержит всю ин-
формацию, необходимую для однозначного определения
выходов системы (ЛС) в любой момент времени t > t0 в
том случае, если известны входные воздействия u (t) при
£ Поскольку входами п (£) мы распоряжаемся, то
для эффективного управления линейным объектом необ-
ходимо знать (уметь оценивать, предсказывать, измерять)
его состояние. Именно это обстоятельство положено в
основу определения состояния систем самого общего вида
[20, 24]. В нашем частном случае, когда состояние в мо-
мент t9 определено как полный набор начальных условий
в уравнениях движения, знание состояния и входов сис-
темы однозначно определяет ее движение лишь при от-
сутствии помех. Если же система подвержена действию
помех или если в системе имеется запаздывание, то на-
чальные условия и входы уже не определяют однозначно
движение системы (ЛС).
Рассмотрим примеры выбора переменных состояния
динамических систем.
Если к механической частице (система) приложить в
момент времени £0 силу (вход), то движение частицы (вы-
ход) для t "> i0 нельзя определить однозначным образом,
если не известны ее положение и скорость в начальный
момент времени. Поэтому скорость и положение являются
переменными состояния этой системы.
Заметим, что переменные состояния определяются не
однозначно. Например, момент количества движения и
положение частицы тоже будут переменными состояния.
В классической механике, если выбран набор обобщен-
ных координат механической системы и известны их про-
изводные, то движение системы при известных силах оп-
ределяется однозначно. Обобщенные координаты вместе
с их производными определяют состояние системы в фа-
зовом пространстве размерности 2га.
Таким образом, понятие фазового пространства клас-
сической динамики естественным образом преобразуется
§ 14]
ОПИСАНИЕ ЛИНЕЙНЫХ ОБЪЕКТОВ
165
в понятие пространства состояний в теории управления.
Напомним, что выбор обобщенных координат динамиче-
ской системы отнюдь не является однозначным.
Рассмотрим электрическую цепь рис. 14.1. Известно,
что если задан начальный ток в индуктивности и
начальпое напряжение на емкости, то для любого закона
Рис. 14.1.
u (i) изменения входного напряжения выходное напря-
жение у (£) можно определить единственным способом.
Поэтому ток в индуктивности и напряжение на емкости
можно рассматривать в качестве переменных состояния.
В цепи рис. 14.2, если известны все напряжения на ем-
костях, которые мы обозначим через ау, х2, х3, то поведе-
ние цепи единственным образом определено для любого
Рис. 14.2.
входного воздействия. Поэтому напряжения па емкостях
л’зМожно рассматривать как переменные состояния.
Рассмотрим, однако, эту цепь подробнее. По заколу
Кирхгофа имеем (г) + х2 (£) -|- (г) = 0 для всех t.
Поэтому, если любые два напряжения из {дд, ата, ж3} из-
вестны, то третье определяется однозначно. Другими сло-
вами, два напряжения на емкостях тоже являются со-
стоянием. Если же в качестве состояния выбраны все три
напряжения, то имеется избыточность в определении
состояния. Естественно так стремиться выбирать состоя-
ние системы, чтобы оно содержало бы наименьшее число
переменных.
166
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. III
Как указывалось выше, выбор переменных состояния
не является единственным. Фактически путем замены ба-
зиса в пространстве состояний можно ввести новые пере-
менные состояния, поэтому существует бесчисленное
число способов выбрать эти переменные. Обычно употреб-
ляются лишь некоторые из этих способов, либо те, кото-
рые дают математические преимущества в исследовании
модели системы, либо те, которые имеют ясный физиче-
ский смысл.
Уравнения состояния и передаточная функция. Ос-
новным понятием теории регулирования является поня-
тие передаточной функции. В дальнейшем будем решать
задачи управления линейными объектами, используя их
описание в пространстве состояний. В рамках этого под-
хода решение ряда традиционных вопросов теории управ-
ления выглядит существенно проще. Кроме того, матрич-
ное описание систем удобно с точки зрения использования
вычислительных методов алгебры и программирования
задач на ЦВМ.
На рис. 14.3, а дано графическое изображение системы
с одним входом и одним выходом, описанной с помощью
Рис. 14.3.
передаточной функции W (р), а на рис. 14.3, б — с помо-
щью уравнений состояния (ЛС).
Йри сравнении описания системы в пространстве со-
стояний и описания с помощью передаточной функции воз-
никает вопрос: когда эти описания эквивалентны? Свя-
занный с этим вопрос: как перейти от одного описания к
§ 14] ОПИСАНИЕ ЛИНЕЙНЫХ ОБЪЕКТОВ 167
другому? По этому поводу заметим следующее. Посколь-
ку передаточная функция отражает только соотношение
между входом и выходом системы, всегда имеется опре-
деленный произвол в выборе переменных состояния сис-
темы, заданной с помощью передаточной ф>гнкции. С другой
стороны, если известно описание системы в пространстве
состояний, то передаточная функция сразу определя-
ется, и притом однозначным образом. Тот факт, что опи-
санию системы в пространстве состояний отвечает единст-
венная передаточная функция, а передаточной функции
системы соответствует бесконечно много представлений
в пространстве состояний, свидетельствует о том, что
описание системы в пространстве состояний является
более общим. Вычислим передаточную функцию стацио-
нарной системы с одним входом и одним выходом. Предпо-
ложив, что начальные условия равны нулю, возьмем пре-
образование Лапласа обоих уравнений (ЛС):
рх(р) = Лх(р) + Ьц(р),
у(р) = с'х(р).
Из первого уравнения, предполагая существование об-
ратной матрицы, имеем
х (р) = Ip# — Л Г1 Ьп (р).
Отсюда сразу получим
у (р) = с' [рЕ — А]~х hu (р).
Коэффициент перед и (р) равен передаточной функции
системы. Следовательно,
И7 (р) = с' [рЕ — АГ1 Ь.
Рассмотренный прямой метод не всегда пригоден для
практического использования, поскольку требует вычис-
ления обращения матрицы. Проще получить передаточ-
ную функцию, преобразуя структурную схему системы
(ЛС). Пример такого преобразования для системы, задан-
ной матрицами
Г 0 11 Г01
Л-[_2_3]. b = [J, с' = [101,
представлен на рис. 14.4.
168
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. III
При большой размерности пространства состояний
процедура вычисления передаточной функции с помощью
структурных преобразований может быть существенно
проще, чем операция обращения матрицы большого
порядка.
Задача определения представления системы в прост-
ранстве состояний по известной передаточной функции
Рис. 14.4.
является более сложной, чем обратная задача, из-за про-
извола выбора переменных состояний. Однако с этой за-
дачей знаком каждый инженер, которому приходится
моделировать системы регулирования на аналоговых ЭВМ.
Рассмотрим решение этой задачи для системы с одним
входом и одним выходом, имеющей передаточную функцию
вида
W(„) = .
РП + Яп-хР^ 1 + • • • + + йо
Соответствующее этой передаточной функции диф-
ференциальное уравнение движения системы можно
§ 14]
ОПИСАНИЕ ЛИНЕЙНЫХ ОБЪЕКТОВ
169
записать в виде
У{п} (0 + an_L7/M(i) + ... -ha0-
= (0 + hn_2u<-n~v (t) + ... + h0.
Здесь у (t) — выход системы, а и (0 — вход. Чтобы перей-
ти к описанию системы в пространстве состояний, заметим,
что это уравнение эквивалентно системе п линейных диф-
ференциальных уравнений 1-го порядка вида (ЛС), если
переменные состояния определить равенствами:
*1 (0 = У (Oi
(0 = У (0 — (0,
я3 (0 — У (0 — (0 6.2и(0,
Хп (0 = У^ (0 ~ Ь^п~^ (0 — ... — Ъп_х U (0,
в которых постоянные (i — 1, 2, . . . , п) связаны с
коэффициентами передаточной функции с помощью ре-
курсивных соотношений: — hn-i, Ь2 = &л~2 — Ь^п^,
77—2 а—1
^п-1 ~ 2 ^i^r+1) Ьп 2 btdi.
i=l i= 1
Нетрудно проверить, что при таком выборе переменных
состояния матрицы системы имеют вид
Г 0 1 0 0 . . . 0 "1 Г п
0 0 1 0 .. . 0 ь2
А = , Ь --
0 0 0 0 , . . 1 ь П-1
_— ЙО — «1 Й2 — «з ...— яп-1- Ь •— я —
с' = [1 0 . . 0].
Структурная схема моделирования этой линейной сис-
темы представлена на рис. 14,5. Рассмотрим примеры.
1. Пусть дан объект управления £ (0 = и (0. Это
может быть, например, механическая частица единичной
массы, на которую действует сила и (0. Запись уравнения
объекта в переменных состояния получим, вводя пере-
менные: х = xlf х = х2. Тогда уравнение объекта сведем
к системе двух линейных уравнений
Х-1 (0 = Х2 (0,
(0 = U (0.
170
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. ш
Если в качестве выхода системы рассматривать положение
частицы xY, то у — и матрицы системы А, В, С имеют
вид
л f° Ч
[о о]’
В--
‘0
1
С = [1 0].
Уравнения системы в подробной записи:
км «ет-
Структурная схема этого объекта представляет собой два
последовательно включенных интегратора (рис. 14.6).
Рис. 14.5.
Рис. 14.6.
2. Рассмотрим камерную нагревательную печь, раз-
деленную на три зоны регулирования. Пусть температура
каждой из зон (i — 1, 2, 3) связана с расходом топлива
в зоне ut (t) (i = 1, 2, 3) уравнением
^i(0 — — aiXi (0 “I- (0 “I" (0, i = 1, 2, 3.
Здесь коэффициенты bjj описывают влияние расхода топ-
лива у-й зоны на температуру в г-й зоне.
S 14]
ОПИСАНИЕ ЛИНЕЙНЫХ ОБЪЕКТОВ
171
Тогда уравнения этого объекта могут быть представ-
лены в виде (ЛС), где
“— «1 0 0 "
О — «а О
О 0 — «з
“1
о
о
О О’
1 о
О 1
Ъ<ц
bsi
j>12 &13
баз fes
&32 &зз
Здесь мы считаем, что все переменные состояния объекта
Рис. 14.7.
С =
известны в качестве выходных величин. Поэтому матрица
С является единичной матрицей. Структурная схема этого
объекта представлена на рис. 14.7.
172
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ п
3. Рассмотрим электрическую цепь, представленную
на рис. 14.8 Выпишем у равнения Кирхгофа для этой
цепи:
dur (f)
ц(0 “ (О — G ——»
Ц^Р--«(0-Яг1(0-ис,«).
Т (0 .. f/X
где U(\ (0 — напряжение на емкости. Вводя обозначения:
.71 = iccL (0, — I, (£), — ц (0, получим уравнения
Рис. 14.8.
движения линейной системы в виде
х (?) = Лх (/) -р bu (0,
у (0 - Сх(0,
где
1 о оп
О 1 oj'
Задачи. 1. Выпишите уравнения состояния в форме (ЛС) для
систем, представленных на рис 14 9. Выпишите фуикпию Лагранжа
и уравнения Лагранжа для этих систем
2. Получите представление систем с передаточпыми функциями
i тю \ — _ЧР_±Л_ г. тг t v Л 2п + Р
Э) U iP) — 7, , б) И (р) - р4_|_ ^з-i- 2р^ + р-р 1
в пространстве состоянии
5 14]
ОПИСАНИЕ ЛИНГ ИНЫХ ОБЪЕКТОВ
173
Рис. 14 9.
<74
УСТОЙЧИВОСТЬ ДВИЖЕНИЙ ОВЪЕКТОВ
[ГЛ. ш
§ 15. Устойчивость
Под устойчивостью состояния равновесия динамиче-
ской системы понимают ее способность возвращаться в
это состояние после исчезновения внешних сил, которые
вывели систему из равновесия. Под устойчивостью дви-
жения динамической системы понимают обычно такое
свойство этого движения, когда малые отклонения на-
чальных условий приводят к малым отклонениям от на-
чальной траектории движения. Теория положений устой-
чивого равновесия динамических систем была в основных
чертах завершена Лаграпжем в его «Аналитической меха-
нике», изданной в 1788 г.
Строгое определение понятия устойчивости движения
было впервые дано А. М. Ляпуновым в его знаменитой
диссертации «Общая задача об устойчивости движения»,
опубликованной в 1892 г. Предложенные в этой работе
методы исследования задач устойчивости оказались чрез-
вычайно плодотворными. По-впдимому, не будет преуве-
личением сказать, что идеи этой работы в значительной
степени предопределили основные результаты современ-
ной теории аналитического конструирования систем уп-
равления.
В дальнейшем, поскольку мы будем рассматривать
только линейные динамические системы, то термины:
движение системы, траектория движения, решение сис-
темы дифференциальных уравнений — будем считать
эквивалентными. Норма вектора х (0 и норма матрицы
А всегда индуцированы скалярными произведениями в
евклидовых пространствах Е" и ЕпХп (см. § 8).
Устойчивость движения по Ляпунову. Дадим опреде-
ление устойчивости движения по Ляпунову.
Определение 1. Решение х (0, t0 s-C t <Z со,
системы
х (0 = А (г) х (г) + f (г)
называется устойчивым по Ляпунову или просто устойчи-
вым, если для любого е 0 можно указать число 6^> О
такое, что при любом xt (£0), удовлетворяющем условию
II Хх (Q — х (£0) | < 6,
§ 151
УСТОЙЧИВОСТЬ
175
справедливо неравенство
|) X! (0 — х (0 || < е при всех t ЕЕ [£0) оо), Q
Определение 2. Устойчивое решение х (0 на-
зывается асимптотически устойчивым, если
Jimx1(0^x(f). О
/—►сю
Согласно данному определению для любой е-окрестности
устойчивого решения х (t) (так как эта окрестность задала
при всех 4-4 < со, то можно говорить о заданной
«трубке» траекторий системы), как бы мала эта окрестность
пи была, всегда существует такая 6-окрестность на-
чальных условий, что любое решение х (0, начинающееся
в этой окрестности, не выйдет из е-окрестности траекто-
рии х (0 при всех t.
Для асимптотически устойчивого решения любое ре-
шение, начинающееся в 5-окрестности начальных усло-
вий, будет асимптотически сближаться с решением х (/)
при г -> оо. Пример просто устойчивой системы: х (/) +
4- х (t) =0. Система х (0 Д- х (I) =0, очевидно, асимп-
тотически устойчива, а система ± (/) — х (t) = 0 — неус-
тойчива.
Обратите внимание на то, что устойчивость (даже
асимптотическая) решения неоднородной системы вовсе
не предполагает ограниченности этого решения. Напри-
мер, решение уравнения х (f) = — х (t) 4 1 — t при
0 < £ <С оо, которое имеет вид х (£) = х (0)е'( 4- 4 явля-
ется асимптотически устойчивым при t -> со. но неогра-
ниченным. В то же время, поскольку в определении устой-
чивости «возмущение» траектории движения задано в на-
чальный момент времени, а согласно формуле Коши
вектор начальных условий х0 входит в решение аддитивно
в виде члена Ф (£, 4) х0, то устойчивость системы цели-
ком определяется свойствами переходной матрицы и
справедлива
Теорема 3. Для устойчивости (асимптотической
устойчивости) всех решений линейной системы
х (!) = А (!) х (!) + f (!)
необходимо и достаточно, чтобы было устойчиво (асимп-
тотически устойчиво) какое-либо (например, тривиальное
х (£) = 0!) решение однородного уравнения.
176
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. III
Доказательство. Оно сразу следует из фор-
мулы Коши и определений 1, 2.
Устойчивость и переходная матрица. Таким образом,
исследование вопроса устойчивости линейной неодпород-
ной системы сводится к исследованию решения однород-
ной системы, которое целиком определяется матрицей
системы A (t) и имеет вид
х (*) = Ф (*, *0) х (Q,
где Ф (£, Q — переходная матрица, соответствующая мат-
рице А (/). '
Рассмотрим три возможных случая.
1. Ф (/, /0) — ограниченная матрица в интервале
Ко, оо), т. е. существует такое число М, что
Г Фо' (Л *о) | < М (f > t0, i, j = 1, 2, . . . , и).
Здесь через Ф/;- (t, /0) обозначен r/'-й элемент переход-
ной матрицы. В этом случае из формулы х (£) =
= Ф (Л £0) х (£ft) следует, что
[[ х (0 JI < п2М шах | х, (£0) j
I
и условие устойчивости выполняется, если взять, напри-
мер, 6 <С Тривиальное решение х (Z) = О устойчиво.
2. Вт Ф (/, £0) = 0. В этом случае матрица Ф (t, tfi)
t—mo
ограничена в интервале £() t < сю и потому, как уже
было выяснено, движение устойчиво. Кроме того, из вида
решения следует, что
lim х (£)= Кт Ф (£, ta) х0 = 0
t—>ой ! ->-<х>
при любом х0. Движение асимптотически устойчиво.
3. Ф (£, to) — неограниченная матрица в интервале
t0 s-C t < оо. Это означает, что по крайней мере одна из
функций Ф^- (ц /0), например, Ф^р (£, £0), не ограничена
в интервале /(| <71 <7 оо. Возьмем начальные условия
ж10 = 0, . . ., жро =# 0, . . жп0 = 0. Тогда
(0 = ^о)
и каким бы малым по модулю ни было функция .т7(£)
будет иеограиичена. Движение неустойчиво. Q
§ 15]
УСТОЙЧИВОСТЬ
177
Исследование переходной матрицы позволяет, таким
образом, решить вопрос об устойчивости системы. Однако
переходную матрицу не всегда просто получить, и чаще
всего необходимо вывести суждение об устойчивости по
матрице A (t).
Устойчивые стационарные матрицы. Если известен
спектр постоянной матрицы А, то вопрос о ее устойчи-
вости (асимптотической устойчивости) решает
Теорема 2. 1°. Нулевое решение линейной системы
х (£) = Лх (£) является устойчивым по Ляпунову, если 1) все
характеристические числа матрицы А имеют отрица-
тельные или нулевые вещественные части, 2) все характе-
ристические числа с нулевыми вещественными частями (ес-
ли таковые имеются) являются простыми (не кратными)
корнями минимального многочлена матрицы А, и неустой-
чивым, если хотя бы одно из условий 1), 2) не выполняется.
2°. Нулевое решение линейной системы х (0 — Ах (t)
является асимптотически устойчивым в том и только в
том случае, когда все характеристические числа матрицы
А имеют отрицательные вещественные части.
Доказательство. Докажем только вторую
часть этой теоремы, поскольку главным образом нас будут
в дальнейшем интересовать асимптотически устойчивые
системы. Доказательство первой части можно найти в
книгах [13, 19]. Пусть все характеристические числа мат-
рицы А удовлетворяют условию Re < 0. Напомним,
что для любой матрицы Л существует неособенная матрица
Р такая, что матрица P-iAP = Q имеет треугольную
форму (теорема 2 § 7). На главной диагонали матрицы Q
расположены собственные числа матрицы А:
. . . ., упп = Хп, элементы под главной диаго-
налью равны нулю. После замены переменных z (t) =
= Р-1х (£) система для z (t) имеет вид
z (£) = Р~1АРг (t) = Qz (f).
Запишем эту систему в развернутом виде:
Si (t) = 7nsi(0 + 712*2 (*)+• + 7inzn (0» si (0) ~
z2. (0 — . . . 7заг2 (0 + - • - + (Oj Z2 (0) =
Z7l (0 “ ... Я.пп^п (0» *n (0) ' : ZnB.
178
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ HI
Из последнего уравнения следует, что zn (I) = znQer>nfd О
при t -> со, поскольку по предположению Re qnn < 0.
Подставляя zn (t) в (п — 1)-е уравнение и интегрируя
его, найдем (t). Решение zn (0 и zn_1 (0 подставим в
(п — 2)-е уравнение и т. д. Осуществляя эту процедуру,
нам придется решать на каждом шаге скалярное уравне-
ние вида
zt (0 - qtlzt (0 4- / (0, Zi (0) - zi(),
где / (0 0 при t -+ со. Решение этого уравнения даст
формула Коши
1
(0 = ( 0г”°/ (з) ds.
0
Отсюда видно, что zt (0 -> 0 при Z —> со, поскольку
Ke 7n<C 0. Таким образом, гг (0 -> 0 при t -> со при всех
i = 1, 2, . . п. и достаточность условий теоремы дока-
зана. Необходимость получается сразу, если предполо-
жить противное Q.
Напомним, что постоянная матрица А, все характери-
стические числа которой имеют отрицательные вещест- t
венные части, называется устойчивой матрицей. Согласно
доказанной теореме устойчивая матрица определяет асим-
птотически устойчивую систему.
Определение^. Для любой устойчивой матрицы
А число а >0, определенное равенством
max Re Хг =- —а,
1<г
называется степенью устойчивости. Q
Этот показатель характеризует скорость затухания
переходного процесса в линейной системе.
Критерий Рауса - - Гурвица. Характеристический мно-
гочлен устойчивой матрицы называют устойчивым мно-
гочленом или многочленом Гурвица. Нетрудно проверить,
что если
<р (X) = X -}~ л^Х -}~ йдХ я^-^Х 0 ап
— многочлен Гурвица, то все его коэффициенты строго
положительны, т. е. аг 2> 0 при всех i = 1, 2, . . ., п.
Чтобы убедиться в этом, достаточно воспользоваться тео-
151
УСТОЙЧИВОСТЬ
179
ремой Виета, согласно которой <р (X) = JJ (X — Xf), и
1^=1
заметить, что если ХЕ — комплексный корень, то сопря-
женное число ХЕ тоже является корнем этого полинома.
Поскольку Re X/ < 0 при всех i — 1, 2, . . п, то все
сомножители вида (X — Хг), где Х; —• вещественный
корень, п сомножители вида (X, — Хг) (X — Хг), где Хг- —
комплексный корень, вообще не содержат отрицательных
коэффициентов. Условие положительности всех коэф-
фициентов является необходимым, но не достаточным
условием.
Рассмотрим матрицу п X п, составленную из коэффи-
циентов характеристического полинома ср (X) ХЛ --
4- . + ап:
"«1 1 0 0 ... О
«3 аа at 1 . . О
аз аа аз ат . . . О
О 0 0 0 . . ап
называемую матрицей Гурвица. На главной диагонали
этой матрицы расположены коэффициенты характеристи-
ческого многочлена, начиная с aL до ап. Нечетные столбцы
содержат коэффициенты с нечетными индексами, а четные —
с четными. Все коэффициенты с индексами, большими
п или меньшими 0, заменяются нулями. В каждой строке
индексы расположены в порядке убывания.
Если задана строка коэффициентов ап. а2,
ar, 1, то матрицу Гурвица можно получить, если каждую
последующую строку образовать из исходной сдвигом на
два такта вправо и затем выделить квадратную матрицу
порядка п. так чтобы в последней строке был единствен-
ный элемент а„. Для многочлена 5-го порядка имеем
180
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
(ГЛ III
Заметим еще, что матрицу Н можно строить, используя
лишь первые два столбца. Для построения необходимо
каждые последующие два столбца заменять предыдущими,
сдвигая их на одну строку вниз.
Приведем матрицу Гурвица к треугольному виду с
помощью следующих преобразований, не меняющих зна-
ков ее диагональных миноров. Вычтем из второго, чет-
вертого, . . . столбца соответственно первый, третий, . . .
у
столбцы, предварительно помноженные на —. Нетруд-
но видеть, чю в полученной матрице, элементы которой мы
обозначим через все элементы первой строки, кроме
первого, суть нули. Снова преобразуем ее, вычитая из
третьего, пятого,... столбца соответственно второй, чет-
вертый,. . .столбец, предварительно помноженные на
е33/с32. В полученной матрице все элементы первых
двух строк, расположенные правее диагональных, равны
нулю. Продолжая этот процесс далее, мы придем к тре-
угольной матрице н-го порядка, называемой матрицей
Рауса:
-Гц 0 . . О
Г12 Го3 ... 0
7* г г
L nl * пп
Главные диагональные миноры матрицы Гурвица
Дх= laj, А.-Iй1 1 I,
11 I аз di I
01 1
(?3 Й2
«а а*
0
«1
«в
1- Ап —
называются определителями Гурвица.
Коэффициенты, стоящие па главной диагонали матри-
цы Рауса, связаны с определителями Гурвица соотяолге-
НИЯМИ
Г11 - Дх, Г22 - -др 7 Г33 - - -др- , . . . (1)
или, что то же самое,
п
Д1 = Гц. А2 = Гц г22,..., Дп = JJ Гц.
i-l
Необходимые и достаточные условия устойчивости мно-
гочлена формулирует
§ 15]
УСТОЙЧИВОСТЬ
181
Теорема 3 (Раус, Гурвиц). Для того чтобы мно-
гочлен <р (Л) = + а-Дп-1 -|- . . . -Г был устойчивым,
необходимо и достаточно, чтобы все определители Гурвица
были положительными, или чтобы были положительными
все диагональные элементы матрицы Рауса R. 0
В следующем параграфе приведена схема алгебраиче-
ского доказательства этой теоремы. Другие доказатель-
ства приведены в книгах [1], [13].
Заметим, что рассмотренные критерии требуют опре-
деления спектра матрицы, либо знания коэффициентов ее
характеристического полинома. Как та, так и другая
задача могут оказаться сложными в вычислительном пла-
не. Поэтому важно иметь подход, который позволил бы
оценивать устойчивость матрицы, минуя вычисление
коэффициентов ее характеристического полинома. Такой
подход связан с прямым методом Ляпунова, которому
посвящен следующий параграф.
Нестационарные матрицы. Если система — нестацио-
нарная, то задача исследования устойчивости матрицы
А (Z) в общем случае не может быть сведена к существен-
но менее сложной задачи, чем задача вычисления переход-
ной матрицы. Исследование устойчивых нестационарных
матриц связано с рядом тонких вопросов.
Казалось бы, естественное условие Х+ (Z) <1 — h, где
ДД>0, а V (Z) - максимальное собственное значение мат-
рицы А (I), не обеспечивает устойчивости нестационар-
ной системы х (/) = А (Z) х (/) Об этом свидетельствует
следующий простой пример.
Рассмотрим пару матриц
М’о Л- М-2 Д
Стационарная система х (Z) Ах (I) очевидно неустой-
чива, так как матрица А имеет положительное собственное
значение X -= 1. Вместе с тем нетрудно проверить, что
матрица eBt является матрицей Ляпунова (см. §11) и
преобразование Ляпунова z (Z) = еВ(х (/) приводит сис-
тему х (г) — Ах (Z) к виду
z (Z) -= [eBt Ae^Bt 2?] z (Z).
Поскольку x(Z) не ограничено, то z (?) = eBtx (Z) тоже
не ограничено (это сразу следует из свойств матрицы
182
УС [’ОЙЧПВОСТЬ движения объектов
[ГЛ. ш
Ляпунова eBi), и полученная система по-прежнему неу-
стойчива. Вместе с тем характеристические числа матрицы
этой системы [еВ(Л е~-Bf4-В] (убедитесь в этом, проведя соот-
ветствующие вычисления) отрицательны и не зависят от t.
Приведем простое достаточное условие асимптотической
устойчивости матрицы А (?).
Теорема 4. Для того чтобы линейная система
х (Z) = А (?) х (0 была асимптотически устойчивой при
Zo <0 достаточно выполнения условия Л+ (Z) — h
<0 при t где h — произвольная положитель-
ная постоянная, Х+ (Z) — максимальное собственное зна-
чение симметрической матрицы (г) 4- А' (/)].
Доказательство. Согласно теореме 9 § 8 о
собственных значениях симметрической матрицы, при
любом t имеет место неравенство
х' (г)[Л (z) + А' (/)] х (z) <4 v (z) х' (z) х (z).
В силу очевидного тождества
4 (х' (0 х (0) - 41| х (0 Г = х' (0 [А' (0 + А (0] х (0
это неравенство эквивалентно следующему:
4|x(0|«<V(0|x(0F.
Поделив обе части этого неравенства на ||x(Z)||3>- 0 и
интегрируя в интервале Z], получим
1х (о к IIх (^) II ех₽ [4" 5v dt} •
to
Поскольку в силу условий теоремы Х+ (Z) <4 — h <0,
имеем х (Z) -> 0 при г->оо. Система асимптотически
устойчива. Q
Устойчивость приводимых систем. Важным классом
нестационарных систем, для которых исследовапие устой-
чивости сводится к стационарному случаю, являются
приводимые системы, для которых имеет место следующая
Теорема 5. Для того чтобы приводимая система
х (Z) = А (t) х (t) была асимптотически устойчива, необ-
ходимо и достаточно, чтобы была устойчивой соответст-
вующая этой системе стационарная матрица.
§ 15]
УСТОЙЧИВОСТЬ
183
Доказательство. Согласно теореме Еругина
решение приводимой системы имеет вид
где Р (/) — матрица Ляпунова, а /? - • постоянная мат-
рица. Поскольку матрица Ляпунова при любых оо
удовлетворяет условию || Р (t) | 1| Р~г (/) || М.,,
a —>0 при t оо в сплу устойчивости матрицы В,
то достаточность условий теоремы получается сразу. Не-
обходимость этих условий немедленно получим, если
предположим противное. Q
Важным частным случаем приводимых систем явля-
ются системы с периодическими коэффициентами (см.
§ И). Для периодической системы переходная матрица
согласно теореме Флокс — Ляпунова имеет вид
Ф(Е /0) =_
где Р (/) — периодическая матрица, а В — постоянная
матрица. Таким образом, асимптотическое поведение
периодической системы определяется собственными чис-
лами матрицы В. Чтобы вычислить матрицу В, необхо
димо решить уравнение
Ф + Т, «„) =
относительно В, где Т — период матрицы А (/). Это вы-
числение провести совсем непросто. К счастью, при ис-
следовании устойчивости этого можно и по делать. Не-
трудно видеть, что если В имеет собственные значения Х^,
то числа будут собственными значениями постоянной
матрицы Ф (Т 4- ?0, /0). Это замечание позволяет сфор-
мулировать условие асимптотической устойчивости для
линейной периодической системы в терминах собственных
чисел матрицы Ф (Т -}- /0, 0.
Т е о р е м а 6. Система с периодическими коэффициен-
тами
х (i) = A (t) х (£), A (t А- Т) ~ А (I)
асимптотически устойчива, т. е. все ее решения стре-
мятся к нулю при t —> оо, если все собственные значения
матрицы, Ф (?0 Д- Т, t0) лежат внутри единичного круга
комплексной плоскости, т. е. | X; [ <; 1 при всех I =
= 1, 2, . . п. 0
184
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. ш
Необходимые и достаточные условия того, что корни
характеристического полинома располагаются внутри
единичного круга, можно получить из критерия Рауса —
Гурвица. Действительно, нетрудно видеть, что корни
полинома
<р (X) — X Д- &1Х Д- ... Д-
располагаются внутри единичного круга тогда и только
тогда, когда корни полинома
Ч’(М = Ч>[|±г](1-х)”
располагаются слева от мнимой оси. Поэтому для выяс-
нения условий устойчивости периодической системы мож-
но использовать критерий Рауса —Гурвица.
Равномерная асимптотическая устойчивость. Уравне-
ние х (Z) = — 1/? х (/), имеющее переходную матрицу вида
Ф (f, i0) = является очевидно асимптотически устой-
чивым, так как > Опри t —> сю. Однакопо заданному
числу £> О выбор 6>0 в определении устойчивости
будет зависеть от начального момента времени £0: б =
= б (f0, в). Если число б> 0 в определении асимптотиче-
ской устойчивости можно выбрать по зависящим от на-
чального момента времени 10, то такая устойчивость назы-
вается равномерной асимптотической устойчивостью. Для
равномерно асимптотически устойчивой системы оценки ее
асимптотического поведения на бесконечности можно
выбрать вне зависимости от начального момента времени.
Этот вид устойчивости представляет значительный
практический интерес при исследовании нестационарных
систем.
При равномерной асимптотической устойчивости нор-
ма переходной матрицы экспоненциально убывает иа бес-
конечности, о чем свидетельствует
Д' Те о р е м а 7. Нулевое решение уравнения х (i) =
= A (i) х (t) равномерно асимптотически устойчиво тогда
и только тогда, когда существуют положительные пос-
тоянные а, р такие, что при выполнено условие
(I Ф(£, ?о) J
§ 15]
устойчивость
185
Доказательство. Достаточность условий тео-
ремы сразу следует из неравенства
I х (Q || = | ф (г, гп) х ф,) КIф |||| х (А>) Л < fl х (/0)||.
Докажем необходимость. Пусть нулевое решение системы
х (f) = A (t) х (Z) равномерно асимптотически устойчиво,
т. е. для любого в> 0 найдется б = б (е) такое, что
|| х (Z) ||^ е, коль скоро || х (Zo) ||-^ б при любом t0. Значит,
8>||х(0|К)1Ф(£, z0)IlhMK-ll
и
(2)
Кроме того, в силу равномерной асимптотической устой-
чивости по t всегда найдется такое 7'> 0, что
|| Ф (Zo + Т, io) || к/ 1/2 при любых Zo.
Используя очевидное неравенство
i;w«. они 'Olli® (о. он
получим
1Ф(/„ + пТ. Ч||<|Ф(1, + »Л < -г(п- ЮК-
... || Ф (z0 ц- 71, z0) || < 2 п.
Учитывая неравенство (2) и замечая, что 2_/' =
получим ||Ф (Z, i0)||бг °, t t0 при всех t0. Q
Если для линейной системы х (Z) = A (t) х (/) найдутся по-
ложительные постоянные а и (3 такие, что |[ х (?) ||
при t> t0, то система называется экспоненциально устой-
чивой. В силу доказанной теоремы 7 экспоненциальная
устойчивость эквивалентна равномерной асимптотической
уст ойчивости. В формулировке теорем 4—6 требование
асимптотической устойчивости можно заменить требова-
нием равномерной асимптотической устойчивости. Дока-
зательство теоремы 4 останется без изменений, а теоремы
5 и 6 останутся справедливыми в силу свойств преобра-
зований Ляпунова.
Задачи. 1. Вычислите максимальное собственное значение
V(0 для матриц:
А (0- кШСе-ш+Б] и [A (t)±A'(i)l,
186
Устойчивость движения онъентов
[ГЛ. ш
если
Устойчива ли матрица A (t)?
2. Пусть А (() = A' (i) — непрерывная ограниченная матрица
и Х+ (£) — се максимальное собственное значение. Покажите, что
если существует s > О такое, что
t
Х+ (Z) dt 8 (Z — i0) при любых i, #о, i i0,
io
то уравнение к (i) = А (?) х (г) является равномерно асимптоти-
чески устойчивым.
3. При каких значениях <х, |3 полиномы
Ф (X) = V + аХ2 4- рХ 4- 3, (X) = X4 -ф аХэ -ф 2Х2 Д- рХ -ф 1
УСТО1ГЧПВЫ?
4. Является ли система
2
(г) ” । । t МО
экспоненциально устойчивой?
5. Покажите, что если A (i) — непрерывная матрица, ограни-
ченная на (—со, -фоо), то выполнение неравенства
ti
J Ц Ф (t> io) '\dt «С к для всех ii^ to
to
эквивалентно равномерной асимптотической устойчивости системы
к (t) = А (t) х (t).
6. Докажите раненства (1).
7. Покажите, что уравнение х (i) — A (t) х (i), где
О
1 ~
2 , i>l,
t
не является равномерно асимптотически устойчивым в области
[i0, оо], хотя его решения и ограничены.
§ 16. Второй метод Ляпунова
Теорема Ляпунова. Второй или прямой метод Ляпу-
нова позволяет построить эффективные достаточные ус-
ловия, выполнение которых гарантирует устойчивость
решений дифференциальных уравнений. Этот метод при-
меняется при исследовании самых различных систем диф-
ВТОРОЙ МЕТОД ЛЯПУНОВА
187
§ 16]
фереициальных уравнений, линейных и нелинейных, в
обыкновенных и частных производных. При исследовании
устойчивости движения прямым методом Ляпунова задача
сводится к построению некоторых скалярных функций
координат системы и времени — функций Ляпунова, ана-
логичных функции энергии в механике. Для линейных
объектов мы ограничимся рассмотрением функций Ляпу-
нова в виде квадратичных форм. Начнем со стационарного
случая. Здесь формулировку необходимых и достаточных
условий устойчивости матрицы А дает следующая
Теорема 1 (Ляпунова). Для того чтобы матрица
А была устойчивой, необходимо и достаточно, чтобы
уравнение A'V VA = — W имело положительно оп-
ределенное решение при любой положительно определен-
ной матрице W.
Достаточность. Пусть V — едииствепное по-
ложительно определенное решение уравнения A'V Д-
4- VA ~ —W, где W — симметрическая положительно оп-
ределенная матрица. Проверьте, что предположение о
симметричности матрицы W не нарушает общности рас-
суждений. Для сокращения записи введем обозначения:
v (/) == х' (Z) Fx (/), и? (?) = х' (I) TFx (/). Тогда в силу
уравнения х (/) = Ах (/) имеем
p(i) = V (t)Vx(t) + x,(t)Vx(t)=x'(t)(A'V-VVA)x(t) -
= — х' (/) IFx (/) — w (0.
Так как матрицы W и У симметричны и положительно
определены, то для любого х в силу теоремы 9 § 8 имеют
место оценки
Х-(1У)||хГ<!р(()<У(Т¥)|х|р,
V(7)|xF<v(«)<V(V)hF.
Из этих неравенств следует, что
где (W) — минимальное собствеииое значение матрицы
W, а (V) — максимальное собственное значение мат-
рицы V. Обозначим а = X- (TF)A+ (F). Тогда имеем не-
равенство
р (0 А —аг? (О» а >> 0.
188
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
(ГЛ. III
Интегрируя это неравенство в пределах (0, сю), получим
оценку для v (/):
v (t) v (0) ехр (—а?) = х' (0) V х (0) ехр (—а/).
Из этой оценки следует, что v (/) -> 0 при t -> оо, а это,
очевидно, возможно тогда и только тогда, когда х (£) -> 0
при t -> оо. Стремление к нулю любого решения уравне-
ния х (/) = Лх(0 в силу теоремы 2 § 15 эквивалентно
устойчивости матрицы А.
Необходимость. Пусть А — устойчивая мат-
рица. Тогда по теореме 4 § 12 существует единственное
решение 7 уравнения AV + VA' = — W при любой W.
Покажем, что это решение положительно определено, если
W — положительно определенная. По теореме 5 § 12 мат-
рица 7 представима в виде
7 = f eA>tWeAtdt,
о
поэтому при любом постоянном х0 имеет место неравен-
ство
со со
Xq 7х0 — j x'oeA'fWeAfxodt = ^xf (t) Wx (t) dt 0,
о о
которое следует из положительной определенности матри-
цы W. О
Приведем ряд полезных следствий, вытекающих из
теоремы Ляпунова.
Следствие 1. Для того чтобы матрица А имела
заданную степень устойчивости а, т. е. Re Xf (Л) —а
для всех i = 1, 2, . . ., п, необходимо и достаточно, чтобы
для любой заданной положительно определенной, симмет-
рической матрицы W существовало бы положительно оп-
ределенное решение уравнения
-2а7 Л'7-h VA = -W.
Доказательство. Условие Re Х$ (Л) < —а
эквивалентно условию Re Хг [А — clE} <0. Это сразу
следует из характеристического уравнения матрицы А.
Поскольку для устойчивой матрицы [А — аЕ] должна
выполняться теорема Ляпунова, подстановка в уравнение
§ 16] ВТОРОЙ МЕТОД ЛЯПУНОВА 189
A'V 4- VA = —W вместо А матрицы [Л -- aA'I доказы-
вает следствие. Q
Следствие 2. В условии теоремы Ляпунова тре-
бование положительной определенности матрицы W мож-
но заменить более слабым требованием неотрицательной
определенности W при условии, что вдоль решений системы
квадратичная форма х' (/) Wx (t) не равна тождественно
нулю при любых ненулевых начальных условиях.
Доказательство. Ойо сохраняется неизмен-
ным для необходимости условий следствия. Докажем дос-
таточность. Пусть имеется положительно определенное
решение 7 уравнения A'V -г VA == — W. Тогда в силу
предположения имеет место неравенство х' (/) Т7х (7) <; О
при всех х (О У= 0 и всех t Л» 0. Но
i> (£) = —w (0 = — х' (0 Т7х (/).
Интегрируя, получим равенство
t
х' (£) 7х(£) = х' (0) 17х(0) 4- J х' (t)Wx(t)dt.
о
Предположим, что х (г) не стремится к пулю при t —> ос.
Тогда найдется s 0 такое, что неравенство х' (/) Ж(х)(г) <
<7 —е выполнено при всех t. В этом случае
х’ (0 7х (/) < х' (0) Жх (0) — г1
и при t —> сю выражение справа становится отрицатель-
ным. Это противоречит предположению о положительной
определенности 7. 0
Теорема Ляпунова сводит проверку устойчивости мат-
рицы А к решению линейного матричного уравнения.
Поскольку матрица 7 — симметрическая, то уравнение
Ляпунова эквивалентно системе п (п ' 1)/2 линейных ал-
гебраических уравнений. При большой размерности мат-
рицы А решение такой системы оказывается иногда менее
трудоемким, чем вычисление характеристического много-
члена матрицы А- Функции v (/) = х' (/) 7х(<), где
7 — положительно определенная симметрическая мат-
рица, удовлетворяющая условиям теоремы Ляпунова,
называются квадратичными функциями Ляпунова.
Подытожим теперь результаты, полученные при ис-
следовании асимптотической устойчивости стационарной
системы.
190
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. Ш
Теорема 2. Матрица А является устойчивой
тогда и только тогда, когда выполнено одно из следующих
эквивалентных утверждений:
1. Все решения уравнения х (t) -= Ах (t) исчезают при
t —> оо .
2. Уравнение A'VA~ VA = — W имеет положитель-
но определенное решение V для любой положительно
определенной матрицы W.
3. Уравнение A'V С VA = — W имеет положится ь.
но определенное решение V для всякой неотрицательно
определенной матрицы W, такой, что квадратичная фор-
ма х (£) W х (£) не обращается в нуль тождественно вдоль
любого нетривиального решения х (t).
4. Строго положительны все определители Гурвица.
5, Строго положительны все диагональные элементы
матрицы- Рауса.
Геометрический смысл метода. Напомним, что всякая
положительно определенная матрица V может быть ис-
пользована для определения скалярного произведения в
евклидовом пространстве по формуле <хп х2) = Vx2.
Следовательно, геометрический смысл метода Ляпунова
исследования устойчивости стационарной системы за-
ключается в том. что мы изучаем изменение расстоя-
ния от движущейся точки до начала координат. Если
расстояние с течением времени строго монотонно умень-
шается, то система асимптотически устойчива. При таком
движении функция х' (t)Vx(t) = v(t, х) при каждом
значении времени может быть интерпретирована как не-
которая замкнутая выпуклая поверхность (м-мериый эл-
липсоид), причем, если С < t2, то выполнено неравенство
х' (tj) Vx (/j) > х' (Z2) Vx (i2). Это неравенство соответ-
ствует тому, что поверхность, соответствующая большему
значению времени, заключена внутри поверхности, кото-
рой соответствует меньшее значение времени.
Функции Ляпунова нестационарной системы. В пря-
мом методе Ляпунова близость х (i) к началу координат
определяется с помощью функции Ляпунова v (t) =
= х' (t) V (х) (г). Если величина v (i) мала, то будет мала и
величина || х (/) | и точка х (t) будет близка к началу коорди-
нат. В нестационарном случае функция Ляпунова, вообще
говоря, зависит явно от времени. В этом случае знако-
определенная функция г?(х, f) в обычном понимании может
§ 16] ВТОРОЙ МГТОД ЛЯПУНОВА 491
сделаться малой по модулю яс за счет близости х (Z) к
началу координат, а за счет изменения времени t. Так,
например, функция v (х, t) — е"!.г- (I) в обычном смысле —
положительно определенная: V (Z) = а_( > 0 при всех
t и обращается в пуль только при х (Z) = 0. Однако су-
дить о близости точки х (Z) к началу координат по этой
функции нельзя, так как при достаточно больших значе-
ниях t за счет уменьшения множителя е( она будет мень-
ше любого наперед заданного положительного числа е
при любом конечном значении х (t). Поэтому в нестацио-
нарном случае необходимо специально определить класс
квадратичных нестационарных функций, которые решали
бы вопрос об устойчивости системы.
Определение 1. Вещественная непрерывная
функция v (х (£), t) = х' (Z) V (Z) х (t) называется поло-
жительно определенной, если существует положительная
постоянная а такая, что при всех t выполнено неравенство
v (х (t), > а I х (Z) || 0 0.
Функция v (х (Z), t) называется отрицательно определен-
ной, если найдется а Д> 0 такое, что
при всех t. 0
Теперь мы определим квадратичную функцию Ляпу-
нова в нестационарном случае.
Определение 2. Положительно определенная
функция и (х, f) = х' (/) V (Z) х (f) называется квадратич-
ной функцией Ляпунова для системы х (0 = А (I) х (0,
если выполнены следующие условия:
1. Существует а Д> 0 такое, что
п (х, f) 0 а || х ||2.
В этом случае говорят, что функция v (х, Z) имеет беско-
нечный высший предел.
2. Производная по времени v (х, Z) в силу уравнений
движения является отрицательно определенной функцией,
т. е. существует 0> 0 такое, что
v(x, Z)< — т|]х[|2<0. О
Существование квадратичной функции Ляпунова эк-
вивалентно для линейной системы экспоненциальной
устойчивости. Об этом свидетельствует
192
УСТОПЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ ш
Теорема 3. Если для системы х (Z) = Л (I) х (0
существует квадратичная функция Ляпунова v (х, t), то
эта система равномерно асимптотически устойчива.
Доказательство. Поскольку v (х, б) — квад-
ратичная функция Ляпунова, то она ограничена сверху
v (х, t) а ||х|2. Отсюда имеем
v (х, t) — p j х|(3 — (3/а) v (х, Г).
Интегрируя это неравенство, получим, что v (х, 0 ограни-
чена сверху значением exp [ — (P/а) (Z — Z0)l v (х0, Zo).
Поскольку г (х, Z) > © || х ||, то это означает, что
I х (0||< ехР С —(P/W “ ^о)1 v (хо,
и, следовательно, система экспоненциально устойчива. В
то же время, согласно теореме 7 § 15, экспоненциальная
устойчивость эквивалентна равномерной асимптотиче-
ской устойчивости. Q
Из этой теоремы и равенства, получаемого путем диф-
ференцирования квадратичной формы v (х, I) по времени:
v (х, Z) х' (0 V (?) к (/) + х' (0 V (Z) х (0 х' (Z) V (0 х (?) =
= х' (Z) [A' (t) V (t) + V (() А (Z) -h V (Z)] х (if),
непосредственно вытекает
Следствие. Для того чтобы система х (Z) ~ A (z)x (2)
была асимптотически устойчива, достаточно, чтобы
существовало решение уравнения
V (t) + А' (I) V (0 + V (О A (Z) = W (I) (I)
в виде положительно определенной матрицы V (£) при лю-
бой отрицательно определенной матрице W (Z). Q
Напомним, что (1) было получено в § 12 при рассмот-
рении задачи об оценке квадратичного функционала вдоль
решений системы. Для стационарных систем согласно
теореме Ляпунова существование функции Ляпунова яв-
ляется не только достаточным, но и необходимым условием.
Для | нестационарных систем имеет место аналогичное
утверждение. Если система экспоненциально устойчива,
то найдется соответствующая квадратичная функция Ля-
пунова. Об этом свидетельствует
Т е о р е м а 4. Пусть A (f) — ограниченная матрица
и уравнение х (Z) = A (f) х (Z) экспоненциально устойчиво.
§ ±6j
ВТОРОЙ МЕТОД ЛЯПУНОВА
193
Пусть, далее, W (t) — ограниченная симметрическая по-
ложительно определенная матрица. Тогда интеграл
V (0 = j Ф' (о, 0 W (о) Ф (б, 0 do
t
сходится при всех вещественных t и поизводная х' (?) V (0 х (0
вдоль решений х (0 = А (0 х (t) равна —х' (?) W (0 х(0.
Более того, если W (0 &Е для всех t, то существуют
положительные постоянные т|1} ц2 такие, что
цгЕ > V (0 > т]2£.
Доказательство. Так как W (0 ограничена,
то найдется а > 0 такое, что W аЕ. По условию экспо-
ненциальной устойчивости системы х (0 = А (0 х (0
найдется пара положительных постоянных у, X таких, что
IJ Ф (б, 0 ] уе-^а~г>, б > t.
Используя эти две оценки, мы видим, что V (0 ограниче-
на сверху следующим неравенством:
F (0 ’С f Е ds = (а/2Х)у3£г.
Вычисляя производную квадратичной формы х' (0 V (0 х (£)
вдоль траектории движения, имеем
х' (0 V (Z) X (Z) = х' (0 [A' (0 V (() + V (0 А (0 + V (0] X (0 =
= х' (0 { f [ А' (0 Ф' (я, 0 W (я) Ф (я, 0 +
t
4- Ф' (б, 0 IF (б)Ф (б, 0 А (0] do} х (0 ф-
©о
+ x'(0-^{j Ф'(б, 0 TF (б) Ф (б, 0йб}х(0 -
t
= х' (0 [Ф' (б, 0 W (б) Ф (б, 0] Йб} X (0 =
z
= — х' (0TF (0 х(0.
При переходе от второго выражения к третьему мы
использовали дифференциальное уравнение для матрицы
7 Ю. Н. Андреев
194
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. III
Ф (з, 0. При выводе последнего выражения мы исполь-
зовали факт Ф (i, t) = Е. Чтобы доказать, что х' (t) V (i) X
X х (2) есть квадратичная функция Ляпунова, осталось
лишь убедиться в том, что она ограничена снизу. Пусть
|] A (0 || а для всех t и пусть W (0 0 &Е 0. Тогда
для х (0 = A (0 х (0
||i (0Ка1х<0!1-
Интегрируя это неравенство, получим
I Ф (б, 0 X || > || х ||_
Используя это неравенство для оценки х' (г) V (0 х (0,
получим
х' (0 V (0 х (0 = j {х' (0 Ф' (о, 0 W (б) Ф (б, 0 х (0) d<5
t
В силу этой теоремы условие следствия теоремы 3 яв-
ляется необходимым и достаточным.
В заключение приведем сводку условий, гарантирую-
щих равномерную асимптотическую устойчивость неста-
ционарной системы.
Теорема 5. Для линейной однородной системы
х (0 А (0 х (0 с непрерывной ограниченной матрицей
А (0 эквивалентны следующие утверждения:
1. Нулевое решение равномерно асимптотически устой-
чиво.
2. Существуют положительные постоянные а, 0 такие,
что || Ф (i, i0) [[ ае_^_М.
3. Существует квадратичная функция Ляпунова
х' (0 V (0 х (0, производная которой вдоль уравнений
движения является отрицательно определенной функцией
к' (0ТУ (0 х (0.
4. Матричное уравнение Ляпунова
V (0 + А' (0 V (0 + V (0 А (0 = W (0
имеет положительно определенное решение V (0 при лю-
бой отрицательно определенной матрице W (0. 0
§ 16J
ВТОРОЙ МЕТОД ЛЯПУНОВА
195
Задачи. 1. Докажите, что положительно определенное решение
V уравнения
Л'Г-Н VA + 2aPF= О
(где W — симметрическая положительно определенная матрица и
а > 0), удовлетворяющее условию V < W, существует тогда и
только тогда, когда вещественные части собственных чисел матрицы
А меньше величины —а.
2. Докажите, что если уравнение х (i) = A (t) х (i) равномер-
00
но асимптотически устойчиво и интеграл \ ц f (о) |] do существует,
о
то все решения уравнения х (i) = A (t) х (f)+ (г) ограничены.
3. Докажите, что для устойчивости многочлена
X3 + ai№ + яз ~ О
необходимо и достаточно выполнение условий: аг, а2, as О,
Я2Я1 — я3
4. Вычислите функцию Ляпунова для системы х (/) =
= eFtAe~Ftx (t), предполагая, что eFt — периодическая матрица,
а матрица Л + Р устойчива. Воспользуйтесь тем фактом, что
если система х (i) = A (t) х (i) экспоненциально устойчива и
х' (f) Q (?) х (() — соответствующая функция Ляпунова, то z'Pz(i)X
XQ (О Р (0 z будет функцией Ляпунова экспоненциально устойчивой
системы z (t) = [Р (г) A (t) Р' (0 Р (О Р-1 (01 z О)* тпп 2 (0 =
= Р (i) х (() ~ преобразование Ляпунова.
5. Докажите, что если A (t) имеет период Т и система х (i) =
= A (f) х (() экспоненциально устойчива, то существует положи-
тельно определенная матрица У (О, которая имеет период Т, а
х'У (i) х является функцией Ляпунова для х (i) = A (f) х (f).
6. Покажите, что многочлен (—1)п [В — ХЕ |, где
— Ьп 0 1
В — б — ^n-i о
о 0 ~
о о
о о
О 0 0 ... О 1
О О О .. . — Ь3 — Ь1_
совпадает с многочленом Хта + = ср (X) тогда
и только тогда, когда
,. * t д2 . Дз , Дг-зДг
Ьх- Дь &г = , Ь3 = ..... Ьг = дг_3дг1
г = 4, 5, . . . , п
(Д$ — определители Гурвица полинома <р (X)).
7. Рассмотрите положительно определевгаую матрицу
п п-1
V = diag [ П П - • • • ’ &2bb 61] ,
<=1 <=1
7*
196
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[1 Л. ш
где bi определены в условии задачи 6, и покажите, что
А [х' (i) Fx (£)] = — 2VBx '(i) X (i) = — 2ЪпХп.
Воспользовавшись этим фактом и следствием 2 теоремы Ляпунова,
докажите критерий Рауса — Гурвица.
8. Могут ли матрицы
sin2 i О "I Г t
О sin21J ’ [— cos t
— cos t
t
соответствовать квадратичным функциям Ляпунова?
9. Являются ли положительно определенными функции
>> х1,
1) v (х, г) = я-4- ,
2) у (х, £) = я2 ж2-}- А. ж1.г2 sin i?
§ 17. Функции Ляпунова и оценка качества
переходного процесса
Оценка длительности переходного процесса. Пусть
матрица А устойчива, а V — положительно определенное
решение уравнения AV -г VA' — —Е, где Е — единич-
ная матрица. Запишем неравенство теоремы 9 § 8 в виде
(1)
В силу уравнения .4 F - VA' = —Е имеем
^)=4-(х'(«их(0)=-1х(ор,
и наше неравенство принимает вид
__ < р (А < _ .
V (7) v Х+ (7) >
dt
или, домножая на ——— , имеем
V (О
dt dv dt
FgT ~ моТ •
Интегрируя это неравенство, получим
у (0) exp (-Z/V (F)) < V (0 < V (0) охр (И)).
§ 17]
ФУНКЦИИ ЛЯПУНОВА
197
Воспользовавшись теперь неравенством (1), получим оцен-
ку нормы вектора х (/) вдоль траектории движения:
Х+(Г) ехр[ — МП Iх II3 ' МИ ехр [ — V (К) ]'
Пользуясь этим неравенством, легко оценить время пере-
хода системы из любого заданного начального состояния
х0 внутрь е — окрестности начала координат. Действи-
тельно, пусть х (0) = Xq, а || х (i)p е2. Получим оцен-
ку для времени переходного процесса t. Из (2) имеем
х- (К) PL .г
откуда сразу следует
М-v (V)inf х~,(7)еЧ.
I хотХо j
Таким образом, если известна функция Ляпунова
х' (?) Рх (г), то по заданному начальному состоянию
системы х0 можно, не решая уравнений системы, полу-
чить оценку для длительности переходного процесса, при-
водящего систему в начало координат.
Оценка квадратичного отклонения. Рассмотрим урав-
нения движения устойчивого стационарного объекта
х (г) = Лх (0. В § 12 показано, что величина
J = х'(0 Wx(t) dt,
о
где W — положительно определенная матрица, может
быть оценена по формуле
J = х' (0) Их (0).
где V — положительно определенная матрица, которая
является решением уравнения Ляпунова
A'V-b VA = -W.
Таким образом, знание функции Ляпунова позволяет
оценить среднеквадратичное отклонение траектории дви-
жения от нуля, не решая уравнений объекта.
Обсуждение. Резюмируя наш краткий обзор прямого
метода Ляпунова, отметим следующее.
198
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. III
1. Второй метод Ляпунова является эффективным ин-
струментом исследования устойчивости движения и харак-
тера переходного процесса в линейных объектах. Для
проведения такого исследования не требуется решения
уравнений объекта.
2. Если можно найти функцию Ляпунова, то метод
становится конкретным инструментом, позволяющим ис-
следовать динамику управляемого объекта. В линейном
стационарном случае это всегда можно сделать, решив ли-
нейное матричное уравнение Ляпунова.
3. Уже в формулировке второго метода содержится
идея о придании системе заданных свойств. Правда, эта
идея выражена пока косвенно. Именно, система устойчи-
ва, если можно найти (построить, угадать) функцию Ля-
пунова, которая решает вопрос об устойчивости. Посколь-
ку эта функция имеет ясный геометрический смысл и,
кроме того, поскольку с помощью этой функции можно
количественно оценить основные черты переходного процес-
са, то задачу конструирования системы с заданными свой-
ствами можно формулировать так: выбрать структуру сис-
темы, или какие-то элементы этой структуры, имеющиеся в
нашем распоряжении (например, цепи обратной связи),
таким образом, чтобы замкнутая система обладала задан-
ной функцией Ляпунова.
Численное решение уравнения Ляпунова. Рассмотрим
задачу численного решения уравнения A'V -f- VA = —W
для случая, когда матрица А устойчива, а матрица W
неотрицательно определена. Согласно теореме 5 § 12 ре-
шение уравнения Ляпунова в этом случае можно пред-
ставить в виде
СО
V — eA4WeA!dt.
о
Воспользуемся для численного определения этого интег-
рала формулой прямоугольников, тогда
со сс
$ eA'(WeA1dt = limA 2 eA'^WeA™.
О fl'*°
Для вычисления матричных экспонент используем
алгоритм § 13. Тогда
eAh = д = [12Е - 6М + ^МЧ-Ч12£ + 6М + ЬМ«].
§ 17]
ФЪ НКЦ1П1 ЛЯПУНОВА
199
Отсюда следует, что
gAJift __ ДК
и поэтому формулу для V можно переписать так:
F = 2 h [ТУ + А'ТУА + А'ЧУА2 + ... J-A'AFA^-i-
к=о
Обозначим частичные суммы этого ряда через Ук.
Тогда нетрудно видеть, что Fk можно вычислить, пользу-
ясь следующей рекуррентной формулой:
Vl+1 = A'2tFtA2t + П, 4 = 1,2,...,
причем Ft = hW 4- A' hWA.
Решение уравнения Ляпунова будет пределом частич-
ных сумм Fk, т. е.
F = lim Fk.
Алгоритм решения уравнения Ляпунова состоит из
следующих шагов:
1. Выбираем h^> 0.
2. Вычисляем матрицу
А = [12£ - 6Ы + №А2]-Ч12£ + 6ДА + ^2А2],
3. Вычисляем матрицу Уг — h [ТУ -J- А'ТУА].
4. При к = 1, 2, . . вычислим
= A'2ftFfcAafc + Ffe.
Величина h должна выбираться так, чтобы обеспечить
достаточную точность вычислений. В работе [58] реко-
мендуется значение h выбирать по формуле
д--------1____
Л ” 200 | V (Л) | >
где V (А) — доминирующее собственное значение мат-
рицы А, т. е. Хг (А) V (А), I = 1, 2, . . п.
Заметим, что алгоритм является устойчивым при лю-
бых значениях h, поскольку, как было показано в § 13
(теорема 2), все собственные значения матрицы Д ио
модулю меньше единицы.
Требуемый объем памяти машины при этом алгоритме
составляет 4тг2 слов. Время вычислений при больших п
200
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. ш
можно оценить по формуле [58] (2}5/с -|- 4)п3р, где и —
время операции умножения, к — число итераций, исполь-
зуемых при вычислениях.
Задачи. 1. Оцените время, за которое система к (?) -= Лх (f)
с устойчивой матрицей
Г 0 1 0"
А = 0 0 1
L-1 -3 — 3_
попадет на единичную сферу х% ф- х3 ф- 1 из начальной точ-
ки х' (0) = [3, 5, 7].
2. Оцените величину
J = х' (i) х (0 dt
а
для движения системы задачи 1 из точки х'о = [10, 2, 1] в начало
координат.
3. Составьте программу для ЦВМ решения матричного урав-
нения Ляпунова, пользуясь приведенным в тексте алгоритмом, для
случая п = 4.
4. Для системы х (() = Лх (i) ф- hu (/), где
выберите вектор k' = [&п так, чтобы на репгениях системы
(f) — [А — bk] х (() достигала минимума функция
ОС
J = xr Р) х (0 dt.
о
Чему равна оптимальная функция Ляпунова?
§ 18. Постановка задач управления
Обсуждение вопросов устойчивости вплотную подводит
нас к постановке задач аналитического проектирования
систем управления.
Следующие основные ситуации характерны для задач
синтеза управляемых линейных конечномерных объектов.
1. Задано желаемое соотношение между входными и
выходными величинами и (?) и у (£). Требуется выбрать
структуру системы (матрицы А, В, С) таким образом,
чтобы получить это соотношение.
§ 18] ПОСТАНОВКА ЗАДАЧ УПРАВЛЕНИЯ 201
2. Задана структура системы (матрицы А, В, С).
Требуется найти входные управляющие воздействия та-
ким образом, чтобы выход системы имел бы заданные
свойства.
Первая из этих задач решается в рамках теории реали-
зации линейных систем, которая здесь не рассматривается.
Вторая задача, которая будет предметом нашего иссле-
дования, может быть названа задачей управления систе-
мой заданной структуры. Качественно эту задачу можно
сформулировать одним из следующих способов.
Задача программного управления. Заданы уравнения
системы и некоторое начальное состояние. Требуется
выбрать управляющую функцию и (/) такую, чтобы систе-
ма перешла в заданное конечное состояние. Если при
этом требуется минимизировать некоторую функцию от
управления и(или) от траектории, то задача называется
задачей оптимального программного управления.
Примером задачи программного управления является
задача вывода ракеты в заданную точку пространства
с заданной скоростью, задача выбора расходов топлива
по зонам нагревательной печи таким образом, чтобы тем-
пература зон менялась бы в соответствии с заданной про-
граммой. Задачей оптимального программного управле-
ния является задача выбора параметров технологического
режима, обладающего каким-либо оптимальным свойст-
вом, или задача выбора такой траектории движения
объекта, которая удовлетворяла бы свойству оптималь-
ности. Типичными критериями при постановке таких
задач являются: время переходного процесса (задачи
быстродействия), расход энергетических ресурсов, на-
дежность выполнения некоторых условий ограничиваю-
щего характера и т. п. Решение этих задач связано с ре-
шением вариационной задачи. Основным инструментом
здесь является принцип максимума Понтрягина. Как
правило, задачу программного управления приходится
решать для нелинейных уравнений движения объекта.
Решения простейших задач программного управления
для линейных объектов будут приведены в главах IV
и VII.
Задача регулирования. Постановка этой задачи свя-
зана с введенной Ляпуновым концепцией возмущенного
движения объекта. Невозмущенное движение объекта —
202
УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ
[ГЛ. 111
это движение под действием заданного управления, опти-
мального или пеоптимального. Если это движение из-за
неточности в задании начальных условии, из-за помех,
поступающих из окружающей среды, дрейфа параметров
объекта во время его движкния или иодругим причинам
отклоняется от расчетного номинального движения, то,
вводя вектор х (/) отклонении действительного движения
от номинального, можно получить уравнения возмущен-
ного движения относительно этого вектора х (f). Если
считать отклонения малыми, то уравнения возмущенного
движения будут линейными относительно вектора х (i).
В терминах уравнений в отклонениях или уравнений воз-
мущенного движения задача стабилизации номинальной
траектории движения сводится к выбору таких управ-
ляющих воздействий в функции переменных состояния
уравнений возмущенного движения, чтобы обеспечить
уменьшение этих отклонений во времени. Для линейной
модели это означает, устойчивость нулевого решения одно-
родного уравнения.
Эта задача является типичной и для тех случаев,
когда объект подвержен действию нежелательных воз-
мущений, которые влияют на его выходную величину.
Например, эту задачу решает регулятор положения
радиолокационной антенны, которая отклоняется от за-
данного положения из-за порывов ветра.
Помимо задачи о конструировании регулятора, для
линейных объектов часто представляет интерес задача
о выборе таких управляющих воздействий в функции со-
стояния, когда выходная переменная следит за соответ-
ствующим наблюдаемым входным воздействием, принад-
лежащим некоторому заданному классу функций. Это
так называемая задача слежения. Эту задачу» например,
необходимо решать в случае, когда радиолокационная ан-
тенна должна следить за летящим самолетом или когда
требуется стабилизировать движение летательного аппа-
рата вдоль заданной траектории.
Задача регулирования является частным случаем за-
дачи о следящей системе, когда отслеживаемый сигнал
равен нулю. Однако часто справедливо и обратное утвер-
ждение. Задачу о следящей системе можно свести к задаче
регулирования, если всякую ошибку слежения (разность
между заданным отслеживаемым сигналом и выходом си-
S 18^ ПОСТАНОВКА ЗАДАЧ УПРАВЛЕНИЯ 203
стемй) рассматривать в качестве регулируемой переменной.
Поэтому основное внимание в дальнейшем будет уделено
задачё регулирования, точная математическая постановка
которой такова:
Дан линейный конечномерный объект
х(г) = Л(г)х(0 + 5(«)и(0, j
yP) = C(«)x(i)- f ' ’
Пусть в некоторый момент времени iQ объект оказался в со-
стоянии х (t0) 0. Требуется выбрать такое управляющее
воздействие u (i), зависящее от начального состояния
х (/0), Которое приводило бы объект в начало координат
пространства состояний. Этот переход должен осущест-
вляться либо за конечное время — i0 0, либо вектор
состояния х (i) должен асимптотически приближаться к ну-
левому значению при t—> оо, т. е. должно выполняться
одно из двух условий:
1) либо х (it; t0, х (i0), u (i)) = 0.
2) либо x (i; i0, x (f0), u (i)) -> 0 при t-> co.
Пас будет интересовать управляющая функция, ре-
шающая эту задачу, не только в виде некоторой функции
времени (управление по разомкнутому контуру), но глав-
ным образом в виде функции от состояния, либо выхода
объекта, т. е. в виде u (i) = и (f, х (i)), или в виде
и (i) = и (i, у (£)) (управление #по замкнутому контуру
или управление в виде обратной связи). Основное вни-
мание будет уделено стационарным регуляторам, которые
обеспечивают асимптотическую устойчивость объекта, ох-
ваченного обратной связью.
Замечание! Еще раз подчеркнем, что если в за-
даче программного управления обычно ищут управляю-
щее воздействие по открытому контуру, то в задаче регу-
лирования необходимо строить управление в функции
состояния системы (в виде обратной связи). Различие ме-
жду этими задачами аналогично различию между задачей
выбора некоторого решения дифференциального уравне-
ния, проходящего через некоторую заданную точку про-
странства состояний, и задачей исследования устойчи-
вости этого решения. Вторая задача требует изучения
204 УСТОЙЧИВОСТЬ ДВИЖЕНИЯ ОБЪЕКТОВ [TJp Ill
свойств всей совокупности решений уравнений объекта.
Поэтому методы аналитического конструирования, регу-
ляторов по существу совпадают с методами исследования
устойчивости решений дифференциальных уравненной. Так,
например. функция Ляпунова позволяет оценить все
существенные характеристики переходного процесса, и
поэтому задачу проектирования регулятора, обеспечи-
вающего стабилизацию заданного программного движе-
ния объекта, можно формулировать как задачу выбора
такой обратной связи, чтобы матрица замкнутой системы А
соответствовала заданной функции Ляпунова V.
\
\
\
\
ГЛАЗА IV
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
В этой главе исследуются свойства линейных обрат-
ных связей в управляемых системах для случая, когда
все переменные состояния могут быть измерены и поданы
па вход системы с соответствующим коэффициентом уси-
ления. Подробно будет исследовапа лишь задача о регу-
ляторе состояния линейной системы. Основной результат
решения этой задачи заключается в том, что для управ-
ляемой системы можно выбрать закон управления, обес-
печивающий произвольно хорошие динамические свойства
замкнутой системы (§ 23). В § 22 мы подробно обсудим
вопросы преобразования координат в пространстве состоя-
ний и введем понятие канонических представлений ли-
нейных стационарных систем в пространстве состояний.
При этом будут введены две канонические формы пред-
ставления систем, имеющих много входов и много выходов.
§ 19. Управляемость и достижимость
Понятие управляемости. Первый вопрос, который воз-
никает при исследовании задачи регулирования, состоит
в следующем. Если система находится в некотором на-
чальном состоянии х0, то существует ли непрерывное
управляющее воздействие u (i). которое переводит систе-
му в состояние хг х;| за время
Прежде чем обсудить этот вопрос с формальной точки
зрения и ввести соответствующие понятия, рассмотрим
примеры, показывающие, что этот вопрос не является
тривиальным.
Рассмотрим электрическую цепь на рис. 19.1. Перемен-
ной состояния этой системы будет напряжение на емко-
сти С, которое обозначим через х (f). Если х (f0) == 0, то,
206 ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ 1ГЛ.; IV
/
очевидно, х (t) =0 при всех t t0 вне зависимости от
входного воздействия и (i). /
Входное управляющее воздействие не оказывает влия-
ния на переменную состояния, поэтому про такую систе-
му говорят, что она неуправляема в момент времени t0.
Рис, 19.1.
В электрической цепи на рис, 19.2 две переменные
состояния а^, т2 равны напряжениям на емкостях.
Входное воздействие — напряжение на входе и (6 —
влияет на обе переменные состояния. С помощью входного
воздействия можно любую из двух переменных состояния
свести к любому значению, но нельзя привести к любому
значению состояние системы — вектор (а^, х2). Действи-
тельно, если (i0) = х2 (t0) — 0, то независимо от u (t)
имеем (£) = (/) при любых /, и, например, в состоя-
ние xt (ij) = 1, х2 (fj = 0 попасть нельзя. Поэтому
эта система тоже неуправляема.
§ 191 УПРАВЛЯЕМОСТЬ И ДОСТИЖИМОСТЬ 207
Введем теперь определение свойства управляемости.
Цп ределение 1, Событие (i0, х0) линейной си-
стемы
\ х (f) = A (i) х (i) + В (i) u (i)
называется управляемым относительно точки хх, если
существуют момент времени и управление u (i),
определенное на интервале t0 t tly которое переводит
событие (i0, х0) в событие (^, хД. 0
Обычно нас будет интересовать управляемость отно-
сительно начала координат: хх = 0.
Определение 2. Линейная система называется
управляемой в момент времени если каждое событие
(i0, х), где /0 фиксировано, а х X, является управляе-
мым. Если же момент времени не упоминается, то эти
свойства должны выполняться при всех i0. 0
Определение управляемости построено таким образом,
чтобы оно описывало необходимые и достаточные условия
существования регулятора в линейной системе. Напом-
ним, что цель регулятора состоит в том, чтобы перевести
систему из произвольного начального состояния х0 в не-
которое требуемое состояние хх, обычно совпадающее с на-
чалом координат.
Для линейной системы критерий управляемости фор-
мулируется с помощью свойств некоторого линейного
оператора (матрицы).
Управляемость системы с нулевой матрицей А. Рас-
смотрим простейший случай, когда матрица A (i) в
уравнении системы равна нулевой матрице. Тогда ди-
намика системы задана уравнением
х (0 = В (0 u (i), х (0 = х0,
х (i) — n-мерный вектор состояния, В (£) — матрица раз-
меров (п X т}. Предположим, что х (i0) и В (£) известны,
и поставим задачу выбора такого управления u (i), кото-
рое обеспечивало бы в момент времени t — ix i0 вы-
полнение условия х (0 = хх.
Интегрирование уравнения движения системы дает
х(0 = хо + B(t)u(t)dt,
/
/
208 ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ [гф IV
/
!
Заметим, что выражение /
г /
L(u) = jj B(t)u(t)dt ' (1)
ta
можно рассматривать как линейное преобразование, ко-
торое ставит в соответствие каждому элементу н (/) про-
странства С"1 [£0, элемент пространства R”. Формально
L(u): Cnl[f0, -К . u(Q-^x(4).
Поскольку нужно выбрать управление u (i), которое
удовлетворяло бы условию
п
Xi = х (fi) = х0 + J В 0) u (t) dt,
to
то, очевидно, если Xj — х0 лежит в области значений ли-
нейного преобразования L (и), тогда желаемый перевод
системы в xt возможен, В противном случае — нет. Чтобы
сформулировать эту задачу в общем виде, введем соответ-
ствующие определения.
Если В (/) — матрица п X т, составленная из непре-
рывных функций времени, определенных на интервале
t то преобразование L-. С"г [£0, -а- В/\ опре-
деляемое формулой (1), является линейным преобразова-
нием,
Говорят, что хх принадлежит области значении этого
преобразования, если существует элемент щ (() в простран-
стве Cm такой, что
ti
Л(иг) - В(1)иг(1)д1 = xv
Таким образом, чтобы проверить, является ли состоя-
ние управляемым, необходимо установить, лежит ли это
состояние в области значений оператора L (и), преобра-
зующего бесконечномерное пространство в конечномер-
ное. Этот оператор не может быть записан с помощью
конечной матрицы, и проверка названного условия за-
труднительна. К счастью, можно построить линейное
преобразование, отображающее п-меряое пространство
в л-мерное, область значений которого в точности совпада-
ем
о?
§ 19]
УПРАВЛЯЕМОСТЬ и достижимость
209
ет с областью значений оператора L (и). Это построение
формулирует следующая
Л е j,! м а. п-вектор хг лежит, в области значений
оператора
L (u) = В (t) и (?) dt
'°
тогда и только тогда, когда он принадлежит области
значений линейного преобразования
й
IF (?о, ?Д - 5 B(f)Br(t)dt. (2)
to
Необходимость, Если хг GE range W (?0, ?ф то
существует вектор zx такой, что W (?0, ?Д zx -= хр Опреде-
лим u (?) по формуле и (?) = В' (t) zx, тогда
fa it
В (?) и (?) dt - В (?) В' (?) <2?zv
ia io
Достаточность. Если xt не лежит в области
значений оператора W (?0, то существует вектор х2
такой, что W (?0, ?1)х2 = 0 и одновременно х^хх #= 0.
Можно указать, например, следующий способ построе-
ния вектора х2. Так как W (?0, ?г) -- симметрический опе-
ратор, он расщепляет пространство В1 в прямую сумму
R ' X range IF (?с, ?J ф ker W (?0, ?i).
Пусть размерность ядра W (?0, ?J отлична от нуля и пусть
г — размерность области значений W (t0, ?г) (г равно
рангу матрицы W). Выберем в Rnбазис et, еа, . . ег, . . ,
> . еп такой, что векторы et, е2, . . ., еТ лежат в области
значений IF (?0, ?t). Пусть хг не лежит в области значений
IF (?0, ?г) и его представление в выбранном базисе имеет
вид
Xi = ФС1 ф ф .,. ф лгсг ф »,, ф ane<ri,
причем аг. ссг+1, иг4.3. . . ап нс все равны нулю. В каче-
стве вектора х2 можно взять, например, вектор
Х3 — ^r+lCr+i Ф &г+2ег+2 Ф . - Ф
210
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[/л. IV
Ясно, что х2 О, по предположению, и кроме у го,
хзх1 = ^г+1+ ®г+2 Ч-... 4~ > 0* j
Продолжим доказательство. Пусть вектор Xj €£ rang(^ W (!0, !Д
и одновременно является управляемым. Из управляемости
хг следует, что существует их (!) такое, что
и
В (!) Ui(t) dt = xlt
t»
тогда
о
х%В (!) пг (t) dt = х2хг Ф О,
<0
но
it
Xj¥(!0, tl) х2 = 5 lX2^(Z)l I#' (0 X4 dt = 0‘
io
Так как В (!) непрерывна, то из
/1
xJV (!0, Q х3 J || В' (!) xsl|2 dt = О
to
следует, что B'(t) х2 = 0 при всех !0 !г, а это про-
тиворечит условию
ti
J х2В (t) dt ^0. 0
r«
Следствие. У правление и (!), которое переводит
состояние системы х (!) = В (!)и (!) из х0 при t = !0
в Xj при t = !ь существует, тогда и только тогда, когда
вектор Xj — х0 лежит в области значений линейного
преобразования (2).
При этом одно из управлений, осуществляющее этот
перевод, имеет вид и (!) = В' (i)z, где z является любым
решением уравнения
W (!0, ii) Z = хг — х0.
Доказательство. То, что управление
и (!) = В' (!) z переводит состояние х0 в хг, проверено
при доказательстве необходимости условии леммы. Об-
$19] \ УПРАВЛЯЕМОСТЬ И ДОСТИЖИМОСТЬ 211
\
ратно. ^сли управление и (?), переводящее х0 в xls суще-
ствует, то вектор х( - xft принадлежит области значений
линейного преобразования (1) в силу формулы Коши.
Но по данной лемме вектор (хх — х0) тогда и только
тогда принадлежит области значении этого преобразова-
ния, когда он лежит в области значений преобразования
(2). О
Критерий управляемости. Перейдем теперь к линейной
системе общего вида, когда А (?) =# 0. Здесь результат,
аналогичный только что приведенному следствию леммы,
формулируется в виде следующей теоремы.
Теорема 4 (критерий управляемости). Для ли-
нейной системы
х (?) - А (?)х (?) + В (?) и (?)
тогда и только тогда существует управление и (?), кото-
рое переес дат систему из состояния х0 при t = t0 в состоя-
ние хх при ? — ?х ?0. когда вектор х0 — Ф (?ц, ?J хг
принадлежат об гасти значении nine иного преобра зова-
ния
и
w (?0, м - ф (?о, ?) в (?) в' (?) ф' е0, t) dt.
Более того, если х# — какое-либо решение уравнения
PF (?о, ?i) х# — х0 Ф (?о, ?J Xj,
то и (?), заданное формулой и (?) = —В! (?) Ф' (?0, ?1)х#,
является одним из управлений, обеспечивающих указанный
переход.
Доказательство. Рассмотрим линейное пре-
образование уравнений системы с помощью замены пере-
менной z (?) = Ф (?0, ?) х (?). Тогда х (?) = Ф (?, ?0)z (?) и
Ф (t, Zo) z (?) + Ф (?, ?0) z (?) = А (?)Ф (?, t0) ъ (t) + В (?) и (?),
но Ф (?, ?0) = А (?)Ф (?, ?0) по свойству 6 переходной ма-
трицы. Значит,
Ф (?, t0)z (?) - В (?)и (?).
Умножая это равенство слева па Ф (?0, ?), получим
z (?) = Ф (?0, f)B (?) и (?).
212 ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ ДЛ, IV
Из предыдущей леммы известно, что множество значений,
которые может принимать вектор z (4) — z (i0), /принад-
лежит области значений матрицы
и
И7 («о, <1) = $ Ф («о, О В (О В' (О Ф' (У О di-
й
Чтобы завершить желаемый переход, потребуем, чтобы
Z (?1) — Z (f0) = Ф (ta, ч) Xj — Ф (/о, /0) х0 = Ф (iOf Ч) Х1 — х0.
Отсюда следует, что желаемое преобразование возможно
тогда и только тогда, когда [х0 — Ф (i0, 4) xj лежит в об-
ласти значений W (t0, it). Из следствия предыдущей леммы
вытекает, что одно из управлений, обеспечивающее задан-
ное преобразование системы, имеет вид
и (i) =- — в' (ОФ' (Он 0х* >
где х# удовлетворяет равенству
W (i0, ijx# = х0 — Ф (io, Oxj.
Следствие. Если при некотором i0 и любых 4
матрица W (i0, 4) имеет максимальный ранг, то линей-
ная система управляема. Q
Матрица W (i0, ij играет важную роль в теории уп-
равления линейных систем. Основные свойства этой ма-
трицы содержит следующая
Теорема 2. Матрица W, определенная в формули-
ровке теоремы 1, обладает следующими свойствами'.
1. W (i0, 0) — симметрическая матрица.
2. W (i0, 4) неотрицательно определена для 0 i0.
3. W (io, 0) удовлетворяет линейному матричному
дифференциальному уравнению
i-t w (г, у = а (г) w (г, у + w (г, уд' (г) - в (f)B' (г),
ir (tL, tl) - 0.
4. W (i0, 4) удовгетворяет функциональному урав-
нению
IT (i0. 0) = W (i0, i) + Ф (h, t)W (t, Ч)Ф' (i0, i).
Доказательство. Свойство 1 сразу следует из
определения. Для доказательства свойства 2 рассмотрим
§ 191 \
УПРАВЛЯЕМОСТЬ И ДОСТИЖИМОСТЬ
213
произвольный постоянный вектор z. Тогда
\ г*
z'W (f0, z - г'Ф (i0, о) В (б) В' (б) Ф' (/о, о) z ds ==
to
G
= 5 \\в'(°)ф'(^> c)zF d°‘
g
Отсюда очевидно z'W (i0, i-^z^O для всех действитель-
ных z. Для доказательства свойства 3 достаточно вычис-
лить производную функции IV (t, по t. Используя
правило Лейбница, имеем
я
Ф (t, б) В (б) В' (б) Ф' (i, б) ds =
t
= - в (г) В’ (0 + \ 4 <ф (г’ 3>в (’)в' (°)ф' (*’ 3» ,1' =
t
tt
= —B(t) В' (i) + A (i) 5 Ф (t, 3) в (б) В' (б) Ф' (t, б) ds +
t
ь
-4- Ф (i, б) В (б) В' (б) Ф' (/, о) dsA' (i).
t
Используя это соотношение, легко проверить справед-
ливость дифференциального уравнения свойства 3. Гра-
ничное условие очевидно выполняется по определению
матрицы W (i0, ij.
Чтобы доказать свойство 4, представим интеграл в опре-
делении И7 как сумму двух интегралов
t
Go, h) $ Ф (to, з) В (б) В' (б) Ф' (/0, б) ds +
io
tt
-|- § Ф (tQ, б) В (б) В' (б) Ф' (t0, б) ds =
t
G
- IV (i0, t) + Ф (i0, i) $ Ф (t, б) В (б) В' (б) Ф' (f, б) </бФ' (i0, i).
214
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ IV
Из этого равенства сразу следует функционально^ урав-
нение свойства 4, если воспользоваться определением
Следствие. С расширением области интегриро-
вания ранг матрицы W (i0, £х) не убывает.
Доказательство. Так как W (t0, tj) неотри-
цательно определена, то
хЧУ (f0, ijx 0, для любого xF R .
Пусть при некотором имеет место строгое неравенство
х'И (i0, ij)x ^>0. Отсюда сразу следует, что | W (i0, j ^>0,
и значит, ранг матрицы W (i0, G) = п. Для любого t
имеем
w (;0, ;) = w (;0, гх) + Ф (;0, ;)Ф Go, *i)-
Первая матрица справа положительно определена, вто-
рая неотрицательно определена, значит, их сумма поло-
жительно определена и ранг W (i0, J) — н. Q
Управляемая система была определена как система,
которая может быть с помощью соответствующего управ-
ляющего воздействия переведена из произвольного на-
чального состояния в начало координат или в некоторую
точку пространства состояний. В некоторых случаях
полный вектор состояниях (i) не доступен для измерения.
В качестве выходных величин системы имеются лишь от-
дельные компоненты вектора состояний, нли линейные
комбинации его компонент. Тогда интересно исследовать
управляемость системы по отношению к выходной вели-
чине у (i). Нетрудно видеть, что решение вопроса об уп-
равляемости системы по отношению к ее выходной вели-
чине не представляет дополнительных трудностей, так
как выход системы связан с ее состоянием с помощью
алгебраического (а не динамического) соотношения
у (i) = С (t)x (i). Следующая теорема содержит необхо-
димое обобщение критерия управляемости.
Т е о р е м а 3. У правление u (i), котпорое переводит
выход системы (ЛС) в точку уг при t = £0, существу-
ет тогда и только тогда, когда — С (О® Gi, io)xo
лежит в области значений линейного преобразования
С (^)Ф Gr QFF Go, М-
Доказательство. Из теоремы 1 известно, что
каждое управляемое при t — t± состояние xL удовлетворяет
§ 19] УПРАВЛЯЕМОСТЬ и достижимость 215
равенству
Ф (;0, Oxi = х0 — W (г0, о*#,
п гедовательно, может быть записано в виде
xi = Ф («1, О 1хо — W (i0, О хф1.
Это означает, что любое управляемое значение у (О = у2
имеет вид
У1 = С (^1)Ф (^i, Охо —' (^1)Ф (О «о)Ф (^о, ^1)х*-
Отсюда сразу следует, что для того, чтобы можно
было достичь некоторое ур нужно, чтобы вектор
У1 — С (fi) Ф (О *о) хо лежал в области значений
оператора С (ij Ф (^, i0) W (i0, ^). 0
Матрицу W (fd, называют иногда грамианом управ-
ляемости. Дело в том, что структура этой матрицы напо-
минает структуру матрицы Грама для системы векторов
n-мерного пространства. Следующая теорема, доказатель-
ство которой оставляем читателю, поясняет использова-
ние этого термина.
Теорема 4. Пусть (i), i = 1, 2, . . п,— эле-
менты пространства Cm [f0, Пусть, далее, F (t) — ма-
трица размером п X т, строками которой являются
f, (Oi 1* — 1» . . ., п. Определим матрицу
h
F(t)F’(t)dt.
to
Векторы f17 f2, . . ., fn линейно независимы на [i0, тогда
и только тогда, когда (гг X п)-матрица W (i0, 0 — не-
особенная, 0
IV (t0, tj) называют грамианом системы функций
fi, f2, - • -,fn.
Следствие. Если система х (t) = A (l)x (i) -f-
+ В (i)u (f) управляема при некотором tlt то строки
(п х т)-матрацы Ф (i0, t)B (i) линейно независимы.
Замечание. Грамиан управляемости W (f0, 0
совпадает с матрицей V (i0, 0, определенной в § 12
с помощью уравнения (3), в том случае, если в этом урав-
нении положить IT (0 = В1 (t)B (f). Вспомните, какой
физический смысл имеет матрица V (f0, 0
216
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ, IV
Критерий достижимости. Перейдем теперь к описанию
понятия достижимости линейной системы.
Определение 3. Событие (i0, х0) линейной си-
стемы
х (;) = А (;)х (г) ! в (г)и (г)
называется достижимым из состояния х15 если найдется
такое Lj t0 и такое входное воздействие u (f),
t-t t <0, что оно переводит систему из состояния х,
при t = I х в состояние х0 при t = i0. 0
Как и раньше, нас в основном будут интересовать со-
бытия, достижимые из начала координат х} = 0.
Заметим, что понятие достижимости является точным
аналогом понятия управляемости, если изменить направ-
ление времени. Иначе, достижимость — это управляе-
мость в «обратном времени».
По аналогии с управляемой системой определим дости-
жимую систему.
Определение 4. Система называется достижи-
мой, е момент времена i_1? если любое событие (i0, х), где t0
фиксировано, ах:'“-Х, является достижимым. Q
Совпадает с точностью до направления времени с кри-
терием управляемости и критерий достижимости. Сформу-
лируем этот критерий для событий, достижимых из начала
коордипат.
Теорема 5 (критерий достижимости). Событие
(t0, х) линейной системы х (i) = A (f)x (t) 4- В (i)u (f) до-
стижимо из начала координат тогда и только тогда,
когда при некотором t-A состояние х принадлежит
области значений линейного преобразования
w (Ci, ;0) = Ф с) & (о) В' (з) Ф' (г0, □) de.
t-i
Доказательство. Оно аналогично доказатель-
ству теоремы 1 н может быть представлено читателю в ка-
честве упражнения. ©
Заметим, что оператор W ($_ь t0) отличается от опера-
тора W (i0, 0 лишь диапазоном интегрирования одной и
той же подынтегральной функции. Для того чтобы про-
верить управляемость, нужно проинтегрировать некото-
рую функцию на отрезке [i0, ij, где а для провер-
§ 19)
УПРАВЛЯЕМОСТЬ и достижимость
217
ки достижимости достаточно ту же функцию проинте-
грировать на отрезке [f_b fj, где t_j t0. Отсюда ясно,
что в нестационарной системе из управляемости не сле-
дует достижимость, а из достижимости не следует управ-
ляемость.
Рассмотрим простой пример: скалярное уравнение
A (I) = b (t)u (f). Если b (i) имеет вид, представленный
на рис. 19.3, а, то систе-
ма в момент f0 управ-
ляема, но недостижима.
Если же функция Ъ (i)
имеет вид, как на рис.
19.3, б, то такая система
в момент i0 полностью
достижима, но неуправ-
ляема.
Для стационарной
системы можно пока-
зать, что из управляе-
мости следует достижи-
мость, и обратно.
Замечание. По-
лученное в теореме 1
управляющее воздей-
ствие, которое дерево- р 3
дит управляемую систе-
му из состояния х0 ири t = t0 в состояние х* при t ~ t},
fi f0, не является единственным. Оно определено с точ-
ностью до некоторой произвольной, вообще говоря,
функции v ((), которая удовлетворяет условию
jj Ф с) В (о) v (о) t/б = 0.
to
Общая формула для управления, обеспечивающего пере-
вод (t0, х0) в (fj, хД, имеет вид
u (f) - (f0, tj) [х0 - Ф (t0, fjJxJ -р
+ v (f). (3)
При v (f) = 0 функция u (t), переводящая (f0, x0) в (f15, x^,
обладает замечательным свойством. Она имеет минимальную
218
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ. IV
норму среди всех функций u (t) вида (3). Это положе-
ние будет строго доказано в § 34.
Линейные периодические системы. Если система явля-
ется управляемой, то в нестационарном случае, вообще
говоря, нельзя указать конечное время, за которое каж-
дое состояние системы можно было бы преобразовать
в начало координат. Для специального класса управляе-
мых нестационарных систем, описываемых линейными
периодическими уравнениями, любое состояние можно
перевести в начало координат за время, не большее перио-
да системы.
Пусть элементы матриц A (t) и В (() — непрерывные
периодические функции времени с периодом Т. Согласно
теореме Флоке — Ляпунова переходную матрицу для
матрицы A (i) можно представить в виде
ф (f, = р p-i (to),
где В — постоянная матрица размеров п X n, а Р (() —
невырожденная непрерывная периодическая матрица,
определенная в § И. Оператор W (t0, t) для периодической
системы можно представить в виде
i
W (£0, 0 = 5 Р^е^-^Р^^В^) В' ((5)(Р-1(з))'е(Гв“а)К'P\t^)de.
Он не обязательно является периодическим, хотя его
подынтегральная функция является периодической функ-
цией времени.
Теорема 6. Если периодическая система управляе-
ма, то ее из любого начального состояния можно перевести
в начало координат за время не большее периода системы.
Доказательство. Пусть Т — период систе-
мы. Предположим, что ранг оператора W ((0, t0 4- Т)
меньше п. Тогда существует ненулевой вектор х такой,
что W (i0, 4- Г)х = 0. Отсюда следует, что
ie+T
0 = x’W (i0, to Ц- Т) х = Х'Ф Оо, а) В (с) В'(с) Ф'(;о, s)x de =
= 5 |х'Ф(;0, б) 5(cj)|2 ds.
^0
§ 19] УПРАВЛЯЕМОСТЬ II ДОСТИЖИМОСТЬ 219
Так как подынтегральная функция непрерывна, то
х'Ф (f0, в)В (ст) = 0 при любом f0 <4 ст <4 £0 -г Т. Но это
значит, в силу периодичности функции Ф (£, ст)В (ст), что
ф (?, <з)В (ст) = 0 при любом о t0. Последнее противо-
речит управляемости системы. Q
Задачи. 1. Получите условия управляемости, аналогичные тео-
реме 1, для матричною дифференциального уравнения
X (?) -= A (t) х (0-1- х (?) в (г) 4- с (t) v(t) в (?).
2. Пусть / (?) — непрерывно дифференцируемая скалярная
функция. Предположите, что для всех i. Покажите,
что если det [b, ЛЬ, . . ЛП~-1Ь] 0, то для всех ^>0 уравнение
ц
e~Atbj (b'e~Afp) dt — х
о
имеет единственное решение р для любого заданного х.
3. Покажите, что предел
i
lim W (0, t) = lim Ф (0, б) В (б) В' (б) Ф' (0, б) da
t—»-X /-+ОО >j
О
существует, если система х (?) = --Л' (?) х (?) равномерно асимпто-
тически устойчива, а |] В (?) |] ограничена для 0 *4 ? *4 °о.
4. Докажите, что дифференциальное уравнение
л (?) 4- и (?) з (?) 4- « (?) = о
управляемо (в том смысле, что если заданы х (0), А (0) и х*
d* (?х), то существуют и (?) и ?х > 0 такие, что х (?г) = х* (?х) н
£ (?i) ~ ** (?i)), еслБ выполнены условия: х2 (0) -|- & (0) =£ 0 н
(*ч* 4- (** О2 ¥= о.
5. Рассмотрите векторное дифференциальное уравнение
X (?) = g (?) [Лх (?) 4- Въ (?)],
где g (?) непрерывна и ограничена:
0 < а < g (?)< р < оо.
Здесь Л, В — постоянные матрицы размеров n X n, n X m соответ-
ственно.
Покажите, что если ранг матрицы [В, АВ, . , ., Л’'’1/?] равен nt
то при любом заданном Г > 0 и любых х0 и хх существует управле-
ние и (?), которое переводит систему из состояния х0 при ? = 0 в
состояние Xj при t = Т,
(Указание. Рассмотрите изменение масштаба времени.)
6. Если А н В — постоянные матрицы, то
?i
17(0, ?i)'==$ e-AtBB‘rA,idt.
&
220
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ. IV
Из теоремы 2 известно, что
d
-fa W (I, ti) = AW (t, h) + W (t, fi) A' — BB', W (fi, fi) = 0.
Если матрица (f0 является решением уравнения
Л(?о+ (М' - ВВ' = о,
то покажите, что матрица М (f, /х) = [I7(f, fj — (?ol удовлетворя-
ет дифференциальному уравнению
М (I, fi) — AM (t, h) + M (f, fi) A’
с начальным условием M (fls fx) = — Qo и что матрица W (i, fx)
представима в виде
IF (f, fi) = Qo — e-A(ti-t)Qoe-A'(\-O
Замечание. Уравнение AQ -|- QA' — ВВ’ — 0 может и не
иметь решения Qo. Здесь сделано, вообще говоря, произвольное до-
пущение о существовании такого решения.
7. Пусть WA (f0, fx) является грамианом управляемости для си-
стемы
i (f) = [Р (t) A (i) P-i (f) 4- P (f) P-i (f)J Mi) -P P (0 В (f) u (f).
Покажите, что P (t0) WB (t0, fj) P' (i0) = (f0, fx).
§ 20. Стационарные объекты
Критерии управляемости. В стационарном случае
критерий управляемости принимает простую и компакт-
ную форму. Пусть заданы матрицы системы {At В}.
Составим матрицу U размеров п X тип, первые т столб-
цов которой совпадают со столбцами матрицы В, вторые т
столбцов совпадают со столбцами матрицы А В и т. д.,
последние т столбцов матрицы U образованы матрицей
А""1#. Матрицу U записывают так:
U = [В, АВ, А*В, . .
Управляемость стационарной системы связана со свой-
ствами матрицы U. Докажем простую лемму.
Лемма. Если ранг (X АВ, . . А25'1/?] равен
рангу [В, АВ, . . Ар2?], то дальнейшее прибавление столб-
цов вида Ap+iB, г = 1, 2, . . не увеличивает ранга ма-
трицы.
Доказательство. Если выполняется указан-
ное в условии леммы равенство, то все столбцы матрицы
§ 20]
СТАЦИОНАРНЫЕ ОБЪЕКТЫ
221
АРВ являются линейными комбинациями столбцов ма-
трицы [В, АВ, . . ., АР^В]. Но тогда и все столбцы ма-
трицы АР+1В = ААРВ тоже линейно выражаются через
столбцы матрицы [В, АВ, . . Л р '/?], и следовательно,
при любом i > 1 добавление слева к этой матрице эле-
ментов вида Ар + гВ не увеличивает ее ранга. Q
Из доказанной леммы, в частности, следует, что при-
бавление каждого последующего элемента вида АРВ либо
увеличивает ранг матрицы на некоторое постоянное число,
либо не меняет ранга. В последнем случае и прибавление
всех последующих столбцов вида Ар+гВ не будет увели-
чивать ранга матрицы.
Сформулируем теперь основной результат теории ли-
нейных стационарных систем.
Теорема 1 (критерий управляемости стационар-
ной системы). Линейная стационарная п-мерная система
х (f) ~ Ах (f) + Ви (f)
управляема тогда и только тогда, когда
ранг U = ранг [В, АВ, . . ., Л"^1/?] = п.
Достаточность. Пусть система не является
управляемой, а ранг U = п. Тогда найдется вектор
Xj 0, лежащий в ядре оператора W (t0, tT) и такой, что
при любом t выполнено равенство Х}Ф (i0, t)B = 0. (Под-
робно это рассуждение проведено при доказательстве
необходимости условий леммы § 19.) Поскольку система —
стационарная, не нарушая общности, положим = 0.
Тогда Ф (0, t)B = 0 при любом t > 0. Дифференцируя
это тождество по t (п — 1) раз и полагая t = 0, получим
х[В — 0, х[АВ = 0, x\A~B — 0, ..., = О,
или х'1 [5, АВ, . . ., Л"-1/Л = 0 и одновременно х^ =^= 0.
Но ненулевой вектор может быть ортогонален всем столб-
цам матрицы U в том и только в том случае, когда ранг
U < п (см. § 8). Полученное противоречие доказывает
достаточность условий теоремы.
Необходимость. Пусть все состояния управ-
ляемы, а ранг U <у п. Если ранг U <Z п, то существует
вектор г =/= О, ортогональный всем столбцам матрицы U,
222
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ. IV
т. е.
z'Z? = 0, z'AB ~ О, . . ., ~ 0.
По теореме Кэли — Гамильтона (§ 5) имеем
z' (И7Х 4" 1 4" • • • 4" ctjA 4" «о) В = О,
и значит, ъ’ АпВ — 0. Но тогда, в силу доказанной леммы,
равенство z'АРВ = 0 выполняется при любом р 0.
Так как все состояния управляемы, то управляемо и со-
стояние z, т. е.
t
0 = Ф {t, 0) z 4- J Ф (i, о) Buz (c) da.
о
Для стационарной системы известен явный вид пере-
ходной матрицы: Ф (t, £0) = поэтому
t t
0 = eAfz 4- §eA<f~a^Ви2(о)da = eAt |z 4- Je-Aa2?u2 (a)da],
о 0
или
t
z = — S e~A°Bvz (a) da.
0
Умножая это равенство слева на z', получим
t
z'z = ]zj* = — jjz' — Лез 4- Buz(a)da.
Но zfApB — 0 при любом р О, следовательно, правая
часть этого равенства равна нулю. Это противоречит
предположению, что z у= 0. 0
Согласно доказанной теореме свойство управляемости
системы полностью определяется алгебраическими свой-
ствами пары матриц {Л, В}. Именно, если матрица Е7,
составленная указанным выше образом, имеет полный
ранг, то система управляема. В противном случае можно
построить неуправляемое состояние.
Поскольку речь идет о стационарной системе и по-
скольку в качестве входных воздействий рассматриваются
непрерывные функции времени, формулируемое ниже
следствие не должно показаться удивительным.
§ 201
СТА.ЦИОНАРНЫЕ ОБЪЕКТЫ
223
Следствие 1. Линей нал управляемая стационар-
ная система может быть переведена из состояния х при
1 = 0 в начало координат к моменту t = о для любого
е ;> 0.
Доказательство. Достаточно показать, что
матрица W (0, е) достигает полного ранга при любом
е 0. В стационарном случае имеем
£
W (0, е) = e~eABB'e~aA'da.
о
Если ранг W (0, е) < п, то найдется состояние х у= 0
такое, что х Gz ker W (0, е). Аналогично тому, как было
показано при доказательстве достаточности условий тео-
ремы, можно получить равенства
х'В 0; х'АК = 0, . . ., х'Ап~1В = 0, . . .,
которые противоречат критерию управляемости стацио-
нарной системы. Следовательно, если система управляе-
ма, то матрица W (0, е) имеет полный ранг при любом
£ > 0. Q
Так как управляемость стационарной системы опреде-
ляется только алгебраическими свойствами пары матриц
{А, В}, то часто говорят просто об управляемости пары
матриц {А, В}.
Используя результат леммы, перепишем критерий
управляемости стационарной системы в следующем виде.
Следствие 2. Линейная стационарная система
управляема тогда и только тогда, когда ранг [5, А В, . . .
, . ., АЛ~ГВ\ = п, где г — ранг матрицы В. Q
Следствие 3. Обозначим через Фа характеристи-
ческий многочлен матрицы А, а через фд —минимальный
многочлен этой матрицы. Если для матрицы А существует
матрица-столбец Ь такая, что пара {А, Ь} управляема,
то фА =
Доказательство. Поскольку полином фд нор-
мирован и является делителем полинома фд, нам необ-
ходимо лишь установить, что степени этих полиномов
совпадают. Но так как фд (А) Ь = 0 по теореме Кали —
Гамильтона, то предположение о том, что степень полино-
ма фд меньше п, противоречит критерию управляемости,
ибо в этом случае найдется х такой, что х' [Ап +
4- а„_1Ап-1 4~ . . . -|- а0]Ь = 0 или, более подробно,
224
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ. IV
х'Л’Ъ = 0, х'/Г'-’Ь = 0, . . х'Ь = 0. Значит, среди
векторов [b, АЬ, , . Л!1Ь] есть линейно зависимые,
а это противоречит критерию управляемости. Q
Следствие 4. В линейной стационарной управ-
ляемой системе ранг матрицы W (t0, t) при любом t^>tQ
равен рангу матрицы U — [В, АВ, . . ., Ап~гВ] и равен
размерности пространства состояний системы п. Здесь г—
ранг В. Q
Задача финитного управления. Согласно следствию 1
управляемая система может быть переведена в начало
координат за произвольно малое время с помощью непре-
рывного управления. Этот вывод не должен показаться
удивительным, поскольку мы считаем, что матрицы
{Л, В) заданы точно, и кроме того, мы не налагаем на
управление никаких дополнительных ограничений, кроме
непрерывности. Задачу о выборе управления, которое
переводит систему в заданное состояние за фиксированное
время, называют задачей финитного управления [42].
Если стационарная система управляема, то оператор
Ж (t0, 0 имеет полный ранг при любых tQ и, следо-
вательно, существует обратный оператор (?0, 0.
В этом случае уравнение
W (?0, ^х* = х0 — ххФ (?0, ?г)
имеет решение
х* = W'1 (*о, *i) [*о - ’ xi Ф (*о, ^1)],
и формула для финитного управления, переводящего
событие (<0, х0) в событие (?n хг), имеет вид
и (?) = В Ф (?0, t)W 1 (?о, ?jl) [х0 Ф (?о, (1)
Напомним, что это управление определено с точностью
до аддитивно добавляемой произвольной функции v (?),
удовлетворяющей условию
н
J Ф (Н, □) Bv (б) de = 0.
to
Перейдем к примерам.
Пример *1. Пусть даны уравнения движения си-
стемы:
ЗД = Н" “F п,
j3 — z2;
§ 201
СТАЦИОНАРНЫЕ ОБЪЕКТЫ
225
матрицы этой системы:
Построим матрицу управляемости:
£/ = [Ь./Ь] = [‘
Ранг U ~ 1 и, следовательно, система неуправляема.
Пример 2. Система
Ti = а"2, = и.
Р = [Ь,АЬ]=[1
является управляемой, так как ранг U ~ 2.
Вычислим для этой системы управление, которое пе-
реводит событие (х, 0) в событие (0, е), Согласно теореме 1
§ 19 одно из таких управлений дает формула
нх (t) - -Ь'Ф' (0, iJJT-1 (0, е)х.
Вычислим переходную матрицу и грамиан управляе-
мости
Ф'(°,<)-[‘ “] Т(0,е) =
Г- 12 £-1
pd р2
№’-’(0,0= \ 4
S2 8
Искомое управление имеет вид:
-12 6 ~
е2 е
6 / 2»1 \ 2 / Зац 9 \
' - —~ { Л2-----t —f-----I --- — 2'7’2 I .
Ё2\ £ j 1 8 \ S 2 /
Это одно из многих управлений, решающих задачу
финитного управления. Вычислим еще одно управление.
8 Ю, Н. Андреев
226
,1ИНЕЙН^Я10ГэР ГГН4Я СВЯ)Ь
[гл IV
Для этого согласно замечанию 2 необходимо построить
функцию v (?), которая удовлетворяет условию
Е
J Ф (в, б) В v (о) do = 0.
о
Управление ия (?) + v (?) по-прежнему будет переводить
(х, 0) в (0, в). Уравпение для v (cf) имеет, очевидно, бес-
конечное множество решений в классе непрерывных
функций. Вычислим одно из них. Подставляя в это урав-
нение выражение для переходной матрицы Ф (в, н), полу-
чим
£
<[!.
Это векторное уравнение соответствует двум скалярным
£ Е
5 (е — б) v (g) do = 0, v (б) do = 0.
о о
Будем искать v (п) в виде квадратного многочлена
v (ст) ~ ст -- acf [3. Тогда получим два линейных урав-
нения для определения коэффициентов а и 0. Решая эту
систему, найдем: а = — е, р = s3/6. Итак, управление
,.ч 6 / 2®i \ 2 / Зал 9 \ . 3 е3
преобразует событие (х, 0) в событие (0, в).
Пример 3. Рассмотрим систему х = Ах Ви,
Построим управление, переводящее систему из начального
состояния х0 в момент ? - 0 в начало координат при t = ?г
По-прежнему воспользуемся формулой (1). Переходная
матрица системы имеет вид:
0
Ф (0, t) =
'еа^‘
О
= Ф'(0, t).
§ 20]
СТАЦИОНАРНЫЕ ОБЪЕКТЫ
227
Вычислим грамиан управляемости, обозначив tr = t,
t
= № (0, б) ВВ'ФГ (0, 6) Йб =
о
f Г<г'п+г’н)е2““°
J [(W-i ч-WM с'(а11+°!2)я
' h2 _|_ Z)2
11 । °12 ^20nf _
2ац
ЬцЬ31 + (аи+азг) t _ ,
«11 4~ «22
(611&Э1 4- &12&22) е<а“+аг2)а 1 , _
ЬпЬи 4- М>22 аазг( _ "
«11 4- «22 }
? 2 f 2.2
°21 "Г °22 p2a3;t_____
2«22 1
_ Ги’п «'is'
— L^21 W2I.
Вычислим обратную матрицу
1У-> /о, и =------5------Г wa ~ ’яг1.
W'22«T1 - ZP21W13 |_— U.’21 №11 J
Обозначим координаты вектора х' = [жх, <г2]. Тогда иско
мое управление примет вид
и(0 =
»i(u’n&iie<Illf4-W2ib2iea2s()4-«2(wi2biie<Illf4-i«22&2iea22f)
W22«.’ii—«’21WI2 xi(wi2&i2eail^-u,2i&22eass04-I2(ttT2£i2e£Illi4-W22&22ecla!?) _
Эквивалентность управляемости и достижимости.
В § 19 было установлено, что линейная система достижима
тогда и только тогда, когда линейное преобразование
^0
W (?_х, ?о) = J Ф (£<ъ о) ВВ'Ф' (10, б)йб
i-t
имеет полный ранг. Но из следствия 1 теоремы 1 вытекает,
что матрица И7-1 (Сп ^о) имеет полный ранг для управляе-
мой системы при любом t0 tr. Значит, управляемая
стационарная система является и достижимой. Справед-
ливо, очевидно, и обратное утверждение. В стационарном
случае справедлива, таким образом, следующая
Теорема 2. Для линейной п-мерной стационарной
системы
х (?) = Хх (?) + Ви (?)
следующие утверждения являются эквивалентными:
8*
228
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ. IV
1. система управляема,
2. система достижима,
3. оператор IP(JO, £х) имеет полный ранг при любом
4. оператор W (^1; tn) имеет полный ранг при любом
5. ранг матрицы U = [5, АВ, . . Ап~гВ] равен п,
здесь г — ранг В. Q
Наиболее подходящим для практической проверки
наличия у системы свойства управляемости является
условие 5.
Задачи. 1. Является ли управляемой пара матриц
— «1 + Ж2,
^2 — 2^2 + «
вычислите одно из управлений, обеспечивающих перевод события
111 621
(О, х0) в событие (Д жх). Примите х0 — П | , xi = 3 >
3. Сформулируйте критерий управляемости для матричного
стационарного дифференциального уравнения
X (/) = АХ (/)4- X (f) В + CV (О D,
где X (t), А, В — матрицы п X н, а размерность матриц С, V (Л, D
равна п X п, г X т, т X п соответственно.
4, Вычислите грамиаи управляемости W (0, 1) для стационар-
ной системы х (t) -j- a; (Z) = и (?).
5. Пусть Q — положительно определенная матрица. Когда
стационарная система
управляема?
6. Если стационарная линейная система
х (f) = Ах (f) Ц- 2?н (£)
управляема, то покажите, что существует матрица С (зависящая от
bi) такая, что система
х (f) = (4 4“ ВС) х (0 bi v (t)
также управляема. Здесь bi — любой ненулевой столбец матри-
цы В.
Замечание. Решение этой задачи будет получево в § 23,
§ 21]
ПОНЯТИЕ ОБРАТНОЙ СВЯЗИ
229
§ 21. Понятие обратной связи
Закон управления. Для линейной конечномерной си-
стемы состоянием в момент времени ?0 является вектор
начальных условий х (?0) — хп. Поскольку сформулиро-
ванная задача регулирования заключается в том, чтобы
обеспечить движение системы в начало координат при
любых начальных состояниях, необходимо формировать
управление, обеспечивающее такое движение, по данным
о состоянии системы, или, как принято говорить в авто-
матике, необходимо формировать управление в виде об-
ратной связи. Далее будет показано, что для линейной
системы вопрос об ее управляемости и вопрос о существо-
вании произвольно хорошего управления в виде обратной
связи тесно связаны между собой. Начнем с определения
закона управления.
Опре д е л е и и е 1. Законом управления будем
называть отображение А’: Т X X U, ставящее в соот-
ветствие каждому момепту времени t и состоянию системы
в этот момент времени х (?) значение управляющего воз-
действия u (?). Q
Отображение А, или функция k (t, х (<)), определяет
u (?) неявным образом. Действительно, при подобном опре-
делении, чтобы найти и 0, необходимо решить функцио-
нальное уравнение
п (i) = к (t, х (г, х0, и (?))).
Сразу не ясно, будет ли функция и 0, вычисленная таким
образом, принадлежать классу непрерывных функций,
выбранному нами в качестве исходного множества управ-
ляющих воздействий? Какие ограничения нужно нало-
жить па функцию к (, •) для того, чтобы решение этого
уравнении было бы непрерывной функцией? Один из спо-
собов выбора таких ограничений — потребовать линей-
ности функции к (?, х (?)) по t и по х 0. Примем функцию
к 0 х (?)) в виде к 0 х 0) = — К (?)х (г) (линейный
закон управления), где К (?) — матрица размеров m х п,
составленная из непрерывных функций. В этом случае
мы конструируем линейный регулятор, для которого
п (?) = — К (?) X (?),
230 ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ [ГЛ.
Уравнение замкнутой системы примет вид
х (?) = A (?) х (?) — В (1)К (?) х (t) =
= [Л (<) - В (t)K (<)] X (()•
Матрицы этой системы составлены из непрерывных функ-
ций, и следовательно, существует переходная матрица
Ф (t, ?0), непрерывная по обоим аргументам. Отсюда
следует, что х (?) = Ф (t, ?0)х0 является непрерывной функ-
цией. Значит, непрерывной будет и функция u (I) ~
= -К
В дальнейшем будут рассматриваться только линей-
ные законы управления. В соответствии с поставленной
задачей предстоит выбрать матрицу цепи обратной связи
К (?) так, чтобы матрица замкнутой системы обеспечивала
бы заданную динамику приближения системы к пулевому
состоянию.
Стационарный управляемый объект. Если система
х (?) — А (?)х (?) 4- В (?)п (?) управляема в момент ?0)
то ее можно перевести, как было показано в § 20, из лю-
бого начального состояния х в начало координат с по-
мощью непрерывного управления. Можно ли реализовать
именно это управление в виде линейной обратной связи
по состоянию? Ответ па этот вопрос для случая управ-
ляемого стационарного объекта дает
Теорема 1. В линейном стационарном управляе-
мом объекте х (?) = Ах (?) Д- Ви (?) входное воздействие
и (?) — —В'И7-1 (?, ?х)х (?), ?0^ ? ^ ?1? преобразует собы-
тие (?0, х) в (?1} 0).
Доказательство. Покажем, что управление,
указанное в условии теоремы, совпадает с управлением
«х (0 — —£'ФГ (?и, ?)z, где W ?Jz = х,
которое, согласно теореме 1 § 19, переводит собыгие(?0, х)
в (?г, 0). Вычислим траекторию движения системы под
действием этого управления. Пользуясь формулой Коши,
имеем
t
х (?) = Ф (?, ?0) W (?0, ?i) z — f Ф (?, б) ВВ'Ф' (?0, о) zda =
ц
== Ф (?, ?0) [И7(?0, ?i) - 1Г(?0, ?)J z.
§ 2(]
ПОНЯТИЕ ОБРАТНОЙ СВЯЗИ
231
Мы воспользовались свойством переходной матрицы
Ф (г, с) = Ф (t, г0) Ф (г0, о).
Используя теперь свойство 4 оператора W (г0, £х) (см.
теорему 2 § 19), согласно которому
W («<,, «,) = W («„, t) + Ф («<,, t)W («, ОФ' («„, t),
получим
X (0 = ф (t, *о) ф (*<М *)№ *1)ф/ (*о, Oz =
= W (£, Ф' (f0, f)z.
Подставляя это выражение в формулу для управления,
указанную в условии теоремы, замечаем, что
u^(/) = —B'W'1 (t, (f, £1)Ф' (ta, t)z = —В'Ф' (£0,£)z
в точности совпадает с управлением нх (0*0
Из доказанной теоремы следует, что матрица обратной
связи К (t) = —B'W-1 (t, tj) обеспечивает движение си-
стемы из (tQ, х) в (fx, 0).
Замечание. Закон управления u (£) =
= —B'W ' (t, tjx (£) редко используется на практике,
так как К (t) ->- со при t -> tv Это связано с условием
точного попадания в начало координат за конечное время
переходного процесса. Кроме того, полученный закон
управления пе является стационарным. Основной вывод
доказанной теоремы состоит в том, что для полностью
управляемого стационарного объекта можно не только
выбрать управление как функцию времени, обеспечиваю-
щее переход системы в начало координат за любое конеч-
ное время, но и реализовать это управление в виде (к со-
жалению, нестационарной) обратной связи.
Нестационарные объекты. В случае нестационарной
системы матрица W (I, ^) (грамиан управляемости) может
не иметь обратной при некоторых t даже в том случае,
если система управляема. Однако и в этом случае управ-
ление в виде обратной связи, которое удовлетворяет
условиям теоремы, существует и имеет прежний вид
u(f) = -В' (t)W+(t, tjx (О,
где W+ — псевдообратная матрица оператора W (t, 2J,
которая определена при всех t как решение матричного
232
ДПНЬЙТПЯ ОБРАТИ А. Я СНИЗЬ
1ГЛ IV
уравнения WXTI =* W, такое, что отображение t-+ X (/,
при каждом tt является кусочно-непрерывным. Подроб-
ности о построении и свойствах лсевдообратцой ма-
трицы имеются, например, в кшпе |Ю). Здесь я:е мы
только проиллюстрируем на простом примере трудности,
которые могут возникнуть при обращении матрицы
Ж (?, Н) в нестационарной системе.
Пример 1. Пусть дана скалярная нестационарная
система х (?) = b (t)u (t). Переходная матрица этой си-
стемы равна 1 (Ф (?, t0) = 1). Пусть функция b (?) имеет
вид, представленный па рнс. 21.1. Спстема в момент
Рис. 21.1.
является полностью управляемой. Выберем в качестве
конечного момента времени ft, тогда оператор W (/, ?t)
имеет вид
Ц
Ж (?, ?j) =- при \ ? - iY.
i
операюр
Для всех значений времени
Ж И) — 0 и, следовательно, не
имеет обратного, хотя
система и является полностью управляемой. ] Го это му
формулой
и (?) -- -В' (£)Ж-1 (?, ?j)x(?)
воспользоваться нельзя. Чтобы обойти эти трудности,
используется понятие псевдообратной матрицы.
Пример 2. Полученное уравнение нестационар-
ного линейного регулятора трудно использовать па
практике, так как W (t, -> оо при t —>- Правда,
при этом х (t) -> 0, и управляющее воздействие и (?) =
~ —В1 (^)Ж'1 (?, ?г)х (?) остается конечной величиной, ня
§ 21J
ПОНЯТИЕ ОБРАТНОЙ (.ВЯЗИ
23:
реализовать его затруднительно, так как придется умно-
жать бесконечно большие величины на бесконечно малые.
В принципе, однако, зта обратная связь может быть
использована для построения многоканального или им-
пульсною регулятора следующим образом.
Пусть состояние системы изменяется под действием
помехи, спектр частот которой ограничен частотой <вп.
Выберем период Т подключения регулятора к объекту так,
. 1
чтобы он был одного порядка с величиной —, а время
подключения регулятора выберем так, чтобы Af <<С Т
При атом условии можно не учитывать действие помехи
в период регулирования. Схематически процесс регули-
рования представлен на рис. 21.2.
Рассмотрим конструирование подобного регулятора
для объекта второго порядка A (t) = и (t). Как было по-
казано ранее, матрицы такого объекта имеют вид
А=[о о]- Ь=Ш’ «'“I1 °1-
Переходная матрица
t1
1 J
ф (0, о - [ J
Нетрудно показать, чю W (t, С) имеет вид
г (ti — i)3
(/, fi) =
3
2
234
ЛИНЕЙНАЯ. ОБРАТНАЯ связь
[ГЛ, IV
а значит,
--6 -1
(h-О2
4 *
(П — t)
Следовательно, матрица обратной связи
Структурная схема этого объекта, охваченного обратной
связью, представлена на рис. 21.3.
Рис. 21.3.
На практике основной интерес представляют стацио-
нарные обратные связи: К = const. При решении задачи
регулирования с помощью такого класса обратных свя-
зей нам придется отказаться от требования точного попа-
дания системы в начало координат за конечное время
регулирования. Единственной разумной заменой этого
требования может быть требование асимптотической ус-
тойчивости системы относительно начала координат. Ниже
будет показано, что управляемая стационарная линейная
система может быть сделана асимптотически устойчивой
с помощью стационарной обратной связи, причем харак-
теристический многочлен замкнутой системы можно выби-
рать по своему усмотрению.
s 22] 4 КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ 235
\
Прежде чем приступить к решению этой задачи, мы
обсудим вопрос о выборе базиса в пространстве состояний
линейной стационарной системы.
Задача. Для системы
вычислите управление в виде обратной связи, которое обеспечивает
перевод любого события (0, х) в событие (г, 0).
§ 22. Канонические представления
Полученные до сих пор результаты не были связаны
с каким-либо конкретным базисом пространства состоя-
ний. Все они были справедливы для любого базиса, в ко-
тором записаны матрицы А, В, С, Ф, W. В дальнейшем
нам удобно будет выбирать вполне определенный базис
в пространстве X с тем, чтобы матрицы системы имели
хорошую (каноническую) форму.
Это будет полезно в двух отношениях. Во-первых,
канонические представления матриц системы имеют ми-
нимальное число ненулевых элементов и потому удобны
при вычислениях и при моделировании системы. Во-вто-
рых, канонические представления существенно упро-
щают, как мы увидим в дальнейшем, доказательства основ-
ных теорем о свойствах обратной связи в линейной
стационарной системе. С их помощью будут получены про-
стые алгоритмы вычисления структуры и коэффициентов
регуляторов, обеспечивающих желаемые динамические
свойства замкнутой системы.
Замена базиса в пространстве состояний. Для линей-
ной системы
х (i) = 4х (£) 4- Ви (i),
у (0 = £*(0
рассмотрим невырожденное линейное преобразование пе-
ременных х = Рх, где Р — несингулярная матрица раз-
мером и X ft. В новых переменных уравнения системы
примут вид
( х — РАР~1х + РВи, I х — Дх 4- Ai,
(у = СР~*х у = Сх.
236
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
(УЛ ГА
Преобразованные матрицы системы вычисляются ио фор-
мулам '
А = РАР\ 7> РР>, С -= СР-Р /
Матрицы Л и А подобны, и значит, их характеристические
многочлены совпадают.
Напомним, что столбцы матрицы /J 1 содержат коор-
динаты новых базисных векторов относительно старого
базиса. Если новые координатные векторы известны, то
матрицу А в новом базисе {ег} можно вычислить по пра-
вилу (см. § 7): Z-й столбец матрицы А в базисе {et} состоит
из координат вектора Hej в этом базисе.
Соотношение между входом системы u (I) и выходной
величиной у (£) в исходной и преобразованной системах
останется неизменным. Одним и тем же входным воздей-
ствиям будут соответствовать одинаковые выходные вели-
чины. Это можно показать непосредственно, выписав
выражение для выхода у (г) в обеих системах. Для ис-
ходной системы имеем по формуле Коши
i
у (I) = Cx(t) = С х0 + еА(/®'’°>7?и(5)б25| .
L и 1
Для преобразованной системы, аналогично, имеем
t
— - С х0 + Ви (з) (Ь j ,
Е □
НО
— PpAp-to) р = рр, £* — РР'\ xD — Рх0.
Подставляя эти равенства в формулу для j (/). убедимся,
что
у (О НО-
Линейные невырожденные преобразования координат
в пространстве состояний линейной системы но существу
соответствуют обычным методам преобразования структур-
ных схем в теории регулирования. Именно, каждому
разрешенному (не изменяющему передаточной функции)
структурному преобразованию в теории регулирования
соответствует некоторое невырожденное преобразование
§ 22]
КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ
237
координат в прост рапстве состояний системы. Верно и
обратное утверждение. Рассмотрим простой пример.
Пус*ь дана система
\ 4 =
е' = [1, 0].
заданное матрицей
I невырожденное преобразование координат,
Преобразованные матрицы системы имеют вид
Z*], B = Pb = [J], с = с'Р"1= [0,1].
Структурная схема преобразованной системы представ-
лена па рис. 22.1, а. Методами структурных преобразо-
Рис. 22.1.
ваний она может быть сведена к первоначальному виду
(рис. 22.1, б).
Вычисление матрицы преобразования. Рассмотрим те-
перь вопрос о вычислении матрицы преобразования Р
по заданным матрицам одной и той же системы, записан-
ным в разных базисах. Начнем со случая системы с одним
входом.
23Я ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ 0?Л. IV
/
Теорема 1. Пусть матрицы управляемой системы
представлены в двух различных базисах пространства X:
{ЛЬ} {Л, Ь}. Тогда матрица Р перехода от представле-
ния {Л, Ь} к представлению {Л, Ь} единственна и вычис-
ляется по формуле
р = [ь, ль,..., л^Ь] [Ь, ль,..л^ьр.
Доказательство. Так как система управляе-
ма, то матрицы управляемости U и U имеют полный ранг.
Непосредственное вычисление дает
[Ь, ЛЬ,..., ЛП-1Ь] = [Ж РЛР-1РЬ,..РЛ^Р^РЪ] -
= Р[Ь,ЛЬ,.... Л^Ь].
Отсюда сразу следует утверждение теоремы. Q
В случае, когда система имеет более одного входа,
матрица U не имеет обратной, так как она не квадратная.
В этом случае, однако, тоже существует квадратная ма-
трица ранга п, с помощью которой строится однознач-
ным образом матрица Р.
Лемма. Если (п X тп}-матрица U = [Р, ЛР, . . .
. . ЛП-1Р] имеет ранг п, то матрица С - UU' тоже
имеет ранг п.
Д о к а з а т е л ь с т в о. Если ранг матрицы U ра-
вен п, то ее строки линейно независимы и, значит, опре-
делитель матрицы Грама UU' положителен. Матрица UU'
имеет полный ранг. Q
Построим теперь матрицу преобразования для общего
случая.
Теорема 2. Если управляемая п-мерная система
описывается относительно различных базисов в простран-
стве состояний X парами матриц {Л, Р} и {Л, Р}, то
невырожденная матрица Р, определяющая преобразование
координат х = Рх, порожденное переходом от одного
базиса к другому, может быть вычислена по формуле
Р = UU’
где U = [Р, ЛР, . . ., Ап~Г Р], U = [Р, ЛР, . . ., An~r Р],
г ~ ранг В — ранг В.
§ 22]
КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ
239
Д о\к азательство. В силу управляемости си-
стемы и согласно лемме имеем
ранг U = ранг V = ранг UU' = ранг UV’.
С другой стороны, пользуясь формулами преобразования
матриц при переходе к новому базису, получим
U = [В, ЛЬ, . . =
= [РВ, РА (Р-!Р)В, . . РА"-1 * * * * * * В (Р~1Р)В] = PU, V=PU\
Умножая последнее равенство справа на U' и затем справа
на [UU']-1, получим требуемую формулу для Р. Един-
ственность матрицы Р, как и в теореме 1, следует из того,
что существует только одно линейное преобразование,
которое связывает два базиса «-мерного векторного про-
странства. Q
Наша задача состоит в том, чтобы выбрать такой базис
в пространстве X или, что то же, такую матрицу линей-
ного преобразования Р, чтобы матрицы системы имели бы
«хороший» вид в этом базисе.
Каноническое представление системы с одним входом.
Пусть дапа линейная управляемая система с одним
входом
х (t) == Ах (t) + Ьп (t)
и пусть <рА (X) = + а-Д11-1 ф- . . . ф- ап
стический многочлен матрицы А.
Определение 1. Пара матриц
"О 1 . .. О -
о о ... о
— характери-
~ 0 -
о
О
1
(УКП)
L~an • -«1
называется управляемым каноническим представлением
системы с одним входом. Q
Напомним, что матрица А является сопровождающей
матрицей многочлена фл (А) (см. § 5).
О том, что для управляемой системы можно выбрать
базис, в котором матрицы системы имеют каноническое
представление, свидетельствует следующая
Теорема 3. Пусть дана пара матриц {А, Ь}.
В пространстве X тогда и только тогда существует
/
2J0 ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ ^'Л. IV
базис, в котором эта пара имеет каноническое представ-
ление, когда пара {А, Ь) управляема. i
Доказательство. Так как пара {А, управ-
ляема, то п векторов Ь, АЪ, . . ., А^Ь образуют базис
в пространстве X, в силу того, что ранг [Ji, Ab, . . .
. . ., An-1b] = п. Значит, базисом будет и /следующая
система векторов: >
е, = A”-1b + a1An"2b 4 ... 4 х,. .41) 4- Щ -ib.
е2 = АТТ-2Ь + х3/ГА) 4 ... 4 <х;1_3Ь,
en_i — /11) у atb,
еп = Ь.
Действительно матрица перехода от базиса {b, Ab....
/Г1-1Ь} к системе векторов {е£, е3, е^} имеет треуголь-
ный вид
~«П-1 %_s • • • «1 1 "
Х1 1 ... (I
_1 о ... О _
“О О . . . 1
О 1 —
-щ ... -an_3“Vi _
и, следовательно, невырождепа, так как на ее диагонали
стоят единицы. Значит, система векторов , е2, . . ., е„)
линейно независима и образует базис в пространстве X.
Вектор b в этом базисе имеет каноническое представ-
ление Ь' = [0, . . ., О, 1]. Вычислим представление матри-
цы А в этом базисе. Для этого воспользуемся правилом
вычисления матрицы линейного оператора в произволь-
ном базисе (см. § 7). Первый столбец матрицы А в новом
базисе имеет вид
Асд = (Anb 4 агАп-1Ь 4 ... 4- а^АЪ 4 a„b) — xj),
но выражение в скобках равно нулю согласно теореме
Кэли — Гамильтона и, следовательно,
Ае£ ctrtb — (Xnen,
§ 22]
КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ
241
Вычисляв остальные столбцы ма грицы А, получим
4еа = /Г-1Ь\ av4n"ab 4-.. .4- з„ ;(42Ь 4- ап_2ЛЬ -- — о^е*,
..........\.......
-4en-i = еп_2 -у а2е„_1,
= ^п-1 “
Столбцы Aei в базисе {е17 е2? , . е,,} образуют канониче-
ское представление матрицы А. Q
Если пара {4, Ь} не является управляемой, то канони-
ческое представление, вообще говоря, не существует.
Например, при b ~ 0 вектор b останется нулевым в любом
базисе и, значит, для пего не будет существовать канони-
ческого представления.
Замечание 1. Если матрицы {Л, Ь} управляемой
системы заданы, то для того, чтобы вычислить их канони-
ческое представление, достаточно вычислить коэффициенты
характеристического многочлена матрицы А.
Пример.
4 = [4 б]’ b = [2]’ Ранг !7 = ранг[‘ 4 = 2.
Пара {Л, Ь} управляема. Характеристический многочлен
матрицы А имеет вид
Фд (X) = (X — 2)(Х — 5) — 12 = X2 - 7Х - 2 = 0.
Каноническое представление пары {Л, Ь}:
А = Го Л, b = Г?1 .
Замечание 2. Если описание системы с одним
входом задано с помощью передаточной функции вида
г* Л“1 I ?* Т1-2 г г
Р “|“ ^2 Р “I— 4 . « “4“ £
г ’
Р + аы> + .. . 4- ап
то каноническое представление этой системы (убедитесь
в том, что опа управляема) имеет вид
о
о
С [ Sni £?1 1) - 'all
242 ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ [ГЛ. IV
/
i
Убедитесь непосредственной проверкой, что передаточная
функция линейной системы, заданной этими ь/атрицами,
совпадает с W (р). Каноническое представление удобно
для моделирования, так как матрицы {Л, Ь} ймеют мини-
мальное число ненулевых элементов. Общац' схема моде-
лирования «-мерной полностью управляемой системы
с одним входом и одним выходом представлена на рис. 22.2.
Рис. 22.2.
Замечание 3. Если в качестве базиса простран-
ства X выбрать векторы {Ь. ЛЬ , . . ЛП-1Ь}, то матрицы
{Л,Ь} управляемой системы с одним входом будут иметь
в этом базисе вид
Проверьте справедливость этого утверждения, воспользо-
вавшись теоремой Кэли — Гамильтона.
Замечание 4. При переходе к новому базису
в пространстве X мы иногда не будет использовать спе-
циальные обозначения для матриц системы, записанных
в разных базисах. Формулы преобразования в этом случае
можно понимать как формулы присваивания одним и тем
же матрицам (операторам) их значений в разных базисах.
Мы будем пользоваться следующим символом для обозна-
чения операции присваивания:
Л : = Р~'АР.
§ 221 КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ 243
Эта формула означает, что элементам матрицы А присваи-
ваются значения элементов матрицы P^iAP. В дальней-
шем при вычислении параметров регуляторов нам придется
несколько фаз менять базис в пространстве X, и раз-
личение веек этих базисов с помощью специальных ин-
дексов представляется нам неудобным. Из текста всегда
будет ясно, в каком базисе представлены матрицы системы.
Канонические представления системы с многими вхо-
дами. Мы подробно рассмотрели случай системы с одним
входом н получили каноническое представление для мат-
риц управляемой системы. Подобные результаты остаются
справедливыми и для линейных стационарных управляе-
мых систем с многими входами. Ввиду того, что подробная
запись доказательства в системе с многими входами слиш-
ком громоздка, ниже приведены лишь результаты важней-
ших этапов, в надежде на то, что читатель проделает под-
робные выкладки самостоятельно.
Рассмотрим управляемую стационарную систему
х(£) = Лх (£) + Ви (£),
y(i) - Сх(0,
где, как обычно, матрицы А, В, С имеют размерность
п X п, п X mt р X п соответственно. Выберем в простран-
стве состояний базис, в котором уравнения системы будут
иметь канонический вид. При этом существенным требо-
ванием является управляемость системы. Напомним, что
если система управляема, то матрица
и = |Ь(. Ь3,..., Ь^, ЛЬ1,..., льт,..ЛП-1ЬЪ ..., Л”-1Ьт^
(здесь Ь; — i-й столбец матрицы В = [Ьь Ь2, . . ., bm})
имеет п линейно независимых столбцов. Существует много
способов выбрать эти п столбцов так, чтобы сформировать
такой базис пространства состояний X, в котором урав-
нения имели бы каноническую форму. Рассмотрим два
таких способа.
Способ 1. Будем перебирать столбцы матрицы U
в следующем порядке: Ьь ЛЬ1( Л2Ь1( . . ., Л'-юЧц, до тех пор,
пока вектор Л''1^ не будет выражаться в виде линейной
комбинации векторов {Ь1? ЛЬ,, . . ., Л*1-1^}. Если vx =
= н, то система может быть управляема с помощью одного
первого столбца Ьх матрицы 5, и задача сводится к уже
244
ЛИНЕЙНАЯ ОВРАТИ4Я СВЯЗЬ
, [ГЛ. 1V
решенной задаче для системы с одним входом. ]Ёсли Vi <4
Г п, то будем последовательно присоединять й полу лен-
ному набору столбцы Ь2, АЬ2, . . . и т. д. вплоть до 4 *“4)2,
пока вектор Л'?-Ь2 не будет выражаться как лилейная ком-
бинация всех столбцов набора, т. с. векторов '{!)£, Abi,...
. . А41-1!)!, Ь2, . . А'^Чь,}. Если 4- х2,<С п-> то ПР°~
должаем присоединять к полученному набору векторы
bg, ЛЬ3, . . А^ЬдИ т. д., убеждаясь каждый раз в том,
что всякий новый вектор пабора не выражается линейно
через выбранные уже векторы. Эту проверку удобно
проводить с помощью процесса ортогонализации (см. § 8).
Предположим, что Vj 4- v2 4’ v3 = п и п векторов
1
{Ь1? 4Ьг, . . ., А4*-1!)!, Ь2. . . А^-Цц, Ь3, . . AVs“ b3} (1)
линейно независимы. Важное свойство этого набора
векторов заключается в том, что вектор АЧ'Ь/ можно вы-
разить в виде линейной комбинации всех предшествующих
векторов набора. Например, вектор А41^ можно выразить
как лилейную комбинацию векторов {b|t Abn A2blt . . .
. . .. AV1-1b1}. Если теперь взять множество векторов
(1) в качестве базиса пространства В1, то матрицы А и В
будут в этом базисе иметь следующий вид:
Матрица А
“О 0 0 ... О S: * : У
1 0 о ... о * : * ’ л
О 1 0.. .0 *! * : *
0 0 0 ... 1 * : * *
Vl X V1 ; б б б ... 0 * : *
; 1 0 0 , , , 0 i ’ *
: а 1 о.., о * = *
о о о,.. 1 * i *
т-гХтг : О 0 б ... 0 *
‘ 1 0 0 ... 0 *
i (И 0 ... О *
Матрица В
"10 0
О fl о
ООО
б“Гб........
о о о
. . . ы. . . bm
ООО
б” о"!......
о о о
_о о о
;о о о... 1 *
V3 X тз
здесь, как и раньше, знаком * обозначены, возможно, не-
§ 221
К \НОНПЧЕСКИН ПРЕДСТАВЛЕНИЯ
245
нулевые элементы матрицы А. Это представление пары
{Л, В} называют первым каноническим представлением
управляемой системы с многими входами [55].
Поскольку набор векторов (1) выбран в качестве бази-
са, то матрица перехода к новому базису Р составлена из
столбцов набора (1) и, следовательно, имеет вид
в = [рн Ро, .. р„] = [Ь1, ЛЬ1?. .A^b3].
Можно проверить непосредственно, что z-й столбец
приведенной матрицы А является представлением вектора
Лр; в базисе {р,, р,, . . р4}. Например, представление
столбца с номером гу. равного Л • А имеет вид
+ MV1X +... + %
(где 01, Р2, . .. — не все нули). Это следует из того,
что вектор ЛН)! линейно выражается через систему век-
торов {Ь], ЛЬ1; . . ., в соответствии со способом
построения базиса (1). Заметим, что полученная матрица
Л является клеточно-треугольной матрицей.
Обратите внимание на то, что матрицы А и В обозна-
чаются одной и той же буквой при записи их в разных
- базисах пространства состояний.
Приведем еще один алгоритм выбора п векторов капо-
нпческого базиса.
Способ 2. В качестве первых т столбцов набора
4 выпишем линейно независимые столбцы матрицы В blf
Ь2, . . bm. (Предполагаем, что ранг В = т.) Присоеди-
। няем к ним последовательно столбцы ЛЬ1? ЛЬ2, . . ., ЛЬ^
к один за одним, проверяя, является ли каждый новый стол-
' бсц линейно независимым от всех предыдущих столбцов
; набора. Для осуществления этой проверки используем
процедуру ортогонализации (см. § 8). Если какой-либо из
новых столбцов выражается в виде линейной комбинации
уже выбранных столбцов, то этот столбец выкидываем из
. набора- и переходим к проверке следующего столбца.
/ После того, как столбец ЛЬог проверен, переходим к про-
‘ верке столбцов Л2Ь2, . . ., Л2Ьт и т. д. до тех пор,
пока не получим н липейно независимых столбцов. Заме-
тим, что если столбец /1';Ь( выпадает нз набора в силу его
линейной зависимости от предшествующих столбцов, то
столбцы Ь/, где / 0, можно опустить, так как они
246
Линейная обратная связь
[гл. IV
тоже будут линейно зависимы от предшествующих столб-
цов (это следует из леммы § 21). После выбора п линейно
независимых векторов расположим их в следующем по-
рядке:
{Ь„..., A^b,, b2...... b„,, Ab.-'bJ. (2)
причем j-Ч + J-U Н.ь z'-
Главное отличие между этим способом и способом 1 со-
стоит в том, что при первом способе вектор Л4^ можно
было выразить в виде линейной комбинации векторов
{Ь(. . . ЛУ,_|Ь,}. в то время как здесь вектор Л1 ЛЬ,
не может быть выражен в виде линейной комбинации век-
торов {Ьп . . ЛИ‘,“1Ь1}. Вектор Л^Ь1} вообще говоря,
выражается линейно лишь с использованием всего полу-
ченного набора из п векторов. Это замечание применимо
ко всем векторам Л^Ь; для i = 1, 2, . . ., т.
Если в качестве базиса пространства состояний ис-
пользовать векторы (2), то матрицы Л и В в этом базисе
примут вид
матрица Л
'О 0 ... О * * : *
1 0 ... О Я * ; *
О 1 ... О » : *[ *
О 0 , . , 1 н< : * *
Ui X pi * 0 0 . , . О $ *
* : 1 0 . . . О * : *
* О 1 ... О * : *
* : 0 0 . . . 1 * *
• Ц2 X
* * о о ... О *
* : * ; 1 0 ... О *
* ; * : : 0 1 ... О *
* : *• -0 0 ... 1 *
Здесь по-прежнему знак * обозначает, возможно,
ненулевые элементы матрицы Л. Матрица В имеет еле-
§ 22] КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ 247
дующие ненулевые элементы: 6П = &Р1+112 = b^lt3 = . . .
. . . = Ьцти_1+1,т = 1- Остальные элементы этой матрицы
равны нулю. Как и ранее, в том, что матрицы А и В
имеют в базисе (2) такой вид, легко убедиться непосредст-
венно.
Сравнивая запись пары матриц {Л, 2?} в базисах (1)
и (2), мы видим разницу в этих канонических представ-
лениях в следующем.
Матрица А, записанная в базисе (1), имеет три блока
на диагонали, в то время как у матрицы А, записанной
в базисе (2), имеется ровно т блоков на диагонали.
Если в случае базиса (1) у матрицы В простой вид —
лишь у первых трех столбцов, то в базисе (2) эта матрица
имеет все столбцы очень простого (канонического) вида.
Заметим, что число 3 взято нами в предположении, что
vi + v2 + v3 = п- Вообще говоря, это число может быть
и другим, но суть дела при этом пе меняется.
Кроме того, матрица А в базисе (1) является клеточно-
треугольной матрицей, и значит, ее многочлен равен про-
изведению характеристических многочленов ее диагональ-
ных клеток. Переставляя векторы в базисе (1) или в ба-
зисе (2), можно прийти и к другим каноническим формам.
3 а м е ч а н и е 5. В теории регулирования большую
J роль играют эквивалентные преобразования структурных
схем. Аналогом этнх преобразований являются преобра-
зования координат в пространстве состояний системы.
Обычно считают, что удобнее преобразовывать структур-
V ные схемы, чем иметь дело с матрицами. Это, конечно, не
> всегда так. Пользуясь представлением системы в прост-
1 ранстве состояний, сразу можно выписать каноническое
ж представление ее матриц, а это представление удобно для
f моделирования и для расчетов, так как матрицы в канони-
ческом представлении имеют минимальное число ненуле-
; вых элементов.
Резюмируя содержание этого параграфа, скажем сле-
J дующее.
? 1. Для управляемой системы всегда можпо выбрать
такой базис в пространстве состояний системы, что мат-
рицы системы принимают в этом базисе наиболее простую
(каноническую) форму. Выше было приведено доказа-
тельство существования канонического базиса и даны
алгоритмы его построения как в системе с одним входом,
248
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
U'JL IV
так и в случае системы с многими входами. Эти базисы
играют важную роль при решении задачи конструиро-
вания регулят ора.
2. Если даны представления матриц системы в различ-
ных базисах пространства X, то соответствующая матрица
преобразования координат может быть вычислена по яв-
ным формулам (теоремы 1, 2).
3. Если дана передаточная функция системы с одним
входом н одним выходом, то каноническое представление
ее матриц выписывается сразу по виду этой передаточной
функции.
4. Введенные здесь канонические представления си-
стемы называют иногда управляемыми каноническими
представлениями в отличие от идентификационных кано-
нических представлений, которые будут рассмотрены
в гл. V.
Задачи. 1. Для системы
постройте каноническое представление по способам 1 а 2 для пар
матриц {Л, В] и {4, С"}.
2. Убедитесь в том, что система
управляема с помощью любого из двух входов. Постройте канони-
ческое представление для {4, ЬД и {4, ЬД где Ьг. Ь3 — столбцы
матрицы В.
§ 23]
Ol,P XT! I Ul Llltl ill <410 КН ГО tllllUO»
249
3. Постройте каноническое
. >1 0 0 0
3 О 0 1)
) о || 0
1 1 11 1) - Т4
— 31 и 0
) — Дз 0 0
) 0 — 2d 0(4
л ) 0 0 1 ;
0 ') 1 1 1 1
б) 4 1 1 Г' 0 0 ’ »
1 0 1 0 0 ‘
0 П 1 0 1
§ 23. Обратная связь «но
в стационарных системах
фрдсчавлонве для нар матриц:
0(5 0 0 " " 0 "
- 7> zti> 0 0
0 - 7>, «7 и
0 0 - Cl; > h 1
0 0 0 0
0 0 0 0
0 0 0 -0-
1 (Г
0 и
р -= 1 1
1 ft
1 1.
состоянию»
Обсудим возможности стационарных обратных связей
по состоянию в управляемой системе. При этом важ-
ную роль будут играть введенные в § 22 канонические пред-
ставления линейной системы в пространстве состояний.
Система с одним входом. Здесь основным результатом
является
Теорема 1, Пусть линейная стационарная систе-
ма с одним входом х (f) = Лх (f) + bw, (£) управляема и
пусть фу Ck) = V -}- Н- - . . + — произвольный
нормированный многочлен п-го порядка с веществен-
ными коэффициентами. Тогда существует вектор обрат-
ной связи к' такой, что замкнутая система х (£) = [Л —
— bkj х (£) имеет фу (Z) своим характеристическим мно-
гочленом.
Доказательство. Обозначим через фи =
— Г 4- а, л''1 . -|- ап характеристический многочлен
матрицы Л. Поскольку пара {Л, Ь} управляема, сущест-
вует базис в пространстве X, в котором эта пара имеет
канонический вид
250
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ IV
(Обратите внимание на то. что в соответствии с принятым
условием мы не меняем обозначения матриц системы при
записи их в различных базисах пространства X.)
Выберем теперь компоненты вектора обратной связи
по формуле
к = — г == 1, 2, ..., n. (1)
Tl-i+l Ч V 7 7 7 У /
Непосредственная проверка показывает, что
0 1 . . . 0 0
0 0 . . . 0 0
[Л — bk'] = — X
0 0 . . . 1 0
— а п-1 - • • — Oti _ L1.
г 0 1 . . .0
Э 0 . . .0
X [^1, • • • , к, d = -
О О ... 1
и значит, tp^-hk'] = V- + уА”-1 + . . . ф- = фу (X), так
как матрица [Л - bk'] является сопровождающей матри-
цей многочлена (X). Q
Таким образом, с помощью обратной связи можно
совершенно произвольно менять динамику системы, вы-
бирая ее характеристические числа по своему усмотрению.
Значит, линейную систему zi-го порядка с единственным
входом, если она управляема, можно считать эквивалент-
ной любой другой управляемой системе zi-ro порядка
в том смысле, что обе системы с помощью обратной связи
можно сделать неразличимыми в пространстве состояний.
Важнейшее значение этой теоремы состоит в том, что
она дает возможность синтезировать систему с заданными
свойствами. Процедура синтеза, по крайней мере в прин-
ципе, чрезвычайно проста.
1. Вычисляем матрицу U = [Ь, ЛЬ, . . ., ЛП1Ь| и
проверяем, совпадает ли ранг этой матрицы с размерно-
стью системы.
2. Вычисляем характеристический многочлен матри-
цы Л
Фд 1 + • • • + «П-
§ 23]
ОБРАТНАЯ СВЯЗЬ «ПО СОСТОЯНИЮ»
251
3. По коэффициентам заданного характеристического
многочлена замкнутой системы вычисляем компоненты
вектора обратной связи по формулам (1).
Замечание 1. Нас пока не интересует уравнение
наблюдения у (/) = Сх (£), поскольку все переменные
вектора состояния мы считаем выходными величинами. Это
равносильно тому, что матрица С равна единичной мат-
рице.
Замечание 2. Если в качестве базиса простран-
ства состояний выбраны векторы {Ь, ЛЬ, . . Лп_’ Ь),
то в этом базисе матрицы системы имеют вид (см. заме-
чание 3 § 22 и пример 3 § 7)
Г 1
о
_ о
Если многочлен замкнутой системы выбран в виде (Л) =
= Г Л тЛ"1 + • • • + Тп, то вектор обратной связи к',
полученный в каноническом базисе, необходимо преобра-
зовать с помощью матрицы перехода от канонического
базиса к базису {Ь, ЛЬ, . . ЛП“’Ь}. Эта матрица приве-
дена при доказательстве теоремы 1 § 22. Компоненты век-
тора вычислим по формулам
к':
0 0... О 1-1
0 0... 1 — 71
= [Т„ ~ • • • ’ 71 ~ ^1]
1 21 . . .
или подробно:
ki = Yi —
*2 = (Та — «г) — «1 (Т1 — <*1)-
&з - (Тз ” «з) — «1 (Тз — «2) — Я2 (Y1 “ «1).
— (Yn «1 (Yn-1 (Y1 ®1)-
Замечание 3. Хотя набор характеристических
чисел заданного многочлена <ру (/.) назван произвольным,
тем не менее имеется одно существенное ограничение.
Многочлен, выбираемый в качестве характеристического
252
ЛИНЕЙНАЯ ОБРАЗНАЯ СВЯЗЬ
1ГЛ IV
многочлена замкнутой системы, имеет вощесхвенные ко-
эффициенты по условиям физической реализуемости
системы, поэтому всякое комплексное число присутствует
в наборе корней этого многочлена вместе со своим сопря-
женным.
Пример 1. Пусть дапа система
ч: ь ня
Эта сис гема полностью управляема, т ак как
ранг U = ранг j = 2.
Вычислим характерпсшческий многочлен матрицы А
Фа - (X - 1)(Х - 2) - X2 - ЗХ 2, а, - -3, а2 -= 2.
Каноническое предоi авлрштр пары {J . Ь}:
1 Г 0 И 1
~ [— 2 3] ’ J ~ [ 1 J ‘
Пусть корни желаемого характеристического много-
члена замкнутой системы равны Xj = 3, Х2 - — 1 Тогда
Гис, 23 1.
заданный характеристический многочлен имеет вид
ФУ (X) = (X 4- 3)(Х 4- 1) ' V 4Х - 3, 71 = 4, у2 ^3.
Компоненты вектора обратной связи, обеспечивающей на-
личие у системы этого многочл ехга, вычисляем по формулам
(1) теоремы 1:
Xi = у2 —- си = 3 — 2 = 1, Х2 - - 4 4 3 = 7.
Структурная схема замкнутой системы представлена на
рис, 23.1.
§ 23] обратная связь «по сосюяшш» 253
Система с многими входами. Рассмотрим систему с мно-
гими входами
х(£) = Лх{£) 4- (JIG)
y(i) = Сх (t).
Будем искать стационарную обратную связь в виде
и = —Кх, где К — матрица размеров т X п. Тогда урав-
нения замкнутой системы примут вид
х(£) — [Л — ВК] х(£),
у (Г) - Сх(0.
Можно доказать теорему, в точности соответствующую
сличаю системы с одним входом. Именно, если система
лправляемл, то возможен такой выбор что характери-
стический многочлен матрицы Л — ВК будет совпадать
с любым, наперед заданным многочленом с вещественны-
ми коэффициентами вида сру (л) - A'1 -j YjV-1 + . . .
. . . -4- уп. Ясно, что практический интерес представляют
только такие многочлены <ру (Л), корпп которых располо-
жены строго слева от мнимой оси. В этом случае замкнутая
система является асимптотически устойчивой (см. § 15).
Необходимый результат получим в два этапа. Сначала
• построим такую обратную связь по состоянию, чтобы по-
лученная система с обратной связью была бы управляема
с помощью одного входа (задача 6 § 21), а затем восполь-
зуемся результатами, приведенными ранее для системы
с одним входом.
Так как рассматриваемая система управляема, то мат-
рица
U = [В, АВ. ... , ЛП-1Я] =
= [bt,ь2,..., bm. ЛЬ15 ..., ЛЬт...., Л^К,H’i_Lbm|
имеет ранг п. Если в матрице В ость столбец Ьг такой, что
матрица [Ьг, ЛЬг, . . ., Л1г-1Ь1] имеет рапг п, то система
управляема с помощью единственной компоненты вектора
управления, именно компоненты иг (£), Если такого столб-
ца в матрице нет, то нельзя получить желаемое управле-
ние с помощью одного входа ut (0. Требуется участие
двух или более компонент вектора и (£). Однако введе-
нием соответствующей обратной связи можно привести
254
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
[ГЛ. IV
линейную систему с многими входами к системе, управляе-
мой с помощью одного входа. Сформулируем точно соответ-
ствующий результат.
Теорем а 2. Пусть {Л, В} — управляемая пара
матриц и пусть Ьр Ь3, . . ., Ь,п — столбцы матрицы В.
Тогда для любого Ьг^0, i = 1, 2, . . т, существует по-
стоянная матрица Кг размеров т X п такая, что пара
матриц {Л — ВКЬ ЬД управляема.
Доказательство. Без потери общности возь-
мем i = 1. Так как система управляема, то матрица U ~
= [2?, АВ, . . Лп-1 имеет ранг п. Следовательно,
в U имеется п линейно независимых столбцов. Выберем
эти столбцы в соответствии со способом 1 (см, § 22). Пусть
это будут векторы
{bi, ЛЬЬ ..,, Л^Ьр Ь2, ЛЬ3.Л^Ьз, Ь3,ЛЬ3,..., Л^Ьз}.
Здесь Vj_ -J- v2 v3 = п. Определим матрицу Р размеров
п X п, в столбцах которой размещены эти векторы:
Р = [Ь„ ЛЬ,...Л’‘-ХЬ,..Л’^Ьз]
и определим матрицу S размеров т X п следующим обра-
зом:
5 = [0, 0,..., 0, е3, 0,.. ., 0, е3, 0,.. ., 0, 0],
где е3 — Vj-й столбец, е3 — (vj 4- v3)-fi столбец этой ма-
трицы, общее число столбцов которой равно Vj -|- v3 -ф v3;
через ег- обозначен г-й столбец единичной матрицы разме-
ров т X т.
Теперь мы покажем, что матрица Klf определяемая
в виде %! — SP-1, удовлетворяет условиям теоремы,
т. е. пара {Л — ВКХ, Ь,} является управляемой. Сначала
перепишем матрицу 5 = КГР в виде
8 = Кг [Ьь ЛЬ1;..., Л’^Ьь ..., Л^ЬЛ =
= [0, ..., 0, е2, 0,..., 0, е3, 0,... , 0].
Это матричное равенство соответствует следующему на-
бору векторных равенств:
= о,
ЛХЬ2 = о,
л А о,
/МК - о,
лдль2 = о,
Т^ЛЬз = 0,
МЬ^О, ...з^Л^А^е,,
£M*b2 = 0....
Л1Л2Ь3 = 0,..., Л1ЛЧ’“1Ь3 = 0,,
12)
§ 231
ОБРАТНАЯ СВЯЗЬ «ПО СОСТОЯНИЮ-)
255
Показать, что пара {Л — ВКг, Ьх} управляема, — все
равно, что показать, что векторы Ьх, [Л — Ьп . . .
. . [Л — ZJTfJ71”1 bj линейно независимы. С помощью
набора векторных равенств (2) легко устанавливаем, что
bi — bx,
[Л — ВКА 1ц =- ЛЬь
[А — ВКА* Ьх - [А — ВКА ЛЬХ = Л9Ь1?
[Л - = [Л — ВКА Л^Х = Л^Ьр
[.4 - = [А - ВК,] Л'^'Ь^. Л« Ь,+ 5е2 = 1>2 + [...],
[Л — 2?J£1]',1+1b1 =- [Л — ВК,} [Ь, 4- Л’Ь.] — ЛЬ2 [..
[Л - вхл = [л — вк,] [Л’-Л3 + ...] = л,,-1ь3+ [...].
В этих равенствах знак [...] использован для обозначения
линейной комбинации предшествующих векторов.
Ясно, что выписанные слева векторы линейно незави-
симы в соответствии с выбором базиса в пространстве X
по способу 1. Значит, пара матриц {Л — ВКГ, bL} управ-
ляема. о
Теперь требуемый результат получается сразу.
Теорема 3. Если линейная динамическая система
(ЛС) управляема, то линейная обратная связь вида
и (£) -- — Кх (t), где К — действительная постоянная
матрица размеров т X п, может быть выбрана таким
образом, что характеристический многочлен матрицы
[Л — ВК\ совпадает с произвольно заданным веществен-
ным многочленом <ру (Z,) = Г4 YA"-1 4- • - • 4 Yu-
Д о к а з а т е л ь с т в о. Введя обратную связь вида
U (й) = W (й) — К-рх (t), преобразуем уравнения системы
к виду
х (£) = [Л — ВКА X (£) 4 Bv (i).
Поскольку пара {Л, В) управляема, то матрица Кг мо-
жет быть выбрана так, чтобы пара матриц {Л — BKlt
bx) была бы управляемая (здесь — первый столбец мат-
рицы В). Введем теперь еще одну обратную связь вида
256
ЛПТГРГГНАЯ <1БРХТЦ\Я СВЯЗЬ
[ГЛ. TV
w = — 1/х, где матрица М имеет вид
” пц , . , тп
I/ 11 0 • • " .
-О (>...<)
После введения этой обратной связи уравнения системы
примут вид
X (?) = [Л -- ВКг — ВМ] х (?) = [Л — ВК± — Ьдп] х (?).
Так как пара {Л — Ьх} управляема, то характери-
стический многочлен матрицы можно выбрать произволь-
но за счет выбора вектор-строки m (см, соответствующую
теорему для системы с одним входом — теорему 1). Объе-
диняя обратную связь и (0 = w (0 — Ахх (?) и обратную
связь w = —Л/х (?), имеем и (?) = (~Кг — Л?) х (?) =
= ~Кх (0- о
Матрицы А', и Л/ можно вычислить, используя приве-
денные выше алгоритмы (теоремы 1 и 2),
Ряс. 23.2.
Значит, К вычисляется по замкнутым конечным фор- J
мулам. Эти вычисления удобно проводить, составив про- |
грамму для ЦВМ.
Заметим, что матрица А’ в только что доказанной тео-
реме не единственна. Есть много различных способов вы-
бора А. Например, если матрица А\2 выбрана так, что пара
§ 231
ОБРАТНАЯ СВЯЗЬ «ПО СОСТОЯНИЮ»
257
матриц {Л, —ВК^ } управляема, то мы получим другую
матрицу К. В литературе встречаются другие способы вы-
числения матрицы К, отличные от приведенного. Приве-
денный способ представляется наиболее простым как
с точки зрения компактности его изложения, так и с точки
зрения удобства для практических вычислений. (См. также
[55?.)
Еще раз напомним, что построение канонического ба-
зиса по способу 1 выполнено в предположении, что 4-
4- v2 4- v3 = п, т. е. что для управления системой доста-
точно первых трех столбцов. Обобщение на случай произ-
вольного числа столбцов ие вызывает затруднений.
На рис. 23.2 приведена структурная схема системы
с многими входами, охваченной такой обратной связью
по состоянию, которая обеспечивает заданную динамику
замкнутой системы. Обозначения на рисунке соответст-
вуют обозначениям доказанной теоремы.
Применим полученные алгоритмы для вычисления об-
ратной связи в системе третьего порядка с тремя входами.
Пример 2. Пусть матрицы системы имеют вид
'1
В = О
О
О О’
1 о
О 1
Тогда матрица Р = В = Е. В соответствии с теоремой
выберем матрицу 5 в виде
3
о о
о о
1 о
'О
1
о
5 =
Матрица обратной связи
« SP’1 = SE = S.
Полученная матрица
Г1
[А - ВКг] = 1
1
О г
1 о
1 1
управляема с помощью одного входа щ. Действительно,
пара матриц
{Л -BKlt bj), К = [1* 0t 01
управляема, так как ранг U = 3, Q
9 Ю. Н. Андреев
258
ЛИНЕЙНАЯ ОБРАТНАЯ СВЯЗЬ
!ГЛ. IV
Неограниченные возможности обратных связей реа-
лизуются в том случае, когда все переменные состояния
доступны для измерения в качестве выходных величин
системы. Обычно это не имеет места на практике. Поэто-
му необходимо решать задачу получения приемлемой
оценки вектора состояния. Этой задаче посвящена гл. V.
Задачи. 1. Вычислите такой вектор обратной связи для системы,
приведенной в примере 1, чтобы замкнутая система была бы гене-
ратором синусоидальных колебаний частоты со, т. е.
.г, - >in <л>/.
2. В той же системе выберите обратную связь так, чтобы корни
замкнутой системы были равны Хх ~ - 5, Х2 = 1.
3. Вычислите обратную связь в примере 2 такую, чтобы харак-
теристические числа замкнутой системы совпадали с числами =
= Ха = %а = —1. Нарисуйте структурную схему полученной си-
стемы.
4. Воспользовавшись теоремой 2. выберите матрицу обратной
связи К в системе, заданной матрицами
А = '0 10 10' 10 10 1 0 0 111 0 1110 .1 0 1 1 1 '1 0 0- 0 0 0 0 10 0 0 1 0 0 0
гак, чтобы система с обратной связью была бы управляема с по-
мощью третьего столбца матрицы В.
5. Для системы, приведенной в задаче 1 f 22, постройте обрат-
ную связь по состоянию такую, чтобы замкнутая система имела бы
следующие характеристические числа: 2 = —1 + ~
= -5 ± 21, Х5 = Хе = — 2.
6. Для системы задачи 2 § 22 рассчитайте коэффициенты обрат-
ной связи, обеспечивающей равенство всех собственных чисел зам-
кнутой системы; X, = Х2 = Х8 = Х4 = —1.
7. (Tzafestas, 1975.) Пусть управляемая пара* {Л, Ь} задана
в канонической форме, т. е. b = [0 ... О 1] и пусть L — устойчи-
вая жорданова матрица, собственные числа которой совпадают с же-
лаемыми собственными числами этой системы, замкнутой с помощью
стационарной обратной связи вида u = k'x(f). Тогда существует
неособенная матрица Т, такая что выполнено равенство
А 4- bk* - TLT~*. (1)
Получите явные формулы для последовательного вычисления
матриц к' и Г по уравнению (1). Распространите полученные резуль-
таты на многомерные системы, считая, что управляемая пара {Л, В]
имеет каноническое представление, приведенное на стр. 244.
ГЛАВА V
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
Для линейной стационарной управляемой системы
нами установлено следующее: 1) Существует управление,
которое переводит любое состояние х в начало координат
за произвольно малое время. 2) Это управление может
быть реализовано в виде нестационарной обратной свя-
зи. 3) Если ограничиться только стационарными линей-
ными законами управления, то можно произвольно ме-
нять динамику замкнутой системы, в том случае, если
все компоненты вектора состояния доступны для из-
мерения.
На практике, однако, все компоненты вектора состоя-
ний не доступны для измерения, либо потому, что число
измерительных устройств ограничено, либо потому, что
часть переменных состояний в принципе нельзя изме-
рить. Обычно выходными величинами объекта служат
лишь отдельные компоненты вектора состояний, либо
линейные комбинации этих компонент.
Таким образом, для того, чтобы воспользоваться ре-
зультатами, связанными с неограниченными возможно-
стями обратной связи по состоянию, необходимо найти
разумную замену (оценку) для вектора состояния си-
стемы. Для оценки состояния естественно воспользо-
ваться информацией о входных и выходных величинах
системы и о ее структуре (матрицах А, В, С).
В этой главе будет получено решение задачи оценки
состояния. Сначала мы введем необходимые понятия и
сформулируем условия, которым должен удовлетворять
объект, чтобы задача оценки его состояния имела реше-
ние. Далее обсудим связь задачи управления и задача
оценки состояния и получим уравнения идентифика-
торов — динамических сйстем, формирующих оценку со-
стояния в стационарном случае.
9*
260
ИДЕНТИФИКАТОРЫ' СОСТОЯНИЯ
[ГЛ. V
§ 24. Наблюдаемость и идентифицируемость
Основные положения. Наша цель будет состоять
в том, чтобы для данной линейной системы восстано-
вить вектор состояния х (t) или иайти оценку этого век-
тора по данным о входах u (i) и выходах^у (i) системы.
Оценку состояния системы обозначим x(i). Близость
оценки х$) к истинному вектору состояния х (i) можно
понимать, по крайней мере, в двух смыслах: либо как
стремление ошибки оценки к нулю, т. е. х (i) — х (t) ->
—> 0 при t—> оо, либо как точное совпадение вектора
состояния х (i) и вектора оценки х (i) в момент t = i0
после наблюдения выходных переменных объекта в те-
чение конечного отрезка времени [t-j, при f0
или [t0, Zj при i0.
Если систему оценки состояния удается построить
хотя бы в одном из указанных смыслов, то возникает
вопрос, нельзя ли построить регулятор, который состоял
бы из системы оценки состояния и обратной связи, вы-
бранной в предположении, что вектор состояния точно
известен. Эта задача будет решена в гл. VI.
В нестационарной линейной системе будем различать
следующие две задачи об оценке текущего состояния
системы.
Задачей наблюдения назовем задачу оценки состояния
системы в момент времени по известным входным и
выходным воздействиям, измеренным в будущем, т. е.
по данным о u (i) и у (/) при t t0.
Задачей идентификации будем называть задачу опре-
деления состояния системы в момент времени t0 по данным
о входных и выходных величинах, измеренных в прошлом,
т. е. по данным у (t) и u(i) при i t0.
План решения этих задач следующий. Мы дадим опре-
деление ненаблюдаемого и неидентифицируемого события
линейной системы. Введем критерии, сформулированные
в виде необходимых и достаточных условий^того, что
Событие является неидентифицируемым или ненаблюдае-
мым. Покажем для стационарного случая, что неиденти-
фицируемые события действительно можно идентифици-
ровать. В заключении обсудим дуальность задачи управ-
ления и задачи оценки состояния.
Перейдем к точным определениям.
§ 24]
НАБЛЮДАЕМОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ
261
Определенно 1. Событие (£0, х) линейной систе-
мы (ЛС) является неидентифицируемым тогда и только
тогда, когда у (?; ?0, х01 0) =0 при всех t ?0. 0
Аналогично определяется ненаблюдаемое событие.
Определение 2. Событие (t0, х) линейной си-
стемы (ЛС) является ненаблюдаемым тогда и только тогда,
когда y(f; ?0, х0, 0) = 0 при всех t > ?0. 0
Согласно этим определениям событие (?0, 0) является
ненаблюдаемым и неидентифицируемым,
Смысл этих определений в следующем. Если на входе
системы имеется нулевое управляющее воздействие'/
а начальное состояние отлично от нуля, то нбидентифици-
руемым и ненаблюдаемым состояниям системы соответст-
вуют нулевые выходные величины.
Введем понятия наблюдаемой и идентифицируемой си-
стемы.
Определение 3. Линейная система явл_яется
наблюдаемой в момент времени ?0. если ни одно событие
(?0, х0) не является ненаблюдаемым, за исключением собы-
тия (?0, О).0
Определение 4. Линейная система является
идентифицируемой, если ни одно событие (?0, х0) не явля-
ется неидентифицируемым, за исключением события
(*о, О).0
Заметим, что из того, что система идентифицируема,
еще не следует, что можно построить хорошую оценку ее
состояния. Это предстоит еще доказать. Собственно, из
того, что система идентифицируема, следует лишь, что
при ненулевом начальном состоянии свободной системы
(управление и (?) = 0) ее выходные параметры являются
ненулевыми. Другими словами, ненулевое состояние систе-
мы вызывает какое-то изменение выходов системы во вре-
мени.
Пример неидентифицируемой системы приведен на
рис. 24.1. Пусть ц(?) = 0 и входная цепь разорвана,
а в индуктивности имеется начальный ток i0, и пусть г (?) =
= .ту (?). Ясно, что нельзя оценить величину этого тока
по наблюдениям выходного напряжения у (?) или даже
обеих величин y(t) и u(f).
Замечание. Часто не делают различия между
задачей наблюдения и задачей идентификации, объединяя
рба этц понятия термином наблюдаемость. Иногд а о пре де-»
262
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. V
ляют наблюдаемую систему как систему, в которой по
прошлым значениям выходных величин можно судить о
состоянии в настоящий момент времени. Мы определили
зту задачу как задачу идентификации, следуя Калману
124b О
В стационарной системе идентифицируемость эквива-
лентна наблюдаемости, и поэтому любое из этих поня-
тий можно использовать
для обозначения задачи
построения оценки со-
стояния.
Критерий неидентн-
фицируемости. Сформу-
лируем критерии не-
идентифицируемости и
ненаблюдаемости. Эти
критерии аналогичны
критериям достижимо-
сти и управляемости,
но доказательство соот-
ветствующих теоремока-
зывается существенно проще, поскольку в данном случае
предстоит лишь показать, в каком случае систему нельзя
идентифицировать (наблюдать), а нет необходимости стро-
ить процедуру идентификации. Критерий неидентифици-
руемости сформулируем в виде следующей теоремы.
Теорема 1 (критерий неидентифицнруемости).
Событие (£0, х) линейной системы
х (t) = А (Z) х (I) В (t) и (<), у (t) = С (t) х (/) (ЛС)
является неидентифицируемым тогда и только тогда,
когда х принадлежит ядру линейного преобразования
,tQ) = J Ф' (о, t^C (а) С (а) Ф(б, £0) da;
здесь, очевидно, М (£_х, ta) — матрица размеров п X п.
Достаточность. Пусть х принадлежит ядру
М (t_if t0). Тогда по определению ядра линейного опера-
тора имеем
М (L1T Q х = 0.
(1)
$ 24] НАБЛЮДАЕМОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ
263
Обозначим матрицу С (б)Ф (б, t0) = N (<з, Q, тогда
N' (о, t0) = [С (б)Ф (б, t0)]' = Ф'(<з, t9) С' (з)>
и формулу (1) можно переписать в виде
to
М (Li, <о) х = № (б, t0) N (б, t0) xda = 0.
tlx
Умножив зто равенство слева на х', получим
to
х'М (t_n t0) х = \ x'N' (б, to) /V (з, to) Х(2б,
i-t
или, замечая, что под знаком интеграла стоит норма век-
тора N (<з, t0) х (поскольку [2V (б, t0) х]' = x'N' (<j, t0))f
получим
х'М (t_x, t0) x = J TV (б, t0) xf cfc = 0.
Но это равенство возможно тогда и только тогда, когда
Д' (б, /0) х = 0 при всех о е It-j., tol- Значит,
N (б, t0) х = С (б)Ф (б, t0) х = у (б; t0, х, 0) = 0,
что как раз и соответствует определению неидентифици-
руемого события.
Необходимость. Пусть событие (t0, х) неиден-
тифицируемо, т. е. при любом t0 имеет место равен-
ство у (t_j; t0, х, 0) = 0. Из формулы
to
х'М (t-1? t0) х = J | С (б) Ф (б, t) х р da
t-i
следует, что х'М (tt0) х = 0, поскольку
У (н; tOi х, 0) -- С (t-i) Ф (г-х, t0) х = 0
при любом t_A t0. Но это и означает, что М (t_1} t0) х =
— 0, т. е. х принадлежит ядру М (t_u t0). 0
Совершенно аналогично доказывается и критерий не-
наблюдаемости.
Теорема 2 (критерий иенаблюдаемости). Событие
(t0, х) линейной системы (ЛС) является ненаблюдаемым
264
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. V
тогда и только тогда, когда х принадлежит ядру опера-
тора М (f0, fj, где
ft
Й (*о, h) = $ Ф' (<3, «о) С' (<J) С (б) Ф (бД0) d<5. О
t.
Задача точной оценки состояния. Покажем теперь, что
ненаблюдаемое событие можно точно восстановить по дан-
ным наблюдения на конечном отрезке времени. Эта задача
аналогична задаче вычисления управления, переводя-
щего любое событие линейной управляемой системы в на-
чало координат.
Пусть система задана матрицами Л (t), В (t), С (t)
и известно входное воздействие и (() для
Тогда ясно, что выход такой системы может быть выражен
в виде
у (() = П(г)Ф (г, г0) х (г0) + У1 (г),
где У1 (0 — известная функция!
ti
yP)-$C(«)®(«,e)B(e)li(e)<fc,
f«
которая не зависит от х (£0). Поэтому для того, чтобы су-
дить о х (£0) по данным о выходе системы, достаточно рас-
сматривать однородную систему
х (0 — А (г) х (г), у (г) = С (t) х (t).
Функция У1 (t) может быть вычислена единственным обра-
зом по известным В (t), С (t), u(£).
Лемма. Пусть С (t) — матрица р X п, элементы
которой непрерывны на интервале Ядро
преобразования L\ Rn—>-Ср[£0, fj, определенного соотно-
шениями L (х (£)) = С (t) х (£), совпадает с ядром преобра-
зования
ft
M(ZaA) = J
Доказательство. Если х (£0) = х0 принад-
лежит ядру преобразования М ^), то М (£й, х0 = О,
§ 241
НАБЛЮДАЕМОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ
265
и значит, х'о М (?0, ?г) х0 = 0. Поэтому
ii ti
$ ХоС7 (?) С (t) x()dt =± J Ц С (?) Xo |2 dt = 0.
tt to
Поскольку C (?) — непрерывная функция, то C (t) х0 = О
при любом ta t tlt и поэтому С (?) х0 = 0. Обратно,
если C(i) х0 = 0, то С' (t) С (?) х0 = 0 и поэтому инте-
<1
грал^ С' (t) С (t) х0 dt равен нулю. Значит, М (f0, ?J х0 =
= 0. О
Теорема 3. Если матрицы линейной системы
х (?) = А (?) х (?), у (?) = С (?) х (?)
заданы на интервале ?0 ?п то можно определить
х (?0) с точностью до постоянного вектора, который ле-
жит в ядре оператора
h
М (?о, ?1) = J Ф' (?, ?0) С (?) С (?) Ф (?, ?о) dt,
В частности, х (?0) можно определить единственным обра-
зом, если матрица М (?0, ?2) — неособенная. Более того,
нельзя отличить, зная у (?) при ?0 tlf 'начальное
состояние хх от начального состояния х2, если вектор
хг — х2 лежит в ядре оператора М (?0, ?j).
Доказательство. Согласно уравнению систе-
мы имеем
у (?) = С (?)Ф (?, ?0) х (?0).
Домножив это равенство слева на Ф' (?, ?ft) С' (?), получим
Ф'(*> ?0) С7 (?) у (?) = Ф7 (?, ?0) С" (?) С (?) Ф (?, ?0)х(?0).
Интех рируя теперь на интервале ?0 ?1( получим
ft
$ Ф' (?, ?ф) С (?) у (?) dt = М (?0, ?Д х (?0).
Так как левая часть этого равенства известна (функцию
у (?) мы измеряем на интервале ?0 ?^ ?j), то значение
х (?0) может быть определено с точностью до аддитивно
добавленного постоянного вектора, лежащего в ядре
266
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
ЕГЛ. V
оператора М (^о, Если же М (£0, несингулярна, то
h
x(t0) = М'1(г0, М$ф'(Мо)
i«
и, таким образом, х (£0) определен однозначно.
Предположим теперь, что хг — х2 лежит в ядро опера-
тора М (£0, ^). Пусть yt (t) и у2 (г) — выходные величины,
соответствующие начальным условиям хх и х2. Тогда
it tt
JIУ1 (0 — У2 (0II2 dt = J || C (t) Ф (t, t0) Xi— C(t) Ф (Л f0)x^dt =
tD К
ti
«= (xj — x2)' J Ф' (£, £0) C' (t) C (t) Ф (f, f0) dt (xj — x2) =
u
= ( Xi — x2y M (£0, £j) (Xi — x3) = 0.
Значит, yj (£) = y2 (t) при f0 t и потому xx и x3
неразличимы. Q
Роль матрицы M (f0, fj) аналогична роли матрицы
И7 (£0, fj, которую мы назвали грамианом управляемости.
По аналогии матрицу М (£0, называют грамианом на-
блюдаемости.
Теорема 4 (свойства грамнана наблюдаемости).
Матрица М (£0, г\), определенная в формулировке теоре-
мы 3, имеет следующие свойства:
1. М (t0, £j) — симметрическая матрица.
2. М (f0, неотрицательно определена для £0.
3. М (£0, удовлетворяет линейному матричному
дифференциальному уравнению
t,) = - А' (/) Й (/, /,) - а (/,/,) А (0 - С (Г) С (0«
(^01 — 0.
4. М (tn, удовлетворяет функциональному уравнению
м (^й, = м (;0, t) Ф' (t, t9) м (f, Ф (t, о
Теорема доказывается аналогично теореме 2 § 19, и
читателю предлагается провести это доказательство в ка-
честве упражнения.
§ 24] НАБЛЮДАЕМОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ 26?
Дуальность задач управления и задач оценки состоя-
ния. Обращает на себя внимание то обстоятельство, что
оператор И7, введенный в § 19, и оператор М из теоремы 1
как бы дополняют друг друга. Преобразуем подынтеграль-
ную функцию оператора W в подынтегральную функцию
оператора М. Для этого произведем замену переменной
интегрирования о = £0 — а в операторе М £ft).
Тогда матрицы W (ta, £г) и М (£_ь £0) примут вид
Ж(?о, h) =
ti-t0
= 5 Ф Go И- &) В' (£0 4 ®) Ф' Go» h 4" <*)
М (f_i, ^(4 ~
f.-h
= j Ф' (to — a, t0) С' (tQ — a) C (t0 — а) Ф (to — a, to) da.
о
Отсюда следует, что преобразование подынтегральной
функции оператора W (£0, f3) в подынтегральную функцию
оператора М (Clt t0) заключается в следующей замене:
Ф Go? t0 4~ ос) —*• Ф' (t0 ос, f0),
В (t0 4- а) -> С' (to — а).
Нов соответствии со свойствами 6 и 7 переходной матрицы
§ 10, матрицы Ф (£0, to + а) и Ф' (£0 — а, (0) удовлетво-
ряют следующим дифференциальным уравнениям:
= _ ф (п + а) А ((о + а)>
= - ф' ('»-««») A! (/„ - а).
Другими словами, преобразование
Ф (А>, *о 4- а) Ф' (to — а, tQ)
равносильно следующему преобразованию матрицы Л (t):
Л 4~ а) -4- A' (to — а).
Значит, для того чтобы осуществить преобразование
подынтегральной функции оператора W (£0, tj) в подынте-
гральную функцию оператора М /0), необходимо
268
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. |V
выполнить следующее преобразование матриц системы:
А (0> + а) A (t0 л), |
В (to а) —> С (^о — а)* J
Это преобразование заключается в зеркальном отображе-
нии всех функций, соответствующих этим матрицам, от-
носительно точки t$, переходе к транспонированным мат-
рицам и замене В иа С,
Предположим, что пара матриц {Л, В} определяет
в момент времени t0 полностью управляемую систему, т. е.
существует t такое, что ранг TF(f0, t) = п, Если эту пару
матриц подставить в оператор М (t^, Zo), предварительно
отобразив их зеркально относительно точки и перейдя
к транспонированным матрицам, то оператор М (Llt t0)
в этом случае будет иметь полный ранг, следовательно,
ни одно состояние системы х (t) = А’ (20, — t) х (0,
у (2) = В' (2t0 — 0 х (0 не будет принадлежать его ядру,
т. е. все эти состояния будут идентифицируемы. Положим
0, + а == 0 тогда преобразование (2) примет вид
А (0-> A' (2t0 - 0,
В (0 С (2t0 - 0.
Таким образом, справедливо следующее утверждение.
Теорема 5. Пара матриц {Л (0, В (t)} определяет
линейную систему, которая в момент времени tQ управля-
ема тогда и только тогда, когда пара матриц А (0 =
= A' (2t0 — 0, С (0 = В' (20) — 0 определяет систему,
которая в момент времени t0 идентифицируема. Q
Дуальность понятий наблюдаемости и достижимости
устанавливает
Теорема 6. Пара матриц Л (0, С (0 определяет
линейную систему, которая в момент времени 0 наблю-
даема, тогда и только тогда, когда пара матриц
А (0 = Л' (20 - 0, & (0 = С (20 - 0
определяет систему, которая в момент времени 0 дости-
жима. 0
Перейдем к стационарному случаю. В стационар-
ном случае переходная матрица системы имеет вид
Ф (*> 0) — и операторы И7 (0, 0), М (0Х, 0) можно
\§ 24] НАПЛЮДАЙМОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ 269
I
представить так:
1 tl—#0
И7 (f0, fi) = J ^АоЛй'е~А'Мб,
о
M (t.x, ta) = $ е~А'аС'Се~Аадс.
о
Так как оператор W (f0, tj) достигает полного ранга при
любом f2 t0 в том и только в том случае, когда пара мат-
риц {Л, В} является управляемой, то и оператор М (f-b
£0) достигает полного ранга при любом £0 2> тогда и
только тогда, когда пара матриц {Л, С} является управ-
ляемой. Но если оператор М (£_х, fo) имеет полный ранг,
то ни одно состояние, кроме нулевого, не принадлежит
ядру этого оператора и, следовательно, система является
идентифицируемой. Таким образом, нами доказана
Теорема 7. Пара постоянных матриц (Л, С}
определяет идентифицируемую систему тогда и только
тогда, когда пара матриц {А', С'} определяет управляе-
мую систему. Q
Но если пара (А, С} идентифицируема, то из опреде-
ления оператора М (f0, fi) непосредственно следует, что эта
пара является и наблюдаемой. Действительно,
h
М (ta, fl) = $ еА' СеА(°-^ ds,
после замены и = б — f0
t,-te
M(f0, fi) = J eA'uC'CeAudu,
о
и M (f0, fj достигает полного ранга при любом fL £0.
Значит, из идентифицируемости пары матриц {Л, С}
следует наблюдаемость этой пары матриц. Теперь, вспоми-
ная формулировку критерия управляемости стационарной
системы, сформулируем следующее утверждение.
Теорема 8. Пара матриц {А, С} определяет
идентифицируемую и наблюдаемую систему в том и толь-
ко в том случае, если ранг D равен рангу [С", А'С*, . . .
. . = п.
270
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
(ГЛ. V
Здесь D — матрица размеров п X пр, составленная ш
столбцов матриц С', А’С’, (А’)п~9С’, каждая из ко-
торых имеет размерность пХ р, s — ранг матрицы С. Q
Теоремы 5, 6 и 7, 8 свидетельствуют о том, что понятие
идентифицируемости дополняет понятие управляемости,
а понятие наблюдаемости дополняет понятие достижи-
мости. Говорят, что достижимость дуальна наблюдаемости,
а управляемость дуальна идентифицируемости. В стацио-
нарном случае идентифицируемость эквивалентна наблю-
даемости, а управляемость эквивалентна достижимости,
и справедлива следующая
Теорема 9. Линейная стационарная система
х (£) = Дх(С) -Г Ви (£),
У (0 = Схр)
(3)
является наблюдаемой тогда и только тогда, когда система
х(0 = 4'x(0 + C"u(0» 1 ,
у(£) = B'x(t) J
является управляемой. Здесь At Bf С — матрицы разме-
ров п X n, п X т, р X п соответственно. Вектор и (()
в системе (3) имеет размерность т X 1, а в системе (4)
вектор и (t) имеет размерность р X 1. 0
Пример. Пусть система задана матрицами
С = [1 0 0];
го о
так как ранг [7?, АВ, А^В] равен рангу 0
1 -I =3,
1.1—1 1J
то система управляема и достижима. Матрица идентифици-
руемости
3
о
.0
D- [Сг,АгСг,АпС'] =
О О'
О -1
— 1 1
тоже имеет ранг, равный 3. Следовательно, система на-
блюдаема и идентифицируема. 0
Дуальность задач управления и задач оценки состоя-
ния позволяет воспользоваться результатами, полученны-
ми при решении задачи управления с помощью обратной
У 25] АСИМПТОТИЧЕСКИ® ИДЕНТИФИКАТОРЫ 271
'I
срязи в стационарной системе, для решения задачи по-
строения оценки состояний этой системы.
I
Задачи. 1. Переменная х (?) уд стелет меряет дифференциальному
уравнению
л (?) 4- л (?) Ц^о,
значение х(?) известно при t= л, 2л, . Можно лн определить
х (0) и ~т (0) по этим данным?
2. Понежите, что линейная стационарная система
х (0 = Лх (?) + -Su (0
управляема тогда и только тогда, когда система
х (?) = — Л'х (/), у(?) = Ь'х(?)
идентифицируема,
3. Являются ли гО 1 0 0 0 1 иде 0-1 0 нтифицируемыми пары матриц:
а> А “ 0 0 0 Л о о '1 2 3‘ 1 0_ , С = [1 0 1 0р
б) А = 4 5 6 ,3 2 1. 7 г_ Г1 2 ЗК 12 1 s]?
§ 25, Асимптотические идентификаторы n-го порядка
» Формулы для точного восстановления вектора состоя-
ний системы по данным наблюдения за входными и выход-
ными переменными на конечном отрезке времени были
получены при доказательстве теоремы 3 § 24. Эти резуль-
таты подобны тем, которые были получены при решении
задачи о построении управления, переводящего систему
в заданную точку пространства состояний за фиксирован-
ное время (теорема 1 § 19).
В важнейшем частном случае стационарной системы мы
попытаемся построить такую оценку вектора состояния
х (Z), чтобы х (Z) — х (Z) 0 при t со. Другого, к сожа-
лению, нельзя потребовать, так как стационарный иден-
тификатор не может, в принципе, обеспечить точную иден-
тификацию состояния системы, точно так же, как стацио-
нарная обратная связь ие пригодна для приведения си-
стемы точно в заданное состояние за конечное время. Но,
так же как ц в случае управления с помощью обратной
272
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. V
связи по состоянию, характеристические числа идентифи-
катора можно назначать по своему усмотрению, совершен-
но произвольным образом меняя характер стремления
оценки х (Z) к состоянию х (t).
В этом разделе будут построены уравнения динамиче-
ской системы, входами которой являются входы и выходы
исходной линейной системы, а выходами компоненты век-
тора х (£) — оценки вектора состояний х (£)
Определение 1. Динамическую систему, ко-
торая формирует на выходе веитор х (Z) по данным о вхо-
дах и выходах системы, будем называть идентификатором
состояния. О
Замечание. В американской литературе исполь-
зуются термины: «observer», «state estimator», «state
reconstruction device». Несмотря на то что задачей иденти-
фикации называют обычно задачу оценки структуры и
параметров математической модели объектов, автор счи-
тает, что термин «идентификатор состояния» вполне точно
отражает суть дела и более удачен, чем иногда используе-
мый буквальный перевод термина «observer» — наблю-
датель. Q
Рассмотрим сначала различные способы конструиро-
вания стационарных идентификаторов состояния.
Простейший идентификатор. Начнем с построения
идентификатора для системы с одним входом и одним вы-
ходом, заданной уравнением
х(£) = Лх(0 Ч- bu(l),
у (0 = с'х#).
Поскольку матрицы системы Л, Ь, с известны, то в каче-
стве идентификатора состояния можно принять модель
системы, которая будет формировать оценку х (£). Схе-
ма такого простейшего идентификатора представлена на
рис. 25.1.
Если начальное состояние системы совпадает с началь-
ным состоянием идентификатора и если на вход иденти-
фикатора подается то же управляющее воздействие, что
и на саму систему, то выход идентификатора х (/) будет
равен состоянию х (Z) при всех t В такой системе нерешен-
ным остается только вопрос о выборе начального состоя-
ния идентификатора. Эта задача решается, если исполь-
зовать свойство идентифицируемости начального состоя-
f 25] асимптотические идентификаторы 273
ния системы на основании^наблюдения за ее выходом.
Ранее было доказано (теорема 3 § 24), что если система
полностью идентифицируема, то ее начальное состояние
можно оценить по известному входу и выходу системы.
Следовательно, для такой системы можно использовать
приведенный простейший идентификатор. У этого иден-
тификатора имеется, однако, два существенных недостат-
ка. Во-первых, начальное состояние необходимо вычислять
Рис. 25.1.
и фиксировать в каждый момент времени, когда исполь-
зуется идентификатор, а это очень неудобно. Второй,
более серьезный недостаток состоит в том, что если мат-
рица Л имеет характеристические числа с положительной
вещественной частью, то даже очень малое отклонение
х (t0) от х (t0) в некоторый момент времени ta, которое
может быть вызвано помехой или неточной оценкой на-
чального состояния, будет расти во времени, тем быстрее,
чем больше величина положительной вещественной части
характеристического числа Л. По этим причинам простей-
ший идентификатор без обратной связи, вообще говоря,
неудов л етворите л е н.
Другой возможный способ получить оценку вектора
состояния состоит в том, чтобы продифференцировать
вход и выход п — 1 раз. Если линейная система иденти-
фицируема, то из у (/) и u (t) и их производных можно вы-
числить вектор состояния. Однако «чистые дифференциа-
торы» не так просто построить. Более того, вычисляемое
274
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ, V
состояние будет «сильно возмущаться» при наличии помел
в том случае, если использовать дифференциаторы.
Асимптотический идентификатор для системы с одним
выходом. В схеме на рис. 25.1 мы использовали не всю
информацию о системе, которая имеется. В формировании
оценки х (t) состояния не участвует выход системы у (Z),
который доступен для измерения. Разумно предположить,
что использование выхода у (Z) позволит улучшить оцен-
ку состояния х (t). Рассмотрим идентификатор, приведен-
ный на рис. 25.2. На вход этого идентификатора поступает
как вход, так и выход исходной системы. Выход у (t) =
= с'х (i) сравнивается с выходом у (Z) = с'х (i), и их
разность является сигналом ошибки и подается на вход
системы в качестве корректирующего воздействия. Именно,
разность [у — у] = [у — с'х] умножается на вектор 1
и подается на входы интеграторов идентификатора. Дина-
мические свойства такого идентификатора существенно
зависят от выбора вектора 1. За счет выбора этого вектора
необходимо обеспечить желаемый характер стремления
разности x(t) — Z (Z) 0 при t -> оо. В дальнейшем рас-
сматриваются только асимптотические идентификаторы.
Определение 2. Линейная динамическая систе-
ма, выходом которой является вектор х (<), называется
25]
АСИМПТОТИЧЕСКИЙ идентификаторы
275
асимптотическим идентификатором состояния линейной
системы
х (6) = Ах (() + .Ви (Z), у (6) = Сх (£),
если x(i) — х (£)-^ 0 при t-+ со. О
Размерность идентификатора, приведенного на рис.
25.2, равна размерности системы п. Динамические урав-
нения этого n-мерного идентификатора имеют вид
x(i) = Ax(f)-p 1 [у (t) — o'x(Z)] 4- bu(Z),
или
х (Z) = [А — 1с'j х (Z) 4- ly (Z) + bu (Z),
Если ввести новые переменные по формуле
r х(£) = x(Z)— х(0
f (проверьте, что это невырожденная замена переменной;
постройте соответствующую матрицу преобразования Р),
, то уравнения идентификатора дрим}т вид
x(Z) = [А — 1с'] х(0;
। х (Z) является вектором ошибки оценки состояния. Если
I бы можно было за счет выбора 1 произвольным образом
I выбирать характеристический многочлен матрицы 1А —
— 1с'1, то это означало бы, что можно произвольно ме-
нять темп стремления оценки х (Z) к состоянию системы
в х (Z). Например, если все собственные числа матрицы
k [А — 1с'I имеют отрицательные действительные части
| меньше величины —о, то все компоненты вектора ошибки
| х (Z) приближаются к нулю со скоростью, ие меньшей,
£ чем e~at. Следовательно, даже если есть большая ошибка
, между х (£0) и х (Zo) в начальный момент времени Zo, то
вектор х (Z) будет быстро (в соответствии с величиной —о)
приближаться к х (Z).
Таким образом, если бы можно было произвольно вы-
бирать характеристический многочлен матрицы [А —
— 1с'], то идентификатор на рис. 25.2 отвечал бы всем тре-
бованиям и был бы значительно более выгоден, чем про-
стейший идентификатор рис. 25.1. Оказывается, что
желаемая динамика идентификатора может быть выбрана
в том случае, если система идентифицируема.
276
Идентификаторы состояния
[гл. V
Теорема 1. Если линейная стационарная система
с одним выходом идентифицируема, то можно построить
асимптотический идентификатор с произвольным желае-
мым набором собственных чисел матрицы [Л — 1с']:
{AltX21 . • Хп} (комплексные числа входят в этот набор
вместе со своими сопряженными}, причем Re (XJ < 0.
Доказательство. Так как пара матриц
{Л, с'} идентифицируема, то пара {Л', с} является со-
гласно теореме 8 § 24 полностью управляемой, и значит,
существует базис в пространстве X, в котором эта пара
матриц имеет вид
А' =
где Фа (Л) — + аД7'-1 4- . . . + an — характеристи-
ческий многочлен матрицы Л. В этом базисе матрицы {Л,
с'} запишутся так:
го о .
Л =
о .
•° 1
•° “ an-l
с'= [О...1].(ИКП)
-О 0 ... 1 — оо _
Это представление пары {Л, с'} назовем идентификацион-
ным каноническим представлением.
Пусть теперь задан произвольный нормированный мно-
гочлен n-го порядка фи (Л) =* V + РДП-1 + . . . + рп
с вещественными коэффициентами. Выберем в качестве
компонент вектора 1 числа Zn_/+l = Pi —• a$ (i — 1, 2, . . .
* . n). Непосредственная проверка показывает, что ха-
рактеристический многочлен матрицы [Л — 1с'] совпадает
с заданным многочленом <ри (X). Q
Замечание 1. Линейная стационарная система
с одним входом и одним выходом, описание которой зада-
но с помощью передаточной функции вида
4-^-2_п.
W(p) = ------— ,
p!l + wi + • • • +
АСИМПТОТИЧЕСКИЕ ИДЕНТИФИКАТОРЫ
277
является управляемой. Матрицы канонического представ-
ления этой системы имеют вид (УКП) (см. замечание 2
к теореме 3 § 22). Идентификационное каноническое пред-
ставление этих матриц имеет вид
А =
г0 о
1 о
0 -%
О ал-1
-0 0 1 — «1 _
Чтобы вычислить компоненты вектора Ь, необходимо
построить матрицу Р преобразования управляемой пары
{Л', с} к идентифицируемой паре {Л, с'} вида (ИКП).
Это построение можно выполнить, воспользовавшись
результатом теоремы 1 § 21. Тогда компоненты вектора b
определятся по формуле Ь: ~ РЪ, где Ь справа имеет вид
Ь' = [0 . . . 1].
Структурная схема моделирования системы вида
(ИКП) приведена на рис. 25.3.
Рис. 25.3.
Замечание 2, Если собственные числа иденти-
фикатора выбраны так, что все их действительные части
отрицательны, то не имеет значения, какое начальное
состояние имеет идентификатор, поскольку его выход
х (7) будет стремиться к действительному состоянию х (t)
асимптотически. Причем чем больше модули отрицатель-
ных вещественных чисел идентификатора, тем быстрее
оценка х (Z) приближается к действительному состоянию.
Но чем быстрее стремление оценки х (/) к х (Z), тем чув-
ствительнее идентификатор к шумам, действующим в ка-
нале измерения состояния системы. Поэтому вопрос о
том, какие собственные числа идентификатора необходи-
мо выбрать, чтобы он выполнял свою задачу паилучшим
278
ИДЕНТИФИКАТОРЫ СОСТОЯНИЙ
[Г Л. V
образом, является далеко не тривиальным, и его решение
требует рассмотрения конкретных условий работы систе-
мы (характер помех, точность задания коэффициентов
и т. д.).
Рассмотрим примеры конструирования n-мерных асим-
птотических идентификаторов состояния для системы
с одним входом.
Пример 1. Пусть даны матрицы системы
MUb МП’ «- = [10,.
Так как пара {Л', с} полностью управляема, то данная
система является полностью идентифицируемой. Матрица
преобразования пары матриц {Л, с'} к идентификацион-
ному каноническому представлению имеет вид
м^-
Это преобразование состоит в замене и на
Итак, идентификационное каноническое представление
матриц системы имеет вид
Если теперь задан произвольный многочлен (ри (Л) = Ха +
+ 01^- + Р2 и мы хотим, чтобы характеристический мно-
гочлен системы идентификатора совпадал с (ри (X), то не-
обходимо выбрать в соответствии с теоремой 1 компоненты
вектора 1 по формулам:
= 02 «2 ~ 02» ^2 = 01 а! = 01»
так как eq — а2 = 0. Уравнения идентификатора имеют
вид
х(0 = [Л — 1с'] х(£) + ly(i) + Ьн (t).
Запишем их подробно:
Структурная схема идентификатора представлена на
рис. 25.4.
fi 25]
АСИМТОТИЧЕСКИЕ ИДЕНТИФИКАТОРЫ
279
Асимптотический дифференциатор. Типичной задачей
теории линейных систем является задача конструирова-
ния дифференциаторов. Оказывается, что эта задача сво-
дится к только что рассмотренной нами задаче идентифи-
кации состояния стационарной линейной системы.
Рис. 25.4.
Определение 3. Линейная система с одним
входом называется асимптотическим дифференциатором
порядка п — 1, если при всех u (Z) Q имеем
г.(0 = -4г- + <(0- « = 0,1,2,.
at
и каждое et (Z) -* 0 при t—>- оо. Q
Пусть задана функция u (t) е= где Q — простран-
ство многочленов от t степени не выше п — 1 с коэффи-
циентами из R. Тогда справедлива
Теорема 2. Асимптотический дифференциатор
порядка п — 1, являющийся п-мерной системой, суще-
ствует.
Доказательство. Дело в том, что входные
воздействия и (i) можно рассматривать как выходные
величины у (0 — u (Z) линейной системы^n-го порядка,
280
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. V
описываемой матрицами
0
0 0-1
о о
1 о
с' = [0.. .0 1], В = 0.
Действительно, вычисляя переходную матрицу этой си-
стемы, получим
1 ...00'
00 лт. t ... о о
®(z,O) = eA<=22A.= ........................ .
11=0 1 t”-l , .
L (п —1)! J
Таким образом, функция
n—i к
у («) = с'х (0 = с'Ф (£, 0) X (0) = с'еА(х (0) = 2 4f Хп~*+1
к=а
является многочленом. Другими словами, любой много-
член может быть получен в качестве выходной величины
у (Z) системы {Л, с'} за счет подходящего выбора началь-
ного состояния х (0). Так как система (Л, с') полностью
идентифицируема, то согласно доказанной теореме можно
построить систему оценки ее состояния, а динамику стрем-
ления оценки л (t) к состоянию х (Z) можно выбирать со-
вершенно произвольно.
Система с многими выходами. Пусть линейная система
х (Z) = Лх (t) + 2?u(£), у (t) = Сх (i), (ЛС)
где Л, В, С — матрицы п X п, nXm, р X п (р > 1)
соответственно, имеет много выходов. По аналогии со
случаем одного выхода рассмотрим «-мерную динамиче-
скую систему — идентификатор, на вход которого поданы
входы системы (ЛС) и, кроме того, сигнал рассогласования
между выходами этой системы и выходами системы (ЛС)
с коэффициентами усиления, заданными с помощью мат-
рицы L, Уравнения зтой системы имеют вид
х(/) = Ai(() + Bu(') Ыу(‘)-&(')] (1)
y(0 = i(«).
§ АСИМПТОТИЧЕСКИЕ ИДЕНТИФИКАТОРЫ 281
Здесь L — матрица размеров п X р. Вводя невырожден-
ную замену переменной х (£) = х (/) — х (Z), мы получим
уравнения для рассогласования между состоянием систе-
мы (ЛС) и выходом идентификатора (1) в виде
х (/) = [А - LC] х (i).
Поскольку пара матриц {А, С} является идентифици-
руемой, то пара {Л', С'} управляема, и значит, найдется
такая матрица L', что характеристический многочлен мат-
рицы [Л' — СL'\ совпадает с любым заданным вещест-
венным многочленом сри (X). Поскольку характеристиче-
ские многочлены матриц [А — LC] и [А' — C'V\ совпа-
дают, то мы получим следующий результат.
Теорема 3. Для линейной идентифицируемой си-
стемы с многими входами (ЛС) существует п-мерный
идентификатор состояния вида (1), причем характери-
стический многочлен матрицы [Л — LC}, корни которого
определяют характер стремления ошибки идентифика-
тора к нулю, может быть произвольным вещественным
многочленом <ря (Л) = V + РЛ’г-1 + • • • + Рп* 0
Из сказанного ясно, что для вычисления неизвестных
параметров идентификатора (матрицы L) по заданным
динамическим свойст^&м (многочлен (ри (А,)) можно вос-
пользоваться алгоритмом выбора матрицы обратной связи,
приведенным в § 23.
Задачи. 1. Постройте идентификатор состояния для пары
матриц
О 0 In
101 Г1 0 0 1*1
0 10’ С~|_0 1 о 1] ’
0 1 о]
который имел бы следующие собственные числа: Ах = л2 = —3,
A3 = Xj = — 1,
2. Постройте устойчивый 4-мерный идентификатор состояния,
все характеристические числа которого равны 1, для системы с од-
ним входом и одним выходом, передаточная функция которой име-
ет влд
Р (Р + 1) (Р + 2) (р+2) •
282
ИДЕЙТИФИКАТ0РЫ1С0СТ0ЯНИЯ
1ГЛ. V
3. Выпишите уравнения идентификатора для системы
Собственные числа идентификатора: = — 1 i, 13 = — 1 — i,
А>з = —3.
4. Постройте идентификатор 6-го порядка для системы, при-
веденной в задаче 1 § 22, приняв в качестве его собственных чисел
= —1, i - 1, 2, . . 6.
§ 26. Идентификаторы Люенбергера
(п — 1)-мерный асимптотический идентификатор для
системы с одним выходом. Построенный в § 25 асимпто-
тический идентификатор имеет ту же размерность, что и
сама система. Согласно теореме 1 § 25, если система иден-
тифицируема, то динамические свойства идентификатора
можно выбирать произвольно. Если уравнения системы
с одним выходом записаны в идентификационной канони-
ческой форме, то выход у (£) совпадает с последней компо-
нентой вектора состояний хл (i). Естественно спросить,
а нельзя ли оценивать лишь переменные (2), гс2 (£),. . .
. . хп-! (£), приняв в качестве оценки переменной хп (t)
результат ее измерения, т. е. положив хп (г) = у (г) =
= хп (£)? Оказывается, такой идентификатор можно по-
строить, причем характеристические числа этого иденти-
фикатора по-прежнему могут назначаться произвольно.
Рассмотрим уравнение «-мерного асимптотического
идентификатора линейной системы
х (t) = Лх (г) 4-1 [у (г) — с'х (г)] + Ьп (г).
Пусть в этом уравнении пара матриц {Л, с'} имеет иден-
тификационное каноническое представление. Это озна-
чает, в частности, что с'х (i) = (i). Примем выход
системы у (i) = с'х (t) = хп (г) в качестве оценки пере-
менной хп (г), т. е. будем рассматривать результат изме-
рения координаты хп (t) в качестве оценки хп (£). Под-
ставляя у (t) = (i) в уравнение идентификатора, полу-
чим следующую систему линейных дифференциальных
уравнений (п — 1)-го порядка (последнее уравнение мы
заменили тождеством (2) = у (£)):
x(t) =- Лх(0 4- апу (t) 4-b«(i). (1)
§ 261 ИДЕНТИФИКАТОРЫ ЛЮЕНБЕРГЕРА
283
Здесь х' (£) = - • •» через А обозначена
подматрица размеров (я — 1)х(я — 1), расположенная
в левом верхнем углу матрицы А. ап — последний стол-
бец матрицы А. Черточка сверху означает, что соответ-
ствующий «-вектор превращен в (« — 1)-мерный от-
брасыванием последней компоненты. Например, b =
Покажем, что характеристические числа (н — ^-мер-
ного идентификатора (1) совпадают с характеристиче-
скими числами матрицы А. Заменим в уравнении иден-
тификатора (1) переменные (£) на (£) по формуле
х (£) = х (t) — х (t). Вектор ошибки имеет размерность
п — 1. В новых переменных уравнения идентификатора
примут вид
х (i) — х (г) = 1 [х (0 — х («)] + а'пу (0 + bu (I).
Но первые п — 1 уравнений системы х (t) = Лх (t)+
+ bw (t) имеют вид
х(£) = Jx(i) -I-3^(2) -|-bu(£).
Учитывая это и то, что хп (О = у (t), получим следующее
уравнение для (« — 1)-мерного вектора х (2):
х(£) = Л’х(г).
Таким образом, характеристические числа подматрицы А
размеров (« — 1) X (« — 1) определяют динамику стрем-
ления к нулю ошибки оценки состояния системы в (п — 1)-
мерном идентификаторе. Следовательно, если найти такое
невырожденное преобразование Р, которое обеспечивает
желаемый набор характеристических чисел у подматрицы
размеров (п — 1) X (п —-1), расположенной в левом верх-
нем углу матрицы Л, то тем самым можно получить урав-
нения (п — 1)-мерного асимптотического идентификатора,
динамические свойства которого можно выбирать по свое-
му усмотрению. Обратите внимание на то, что в приведен-
ном’виже'выводе преобразование Р произвольно меняет
характеристические числа матрицы А, не меняя характе-
ристических чисел матрицы А! Проверим, что нужное нам
284
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. V
преобразование Р имеет виц
(2)
где Е — единичная матрицы размеров (п — 1) X (п — 1).
Если пара {А, с'} имеет каноническое идентифика-
ционное представление, то непосредственное вычисление
дает
О 0 ... О рп-1 : (ct * Зп-1 %
1 0 ... О Рп-2 (ai 31) Рп-2 ап-1 + ₽п-1
РАР~г =
о о ... 1 -Pi. i (ctT— Т3т)0г
-% +31
О О ... О 1
7 L + ₽1 .
Если обозначать компоненты вектора b через blt 62, . . .
. . . , Ьп, то первые п — 1 компонент преобразованного
вектора Ь: = РЬ имеют вид
&П Зп-1 \
Г. _ _ &Т!-1 Зп-2 \
+’2 ~ 31
Так как характеристический многочлен матрицы
РАР~! есть многочлен сри (/) = V-1 + PiV"2 + . . .
. . . + рп-!, который можно выбрать по своему усмотре-
нию, то это и означает, что можно найти уравнения
(п — 1)-мерного идентификатора с желаемым набором
характеристических чисел. Проделанные вычисления поз-
воляют сформулировать следующее утверждение.
Теорема 1. Для идентифицируемой п-мерной ли-
нейной системы х (£) Ах (t) + Ы (£), у (t) = С'х (г)
можно построить (п — 1)-мерный идентификатор состоя-
ния, характеристические числа которого можно выбирать
по своему усмотрению. Если матрицы {А, с'} представле-
ны в виде (ИКП), то выход системы используется в этом
идентификаторе в качестве оценки п-й компоненты век-
тора состояния. Q
§ 26]
ИДЕНТИФИКАТОРЫ ЛЮЕНБЕРГЕРА
285
Замечание, Подобные (п — 1)-мерные и вообще
(п — р)-мерные (где р — число линейно независимых вы-
ходов) асимптотические идентификаторы называют иногда
идентификаторами Люенбергера, по имени американского
ученого, впервые изучавшего их структуру. Q
В приведенном нами способе построения асимптоти-
ческих идентификаторов входы ие играют какой-либо
роли. Поэтому все наши рассуждения применимы к иден-
тифицируемым системам с несколькими входами и одним
выходом.
Алгоритм построения (я — 1)-мерного идентификато-
ра. Пусть заданы матрицы управляемой системы с одним
выходом и, вообще говоря, многими входами {А, Ь, с'}.
Полученный нами алгоритм построения (га — 1)-мерного
идентификатора состояния состоит из следующих шагов:
1. Матрицы системы {А, Ь, с'} записываем в таком ба-
зисе, чтобы пара {А, с'} имела каноническое идентифика-
ционное представление (ИКП).
2. Выбираем динамические свойства идентификатора —
многочлен
Фи(М = 1 + 2 + "-4е fU-i*
3, Преобразуем] все матрицы системы с помощью мат-
рицы Р цида (2). Уравнения искомого идентификатора
имеют при этом вид
х (£) = Лх(*) + апг/(/) +
где Л — подматрица размеров (« -!) х (ц —А); распо-
ложенная в левом верхнем углу матрицы А, ап — послед-
ний столбец матрицы А.
Пример 1. Рассмотрим полностью идентифицируе-
мую систему второго порядка
^ = [“02_1]. Ь = [«], о'= [10].
Построим для этой системы идентификатор первого по-
рядка, динамика которого задана характеристическим
многочленом <ри (л) == X + р.
Преобразуем матрицы системы к идентификационному
каноническому виду по формулам: А : = РАР~г, Ь : =
= РЬ, с':— с'Р”1. Матрица Р = . В результате
286
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ, V
расчетов получим
А ~ I 1—21*
b = [J], с’= [0 1].
Преобразуем теперь матрицы системы с помощью невы-
рожденного преобразования (2)
с'Р-1 = [0 1].
Окончательно уравнения идентификатора примут вид
& (*) = — (1 + 0) (0 + 0 (1 — 0) У (^) + и (*)>
«8 (0 = у (О-
Структурная схема этого идентификатора приведена на
рис. 26.1. Сравните эту схему со схемой идентификатора
второго порядка, приведенной на рис. 25.4.
Рис. 26.1.
Идентификаторы Люенбергера для системы с многими
выходами. Изучим вопрос конструирования асимптоти-
ческих идентификаторов для идентифицируемых систем
со многими выходами. Поскольку задача идентификации
состояния дуальна задачам управления, мы можем при
конструировании идентификатора состояния для системы
с многими выходами использовать соображения, приве-
денные при решении задачи выбора обратной связи по
§ 26]
ИДЕНТИФИКАТОРЫ ЛЮЕНЁЕРГЕРА
287
состоянию для системы с многими входами. Ясно, что из
экономических соображений выгодно конструировать
идентификаторы возможно меньшей размерности. Мы по-
кажем, что если ранг матрицы С равен р, то асимптотиче-
ский идентификатор состояния имеет размерность п — р
и оценивает все переменные состояния системы. Эта за-
дача будет решена в два этапа. На первом этапе мы пре-
образуем уравнения системы в такую каноническую фор-
му, что новые уравнения можно рассматривать как сумму
подсистем, каждая из которых имеет один выход. Затем
для каждой из этих подсистем мы построим идентифика-
тор, используя построенный выше алгоритм. Основу дока-
зательства составляет выбор специального базиса в про-
странстве состояний.
Рассмотрим идентифицируемую систему (ЛС). По-
скольку пара {Л, С} идентифицируема, то пара {Л', С'}
управляема. Каноническое представление этой лары в
пространстве состояний можно построить, воспользовав-
шись способом 2 выбора и линейно независимых векторов,
приведенным в § 22. Обозначим через cf t-ю строку мат-
рицы С (i =- 1, 2, . . р). Строки этой матрицы содержат по
п элементов. Предположим, что эти строки линейно неза-
висимы. Воспользовавшись управляемостью пары {Л', Сг}
и применяя способ 2, найдем п линейно независимых строк
вида
1 ’
ci, ci А, ciA2, . . ciA'
Сз, СзА, с$А2, . . сзА ,
►
ср, срА, срА2..*
Здесь Pi + р2 + . . . -г Рф -= я. Построим из этих строк
(п X п)-матрицу (X располагая строки в следующем по-
рядке: clt ^Л, схЛ2, . . ., с3, с2Л, ... Тогда
Так как все строки в таблице (3) линейно независимы,
то матрица Q неособенная и матрица существует.
288
Идентификаторы состояний
[гл. V
Обозначим столбцы матрицы Q 1 следующим образом:
Q 1 = teW е12’ * • ч е1Р-х> ®21» е22? • • -j м ^Н-р’ * * *’ еРИр1*
Поскольку QQ~Y = Е, то по определению выполняются
следующие условия:
{1, если 1 = 1 и / = с? 4- 1,
л (Zt)
О в противном случае.
Теперь примем в качестве базиса пространства состояний
набор столбцов
Р-1-i
[е^, Ае^,..A e1{il, е^,
Ле2^2,.. А а А р СрррЬ (5)
Эти столбцы линейно независимы. Докажем сначала, что
линейно независимы столбцы [е^., , . . ., 1.
Предположим, что существует нетривиальная линейная
комбинация этих столбцов. Например,
41^ 4- OtAe^ -j- о^.Л1*1 = 0.
Умножив это равенство слева на строку сг, получим
p.—i
(ЗД 4- <хасМ 4----|- а^.М 1 ) = О,
но e<jx =# 0. Значит, линейно зависимы строки набора (3)
Полученное противоречие доказывает, что столбцы
едл., Ле^,..Л г е^.
линейно независимы при любом i = 1, 2, ..., р, Вспоми-
ная, что столбцы e1(i„ е^, . . ., еР1лр линейно независимы
по построению, легко видеть, что все столбцы набора (5)
линейно независимы. Образуем из этих столбцов матрицу
1 ~ [ецхр Ле^,..., Л р еРиД
и выберем столбцы этой матрицы в качестве базиса про-
странства состояний. Приведение матрицы С к этому ба-
зису в соответствии с формулой С: — СР~г приводит
§ 26] ИДЕНТИФИКАТОРЫ ЛЮЕНБЕРГЕРА 289
к следующему виду уравнения наблюдения:
1/1 -
Уч
- Ур „
-0 0. .,0 1 00...000,. [00... О
00...()0i00...01!..j00...0
_о о ... о о jo о ... о о
0п
X.
При вычислении С мы воспользовались формулой (4).
Б новом базисе уравнение х (/) = Лх (/) + Ви (£)
примет следующий вид:
£12
*iPi
£21
*2РЗ
'О 0 ... О *: *
1 0 ... О *; *
О 0 ... 1 * : *
* j о о ... о *
* j1 0 ... О *
* : 0 0 ... 1 *
X 4~ -Ви,
Jpv-p
* ; *! ! О 0 ... О *
* *: :1 0 ... О *
*: *: : 0 0 ... 1 *
где знаком * обозначены, возможно, ненулевые элементы
матрицы. Приведенную систему уравнений можно, оче-
видно, рассматривать как совокупность р систем уравне-
ний, каждая из которых имеет много входов и единствен-
ный выход. Структурная схема полученного канонического
представления приведена на рис. 26.2, Каждая из р си-
стем имеет следующий вид:
Здесь Di и Bi — матрицы размеров Х /; и [i, х m соот-
ветственно.
О
, . . =0 О .. . О 1
*
*
*
*
Ю Ю. II Андреев
290
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
(ГЛ. V
Используя полученное каноническое представление,
можно непосредственно применить к системе с многими вы-
ходами результаты, полученные при построении иденти-
фикаторов для системы с одним выходом. Для каждой под-
системы (6) можно построить асимптотический идентифи-
катор размерности р; — 1. Следовательно, размерность
Рис. 26.2.
идентификатора системы равна сумме размерностей р
идентификаторов для систем (6):
р
2 (Hi — 1) =п—р-
г=1
Эти идентификаторы дают на своих выходах п — р оценок
переменных состояния. Выходной вектор системы достав-
ляет еще р оценок. Характеристический многочлен каж-
дого из р идентификаторов согласно доказанному ранее
результату (теорема 1) можно выбирать по своему усмот-
рению. Единственное ограничение, связанное с реализуе-
мостью системы, состоит в том, что этот многочлен должен
иметь действительные коэффициенты. Поэтому, если ком-
§ 26]
ИДЕНТИФИКАТОРЫ Л ШЕНБЕРГЕРА
291
плексное число является корнем этого многочлена, то
сопряженное число 1$ тоже должно быть корнем этого
многочлена. Полученные результаты суммируем в виде
следующей теоремы.
Теорем а 2. Если п- мерная линейная стационарная
система
х(0 = + Би (0, 1 /ттг>
у(0 = Сх(О J (Л }
полностью идентифицируема, то можно построить
(п — р}-мерный асимптотический идентификатор состо-
яния, характеристический многочлен которого совпадает
с любым желаемым устойчивым многочленом, с действитель-
ными коэффициентами. Здесь р равно рангу матрицы С. 0
Алгоритм построения асимптотического идентифика-
тора состояния для системы с многими входами состоит
из двух этапов:
1. Выбираем базис в пространстве X, в котором система
разбивается на р подсистем вида (6), используя способ 2
§ 22.
2. Используем алгоритм построения идентификатора
для системы с одним выходом и многими входами.
Замечание. Хотя приведенные результаты и име-
ют значительный теоретический интерес, они не дают кри-
териев выбора полюсов идентификатора. Ясно, что харак-
теристические числа идентификатора должны выбираться
таким образом, чтобы идентификатор был устойчивым
и чтобы вещественные части его собственных значений
были «более отрицательными», чем вещественные части
собственных значений самой системы. Это нужно требо-
вать потому, что, как правило, по известно начальное
состояние идентификатора. Однако увеличение модуля
вещественных частей идентификатора превращает его в
дифференциатор со всеми возникающими при этом проб-
лемами. Выбор размещения полюсов идентификатора —
Сложная задача, в особенности для многомерных систем.
Матричное уравнение ТА — DT « S в теории иден-
тификаторов. Рассмотрим другой подход к задаче констру-
ирования идентификатора. Начнем с задачи идентифика-
ции состояния однородной стационарной системы х (£)
~ Ах (i), уравнение наблюдения которой имеет вид у (/) —
1 )*
292 ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ [ГЛ. V
= Сх (0, где С — матрица р X п. Пусть выходы этой
системы подаются на входы g-мерной системы (идентифи-
катора) z = Dz 4- QCx, где Q — матрица q X р, D — мат-
рица q X q. Обозначим QC = S, тогда
z — /)z -|- Хх. (7)
Предположим теперь, что существует (q X г0-матрица Т
такая, что выполняется равенство ТА —DT = 8. Тогда
непосредственным вычислением легко установить, что
решение уравнения (7) представимо в виде
л (0 = Тх (0 -р eDi {z (0) — Тх (0)] (8)
и, значит., если D — устойчивая матрица, то z (0
Тх (0 при t -> оо при любых z (0) и х (0). Предполо-
жим, что система имеет р линейно независимых выходов,
размерность идентификатора равна п — р, причем матрица
D устойчива, а Т является решением уравнения
ТА ~ I)T ~-$ (9)
и имеет ранг (п — р). Тогда р компонент вектора выхода
и п — р переменных состояния идентификатора дают ровно
п линейно независимых линейных комбинаций пере-
менных состояния системы. Решая эти п линейно незави-
симых уравнений относительно п неизвестных, получим
оценки всех компонент вектора состояния. Динамика
стремления ошибки этих оценок к нулю определяется мат-
рицей D. Задача конструирования идентификатора при
таком подходе сводится к решению матричного уравнения
ТА — DT = S относительно (q X л)-матрицы Т. В этом
уравнении матрица А задана, матрицу D выбирают по же-
лаемым динамическим свойствам идентификатора, матри-
ца S задана частично, так как 8 = QC, где С задана, a Q
предстоит выбрать. Итак, алгебраическая задача состоит
в том, чтобы выбрать D и Q так, чтобы решение Т имело
заданный ранг п — р.
Если система подвержена внешним воздействиям В =/=
*/= 0, то решение уравнений идентификатора будет по-
прежнему иметь вид (8), если эти уравнения записать
в форме
z (0 = Dz (0 4- «Ух (0 ТВи (0
(10)
23]
ИДЕНТИФИКАТОРЫ ЛЮЕНБЕРГЕРА
2УЗ
и если Т удовлетворяет уравнению (9), Советуем читателю
проделать соответствующие несложные вычисления и дока-
зать следующий результат.
Теорема 3. Выгоды линейной (g-мернои) системы
(10) асимптотически приближаются к линейным комбина-
циям вектора состояний Тх (£) линейной системы х (!) =
= Ах (t) Ц~ Ви (£) при любых начальных условиях z(0),
х (0) в том и только в том случае, когда Т является реше-
нием матричного алгебраического уравнения (9), а матри-
ца D устойчива. Q
Поскольку теоремы о существовании идентификаторов
с произвольными динамическими свойствами нами доказа-
ны, мы рассмотрим задачи конструирования идентифика-
торов с помощью данного подхода, не останавливаясь на
математических подробностях. Пусть матрицы {А, е'}
системы х (Z) = Ах (t), у (t) - с'х (£) имеют идентифика-
ционное каноническое представление. Пусть уравнение
(7) идентификатора для этой системы имеет вид
В этом случае легко проверить, что решением уравнения
ТА — DT = S является единичная матрица Е = Т, по-
этому переменные идентификатора z; служат оценкой для
соответствующих переменных Поскольку матрица урав-
нения наблюдения е' = [0 0 ... 1] нам задана, то из урав-
нения S = Qc имеем
г 3 — а -I
гп п
<2 = -
— ЗС1 _
Поскольку характеристический полином матрицы D ра-
вен фя (X) *» \п + pi V"1 + . . . то динамические
свойства идентификатора можно выбрать по своему усмот-
рению.
294
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. V
Рассмотрим теперь задачу конструирования иденти-
фикатора (п — 1)-го порядка для системы х (0 = Лх (t),
у (f) = с'х (£), где {Л. с'} представлены в виде (ИКП).
Если уравнения идентификатора имеют вид
то решением уравнения ТА —DT = 5 будет матрица
"1 0 ... О - Ря-L-
о 1 ... о -рп_2
_0 О . . . 1 —
размеров (и — 1) X и. В этом случае оценки переменных
получаются из переменных zf ио следующим формулам:
~ 2-1-1 -р Р i-1 Ar (И)
Поскольку коэффициенты {5г можно выбирать по своему
усмотрению, то динамические свойства идентификатора
по-прежнему могут назначаться произвольно. В общем слу-
чае, условие идентифицируемости системы гарантирует
существование матриц D (с произвольно заданным харак-
теристическим многочленом) и Г, Q, удовлетворяющих
уравнение ТА — D Т — QC и таких, что выходы иденти-
фикатора z (i) дают оценки всех компонентов вектора со-
стояний. Рассмотренный подход позволяет, таким обра*
зом, выяснить алгебраическую сторону проблемы конструи-
рования идентификатора.
Пример 2. Пусть матрицы системы имеют вид:
5 26]
ИДЕНТИФИКАТОРЫ ЛЮЕНВЕрГЕРА
295
Выберем собственное значение идентификатора X = —3.
Тогда уравнение идентификатора имеет вид
Д0--ЗН0 + И 01 [-W] + т [?]«(().
Пусть z (t) = Гх (?), где Т является решением уравнения
Г[“о + °Ь
Решение этого уравнения имеет вид Т = ---. Вы-
числим ТЬ — £1 -5“ • Окончательно уравне-
ние идентификатора получим в виде
(0 = — Зг (0 -р ль (t)-L и (0
и
z(0 = ^(/)----у~^2(0.
Структурная схема данной системы и построенного иден-
тификатора приведена на рис. 26.3.
Рис. 26.3.
Еще один способ построения (и, — р)-мерного иденти-
фикатора. Пусть в уравнениях (ЛС) в условиях теоремы
2 матрица С имеет ранг р. Выберем в качестве новых пе-
ременных состояния р линейных комбинаций компонент
вектора х (0, задаваемых уравнением наблюдения систе-
мы, и еще (п — р) линейно независимых комбинаций ком-
понент х (t), заданных равенством z (t) = Lx (t), где
296
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
[ГЛ. V
L — матрица (п - р) X п, строки которой ливойпо не-
зависимы, Проведенную замену переменных можно за-
писать так:
у (0
х(0 = Рх(0.
(12)
В соответствии с выбором L это — невырожденная замена
переменной, и матрица Р имеет обратную. Поэтому
х(0 = Р“г
р(0 I
|у Ш
Подставляя новые переменные в уравнения системы, по-
лучим
z (t) 1 , Гх (I)
= РАР~Г + РБц(0,
у (0 J Ly(#)J
или, разбивая матрицы РАР 1 и РВ на блоки, имеем
'z (t) ’
-у Ю _
’4«i л/]р<0’
‘ -У Ю -
(*)
Из этого представления следует, что уравнение для пере-
менных х (0 имеет вид
z (0 = Azzz (0 4- Л^у (0 -Н Вги (0.
Возьмем в качестве уравнения оценки вектора z (0 урав-
нение
i (0 - - A J (0 + ЛуУ (0 + Bzu (0, Z (0) 0. (13)
Тогда ошибка оценки z (0 = z (0 — z (0, как нетрудно
видеть, удовлетворяет уравнению
z (0 = А,гг (0, z (0) = z (0)-z(0).
Если матрица Azz устойчива, то ъ (0 0 при ^->оо.
Таким образом, оценка вектора состояния системы (ЛС)
определена равенством
г fz (0 1
х(0 -- Р-1 ,
§ 26]
ИДЕНТИФИКАТОРЫ ЛЮЕНПЕРГЕР \
297
и, если матрица L в (12) выбрана так, что подматрица
Лгг (п — р) X (п — р) устойчива, то
при
Структурная схема идентификатора приведена на
рис. 26.4.
Рис. 26.4.
Задачи. 1. Даны матрицы системы
“1 1 1"
О 1 О
О 1 1
Так как ранг матрицы {С, А'С'} равен 3, то система идентифици-
руема. Ранг матрицы С равен 2. Значит, идентификатор будет иметь
размерность 1. Выпишите уравнения этого идентификатора.
2. Докажите, что уравнение1 ТА — ВТ — С, где А и В —
квадратные матрицы п X п и т X т, имеет единственное решение
при любой матрице С тогда и только тогда, когда А и В не имеют
общих характеристических чисел.
3. Получите уравнения асимптотическою идентификатора сис-
темы с многими выходами, используя каноническое представление,
получаемое по способу 1 § 22.
4. Постройте идентификатор с собственными значениями =
= Ха = = — 1 для системы, заданной матрицами
4 = гО 1 0 Од 0 0 10 0 0 0 1 . с' —[2 0 1 0], ъ = лг 0 0
Д 0 0 0 Л-
5. Укажите основной принципиальный недостаток идентифи-
катора Люенбергера в сравнении с n-мерным идентификатором
(фильтром Калмана).
298
ИДЕНТИФИКАТОРЫ СОСТОЯНИЯ
(ГЛ. V
6. Используя замену переменной (12), постройте идентифика-
тор состояния гармонического осциллятора х (?) 4~ ж (?) = и (?).
у (t) = х (t), приняв собственные значения идентификатора рав-
ными —5.
7. Оцените все переменные состояния объекта
х (?) — х гг,
z (?) _ ат — и,
если измеряется переменная z (t), а собственные числа идентифи-
катора равны: —1i, —1 — i, —1. Решите эту задачу тремя
способами, приведенными и тексте. Какой способ обеспечивает
минимальный объем вычислений?
8. Для объекта
х (I) = и (I). у (?) = х (?) 4~ А,
где Д — аддитивная достоянная помеха в канале измерения, по-
стройте динамическую систему, три выхода которой асимптотически
стремились бы к величинам х (?), (£), А при t -> со.
Указание. Введите третью переменную состояния с урав-
нением А (?) = 0 и постройте идентификатор для полученной систе-
мы 3-го порядка.
9. Сконструируйте идентификатор 2-го порядка опенки состоя-
ния системы
1 я о 10 0' 0 0 1 Г1 о о о
А = 0 0 0 1 ’ с - [о 0 1 0
_0 - -1 а 0-
Собственные числа идентификатора: Л1 = — 2 -f- i, ~ - 2 — I.
ГЛАВА VI
МОДАЛЬНОЕ УПРАВЛЕНИЕ
Модальное управление обычно определяют как управ-
ление, которое изменяет моды (собственные значения ма-
трицы объекта) с целью достижения целей управления.
По существу задачи модального управления встреча-
лись уже в главах IV и V. Так, в § 23 приведен алгоритм вы-
бора такой обратной связи но состоянию, которая обеспе-
чивает заданное размещение собственных значений (мод)
объекта на комплексной плоскости. Б §§ 25, 26 из чисто
«модальных соображений» выбиралась динамика иденти-
фикатора.
В данной главе эти результаты положены в основу кон-
струкций устойчивых регуляторов состояния. Основное
внимание будет уделено конструированию обратных свя-
зей, обеспечивающих заданное размещение собственных
чисел (мод) замкнутой системы на комплексной плоскости.
При этом предполагается, что конструктору известно, ка-
кой набор собственных чисел желателен. Единственным
обязательным требованием будет требование устойчивости
замкнутой системы. Безусловно, устойчивость системы
является необходимым, но далеко не достаточным условием
ее практической пригодности. Регулятор обычно должен
обеспечить выполнение разнообразных требований, предъ-
являемых к переходному процессу. Эти требования могут
сложным образом зависеть как от собственных чисел зам-
кнутой системы, так и от нулей ее передаточной функции.
Таким образом, читателю необходимо иметь в виду, что
разбираемые ниже методы расчета модальных регуляторов
не исчерпывают всей задачи инженерного конструиро-
вания регуляторов, а обеспечивают формализацию и алго-
ритмизацию важнейшего этапа решения этой задачи —
этапа выбора динамической обратной связи по заданным
желаемым собственным числам замкнутой системы.
300
МОДАЛЬНОЕ УПРАВЛЕНИЕ
(ГЛ. VI
§ 27. Конструкция регуляторов
В главе IV было показано, что управляемой стацио-
нарной системе с помощью обратной связи можно придать
произвольные динамические свойства. Именно, корни
характеристического уравнения такой замкнутой системы
можно выбирать произвольно. Эти неограниченные воз-
можности стационарной обратной связи нельзя, вообще
говоря, использовать из-за того, что не все компоненты
вектора состояний обычно доступны для измерения.
В главе V выяснено, что для идентифицируемой систе-
мы можно построить динамическую систему'- (идентифи-
катор), выходные переменные которой асимптотически
приближаются к переменным состояния исходной системы.
Теперь предстоит объединить эти результаты в конст-
рукции одного регулятора.
Этот регулятор состоит из динамической системы, вы-
рабатывающей на своем выходе оценку вектора состояний
х (t) по результатам измерения выхода системы у (() и
Рис. 27.1.
входа u (i), и из стационарной обратной связи вида и (/) =
= - Кх («) (рис. 27.1)
Применение п-мерных идентификаторов. Рассмотрим
n-мерную управляемую и идентифицируемую линейную
систему
х (0 == Лх (0 4- Ви («),
у (О = Сх(0-
(ЛС)
Пусть, матрица обратной связи К выбрана так, что
характеристический многочлен матрицы [Л — ВК] сов-
падает с выбранным нами желаемым многочленом <ру (%).
' s 27] КОНСТРУКЦИЯ РЕГУЛЯТОРОВ 301
Предположим теперь, что построен асимптотический иден-
j тификатор состояния, уравнение которого имеет вид
х (?) = L4 — LC] х (?) 4- Ly (?) + Ви (I); (И)
обозначим характеристический многочлен идентифика-
тора сри (X) = ф[А-ьс]. Так как вектор х (?) недоступен для
* измерения, то попробуем заменить в цепи обратной связи
вектор х (?) на его оценку х (?). Напомним, что поскольку
* многочлен <ри (%) можно выбрать по своему усмотрению,
’ то всегда можно получить произвольную динамику стрем-
ления оценки х (?) к х (t) при t —> оо. При такой замене
> основной интерес представляет два вопроса: (1) матрица
* К выбрана в предположении, что известно состояние
? х (?), а потом вектор состояния заменен его оценкой х (г).
j Получится ли прежний результат? Другими словами, бу-
\ дет ли система с обратной связью по-прежнему иметь же-
s лаемый характеристический многочлен (ру (А)? (2) Какой
эффект вносит в систему идентификатор? Какое отношение
к характеристическому многочлену замкнутой системы
2л-го порядка будет иметь характеристический многочлен
идентификатора? Войдут ли собственные числа иденти-
фикатора в замкнутую систему без изменений? Оказы-
вается, что выбранные характеристические числа системы
с обратной связью по состоянию и характеристические
числа идентификатора войдут в замкнутую систему без
изменений. Именно, справедлива следующая
Теорема 1. Пусть дана управляемая и идентифи-
цируемая система {Л, В, С}. Пусть матрица К выбрана
/ так, что характеристический многочлен матрицы [А —
-~ВК] совпадает с заданным многочленом <ру (А) =- А” +
+ у1А’г-1 . . . + и пусть выбрана матрица L
такая, что характеристический многочлен матрицы [Л —
— LC] совпадает с <ри (А) = Ап Ц- А11’1 4" • • Рп;
тогда характеристический многочлен замкнутой системы
2п-го порядка
х (?) = Хх (?) — ВКх (?),
х (?) = [А — LC] х (?) — ВКх (t) LCx (?),
который мы обозначим через ц() (А), совпадает с произве-
дением выбранных многочленов (А) = (А) - <ри (А).
302
МОДАЛЬНОЕ УПРАВЛЕНИЕ
ГЛ. VI
Доказательство. Вычислим характеристиче-
ский многочлен получившейся системы 2д-го порядка
Г
' А : — в к
LC : А — LC — В К
Сделаем невырожденную замену переменной х (/) =
— х (t) — х (t). Матрица этого преобразования имеет вид
где Е — единичная матрица размеров п X п. В новых
координатах матрица замкнутой системы будет клеточно-
диагональной матрицей
X (t)
5(0_
x(tf
А - - В К ?
0 ; Л — LC
Характеристический многочлен этой клеточно-диагопаль-
ной матрицы совпадает с произведением характеристи-
ческих многочленов клеток, стоящих на диагонали. Имен-
но, фо (А) = фу (X) - ф„ (A). Q
Доказанная теорема очень важна для приложений. Она
утверждает, что поскольку речь идет о характеристических
числах замкнутой системы, то в некотором смысле пет раз-
ницы между использованием в цепи обратной связи вектора
х (/) и вектора х (t). Следовательно, и это особенно важно
и удобно, конструирование цепи обратной связи и кон-
струирование идентификатора можно осуществлять не-
зависимо. Характеристический многочлен замкнутой си-
стемы будет равен произведению характеристических
многочленов системы с обратной связью «и* состоянию»
и идентификатора. При конструировании обратной связи
мы имеем дело с двумя независимыми задачами, каждая
из которых л-мерпа.
Для случая, когда управляемая и идентифицируемая
система имеет единственный вход и один выход, формулы
построения n-мерной обратной связи, обеспечивающей
заданный набор 2п собственных значений матрицы замкну-
той системы, можно представить в замкнутой компактной
форме.
§ 27]
КОНСТРУКЦИЯ РЕГУЛЯТОРОВ
303
Алгоритм вычисления коэффициентов регулятора для
системы с одним входом. Пусть даны матрицы управляе-
мой и идентифицируемой системы с одним входом и с од-
ним выходом {А, Ь, с'} и пусть характеристический мно-
гочлен матрицы А равен фа (X) =
. . . Выберем в качестве <р7 (X) -- /Л 4- . . .
. • . +а характеристический многочлен идентификатора
представим в виде фи(Х) =- У-' 4- pj Хп-1 + . . . + (V
Введем обозначения
Уравнения регулятора, согласно приведенным выше ре-
зультатам имеют вид
х (t) = [А — 1с'] х (t) Ц- ly (t) 4- bu (£),
и (t) = — k'x(£).
Матрицы pf [Л-le'J = цулятора можно вычи -0 0 . . . 0 — [зп - 1 0 . . . о - ря_г о 1 ... о — зп_2 слить ,1 = по формулам ' - &п-1 ап-1 &П-2 ап-2
к' = L о о ... 1 — -1 Ь - РЬ, [Тп ’ Tn-1 • •, 71 - L 31 — ai -
Чтобы получить матрицы Р и Р \ необходимо последова-
тельно выполнить следующие вычисления:
U = [b,Ab,..., A«-ib], U = [b,Ab,...,4nLb],
tf = U-1, с' = c'Uff, Р ~ {[с, А'с,..., (^4)'71-1с]£7}г, Р*1.
Объем всех вычислений, необходимых для построения ма-
триц регулятора, в точности равен двум обращениям и пяти
умножениям п-мерпых матриц.
Мы пе приводим здесь подробного вывода этих формул,
так как по существу они были получены ранее. При-
веденный алгоритм объединяет задачу выбора обратной
304
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
связи «по состоянию» и задачу выбора коэффициентов иден-
тификатора. При последовательном применении этих
алгоритмов нужно лишь следить за тем, чтобы матрицы
системы были бы записаны в одном и том же базисе про-
странства состояний. Существование матрицы перехода
к каноническому представлению и к идентификационному
каноническому представлению обеспечивается свойства-
ми управляемости и идентифицируемости системы. Ясно,
что полученные уравнения регулятора определены с точ-
ностью до некоторого невырожденного преобразова-
ния Р в пространстве состояний системы.
Для случая системы второго порядка с одним входом
и одним выходом можно позволить себе роскошь в явном
виде выписать формулы обратной связи по заданным коэф-
фициентам многочленов фу и фи. Пусть элементы матриц
системы обозначены:
Я — [йц], Ъ — с = [ci, <?2], Фа ~ № Н-
Выберем: фу = V + Ti X ?2> Фи = № "И РЛ + Рз-
Матрицы регулятора вычисляем по формулам:
[1 — 3ij L3i — ceij 1/2 J
С1 ~ й 12^2) “Г
+ С2 (<%2^2 + Й21^1 к й22^2),
<2 (Тз + «а) — <*i (71 - - 31)
сз (ai?T — а2св) —
(Ti — ai)(ai?i — «2<‘а) — <т (Та — «а)
ea(aici — а2с2) — с®
(1)
Структурная схема регулятора приведена на рис. 27,2.
Замечание. Вычисление не обязательно прово-
дить по приведенным общим формулам. Порядок расчетов
может быть и другим. Поскольку характеристический
многочлен замкнутой системы, охваченной связью по со-
стоянию, и характеристический многочлен идентифика-
тора можно вычислять независимо друг от друга, то
можно построить несколько равноценных алгоритмов
вычисления n-мерной обратной связи, обеспечивающей
заданный набор 2п характеристических чисел замкнутой
§ 271
КОНСТРУКЦИЯ РЕГУЛЯТОРОВ
305
системы. Например, сначала можно вычислить вектор об-
ратной связи к\ Для этого удобно перейти к каноническо-
му управляющему представлению. Тогда матрицы А, Ь,
к' выписываются сразу, а для получения матрицы с'
необходимо вычислить матрицу преобразования Р. Чтобы
вычислить вектор 1. удобно перейти сразу к базису, в ко-
тором пара {Д, с'} имеет каноническое идентификацион-
ное представление. Тогда матрицы {Д, с', 1} выписывают-
ся сразу, а для вычисления матриц k', Ъ нужно строить
соответствующую матрицу перехода. Последовательность
вычислений можно менять. Необходимо лишь помнить
основное правило: все матрицы системы должны быть за-
писаны в одном и том же базисе пространства состояний.
Ясно, что коэффициенты регуляторов при различных
способах расчетов могут быть разными, хотя замкнутая
система и будет иметь один и тот же набор собственных
чисел. Получаемые регуляторы будут иметь одну и ту же
передаточную функцию и одинаковые характеристиче-
ские многочлены. Структурные схемы этих регуляторов
можно сделать идентичными с помощью соответствующего
невырожденного линейного преобразования в простран-
стве состояний или с помощью разрешенных преобразо-
ваний структурных схем.
Фильтр Калмана. Задача регулирования в детерми-
нированной постановке решена, считая, что все параметры
Зоб МОДАЛЬНОЕ УПРАВЛЕНИЕ [ГЛ. VI
системы точно известны и что на систему не действуют
помехи в процессе ее работы. Между тем конструирование
регулятора невозможно без учета реальных условий при-
менения системы, без учета характера помех и возмущений,
действующих на систему. Удивительно, что структура
линейного регулятора, наилучшим образом работающего
при наличии помех, в точности совпадает со структурой
регулятора, использующего «-мерный идентификатор со-
стояния (теорема 1),
Приведем без доказательства соответствующие ре-
зультаты.
Если в системе присутствуют помехи на входе и выходе
системы, задача детерминированного управления заме-
няется стохастической задачей. Вместо рассматриваемой
нами ранее линейной системы исследуется следующая
система (рассмотрим стационарный случай):
х (£) = Лх (£) -Ь Ь [ц (£) + v (t)],
у (/) = с'х (t) + w (t),
где v (£) и iv (/) — соответственно аддитивная скалярная
входная помеха и шум измерения вектора выхода. Помехи
v и и- предполагаются стационарными независимыми бе-
лыми гауссовыми шумами с пулевым математическим
ожиданием, т. е.
Е (v) = 0; Е (w) = 0, Е ($) иУ (I 4- т)} = О,
Е {г/ (t) v (t + т)} = q6 (т), E{n?(f), w' (t + т)} — Рб (т),
где б дельта-функция Дирака, Р — симметрическая неот-
рицательно определенная матрица и q 0, Е (•) — ма-
тематическое ожидание.
Если предположить, что матрица Р положительно оп-
ределена, то оценка х (t) вектора состояния х(£) может
быть построена в виде (подробности имеются в книге [24])
х (t) = Лх (t) L [у (0 — с'х (t)] + Ьм (t), х (0) = 0,
где
L = К^'Р-1,
а Ко — единственное положительно определенное решение
алгебраического матричного уравнения (уравнение Рик-
кати)
АК (t) + К (t) А' - К (t) с'Р^сК (/) Ч- <?hb = 0.
§ 27] КОНСТРУКЦИЯ РЕГУЛЯТОРОВ 307
Более того, этот идентификатор асимптотически устойчив,
т. е. собственные значения матрицы [Л - Ле] имеют от-
рицательные вещественные части. Структура этого иден-
тификатора (фильтра Калмана) в точности совпадает со
структурой «-мерного асимптотического идентификатора
состояния (§ 25).
Выбор коэффициентов для асимптотического иденти-
фикатора в детерминированном случае был ограничен
лишь условием асимптотической устойчивости матрицы
[А — Lc], а в остальном произволен. Уравнения фильтра
Калмана однозначно определяют все коэффициенты иден-
тификатора по данным о характеристиках помех в соот-
. ветствии с выбранным критерием (минимум среднеквад-
' ратичной ошибки оценки состояния).
Использование идентификатора Люеибергера. Резуль-
тат, аналогичный теореме 1, справедлив и для случая ис-
0 пользования (« — р)-мерного идентификатора состояния.
| Сначала докажем соответствующий результат для системы
; с одним выходом, когда идентификатор имеет размерность
> п — 1.
Т е о р е м а 2. Пусть идентифицируемая и управляе-
мая система с одним выгодом и, вообгце говоря, с многими
входами задана матрицами {Л, В, с'}. Пусть, далее, мат-
- рица К выбрана так, что характеристический многочлен
матрицы [Л — ВК] совпадает с желаемым <рт (А), и пусть
для этой системы построен (п — 1)-мерный идентифика-
тор состояния с характеристическим многочленом <ри (А) =
= А71-1 + рД”-2 -ф ... — Pn-i- Тогда характеристиче-
ский многочлен замкнутой системы (2п — 1)-го порядка
равен произведению многочленов <р0 (X) = <ру (А) (ри (А).
Доказательство. Обозначим через х (t) вы-
ход идентификатора. Этот вектор имеет размерность п — 1.
Уравнения замкнутой системы имеют вид
х (0 = jlx(t) — ВК
x(t) - Эх(0 - anrn(f) + Bu(t)
(см. теорему 2 § 26). Если теперь в этих уравнениях сде-
лать невырожденную замену переменных х (t) — х (i) —
— х (/) точно так же, как это было сделано при доказа-
тельстве теоремы 2 § 26, то уравнения системы вместе
х(0
мт ’
308
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
с цепью обратной связи примут вид
х(0 = [А - BK] х(0 + [?Jx(£),
х (#) = J’x(Z).
Матрица этой замкнутой системы (2п — 1)-го порядка
имеет вид
~А — ВК>. ? '
0 5 J *
Это — клеточно-диагональная матрица, и следовательно,
ее характеристический многочлен равен произведению
характеристических многочленов ее диагональных клеток,
т. е.
Фо W = Фу (Ь)‘фи (X). Q
Если система имеет много выходов и является иденти-
фицируемой, то, как показано при доказательстве теоремы
3 § 26, ее можно представить как прямую сумму подсистем,
каждая из которых имеет один выход и много входов. От-
сюда следует справедливость следующего утверждения.
Теорема 3. Пусть линейная система п-го порядка
является управляемой и идентифицируемой и имеет р не-
зависимых выходов. Тогда можно построить цепь обратной
связи (п — р)-го порядка, такую, что характеристиче-
ский многочлен замкнутой системы (2п — p)~s0 порядка
совпадает с произвольным вещественным многочленом
(2п — р)-го порядка. Q
Естественно, нас интересуют только асимптотически
устойчивые многочлены, все характеристические числа
которых имеют строго отрицательные вещественные
части.
Пользуясь описанием идентификатора Люенбергера,
приведенным в конце § 26 (рис. 26.4), можно легко дока-
зать теорему о возможности раздельного выбора харак-
теристических чисел идентификатора и системы, охвачен-
ной обратной связью по состоянию. Действительно, если
выбрать в качестве переменных состояния системы
(2п—р)-го порядка переменных {х (£),£(£)}, то, пользуясь
§ 27J
КОНСТРУКЦИЯ РЕГУЛЯТОРОВ
309
результатом § 26, имеем
(2)
Отсюда сразу следует, что собственные числа замкнутой
системы есть собственные числа системы со стационарной
обратной связью по состоянию (матрица [Л — В К])
плюс собственные числа идентификатора (матрица Агх).
Это следует из представления матрицы системы (2) в виде
’z(0 '
_Х(0
z~ р)
* (0 ]
Эта теорема завершает исследование задачи констру-
ирования устойчивого регулятора нулевого состояния.
Рассмотрим подробно ряд примеров конструирования
асимптотически устойчивых регуляторов.
Пример. Два интегратора, охваченные положи-
тельной обратной связью, имеют следующие уравнения:
= ^2,
т2 = ж1+и, J], Ъ = [1У с'= [1 0].
У = £1,
Согласно теореме 1 для этой системы можно выбрать
цепь обратной связи, содержащую два динамических
элемента, и такую, что замкнутая система 4-го порядка
будет иметь произвольно заданный характеристический
многочлен. Это можно сделать потому, что система являет-
ся управляемой и идентифицируемой. Коэффициенты цепи
обратной связи вычисляются по формулам (1). Структура
этого регулятора приведена на рис. 27.2.
Согласно теореме 2 для этой системы можно выбрать
обратную связь первого порядка такую, что замкнутая
система будет иметь произвольно желаемый характеристи-
ческий многочлен 3-го порядка. Построим такой регу-
лятор,
1. Вычислим характеристический многочлен матрицы А
<рл (X) = X2 — 1; = : О, == — С
2. Зададимся многочленами: (X) -- X2 X J-
и <ри (X) = X + Р, которые характеризуют динамику
310
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
системы, охваченной стационарной обратной связью по со-
стоянию, и динамику идентификатора состояния соответ-
ственно.
3. Так как пара матриц {Л, Ь} имеет каноническое пред-
ставление, то компоненты вектора к' сразу вычислим по
формулам — а2, к2 = — cq, и, следовательно,
к' = + 1, yj.
4. Теперь необходимо перейти к базису, в котором пара
{Л, с'} имеет идентификационное каноническое представ-
ление. Переход к идентификационному каноническому
представлению осуществляется с помощью матрицы
Преобразование с помощью этой матрицы всех матриц
системы дает:
Л: = РЛ^>=[? J], Ь: = РЬ = Щ,
е':~ с'Р^1 = [0 1], к':— к',?-1 = + 1].
5. Остается преобразовать матрицы системы {Л, Ь,
с', к'} с помощью преобразования
Мо ЧЬ !]
Б результате получим матрицы регулятора вида
Ь:=рн; чшма-
к': = к'Р1 = [Ть т2 + 1] ,] = (Т1, ?Т1 + (Та + Ы
с': =с'Р-* = [0 1][J J] = [0 1].
На рис. 27.3 приведена структурная схема обратной связи
вместе со структурной схемой объекта. На рис. 27.4 тот
же регулятор изображен в соответствии с общей схемой
рис. 27.1.
Стабилизация неустойчивого объекта 4-го порядка.
Рассмотрим задачу выбора параметров регулятора для
Рис. 27 3.
Рис. 27.4.
Рис, 27.5.
312
МОДАЛЬНОЕ УПРАВЛЕНИЕ
ГГЛ VI
объекта 4-го порядка, структурная схема которого приведе-
на на рис. 27.5. Уравнения этого объекта имеют вид
21 =
=- Ж3,
т3 = х4,
— Жу -f- Ы,
0 10 0
0 0 10
0 0 0 1’
1 о о 0_
с' = [2 О 1 0].
о
1
Матрица управляемости:
г0
и = fb, ЛЬ, Л2Ь, Л3Ь] =
1
О О 1
0 10
1 о о
ООО
имеет ранг 4, следовательно, система управляема. Так как
ранг матрицы
[с, Л'с, Л'2с, Л'3с] =
О
2
О
1
1
О
2
О
о-
1
О
2_
О
тоже равен 4, то система является и идентифицируемой.
Согласно теореме 2 существует цепь обратной связи 3-го
порядка такая, что характеристические числа замкнутой
системы ?-го порядка совпадают с желаемым набором
чисел. Вычислим коэффициенты этого регулятора.
1. Вычислим характеристический многочлен матри-
цы: <рА - Л1 — 1, ах — а2 — а3 = 0, ai =- — 1.
2. Зададимся многочленами цепи обратной связи и
идентификатора (X) = Л4 f- pjA3 + у.Л2 ф- Т-.Л + Yv
<ри (М = v -I- + рд + £3.
3. Так как пара {Л, Ь} имеет канонический вид, то
компоненты вектора к' сразу вычислим по формуле:
^n-i+i = Тг
к7 = {р4 + 1, у3, у2, yj.
Замечание. Если бы лара матриц {А, Ь} не имела
канонический вид, то необходимо было бы построить мат-
рицу преобразования к каноническому базису. 0
4. Теперь перейдем к базису, в котором пара {Л, с')
имеет каноническое идентификационное представление.
Соответствующая матрица перехода вычисляется по фор-
мулам теоремы 1 § 22. В нашем случае эти вычисления дают
5 27]
КОНСТРУКЦИЯ РЕГУЛЯТОРОВ
313
следующий результат:
0 1 “ 3 0 А 1 3
-0 1 0 2] 1 2
1 0 2 0 ~ 3 0 0
Р = 0 2 0 1 ’ 1 = 2 1
о а ——— Q
2 fl 1 О] 3 ~ 3
2 1
L “Г 0 ~ 3 0
Преобразуем все матрицы системы с помощью матрицы Р:
г0 0 0 1-1 г2п
А : - РАР~У - 1 0 0 0 0 1 0 о 1 b : М) 0 1
с' 0 О 1 0 - c'P1 [0001], 0_
к' = [74 4-1,7», 72, 71] 0 1 “ 3 0 2 - 3 1 3 0 2 Т 0 0 -Г 4 о » -4 -4 » =
Тз 4- 2Т1 (Т4 4-1)4- 2^2 2тз — п 2 (?< + 1) — «уа'
3 3 *3’3
5. Теперь, следуя процедуре построения идентифика-
тора размерности п — 1 (теорема 2 § 25), преобразуем
матрицы системы с помощью невырожденной матрицы:
Г1 0 0 — 3s-| г! 0 0 ,Зз-|
0 1 о — о 1 о За
р = 0 о 1 -31 , р^ 0 0 1 31 У
0 0 0 1 _ 0 0 0 1 _
гО 0 — 8з 1 — З1З3 ~ r2-|
1 0 -,3s Зэ — 31рг 0
А : - РАР~1 — 0 1 -Bi fc-ISj , Ь : - РЬ = 1
-0 0 1 31 0
с': = с'Р1 [0001],
k : — k Р 1 — [/ср к%. k^i^ 4~ к$? 4- &з^з 4~ ]*
314
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
где
Г 2Т1 — Тз , 2?2 — (Та +1) 7. ^з — Yi
/Ь1 — ---3--- J Л'2 — -----3 Г л3 “ 3 ’
> _ 2(74 + 1) — Тз
Л?4- з -
Напомним, что уравнения регулятора имеют вид
х (£) = Хх (£) -|- 1ш (f), x'(f) = [ЯГ1, гс2, х3, у],
и (/) = — к'х (<). у (/) =- (t).
Структурная схема регулятора приведена на рис. 27.6.
Рис. 27.6.
Замечание. Хотя вычисления структуры регу-
ляторов проводятся по конечным формулам, тем не менее
для систем высокого порядка могут возникнуть суще-
ственные трудности, связанные с вычислением обратной
матрицы. Мы не станем заниматься здесь вопросами вы-
числений обратных связей для конкретных задач, а при-
водим лишь те алгоритмы организации таких вычислений.
S 28]
УПРАВЛЕНИЕ ОТДЕЛЬНЫМИ МОДАМИ
315
которые непосредственно следуют из доказательств нуж-
ных нам результатов. Заметим, однако, что решение за-
дачи о регуляторе сводится к традиционным вычислитель-
ным проблемам линейной алгебры, методы решения ко-
торых интенсивно разрабатываются.
Задачи. 1. Для системы
*1 (I) = 3'i (0 + (I) + W (*),
*^2 (0 = 3Т (*)
вычислить цепь обратной связи 1-го порядна такую, чтобы замкну-
тая система имела следующие характеристические числа: Хх = —3,
Х3 ~ —2 -р г, Х3 — - 2 - I.
2. Для системы, приведенной на рис, 27.5, выберите цепь об-
ратной связи 3-го порядка такую, чтобы система имела характери-
стические числа. Xi —1 4-5, Х2 ~ —1 — 1' Х3 = Х4 = " 2,
Xs = —3, Хе = X? 1. Числа Х-, Хе, X? принадлежат идентифи-
катору.
3. Двигатель постоянного тока имеет передаточную функцию
«Г7 8
ИЧр) “ рз 9/Ja 8р •
Конструктор выбирает передаточную функцию замкнутой системы
в виде
4000
1 (Р) ~ (р4-Ю)(р+Ю)(р4-40)-
Для оценки состояния возьмите фяльтр Калмаиа с собственными
числами Хх = Х2 = Х3 = -20. Вычислите коэффициенты регуля-
тора и нарисуйте его структурную схему.
4. Вычислите обратную связь «по выходу» для системы
А = t1 1 СП [si о h^b WOO i 1 fcC II '0 O' 1 3 J3 L , 0 7 [7 9 0
такую, чтобы собственные числа замкнутой системы были: Хх = —3,
Ха = —3, Х3 = —4. Вычислите матрицу обратной связи «по со-
стоянию» для тех же условий [76[,
§ 28. Управление отдельными модами
Модальное управление можно определить нан управ-
ление, которое изменяет моды (собственные числа матрицы
системы) с целью достижения желаемых целей управле-
ния. Ранее были рассмотрены регуляторы, которые обес-
печивают управление всеми модами объекта. Часто управ-
ляемый объект имеет лишь небольшое число собственных
316
МОДАЛЬНОЕ УПРАВЛЕНИЕ
1ГЛ, VJ
чисел, которые с помощью управления требуется сдви-
нуть в желаемые точки, оставляя остальные собственные
числа без изменения. Тогда говорят об управлении отдель-
ными модами объекта. Это управление, вообще говоря,
проще вычислить и реализовать, чем управление, обеспе-
чивающее возможность выбора всех характеристических
чисел объекта. Такие задачи на практике часто возникают
при управлении многомерными объектами.
Модальная управляемость. Для того чтобы существо-
вало решение задачи о выборе управления, обеспечиваю-
щего изменение лишь некоторых собственных чисел
системы при сохранении остальных собственных чисел, оче-
видно, не требуется, чтобы объект обладал свойством пол-
ной управляемости. Достаточно, чтобы он был модально
управляем, т. е. допускал бы закон управления, изменяю-
щий заданные моды объекта.
Пусть Гg = {Xlf . . . , Xg}, q п,— произвольный
набор комплексных чисел, в котором каждое число при-
сутствует вместе со своим сопряженным. В дальнейшем
буква Г будет обозначать только наборы чисел, обладаю-
щих этим свойством. Назовем систему х (t) = Лх (£) +
4- Ви (£), у (t) = Сх (£) (ЛС) модально управляемой по
отношению к набору Г9, если существует матрица обрат-
ной связи К такая, что q собственных чисел матрицы
[А — ВК] совпадают с числами набора Га. Матрицу
К в этом случае называют матрицей модальной обратной
связи или модальным регулятором.
Если q = п и система (ЛС) модально управляема по
отношению к произвольному набору чисел Гп, то (ЛС)
называется полностью модально управляемой.
Предложение 1. Если существует базис в про-
странстве состояний, в котором система (ЛС ) не является
полностью модально управляемой, то (Л С) не является пол-
ностью модально управляемой.
Доказательство. Пусть х (t) = Лх (t) +
-р Ви (t) не является полностью модально управляемой,
а та же система, записанная в другом базисе пространства
состояний х (£) « Лjx (I) 4- Bjii (£), полностью модально
управляема. Тогда векторы х (£) их (t) связаны неосо-
бенным линейным преобразованием х “ Рх. Поэтому
А « P“MjP, В и значит, матрицы А и по-
добны. Поскольку пара (Л19 Bt} полностью модально уп-
§ 28] УПРАВЛЕНИЕ ОТДЕЛЬНЫМИ МОДАМИ 317
равняема, то существует матрица Кг такая, что собствен-
ные значения совпадают с Гп, где Гп — про-
извольный набор комплексных чисел. Далее, мы имеем
х (0 = [А — BKtP] х (t) = Р-1 [Л2 - Рх, и зна-
чит, матрица [Aj — BpSkJ подобна матрице [А — ВКТР],
и поэтому пара {Л, В} полностью модально управляема.
Полученное противоречие доказывает теорему. Q
Для управляемой системы с одним входом справедливо
Предложение 2. Если пара {Л, Ь} управляема,
то она и полностью модально управляема и соответствую-
щий модальный закон управления единствен. Q
Понятие полной модальной управляемости эквивалент-
но понятию управляемости. Об этом свидетельствует
Теорема 1. Пара матриц {Л, В} управляема
тогда и только тогда, когда она полностью модально уп-
равляема.
Д оказательство. Предположим, что пара {Л ,В}
полностью модально управляема, но не управляема.
Тогда существует базис в пространстве Rn такой, что одна
из компонент вектора состояния представима в виде =
= KiXi, где — собственное значение матрицы А (см.
задачу 1). Поскольку уравнение для х^ не зависит от уп-
равления и от других переменных состояния, то собствен-
ное значение X,- нельзя изменить с помощью выбора матри-
цы обратной связи К. Отсюда следует, что система не
является полностью модально управляемой, что противоре-
чит первоначальному предположению. Мы доказали до-
статочность. Необходимость сразу следует из результатов
§ 23 (теорема 1). Q
Управление одной и двумя модами. Теперь обсудим
конструктивные методы построения модального управле-
ния, т, е. технику вычисления таких обратных связей,
которые обеспечивают сдвиг некоторых собственных зна-
чений матрицы А в желаемые точки комплексной плоскости.
1 Такая техника полезна при решении таких задач, когда
объект не является управляемым, но модально управляем
и может быть стабилизирован с помощью модальной об-
ратной связи. Кроме того, часто и для управляемого
объекта требуется построить такую обратную связь,
которая смещала бы лишь некоторые моды этого объекта
в заданные точки. При решении этой задачи можно вос-
пользоваться общими алгоритмами (§ 23). Однако при
318
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
таком подходе сложность решения задачи неизмеримо выше,
так как даже при сдвиге всего одного собственного значе-
ния приходится иметь дело с обращением матриц полной
размерности п.
Пусть линейный объект является модально управля-
емым по отношению к вещественному собственному зна-
чению ХР Рассмотрим задачу выбора обратной связи,
обеспечивающей сдвиг Xj X* и оставляющей неизмен-
ными остальные собственные числа объекта. Выберем
в пространстве состояний такой базис, чтобы матрица объ-
екта А имела треугольную форму. Итак, пусть
х (г) = Ах (г) + Ви (г),
(1)
где
Выберем матрицу обратной связи К размеров т X п
вида
-fcii 0 ... о-
А*21 0 ... О
lAi о . . . oj
Тогда матрица замкнутой системы будет
[А - ВК] = ?л — <bi, ki> : 0 . 0 "
— <Ьз, ki> А2 • . 0
— <ЬЯ, к1> *
Здесь через Ьг обозначены вектор-строки матрицы В, кх —
первый ненулевой столбец матрицы обратной связи К,
Так как мода Хх управляема, то найдется вектор кх такой,
что <к1( Ьх> 0. Если выбрать кх нз условия
Хх — <bx, кх> ~ Хх,
то получим желаемый сдвиг собственного значения Хх
при неизменных остальных собственных значениях мат-
§ 28]
УПРАВЛЕНИЕ ОТДЕЛЬНЫМИ МОДАМИ
319
рицы А, Вектор к, в общем случае системы с многими вхо-
дами не единствен.
Аналогичную процедуру можно построить для выбора
модального регулятора, обеспечивающего сдвиг двух
собственных управляемых чисел объекта при неизменных
остальных модах. Рассмотрим такой алгоритм для случая
сдвига двух корней Ах, Х2 к желаемым значениям /n. Х2-
Пусть система (1) имеет управляемые собственные числа
Хх, Х2, вещественные и различные. Выберем (т X п)-
матрицу#в виде К ~ [кх, к3, О, . . 0], где к(. к3 — пер-
вые два столбца этой матрицы. Тогда матрица замкнутой
системы будет иметь вид
[А — ВК\ =
Xi — <Ы, ki> <bi, кэ> ;
<Ь-з, ki> %2 — <Ьа, кг> :
/111; 0
/112 : -^22
*
Характеристический многочлен этой клеточно-диагональ-
ной матрицы равен произведению характеристических
многочленов клеток, стоящих на диагонали,
det [X# — А : ВК] = det [X# — An] det [X# — А33] =
= det [X# - Alx] (X - Х3) (X - Х4) ... (X - Хп).
Для того чтобы этот характеристический многочлен имел
желаемые собственные числа Xj., Xj, необходимо потре-
бовать, чтобы
det [X# — Ахх] == (X — Xi) (X — Х2) = X2 — (Хх -|- Х2) X -р ХхХ2.
Это дает уравнение для векторов кх, к3:
[X — Xi <bx, kj^] [X — Х<2 <Ъ2, к2^] — <ЬХ, к2> (Ь2, кх> ~
= X2 — (Хх -р ХА X Ц- ХхХ2.
Будем искать векторы кх, к2 в виде кг = 6гк0, i = 1, 2,
где к0 — постоянный вектор, удовлетворяющий условиям
<Ь1( к0> ф О, <Ь3, к0> Ф 0. Обозначим: рх <ЬП к0>,
р2=(Ъ2, к0>. Тогда уравнение относительно 6lf 62 примет
320
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ VI
вид
х — Xi — 61З1 — j _ Г Ч
— 61& X — Xj - бф-J ~ [о
о
(2)
Если приравнять коэффициенты многочленов в обоих ча-
стях этого равенства, то получим пару нелинейных урав-
нений относительно б,. Эти уравнения можно, однако,
свести к линейным следующим образом:
л . ГХ — Xi — 6131 — 6з31 "I _
е L - б1р1 х - х2 - mJ “
- det [ - sip! - mJ + doL L о x - хг г
Умножим вторую строку первою определителя в правой
части этого равенства на v и вычтем из 1-й строки.
Тогда получим в правой части равенства выражение
ГХ — Xi 0 1 ГХ — Xi — 61^1 — д-АА
det [ - ер, - 6$J + det [ о X-. Ха] ’
и уравнение (2) сводится к такой линейной системе:
+ 62% = (Хх -р Х3) — (Xj -р Х3) |
Ш ^“1^2 — XiX3. J
Определитель этой системы
deb [х131 Xz3i] ~ “ Х1) 0
в силу предположения Х^ ф Х2. Таким образом, нужные
числа 61э 62 всегда найдутся.
Алгоритм вычисления модального регулятора К, обес-
печивающего сдвиг двух управляемых мод системы, со-
стоит из следующих шагов.
1» Выбираем базис в пространстве состояний, в котором
матрица А имеет треугольную форму и первые два места
на главной диагонали заняты сдвигаемыми модами Xlf Ха.
2. Выбираем постоянный вектор к0, так, чтобы <к0,
bj> 0, <кп, Ь2> 0. Это можно сделать потому, что пара
мод Х1} Х2 управляема.
3. Вычисляем коэффициенты 62, решая линейную
систему (3). Существование нужных бг, 62 обеспечивается
тем, что Xt =7^ Х2.
281
УПРАВЛЕНИЕ ОТДЕЛЬНЫМИ МОДАМИ
321
Замечание!. Мы рассматривали простейший слу-
чай различных вещественных корней. Если корни — ком-
плексные, то процедура сохраняется. При этом, однако,
следует иметь в виду, что матрица перехода к базису, в ко-
тором матрица системы имеет треугольный вид, будет
комплексной матрицей, и удобнее проводить все вычисле-
ния, имея в виду первоначальный базис системы. Если при
применении модального регулятора комплексные числа
объекта входят в набор по-прежнему вместе с сопряжен-
ными, то замкнутый объект будет по-прежнему физически
реализуем. Для вычисления модального управления,
которое обеспечивает сдвиг первых двух собственных зна-
чений, необходимо злать лишь эти собственные значения
и соответствующие им собственные векторы.
Замечание 2. Для системы с многими входами
обратная связь, обеспечивающая сдвиг одного или двух
собственных значений, не единственна. Может существо-
вать бесчисленное множество векторов к0, удовлетворяю-
щих нужным требованиям. Выбор единственного к0 из
этого множества может быть основан на соображениях оп-
тимальности по какому-либо критерию, чувствительности
системы по отношению к изменениям параметров, оценки
стоимости управлений по разным входам и т. п. Иногда
вектор к0 целесообразно выбирать таким, чтобы обеспечить
минимальное значение коэффициентов усиления в цепи
обратной связи.
Итерационное построение модального управления.
Можно попробовать реализовать закон управления, сдви-
гающий I собственных значений в желаемые точки, последо-
вательно применяя обратные связи, которые обеспечи-
вают на каждой итерации сдвиг лишь одного-двух корней,
оставляя неподвижными остальные корни системы. Об-
щая обратная связь получается объединением обратных
связей, вычисленных на каждой операции.
Рассмотрим систему с различными собственными зна-
чениями
х (£) = Лх (i) 4- 7iu (£),
записанную в таком базисе, в котором матрица А — тре-
угольная. Первый шаг итерационной процедуры будет
состоять в применении закона управления u (t) = (i)
такого, чтобы он сдвигал пару собственных значений
П Ю. Н Андреев
322
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
Х2 к значениям соответственно. Подставляя эту
обратную связь в уравнение системы, получим систему
х (£) = ЛС1) х (£) 4. Ви (t), где ЛС1) = А — ВК^. Полу-
ченную систему снова можно привести к такой форме,
чтобы матрица Л[1) была бы треугольной. Предположим,
что это преобразование выполнено, тогда на диагонали
матрицы Л С1) стоят собственные числа Х3, . . Хп.
Если полученная матрица ЛС1) отвечает предъявляемым
Рис. 28.1.
требованиям, то выбор обратной связи закончен. В против-
ном случае выбираем модальную обратную связь К&
так, чтобы Л(2) — [ЛС1) — SC1) да] имела бы, например,
собственные значения Х3, Л4, совпадающими с числами
А3, Х4, а остальные собственные числа неизменными. По-
добная итерационная процедура может быть продолжена,
причем на каждой итерации некоторое число собственных
чисел будет изменяться. После j шагов система будет иметь
уравнение
х (£) = Л^х (i) 4“ Su (i).
Графическое изображение этой процедуры представлено
на рис. 28.1.
§ 28]
УПРАВЛЕНИЕ ОТДЕЛЬНЫМИ МОДАМИ
323
Ясно, что в таком рекурсивном алгоритме каждый шаг,
да и все j шагов, легче осуществить, чем провести один шаг,
сдвигающий сразу I мод объекта. Трудности вычислений
экспоненциально растут при увеличении числа корней,
сдвигаемых одновременно. Поэтому удобнее всего работать
одновременно с одним или двумя собственными значения-
ми. Если сдвигаемое собственное значение — действи-
тельное, то можно использовать шаг в итерационной про-
цедуре, обеспечивающий сдвиг только одного собственного
значения. Если же сдвигаем одновременно два собственных
значения, то можно изменять как действительные, так
и комплексно-сопряженные пары собственных значений.
В заключение этого параграфа заметим, что хотя уп-
равление отдельными модами и требует меньше вычисле-
ний, но приведенные алгоритмы можно реализовать лишь
при наличии Если же моды, которыми мы хотим уп-
равлять, не известны, то по-прежнему требуется решение
системы линейных уравнений n-го порядка, и трудности
вычисления управления, сдвигающего одну моду, экви-
валентны трудностям при вычислении управления, сдви-
гающего все моды системы. Поэтому основная область при-
менения управления отдельными модами,— это объекты,
для которых известны нежелательные моды и требуется
построить модальный регулятор, изменяющий только эти
моды объекта и оставляющий неизменными все остальные
моды. Вопросы управления отдельными модами рассмот-
рены в предположении, что все переменные состояния
могут быть измерены и поданы на вход в виде обратной свя-
зи. Если это условие не выполняется, то необходимо
строить оценки состояния, как это сделано в гл. V. Теория
модального управления может быть применена и в этом
случае. Подробности можно найти в работах [81, 84].
Задачи. 1. Докажите, что пара {4, В} управляема тогда и
только тогда, когда не существует баэиса в пространстве Rn такого,
что одна из компонент вектора состояний представима в виде (f) =
= ('), где — собственные значения матрицы А.
2. Для управляемой системы х (t) = Ах (г) + Ви где А =
= — Е,
'1 1 Г
В= 1 1 1
1 1 1
11*
324
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
выберите модальную обратную связь, при которой замкнутая си-
стема имеет матрицу
Г— 4 О О"
4 = 0—1 0 -
о 0 — 1.
3, Для системы, приведенной в задаче 4 § 26, выберите модаль-
ную обратную связь, при которой пара собственных значении мат-
рицы А станет Ах = л2 — —3, при сохранении неизменными осталь-
ных собственных чисел системы.
4. Пусть вещественная матрица А имеет л различных собствен-
ных чисел Xj, %2> • •! и пусть vlf va, . . vn — соответствующие
собственные векторы. Построите алгоритм сдвига I < п собствен-
ных чисел матрицы А к желаемым значениям А,*, Х2.л;, пред-
положив, что пара {4, В} управляема,
§ 29. Интегральная обратная связь
Мы рассматриваем конструирование систем управле-
ния на основе линейной модели. Эта модель, как правило,
пе точна. Неточности могут быть следствием допущений,
сделанных относительно теоретических положений о про-
цессе, следствием линеаризации уравнений нелинейной
модели, могут возникать из-за ошибок в задании парамет-
ров процесса и по другим причинам. Кроме того, управ-
ляемые процессы часто подвержены влиянию возмущений,
которые нельзя измерить. Чтобы добиться нечувствитель-
ности по отношению к внешним возмущениям и к ошибкам
модели, в промышленных регуляторах всегда присутст-
вует интегральная обратная связь. Для улучшения харак-
теристик систем управления часто используется управ-
ление по возмущению. Здесь будут рассмотрены эти спо-
собы управления с точки зрения пространства состояний
объекта.
Если не все переменные состояния доступны для изме-
рения, то регулятор содержит динамическую систему —
идентификатор, цель которой состоит в оценке переменных
состояния, не доступных для измерения. Этот идентифи-
катор обеспечивает наличие интегральной обратной связи.
Однако из теории автоматического регулирования изве-
стно, что для исключения статической ошибки даже в объ-
екте первого порядка, например, имеющем уравнение
& (г) « — х (t) -j. и (^) _|_
§ 29]
ИНТЕГРАЛЬНАЯ ОБРАТНАЯ СВЯЗЬ
325
уже требуется наличие интегратора в обратной связи.
Вместе с тем, если у этого объекта измеряется переменная
® (0 = У (£)> то, казалось бы, для восстановления состоя-
ния не требуется идентификатор и для обеспечения же-
лаемых динамических свойств замкнутой системы доста-
точно стационарной обратной связи. На самом деле это
не так. Коль скоро имеются неконтролируемые возму-
щения, действующие и а объект в процессе регулирования,
то состояние объекта х (t) вместе с управлением и (£)
ие достаточны для предсказания выхода в будущем из-за
наличия помехи. Чтобы можно было по-прежнему решать
задачу регулирования в рамках схемы: «состояние — иден-
тификатор состояния — обратная связь по состоянию»,
необходимо ввести фиктивные переменные состояния, ко-
торые содержали бы информацию о помехе.
Аддитивная помеха в канале измерения. Рассмотрим
простейший устойчивый объект 1-го порядка
& (£) = — ах (t) -j- и (t).
Пусть переменная состояния этого объекта измеряется
с постоянной ошибкой А. В этом случае уравнение наблю-
дения имеет вид
у (£) = х (t) + A (i), A (?) = const.
Если использовать обратную связь по выходу и (£) —
= — ку {t)y то замкнутая система будет содержать стати-
ческую ошибку. При t -> оо имеем — ах (t) — к(х (I) +
+ А) = 0 и, следовательно, х (t) = ^0. Таким об-
разом, хотя объект — 1-го порядка, но его переменная
состояния х (t) ие доступна для измерения, и для того,
чтобы воспользоваться преимуществами «обратной связи
по состоянию», необходимо построить динамическую систе-
му для оценки х (f). Введем новую переменную состояния
A (t) с уравнением A (£) = 0. Тогда уравнения объекта
примут ВИД
£ ($) = — ах (i) -j- и (t),
А (0 = 0, у (г) = х (г) + А (г).
Матрицы этого объекта
4 = о]’ ь = [о]’ = (!)
326
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
Заметим, что пара {А, Ь} неуправляема, но пара {А, с'}
идентифицируема, поскольку {А', с} управляема. Дей-
ствительно,
и = [с, А'с] = [J -“]
и ранг U = 2. Построим идентификатор Люенбергера
для оценки состояния этого объекта 2-го порядка. При
этом воспользуемся заменой переменной (см. § 26, фор-
мула (12)). Пусть
г (0 = х (t) + (О, У (0 = х (О + д (О»
тогда
Гг(01 _ Г1 Z] _ пРЮ*]
Ly(t)J Ll 1J 1.Д U)J “ LA U)J ’
и мри I 1 матрица Р — неособенная. Вычислим
1 I л
L~ 1 — I 1 —Z I
и построим идентификатор для переменной z (£). Тогда
оценки переменных состояния имеют вид
i(0 = TZT 2(0 —г=7 у(0’
Д (0 = - г W + Г=7 У (О-
Теперь необходимо преобразовать матрицы {А, Ь} с по-
мощью матрицы Р. Это преобразование дает
ЖН!]-
§ 291
пйтё^ралёйая оёратйая сйязЬ
327
Следовательно,
А — '- А - - l a— I - 1
^zz j___j ^lzv j______/ •> 1 г 1 •
Уравнение идентификатора для переменной z (£) в соответ-
ствии с формулой (13) § 26 имеет вид
2(0= — 7rrr2(0+-^TTs(0 + «(0- з(0) - 0.
Теперь, используя оценку переменной состояния х (’)
можно построить обратную связь вида и (t) = (/)
Обгций вид уравнений замкнутой систем!л гаков:
£ ($) = — ах (£) 4* и (0»
2(0 = ” TT7Ts(0 + т=тУЩ +и(0-
y(t) = x(t) + л, x(t) =
и (i) -- — кх (£).
Структурная схема замкнутой системы представлена на
рис. 29.1. Ее собственные числа равны собственному
значению идентификатора и собственному значе-
нию объекта, охваченного обратной связью по состоянию
Х2 = — а — к. При к — a, I <Z 1 замкнутая система
устойчива.
5^8
моДалЬноё Управление
1гл VI
Вычислим передаточную функцию полученного регу-
лятора. Она имеет вид
kl
1__I Р
Т+~-
Уравнение регулятора получено без привлечения каких бы
то ни было дополнительных инженерных соображений
о виде его передаточной функции. В рассуждениях исполь-
зованы только следующие понятия: состояние, обратная
связь по состоянию, идентификатор состояния.
Замечание. Хотя рассматриваемая система и
имеет второй порядок, переменной Д не соответствует
в этой системе никакой динамический элемент. Поэтому
выбираем обратную связь только по переменной х (£),
используя полученную для этой переменной оценку х (£).
Можно рассуждать по-другому. Система (1) является не-
управляемой, но она модально управляема по отношению
к переменной х (£). Поэтому выбираем обратную связь по
состоянию (а значит, используем информацию об обеих
переменных состояния х (t), Д (£)) такую, чтобы первое
собственное значение объекта имело бы заданное зна-
чение.
Постоянное возмущение на входе. Рассмотрим тот же
устойчивый объект 1-го порядка при наличии аддитивной
помехи на входе объекта. Уравнение объекта в этом случае
имеет вид
£ (О = ~~ ах (?) + и (0 + А»
у (I) = х (I).
Обратная связь вида и (£) = — ку (t) не избавляет от ста-
тической ошибки и в этом случае. Поступим аналогично
тому, как было сделано выше. Введом'ййьую переменную
состояния с уравнением Д (t) = 0. Тогда система 2-го
порядка
& (/) — — ах (t) -j- Д 4- и (;),
Д (0 = О,
у (t) =
л=Го Л- НЗ’
§ 29] ИНТЕГРАЛЬНАЯ ОБРАТНАЯ СВЯЗЬ
329
полностью идентифицируема. Построив идентификатор со-
стояния этой системы, можно, как и раньше, получить
требуемую интегральную обратную связь. Однако нетруд-
но видеть, что в этом нет необходимости, поскольку эта
задача эквивалентна предыдущей. Достаточно привести
помеху на входе системы к выходу.
Рассмотрим невырожденное преобразование перемен-
ных: z (t) = х (i) + А; А (£) == А (£). Матрица этого пре-
образования имеет вид
Согласно общему правилу, преобразуем матрицы {А,
Ь, с'} по формулам: А : = РАР~\ Ь: — РЬ, с' : =
~ р-1 с. В новом базисе матрицы системы примут вид
Эта система имеет уже единственную помеху на выходе,
и регулятор, обеспечивающий асимптотическую устойчи-
вость для этой системы, совпадает с приведенным на
рис. 29.1. Поскольку невырожденная замена переменной
не изменяет соотношения между входом и выходом системы
(не меняет передаточной функции объекта), задача выбора
регулятора решена для случая аддитивной помехи на
входе.
Замечание. Нетрудно видеть, что выбор перемен-
ных состояния при наличии помех не является однознач-
ным. В рассмотренном примере в качестве переменных со-
стояния можно взять пару {ж (£), х (£)}, или пару {я ($),
u (t)}, или {у (£), х (£)}, или линейные комбинации этих
переменных.
Интегральная обратная связь для многомерного объ-
екта. Рассмотрим многомерный случай. Пусть уравнения
линейной стационарной системы представлены в виде
х (t) = Дх (i) + #п (£),
У (о = Cx(t) 4- DA,
где А — вектор г X 1, a D — матрица р X г, А — произ-
вольный вектор постоянного возмущения при измерении,
330
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
Мы рассматриваем по-прежнему детерминированный слу-
чай. Потребуем, чтобы система удовлетворяла условиям
асимптотической устойчивости по отношению к выходу,
т. е. у (£) 0 при t —> оо и, кроме того, х (£) -> 0 при
£ —> оо. Вектор помехи А мы считаем неизмеримым. Пусть
(р X п)-матрица С имеет ранг р и р тп, где т — раз-
мерность вектора и (£). Будем предполагать, что все урав-
нения рассматриваемой системы линейно независимы.
Если это условие не выполняется, то можно понизить поря-
док системы, исключив ее линейно зависимые уравнения.
Введем новый вектор состояния z' (£) = [х'(С> У'(01 и
новое управляющее воздействие по формуле v (£) =
— и (£). Дифференцируя исходное уравнение системы
х (£) = Лх (£) 4- 2?и (£), получим следующую систему
уравнений относительно переменных состояния z (£):
z (£) = Az (£) + #u (f),
1де
z(°)=[c
(2)
1 Гх <°П
, МО)
J LA(O)
в
о
Поскольку по предположению матрица С имеет ранг р,
то матрица в уравнении (2) имеет полный ранг п + р и
z (0) может быть любым вектором в области значений этой
матрицы. Наша задача относительно переменной z (£)
заключается в том, чтобы обеспечить z (£) —> 0 при t —► оо
из любых начальных состояний z (0). Эти условия могут
быть выполнены, если пара {Л, В} управляема, а матрица
Г А 5 j „
к, 0 имеет полный ранг п + р. Более того, в этом случае
мы можем произвольно выбирать динамику замкнутой си-
стемы за счет выбора стационарной обратной связи по со-
стоянию z (£) вида v (£) = Kz (£). После перехода к преж-
ним координатам получим равенство
v (0 = и (£) - Кгх (£) + Х2у (£),
§ 29]
ИНТЕГРАЛЬНАЯ ОБРАТНАЯ СВЯЗЬ
331
интегрируя которое, вычислим искомое управление
t
и (0 = А\х (t) 4- К2 у (£) dt 4- #2уо, (3)
о
гДе у0 — вектор начальных условий, задаваемых на р
интеграторах. Обычно у0 = 0.
Управление, как, впрочем, и в одномерном случае,
не использует информацию ни о векторе возмущений Д,
ни о матрице D. Эти сведения нужны лишь для формиро-
вания начальных условий согласно уравнению (2). Наши
рассуждения сформулируем в виде теоремы, доказатель-
ство которой оставляем читателю. См. также [59, 601.
Теорема 1. Линейная стационарная система
z(() = + где А = [£ °], = [о ] ’
является управляемой тогда и только тогда, когда:
1) пара {А, В} управляема, 2) матрица имеет ранг
п 4- р. В этом случае с помощью обратной связи вида
v (/) = Къ (0 замкнутой системе можно придать произ-
вольные динамические свойства. Если обратная связь
v(t) = Къ (t) выбрана так, что многочлен <р (X) =
— ап+р 4- 4- . • • + ап+р = 0 является харак-
теристическим многочленом (п 4* р)-го порядка замкнутой
системы, то этот многочлен будет характеристическим
многочленом системы
х (t) = Лх (Q 4- Su (2),
y(t) = С'х (t) 4-DA,
охваченной интегральной обратной связью вида
t
u(0 = Я\х(0 4-#2§у(£)^ + Я'гУо-
о
Если многочлен (X) устойчив, то выполняются условия
у (0 0, х (f) 0 при t оо. Q
Таким образом, закон управления, обеспечивающий
замкнутой системе заданную динамику, можно рассчи-
тать, рассмотрев вспомогательную систему (4). Очевидно,
этот подход аналогичен тому, который был рассмотрен
332
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
при исследовании возмущений в системах Vro порядка.
Разница в том, что там мы брали в качестве новых пере-
менных состояния выход у (0 и линейную комбинацию
х (t) и Д (t), а здесь берем х (£) и у (£). Но зная х (£) и
у (t), можно вычислить А и х (£). Если не требуется выби-
рать динамику замкнутой системы, а необходимо лишь
стабилизировать эту систему, то вместо требования управ-
ляемости пары {Л, В} достаточно требования модальной
управляемости по отношению к ее неустойчивым модам.
Управление по возмущению. Если помеха доступна для
измерения, то задача управления существенно упрощает-
ся. Начнем со скалярного случая. Пусть
х (t) = ах (£) и (£), у (0 = х (t) 4- А
и помеха А измеряется. Тогда управление вида и (t) =
= —ky (t) 4- АА, к > 0, обеспечивает стабилизацию си-
стемы, поскольку
« (£) —к [х (£) 4- А] 4- fcA = —кх (t)
и мы имеем обратную связь по состоянию. Управление
в присутствии помехи сводится к управлению без помехи
с помощью вычитания измеряемого сигнала помехи из
выходного сигнала. Чтобы выполнить такое вычитание
в матричном случае, необходимо провести некоторые пре-
образования координат в пространстве состояний. Итак,
пусть
х (£) = Ах (£) 4- Du (£) 4- F&,
У (О = Сх(£) 4- DA,
и помеха А измеряется. Введем в рассмотрение матрицы
размеров (д 4- р) X (л г т), (п 4- р) X г соответственно
и предположим, что ранг матрицы /V равен п 4~ Р- Опре-
делим (п /?)-мерный вектор равенством
, и,.
= - [У+ЯА]',
где через У+ обозначена матрица У+ = [N'NY^N'. По-
скольку N имеет ранг (п 4- /?), то (п 4- р) X (п 4- р) -
t
f g 29] ИНТЕГРАЛЬНАЯ ОБРАТНАЯ СВЯЗЬ
i матрица У'У обратима. Рассмотрим теперь преобразова-
ние беременных z -- х х, у = и — й. Заметим, что
z и v равны отклонениям от требуемых конечных значений
переменных состояния и управляющих переменных соот-
ветственно. Проведя это преобразование переменных,
й получим
I z (0 - Аг (0 + Bv (0 4- q1: j
I У (0 = Cz(0 + qa, f (5)
I z(0) = x(0) — x, J
'. где векторы qx и q2 определены равенством
Требование х (0 -> 0 и у (0 -> 0 при t -> оо для исходной
системы уравнений эквивалентно требованию z (0 -> О,
У (0 О при t оо для преобразованной системы. Эти
' условия будут выполнены в том случае, если пара {Л, В}
управляема и векторы qt и q3 равны нулю. Последнее
- условие эквивалентно требованию УУ+И = Н, откуда
\ NN+ = Е. Управляющее воздействие вида v (0 = Кг (0
обеспечивает в силу управляемости пары {Л, В} желае-
мые динамические свойства замкнутой система. Возвра-
щаясь к исходным координатам, получим управление
и (0 в виде
й (0 =- Ух (0 + [К — £]У+ЯА,
где У+ = [УУ'Г^У'. Это управление содержит измеряе-
мую помеху А. Проведенную схему вычислений сумми-
руем в виде следующего результата, доказательство кото-
рого оставляем читателю.
Теорема 2. Если в линейной стационарной систе-
ме (5) вектор возмущения А измеряется, то системе мож-
но придать произвольные динамические свойства с помощью
обратной связи вида
и (0 - Кх (0 + [К - £] [УУ'ИУ'А
в том и только в том случае, когда
1) пара {А, В) управляема,
2) ранг матрицы У = равен п 4- р, еде р —
число линейно независимых выходов системы. Q
334
МОДАЛЬНОЙ УПРАВЛЕНИЙ
[ГЛ. VI
Таким образом, условия существования требуемого
управления по возмущению при измеримых возмущениях
совпадают с условиями существования управления в виде
интегральной обратной связи при неизмеримых возмуще-
ниях.
Поскольку система с управлением по возмущению чув-
ствительна к ошибкам измерения и к вариациям парамет-
ров объекта, то на практике комбинируют управление по
возмущению (которое позволяет быстро реагировать па
значительные помехи) и управление в виде интегральной
обратной связи (которое обеспечивает астатизм системы
даже по отношению к малым неконтролируемым возмуще-
ниям и улучшает характеристики чувствительности си-
стемы по отношению к вариациям ее параметров).
Задачи. 1. Получите уравнение интегральной обратной свя-
зи в примере 1, приняв в качестве переменных состояния (х (0,
и (/)) и (х (0, X (0).
2. Рассмотрите объект
i (0 = — <хх (0 -j— и (0,
У (0 = х (0+ Да-
где Ах, Да — некоторые неизвестные постоянные. Сконструи-
руйте регулитор так, чтобы при t <х> л (0 _> 0 и у (0 -> 0. Какое
минимальное число динамических элементов должен содержать та-
кой регулятор?
3. Для объекта 2-го порядка f (г) 4* х (0 = u (0, У (0 =
= х (0 Л, где А — постоявная неизмеримая помеха, выберите
регулятор, который обеспечивает выполнение условий & (0 -> О,
у (0~> 0 при любых А. Каков минимальный порядок этого регуля-
тора?
4. Для задачи 3 рассмотрите возмущение вида А (0 = sin cof,
где о — некоторая постоянная.
5. Линейная стационарная система
с = [0 1
имеет помеху в канале измерения
у (0 = с'х (0 4- А (0.
Можно ли придать этой системе произвольные динамические свой-
ства с помощью соответствующим образом подобранного регуля-
тора, если неконтролируемое возмущение А (0 имеет вид А (0 —
= sin саг? Зависит ли результат решения задачи от частоты возму-
щения со?
6, Определите, каков минимальный порядок динамической
обратной связи, которая позволяет получить произвольное
§ 30] I УПРАВЛЕНИЕ РАСПРЕДЕЛЕННОЙ СИСТЕМОЙ 33 £
размещение полюсов линейной системы
“0 1 0 0 0" -0 0 0“
(j 0 1 0 0 1 0 0 Г1 0 0 0 0
А == 0 0 0 1 0 , в- 0 1 0 ’ с = 1 ° ° о
0 0 0 0 1 0 о 1
„1 0 о 0 0_ 0 о 0^
§ 30. Модальное управление распределенной системой
Рассмотрим примеры модального управления распре-
деленной системой для случаев, когда задача управления
распределенной системой сводится к задаче управления
конечномерным объектом.
Аппроксимация распределенной системы с помощью
конечного числа мод. Рассмотрим простейшее уравнение
теплопроводности
= 0<Z<4, t>0, <?(Z,0)= <?„(!) (1)
с граничными условиями
Т 1,-0 = °’ = 2(1.0]. (2)
Это уравнение описывает, например, температурное поле
в тонком стержне единичной длины и единичного сечения,
теплоизолированном с боковых поверхностей и с одного
торца 7 = 0. и (t) — температура нагревателя, располо-
женного у торца стержня I = 1. Тепловой поток при
I = 1 пропорционален с коэффициентом «р» разности
температур нагревателя и торцевой поверхности стержня.
Известно, что решение задачи (1), (2) можно представить
в виде [8]
Q 7) - cos (7),
где (() являются решениями уравнений
М*) = — PnXn(t) + п = 1, 2,..
- 2 sin u
Хп (0) = Хп, Ап = ----------;--:---------- ,
' ? Ир + ЯШ jl^COSp.^
(3)
336
модальное управление
[^л. VI
а числа jin -- корни характеристического уравнения
р, = 6 ctg р,. Формально систему уравнений (3) можно
записать в матричной форме
х(0 « 4х(/) +Ьа(0, х(0) = хо, (4)
где А — диагональная матрица бесконечной размерности:
А = diag [—. . ., —Цп, . . .], x' (Z) =
= (Z), (£), . . J, b' (Z) = Ipt pa, . . L
Часто с целью расчета практически приемлемых законов
управления рассматривают лишь первые несколько мод
системы, считая, что при больших п вклад членов
Ап cos (Z) незначителен [8, 9]. Это может быть оп-
равдано тем обстоятельством, что «переходная матрица»
бесконечномерной системы (4) имеет вид
Ф (Z, 0) = diag Е/Г1*1*, ..],
а числа оп согласно характеристическому уравнению
удовлетворяют неравенствам (?? — 1) л «л, и
следовательно, величина р« быстро возрастает при повы-
шении порядкового номера п. Сведение задачи об управ-
лении распределенной системы к конечномериой исполь-
зуется при решении задачи оптимального управления ме-
тодом моментов [8, 9, 43]. Если поступать формально,
считая, что распределенная система достаточно точно опи-
сывается своими первыми п модами, то задача об управ-
лении такой системы сводится к управлению следующей
конечномерной системой с одним входом:
x(Z) = Ax(Z) + Ы (Z), х(0) = Xq,
где А = diag [—р?. — b' = [у,?, pt • • •
si
- • ЦгЛ
Нетрудно проверить, что пара матриц {А, Ь} полно-
стью управляема и, следовательно, с помощью обратной
связи по состоянию можно обеспечить наличие у замкну-
той системы произвольного набора собственных чисел.
Заметим, что набор собственных чисел {рг-} определен,
если задать значение коэффициента р, определяемого по
геометрическим размерам, внутренним свойствам (коэф-
фициент теплопроводности) и условиям внешнего теплооб-
§ 30]
УПРАВЛЕНИЕ РАСПРЕДЕЛЕННОЙ СИСТЕМОЙ
337
мена (коэффициент теплоотдачи). Пусть распределенная
система имеет фиксированное значение 0 и соответствую-
щий набор {цг}. Зададим некоторый желаемый параметр
Р* р и вычислим по уравнению ц = Ь* ctg ц харак-
теристические числа {[Xf*}- Так как система управляема,
то можно выбрать вектор обратной связи к' так, чтобы
замкнутая система х (Z) = [А — bk']x(0 имела бы набор
собственных чисел (рц }. Вообще говоря, это в некотором
смысле равносильно изменению внутренних свойств рас-
пределенной системы с помощью активной линейной об-
ратной связи по состоянию. Так, если коэффициенту
теплопроводности стержняХ соответствует набор собствен-
ных чисел {[X/}, а значению этого коэффициента А* —
набор то выбором обратной связи можно обеспе-
чить системе набор чисел {ц/*}. При этом предполагается,
что все переменные состояния системы доступны для из-
мерения и, кроме того, что поведение распределенной си-
стемы точно описывается с помощью ее первых п мод.
Снять эти допущения — сложная задача. Здесь заметим,
что если измеряется температура в какой-либо точке
стержня 0 Zx 1 и если система представлена с помо-
щью первых п мод, то уравнение выхода имеет вид
п
V (0 = Q (А 0 = 3 Аг COS [XnZ^ft (0 = с'х (£),
1=1
где с' = LA cos [Х]/15 А2 cos [x2Z1t . . ., Ап cos [хп/х], и не-
трудно проверить, что пара {Л, с'} полностью наблюдае-
ма для всех Zj се [0, 1]. Следовательно, можно построить
идентификатор этой системы и произвольными динамиче-
скими свойствами. По поводу точности аппроксимации рас-
пределенных систем конечным числом мод имеется об-
ширная литература. Библиографию можно найти в [8, 9].
Стабилизация неустойчивой распределенной системы.
В некоторых случаях неустойчивость линейной распреде-
ленной системы связана лишь с конечным числом ее не-
стабильных мод. Однако обычно для стабилизации таких
систем требуется знание состояния системы во времени.
Задача получения приемлемой оценки состояния распре-
деленной системы необычайно трудна. В приводимом ниже
простом примере [871 для стабилизации системы требуется
только информация о ее неустойчивых модах,
338
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
Снова рассмотрим одномерное уравнение диффузии
^L = ^JL+»e(M)+«(M), (5)
определенное при t '^> О, I [0, 11. Здесь Q (t, Г) — со-
стояние системы (например, распределение температуры
в стержне), а и (t, I) — управление. Начальные и гранич-
ные условия заданы соотношениями
<2 (0, z) = <?0!(Z), Q (t, 0) = q (t, i) = о,
О < Z<1, f>0, (6)
где Qa (Z) — непрерывная функция времени. Предполагая,
что и (t, Г) непрерывно дифференцируемая функция
обоих аргументов и и (Z, 0) = и (Z, 1) = 0, запишем ре-
шение (5), (6) в виде
Q(t, 0=2 >?„(/) =/2 sin п„/.
Обозначим х' (Z) — (Z), х2 (Z), . . Л. Тогда х (t) удов-
летворяет бесконечномерной системе обыкновенных диф-
ференциальных уравнений
х (Z) = 4х (Z) 4- Ь (Z), (7)
где
^’(0) =
QoW= 2«„r(0)Tn(Z),
п=1
u(t,i) = 2мох,(о, ь'(о = [М)Аад,---ь
П=1
а Л — диагональная матрица бесконечной размерности
с диагональными элементами = —п2лг а, п =
==1,2, .... Пусть (т + 1)2л2 > а L> т2^2 для неко-
торого положительного целого т, так что первые т мод
системы неустойчивы.
Мы хотим построить обратную связь такую, чтобы все
модырзамкнутой системы были устойчивы. Очевидно, что
если Q (£, Z) можно точно измерить в любой момент вре-
мени, то любая обратная связь вида и (Z, Z) = kQ (Z, Z),
5 зо]
УПРАВЛЕНИЕ РАСПРЕДЕЛЕННОЙ СИСТЕМОЙ
339
где к —а, обеспечит стабилизацию системы. Рассмот-
рим конечномерную стабилизирующую обратную связь,
которую можно реализовать. Пусть управляющее воздей-
ствие задано в виде
т
u(t, I) = 2 6i (0М0»
где Ст; (Z) — некоторые непрерывные функции, число т
равно числу нестабильных мод объекта» а вектор u' (0 =
— [&! (t), и2 (t), . . ит (£)] представляет собой искомое
конечномерное управление. В практических ситуациях
(0 ui (0 может описывать управление, которое локали-
зовано на подмножествах 12 отрезка [0, 1], а (Z) является
подходящей непрерывной функцией, заданной на 12. Оче-
видно, вектор b (t) в уравнении (7) может быть представлен
в виде
Ь (£) = Ви (t),
где
<О1, Y1> <Оа, Т1> . . . <от, ’Гр "
В = <О1,ЧР2> <02,^0 .,. <om, *г2>
и
1
<П1,Т71> = J <з{(7) Tn (Z)dZ.
о
Пусть Вт обозначает (т X т)-матрицу, образованную
первыми т строками матрицы В. Если о(- (Z) выбраны так,
что матрица Вт имеет обратную, то простая стабилизи-
рующая обратная связь для уравнения (3) имеет вид
и (7) = — 1ГпКРтх (t), (8)
где К — диагональная матрица с элементами к^ =
— а — /2л2, / = 1, 2, . . ., т, а матрица Рт является
матрицей оператора проектирования, определенного соот-
ношением Рта = [а1: а2, ...» «тГ для всех а' =
= [а1? а2, . . .1. Оператор Рт, таким образом, проек-
тирует бесконечномерное пространство последовательно-
стей вида [лх, а2, . . обычно обозначаемое через Z2,
340
Модальное уйравЛение
[ГЛ. VI
в конечномерное пространство Rm. Заметим, что в законе
управления (8) участвуют только амплитуды неустойчи-
вых мод. Предполагается, что все неустойчивые моды
идентифицируемы, или точно измеряемы.
Уравнение системы, охваченной обратной связью, имеет
вид
ДД = [A-BB'jKPm]*(t). (9)
Поскольку матрица
[А - ВВ^КРт] =
(здесь 0т«, —пулевая матрица, ?— матрица с возможно
ненулевыми элементами размеров со X иг) является тре-
угольной, то ее собственные значения i '^> т, совпа-
дают со стабильными модами разомкнутой системы, в то
время как все нестабильные моды отрицательны за счет
выбора матрицы К. Таким образом, (t) —> 0 при
t 0 при любом 2 = 1,2, ...
Геометрическая интерпретация данного примера со-
стоят в следующем. Пространство состояний распределен-
ной системы, совпадающее с пространством 12, мы разла-
гаем в прямую сумму конечномерного подпространства
Хт, которое содержит только нестабильные моды объекта,
и бесконечномерного подпространства Х£, содержащего
устойчивые моды объекта. Так как подсистема, определен-
ная в Хт, управляема, идентифицируема и имеет конеч-
ную размерность, то можно построить стабилизирующую
обратную связь (линейное отображение на X с конечно-
мерным рангом) такую, что подпространство Xх является
инвариантным при отображении А + Ви и собственные
значения или частоты устойчивых мод остаются при этом
преобразовании без изменений.
Й.Д-ЕДЙ1Ц4Я СИСТЕМА
341
S 31]
Заметим, что данная процедура пригоДЬа для измене-
ния первых г собственных значений устойчивой системы
(а - 0), если предположить, что информация о соответст-
вующих модах системы имеется.
Задачи. 1. Для уравнения (5), (6), где а = 0, и (Z, t) =
= Ъ (J) и (t), а
( , 3
b при < I < — ,
I 0 в противном случае,
выберите управление и (/) в виде обратной связи, считая, что необ-
ходимые данные о состоянии системы имеются, такое, чтобы первые
два собственных значения системы совпали с числами =
= — 8:г2, = — 12л2, а остальные собственные значения оста-
лись неизменными.
2. Для системы (1), (2) при [3=1, ограничившись двумя пер-
выми модами ряда решения, и считая, что измеряется температура
в точке I = 0, сконструируйте регулятор, который придавал бы
системе собственные числа, определяемые как первые два корня
уравнения р = 2 ctg р. В качеств идентификатора состояния ис-
пользуйте фильтр Калмана с собственными числами лх — а2 ~ — 9.
§ 31. Следнщая система
Рассмотрим, основываясь на модальных соображениях,
синтез следящих систем, обеспечивающих точное слежение
за командными сигналами сложной формы при наличии
неизвестных и неизмеримых возмущений. Основная идея
решения этой задачи аналогична той, которая была ис-
пользована для обоснования введения интегральной об-
ратной связи в § 29. Мы рассмотрим неизвестный сигнал
помехи и командный сигнал как выходы некоторых иден-
тифицируемых динамических систем, структура которых
известна, а начальное состояние произвольно. Далее мы
построим следящую систему для «идеального» случая
в предположении, что состояния фиктивных динамических
систем, выходы которых совпадают с помехой и командным
сигналом, нами точно измеряются в любой момент време-
ни. Затем построим идентификаторы состояний этих
динамических систем и, заменяя в формулах для идеаль-
ного случая состояние его оценкой, получаемой на выходе
идентификаторов, придем к физически реализуемой кон-
струкции следящей системы. Из-за отсутствия места бу-
дем опускать промежуточные выкладки при решении
342
МОДАЛЬНОЕ УПРАВЛЕНИЕ
£ГЛ VI
возникающих в процессе конструирования алгебраичес-
ких задач.
В заключение будет дан подробный пример кон-
струирования следящей системы для объекта 2-го порядка.
Излагаемый здесь подход неоднократно уже упоминался
в литературе в связи с задачей конструирования следящих
систем (см., например, [83], [89]). Наше изложение близко
следует работе [63], в которой рассматривается задача для
общего нестационарного случая. Мы ограничимся рас-
смотрением стационарной системы.
Постановка задачи. Пусть управляемый и идентифи-
цируемый стационарный объект описан уравнением
х (?) = Дх(?) + Bu{t) + Fw(0,
у (г) = Сх(<),
(1)
где, как обычно, х (?) — n-вектор состояния, u (£) — rn-
вектор входных возмущений, у (?) — р-вектор выходов и
w (?) — r-вектор внешних возмущений, А, В, F, С — по-
стоянные матрицы размеров п X н, п X m, п X г, р X п
соответственно. Будем предполагать, что выходы объекта
линейно независимы, так что rank С = р. Задача управ-
ления объектом будет заключаться в том, чтобы выбрать
вход и (?) так, чтобы выход объекта у (?) по возможности
точно следовал за некоторым заданным р-мерным ко-
мандным сигналом ук (?), который заранее не известен,
но измеряется (появляется) в текущий момент времени ?.
Более того, требуется обеспечить удовлетворительное
слежение за командным сигналом при действии на объект
неизвестной внешней помехи w (?).
Типичным примером такой задачи является задача
обеспечения высокоточного слежения антенной радиоло-
катора за летящим объектом при воздействии на антенну
порывов ветра и при непредвиденных маневрах летящей
цели.
Начнем рассмотрение задачи с представления сигнала
помехи и командного сигнала с помощью «переменных
состояния». Здесь уместно напомнить, что аналогичные
представления были использованы нами при конструиро-
вании асимптотического дифференциатора в § 25, а так-
же в § 29.
§ 31]
СЛЕДЯЩАЯ СИСТЕМА
343
Пусть командный сигнал ук (7) является выходом не-
которой фиктивной динамической системы
г (£) = У?г (Z), | (2)
yK(i) = Gr(O, J
причем ук (i) можно непосредственно измерить. Матри-
цы R, G известны, их размерность v X v, р X v соответст-
венно. v-вектор г (i) представляет собой «состояние»
командного процесса. Вектор г (г) может скачкообразно
изменяться в произвольные моменты времени за счет изме-
нения начальных условий. Внешнее возмущение w (£)
появляется на выходе фиктивной динамической системы
2 (О ~ 1 ,3)
w (О = Hz (г), J
где w (г) недоступно для непосредственного измерения,
матрицы D и Н размеров р х р и г X р заданы, р-вектор
z (i) является «состоянием» процесса помехи, начальные
условия в (3) неизвестны и могут скачкообразно изме-
няться в произвольные моменты времени.
Заметим, что функции ук (г) и w ($) могут быть разрыв-
ны из-за возможного скачкообразного изменения началь-
ных условий. С помощью динамических процессов (2),
(3) можно моделировать широкий класс реальных помех
и командных сигналов. Например, это могут быть произ-
вольные линейные комбинации конечных импульсов,
полиномиальных функций времени, затухающих и на-
растающих синусоидальных сигналов, нарастающих и
затухающих экспонент и т. д., причем коэффициенты
в этих линейных комбинациях могут меняться скачками
в произвольные моменты времени.
Необходимо выбрать управление u (t) так, чтобы вы-
ход объекта у (г) точно и безынерционно следил за каж-
дым командным сигналом ук (г), который может появить-
ся на выходе системы (2) при наличии любой неизмеряе-
мой помехи w (£), генерируемой системой (3). Кроме того,
управление u (г) должно быть физически реализуемо в ви-
де обратной связи по выходу, т. е. u (I) = и (у (Z), ук (/)).
Решение этой задачи будет основано на чисто алгебраи-
ческих соображениях. Начнем с простейшего «идеального»
случая. Будем считать, что состояния систем (1), (2), (3)
344
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
доступны для прямого измерения. Тогда вся информация,
необходимая для предсказания поведения объекта в буду-
щем, имеется, и с помощью линейной стационарной обрат-
ной связи по состоянию мы можем обеспечить произволь-
но хорошую динамику слежения за командным сигналом.
Пусть управление, решающее задачу в этом идеальном
случае, состоит из двух слагаемых
и (Г) = ип (£) -р ик (£)» (4.)
где un (t) обеспечивает компенсацию влияния помехи
w (Z) на объект, а пк (/) обеспечивает слежение за команд-
ным сигналом ук (Z) в предположении, что помеха отсутст-
вует. Начнем с вычисления управления un (I).
Точная компенсация помехи. Подставим управление
(4) в уравнения объекта (1) и, воспользовавшись форму-
лой Коши и подставляя w (2) = Hz (t), выпишем явное
выражение для выхода у (7):
t
у (Z; х0, £0, ж (£)) = СеЛ(МоА() + С J ел(^)5пк (т) dx +
t
4- С j еАУ~А [Иид (r) + FH-ъ (r)] dx. (5)
to
Чтобы выход у (I) не зависел от помехи w (г), необходимо
и достаточно, чтобы последний член справа был тождест-
венным нулем. Сформулируем этот результат.
Теорема 1. Действие возмущения w(i) на выход
объекта (1) у (Z) будет полностью исключено тогда и только
тогда, когда найдется постоянная матрица А такая, что
CeA{t--c) \н\ 4 FH1 — о при всех т, t оо. (6)
Соответствующее управление имеет вид иП (i) = Az (t). 0
Условие (6), очевидно, эквивалентно следующему (см.
§ 20):
С [В, АВ, А2В, . . ., А11-1#] = 0, В = В А + FH, (7)
которое в свою очередь влечет за собой систему равенств
СА‘ [В А + FH] = 0 при s = 0, 1, 2, . . ., п - 1.
Если ввести в рассмотрение матрицу
W = [С", А'С'. (А2)'С", . . ., (A^'C'J,
ЙЛЁДЯЩАЯ СИСТЕМА
345
$ 311
ранг которой равен п в силу идентифицируемости пары
матриц {Л, С), то условие (7) можно записать в виде
rank [VT, В, FH\ = rank [W', 5].
Если это условие выполнено, то соответствующая матри-
ца А может быть вычислена. Наиболее общая формула для
А имеет вид [64]
д = -(W'B)+W'FH +
где через (-)+ обозначена псевдообратная матрица, —
произвольная параметрическая матрица, Е — единичная
матрица.
Точная компенсация помехи с помощью управления
«п (0 = Az (I) возможна даже в том случае, если помеха —
разрывная функция, когда точно известно «состояние»
процесса помехи z (t). Это условие соответствует случаю
точного измерения сигнала помехи.
Идеальное управление ип (0 является, конечно, физи-
чески не реализуемым из-за отсутствия данных о состоя-
нии z (£). Далее мы построим оценку для этого состояния
с помощью идентификатора, а пока продолжим изучение
«идеального» случая.
Слежение за командным сигналом. Предположим, что
выбрано идеальное управление un (£) = Az (£). Тогда
уравнения движения (1) примут вид
х («) =• Ах (0 + Ви„ (I) + Въ (0, | g.
y(i) = Cx(f), J
где В = BE 4- FH. Заметим, что в соответствии с вы-
бором ип (г) член Bz (i) не влияет на выход системы. Те-
перь задача состоит в том, чтобы выбрать управление
ик (г) так, чтобы обеспечить точное слежение за каждым
сигналом ук (г), который появляется на выходе системы
(2). Установим сначала необходимое условие точного
слежения.
Теорема 2. Для теоретически точного слежения
выхода системы (8) у (t) за командным сигналом ук (г),
генерируемым системой (2), необходимо, чтобы существо-
вала матрица 0 (возможно, не единственная) такая,
чтобы
G = Св.
(9)
346
МодаДьйоё Управление
[гл. vi
Доказательство. Рассмотрим ошибку слеже-
ния еу (i) = ук (t) — у (г). Используя (2) и (8), получим
Еу (t) = Gr (г) — Сх (г).
Заметим теперь, что v-вектор г (Z) («состояние» командно-
го процесса), вообще говоря, совершенно произволен.
Отсюда немедленно следует, что для того, чтобы 8У(£) = О
для некоторого х (£), необходимо и достаточно, чтобы су-
ществовала матрица О такая, что G = CQ. Однако необ-
ходимо еще доказать, можно ли соответствующее х (г)
реализовать с помощью допустимого управления. Отсю-
да следует отсутствие достаточности в условии теоремы. 0
Если командный сигнал появляется на выходе систе-
мы (2), начальные условия которой могут меняться скач-
кообразно, то ясно, что точное слежение за таким команд-
ным сигналом с помощью стационарной обратной связи,
вообще говоря, неосуществимо. Положение здесь анало-
гично тому, какое мы имеем при решении задачи регули-
рования с помощью стационарной обратной связи. Одна-
ко по-прежнему, хотя мы и не можем обеспечить точное
слежение, мы можем выбрать любую динамику стремле-
ния к нулю ошибки слежения.
Предположим теперь, что матрица О выбрана в соот-
ветствии с равенством (9), и запишем ошибку слежения
в виде
By (О = С [6г (0 — х(«)Ь
Удобно ввести новую переменную £ (i), определенную
равенством
g(i) = 0r(i)-x(Z). (Ю)
Тогда ошибка слежения может быть представлена в виде
8У (Z) = Cg (I). Теперь задача точного слежения за команд-
ным сигналом может быть представлена как задача выбора
управления ик (£), которое обеспечивало бы быстрое стрем-
ление к нулю переменных £ (£) из любого начального со-
стояния ? (^). Ясно, что, решив эту задачу, мы обеспе-
чим быстрое стремление к нулю ошибки слежения еу (Z).
Дифференцируя (10) по времени и используя уравне-
ния состояния для г (£) (2) и для х (£) (8), получим линей-
ное дифференциальное уравнение относительно вектора
СЛЕДЯЩАЯ СИСТЕМА
347
§ 31]
; («)•
; (0 = (Z) - 5Ик (0 + (3/2 - А0) г (£) - £z («). (11)
Это уравнение по структуре подобно уравнению объекта
(1). Последние два члена в (11) играют роль внешних воз-
мущений. Это наводит на мысль об использовании «иде-
ального» управления, обеспечивающего компенсацию по-
мехи, для построения управления пк (£).
Предположим, как и ранее, что состояния г (£), х (£)
можно точно измерить и что идеальное управление uK (7)
можно выбрать в виде стационарной обратной связи по
состоянию
нк (0 = (Э + К2г (/), (12)
где Кх и K.L — некоторые постоянные матрицы т X п и
т X v, которые предстоит выбрать на основе соображений
о динамике идеальной следящей системы. Подставляя
(12) в (11), получим
g (i) - U + (t) - Vr (t) - Bz (f), (13)
где матрица V определена равенством
V = -ЬВ + Ав + В + #2]. (14)
Заметим, что в формуле (13) член —Bz (I) не влияет на
выход системы у (7) согласно выбору управления ип (7)>
однако он может влиять на «состояние» £ (t). Задача
слежения за сигналом ук (i) свелась теперь к выбору мат-
риц jK\ и в (13) так, чтобы (t) >0 из любого началь-
ного состояния £ (£). Так как Bz (£) на выход системы не
влияет, то, используя теорему 1, потребуем, чтобы матри-
ца V удовлетворяла тому же набору условий, что и мат-
рица В = В\ 4- FH в условиях этой теоремы. Объеди-
няя эти результаты, получим следующее утверждение.
Теорема 3. Произвольное решение £ (£) системы
(13) будет асимптотически стремиться к нулю независи-
мо от г (Z) и z (I) тогда и только тогда, когда выполнены
два условия:
а) матрица К-,. выбрана так, чтобы матрица [Л -f-
-f- BKt] была бы устойчивой',
348
МОДАЛЬНОЕ УПРАВЛЕНИЕ
[ГЛ. VI
б) выбор матрицы К2 обеспечивает выполнение равен-
ства
СеА^ [ел - 40 - ВК& - В/С] = 0 (15)
при всех т, I. 0
Заметим, что для того чтобы выполнялось условие б)
теоремы 3, необходимо и достаточно, чтобы существовала
матрица К2 такая, что
ВК2 = V + 07? - 40 - BKYe (16)
для некоторой матрицы V, которая удовлетворяет условию
у — q Поэтому вычисление матрицы К2 можно
проводить в два этапа. Сначала выбрать матрицу V, удов-
летворяющую условию (15), а затем вычислить /С2 по
формуле (16). Заметим, что условие (15) выполнено тогда
и только тогда, когда одновременно выполнены два ус-
ловия:
rank [В, V + 07? — 40] = rank [5], (17)
СеА^ У = 0, < т < t, t0 < t < оо. (18)
С точки зрения практической реализации вычислений по-
лезно заметить, что условия (17) и (18) не зависят от выбо-
ра матрицы Кг.
После выбора матриц Кг и К2 идеальное управление
имеет вид
u (t) = Az (Z) -J- А\х (t) + K2r (£).
Динамические свойства этой идеальной системы будут
определяться выбором матриц Klf ТГ2, Л.
Физически реализуемая следящая система. Обратим-
ся к задаче оценки состояний систем (1), (2), (3). Будем
считать, что реально доступны для измерения лишь две
величины: выход объекта у (t) и командный сигнал
у к (t)- Как и ранее, при конструировании регулятора ну-
левого состояния (§ 27), покажем, что замена в идеальном
случае векторов состояний х (i), z (i), г (г) приемлемыми
оценками х (7), z (i), f (z), получаемыми на выходе иден-
тификаторов, использующих информацию только об
измеримых величинах у (i), ук (£), позволяет сконструиро-
вать физически реализуемую следящую систему, динами-
ческие свойства которой можно выбирать по своему ус-
мотрению. Для простоты будем использовать для оценки
§ 311
СЛЕДЯЩАЯ СИСТЕМА
349
состояния n-мерные идентификаторы (фильтры Калмана).
Аналогичные результаты могут быть получены и при ис-
пользовании идентификаторов Люенбергера.
Поскольку конструирование идентификаторов и-мер-
ного порядка было подробно изучено в гл, V, мы здесь
сразу выпишем уравнения идентификатора, на выходе
которого будет оценка состояния объекта х (t) и оценка
«состояния» помехи z (i):
(19)
где матрицы А, 5, С, D, F, Н определены выше, у(£) и
u (i) — соответственно действительный выход объекта и
действительный вход в (1). Предположим, что матрицы
Lr и выбраны таким образом, что разность между зна-
чением [х (i), z (Z)] и оценкой [х (Z), z (г)] асимптотически
стремится к нулю:
[£«(;). ег(г)]'- [х(г), z(i)]'— [х(г), z(z)]'->0 при г-*оо-
Уравнения для ошибки оценки состояния имеют вид
(0_
A^-LiC \FH ея(«)
_ j D J [ег (t) J
(20)
В силу того, что пары матриц {А. С} и {£>, И} являются
идентифицируемыми, можно выбрать соответствующие
матрицы Lr и £2 так, чтобы обеспечить желаемую динами-
ку стремления ошибки идентификации к нулю.
Построение физически реализуемого идентификатора
«состояния» г (г) по измерениям ук (t) можно осуществить
по следующим формулам:
? (0 = [Я + NG] ;(«) - 7VyK (0, (21)
где Я и G заданы в (2), a N — матрица, которая обеспечи-
вает желаемый темп стремления ошибки к нулю и выби-
рается конструктором. Ошибка оценки er (i) = г (2) —
— f (£) удовлетворяет уравнению
8r (f) = [fl + (г). (22)
350 МОДАЛЬНОЕ УПРАВЛЕНИЕ [ГЛ, VI
Поскольку пара {/?, G} идентифицируема, то выбор мат-
рицы N можно всегда осуществить, если задаться дина-
микой стремления 8r (i) —> 0 при » ос.
Теперь мы готовы к тому, чтобы выписать уравнения
физически реализуемой следящей системы. Для этого до-
статочно в формулах uir (i) = Az (t), uK (Z) = A\x (f) 4-
+ K2r (Z) заменить {z (£), x (£), r (£)} их оценками
{z (£), x (t), i (£)} и получить физически реализуемое
управление вида
и(£) = пи(£) + ии (i) = Az(i) + #ix(£) + A2r (Z). (23)
Чтобы доказать, что это управление на самом деле позво-
ляет отслеживать любой командный сигнал, появляющей-
ся на выходе (2), в присутствии любого внешнего возму-
щения, генерируемого системой (3), мы рассмотрим дина-
мическое поведение действительной ошибки слежения
8у (I) = Ук (0 — У (t) при управлении (23). Для этой
цели подставим управление (23) в уравнение (1) и, исполь-
зуя обозначения:
х (Z) = х (f) — 8х (£), z (0 = z (0 — ег (£), г (£) = г (i) — (f)>
получим
х (г) = [А 4 ВКу\ х (г) 4- [5А 4- FH] z (г) 4-
4- ВК& (г) 4- в[Аех (г) — (г) — К2гг (г)]. (24)
Уравнение (24) описывает движение реального объекта
при действии возмущения w (i) и при управлении в виде
обратной связи (23).
Рассмотрим теперь поведение переменной состояния
£ (£), заданной равенством (10).
Уравнение для £ (г) с использованием (24) имеет вид
£ (i) = [А 4- £ (*) - 7г (i) - Bz (t) 4-
4- В [Xx8x (0 — ’X28r (г) — Aez (i)]. (25)
Если матрицы A, К2, N в идентификаторах выбраны долж-
ным образом, то ошибки 8Х (Z), ez (i)> sr (i) будут стре-
миться к нулю, и поведение переменной £ (г) в промежут-
ках между скачками в начальных условиях систем (2) и
(3) будет определено уравнением
£ (г) = [А 4- BKJZ (0 - Fr (0 - 5z(0,
§ 31]
СЛЕДЯЩАЯ СИСТЕМА
351
которое в точности совпадает с уравнением (13). Поэтому,
если выполнены условия теоремы 3, то ошибка слежения
будет приближаться к нулю асимптотически, и значит,
система будет обеспечивать высокоточное слежение за
командным сигналом при любой помехе. Структура полу-
чаемой следящей системы представлена на рис. 31.1.
Основными элементами этой системы являются идентифи-
катор командного сигнала и идентификатор помехи и
состояния объекта.
Пример. Рассмотрим подробно простой пример
конструирования линейной системы. Пусть дан объект
2-го порядка
[моН-9 л:мич°Н)’ (2.
где у (2), и (2). w (2) — скаляры. Допустим далее, что
помеха w (2) исследована экспериментально и что она
состоит из временных интервалов, на которых помеха рав-
на неизвестной постоянной, и интервалов, на которых она
равна линейной функции времени с неизвестным углом
наклона. Общая формула такой помехи имеет вид
ш (2) = ат + а22,
(27)
где а2 — неизвестные постоянные, которые могут
скачком меняться совершенно произвольным образом.
Ранее мы видели (см., например, § 10), что сигнал и? (2)
такого вида появляется на выходе динамической системы,
состоящей из двух интеграторов. Поэтому в качестве фик-
тивной динамической системы, генерирующей сигнал по-
мехи, примем уравнение]
pi(*)] _ ГО 1Ц*«1(01 г) _ [° и
~~ Lo oj z=i (оJ ’ Lo Oj ’
№(/) = [! ff = [l 0].
Lz2 JJ
Пусть, далее, командный сигнал имеет вид
г/и (2) (29)
где Ти ?2 — неизвестные постоянные, которые могут ме-
няться скачкообразно в произвольные моменты времени.
Рис* 31.1
модальное управление [гл. VI
СЛЕДЯЩАЯ СИСТЕМА
353
§ 311
Таким образом, сигнал помехи w (t) может, вообще
говоря, в точности совпадать с командным сигналом ук (?).
Будем считать, что фиктивная динамическая система, гене-
рирующая сигнал (29), совпадает с системой (28). так что
R = D, a G - Н.
Задача состоит в конструировании управляющего
устройства в виде обратной связи такого, чтобы выход
объекта (26) точно отслеживал любой командный сигнал
ук (?) вида (29), Кроме того, система должна удовлетво-
рительно работать при любой помехе ге (?) вида (27).
Начнем с выбора матрицы А, удовлетворяющей усло-
виям теоремы 1. Необходимо проверить условие (7),
которое имеет вид
[1 01 к? АВ1 = 0, (30)
где
М-9 М ММ1> °’
и А — искомая матрица. Нетрудно видеть, что условию
(30) можно удовлетворить, если, например, выбрать
А — — [1 0]. При этом выборе имеем В = 0, и управле-
ние Пп(0» обеспечивающее инвариантность выхода по
отношению к помехе, имеет вид
mo=-ii =—г»(о.
где (?), (?) переменные «состояния» помехи. Сле-
дующий шаг заключается в выборе матрицы 0, удовлет-
воряющей условию теоремы 2. Для нашего примера урав-
нение для © имеет вид
[1 0] - [1 О]0.
Ясно, что выбор © -- 1 является удовлетворительным.
Теперь необходимо выбрать матрицу Кл так, чтобы пере-
менная £ (?) -> 0, где £ (?) удовлетворяет уравнению
[tV-П Г 0 1 1ГИ01
Необходимо выбрать fcu, fc12 так, чтобы все решения этой
системы стремились к нулю. Например, можно выбрать
величины А’п и так, чтобы оба собственных значения
12 Ю. И Андреев
354
МОДАЛЬНОЕ УПРАВЛЕНИЕ
ГГЛ. VI
матрицы системы были бы отрицательны и достаточно ве-
лики по модулю. По заданным значениям характеристи-
ческих чисел = %3 — —10 находим: кп =-- —91,
/г12 = —19. Чтобы выбрать матрицу К2, удовлетворяю-
щую второй части теоремы 3, необходимо сначала подоб-
рать матрицу V, которая удовлетворяла бы условию (17)
'-В a-U J1WIT
Это равенство можно удовлетворить выбором V = 0.
Нетрудно видеть, что в этом случае выполнено и равенство
(18). Теперь матрицу К.> можно непосредственно вычислить,
используя уравнение (16). Эта матрица определена
однозначно, если выбраны матрицы V. Обозначим
А?2 = 1^21 тогда вычисление по формуле (16) дает
/г21 = 100, к.1г — 20. Теперь можно выписать управление
«к (2), отвечающее за точное слежение за командным сиг-
налом:
ий(0 = Xix(t) + A2T(Z) =
---- — 91ii (0 — 19^2 («) + lOOfi (t) + 20r2 (2). (31) j
Займемся теперь выбором динамики идентификаторов со-
стояния. Сначала сконструируем идентификатор для оцен-
ки состояний х (2), 1 ((), Согласно (20) уравнения для оши-
foi
/12 — 9
foi
/22
°Т
о
1 0
— 1 h
' ’ о i о 1
oio о
МО
Ч (0
еа (0
мо
е(0 =
«(О-
(32)
Необходимо выбрать коэффициенты Zn, Z12, Z21, Z32 так,
чтобы е (/) -> 0 с желаемой динамикой. Это означает, что
собственные числа матрицы должны иметь отрицательные
§ 31]
СЛЕДЯЩАЯ СИСТЕМА
355
вещественные части. Вычисление характеристического
многочлена матрицы в (32) дает
л4|- (1 - ZU)V + (9 - Z12 - 1 -Zn)^ - Z21X - Z22 = 0.
Назначая корни этого многочлена, можно сразу выбрать
соответствующие этим корням коэффициенты Zn, Zl2, Z21,
Z22. Выпишем общий вид уравнений идентификатора для
состояния [х ((), z (?)]:
(0 4-
(33)
Для завершения конструирования осталось выбрать иден-
тификатор для командного сигнала. Пусть матрица в урав-
нении (22) имеет вид
Гт 11
Lm о] *
Ее характеристический полином V — — п2 = 0. Если
оба корня равны некоторому отрицательному числу ht
то имеем щ — 2h, щ = —h2.
Уравнение идентификатора командного сигнала имеет
ВИД
Г1(0
2h 1
n (?)
2h
~h\
(34)
У* (0*
Это завершает выбор управляющего устройства для дай-
ной следящей системы. Осталось выписать уравнение для
физически реализуемого управляющего сигнала
и (I) = — z-l (?) — 91^1 (?) — 1 9z2 (?) Ц- 100?! (t) + 20r2 (?),
12*
356
MOJWLbHOE УПРАВЛЕНИЕ
Ira. \
Pue. 31.
§ 31]
СЛЕДЯЩАЯ СИСТЕМА
357
где оценки (t), (2) получим на выходе иденти-
фикатора (33), а оценки Tift), г2 (0 — на выходе иденти-
фикатора (34).
Блок-схема всей следящей системы представлена на
рис. 31,2. Эта следящая система успешно решает задачу
даже в том случае, когда командный сигнал в точности
совпадает с сигналом помехи!
Задача. Сконструируйте следящую систему для полностью уп-
равляемого и
матрицами
Г~3
л = о
_ О
полностью идентифицируемого
объекта, заданного
Командный сигнал:
Сигнал помехи:
1"
1
— 1
”0
1
-0
"1 0'
0 1
.1 1
11
о .
0_
1 i 01
.0 1 11’
ра 4- at -j- bl
YkW = р2+ ct + dj
1
— 2
0
В =
F =
Параметры a, b, c, d — произвольные постоянные, скачко-
образно изменяющиеся во времени.
ГЛАВА VII
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
Решая задачу конструирования регулятора, мы при-
нимали во внимание лишь требование устойчивости замк-
нутой системы регулирования. Поэтому параметры регу-
лятора были подчинены некоторым неравенствам, обеспе-
чивающим расположение всех полюсов замкнутой системы
в плоскости Res С 0. Если потребовать, чтобы переход-
ный процесс в системе был паилучшим в каком-то строго
определенном смысле, то параметры регулятора можно
выбрать однозначно из условия минимума заданного кри-
терия качества.
Задачей управления с квадратичным критерием каче-
ства или задачей наименьших квадратов будем называть
задачу, для которой заданы:
1. Квадратичный критерий качества
ц
J = {и' (г) R (г) и (г) + к' (/) L (t) х (г)} dt 4- х' Qx (гд.
io
2. Уравнение движения
х(/) А(г)х(г) + 5(t)u(?),
у (0 =* С (t) х (f), х (?„) = х0.
3. Множество, которому должно принадлежать состоя-
ние x(£i), и требуется найти управляющую функцию
u(f), определенную на интервале <3 R» которая
удовлетворяет условиям 2, 3 и минимизирует J. Без
потери общности матрицы Q, R и L считаем симмет-
ричными.
Сформулированная задача является вариационной и
легко может быть решена методом принципа максимума
Понтрягина или с помощью динамического программиро-
ГЛ VUJ
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
359
яания Веллмана. Однако привлекательно получить ее
решение элементарными методами, используя линейность
уравнений движения и элементарные свойства квадратич-
ных форм. Оказывается, это можно сделать, если взять
в качестве класса управляющих функций ft пространство
Cm [£0, $11 непрерывных функций. При решении задачи
мы получим явное выражение для потерь, возникающих
при замене оптимального управления на любое другое
управление. Мы также автоматически получаем условия,
при которых задача имеет решения.
Будем различать два вида решений сформулированной
задачи. Если мы определяем оптимальное управление
u (t) как функцию А, В, L, (?, х0, t и множества, которому
должно принадлежать х (it), но не как функцию текущего
состояния х (£), тогда мы говорим об управлении по ра-
зомкнутому контуру, или просто о разомкнутом управле-
нии, В том случае, когда управление выражается как
линейная функция оптимальной траектории х (Z), т. е.
u (£) — -К (/)х (£), то говорится, что управление пред-
ставлено в виде обратной связи (управление по замкну-
тому контуру).
Такое различие никогда не возникает в задачах кла&-
сического вариационного исчисления. В теории управляе-
мых систем такое различие крайне важно, поскольку
разомкнутые и замкнутые системы оптимального управ
ления по-разному ведут себя в присутствии помех и при-
меняются эти системы в совершенно различных случаях.
Задачи с квадратичным критерием качества относятся
к таким задачам управления, решение которых может
быть получено в замкнутой форме. Это обстоятельство
имеет основополагающее значение при конструировании
практических систем управления. Ограниченность форму-
лировки задачи, связанная с отсутствием ограничений на
управление и на траекторию движения, может быть снята
с помощью выбора весовых функций (матрицы Q, L, R) в
формулировке критерия качества.
Кроме того, получаемый при решений задачи с квад-
ратичным критерием оптимальный закон управления яв-
ляется линейным законом и, следовательно, легко реали-
зуется на практике.
При решении задач этой главы везде предполагает-
ся, что состояние системы либо ее выход доступны для
S60
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VI
измерения; если это условие не выполняется, то дополни-
тельно к оптимальному регулятору необходимо конструи-
ровать идентификаторы состояния для получения прием-
лемой оценки вектора состояния.
§ 32. Минимизация в евклидовых пространствах
Цель этого параграфа состоит в том, чтобы привести
алгебраические аналоги задач управления с квадратич-
ным критерием качества. Такими аналогами могут слу-
жить рассматриваемые ниже задачи минимизации в про-
странствах со скалярным произведением. Перед чтением
этого параграфа советуем читателю еще раз прочесть § 8.
Минимальная длина вектора, принадлежащего задан-
ной гиперплоскости. Рассмотрим уравнение гиперплоско-
сти в евклидовом пространстве <х, Ь)> = а, где Ь — неко-
торый фиксированный вектор, а а — вещественное число.
Поставим задачу о выборе вектора х, лежащего в данной
гиперплоскости и имеющего минимальную длину (норму)
|| х ||2 = <х, х> ~ min. Для решения этой задачи восполь-
зуемся неравенством Коши — Буняковского
<х, У>2<<х, х> (у, у>. (КБ)
Напомним, что равенство в (КБ) достигается тогда и толь-
ко тогда, когда векторы х, у линейно зависимы (см. тео-
рему 9 § 8). Решение задачи о векторе минимальной длины
заключается в том, чтобы выбрать х пропорциональным
вектору Ъ, а константу пропорциональности подобрать
из условия <х, Ь> = а. Следующая теорема формулирует
этот результат.
Теорема!. Пусть Ь =# 0 — фиксированный вектор
в абстрактном евклидовом пространстве и пусть а —
данный скаляр. Тогда значение х, которое минимизирует
<х, х> при ограничении <х, Ь> — а, равно
х0 = а <Ъ, Ь)-1Ъ.
Доказательство. Сначала заметим, что х0
лежит в данной гиперплоскости. Действительно,
<х0, Ь> = (а (Ь, Ь)”1 Ь, Ь> = а (Ь, Ъ>-1 (Ь, Ь> = а.
Покажем теперь, что любой другой вектор х из этой ги-
§ 32]
МИНИМИЗАЦИЯ В ЕВКЛИДОВЫХ ПРОСТРАНСТВАХ 361
перплоскости имеет большую норму. Если <^х, = а,
тогда
<х, Ъ> — <х0, Ъ> = 0, или <х — х0, Ъ> = 0.
Домножая это равенство на а <Ъ, ЬХ\ получим
<х, Xq> — <х0, Хо> = 0, (1)
вместе с тем по определению скалярного произведения
имеет место неравенство
О < <х0 — х, х0 — х) = <х0, х0> — 2 <х0, х> + <х, х>.
Используя равенство (1), получим к) — <х0, х0^ 0,
т. е. норма вектора х больше нормы выбранного векто-
ра х0. О
Эта задача важна в геометрии, так как ее решение дает
метод определения минимального расстояния между точ-
кой и плоскостью, не содержащей этой точки.
Минимальная норма решения линейной системы. Если
X — евклидово пространство со скалярным произведе-
нием a Y — евклидово пространство со скаляр-
ным произведением <•, то для линейного преобразо-
вания L: X-^-Y определено сопряженное преобразова-
ние £*: Y —> X. Напомним, что L* называется сопряжен-
ным к L, если для всех х Е X п у Е Y выполнено равен-
ство
<у, Г(х)>у= <Г(у), х>х.
Снова подчеркнем, что пространства X и Y мюгут быть
совершенно различными. Например, одно из них может
быть конечномерным, а другое — бесконечномерным.
Следующая теорема обобщает теорему 1 и является
весьма полезной для наших целей.
Теорема 2. Если L: X—Y — линейное преобра-
зование из евклидова пространства X в конечномерное евк-
лидово пространство Y и если произведение преобразова-
ний LL*'. Y —> Y является обратимым, то уравнение
L (х) = у0 имеет решение
Более того, если х, — какое-нибудь другое решение урав-
нения L (х) = у0, то справедливо неравенство
<Х1, Х1> > <Хо, Хо>.
362
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Доказательство. Пусть LL* (ух) == у0. Тогда
Ух существует, так как матрица LL* обратима. Тогда
х0 = L* (ух). Ясно, что вектор х0 удовлетворяет исходно-
му уравнению
Если хг — какое-либо другое решение, то L (xt) — L (х0) =
= 0, и поэтому
(Ух, L(Xo)> = <Г(У1), Хо> = <Х0, Хо>,
<Уъ Ь(Х1)> - <Г (Ух), Хх> = <х0, Хх>.
Отсюда немедленно имеем <х0) х0)> — <х0, xt\ Восполь-
зовавшись этим равенством, получим требуемое утверж-
дение
О < <Хх — х0, Хх — Хо> =
=* <*ь Х1> — 2 (Хх, х0> + <х0, х0> =
= (Хх, Х1> — <Хо, Хо> > о. О
В качестве мнемонического правила может быть по-
лезна коммутативная диаграмма, представленная на
рис. 32.1. Смысл диа-
граммы в том, что хотя
и нельзя прямо перейти
из Y в X, потому что лю-
бой у имеет много про-
образов в X, можно все-
таки выбрать единствен-
ный прообраз, восполь-
зовавшись условием ми-
нимума нормы. Этот вы-
бор реализуется, как
утверждает доказанная
теорема, на пути из Y
в X через преобразова-
ние LL*.
L*
Рассмотрим пример использования результата теоре-
мы 2. Пусть X — Rm, Y = Rn. Тогда каждому линейному
преобразованию L: X —> Y соответствует т X н-матри-
ца А этого преобразования, записанного относительно не-
которых базисов, выбранных в пространствах X н Y.
Пусть z — вектор пространства Y и Л матрица т X п
§ 32]
МИНИМИЗАЦИЯ В ЕВКЛИДОВЫХ ПРОСТРАНСТВАХ 363
ранга т. Рассмотрим задачу отыскания n-вектора х такого,
что Лх -- - z, а величина || х || 2 = <х, х> минимальна. Со-
пряженному преобразованию L* в этом случае соответст-
вует транспонированная матрица А'. Поскольку матрица
А имеет ранг т, то матрица АА' размеров т X т имеет
обратную и согласно теореме 2 вектор х0 — А' (ЛЛ')^г
является таким решением линейной системы Лх = z,
которое имеет минимальную норму среди всех других
решений этой системы.
Это решение линейной системы называют псеедореше-
нием, а матрицу Л+ = А' (ЛЛ')-1 — псевдообратной мат-
рицей для матрицы Л. Такое определение псевдообратной
матрицы годится для прямоугольных матриц, ранг кото-
рых совпадает с числом строк или с числом столбцов. Если
матрица Л — квадратная и неособенная, то псевдообрат-
ная матрица совпадает с обратной. Более подробно со
свойствами псевдообратвых матриц можно познакомиться
по книгам [10, 16}.
Минимизация квадратичной формы на решениях ли-
нейной системы. Рассмотрим небольшое обобщение полу-
ченного результата. Пусть задана матрица Q = А"'ЛТ.
Найдем решение уравнения Лх = z, минимизирующее
квадратичную форму х'фх. Если j N | Ф 0 (это условие
будет выполнено в том случае, если матрица Q положи-
тельно определена), то можно принять Ах = у и тем са-
мым свести задачу к предыдущей. Лучший х, обеспечиваю-
щий минимум квадратичной формы, вычисляется тогда по
формуле
хо — Q-1Af (AQ~lA f)-1z.
В добавление к этим результатам, которые описывают
минимизацию <х, х)> при линейных ограниченниях, имеет-
ся много интересных задач, где нужно минимизировать
сумму квадратичной и линейной форм. Мы воспользуемся
прямым методом для доказательства элементарного, но
полезного результата.
Теорема 3. Если симметрическая матрица Q --
= Q' положительно определена, то для всех х в Rn имеет
место неравенство
3 = х'фх + 2r'x -j- b > Ь — г'(2-1г,
причем равенство достигается тогда и только тогда,
когда х0 = - (Б1 г.
364
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Доказательство. Поскольку Q положительно
определена, существует Q1. Прибавляя г' Q"1 г к [3 и
вычитая этот же член, получим полный квадрат
З Цх • | (Hr)' Q (х 4- (?-1г) + b — г'(Mr.
Так как Q положительно определена, то первое слагаемое
справа имеет минимальное значение, равное нулю, и этот
минимум достигается при х = — (Г1 г. 0
В заключение заметим, что решение задачи, в которой
требуется найти минимум (х, х)> при ограничении
<х, (?х> = 1,
было получено в § 8 (теорема 9). Согласно этой теореме
максимальное значение <х, х> вычисляется по формуле
max<x, х) = [V(^)]-1,
а минимальное по формуле
min (х, х) = [V (<2)Г\
где V (0, V (0 — соответственно максимальное и ми-
нимальное собственные значения матрицы Q.
Задачи. 1. Пусть Q — симметрическая неотрицательно опре-
деленная матрица. Показать, что существует минимум для
11 — x'Qx -|- 2у'х + Ь,
ели вектор у лежит в области значений Q и нет минимума в против-
ном случае. Единственно ли минимальное значение х?
2. Рассмотрим задачу нагрева стальных заготовок, проходящих
через печь, разделенную иа пять зон. Предположим, что стоимость
нагрева в каждой зоне пропорциональна квадрату температуры зо-
ны Тг, и предположим, что температура изделия Г*, выходящего
пз зоны, связана с температурой заготовки (изделия) при входе в
зону То и с температурой зоны уравнением
1
Т — 2 (-^г—
Найдите значение температур зон Т\, Т2, ^з, минимизирую-
щих стоимость нагрева, если начальная температура заготовки 10°,
а конечная температура 1000°.
3. Пусть А — матрица п X т. Предположим, что для всех
матриц С размером m X m уравнение
Д 'Q + QA --- С
можно решить. Найдите решение, для которого tr Q'Q минимален.
4. Линейная система уравнений в теореме 2 имеет решение,
и задача заключается в выборе оптимального решения из множества
имеющихся. Задача, дополняющая названную, заключается в выбо-
§ 33] ЗАДАЧИ СО СВОБОДНЫМ КОНЕЧНЫМ СОСТОЯНИЕМ 365
ре вектора х такого, чтобы величина [|Дх—у]| была бы минимальна,
когда система Дх — у решений не имеет. Покажите, что если А
имеет размер т X п и ранг т, то выбор х0 = (А'А^А’у миними-
зирует |] Дх — у [j.
5. Дан набор п пар {.rlf Найдите функцию / (£) = at-]- [3
(аир — постоянные, которые следует определить), такую, чтобы
п
2 [/ (И) — ад Г2 было минимально (см. задачу 4).
1=1
6. Минимизировать х'фгф- Ь'х при ограничении Сх — 0, когда
С — матрица т X п ранга т.
§ 33. Задачи со свободным конечный состоянием
системы
Будем различать два типа задач.
Задача без ограничений на конечное состояние системы
и задача с фиксированным конечным состоянием. Первая
задач а немног о проще, и решение ее будет получено
в этом параграфе. Сразу следует оговориться, что под
«решением» подразумевается возможность вычисления оп-
тимальных траектории и оптимальных управлений в тер-
минах решений некоторых нелинейных матричных диф-
ференциальных уравнений, которые могут быть проинте-
грированы только в частных случаях. Однако даже
в таком виде приводимые результаты играют центральную
роль в теории управляемых систем, так как они позво-
ляют получить представление о структуре оптимальной
системы. А если нужны конкретные числа, то расчеты лег-
ко осуществляются на ЭВМ.
Уравнение Риккати. Итак, пусть задача наименьших
квадратов характеризуется свободным правым концом
траектории и функционалом качества вида
ц
J = § [х' (i) L (() х (i) + u' (i) u (i)] dt х' (fi) Qx (ft).
t.
Мы предположим, что матрица L — симметрическая, но
не обязательно положительно определена, хотя эти тре-
бования и выполняются в большинстве практически инте-
ресных случаев.
Кроме того, будем предполагать, в отличие от общей
постановки задачи, что в квадратичной форме относитель-
но управляющих воздействий u' (i) 7’ (i) и (/) матрица
566
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
R (/) совпадает с единичной матрицей Е. Это несколько
сократит наши выкладки, не нарушая общности рассуж-
дений. Рассмотрение случая произвольной положительно
определенной матрицы R (£) мы оставляем читателю (см.
также задачу 7). Поскольку L (() предполагается неотри-
цательно определенной, то, вообще говоря, не является
верным утверждение о том, что существует минимум J.
Оказывается, что определение условий существования ми-
нимума J и вычисление оптимального управления связано
с решением матричного дифференциального уравнения
1-го порядка, называемого уравнением Риккати:
К (г) - -Л'(0 К(1) - К (i) A (t) +
+ к (() В (t)B' - L (t). (УР)
Поскольку это уравнение — нелинейное, то не ясно, будет
ли при заданном начальном условии К (Q = Ко сущест-
вовать его решение. Волее того, если даже решение су-
ществует для некоторого интервала времени, то опо может
перестать существовать для большего временного интер-
вала. Чтобы проиллюстрировать типичные трудности,
возникающие при решении уравнения Риккати, рассмот-
рим простой пример скалярного уравнения 1-го порядка
k (t) = k2 (t) 4- 1, k (0) = 0.
Это, очевидно, уравнение Риккати. Разделяя переменные
и интегрируя, получим k (f) = tg t. Решение стремится
к бесконечности при t л/2, и поэтому оно существует
на интервале 0 t 1 и не существует на интервале
О I 2. При рассмотрении двух теорем этого параграфа
предполагается, что можно решить соответствующее
уравнение Риккати и что решение не обращается в бес-
конечность на рассматриваемых интервалах. Через
К (t, Л"1? Ч) обозначим такое решение уравнения Рик-
кати (УР) в момент времени которое в момент Ч удов-
летворяет начальному условию К (^) = Л^.
Еще несколько предварительных замечаний об урав-
нении Риккати. В нашем изложении оно вводится не-
сколько искусственно. Рассуждения строятся таким об-
разом, Если имеется решение уравнения Риккати (УР),
то можно сделать некоторые выводы о существовании и о
виде решения интересующей нас оптимальной задачи.
§ 33] ЗАДАЧИ СО СВОБОДНЫМ КОНЕЧНЫМ СОСТОЯНИЕМ 367
Читателя не должно смущать отсутствие мотивировки
введения этого уравнения. Она будет дана в дальнейшем
вместе с результатами исследования некоторых свойств
решений этого уравнения.
Задача о регуляторе нулевого состояния. Физическое
содержание этой задачи заключается в том, что система
с оптимальной обратной связью должна возвращаться
в нуль из любого состояния, причем критерий качества
вдоль любого такого движения системы должен достигать
минимума. Решение этой задачи основано на следующем
простом равенстве.
Лемма 1. Пусть Л, В и К — К' заданы. Предполо-
жим, что К (?) существует на интервале t 0 tx.
Тогда для х (?) и и (?), удовлетворяющих уравнению
х (?) = А (?) х (?) + В (?) и (?), выполнено равенство
Г и б)
. Х(С
о
B'(t) К (?)
[и' (?), х" (?)] ; .
dt —
— х" (?) К (?) х (?) = 0.
Доказательство. Если х (?) — любая диффе-
ренцируемая траектория системы, а К (?) — любая диф-
ференцируемая матрица, то имеет место очевидное тож-
дество
ц
~ [х7 (?) К (?) X (?)] dt --- X7 (?) К (?) х (?)
to
или, более подробно,
J (х' (t)K (?) х(?) + х' (?) К (?) х (?) -|- х7 (?) К (?) х (?)] dt —
— х'(?)Х(?) х (?)|Й = 0.
Если в этом выражении подставить вместо х (?) и х' (?)
правую часть уравнений движения Л(?) х(?) 4- B(t) и (?)
и х7(?)Л'(?) + и'(?)£?(0 соответственно, то получим
утверждение леммы. 0
Решение задачи со свободным конечным состоянием
системы сформулируем в виде следующей теоремы.
368
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
ьГЛ VI
Теорема 1. Пусть заданы матрицы А (?), В (?),
£ (у) == L' (?) и Q — Q'. Предположим, что на интервале
to ? S. Ч существует решение К (?) дифференциального
уравнения (УР) с начальным условием К {1г) = Q. Тогда
существует управление и (?), которое дает минимум кри-
терию качества
й
4 = i К (4 £ (О X (?) + и' (?) и (?)) dt + х' (?г) Qx (?х)
to
для системы х (?) = Л (?)х (?) + В (?) и (?), х (?0) — х0.
Минимальное значение J равно х (?0) К (?0. Q, tx)x (?0).
Минимизирующее управление в виде обратной связи имеет
вид
и (?) = - Q, ?х)х (?).
Минимизирующее управление по разомкнутому контуру
и (?) = —В' (1)К (?, Q, ?3)Ф (?, ?о)хо,
где Ф (?, ?о) — переходная матрица для уравнения
4 (?) = [А (?) — В (1)В' Ж & ^1)1х (*)•
Доказательство. Преобразуем выражение для
критерия /, прибавив к J тождество предыдущей леммы;
й
J = Vй' х' (01 Дj] [ х $] dt + (н) (?Х (Н) 4-
fl +5 [«'(о» x'wi ?o 0 ОИ(?)
^Ф + Л'(?)О) + *ФЛ(?)
[х(о] dt~ х'(*И(0х(?)й •
Здесь К (?) = К (?, Q, ?х). Объединяя два интеграла
в правой части этого равенства и воспользовавшись диф-
ференциальным уравнением для К (?), из которого сле-
дует, что
К (?) + Ar (i)K (?) Ц- К (?) А (?) + L (?) -=
= К (?)В (?)В’ (t)K (?),
§ 331 ЗАДАЧИ СО СВОБОДНЫМ КОНЕЧНЫМ СОСТОЯНИЕМ 369
получим равенство
j = 5 [и' (С- х'(0]
to
Е : B'{t}K{t)
к (t) в (*)№) в (t) в' (*)£(?).
"и (Г)"
dt 4-
+ х' (£0) К (io) X (i0) =
tt
= $ IIи (0 + В' (?) К (?) х (i) ||2 dt 4- х' (i0) К (io) х (i0).
to
Мы воспользовались начальным условием для уравнения
Риккати, согласно которому К (?т) = К (in Q, tx) = Q. То
обстоятельство, что подынтегральное выражение пред-
ставлено в виде квадрата нормы некоторого вектора, лег-
ко проверяется, если выполнить матричное умножение.
Полученное выражение для J делает выбор оптимального
управления очевидным. Действительно, поскольку подын-
тегральная функция неотрицательна, минимум J равен
х' (i0)-К" (io> Qi ii)x(£o)> и достигается этот минимум в том
и только в том случае, когда интеграл равен нулю. По-
этому оптимальное управление дается формулой
и (?) = —В' (?) К (i, Q, /-j) х (f),
т. е. в виде обратной связи. Подставляя его в уравнение
движения, получим уравнение для оптимальной траекто-
рии
х (£) - [4 (i) - В (i) В'(t) К (i, Q, Н)]х(£).
Если Ф (£, £0) — переходная матрица этого уравнения, то
оптимальное управление по разомкнутому контуру дает-
ся равенством
и (?) = -В' (t)K (t, Q, ti) Ф((, t„)x (t„>. o
Полученный результат дает решение задачи синтеза
оптимальной системы с обратной связью. Структурная
схема системы представлена на рис. 33.1.
Решенная задача получила название задачи о регуля-
торе нулевого состояния [24]. Эта задача рассматривалась
в § 27 с учетом лишь требования устойчивости замкнутой
системы. Пользуясь теоремой 1, можно выбрать коэффи-
циенты в цепи обратной связи так, чтобы обеспечить мини-
мум квадратичному критерию качества.
370
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Заметим, что если выбор коэффициентов в цепи об-
ратной связи на основании «модальных» соображений, на-
пример, по заданным полюсам передаточной функции зам-
кнутой системы, не является однозначным, то наличие
квадратичного критерия оптимальности однозначно опре-
деляет все коэффициенты в цепи обратной связи. Имеется
много интересных вопросов, связанных с сочетанием мо-
дального и оптимального подходов при конструировании
Рис. 33Л.
регуляторов. Например, можно решать задачу о выборе
среди множества обратных связей, равноценных с модаль-
ной точки зрения, такой, которая обеспечивает минимум
некоторому критерию качества. Возможны н другие соче-
тания этих подходов. Некоторые подробности имеются
в книгах [47, 67, 80}.
Пример 1. Пусть х (0) «= 1. Найти х (£) на интер-
вале 0 71 так, чтобы критерий
т
J = $ (0 + (О) dt
о
достигал минимума. Рассмотрим эту задачу как задачу
оптимального управления. Пусть уравнение движения —
х (Z) = и ((). Тогда уравнение Риккатн для этой задачи
имеет вид
к (/) = (/) — 1.
Решение, которое проходит через нуль при t = Т, имеет,
очевидно, вид к (t) = th (Г — £). Поэтому оптимальная
траектория удовлетворяет уравнению
х (£) = —th (Т — t)x (().
§ 331 ЗАДАЧИ СО СВОБОДНЫМ КОНЕЧНЫМ СОСТОЯНИЕМ 371
Интегрируя это уравнение, получим
= chi — (-^40 shi,
u(t) = — th (T — f) x (£).
В соответствии с результатом теоремы минимум J равен
х' (0)£ (0, 0, Т)х (0) = (0) th Т.
Пример 2. Рассмотрим задачу предыдущего при-
мера я = и для другого критерия качества:
т
J и 2 (£) dt х2 (Г),
о
Уравнение Риккати к (£) = к2 (£), к (71) = 1 имеет реше-
ние
*(0 =
Уравнение для оптимальной траектории
x{t) = — k{t)x(t) = , ^(0) = 1-
Его решение дается формулой х (£) 1— . Оптималь-
ное управление, выраженное в виде обратной связи, есть
u(t) = — В' (£) К (/, (?, х (0 —
=________*___fl_________________,
Т -pi -t 1 + Т/ 1 + ? ’
а оптимальное управление по разомкнутому контуру,
очевидно, совпадает с приведенным, так как х$ = 1.
Оптимальное движение системы в примерах 1, 2 иллю-
стриуется рис. 33.2.
Замечание. Таким образом, согласно теореме 1
для того, чтобы выбрать коэффициенты в цепи обратной
связи, необходимо вычислить матрицу К (£), решив урав-
нение (УР). Матрица К (£) зависит только от матриц
А (£), В (£), 0» В (£) и не зависит от начального состояния
системы. Поэтому оптимальная система с обратной связью
может быть спроектирована при наличии только информа-
ции о структуре системы (матрицы Л (£), В (£)) и о критерии
372
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ТЛ. V
качества (матрицы Q, L (?)). При этом над состоянием
к (?) производится линейное преобразование с помощью
матрицы B’(t}K(t, Q, £х). Оптимальная система с обрат-
ной связью является, таким образом, линейной системой
с переменными параметрами. Поскольку уравнение (УР)
нелинейно, то найти его решение в замкнутой форме, как
правило, невозможно, и вычисление К (?) приходится
осуществлять с помощью ЦВМ.
Явный вид решения уравнения Рнккати. В специаль-
ном частном случае, когда L = 0 в определении критерия
качества, решение уравнения Риккати выражается в явном
виде через матрицу W (?. ?х), которую мы назвали грамиа-
ном управляемости (см. § 19). Итак, пусть L = 0. Тогда
уравнение Риккати имеет вид
К (?) = — А1 (?) К (?) — К (?) А (?) + К (?) В (?) В’ (?) К (?), 1
ед) = (2- I
(1)
Если теперь предположить, что матрица К (?) имеет об-
ратную, то мы знаем, что справедливо соотношение
§ 33] ЗАДАЧИ СО СВОБОДНЫМ КОНЕЧНЫМ состоянием з?з
Умножая теперь уравнение (1) справа и слева на матрицу
К-1 (£) и воспользовавшись этим соотношением, получим
4 К~‘ (t) = К’1 (t) A' (t) + А (I) К'1 (t) - В (t) В' (I),
к-1 (У = «г1.
Но согласно свойству 3 матрицы W (£, £х) (теорема 2§ 19),
матрица W (t, удовлетворяет точно такому же матрич-
ному дифференциальному уравнению. Поскольку это
уравнение линейное, известно его решение (теорема
1 § 12), используя которое, немедленно получаем явный
вид решения уравнения Риккати
К (£, Q, Q = [W (£, О + Ф (;, (/, /ОГ1.
Эта формула справедлива, естественно, лишь в предполо-
жении, что обратная матрица справа существует. Резуль-
таты проведенных вычислений можно выразить следующим
образом.
Теорема 2. Пусть A (£), В (£) и Q = Q' — данные
матрицы и пусть W (£, — грамиан управляемости для
системы
х (/) = A (Z)x (£) -р В (Z)u (£).
Тогда, если матрица
н (t, *i) = w (;, + Ф (t, (t, tj
обратима для всех te интервале t0 t то существует
управление, которое^ доставляет минимум критерию
качества
f*
J = J и' (£) u (£) dt + х' (^) Qx (<l).Q
to
Преобразование координат. Чтобы получить полную
картину результатов при рассмотрении задач линейной
теории, важно уметь исследовать эффекты, связанные
с преобразованием координат в пространстве состояний
исследуемой системы. Для задач с квадратичным крите-
рием качества основные вопросы таковы. Как изменится
уравнение Риккати при замене координат? Б какой коор-
динатной системе это уравнение будет иметь простейшую
форму?
374
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
(ГЛ. VII
Мы рассмотрим замену переменных z (t) = Р (0х (0,
предполагая, что Р (0 несингулярна, т. е. [ Р (0 [ О
ни в одной точке интервала t 0, кроме того, пред-
положим, что Р (0 является дифференцируемой.
При такой замене переменной, как было показано
в § 10 (теорема 2), уравнения системы, приведенные
в условии теоремы 2, преобразуются к виду
z (0 = [Р (0 A (t)P~l (0 + Р (t)P~l (01Z (0 4-
+ Р (t)B (0u (0,
а критерий J примет вид
к
J = \ V1 (0 u (0 + z' (0 (0 L (0 Р1 (0 z (0) dt 4-
Из этих двух равенств непосредственно следует, что урав-
нение Риккати для новой системы преобразуется к виду
'к (t) = -[Р (0 А (0Р-1 (0 Р (0Р-1 (0]К (0 -
-К (0 [р (0А (0Р"1(0 - Р (0 Р’1(01 4-
4- К (t)P (t)B (0 - P'-1(0L(0P“1(0.
Интересным частным случаем проведенного преобразова-
ния является Р (/)--. Ф (/0, 0, где Ф — переходная матрица
исходной системы. Эта матрица, естественно, удовлетво-
ряет требованиям, предъявляемым к Р (0. В этом частном
случае линейные члены в уравнении Риккати исчезают,
и оно преобразуется к виду
К (0 - К (t)G (t)Gr(t)K (0 - (0,
где G (0 = Ф (£0, 05(0, а Н (0 определена в условии тео-
ремы 2.
Задача о регуляторе выхода. Иногда требуется оцени-
вать качество переходного процесса не по отклонениям
переменных состояния, а по отклонениям выходных пере-
менных системы от заданного значения (обычно нулевого).
При такой постановке задачи критерий оптимальности
имеет вид
ti
J - 5 [у' (0 Ь (0 У W + (0 “(«)]* + У' (Ь) <?У (Ь), (2)
§ 33] ЗАДАЧИ СО СВОБОДНЫМ КОНЕЧНЫМ СОСТОЯНИЕМ 375
где Q, L (t) — положительно полуопределенные матрицы
размером р X р. Задача с таким функционалом сводится
к решенной задаче о регуляторе состояния в том случае,
когда система является полностью наблюдаемой. Дей-
ствительно, поскольку согласно уравнению наблюдения
у (£) = С (£)x (£), то функционал можно записать в виде
ti
J = § [х' (f) С' (£) L (£) С (£) х (£) 4- u' (£) и (£)] dt
t0
-b x' (Zj) Cf (£i) QC (£i) x (Zj).
Этот функционал совпадает с функционалом задачи о
регуляторе состояния в том случае, когда матрицы
C'(t)L (t)C (£) и C'tt^QC (£х) положительно полуопределе-
ны, Следующее утверждение формулирует условия экви-
валентности этих двух задач.
Лемма 2. Если пара матриц {Л (£), С (^наблюда-
ема^ а матрицы L (£), Q положительно полуопределены,
то матрицы C'(t)L (t}C (£), С' (t-^QC (Zx) являются поло-
жительно полуопределенными матрицами.
Доказательство, По условию леммы имеем
y'(t)L (t)y (£) > 0 при любом у (£), откуда следует
x'(t)C'(t)L (t)C (t)x (£) 0 для любого вектора у (/) =
= С (£)x (£). Но из условия наблюдаемости имеем одно-
значное соответствие между векторами у (£) и х (£), т. е.
каждый выходной вектор у (£) получается при единствен-
ном состоянии х (£) и потому х'(£)С' (t)L (t)C (i)x (£) 0
при любом x (£), а следовательно, матрица C'(t)L (t)C (£)
положительно полуопределена. Аналогично устанавли-
вается положительная полуопределенность матрицы
C'(Z)(?C (Z). О
Теперь, пользуясь теоремой 1, сформулируем решение
задачи о регуляторе выхода.
Теорема 3. Пусть система {А (/). В (t), С (£)}
наблюдаема и пусть L (f), Q — положительно полуопреде-
ленные матрицы размеров р X р. Тогда, если на интервале
f0 < f < существует решение К (£) дифференциального
уравнения
K(t) = - A' (t)K (/) - К (t)A (t) +
+ К (t}B'(t)K (t) - C\t)L
376
КВАДРАТИЧНЫЙ' КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
с граничным условием К (£х) = C'[t-^QC (fj), то оптималь-
ное управление, минимизирующее функционал (2), имеет
вид
и (0 = - (?, C'ttJQC fa), ^)х (t).
Оптимальное движение определяется дифференциальным
уравнением
х (Z) = [А (£) - В (f)B'(t)K (£, C'ttJQC (*i)> *i)lx (*)<
а минимальное значение критерия качества равно
J $ ~ х.' (t0)K (£0, С' (t^QC (fj), fj)x (io). Q
Заметим, что для построения обратной связи, решаю-
щей задачу о регуляторе выхода, нужна информация о сос-
тоянии системы х (£). Данных о выходной величине у (£)
для решения этой задачи недостаточно. Однако, если сис-
тема наблюдаема, то можно построить оценку состояния
и реализовать оптимальное управление.
Задачи. 1. Рассмотрите минимизацию
р b(i)JLxp)J 1
для системы: х (/) = А (/) х (г) 4 В (i) u (t). Покажите, что со-
ответствующее уравнение Риккати имеет вид К (у) =
= - A’ A (t)-L (г) 4- [jV(0 ч-в' (г) к (()]' [ту (р 4-
-[- В' (t) К (/)], и докажите аналог теоремы 1 для этих условий.
2. Покажите, что если К (г) является решением стационарного
уравнении Риккати
К (() = — А'К (t) — К (г)Л + К! (t)BB’K (t) — L,
то e~AtK (j, Q, удовлетворяет нестационарному уравнению
Риккати
К (t) = К (0 еА*ВВгеАЧК {1} — e~A,iLe~At.
3. Покажите, что существует начальное состояние р (t0) для
системы уравнений р (£) = — A' (t) р (f) такое, что управление н0 (t),
которое минимизирует
h
J = U' р) u р) dt 4 X' pl) Qx pi),
to
для уравнения x (t) = A (t) x (z) 4 В (z)u (t) имеет вид u0 (t) =
= -S(Z)p(Z).
g 33] ЗАДАЧИ CO СВОБОДНЫМ КОНЕЧНЫМ СОСТОЯНИЕМ 377
4. Рассмотрим систему х (0 — A (1} х (/) + В (0 u (0. Предпо-
ложим, что мы хотим обеспечить близость траектории этой системы
к заданной траектории х* (0, где х* (0 является решением одно-
родного уравнения х* (f) = A (0 х* (0. Чтобы решить эту задачу,
определим критерии оптимальности в виде
т
J -= {и' (0 и (0 + [X (0 - х*(0]' Z, (0 [х (0 - х*(0]} dt.
о
Покажите, что управление, минимизирующее эту функцию, имеет
вид
«в (0 = F (О х (0 + g (0-
Чему равны F(l) и g (0?
5. Пусть А и В — постоянные матрицы и пусть
х (0 = Лх (0 + Ви (I).
Предположим, что А не имеет собственных значений с нулевой ве-
щественной частью (лежащих на мнимой осн). Покажите, что если
К определено как
tf = lim [Ж (О, 0]-\
то [Л — ВВ' К] имеет все свои собственные числа в плоскости Rep <4
< 0.
6, Пусть дана система .t (0 = 2х (0 + и (0, х (0) = 1, О t
% 1. Найдите оптимальное управление в виде цепи с обратной
связью и в разомкнутом виде для критерия качества
1
J = (1)4- (t)dl.
о
7. Покажите, что если в формулировке теоремы 1 заменить
члек и' (0 и (0 членом вида и' (0В (0 и (0, где R (0 — положитель-
но определенная матрица, то оптимальное управление имеет вид
и (0 = — R-1 (t)B' (t)K (0 х (0.
8, Для уравнения х (0 = 0,5а? (0 + и (0, х (0) = х0 вычисли-
те оптимальное управление в виде обратной связи, обеспечивающее
минимум критерия
1
J = [2е-0(2 (0 4- 0,5Нжа (0] dt.
о
Вычислите минимум J.
9. Для системы
ГО п г гл
с'= [0 1]
А =
378
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ VII
вычислите оптимальный закон управления для критерия
1
J = (0Е«г (ИИ*,
о
Дли оценки состояния системы постройте фильтр Калмана с соб-
ственными числами = Х2 = — 3.
10. В формулировке теоремы 1 нет требовании управляемости
пары {Д (I), В (()}. Каков физический смысл оптимального управ-
ления дли неуправляемой системы?
§ 34. Терминальное управление
Если управляющее воздействие и (£) должно обеспечить
перевод системы в заданное состояние в конце интервала
£0 t Zi или если требуется, чтобы в момент времени
tx состояние х (4) принадлежало бы заданному множеству,
то соответствующая задача минимизации квадратичного
критерия называется задачей с фиксированным конечным
состоянием или терминальной задачей. Для решения этой
задачи методы предыдущего параграфа должны быть моди-
фицированы. Будем рассматривать лишь случай, когда
конечное состояние является жестко фиксированным. Од-
нако в рамках развитых методов возможны различные
обобщения. Поскольку конечное состояние системы фик-
сировано, можно, не нарушая общности, положить Q =
= 0 в выражении для квадратичного критерия.
Минимум нормы терминального управления. Начнем
с рассмотрения простейшего вида критерия, который полу-
чается, если L = 0:
ч
J = jj и' (£) и (£) dt = | и (£) |Ja.
Покажем, что управление, которое было получено нами
при доказательстве управляемости линейной системы
(вспомним, что это было одно из возможных управлений,
обеспечивающих заданное движение системы), имеет ми-
нимальную норму.
Теорема 1. Пусть A (t) и В (£) — заданные мат-
рицы и пусть W (t0> fj — грамиан управляемости системы
х (£) - А (0х (£) -}- В (£) u (£).
§ 34]
ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ
379
Если u0 (t) — управление вида
ио (0 = ~ в' (0ф' (*о>
где ъ удовлетворяет условию
W (f0, = х0 — Ф (f0, fjjxn
то управление и0 (/) переводит систему из х0 при t = tQ
в Xi при t = fi, причем, если ux (f) — какое-либо другое
управление, удовлетворяющее этим граничным условиям,
то
и Й
§ Ui (f) Uj (f) dt > J U() (f) Uo (f) dt,
i» la
Более того, если W (tQ, tr) имеет полный ранг {система
полностью управляема), то
ti
J ui (f) Uo (f) dt = [x0 — Ф (f0, /i) xjW\f0, fJfXo— Ф(^, ^)хД.
fo
Доказательство. To, что управление u0(f)
обеспечивает движение системы из х0 при t = f0 в Xj при
t ~ f1; было установлено в § 19. Впрочем, легко проверить
непосредственно, что выполняется равенство
h
Ху = Ф (fy, f0) [х (f0) 4- Ф °) В С3) В> (б) и» (3) ’ (О
^0
Возьмем какое-либо управление u, (f), которое тоже удов-
летворяет граничным условиям. Тогда
h
Х1 - Ф (fl, fo)[x(f0) + 5 Ф(^б)й(з)и1(а)йб1. (2)
fo
Вычитая из равенства (1) равенство (2), получим
о
— § Ф (f[). о) В (т) [П1 (о) — и0 (о)] d<5 — 0.
Домножая это равенство слева на к' и вспоминая опреде-
ление u0 (i) по условию теоремы, получим
$ ui (a) [Ur (о) — По (<з)1 da = 0.
380
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Это условие позволяет проверить непосредственно, что
е»
{ui (g) Ui (а) — щ (g) uo (a)} da =
fi
= $ [Hi (g) — uo (a)]' [tit (a) — u0 (a) ] da.
to
Так как выражение справа неотрицательно, это завершает
доказательство оптимальности u0 (£).
Заметим, что в случае обратимости матрицы W (£0, 0
(а это, естественно, более интересный случай) имеем
h ti
§ Uq (/) u0 (t) dt = z' Ф (f0, a) В (g) B' (g) Ф' (tQ, a)da% =
= z'W (io, ф =
= [x0 — Ф (io, Zj) Xif W'1 (£0, 0[ x0 — Ф (to, *1) XjJ. 0
Заметим, что поскольку мы имеем явное выражение для
квадрата нормы оптимального управления, то при задан-
ном управлении, удовлетворяющем граничным условиям,
Рис. 34.1.
мы имеем явную формулу для величины, на которую ле-
вая часть неравенства
ц ц
ux (/) Ui (£) dt > $ ui (£) Uo (0 dt
превосходит правую. Структура оптимальной системы дана
на рис. 34.1.
Для доказательства теоремы 1 можно использовать ре-
зультат теоремы 2 § 31. Этот подход помогает уяснить
«геометрический смысл» полученного результата.
§ 34]
ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ
381
Чтобы сделать это, заметим, что задачу вычисления
оптимального управления можно трактовать как задачу
решения линейного интегрального уравнения
t,
L (и) = ф (^’ °) 5 (°)и (3) ds = [Ф (#о, Ч) xi — Хо].
Здесь L (и) определяет линейное преобразование евклидо-
ва бесконечномерного пространства m-ок непрерывных
функций, которое мы обозначили С" [*0, fj, в линейное п-
мерное евклидово пространство Е*1, или
£(u): С? Ifo,
Напомним, что скалярное произведение в Еп: <хп ха) =
= х^, а скалярное произведение в С™ [*0,
ii
<ut, U2> = щ (б) u2 (о) ds.
Заметим далее, что оператор L*, сопряженный к L, имеет
вид
£* (х) = £х)х,
где х е Е?г, и поэтому преобразование ££* просто равно
W (f^ *i). Если эта матрица обратима, то в соответствии
с теоремой 2 § 32 выбор
«о (*) = -5'(*)Ф'(*оЛ)И^ (Аи h)
минимизирует <и, и) для L (и) = х. Приведенная на
рис. 34.2 диаграмма иллюстрирует идею этого доказа-
тельства.
382
квадратичный критерий качества
1ГЛ. VII
Рассмотрим простой пример использования доказан-
ной теоремы. Пусть дана электрическая цепь (см. рис. 34.3).
Уравнение движения этой системы
4си(о=чо,
где С — емкость, i (?) — ток в цепи, R — сопротивление.
Энергия, рассеянная на сопротивлении в интервале [0, ?J,
равна
к
ц = § Ri? (?) dt.
u(i) °
Пусть требуется найти
i (?) такое, чтобы и (0) =
= и0, и (?J = ulf а энер-
гия, рассеянная иа сопро-
тивлении, была бы мини-
мальной. Мы хотим минимизировать
fi
J — § i3 (?) dt.
о
Грамиан управляемости в этой задаче имеет вид ТУ (0, t-^ =
ti
= р-г и оптимальное движение в соответствии с результа-
том теоремы 1
Q
h (О = ~t(ui ~ «о) = const.
Минимум рассеянной на сопротивлении энергии реали-
зуется при постоянном токе. Если и0 = 0, то простой рас-
чет показывает, что отношение энергии, накопленной в
цепи, к энергии, затраченной за время ?а в оптимальном ре-
жиме, равно 1/(1 + 2RC/t1), Это отношение минимизирует
эффективность этой цепи как накопителя энергии.
Общий случай терминальной задачи. Последний шаг
в решении задачи управления с квадратичным критерием
качества состоит в решении терминальной задачи, когда
L в критерии оптимальности отлична от нуля. Процедура
решения состоит в комбинировании полученных ранее
результатов.
§ 34] ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ 383
Пусть уравнение движения системы
х (?) = A (?)х (t) 4~ В (?)и (?),
а критерий качества
J = {u' (?) u (?) -J- x' (?) L (?) x (?)) dt. (3)
to
Решение задачи выбора оптимального и (?) снова зависит
от решения уравнения Риккати
К (?) = - A'(t)K (?) - К (?)Л (?) 4- К (t)B (?)5'(?)£(?) -
-£(?). (УР)
Одиако граничные условия в этом уравнении, как будет
показано ниже, не являются теперь жестко фиксирован-
ными.
Теорема 2. Предположим, что существует сим-
метрическая матрица такая, что решение К (t, К±, ?х)
матричного уравнения Риккати существует на интервале
?0 ? ‘С ti- Тогда дифференцируемая траектория х (?),
определенная на интервале ?0 4^ ? ?п минимизирует
критерий качества (3) для дифференциального уравнения
х (?) = А (?)х (?) + В (?)и (?) и граничных условий х (?0) =
= х0, х (?t) -- х2 тогда и только тогда, когда она миними-
зирует величину
h
J\ = v' (?) v(?) dt,
te
для дифференциального уравнения
х (?) = [Л (?) - В (t)B'(t)K (?, Кг, ?1)]х(?) 4- 5(?)v(?)
и граничных условий х (?0) = х0, х (?х) = хх. Более того,
вдоль любой траектории, удовлетворяющей граничным ус-
ловиям, выполняется равенство
•Т J1 4~ (?0i К-у, ?i)xo х (£i)-
Доказательство. Если подставить уравнение
х (?) = А (?)х (?) < В (?)и (?) в равенство леммы 1 § 33,
ЗЯ4
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
то J приводится к виду
tf
to
Е О
0
О)В(0 л (От)
Объединяя эти два интеграла и используя уравнение Рпк-
кати для К (?), получим
to
Е В' (?)К(?)
К (?) В (?) К (?) В (?) В' (?) К (?)
J
- - 5 IIU (?) 4- В' (?) К (?) х(?) j|2 dt + х' (QK(Q X (?0).
to
Полагая v (?) = u (t) В' (t)K (?)х (?), получим уравне-
ние движения относительно переменных х (?) и v (?)
X (?) = [Л (?) — В (t)Br (t)K (?0, Ки ?г) ]х (?) + В ?) v (О
и минимизируемый функционал вида
(i
J = $ v' (?) v (?) dt + х' (?0) К (?0, К» ?i) X (?0) — х' (?i) Кгх (?i).
i#
Этим завершается доказательство эквивалентности, тре-
буемой условиями теоремы. 0
Доказанная теорема (заметьте, что доказательство по-
хоже на доказательство теоремы 1 § 33) сводит задачу с
ненулевой матрицей L (?) к эквивалентной задаче отно-
сительно управления v (?), критерий которой имеет нуле-
вую матрицу L (?). Эту эквивалентную задачу мы уже ре-
шили (теорема 1 этого параграфа). Формулы для вычи-
сления .оптимального управления оказываются довольно
сложными.
Структурная схема оптимальной системы с обратной
связью совпадает с той, которая была приведена при ре-
§ 34]
ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ
385
шении задачи со свободным конечным состоянием. Разни-
ца заключается в граничных условиях уравнения Рик-
кати. Матрицу необходимо подобрать (в задаче со
свободным конечным состоянием начальное условие урав-
нения Риккати было фиксировано и равно матрице Q, вхо-
дящей в формулировку квадратичного критерия общего
вида) так, чтобы траектория движения проходила в момент
?! через заданную точку х (?т) = хР Таким образом, мат-
рица К (?) коэффициентов усиления в цепи обратной свя-
зи будет существенно изменяться в зависимости от задан-
ного значения хР Поэтому для реализации такой системы
придется решать уравнения Риккати каждый раз, как
только изменились входные данные относительно величины
хг Этот существенный конструктивный недостаток связан
с требованием точного попадания в точку х,_ Если ввести
стоимость отклонения от х1? т. е. Q 0, в формулировку
критерия качества, то матрица обратной связи не будет
зависеть от величины хР
Оптимальная следящая система. Задачи о регуляторе
состояния и о регуляторе выхода являются частным слу-
чаем более общей задачи слежения. Мы рассмотрим задачу
оптимального слежения выхода системы у (?) за заданной
входной функцией времени z (?). Будем предполагать, чтн
функция z (?) известна при t Обозначим ошибку
слежения Д (?) --= z (?) — у (?) и рассмотрим следующий
критерий качества:
J = $ [ Д' (?) L (I) Д (?) + и' (?) и (?)] dt + Д' (?) <?д (0, (4)
(о
где L (t), Q — положительно полуопределенные матрицы.
Тогда решение задачи о минимизации этого функционала
вдоль траектории движения линейной системы непосред-
ственно следует из результатов § 32 и теоремы 2. Остав-
ляем читателю доказательство следующей теоремы.
Теорема 3. Для линейной наблюдаемой системы
х (0 = A (I) x(t) + В (?) u (?), у (?) = С (?) х (?)
управление в виде обратной связи, минимизирующее крите-
рий качества (4), где z (?) — заданная непрерывная функ-
ция, имеет вид
п (?) = В' (?) [v (?) — К (?)х (?)].
3 Ю. Н. Андреев
386 КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА (ГЛ. VU
Положительно определенная, симметрическая матрица
К (/) является решением уравнения Риккати
К (t) = - К (t)A (f) -
— + К (t}B — C'(f)L(t)C (О
с граничным условием
к = С' (MQC
вектор v (t) является решением, уравнения
v (0 = — [A (t) — В (t)B’v(0 — C"(0ZX0z (О
с граничным условием
v (^1) = (О*
Оптимальная траектория есть решение линейного диффе-
ренциального уравнения
х (0 = 1А(t) — В (t)B' (t)K (0]х (t) + В (t)B\f)v(t)
с начальным условием х (£0) = х0. Q
Заметим, что как уравнение Риккати, так и его началь-
ные условия не зависят от желаемого выхода z (t). Отсюда
следует, что матрица обратной связи К (0 полностью опре-
деляется заданием матриц системы, критерия стоимости
и временным интервалом [£0, 01. Заметим далее, что струк-
тура регулятора получается точно такая, как и в задаче
о регуляторе выхода. Значит, собственные числа опти-
мальной следящей системы с обратной связью совпадают
с собственными числами оптимальной системы, получен-
ной при решении задачи о регуляторе выхода. Отличие
оптимальной следящей системы от оптимального регулято-
ра выхода состоит в наличии вектора v (t). Важно пом-
нить, что для вычисления текущего значения функции
v (0 необходимо знать функцию желаемого выхода z (0
при всех t0 t 0. Это условие редко выполняется в ре-
альных системах. Структурная схема оптимальной следя-
щей системы приведена на рис. 34.4. Если желаемый вы-
ход принадлежит некоторому известному классу функций,
например, является решением однородного уравнения
z (0 = /1z (0, то задачу слежения можно свести к задаче
о регуляторе состояния, включив вектор z (0 в общее чис-
ло переменных состояния и сконструировав идентифика-
S 34] ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ
387
тор этого состояния. Напомним, что подобный подход был
использован в § 25 при конструировании асимптотического
дифференциатора. С этих позиций задача о следящей сис-
теме изучалась в § 31.
Рис. 34.4.
Задачи. !. Определите, при каких условиях существует управ-
ление ц0 (2), которое переводит систему
х (0 = А (£) х (t) 4- В (t) u (t)
из хи при t0 в хх при /j и минимизирует
а
J = (ц' (t) ц (t) -р 2и (/) .Vx (2) -j- х' (7) Lx (t)} dt.
fo
Предположите, что грамиан управляемости W (Zo, — положи-
тельно определенная матрица. Найдите управление, предполагая,
что оно существует.
2. Пусть С — матрица т X п ранга т. Найдите u (t) такое,
что состояние системы
X (t) = А (0 х (0 4- В (t) u (t), х (0) = Xq
попадает в ядро С при t = 1 и
1
J = {х' (t) L (2) х (t) 4- u' (t) u (t)}dt
о
минимизируется.
3. Покажите, что существует начальное состояние для сопря-
женных уравнений
i> 0) = — a' (t) р (t)
такое, чго управление, которое минимизирует
G
J = u' (t) и (t) dt
t»
13*
388 КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА [ГЛ VII
и переводит состояние системы х (t) = A (t)x (t) -j- В (i) u (t) из x0
при f0 в ki при i1( имеет вид
И (t) = - В' (О Р (*)
Л
4. Найдите минимальное значение (t)dt при ограничениях
о
х (л) ~ 0, г (0) == 1.
5. Пусть А — постоянная матрица п X п и Ь — постоянный
п-всктор. Пусть пара {А, Ъ} управляема. Для заданной функции
ф (i), определенной на интервале найдите х0 такое,
чтобы минимизировать интеграл
СТ
J = [ф (/) — be“^7xo j2 dt,
о
6. Найдите функцию времени u (I) такую, чтобы неустойчивая
•система х (t) = л {t) -j- и (г) переходила в нулевое состояние, а
СО
J = w4 (f) dt
о
<5ыло минимальным Найдите и (I) в виде обратной связи, т. е. как
функцию Г (Z)
7, Пусть А — постоянная матрица п X п, В — постоянная
матрица п X и- Пусть пара {А, В) управляема. Дана известная
функция времени v <Л}. Найдите управление u (t), которое перево-
дит систему х (£) = Ах (t) ф- Ви (t) ф- Су (t) из х0 в 0 за время
Т н минимизирует
Т
J = u' (Z) и (/) dt.
о
8. Найдите управление и (t) и конечное время Т такие, что
скалярная система (г) = u (f) переходит из х (0) = 0 в х (Т) — 1
при минимуме (по м (£) и по Т. так как Т не фиксировано) величины
Т
J u2(J)dt+ Т.
о
9. Рассмотрите задачу попадания траектории х ((), £ (0
= и (г), х (0) = 1 на линию х = at — а при минимуме
ц
7 = {и2 («) 4-(«)}<?«,
о
С — фиксировано.
S 35]
стационарные системы
389
10. Найдите управление, переводящее систему t (f) == ь (t)u (t)
из состояния х (0) = 1 в состояние ж (1) = 0 и минимизирующее
t
J = w2rfi.
о
11. Найдите и (t) такое, что скалярная система ± (t) =
= — х (t) 4" и (t) переходит из х = 1 при t = 0 в х — 0 при t = 1
и
0,5 1
J = и* (£) dt + 2 м2 (t) dt
О 0,5
достигает минимума.
§ 35. Стационарные системы
При переходе к стационарному случаю полученные ра-
нее результаты упрощаются и их легче интерпретировать.
В стационарном случае решение уравнения Риккати мо-
жет быть получено (по крайней мере, в принципе) в зам-
кнутой форме. Оно сводится к вычислению матричных
экспонент и взятию обратной матрицы. Заметим, что даже
в случае стационарной системы оптимальный закон управ-
ления является нестационарным. Чтобы получить стацио-
нарный закон управления, необходимо рассмотреть пове-
дение системы на пол\ бесконечном интервале времени
оо. Если система является управляемой и иденти-
фицируемой, то оптимальный стационарный закон управ-
ления, вычисляемый как решение алгебраического нели-
нейного уравнения Риккати, существует и единствен.
Более того, полученная оптимальная система является
асимптотически устойчивой. Решение этой задачи о стацио-
нарном оптимальном регуляторе состояния используется
при конструировании многих систем автоматического
управления.
Алгебраическое уравнение Риккати. Начнем исследо-
вание стационарных объектов с изучения свойств алгебраи-
ческого уравнения Риккати, решение которого дает опти-
мальный закон управления для стационарной системы
с бесконечным временем существования. Сначала докажем
один вспомогательный результат.
Л е м м а. Пусть система {Л, В, С} управляема и иден-
тифицируема. Пусть, далее, Kt, К,, таковы, что матрицы
390
квадратичный критерий качества
£ГЛ VII
U — 5ATJ = и [Л —ВК2\ — А2 устойчивы. Тогда для
решений уравнений
+ VA4- K'j^ + C'C = 0, i = l, 2, (1)
обозначенных через Rlf У2, справедливы равенства
Vy - V2 = (2)
где [К^ - KJ [Кх - KJ [5% - Ка] -
-IB’V2-KJ {K^-Kj
Ri - У2 = е(А-вк>]'гИ^(А-вк,]^ (3)
о
где W, = - /Г2Г [Я\ - KJ - [tft - KJ [5'Ft -
-КА - [B’VX - KJ[K1 - KJ
Доказательство. Так как матрицы Аг, Аа
устойчивы, то’согласно теореме 5 § 12 решения 7lt V2 урав-
нений (1) существуют и единственны, причем каждое из
этих решений представимо в виде
Vi = AA~BKiJ,( [K'xKi + С'С] e[A~BKi]t dt, i = 1, 2.
0
Выпишем первое из уравнений (1)
[Л - BffJ'Vt + Уг [Л - ВКА + K'rKi + С'С = 0,
или, что то же самое,
[Л - - 7J 4- [7j - F2] [Л - BKt] + К[Кг +
+ С'С + [Л - BKJV2 + V2 [Л - ВКА = о.
Из уравнения (1) при i = 2 имеем
A'V2 + VSA + С'С = £28'^2 + V2BK2 - к2к2.
Подставляя это равенство в предыдущее, получим урав-
нение
1Л - BKJWi ~ FJ + [Vi - ОЛ - ВКА + W = 0,
где W имеет вид, указанный в условии леммы. Поскольку
это — уравнение Ляпунова и матрица [Л — S/TJ устой-
9 35]
СТАЦИОНАРНЫЕ СИСТЕМЫ
391
чива, то его решение может быть представлено в виде ин-
теграла (2) согласно теореме 5 § 12. Аналогично доказы-
вается равенство (3). О
Теперь докажем существование решения алгебраичес-
кого уравнения Риккати. Заметим, что точно так же, как
в случае оценки квадратичного функционала в § 12, где
при переходе к бесконечному временному интервалу мат-
рица V удовлетворяет алгебраическому, а пе дифференци-
альному уравнению, для оптимальной задачи матрица об-
ратной связи при бесконечном времени существования
системы удовлетворяет алгебраическому, а пе дифферен-
циальному уравнению Риккати.
Теорема 1. Если система {Л, В, С} управляема
и идентифицируема, то существует симметрическая поло-
жительно определенная матрица V, которая является ре-
шением алгебраического уравнения Риккати
A'V + VA - VBB'V + С’С = 0. (АР)
Доказательство основано на построении сходящейся
последовательности положительно определенных функций
{Ртп}, т = 1, 2, . . . Рассмотрим критерий качества
ос
J = {u' (t) и (/) ф- х' (t) С'Сх (£)) dt.
и
Пусть Ро — положительно определенное решение линей-
ного алгебраического уравнения
[Л - BKJ'V + V U - Мо] 4- K0KG 4- С'С - 0,
где выбрана так, что [4 — ВК^] — устойчивая матри-
ца. Примем Kt = B'V(} и найдем соответствующую матрицу
как решение уравнения
[4 — BB’VJ V + V [А - BB'V0] 4- V0BB'VQ 4- С'С = 0.
Чтобы убедиться в том, что матрица существует и поло-
жительно определена, воспользуемся равенством леммы,
которое после несложных преобразований, использующих
определение и примет вид
Ко - Pi = eiA-^'AK0 - AJ' Ио -
о
392 КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА [ГЛ VII
Так как подынтегральное выражение неотрицательно, име-
ем lzc - V ] 0. Из равенства (3) в условии леммы следу-
ет, что матрица [Л — 2?'2?FO] устойчива. Повторяя эти
рассуждения для in = 1, 2, . . получим неубывающую
последовательность положительно определенных функций
Fo F3 Vm ^. . . Поскольку система пол-
ностью идентифицируема, то величина J строго положи-
тельна при любом х0 0. Следовательно, не возрастаю-
щая скалярная последовательность XqFoXu, хД^х^, . . .
. . ., соответствующая построенной матричной по-
следовательности ограничена снизу и поэтому со-
гласно известной теореме анализа имеет конечный предел
т] = lim ХоУтхо при любом х0 =А 0. Покажем, что матрич-
ная последовательность Vm в этом случае тоже имеет пре-
дел Foe = limF^. Действительно, так как скаляр
т—*ос
[1 О . . . OJ Vm [1 0. .. or
имеет предел при т —> оо, то ?’ц — элемент матрицы —
имеет предел. Аналогичное утверждение очевидно спра-
ведливо для любого гл-го элемента этой матрицы. Значит
все диагональные элементы имеют предел. Пусть теперь
Хо имеет все элементы нулевые, а г-ю и j-ю компонен-
ты — равными единице, тогда
т Т7 tn I т о
^0 ~ ”1“
т т
так как и имеют предел при т —оо, то существует
предел и для при всех i, j. Таким образом, все элементы
матрицы Fm при m —оо имеют предел. Значит, существу-
ет lim Vm = Feo.
Поскольку все матрицы построенной последовательно-
сти {Fm} при любом т = 1, 2, ... удовлетворяют линей-
ному алгебраическому уравнению
М — BB'Vm_i] Г m -|- Fm ]А — BB'Vm i] -г
+ б С -J- Ут^BB'V т_1 = о,
предельная матрица F«, удовлетворяет уравнению (АР).
Действительно, переходя к пределу при т оо и замечая,
§ 35] СТАЦИОНАРНЫЕ СИСТЕМЫ 393
что F^ = Foe, имеем
[Л - ВВГооГ F« + FTC [Л - + С'С + FLB^Foo -
= ЛТоо + Foo Л + С'С — V^BB'V^ - 0. О
Сформулируем отдельно одно важное утверждение, а
доказанное нами при доказательстве теоремы.
Следствие. Если Foe — положительно определен-
ное решение уравнения (АР) в условиях теоремы 1, то все
решения системы х (/) = [Л — BB'V^Jx (i) стремятся
к нулю при t —оо и интеграл
J = f
S а
является сходящимся. 0 >
Таким образом, замкнутая система с обратной связью и
и (£) = — B'VaoX^t}, где Foo является решением уравнения
(АР), будет асимптотически устойчивой системой.
Явный вид решения стационарного уравнения Рикка-
ти. Аналогично тому, как решение стационарных матрич-
ных уравнений § 12 может быть выражено через матрич-
ные экспоненты в том случае, когда существует решение
Соответствующего алгебраического уравнения Ляпунова,
решение стационарного уравнения Риккати
F (I) = — A'V (0 ~ F (0Л 4- F (t)BB'V (i), F (0) = Fo
(УР)
можно записать в замкнутой форме в том случае, если из-
вестно решение алгебраического уравнения (АР). Обозна- i
чим решение (АР) через F» и сделаем в уравнении (УР)
следующую замену переменной: Т (t) ~ V (t) — FTC. Тогда
Т (г) = - [л' - v^BB'Wit) - т (0(4 - +
+ V (t)BB'^(t). (4)
Уравнение по-прежнему является нелинейным, но если
его справа и слева домножить на матрицу Т'1 (t), то оно
становится линейным относительно Т"-1 (if)**
= [Л — BB'V^] (Г) +Т-1 (O+'F"1 (t)[A'~VeoBB'l-.BB'.
14 Ю. Н. Андреев
394
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Мы воспользовались равенством
£ Т’1 (t) = — 'Г'1 (Г) Ч* (0 Т-1 (0.
Линейные матричные уравнения вида (4) были рассмотре-
ны в § 12. Имея в виду следствие теоремы 1, согласно кото-
рому [Л — — устойчивая матрица, существует
и единственна положительно определенная матрица
которая удовлетворяет матричному уравнению Ляпунова
[Л - BB'V^ + Qt [А' — BB'VeJ - BB' = О,
и одновременно |
(?х = - J BB'e<A-BB’v°°]t dt. :
о <
Решение уравнения (4) с использованием матрицы QT за-
пишется в виде (см. § 12) 1
~ Qi + e[A~BB'v°°]t [vF-1(O)-Q1]etA-BB'Va’1'i. !
Используя эту формулу, получим: решение уравнения
Риккати (УР) в явном виде ’
У(*,Уо,О) =
= 7» + {(? + [(¥„ - Т.)’1 - <?,] eEA'-v«B'®)'}-i.
Единственность оптимального управления. Приведем {
теперь один результат относительно единственности реше-
ния алгебраического уравнения Риккати (АР).
Теорема 2. Если система {А, В, С} управляема
и идентифицируема, то существует единственное реше-
ние уравнения VA + A'V — VBB'V 4- С'С = 0, которое
обладает тем свойством, что матрица [А — BB'V] ус-
тойчива.
Д о к а з а т е л ь с т в о. Предположим противное. к
Пусть имеется две симметрических матрицы Vi и V2, кото- Л
рые являются такими решениями приведенного в условии
теоремы уравнения, что обе матрицы [А — BB'Vil, i = 1
= 1,2, имеют свои собственные значения слева от мнимой
оси. Тогда все решения систем х (0 = [А — BB'Vtlx (0, 1
i = 1, 2, стремятся к нулю при t-+ со. Более того, как
S 35]
СТАЦИОНАРНЫЕ СИСТЕМЫ
395
мы видели при доказательстве теоремы 2 § 34,
t
{и' (о) и (б) 4- х' (о) С'Сх (б)} йб =
о
t
= х' (0) VjX (0) —• х' (t) Ftx (t) 4- Ju и (Г) 4- B'Vtx=
6
t
= x' (0) F2x (0) — x' (7) V2x (t) 4- Iu (0 4- B'V2x (£) ||a dt’,
о
поскольку по предположению Fj F2 и обе матрицы сим-
метрические, то существует х0 такой, что XqFjXq x0F3x0.
Пусть, например, XqFjXq х0У2х0. Тогда примем u (t) =
= — B'V2x (f). Устремляя t к оо, имеем
ос
х^2х0 = х^хо 4- j || В' (Vi — F8) x (£) l|2 dt,
о
что очевидно невозможно. Мы пришли к противоречию,
предположив, что 1/1 =$= F3 и [Л — BB'V]] и [Л — BB'V2]
устойчивы. 0
Стационарные регуляторы. Применяя теоремы 1, 2,
можно анализировать еще один специальный случай.
Именно, случай минимизации квадратичных функциона-
лов для линейных стационарных систем на интервале
0 t оо. Эта задача имеет особый интерес из-за срав-
нительно простой формы представления ответа. Следующая
теорема содержит основные результаты.
Теорема 3. Пусть стационарная система {Л, В,
С] управляема и идентифицируема. Пусть, далее, F«, —
положительно определенное решение уравнения
A’V + VA - VBB'V = - С'С.
Тогда существует управление, которое минимизирует
СЮ
J = J (и' (£) и (t) 4- х' (i) С'Сх (£)} dt
для системы, х (t) = Лх (t) 4~ (0> х (0) = хо> причем
минимальное значение J равно x0FTCx0. Минимизирующее
14*
396
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
управление в виде обратной связи имеет вид
и (О =
а в разомкнутой форме — вид
и(0 = -^Т^А-вв'у“]\
Доказательство. Сначала заметим, что если
Ц х (i) || приближается к нулю при то интеграл
СЮ
J = j {u' (t) и (£) 4- х' (i) С'Сх (t)} dt
о
сходится. Это является немедленным следствием предпо-
ложения об управляемости, из которого с учетом теоремы
1 § 33 следует
t+i
min f {«'(t) u (t) 4- x'(0 C'Cx(t)}dt > x'(£) V (0, Q,t) x(t) >
u i
>e||x(0||.
Сделаем замену переменной
v (Г) = u (i) 4- B’V^x (Г),
называемую иногда преобразованием Риккати, Уравнения
движения примут вид
х (t) — [Л — ВВ'УоДх ($) 4~ (0,
и J становится равным
ос
J = J {[v(i) — В'УаДфГ [v (0 — ВТеоХ (Г)! 4-
0
4- х'(0 С(7'х (0} dt.
Преобразуя подынтегральное выражение с использовани-
ем равенства
4- ЛТ», — V^BB'Vk = - С’С,
получим
сю
J = j {v' (0 v (0 — [М — х (0 + (0Г (0 —
о
— х' (0 Foo [(^ — BB’V^} X (0 4- By (0J} dt =
ОС сю
= f v' (0 v (0 dt — x' (0 7«>x (0
о 0
$ 35]
СТАЦИОНАРНЫЕ системы
397
Из следствия теоремы 1 известно, что все решения
х (0 = [Л - БВ'Иоок (£)
стремятся к нулю при t сю. Поэтому лучший выбор
v (Z) есть 0.Q
Структурная схема стационарного оптимального регу-
лятора приведена на рис. 3.5.1.
Рис. 35.1.
Пример. Рассмотрим минимизацию
т '
J = [ 4-
о
для £ (I) = и (t). Уравнение Риккати в этом случае имеет
вид
и (I) = г>2 (£) — 1.
Можно, конечно, прямо решить зто уравнение, но цель
состоит в иллюстрации полученных выше результатов,
и поэтому мы будем следовать всем этапам предыдущих
рассуждений. Имеется положительно определенное реше-
ние уравнения v2 — 1 = 0, v ~ 1 (есть и решение v = —1,
которое не представляет для нас интереса). Пусть Т =
= v —- 1,тогда
ф-(0 - >Г2 (i) +2^(0;
поделив на VF2 и полагая Ч'1 = ср, получим
<р (£) == - - [2ф (t) -4-1].
398
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Значит, ф (£) = ае 2f — ~ и
!>(£)' = Y (О'+ 1 =
1 _ 2ае~2( 4-1
, 1 “ 2ае-«*—1 ’
2
Если х (0) фиксировано, а х (Т) свободно, то минимизиру-
ющее и (£) равно — v где а в определении v (/)
выбирается так, чтобы выполнить условие г? (У) =0. Ми-
нимальное значение интеграла в этомг случае равно
т2(0)г?(0) и
1 _ e2(t-T)
= = th (7-0.
Заметим, что г? (0 —1 при [I — Т) 0. Q
Замечание. Результат, аналогичный теореме 3,
может быть получен для квадратичного функционала вида
СЮ
J = J {и' (<) 7?и (t)' х' (£) Lx (£)} dt,
о
где L = U симметрическая неотрицательно определенная
матрица, a R — положительно определенная матрица.
Задачи. 1. Пусть система {/I, В, С} управляема и наблюдае-
ма. Пусть 7^ — симметрическое положительно определенное реше-
ние уравнения A'V -|~ VA — VBB'V 4- С'С = 0. Покажите,
что V (tlf Q, 0) приближается к 7^ при — оо для всех Q =
= Q'>^
2. Пусть 7^ является решением A'V VA — VBB'V 4~ М =
= 0 таким, что матрица [Л — BB'V^ устойчива. Предположим,
что N определена условием
= J ^A-BB'V^fjjjj^A-BB'V*,!'^
о
и обратима. Тогда покажите, что 7^ = АГ-1 является также реше-
нием уравнения
A'V 4- VA — VBB'V 4- М = 0.
и что матрица [А — BB’V^ 4~ 55'2V-1J устойчива.
3. Получите с помощью теоремы 1 доказательство утвержде-
ния: всякая положительно определенная матрица имеет един-
ственный симметрический положительна определенный квадратный
корень.
СТАЦИОЙАРЙЫЕ СИСТЕМА
399
§ 361
4. Пусть является положительно определенным решением
квадратного матричного уравнения
А' V + VA — VBB'V 4- С С = 0;
если А = А' и В — С', то покажите, что тоже удовлетворяет
этому уравнению. Если система {А, В, С} управляема и наблюдае-
ма, то могут ли существовать другие положительно определенные
решения?
5. Найдите аир такие, что для уравнения
я (i) + а 4- ря (0 = 0
интеграл
00
J == {г2 (t) 4- [ал (i) 4- ря dt
&
имеет минимум. Покажите, что ответ не зависит от £ (0) ня (0).
Объясните, почему?
6. Покажите, что закон управления в виде обратной связи
для стационарной системы
х (t) = Лх (t) 4“ Ви (i), y'(i) = Сх (i)
и критерия качества
h
J = {u' (f) и (i) 4- х' (i) С'Сх (t)} dt + х' (ti) Qx ((i)
о
имеет форму и (t) = Кх (t), где К — постоянная матрица, в том
случае, если Q удовлетворяет уравнению
QA 4- A'Q — QBB'Q 4~ С'С - О
и является положительно определенной матрицей.
7. Пусть {Л, В, С} стационарная управляемая н наблюдае-
мая система. Найдите и (2) такое, что для
х (t) = Лх (i) 4- Ви (t), у (i) = Сх ($), с' = [1 0]
интеграл
Ср со
J ~ и' (t) и (t) dt 4- у' (t) у (t) dt
о 1
имеет минимум.
8. Для системы
и критерия качества
со
J =Д е3/ (и2 (£) 4- (£)) dt
о
400
КВАДРАТИЧНЫЙ КРИТЕРИИ КАЧЕСТВА
[ГЛ. VII
покажите, чю вещественные части собственных чисел замкнутой
оптимальной системы удовлетворяют условию Ro X; — 1.
СЮ
9. Пусть i (i) — ах (£) + u J ~ (и2 (i) -j- fk2 (£)} dt, где
о
a, 0 — положительные постоянные. Вычислите оптимальный закон
управления, решив соответствующее уравнение Риккати. Будет ли
полученная замкнутая система асимптотически устойчива?
10. Вычислите оптимальное управление для системы
го л . m Г •
л==[о ог ь=[1]’ dt-
о
У казание. Введите дополнительную переменную состоя-
ния х3 = и (t) и рассмотрите полученную систему 3-го порядка.
11. Покажите, что решение алгебраического уравнения Рик-
кати в условиях теоремы 1 является функцией Ляпунова.
§ 36. О решении уравнения Риккати
В §§ 33—35 были получены условия, при которых су-
ществует решение задачи оптимального управления с квад-
ратичным критерием качества. Эти условия были получе-
ны вместе с формулами для минимизирующего управления
и для оптимальной траектории. Все эти конструкции за-
висели от возможности решить матричное уравнение Рик-
кати при определенных граничных условиях, заданных
в некоторый момент времени. Здесь мы исследуем уравне-
ние Риккати само по себе. Покажем связь уравнения Рик-
кати с линейной системой сопряженных уравнений, имен-
но, установим, как связано уравнение Риккати с системой
канонических уравнений Гамильтона.
Локальные условия существования решения уравне-
ния Риккати. Начнем с установления важного, и, вообще
говоря, удивительного факта, состоящего в том, что ре-
шение уравнения Риккати может быть сведено к решению
соответствующей системы линейных дифференциальных
уравнений. Сначала заметим, что скалярное уравнение
Риккати может быть приведено к линейному уравнению
2-го порядка (или к системе двух линейных уравнений
1-го порядка) простым преобразованием переменных.
Рассмотрим линейное дифференциальное уравнение
2-го порядка
* (*) + Р (*)* (0 + У (£) = 0.
§ 36]
О РЕШЕНИИ УРАВНЕНИЯ РИККАТИ
401
Примем к (0 = х (0 / х ( f), тогда
и, значит,
к (0 + *!(0 + ₽ (Ок (0 = - V (0.
Подобное преобразование можно привести и в нескалярном
случае. Начнем, однако, не с векторного уравнения 2-го
порядка, а с пары линейных векторных уравнений <-го
порядка.
Лемма. Пусть Ф является переходной матрицей для
системы 2п линейных дифференциальных уравнений
Гх(01 Г л (О -В (О В'(t)-i Гх (О’]
LpWJ L- L(0 - Л (t)J [р (t)J *
Рассмотрим разбиение матрицы Ф на блоки размером
(п X п)
Ф — Г®11 ®1з1
[Фз1 Фаа_|
Если определить матрицу К в виде
К (0 Q, tj) = [Ф2з(0> 0 @Ф12 (0, 01 11^Фц (0» 0
— Фи (0» Н
или, эквивалентно этому представлению, в виде
К (0 Q, 0) = [Ф21 (0 0) + Ф23 (0 0)<?][ФИ (0 0) +
+Ф12 («, «!)<?]-*,
то, очевидно, К (0, (0 0) = Q и
Q, «1) = - A'(f)K(t, Q, ti)-K(t, Q, t,) A (0 +
+ К ((, Q, (0 В (0 В' (t) К (t, Q, t,) — L (i)
в том случае, если указанное обращение существует.
Доказательство. Докажем лемму только для
первого из указанных представлений матрицы К (0 Q, 0).
Сначала вспомним равенства, доказанные ранее (см. § 10):
-^-Фв(0, 0 = -Фв («1,05(0,
Ар'>(0=-Р'«(05(0Р-’(0.
Используя эти два факта, проверим, что матрица K(t,Q, 0)
402
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
в том виде, как оиа приведена в условии теоремы, удов-
летворяет уравнению Риккати. Граничные условия оче-
видно выполнены, поскольку Ф = Е. Займемся
алгебраическими выкладками. Определим матрицы X (i)
и Р (/) следующим равенством:
В соответствии с утверждением леммы К (t, Q, =
=> Р~] (t)X (t) и отсюда
4 K(t,Q, t,) = - P-* (0 P (0 P-* (OX (0 + r1 (0 * (0-
Используя свойства Ф, имеем
[Х(0, - Р(01 = [Х(0, Р(')] '°] ’
отсюда
4 X (<,<?, 0) = Р-* (0 X (0 В' (0 Р-1 (0 X (0 -
- р-* (0 Р (0 А' (0 Р"1 (0 Р'1 (0 X (0 -
-р-'(0Х (z)A (0 - p-‘(0P (t) =
= К (/, Q, tt)B (t)B'(t)K (t, Q, - A' (t)K (t, (?,
- К (z, Q, tJA (0 - L (0. О
Естественно, что матрица [Ф23 (^, t) — @Ф]2 (^, 0],
которая появляется в приведенном выше выражении для
К, не обязательно обратима при всех t. Поэтому из лем-
мы, конечно, ие следует существование решения уравне-
ния Риккати для всех моментов времени. Однако Ф22(гг,
tj) — Е и Ф12 £0 = 0 являются непрерывными функ-
циями времени. Так как Е обратима, то понятно, что
[Ф22 (£ь t) — ()Ф12 (*i> 0] тоже обратима для тех t, при
которых величина t — достаточно мала в сравнении с
Q. Поэтому для моментов времени, близких к начальному,
мы имеем следующую локальную теорему существования
решения уравнения Риккати.
Теорема 1 (локальная теорема существования
решения уравнения Риккати). Пусть матрицы А, В и
L ограничены на интервале 11 — | Т, а Ко — заданная
постоянная матрица. Тогда существует е 0 такое,
6 SB]
О РЕШЕНИИ УРАВНЕНИЯ РИККАТИ
403
что для 11 — £0 | < е единственное решение уравнения
Риккати существует на интервале 11 — tQ | < £.
Доказательство. Существование следует из
предыдущей леммы, если принять KQ = Q. Единствен-
ность следует из того факта, что в любом ограниченном
подмножестве КпХта Правая часть уравнения Риккати удов-
летворяет условию Липшица, и значит, применима теоре-
ма единственности решения дифференциального уравне-
ния. 0
Пример. Рассмотрим уравнение Риккати
k (t) = №(t) + 1.
Связанная с ним система линейных уравнений является
гармоническим осциллятором:
P(t)1 го -11Гх(«)-|
Lp (t)J |i °JLp(oJ
Решение, соответствующее x (0) = 1, p (0) = й0, имеет
вид
[х (01 _ ГС031
Р (OJ ~ Lsin I
поэтому
Канонические уравнения. Линейная система 2п урав-
нений имеет каноническую форму, если существует скаляр-
ная функция Н, называемая гамильтонианом, такая, что
Н зависит от х, р и t:
Очевидно, что квадратичные гамильтонианы приводят к
линейным уравнениям. Для пары уравнений, приведен-
ных выше, соответствующий им гамильтониан имеет вид
н (х, р, о=4"х мL х +р А ю х (о——в <*>•
Эти понятия играют центральную роль в классическом
вариационном исчислении и в теории принципа максимума
Понтрягина.
404
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Следующая теорема, приведенная без доказательства,
проясняет одну из причин этого обстоятельства.
Теорема 2. Пусть х (i) ви (() оптимальны в смысле
теоремы 1 § 33 или теоремы 2 § 34. Тогда существует
п-вектор р (£) такой, что х (() и р (f) удовлетворяют системе
2п канонических уравнений
Г 1 _ Г Л (0 - В (0 В1 (/)! Гх (t) 1 Гх (to)l _ Гхо 1
Lpm I—Mt) - A'(t) J [р (0 J » LP (MJ LPoJ *
причем оптимальное управление имеет вид
U (t) = - В' (t)p (t). 0
В классическом вариационном исчислении условия су-
ществования минимума формулируют в терминах отсут-
ствия сопряженных точек и фокальных точек для траекто-
рии канонической системы. Напомним, что две точки в мо-
менты времени i0 и называются сопряженными точками,
если можно найти нетривиальное решение канонических
уравнений такое, что х (f0) = х (^) = 0. Две точки назы-
ваются фокальными, если можно найти нетривиальное
решение канонических уравнений такое, что х (£0) =
= Р (^i) = 0- Существование минимума и отсутствие со-
пряженных и фокальных точек связано между собой сле-
дующим образом.
Из теоремы 1 § 33 известно, что задача со свободным
конечным состоянием без ограничений имеет решение,
если соответствующее уравнение Риккати имеет решение
К ^i)j которое существует в интервале t
Можно доказать, что это справедливо тогда и только тогда,
когда на отрезке t± нет фокальных точек, т. е. что
условие отсутствия фокальных точек на рассматриваемом
интервале времени является необходимым и достаточным
условием существования решения уравнения Риккати.
Для задачи с фиксированным конечным состоянием
достаточным условием существования минимума является
условие существования матрицы К (t, Къ £х) для некоторой
симметрической матрицы Kv Вопрос о точном выборе
оставлен открытым.
Можно показать, что выбор такой матрицы начальных
условий Кц которая обеспечивает существование реше-
ния на t возможен тогда и только тогда, когда
интервал £0 t не содержит сопряженных точек.
§ 36]
О РЕШЕНИИ УРАВНЕНИЯ РИККАТИ
405
Пример.
Рассмотрим задачу минимизации
т
J {и.3 (() х2 (Q) dt,
о
где х (() — и (() и х (0) — 0. Канонические уравнения
для этой задачи
МОТ р -I'lptO'l
.moj b w) J ’
их решение имеет вид
х (i) = A sin t + В cos t, p (t) = — x (t).
Рассмотрим задачу с фиксированным конечным состоя-
нием. Видно, что интервал 0 t л не содержит сопря-
женных точек, поэтому при ?' < а и при граничных усло-
виях ж (0) = х (Г) - 0
т
min \ {ж2 (i) 4- хъ (£)} dt = 0.
и 5
Если теперь рассмотреть задачу со свободным конечным
состоянием, то х (£) = sin t и х (0) = р = 0- Значит,
точки ж (0) ит(у) являются фокальными точками. Интер-
вал же, свободный от фокальных точек, есть 0 t <Z -%- .
До сих пор не рассматривалось влияние на существова-
ние решения той части критерия качества, которая
отражает стоимость конечного состояния и имеет вид
x'(Zi)(?x (£2).
Один из наиболее легких качественных результатов
дает следующая теорема.
Теорема 3. Если — Q2 неотрицательно опре-
делена t то для всех t <Z К разность К (t, — К (t,
Q2, (i) неотрицательно определена, если обе матрицы К су-
ществуют. Поэтому, если решение, проходящее через (?а,
существует на интервале tQ t то по меньшей мере
на том же интервале существует решение, проходящее
через Qr.
Доказательство. Утверждение теоремы яв-
ляется прямым следствием теоремы 1 § 34, которая утвер-
406
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ- VII
ж дает, что величина х'(0)2Г (t0, <21? 0х (0) является мини-
мумом J. Ясно, что возрастающая «цена» конечного состоя-
ния системы увеличивает общую стоимость. 0
Существование решении на полубесконечном интер-
вале. Теперь займемся вопросом существования решения
уравнения Риккати на всей полуоси. Как видно из послед-
него простого примера, нужны нетривиальные предполо-
жения, чтобы К (t) не обратилось в бесконечность при
конечном значении t. Чтобы исследовать этот вопрос, пред-
положим, что L (t) в дополнение к тому, что она — сим-
метрическая, является еще неотрицательно определенной.
Также будем предполагать управляемость системы.
Теорема 4. Предположим, что грамиан управляе-
мости для системы х (t) = A (t)x (t) В (t)vL (£) — поло-
жительно определенная матрица и L (t) = L'(t) — не-
отрицательно определенная матрица при всех t. Если
К (t, О, Z2) является таким решением уравнения (УР), ко-
торое проходит через 0 при t = tY, тогда при данном t^
К (t, 0, tx) существует на t() t <:: tx независимо от t0.
Более того,
К (to, К) К (to^ ^2) для tp tx ^2 (1)
и
0 К (to, 0, t2) Лг (t0, tx) для t0 tx tg,
где
ц
N (to, К) = [И7 (t0, К)]"1 + j Xi (с) L (о) Xi (о) ds,
to
Xt(<3) =
<т
= |ф (б, to) — Jd> (б, р) В (р) В'(р) Ф' (to, р) dp [РУ (to, Ч)Г1} Хо,
а Ф — переходная матрица для х (t) = A (t)x (t).
Доказательство. Из теоремы о локальном
существовании решения уравнения Риккати мы знаем,
что если t — tr — достаточно малое число, то К (t, Q, tr)
существует, а из теоремы 1 § 33 имеем
х' (t) К (t, 0, tj)x(t) = min f {u'(t)u(t) + x'(t)L(t)x(t))dt.
§ 36]
О РЕШЕНИИ УРАВНЕНИЯ РИККАТИ
407
Используя теперь неравенство L (t) 0, имеем в силу
существования К (t, 0, tT), что
К (t, 0, tj > 0.
Более того, если К (t, 0, t*) и К (t, 0, t2) существуют при
t0 < t tx и to t < t2 соответственно, то при х (t0) =
= *о и t2 > ti
fi
xi# (t0, 0, (г) х0 = min f {u' (t) u (t) -f- x' (t) L (t) x (t)} dt <;
U to
is
min i* {u' (t) u (t) x' (t) L (t) x (t)} dt = (t0, 0, t2) x0.
u t.
Поскольку это условие выполнено для любых х0, оио экви-
валентно неравенству (1), устанавливающему монотонное
поведение К (t). Остается показать, что К (t) существует
на интервале t0 t для всех tv
Так как единственная причина, по которой матрица
К (t) могла бы не существовать, состоит в том, что она
обращается в бесконечность при конечном значении t,
можно доказать существование, показав, что матрица К
ограничена. Рассмотрим управление вида
„ /л _ Г - В' И Ф' ((о- 0 Со- № х Со). to < t < ‘к
приложенное к системе в момент t0. Как известно из теоре-
мы 2 § 19, это управление приводит х (t) в нуль в момент
tx, и в силу того, что при t tr управление — нулевое,
нулевое состояние сохраняется для всех t Поэтому
для этого управления и соответствующего ему отклика
Xj (t) выполнено условие
СО
f {u2 (t) Uj (t) + Xj (t) L (t) X! (t)} dt >
i.
> min [ {u' (t) u(t) + x'(t)£(t)x(t)} dt — xr(t0)K(t0, 0, t2)x(t0)
« to
для всех t2 tv Вычисления показывают, что левая
часть этого неравенства равна х' (t0)JV (t0, tx)x (t0). По-
скольку матрица # (t0, tj, очевидно, конечна при всех t0,
408 КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА [ГЛ. VII
мы видим, что К ((, 0, ij) существует на любом интервале ।
h < t < tr.
Численное интегрирование уравнения Риккати на ко- |
печном временном интервале. Из леммы следует, что реше- |
ние уравнения Риккати для стационарной системы {Л, |
Z?, С} с критерием оптимальности
к
J = f {у' (0 У (0 + и' (0 и (0} dt I
о
4
представимо в виде |
к (t) = {Ф31(о, t) 4- ф22(о, t)K (0)}{фп(0, о + ;
+ Ф13(0, г)Х(())Г, (2) I
где l
К (0) = — Фй1 (0UJ Ф21(0, 4), (3) I
Щ_[Фн(0, t) Ф12(0ч Z)-| Г) — Г A —
e L®ai(O, 0 Фи(0, oJ’ L— E — A' J*
Поэтому матрицу К (t) можно вычислить, если вычислить
значение eDt. Используем для вычисления этой матричной
экспоненты алгоритм § 13. Такой подход предложен в ра-
боте [61). Тогда
exp (Dh) = А 4- О (h5), где
л={г-4о+й-°Т1{г+-го+^№}
и О (къ) означает ошибку аппроксимации ряда для экспо-
ненты, имеющую порядок А5.
Если матрица Л вычислена, то требуется к матричных
умножений для вычисления exp (Dt) в точках A, 2h, 4/ц
8А, . . 2АЛ. Причем, очевидно, exp (2hD) = Л*Л =
= Л3, ехр (23АГ>) = Л3Л2 = V , . . exp (2*AD) =
= д2*-1дяК-1 да*, где к __ целое число, выбираемое
так, чтобы шаг интегрирования h = ^/2* был достаточно
малым, чтобы обеспечить малую ошибку аппроксимации
О (А5).
После вычисления матрицы exp (Dt) при 0 t
значение К (0) вычисляется по формуле (3), а значение
К (t) — по формуле (2).
Этот алгоритм обеспечивает высокую скорость сходи-
мости вычислений. Однако он плохо работает ири
>
§ 36]
О РЕШЕНИИ УРАВНЕНИЯ РИККАТЯ
409
поскольку в этом случае столбцы матрицы Фа2(0, *)
становятся линейно зависимыми и матрица К (0) не опре-
делена.
Общее время вычислений, требуемое для расчета К (£),
приблизительно равно (25 + 12 А:)ц/г’, где ц — время опе-
рации умножения, к обычно варьируется в пределах 5—
20. Приблизительно общего времени зани-
мают вычисления обратных матриц [61].
Итерационное решение алгебраического уравнения
Риккати. Рассмотрим алгоритм решения уравнения
A'V -F VA - VBB'V 4 С'С = 0, (АР)
основанный на итерационной процедуре, построенной при
доказательстве теоремы 1 § 35. Он состоит из следующих
шагов-
1. Кт = B'Vm-ir
2. Лт/1 — А — ВК;п.
3. Вычисляем Vm как решение линейного матричного
уравнения
AmV Ц- VАт Ц- С'С 4- КтКт ~~ 0.
4. Проверяем условия окончания вычислений
Вычисления 1—4 осуществляем при т = 1, 2, . .
Чтобы начать вычисления, необходимо подобрать К() та-
ким образом, чтобы матрица [А — ВК$] была устойчивой
Сделаем в связи с этим алгоритмом ряд замечаний.
1. Построенная процедура подобна методу Ньютона
решения нелинейного уравнения / (х) = 0. Она имеет про-
стую геометрическую интерпретацию в скалярном случае.
Тогда уравнение (АР) является простым квадратным урав-
нением. Решение этого уравнения методом Ньютона стро-
ится по формуле
Илнг =
TZ 2AVm-B^m + C^
m (24-2WJ
и.ч которой следует
(2A - 2ВЦ’т) V„n + 4- C2 = 0.
410
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
Это уравнение совпадает с линейным уравнением
(Л — BB'Vm) Vm+I -f- Vm+1 (А — Bf>'Vm) 4“ CC' Ц-
+ VmBB’Vm = 0,
решаемом на каждом шаге итерационного процесса. Гео-
метрическая интерпретация итерационного решения урав-
нения (АР) в скалярном случае дана на рис. 36.1.
2. Известно, что метод Ньютона обеспечивает квадра-
тичную сходимость вблизи точки решения. Это свойство
сохраняется и в матричном случае. Можно показать [66],
что в условиях приведенного алгоритма
И™-Foo II2 3,
где а — положительное число.
3. Для выбора начального значения Ао можно исполь-
зовать алгоритм построения устойчивого регулятора по
состоянию, приведенный в § 23. Решение линейного мат-
ричного уравнения Ляпунова можно реализовать с по-
мощью процедуры, приведенной в § 16.
Задачи. 1. Найти управление, которое приводит систему
•h (01 Г 0 *1 (01 Г 0 1
M0jL-1 0jL®3(OJ + I 1 Jw(0
§ 361 О решении уравнений РИККАТИ
411
из жх = 2, х2 = О при t = 0 на круг х® + ж® = 1 при t = 1 и мини-
мизирует
1
^=${«40+4^)}dt-
о
2. Доказать теорему 2.
3. Вычислить таиой линейный закон управления для системы
Г—1
О О'
-1 1 ,
1 -1
С=Е.
который минимизирует критерий качества
1
j=Ji (»! (о+(*)+(о + к'2 (z))dt-
о
Составить программу для ЦВМ, используя алгоритм, приведенный
в теисте.
4. Пользуясь итерационной процедурой решения алгебраиче-
J = [5ж® + 3^ -j- 2ж| + »| + Юн2] dt.
о
Составить программу для ЦВМ.
5. Показать, что для системы
ГО 11 Г О'!
л = [о о]- Ь=[1Р с'^11 -И
с критерием качества
оа
J = j [4«(O4-a?J(O] dt
о
оптимальный закон управления имеет вид
й (!) = — ял (t) — 2жа (i) — 2u (i).
412
КВАДРАТИЧНЫЙ КРИТЕРИЙ КАЧЕСТВА
[ГЛ. VII
6. Решить дифференциальное уравнение Риккати
[О О 1 ГО 11 „
rw-iml, rsj'L -rd*"’-
Г 1 1 , Г О СП
~7Г(О|о][1 0И(0 + [о ЯГ(О) = О,
используя решение соответствующего уравнения 4-го порядка (см.
лемму).
7. Получить результаты теорем 1, 2, 3, 4 для квадратичного
критерия вида
оо
J = ]х' (i) СТСх (f) + u' (t) ffu (ОI dt,
о
где L и R — положительно определенные матрицы.
8. (Shubert Н. А.). Показать, что матрица К = £>-1 +
+ L], где матрицы D и L определены соотношениями
D’D = BR-'B', L'L = Q + A' (D'D^A,
является единственным положительно определенным решением ал
гебраического уравнения Риккати
Q + А'К + КА' — KBR-'B'K = О
в том случае, если R — положительно определенная симметри-
ческая матрица, а матрица В — неособенная.
9. Пользуясь результатом задачи 8, вычислять оптимальную
обратную связь для системы (/) = и1 (t), .т2 (f) = (£) -j- и2 (i)
при следующем критерии качества:
СО
J = 5 1Ж2 (0 + “1 (0 + И2 (0] df.
()
ПОСЛЕСЛОВИЕ
Многие важные обстоятельства, сопутствующие про-
цессу инженерного проектирования систем управления
линейными объектами, не были учтены в изложенном вы-
ше подходе, основанном на методах пространства состоя-
ний. При использовании этой теории для решения прак-
тических задач читателю необходимо иметь в виду, что
принятые выше допущения о стационарности и линейно-
сти (а не только линеаризуемости) объекта и законов упра-
вления, о точном задании всех параметров системы, об от-
сутствии ограничений на управляющие воздействия и
фазовые переменные, о бесконечной полосе пропускания
усилителей в цепи обратной связи и т. п. редко выполня-
ются на практике одновременно.
Кроме того, в рассмотренных формулировках задач
модального и оптимального управления явно не фигури-
ровали требования к важнейшим характеристикам пере-
ходного процесса: время регулирования, колебательность,
монотонность и др. Вместе с тем известно, что подчас сов-
сем не просто выбрать характеристические числа замкну-
той системы или коэффициенты в квадратичном критерии
качества так, чтобы переходный процесс удовлетворял бы
нужным техническим условиям. Далее, существенное влия-
ние на переходный процесс оказывают нули передаточной
функции, а алгоритмы эффективного управления нулями
с помощью линейных обратных связей здесь не рас-
сматривались. Наконец, поскольку при изготовлении лю-
бой системы ее параметры удается реализовать лишь с ко-
нечной точностью, то совершенно необходимо исследовать
чувствительность получаемых структур по отношению
к колебаниям (причем не обязательно малым) коэффициен-
тов в цепях обратных связей и в уравнениях объекта. От-
сутствие исследования вопросов чувствительности в тек-
сте этой работы вовсе не означает, что таких исследований
414
Послесловий
не ведется в рамках упомянутых методов. Работы, посвя-
щенные этой проблеме, многочисленны и их поток непреры-
вно растет. Тем не менее, безусловно, в этой области оста-
лось еще много нерешенных проблем. С вопросами чув-
ствительности тесно связаны вычислительные трудности,
которые могут возникнуть при решении систем линейных
алгебраических уравнений, используемых для вычисле-
ния коэффициентов регуляторов. Эти трудности особенно
часто проявляются при большой размерности задачи или
при ее плохой вычислительной обусловленности.
Все перечисленные трудности применения алгебраи-
ческого подхода к синтезу систем дают почву для ожив-
ленной полемики в литературе по управлению относи-
тельно теоретической ценности и практической целесооб-
разности использования методов пространства состояний,
примерно в том плане, как они были изложены выше.
Крайняя точка зрения утверждает *), что мето-
ды пространства состояний являются «крайне наивными
и несовершенными в практическом смысле», что «хотя все
зти задачи и интересны с математической точки зрения,
но оии либо несущественны с инженерной точки зрения
конструирования систем с обратной связью, либо форма-
лизм пространства состояний значительно усложняет про-
блему, в то время как много более прозрачные результаты
получены с помощью передаточных функций».
Безусловно, трудно представить теорию управления
без передаточных функций и частотных методов, которые
имеют ясный физический смысл, многократно апробирова-
ны и хорошо зарекомендовали себя при решении различ-
ных проблем конструирования реальных систем управле-
ния. Но нельзя согласиться и с точкой зрения вышеупомя-
нутых авторов на роль методов пространства состояний.
Начатый Р. Калманом и другими исследователями
процесс алгебраизации теории управления имеет большое
методическое значение. Так, например, используя теорию
модулей над кольцом многочленов, удалось с единых по-
зиций изложить частотные и временные методы, не прибе-
гая к преобразованию Лапласа, ввести более общее опре-
деление передаточной функции, построить единую теорию
*) Horowitz I., Shaked U., IEEE. Trans. Autom,
Contr., 1975, v. AG — 20, N 1, 84—97.
ПОСЛЕСЛОВИЕ
415
реализации дискретных и непрерывных линейных систем,
как стационарных так и нестационарных [24]. Имеются
попытки построения еще более общей теории *), исполь-
зующей аппарат теории категорий и позволяющей с еди-
ной точки зрения и на едином математическом языке из-
лагать проблемы управления конечномерными и распре-
деленными объектами как линейными, так и нелинейными.
Большое практическое значение изложенной выше тео-
рии состоит в том, что с ее помощью удается исчерпываю-
щим образом описать решение задачи синтеза системы
управления (в отдельных практически важных частных
случаях), причем сама структура системы получается в ре-
зультате решения строго сформулированной задачи без
каких-либо дополнительных допущений или упрощений
интуитивного порядка. Кроме того, и это может быть са-
мый интересный факт, решение задачи синтеза оказывает-
ся подчас проще, чем решение задачи анализа системы
с произвольно заданной структурой той же сложности,
хотя в классической теории регулирования всегда счита-
лось справедливым обратное положение вещей. Действи-
тельно, в примере синтеза регулятора для объекта 4-го
порядка, приведенном в § 27, чтобы выбрать структуру
и коэффициенты динамической обратной связи, обеспечи-
вающей заданное размещение полюсов замкнутой системы
на комплексной плоскости, необходимо выполнить ряд
умножений матриц, т. е. выполнить вычисления по ко-
нечным алгебраическим формулам, заданным в явном
виде. Для исследования динамики такой системы с произ-
вольно выбранной динамической обратной связью 3-го
порядка необходимо по крайней мере определить или оце-
нить размещение корней полинома 7-го порядка. А это,
как известно, задача, которую нельзя решить с помощью
явных формул. Необходимо использовать приближенные
вычисления, итерационные процедуры и т. п.
Безусловно, такое простое решепие получено за счет
существенной идеализации задачи. Пользуясь терминоло-
гией исследования операций, можно сказать, что в данном
случае существенное расширение множества стратегий
в исследуемой операции (решение задачи регулирования),
•) А г b i b М. А., М anes Е. D., Automatica, 1974, v. 10,
ЭД 3, 285—302.
416
ПОСЛЕСЛОВИЕ
получаемое за счет предположений об идеальной точности
элементов, неограниченности управлений, полос пропус-
кания и фазовых переменных позволят, как это нередко
бывает в подобного рода задачах, *) получить вполне про-
стое решение.
Можно предположить, что подобного рода эффектив-
ные методы решения задач синтеза грубых систем удаст-
ся построить в рамках методов пространства состояний,
так как при алгебраическом подходе представляется
естественным при формулировке задачи синтеза включить
параметры, характеризующие нестабильность, разброс,
неопределенность коэффициентов объекта и регулятора,
в число выбираемых при синтизе параметров.
Построение такой теории синтеза грубых систем
позволит эффективно решать задачи синтеза допусков
на нестабильность отдельных коэффициентов системы
по заданным допускам на нестабильность ее выходных
характеристик.
Добавление при корректуре. При чтении корректуры
этой книги автор познакомился с интересной работой Н, Т. Кузов-
кова «Модальное управление и наблюдающие устройства» «Мапгино-
строепие»-, 1976), н которой наряду с теоретическими результатами
дано решение ряда практических задач конструирования систем
управления летательными аппаратами (автопилотов, гнростабнли-
заторов, орбитальных гироскопов и. т.п.). В частности, приведен-
ный на стр. 99-114 пример синтеза гиростабилизатора служит
убедительной иллюстрацией того положения, что использование
наблюдающих устройств (идентификаторов состояния) и модального
управления позволяет подчас синтезировать регулятор с более
высокими показателями качества переходного процесса, чем это
достижимо с помощью частотного метода или метода корневого
годографа.
Июнь 1976 г.
*) Г е р м е й е р Ю. Б., Введение в теорию исследования опе-
раций. «Наука», 1971,
УКАЗАНИЯ НА ЛИТЕРАТУРНЫЕ ИСТОЧНИКИ
Глава I. Излагаемые здесь вопросы традиционны и подробно
освещены в фундаментальных трудах [5, 6, 10, 11, 13, 16, 29, 35,
37, 43, 44, 45, 46]. Кроме того, в §§ 7, 8 использован материал работ
[52, 55], в §§ 3, 4 — неопубликованные лекции Б. В. Лидского ло
линейной алгебре, читанные в МФТИ в 1958 году.
Глава II. Основные факты имеются в книгах [22, 27, 30, 38,
40, 47]. Содержание §§ 11, 12 основано на материале книги [52].
§ 13 осиован на работах [18, 45, 56, 57].
Глава III. Основные источники [3, 4, 6, 13, 19, 21, 31, 32, 34,
36, 48, 52, 64, 72].
Глава IV. Основные факты имеются в работах [23, 24, 41, 52,
55, 20, 21]. При изложении канонических представлений много-
мерных объектов мы следуем работе [55]. Другие подходы имеются
в работах [70, 81, 88].
Глава V. Основными источниками являются работы американ-
ских авторов [24, 55, 68, 69, 71].
Глава VI. Модальный подход к конструированию регуляторов
систематически развивается в книгах [24, 55, 80, 81] и в статьях
[51, 53, 59, 60, 62, 74, 76—78, 84—89].
Глава VII. Эта традиционная задача подробно освещена в ра-
ботах [2, 24, 32, 41, 47, 52, 67, 73]. Укажем на статьи, в которых
имеются методы численного решения уравнения Риккати.' [54, 61,
66, 86].
ЛИТЕРАТУРА
1. Айзерман М. А., Теория автоматического регулирования.
Изд-во «Наука», 1966.
2. Атаис М.» Фа л б П., Оптимальное управление. Перев.
с англ., изд-во «Машиностроение», 1968.
3. Барбашин Е. А., Введение в теорию устойчивости. Изд-
во «Наука», 1967.
4. Барбашин Е. А,, функции Ляпунова. Изд-во «Наука»,
1970.
5. Беклемишев Д. В., Курс аналитической геометрии и ли-
нейной алгебры. Изд-во «Наука», 1971.
6. Беллмаи Р., Введение в теорию матриц. Перев. с англ.,
изд-во «Наука», 1969.
7. Болтя некий В. Г., Математические методы оптимального
управления. Изд-во «Наука», 1966.
8. Бутковский А. Г., Теория оптимального управления
системами с распределенными параметрами. Изд-во «Наука»,
1965.
9. Бутковский А. Г., Малый С. А., Андреев Ю. Н.,
Оптимальное управление нагревом металла. Изд-во «Металлур-
гия», 1972.
10. Воеводин В.В., Линейная алгебра. Изд-во «Наука», 1974.
11. Воеводин В. В., Линейные преобразования. Изд-во МГУ,
1971.
12. Г а б а с о в Р., Кириллова Ф., Качественная теория
оптимальных процессов. Изд-во «Наука», 1971.
13. Гаитмахерф. Р., Теория матриц. Изд-во «Наука», 1966.
14. Г а н т м а х е р Ф. Р., Лекции по аналитической механике.
Изд-во «Наука», 1967.
15. Гельфанд И. М., Фомин С. В., Вариационное исчисле-
ние. физматгвз, 1961.
16. Г л а з м а н М. И., Л юбич Ю. И., Конечномерный линей-
ный анализ. Изд-во «Наука», 1969.
17. Годунов С. К., Рябенький В. С., Разностные схемы.
Изд-во «Наука», 1973.
18. Демидович Б. П., Марой И. А., Основы вычислитель-
ной математики. Изд-во «Наука», 1970.
19. Демидович Б.П., Лекции по математической теории ус-
тойчивости. Изд-во «Наука», 1967.
20. 3 а д е Л., Д езоер Ч., Теория линейных систем, Перев.
с англ. Изд-во «Наука», 1970.
21. Зубов В. И., Лекции по теории управления. Изд-во Л ГУ,1972.
ЛИТЕРАТУРА
419
22. Е р у г и и Н. П., Линейные системы обыкновенных дифферен-
циальных уравнений. Физматгиз, 1963.
23. К а л м а н Р., Об обшей теории систем управления. Труды
1 конгресса ИФАК, т. 2, изд-во АН СССР, 1961, стр. 521—547.
24. Калма ft Р., Ф а л б П., А р б и б М., Очерин по матема-
тической теории систем, перев. с англ. Изд-во «Мнр», 1971.
25. К а р т а н А., Дифференциальное исчисление. Дифференци-
альные формы, перев. с фр. Изд-во Шир», 1971.
26. КолмогоровА. Я., Фомин С. В., Элементы теории
функций и функционального анализа. Изд-во «Наука», 1968.
27. Красовский Н. Н., Теория управления движением.
Изд-во «Наука», 1968.
28. К у д р я в ц е в Л. Д., Математический анализ, т. I. Изд-во
«Высшая шиола», 1970.
29. К у р о пт А. Г., Курс высшей алгебры. Изд-во «Наука», 1971.
30. Лапп о-Д аннлевский И. А., Применение функций от
матриц к теории линейных систем обыкновенных дифференци-
альных уравнений, Гостехиздат, 1957.
31. Ла-Салль Ж., Л евшеп С., Исследование устойчивости
прямым методом Ляпунова, перев. с англ. Изд-во «Мир», 1964.
32. Летов А. М., Динамика полета и управление. Изд-во «Нау-
ка», 1969.
33. Лионе Ж.-Л., Оптимальное управление системами, описы-
ваемыми уравнениями с частными производными, перев.
с франц. Йзд-во «Мир», 1972.
34. Ляпунов А. М., Общая задача об устойчивости движения.
Гостехиздат, 1960.
35. Мальцев А. И., Основы линейной алгебры. Изд-во «Наука»,
1970.
36. М ер к ин Д. Р., Введение в теорию устойчивости движения.
Изд-во «Наука», 1971.
37. Окунев Л. Я.. Высшая алгебра. Изд-во «Просвещение», 1966.
38. Петровский И. Г., Лекции по теории обыкновенных диф-
ференциальных уравнений. Изд-во «Наука». 1964.
39. Понтрягин Л. С., Болтянский В. Г., Гамкре-
лидзеР. В., Мищенко Е, Ф., Математическая теория
оптимальных процессов. Изд-во «Наука», 1961.
40. Понтрягин Л. С., Обыкновенные дифференциальные
уравнения. Физматгиз, 1961.
41. Ройтенберг Я. Н., Автоматическое управление. Изд-во
«Наука», 1971.
42. Ф е л ь д б а у м А. А., БутковскийА. Г., Методы тео-
F рии автоматического управления. Изд-во «Наука», 1971.
43. гФорсайт Дж., Молер К., Численное решение системы
линейных алгебраических уравнений, перев. с аигл. Изд-во
«Мир», 1969.
44. Шилов Г. Е., Конечномерные линейные пространства. Изд-
во «Наука», 1969.
45. X о в а н с к и й А. Н., Приложение цепных дробей и их обоб-
щений к вопросам приближенного анализа. Гостехиздат, 1956.
46. Ха л мош П. Р., Конечномерные векторные пространства.
,Перев. с англ., Физматгиз,’ 1963.
420
ЛИТЕРАТУРА
47. Якубович В, А., Старжинский В, М., Линейиые
дифференциальные уравнения с периодическими коэффициента-
ми. Изд-во «Наука», 1972.
48. Balabanian N., В i с к а г t Т. A., Electrical Network
Theory. New York, 1969.
49. Barker G. P., Normal matrix and the Lyapunov equation.
SIAM. J. Appl. Math. 1974, vol. 26, № 1.
50. BarnettS., Some topics in algebraic systems theory: a sur-
vey. Int. J. Control, 1974, vol. 19, № 4.
51. Bradshaw A., Porter B., Modal control of a class of
distributed — parameter systems. Multi-eigenvalue assignment.
Int. J. Control, 1972, vol. 16, № 2, p. 277—285.
52. Brockett R. W., Finite dimensional linear systems. New
York, 1970.
53. В г у s о n A. E., L u e n b e r g e r D. G., The synthesis of
regulator logic using state-variable concepts. Proc. IEEE, 1970,
vol. 58, p. 1803—1811.
54. В u d у R. S., Global theory of the Riccati equation. J. Comput.
Syst. Set, 1967, vol. I, p. 349—361.
55. Chen С. T,. Introduction to linear system theory. New York,
1970.
56. С r a n к T., N i c h о 1 s о n R., A practical method for nu-
merical evaluation of solutions of partial differential equations
of the heat-conduction type. Proc. Camb. Phil. Soc., 1947. vol. 4
p. 50—67.
57. Davison E. J., A high-order Crank—Nicholson techniques
for solving differential equation. Computer J., 1967, vol. 10, № 2.
58. D a v i s о n E. J., M ann F. T., The numerical solution of
-f- QA = — C, IEEE Trans. Autom. Control. 1968, AC—13,
№ 4, p, 448—449.
59. I) a vi son E. J., The feedforward control of linear multiva-
riable time — invariant systems. Automatica, vol. 9, p. 561—
573, 1973.
60. Davis о n E. J., The output control of linear time-invariant
multivariable systems with unmeasurable arbitrary disturbances.
IEEE Trans. Autom. Control, vol. AC—17, № 5, p. 621—629,1972.
61. D a v i s o n E. J., M a к i M. C., The numerical solution of
the matrix Riccati differential equation. IEEE Trans, Autom.
Control, 1973, vol. AC — 18, № 2, p. 71—73.
62. Davison E. J., Smith H. W., Feedforward and feedback
design of industrial regulators. Proc. IEEE, 1974, vol. 121, № 5,
p. 397.
63. J о h n s о n C. D,, Algebraic solution of the servomechanism
problem with external disturbances. Trans. ASME. set. G, 1974,
March, p. 25—35.
64. Kalman R. E., Bertram J. E., Control system analysis
and design via the second method of Liapunov. Trans. ASME,
ser. D, p. 371—393, 1960.
65. Kirk D. E., Optimal control theory. New York, 1970.
66. К 1 e i n m a n D. L., On Iterative techniques for Riccati Equa-
tion computations, IEEE. Trans. Autom. Control, 1968, AC—13,
№ 2, p. 114—115.
ЛИТЕРАТУРА
421
67. Kwakernaak Н., Sivan R., Linear optimal control
systems. New York, 1972.
68. Luenberger D. G., Observing the state of a linear system.
IEEE Trans. Military Electron,, 1964, vol. MIL — 8, Я» 1—2,
p. 74-80.
69. Luenberger D. G., Observers for multivariable systems.
IEEE Trans, Autom. Control, 1966, AC—11, №2, p. 190—197.
70. Luenberger D. G., Canonical forms for linear multivariable
systems. IEEE Trans. Autom. Control, 1967. AC — 12, p. 290—
293.
71. Luenberger D, G„ An introduction to observers. IEEE
Trans. Autom. Control, 1971, AC — 16, p. 596—602.
72. Man F. T., A Theorem on the Lyapunov matrix equation.
IEEE Trans. Autom. Control, 1969, AC — 14, 3, p. 306.
73. M e I s a J. L.. Schultz D., Linear Control Systems. New
York, 1969-
74. Mufti T. H., A review of the poll problem for multivariable
systems. Ottawa, May, 1971.
75. Munro N., Computer-aided design procedure for reduced order
observers. Estimate of entire state vector. Proc. IEE, 1973, vol.
120, № 2.
76. Munro N., Vardulakis A., Pole-shifting nsing outpoot fe-
edback. Int. J. Control, 1973, vol. 18, № 6, p. 1267—1273.
77. Newman A. K., A general theory for compensating constant
linear systems. Int. J. Control, 1972, vol. 15, N 4, p. 641—649.
78. P earson J. B., Ding Ch. J., Compensator design for
multivariable linear systems. IEEE Trans. Autom. Control,
1969, AC — 14, № 2, p. 130—134.
79. Ogata K., State space analysis of control systems. New York.
1966.
80. Porter B., Crossley T. P., Modal Control. London, 1972.
81. Rosenbrock H. H., State-space and multivariable theory.
London, 1970.
82. Rnbio I. E., The theory of linear systems. New York, 1971.
83. Shubert H. A., An analytic solution for an algebraic matrix
Riccati equation. IEEE AC—19, June 1974.
84. Simon I. D., M i 11 e r S. K,, A theory of modal control.
Inform. Control, 1968, vol. 13, p. 316—363.
85. Smith H. W., Davison E. J., Design of industrial re-
gulators (integral feedback and feedforward control). Proc. IEE
1972, vol. 119, № 8, p. 1210—1216.
86. Vit K., Iterative solution of the Riccati equation, IEEE Trans.
Autom. Control, 1972, AC — 17, № 4, p. 258—259.
87. W an g P. К. C., Modal feedback stabilisation of a linear
distributed system. IEEE Trans. Autom. Control, 1972, AC —
17, p. 552—553.
88. Wonham W. M., On pole assignment in multi-input control-
lable linear systems. IEEE Trans. Autom. Control, 1967, AC — 12,
p. 660—665.
89. W о n h a m W. M., Tracking and regulation in linear multi-
variable systems. SIAM J. Control, 1973, vol. II, № 13, p. 424—
437.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Адъюнкт 35
Аксиома Архимеда 18
— непрерывности 18
— упорядоченности 17
Алгоритм Гаусса 42
Базис 65
— ортонормированный 89
Беспорядок 32
Задача наблюдения 260
— наименьших квадратов 358
— о регуляторе нулевого состояния
369
— регулирования 203
— терминальная 378
— управления оптимального про-
граммного 201
- - — финитного 224
Закон управления 229
Значение собственное матрицы 58
— — оператора 82
Вектор 82
— выходных переменных 161
— собственный оператора 82
Вектор-столбец 19
Вектор-строка 19
— фазовых координат 161
Величина выходная 181
Воздействие управляющее 161
Вронского определитель 104
Вход 161
Выход 161
Гамильтониан 403
Гаусса алгоритм 42
Грама матрица 96
— определитель 96
Грамиан наблюдаемости 266
— системы функции 215
— управляемости 215
Гурвица матрица 179
— многочлен 178
— определитель 180
Детерминант 31, 32
Дефект оператора 77
Диаграмма коммутативная 114
Дифференциатор асимптотический
279
Дополнение алгебраическое 35
— ортогональное 92
Достижимость 216
Единица кольца 14
Еругина теорема 128
Зависимость линейная векторов 84
— — строк (столбцов) матрицы 45
Задача идентификации 280
Идентификатор 272
— асимптотический 275
— Люенбердера 285
Изоморфизм 79
Инверсия 32
Интеграл от матрицы 74
Клетка матрицы 27
Кольцо 10
— ассоциативное 10
— коммутативное 10
Комбинация линейная 88
— — тривиальная 45
Координаты вектора 66
Коши — Буняковского неравенство
88
Коши формула 116
Крамера правило 50
— формулы 50
Критерий достижимости 216
— неидентифицир уем ости 262
— пенаблюдаемости 263
— Сильвестра 99
— управляемости 211
— — стационарной системы 221
Кронекера — Капелли теорема 49
Кэли — Гамильтона теорема 58
Ляпунова матрица 128
— преобразование 128
— теорема 187
Ляпунова — Флоке теорема 130
Матрица 9, 18
— Грама 96
— Гурвица 179
— диагональная 20
— единичная 22
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
423
Матрица квадратичной формы 98
— квадратная 19
— клеточная 27
— клеточно-диагональная 29
— Ляпунова 128
— многочлена сопровождающая 60
— модальной обратной связи 316
— неотрицательно определенная 99
— неположительно определенная 99
— нулевая 19
— обратимая 26
— обратная 26, 40, 41
— оператора 75
— ортогональная 94
— отрицательно определенная 99
— перехода 67
— переходная 105, 112, 176
— подобная 55
— положительно определенная 99
— полура спавшаяся 37
— присоединенная 40, 113
— псевдообратная 231, 383
— распавшаяся 29
— расширенная 49
— Рауса 180
— симметрическая 26, 91
— транспонированная 25
— треугольная 58, 84
— устойчивая 145, 178
— фундаментальная 104
— характеристическая 56
Матрицы перестановочные 22
— равные 19
Минор 47
— базисный 47
— дополнительный 32
Многочлен 24
— Гурвица 178
— минимальный 60
— устойчивый 178
— характеристический 56
Мода 299
Модуль 62
Морфизм 73
Неравенство Коши — Буняковского
88
— треугольника 89
Норма вектора 88
Нуль кольца 12
Область значений оператора 73
— определения оператора 73
Оболочка множества линейная 69
Образ вектора 78
Обращение матрицы 28
Объект линейный 180, 163
Оператор единичный 74
— линейный 78, 79
— невырожденный 81
— неособенный 81
— обратный 81
— самосопряженный 91
— скалярный 74
— сопряженный 90
— тождественный 74
Операция алгебраическая 9
Определители Гурвица 180
Определитель 31 32
— Вронского 104
— Грама 96
— произведения матриц 38
Орт 89
Ортогонализация базиса 90
О cip огр адского — Лиувилля теорема
Отрезк и вложенные 18
Пеано ряд 110
Переменные состояния 162, 164
Пересечение подпространств 70
Перестановка 32
— нечетная 32
— основная 32
— четная 32
Подпространство 68
— инвариантное 82
Поле 16
Правило композиции для переходной
матрицы 114
— Крамера 50
Представление каноническое иден-
тификационное 276
— — системы со многими входами
245
— - - — С одним входом 239
Преобразование линейное 73
— Ляпунова 128
— матриц элементарное 48
— Риккати 398
Произведение матриц 20
— операторов 78
— скалярное 87
Производная от матрицы 74
Прообраз вектора 73
Пространство евклидово 87
— линейное 82
— — бесконечномерное 85
— — вещественное 82
— — комплексное 88
— — конечномерное 65
— нормированное 89
— событий 162
- состояний 181
— фазовое 182
Псевдорешение линейной системы 363
Разложение детерминанта 36
Размерность линейного пространства
65
— линейной системы 162
Разность векторов 63
— элементов 13
Ранг матрицы 47
— оператора 77
Рауса матрица 180
Регулирование 203
Регулятор модальный 316
Решение системы 161
— общее 51
— тривиальное 51
Ряд Пеано ИО
Связь обратная модальная 316
Сильвестра критерий 99
424
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
391
I
M]
I
нь
pc
и 1
КС
р<
П1
I
И
Р
V
=1
Т(
Н
ul
w
ОС
т
।
П
Система вложенных отрезков 18
— достижимая 216
— идентифицируемая 261
— линейная 160, 163
— линейных уравнений неоднород-
ная 51
— несовместная 49
— однородная 51
— • - - - совместная 49
— модально управляемая 316
— — — полностью 316
— наблюдаемая 261
— периодическая 218
— приводимая 128, 182
— решений фундаментальная 53
— — — нормальная 53
— следящая 342
— - - оптимальная 385
— стационарная 161
— управляемая 207
След матрицы 57
— — квадратной 112
Событие 162
— достижимое 216
— неидентифицируемое 281
— ненаблюдаемое 261
— управляемое относительно точки
207
Соответствие изоморфное 79
Состояние системы 161, 182, 164
Спектр оператора 82
Степень устойчивости 178
— элемента 12
Столбец 19
— базисный 47
Строна 19
— базисная 47
Сумма матриц 20
--- прямая 29
— подпространств 89
--- прямая 71
Сходимость посиедовательности мат-
риц равномерная 107
— — функций 106
— равномерная 107
— ряда функций 107
— -- — абсолютная 107
— равномерная 107
Теорема Еругина 128
— кронекера — Капелли 49
— Кэли — Гамильтона 58
— Ляпунова 187
— Ляпунова — Флоке 130
— О строгред ского — Лиувилля 112
Точки сопряженные 404
— фокальные 404
Траектория движения системы 161
Транспозиция 32
Транспонирование 25
Умножение матрицы на число 23
Управление 161
— модальное 299
— по замкнутому контуру 359
— — разомкнутому контурт 359
— программное оптимальное 201
— разомкнутое 359
— терминальное 378
— финитное 224
Управляемость 207
— модальная 316
Уравнение выхода 161
— наблюдения 161
— самосопряженное 119
— сопряженное 95, 118, 140, 141
Условие ортогональности 133
Устойчивость 174
— асимптотическая 175
— — равномерная 184
— по Ляпунову 174
— экспоненциальная 185
Фаза системы 162
Фильтр Калмана 305
Форма квадратичная 98
Формула вариации постоянных 118
---— матричная 139
— Коши 116
Формулы Крамера 50
Функция Ляпунова квадратичная
189, 191
— отрицательно определенная 191
— передаточная 166
— периодическая 127
— положительно определенная 191
Число 18, 62
— измерений линейного пространст-
ва 65
— собственное матрицы 58
— — оператора 82
— характеристическое матрицы 58
Экспонента матричная 120, 149
Элемент 9
- нулевой 12
— противоположный 13
Элементы ортогональные 89
Ядро оператора 77
О
I