Текст
                    ТЕОРИЯ УПРАВЛЕНИЯ
С.К. КОРОВИН
В.В. ФОМИЧЕВ
НАБЛЮДАТЕЛИ СОСТОЯНИЯ
ДЛЯ ЛИНЕЙНЫХ СИСТЕМ
С НЕОПРЕДЕЛЕННОСТЬЮ
МОСКВА
ФИЗМАТЛИТ®
2007

УДК 517.927 ББК 22.16, 22.18 Ф76 Издание осуществлено при поддержке Российского фонда фундаментальных исследований по проекту 07-06-02002 Коровин С. К., Фомичев В. В. Наблюдатели состояния для линей- ных систем с неопределенностью. — М.: ФИЗМАТЛИТ, 2007. — 224 с. — ISBN 978-5-9221-0834-8. Монография посвящена изложению методов синтеза асимптотических на- блюдателей для линейных и некоторых классов билинейных динамических систем в условиях неопределенности. В книге приведены классические ре- зультаты по теории наблюдателей (критерии наблюдаемости, методы синтеза наблюдателей Люенбергера для полностью определенных систем), а также достижения последнего периода (около 20 лет) в данной области (методы синтеза наблюдателей для систем в условиях неопределенности, методы синте- за функциональных наблюдателей, в том числе минимального порядка, новые канонические формы для наблюдаемых систем). Приведены результаты как для непрерывных, так и для дискретных динамических систем. Для специалистов в области теории управления и ее приложений, а также аспирантов и студентов, специализирующихся в указанном направлении. ISBN 978-5-9221-0834-8 © ФИЗМАТЛИТ, 2007 © С. К. Коровин, В. В. Фомичев, 2007
ОГЛАВЛЕНИЕ Предисловие...................................................... 6 Глава 1. Понятие о наблюдателях состояния...................... 7 Глава 2. Наблюдаемость.......................................... 11 2.1. Наблюдаемость, идентифицируемость, критерии наблюдаемости и идентифицируемости............................................ 11 2.2. Передаточная функция и канонические формы................ 23 2.2.1. Канонические формы для скалярных систем (23). 2.2.2. Ка- нонические формы для векторных систем (28). 2.3. Каноническое представление с выделением нулевой динамики. ... 33 2.3.1. Нулевая динамика скалярной системы (33). 2.3.2. Нулевая динамика векторных систем (37). 2.4. Нестационарные линейные системы.......................... 42 Глава 3. Наблюдатели полного фазового вектора для полностью определенных линейных систем................................ 46 3.1. Полноразмерные наблюдатели............................... 46 3.1.1. Алгоритмы синтеза наблюдателей с использованием раз- личных канонических форм (51). 3.1.2. Синтез наблюдателей с использованием 1-го канонического представления векторных си- стем (52). 3.1.3. Синтез с использованием формы Люенберге- ра (54). 3.1.4. Синтез наблюдателей при восстанавливаемой паре {С, А} (55). 3.2. Наблюдатели Люенбергера пониженного порядка............. 58 Глава 4. Функциональные наблюдатели для полностью опреде- ленных линейных систем..................................... 65 4.1. Постановка задачи. Функциональные наблюдатели люенбергеров- ского типа................................................... 65 4.2. Восстановление скалярных функционалов................... 68 4.3. Восстановление векторных функционалов................... 78 4.4. Метод скалярных наблюдателей............................ 80 4.4.1. Случай кратных корней (88). 4.4.2. Случай комплексных корней (94). 4.5. Системы с векторным выходом............................. 96
4 Оглавление Глава 5. Асимптотические наблюдатели для линейных систем с неопределенностью....................................... 103 5.1. Гипервыходные системы................................... 104 5.2. Функциональные наблюдатели.............................. 111 5.3. Синтез наблюдателей методом псевдовходов................ 111 5.4. Классические методы синтеза наблюдателей в условиях неопреде- ленности ................................................... 117 5.4.1. Исключение возмущения из уравнения для ошибки оцени- вания (117). 5.4.2. Метод исключения возмущения из уравнения системы (119). 5.4.3. Методы, основанные на приведении системы к специальному каноническому виду (120). 5.4.4. Метод псевдов- ходов (121). 5.4.5. Методы синтеза наблюдателей с управлени- ем (122). 5.5. Статические и астатические методы оценивания в условиях неопре- деленности ..................................................... 123 5.5.1. Наблюдатели для квадратных систем с неопределенно- стью (123). 5.5.2. Наблюдатели для систем с произвольным отно- сительным порядком г > 1 (136). 5.6. Асимптотический наблюдатель для систем с неопределенностью . . 137 5.6.1. Системы со вторым относительным порядком (137). 5.6.2. Системы с произвольным относительным порядком (140). Глава 6. Наблюдатели для билинейных систем.................... 148 6.1. Асимптотические наблюдатели билинейных систем на плоскости. . 148 6.2. Асимптотические наблюдатели для некоторых классов п-мерных билинейных систем........................................... 161 6.2.1. Постановка задачи (161). 6.2.2. Системы со скалярным вы- ходом и вырожденной матрицей билинейности (162). 6.2.3. Си- стемы с векторным выходом и вырожденной матрицей билинейно- сти (167). 6.2.4. Системы с векторным выходом и известным вхо- дом (169). 6.2.5. Асимптотические наблюдатели на основе метода декомпозиции (171). Глава 7. Наблюдатели для дискретных систем..................... 175 7.1. Математические модели дискретных объектов............... 175 7.2. Дискретные наблюдаемость и наблюдатели. Канонические формы 178 7.3. Метод псевдовходов в задаче синтеза функциональных наблюдате- лей .......................................................... 188 7.3.1. Скалярная система, скалярный функционал (188). 7.3.2. Скалярные наблюдения, векторный функционал (192). 7.4. Метод скалярных наблюдателей в задаче синтеза функционального наблюдателя минимального порядка.............................. 197 7.4.1. Скалярный функционал, скалярное наблюдение (198). 7.4.2. Скалярные наблюдения, векторный функционал (200). 7.5. Синтез наблюдателей в условиях неопределенности......... 201
Оглавление 5 7.5.1. Квадратные системы (202). 7.5.2. Гипервыходные систе- мы (203). 7.5.3. Метод псевдовходов при синтезе наблюдателя состояния (207). 7.5.4. Некоторые классические методы синте- за наблюдателей состояния в условиях неопределенности (210). 7.5.5. Метод исключения возмущения из уравнения для ошибки оценивания (210). 7.5.6. Метод исключения возмущения из урав- нения системы (212). 7.5.7. Методы, основанные на специальных канонических формах (214). Список литературы................................................ 217
Предисловие В книге отражены достижения последнего периода времени (при- мерно 2-х десятилетий) в области синтеза наблюдателей состояния динамических систем, описываемых обыкновенными дифференциаль- ными уравнениями или же рекуррентными соотношениями с конечной памятью. Результаты предшествующего периода времени достаточно полно отражены в монографии О’Рейли. Главные достижения связаны с развитием теории наблюдателей для многомерных (многосвязных) систем, функциональных наблюдателей и наблюдателей в условиях неопределенности. Кроме того, существенный прогресс достигнут в синтезе простейших наблюдателей, т. е. наблюда- телей минимального порядка. Эта проблема исследована как для стан- дартных, так и функциональных наблюдателей. Общей, объединяющей все проблемы, является идея получения необходимой информации о системе минимальными средствами. Еще одна проблема, затрагиваемая в книге, касается статических и астатических методов оценивания в условиях неопределенности, при- ведены алгоритмы оценивания, дающие асимптотически точное восста- новление функции или с погрешностью, регулируемой по произволу. Книга ориентирована на специалистов по теории автоматического управления, а так же преподавателей, студентов и аспирантов соответ- ствующих специальностей. При работе над книгой и при подготовке рукописи к печати су- щественную помощь нам оказали к.ф.-м.н. доцент МГУ А.В. Ильин и аспирант МГУ И.С. Медведев. Мы выражаем им благодарность за оказанное содействие и возможность использования результатов совместных исследований в данной книге. Авторы так же признательны академику Емельянову Станиславу Васильевичу за помощь, оказанную им при проведении исследований и подготовке рукописи книги. Книга издается при поддержке РФФИ, грант № 07-06-02002. Москва, 2006.
Глава 1 ПОНЯТИЕ О НАБЛЮДАТЕЛЯХ СОСТОЯНИЯ Задача о синтезе наблюдателей состояния для динамических си- стем, в том числе и для систем автоматического управления, является классической и имеет богатую историю. Далее всюду для определенности под динамической системой пони- маем систему управления. В конечномерном случае при непрерывном времени система автоматического управления описывается системой обыкновенных дифференциальных уравнений, правая часть которой зависит от входа системы u(t), выбором которого можно влиять на свойства данной системы. В общем виде подобная система задается векторным дифференциальным уравнением х = f(x, и, t), t 0, (1.1) где х е Rn — фазовый вектор системы. Необходимость в наблюда- теле состояния обусловлена тем, что при решении задач управления зачастую доступна информация не о фазовом векторе х, а только о некоторой функции от х: y = h(x), (1.2) которую называют выходом системы, что, вообще говоря, затрудняет решение задачи управления с надлежащим качеством. Под задачей построения наблюдателя состояния понимают синтез динамического устройства, формирующего оценку вектора состояний динамической системы по доступной информации о системе, ее изме- ряемым выходу и входу. Решению этой задачи для различных классов систем при тех или иных предположениях о параметрах системы, о доступной информа- ции, посвящено огромное число работ. В 1963 г. Давид Люенбергер заложил основы теории наблюдателей для линейных стационарных систем управления. До сих пор появляют- ся работы, обобщающие или распространяющие эту теорию на новые классы систем.
8 Гл. 1. Понятие о наблюдателях состояния Кратко остановимся на проблемах, которые обычно возникают в теории асимптотических наблюдателей, решающих задачу на- блюдения в асимптотике при устремлении времени в бесконечность, в отличие, скажем, от финитных наблюдателей, решающих задачу за конечное время. Далее речь идет только об асимптотических наблюда- телях. Первая проблема состоит в получении ответа на вопрос, а возможно ли в принципе для данной системы по имеющейся информации вос- становление (построение оценки) полного фазового вектора системы? Соответствующую задачу называют задачей о наблюдаемости дина- мической системы. Полное решение этой проблемы получено для многих видов дина- мических систем, в том числе для линейных стационарных многосвяз- ных систем управления, которые описываются уравнениями вида ( х — Ах 4- Ви, 1 у = Сх, (1-3) где х е Rn — неизвестный фазовый вектор системы, и е Rm, у е — известные вход и выход системы, соответственно; А, В и С — посто- янные матрицы соответствующих размеров. Задача о наблюдаемости решена также и для линейных нестацио- нарных систем, т. е. для векторных систем вида х — A(t)x 4- B(t)u, (1.4) У = при некоторых условиях на матричные коэффициенты A(t), B(t) и C(t). Сложнее обстоит ситуация с нелинейными системами общего вида (1.1)—(1.2), однако для многих частных случаев эта задача получила свое решение. Для тех систем, которые допускают восстановление фазового вектора по имеющейся информации (такие системы называ- ются наблюдаемыми) встает задача о получении оценки x(t) фазового вектора x(t). Для решение этой задачи традиционно используют вспомогатель- ные динамические системы, которые и формируют указанную оценку. В общем случае такие системы могут быть записаны в виде z = g(z,u,y), X — p(z, и, у). (1-5) Такие системы и называют наблюдателями. Здесь синтезу под- лежат функции д(.) и р(.), размерность вектора z(t) называют размерностью наблюдателя. Если оценка x(t) асимптотически схо- дится к фазовому вектору системы x(t), то наблюдатель назы- вают асимптотическим (если, кроме того, имеет место оценка
Гл. 1. Понятие о наблюдателях состояния 9 1.6) \\x(t) - x(t)\\ 9 < Со||£(О) - a;(O)||e~7t, где константы 7 > 0, Со > 0, то такой наблюдатель называют экспоненциальным). Для линейных ста- ционарных полностью определенных систем (1.3) эта задача получила исчерпывающее решение. Однако для линейных систем с неопределенностью (возмущенных систем) вида х — Ах + Ви + У = Сх, где £ rf - неизвестное возмущение, задача о синтезе асимптотиче- ских наблюдателей полностью еще не решена. До сих пор появляются работы, в которых предлагаются подходы к решению указанной про- блемы при различных предположения относительно параметров систе- мы (1.6) и неизвестного возмущения £. Еще сложнее обстоит дело с синтезом наблюдателей в нелинейном случае, на сегодня эта задача решена лишь для некоторых классов нелинейных динамических систем. В теории автоматического управления часто помимо устойчивости замкнутой системы предъявляются те или иные дополнительные требо- вания к свойствам регулятора. В частности, нередко требуется, чтобы размерность наблюдателя * 2) (т. е. размерность фазового вектора z(t) динамической системы (1.5)) была минимальна. В результате появи- лась проблема, связанная с построением минимального наблюдателя, т. е. наблюдателя минимального динамического порядка, т. е. мини- мальной размерности. Для линейных стационарных полностью определенных систем (1.3) эта задача оценивания полного фазового вектора получила исчерпыва- ющее решение в работах Люенбергера. В то же время для решения задач управления зачастую не требуется знать весь фазовый вектор системы, а достаточно располагать информацией лишь о некотором функционале от этого вектора, например следующего вида a = h(x) еГ, (1.7) где /г(.) — известная достаточно гладкая функция. В этом случае имеет место задача о построении оценки для этого функционала, или, иначе говоря, задача о построении функционального наблюдателя. Разуме- ется, эта задача имеет смысл, когда размерность такого наблюдателя оказывается ниже размерности наблюдателя, восстанавливающего пол- ный фазовый вектор. В случае линейной стационарной системы без неопределенности и линейного функционала а = Нх 9 || || — какая-либо норма в Rn. 2) Наблюдатель, как правило, часть ругулятора.
10 Гл. Г Понятие о наблюдателях состояния эта задача рассматривалась в монографии О’Рейли [87], где предло- жены методы построения функциональных наблюдателей и получена оценка сверху для размерности таких наблюдателей. Однако задача о функциональном наблюдателе минимальной размерности получила решение только недавно. Кроме того, самостоятельный интерес представляет задача о синте- зе функциональных наблюдателей для линейных и нелинейных стаци- онарных и нестационарных систем с неопределенностью. Аналогичные задачи, т. е. задачи о наблюдаемости, о синтезе на- блюдателя, о построении наблюдателя в условиях неопределенности, о синтезе функциональных наблюдателей, о минимальном наблюдателе и т. п., имеют место и для дискретных регулируемых систем, в частности, для линейных дискретных систем управления, которые описываются уравнениями Ажд; ~Ь BUfc, Ук = Схк, к = 0, 1,2,... , где, как и ранее, х е — фазовый вектор, и е и у е Rz — вход и выход системы, соответственно. Для линейных стационарных систем большинство результатов пе- реносятся с непрерывного случая на дискретный, хотя для последнего имеются особенности и существенные отличия.
Глава 2 НАБЛЮДАЕМОСТЬ 2.1. Наблюдаемость, идентифицируемость, критерии наблюдаемости и идентифицируемости Рассмотрим задачу наблюдаемости, т. е. задачу о принципиальной возможности восстановления фазового вектора системы по измерениям ее выхода. Далее рассматривается линейная система вида ( х = A(f)x + | У = C(t)x, ) где х € Rn — неизвестный фазовый вектор; и € Rm, у € — известные вход и выход системы, соответственно. Пару (£*,#*) будем называть состоянием системы (в момент времени £*), если х* = x(t*}. Решение системы, соответствующее управлению u(t) и начальному состоянию (£о,^о), будем обозначать x(t, to,xo, и), а выход, соответственно, y(t, to,XQt и), t to. Различают две задачи восстановления неизвестного вектора x(t). Задача наблюдения — задача оценки состояния системы в момент времени to по известным входу и выходу системы u(t) и y(t) при t to, т. е. задача восстановления начального значения фазового вектора по будущим измерениям входа и выхода. Задача идентификации — задача оценки состояния системы в момент времени по данным о входе и выходе при t Г, т. е. задача восстановления фазового вектора в текущий момент времени t* по измерениям входа и выхода в прошлом. Эти определения восходят к работам Р. Калмана. Замечание 2.1. Часто не делают различия между наблюдением и идентификацией, объединяя эти понятия термином наблюдаемость. Иногда наблюдаемую систему определяют как систему, в которой по прошлым значениям выходных и входных величин можно восстановить
12 Гл. 2. Наблюдаемость текущее состояние системы. Выше эта задача была определена как задача идентификации. Далее для простоты будем обозначать x(t,t^,x^,u} — x(t) — реше- ние системы (2.1), соответствующее начальному состоянию x(t$) — xq и входу u(t). Соответствующий выход системы будем обозначать y(t,to,xo,u) = y(t). Введем понятия наблюдаемой и идентифицируемой системы (еле- дуя [1]). Определение 2.1. Линейная система (2.1) является наблюдаемой в момент времени to, если ?/(t;to,xo,O) = 0 при t to тогда и только тогда, когда xq = 0. Определение 2.2. Линейная система (2.1) является идентифици- руемой в момент времени to, если y(t\ t$, xq, 0) = 0 при t to тогда и только тогда, когда xq = 0. Заметим, что если система идентифицируема (наблюдаема), то при ненулевом начальном состоянии (to, хо) (и нулевом входе и = 0) выход системы не равен тождественно нулю, т. е. ненулевое начальное состо- яние порождает некоторую нетривиальную реакцию выхода. Перейдем теперь к рассмотрению линейных стационарных регули- руемых систем вида где х е Rn — фазовый вектор, и е Rm, у е — известные вход и выход системы; Л, В и С — постоянные матрицы соответствующих размеров. Так как наблюдаемость и идентифицируемость системы (2.2) целиком определяются матрицами А и С, то говорят о наблюдаемости (идентифицируемости) пары {С, Л}. Для стационарной линейной системы (2.2) имеет место следующее утверждение. Теорема 2.1. Стационарная пара {С, Л} наблюдаема тогда и только тогда, когда она идентифицируема. Далее будем говорить только о наблюдаемости пары {С, Л}. Для линейных стационарных систем (2.2) имеет место простой критерий наблюдаемости пары {С, Л}. Теорема 2.2. Стационарная пара {С, Л} наблюдаема тогда и только тогда, когда выполнено ранговое условие С СА = п. (2.3) САп~1 rank
2.1. Наблюдаемость, идентифицируемость 13 Матрицу 7V(C, А) = С СА называют матрицей наблюдаемо- САп~х сти (матрицей наблюдаемости Калмана). Доказательство. Достаточность. В силу стационарности сис- темы (2.2) можно положить to = 0. Если система ненаблюдаема, то найдется вектор xq / 0 такой, что y(t, 0, xq, 0) = CeAtxq = 0 при всех t 0. Последовательно дифференцируя (п - 1) раз выход y(t) в силу системы (2.2) при u(t) = 0, получим систему уравнений 7/(0) = Схо = 0, 7/'(0) = С Ахо = о, y^-i\O) = CAn-ixo = O. Так как xq / 0, то это означает, что rank7V(C, А) < п. Следовательно, если матрица наблюдаемости N(C, А) полного ранга, то система (2.2) наблюдаема. Необходимость. Пусть система (2.2) наблюдаема. Покажем, что N(C, А) — матрица полного ранга. Пусть гапкЛ^(С, А) < п. Тогда найдется вектор xq / 0 такой, что Сх0 = 0, САхо = О,..., САп~1хо = О. (2.4) В силу теоремы Кели-Гамильтона матрицы Aq при q п выражаются через матрицы /, А,..., Ап-1, поэтому из (2.4) следует, что CAqxo = 0 при всех q 0. Тогда и для матричной экспоненты имеет место равенство г—0 г=1 при всех t 0. Следовательно, если rank7V(C, А) < п, то найдется ненаблюдаемое состояние (0, xq), что противоречит предположению о наблюдаемости пары {С, А}. Теорема доказана. □ Ранговое условие (2.3) говорит о том, что среди (пГ) строк матрицы N(C,A) еКИхп есть п линейно независимых. При этом может ока-
14 Гл. 2. Наблюдаемость заться, что выполнено условие rank С - СА = rank АС (С, А) = п (2-5) при некотором и п. Минимальное число г/, при котором выполня- ется условие (2.5), называют индексом наблюдаемости пары {С, А} (системы (2.2)). Иногда матрицей наблюдаемости называют матрицу ЛС(С,А). Для стационарной системы (2.2) имеет место следующее утвержде- ние. Лемма 2.1. Если rankNp(С, А) = rank7Vp_|_i(C, А), то rank (С, А) = rank7Vp+(?(C, А) для всех q 1. Доказательство. Если гапкТУДС, А) = rank СА rank САр-г С СА САР-1 САР = rankNP+i(C, А), то это означает, что строки матрицы САР линейно выражаются через строки матриц С, СА,..., САР-1. Тогда и строки матрицы САр+1 = = САРА линейно выражаются через строки матриц С, СА,..., САР-1. Следовательно, rankNp(С, А) = rank JVp+2(C, А). Продолжая рассуждения по индукции получим утверждение лем- мы. Лемма доказана. □ Следовательно, ранг матриц NP(C, А) при увеличении р либо уве- личивается на каждом шаге, либо не изменяется, начиная с некоторо- го р*. Если rankNp*(C, А) = п, то пара {С, А} наблюдаема, а р* = и. Если же rankTVp* (С, А) < п, то пара {С, А} не наблюдаема.
2.1. Наблюдаемость, идентифицируемость 15 Из леммы 2.1 получим простое следствие. Следствие 2.1. Если ранг матрицы С максимален, т. е. rank С = = I, а пара {С, А} наблюдаема, то rank7Vn_z+i(C, А) = rank СА СА Доказательство. По условию rank[C] = rankiVi(C, А) = При добавлении строк САР ранг матриц NP(C, А) увеличивается по край- ней мере на 1, пока не достигнет п. Следовательно, добавление строк матриц С А,..., САп~1 увеличит rank^_/+i(C, А) до п. Следствие доказано. □ Таким образом, если rank С = I, то для индекса наблюдаемости у справедлива оценка у С п — I + 1. Рассмотрим преобразование координат с матрицей Р в линейной стационарной системе (2.2): х = Рх, где х — новые координаты. _ При_указанной замене тройка матриц {С, А, В} перейдет в тройку {С, А, В}, которые связаны с исходными матрицами соотношениями С = СР~[, А = РАР~\ В = РВ. Матрица наблюдаемости преобразованной системы принимает, соот- ветственно, следующий вид: N(C,A) = СР"1 СР-1(РА)Р~1 . CP~l(PAP~l) В силу невырожденности матрицы преобразования Р rank7V(C, А) = rank7V(C, А), т. е. свойство наблюдаемости инвариантно к замене координат. Это же, разумеется, верно и для N„(C, А).
16 Гл. 2. Наблюдаемость Для линейных нестационарных систем с матрицами A{t), C(t) в случае, если A{t) и C{t) достаточное число раз дифференцируемые функции, также может быть определена матрица наблюдаемости W) = Q1W ‘ (2.6) . Qn(t) _ где матрицы Qi{t) е R/Xn определяются следующими формулами: Qi(Z) = C(t), = Qi{t)A{t) + Qi{t), i = 1,2, ...,n — 1. Часто в литературе используется следующее определение. Определение 2.3. Система (2.1) (пара {C{t),A{t)}) равномерно {дифференциально-) наблюдаема тогда и только тогда, когда матрица наблюдаемости N{t) е R(n/)xn из (2.6) удовлетворяет ранговому усло- вию rankTV(t) = п, t to. Задача наблюдения для линейных систем имеет тесную связь с задачей управления. Кратко изложим основные результаты на этот счет, следуя работе [1]. Рассмотрим линейную нестационарную систему х = A{t)x + B{t)u. (2.7) Определение 2.4. Событие (to,#o) линейной системы (2.7) назы- вается управляемым относительно точки х\, если найдется момент времени ti to и управление u{t), определенное на интервале [to, ti], которое переводит событие (to,#o) в событие (ti,ац). Для линейных систем обычно рассматривается управляемость от- носительно начала координат, т. е. относительно х\ = 0. Определение 2.5. Линейная система называется управляемой в момент времени to, если каждое событие (to,x), где to фиксировано, а х — произвольный вектор из Rn, является управляемым (относительно Х[ = 0). Линейная система управляема (равномерно по to), если она управ- ляема в любой момент времени to. Далее имеем дело с управляемостью {управляемостью пары {Д; В}) для линейной стационарной системы (2.2), имеет место крите- рий управляемости:
2.1. Наблюдаемость, идентифицируемость 17 Теорема 2.3. Линейная стационарная система х — Ах 4- Ви управляема (пара {А, В} управляема) тогда и только тогда, когда выполнено ранговое условие гапк[В, АВ,..., Ап-1 В] = п. Матрицу К(А,В) = [В,АВ,...,Ап~хВ] € Rnx(mn) называют мат- рицей управляемости (матрицей управляемости Калмана). Для матриц управляемости, как и для матриц наблюдаемости, име- ет место утверждение, аналогичное утверждению Леммы 2.1. Лемма 2.2. Для матриц КР(А,В) = [В, АВ,..., Ар~1 В], где р = 0, 1,..., ранг матриц КР(А,В) монотонно возрастает до неко- торого р*, а для р^ р* rankКр(А, В) = rankКр* (А, В). Если пара {А, В} управляема (т. е. система (2.2) управляема), то минимальное число у такое, что rank (А, В) = п, называют индексом управляемости. Если rank В — т, то rankК(А, В) = [В, АВ,..., An-mB] = п, а индекс управляемости р п — т 4- 1. Имеет место двойственность задач управляемости и наблюдае- мости [64], так, если стационарная система !х = Ах 4- Ви, у = Сх управляема (наблюдаема), то двойственная к ней система, т. е. си- стема вида ( х' = Атт' 4- СТи', [ у' — BTxf наблюдаема (управляема). Вернемся теперь к задаче наблюдения и рассмотрим ситуацию, когда критерий наблюдаемости не выполнен. Если rank N(С, А) < п, то система (2.2) называется ненаблюдаемой (не полностью наблюдаемой). Пусть выполнено условие rank7V(C,A) =£,
18 Гл. 2. Наблюдаемость где 0 < £ < п. %ля не полностью наблюдаемой системы существует невырожденное преобразование координат [3, 63, 64], приводящее си- стему к виду fi1 = Ацх1 + Biu, х2 = А21 х1 4- А22Х2 + B2U, (2.8) У = С[Х1, где х1 е х2 е Rn-5, Лц, Л21, Л22, Bi, В2 и С\ — матрицы с постоянными коэффициентами соответствующих размеров. При этом пара {С1,Ац} — наблюдаема, хх — наблюдаемая часть системы, х2 — ненаблюдаемая часть системы. Аналогичный результат имеет место в случае, если не выполнен критерий управляемости. Если rankK(B,A) < п, то система (2.2) называется неуправляемой (не полностью управляемой). Пусть вы- полнено условие rank К (В, А) = у, 0 < г) < п. Тогда для не полностью управляемой системы существует невырож- денное преобразование координат [3, 64], приводящее систему к виду {i1 = Ali#1 4- Ai2#2 4- B\u, x2 = A22X2, (2.9) у = Cix1 4- C2X2, где x1 e UT7, x2 e Rn-r?, Ап, A12, A22, Bi, Ci и C2 — постоянные матри- цы соответствующих размеров. При этом пара {Ац,В1} — управляема, т. е. хх — управляемая, а х2 — неуправляемая часть системы. Говорят, что система (2.2) находится в общем положении, если она управляема и наблюдаема (тройка {С, А, В} находится в общем положении, если пара {С, А} — наблюдаема, пара {А, В} — управля- ема). Если система не полностью управляема и не полностью наблюда- ема, то невырожденным преобразованием координат она может быть приведена к виду [3, 63, 64], называемому калмановской декомпози- цией системы ' хх = Анх1 4- А12ГГ2 4- А13Х3 4- В\и, ±2 = А22Х2 4- А24Ж4 4- B2U, i3 = A33X3 4- A34T4, (2.10) k x4 = A44X4, у = C2X2 4- C4X4,
2.1. Наблюдаемость, идентифицируемость 19 где хг е Aij, Bi, Cj — постоянные матрицы соответствующих размерностей. Здесь: хх — управляемая, но ненаблюдаемая часть; х2 — управляемая и наблюдаемая часть; х3 — неуправляемая и ненаблюдаемая часть; х4 — наблюдаемая, но неуправляемая часть. При этом: П2 min(£, ту); щ + П2 = тр П2 + щ = п\ + П2 + пз 4- + П4 = п. Рассмотрим неполностью наблюдаемую систему, записанную в ка- ноническом виде (2.8); имеет смысл следующее Определение 2.6. Неполностью наблюдаемая система (2.2) вос- станавливаема (обнаруживаема), если ненаблюдаемые координаты си- стемы при и = 0 и тождественно равной нулю наблюдаемой части стремятся к нулю при £ —> оо (т. е. если матрица А22 в каноническом представлении (2.8) гурвицева 9). Определение 2.7. Не полностью управляемая система (2.2) ста- билизируема, если неуправляемые координаты при t —> сю стремятся к нулю (т. е. если матрица А22 в каноническом представлении (2.9) гурвицева). Известен ряд эквивалентных форм критериев управляемости и на- блюдаемости, в некоторых ситуациях удобен алгебраический критерий наблюдаемости линейной стационарной системы (2.2) (в форме Розен- брока, сформулированный и доказанный в работе [85]). Теорема 2.4 (критерий наблюдаемости Розенброка). Пара {С, А} наблюдаема тогда и только тогда, когда выполнено ранговое усло- вие = п, АеС. (2.11) XI- А С rank Замечание 2.2. Так как для всех А 0 spec А имеет место равенство гапк[А/ — А] — п, то условие (2.11) надо проверить только для Xi е spec(A), г = 1, ... ,п. Доказательство. Необходимость. Пусть пара {С,А} наблюда- ема, но существует число А* е spec(A), А* е R, такое, что rank XU-А С < п. 9 Гурвицевой называют постоянную матрицу, характеристический полином которой удовлетворяет критерию асимптотической устойчивости Гурвица.
20 Гл. 2. Наблюдаемость Тогда найдется вектор xq G Rn такой, что А*/ - А С хо =0, хо ф 0. В этом случае x(t) = хоехч является решением системы (2.2) при u(t) = 0, при этом выход системы y(t) = Схоехч = 0. Если А* е С, то и А е spec(X), xq G Сп, кроме того, A*Z — А С хо = 0, а, следовательно, y(t) — Ca?oeA*f = 0. Таким образом, 4- 72^оеА *) = 0 при всех 71 и 72 £ С, а, значит, найдутся числа 71 и 72 такие, что вещественная функция ^\хоехч + 72#оеА** отлична от нуля, а выход системы _Ф y(t) = С(71£оел ‘ + 72^оел f) = 0. Таким образом, получили противоречие с определением наблюдае- мости системы. Достаточность. Рассмотрим уравнение (2.2) при и = 0 в случае, если выход системы y(t) = 0: ( х — Ах, \у = Сх. Проведем преобразование Лапласа этой системы при нулевых на- чальных условиях. Обозначив X(s) = Cx(t), Y(s) = £y(t), получим уравнение Г (si- А)Х = 0, 1 СХ = 0. В силу невырожденности матрицы при всех А е С из послед- XI - А С ней системы следует, что Х($) = 0. Делая обратное преобразование Ла- пласа, получим, что x(t) = 0 при f > 0, а, следовательно, тождественно равному нулю выходу соответствует только тождественно равный нулю вектор состояния. Теорема доказана. □ Сходную формулировку имеет критерий управляемости Розенброка, именно верна Теорема 2.5 (критерий управляемости Розенброка). Пара {А,В} управляема тогда и только тогда, когда выполнено ранговое усло- вие rank[AZ — А, В] = п, A G С. (2-12)
2.1. Наблюдаемость, идентифицируемость 21 Замечание 2.3. Условие (2.12) достаточно проверить для Xi е spec(A), i = 1, ...,п. Для не полностью наблюдаемой системы имеет место следующее утверждение. Теорема 2.6. Не полностью наблюдаемая пара {С, А} восстанав- ливаема тогда и только тогда, когда выполнено ранговое условие — п, А£С_, (2.13) rank XI- А С где С_ — левая открытая полуплоскость комплексной плоскости С (т. е. А е С_ если и только если Re А < 0). Доказательство. Заметим, что ранг матрицы наблюдаемости Розенброка R(C,A) = ’ XI- А' С инвариантен к невырожденной замене переменных системы. Действи- тельно, при переходе от переменны^ х_к переменным х = Рх матрицы системы {С, А} переходят в пару {С, А} = {СР-1, РАР-1}. При этом матрицы наблюдаемости Розенброка для старой и новой систем связа- ны равенством = R(C,A)P~{, L u J где Ii — единичная матрица порядка I х I. В силу невырожденности матриц, стоящих в последнем произведении слева и справа, следует, что ____ rank Д (С, А) - rank Д (С, А) для всех А е С, т. е. понижение ранга этих матриц происходит на одних и тех же значениях А и на одно и то же число. Поэтому для доказательства теоремы достаточно рассмотреть си- стему, записанную в канонической форме (2.8). В этом случае матри- цы С и А имеют блочную структуру: ‘Ан 0 . А21 А22 С=[С1,0], причем, в силу наблюдаемости пары {С\, Ап}, rank Д(С1, Ai 1) = rank XIу - Ап Ci АеС, = и.
22 Гл. 2. Наблюдаемость где и — индекс наблюдаемости пары {С^Ап}. Запишем матрицу наблюдаемости Розенброка для пары {С, А} в блочном виде AZp - Ац Я(С,А) = А21 Ci О AZn_p А22 О Так как H(Ci, Ап) имеет полный ранг, то уменьшение ранга матрицы Я(С, А) происходит только в том случае, если уменьшается ранг мат- рицы (AZn-д, - А22). Это происходит на собственных значениях матри- цы А22, характеризующей динамику ненаблюдаемой части системы. Пара {С, А} обнаруживаема, тогда и только тогда, когда матрица А22 — гурвицева. Следовательно, при всех А С_ матрица (Х1п-и — — А22), а, следовательно, и R(C, А), имеет полный ранг тогда и только тогда, когда пара {С, А} обнаруживаема. Теорема доказана. □ Замечание 2.4. Обратная связь по выходу системы не меняет спектр ее ненаблюдаемой подсистемы. В самом деле, пусть L е RnxZ — произвольная постоянная матрица, a Al = А — LC. Тогда, если пара {С, А} наблюдаема, то и пара {С, Al} наблюдаема. Если пара {С, А} восстанавливаема, то и пара {С, Al} восстанавливаема, причем спектр ненаблюдаемых частей для обеих пар совпадает. Для доказательства этого факта достаточно заметить, что при всех А е С имеет место равенство Г si - (А - LC) rank С = rank si- А С Аналогичное утверждение имеет место и для неполностью управ- ляемой системы. Теорема 2.7. Неполностью управляемая пара {А, В} стабилизи- руема тогда и только тогда, когда выполнено ранговое условие rankfAI — А, В] = п, А С_. (2.14) Замечание 2.5. Обратная связь по состоянию не меняет спектр ее неуправляемой подсистемы. В самом деле, пусть К е RnXm — произвольная постоянная матрица, а Ак = А — ВК. Тогда, если пара {А, В} управляема, то и пара {Ак,В} управляема. Если пара {А, В} стабилизируема, то и пара {Ак,В} стабилизируема, причем спектр неуправляемых частей для обеих пар совпадает.
2.2. Передаточная функция и канонические формы 23 2.2. Передаточная функция и канонические формы В теории управления самое широкое применение имеет понятие передаточной функции, которая определяется как оператор ИДз) от комплексной переменной s, связывающий преобразования Лапласа Y(з) и U(з) выхода и входа системы при нулевых начальных условиях, т. е. У(з) = W(s)U(s). Для линейной стационарной системы !х = Ах + Ви, у = Сх передаточная функция имеет следующий вид: W(s) = C(sI - (2.15) Если у е Rz, и е Кт, то W(s) е CZxm, причем элементы матрицы 1У(з) — дробно-рациональные функции комплексной переменной s. Для W(s) справедливо представление = C(adj(sl - Л))В = [ДДаД det(sl — A) а(з) где adj (si —А) — алгебраическое дополнение соответствующей матри- цы; а(з) — характеристический полином матрицы А; (<»)] — I х т матрица из полиномов от s, причем deg(/3;j(s)) < dega(s), i = j = В случае скалярной системы, когда т = I = 1, передаточная функ- ция Т¥(з) представляет собой дробно-рациональную функцию: 1У(а) = a(s) Введем следующие обозначения для коэффициентов полиномов /?(з) и a(s): a(s) = а\ + c^s + ... + ansn + sn, (2.17) /?(s) = /31+ (32s + ... + finsn~\ (здесь учтено, что deg a(s) = n, <legl3(s) < n; вообще говоря, все стар- шие коэффициенты полинома (3(s) вплоть до коэффициента с номером q могут равняться нулю, т.е. /Зп — (Зп-\ = ... = = 0,(3q / 0. Тогда число г = п + 1 — q называют относительным порядком скалярной системы, или, соответсвенно, относительным порядком передаточной функции VK(s)). 2.2.1. Канонические формы для скалярных систем. Для ска- лярной системы вводится понятие (первого) наблюдаемого канониче- ского представления системы, когда
24 Гл. 2. Наблюдаемость А = /010 0 0 1 / СВ \ САВ О 0 0 ... 1 \ -ai -02 -аз ... -ап / \ САп~'В / (2.18) 0 \ в = С' = (1,0,...,0). Теорема 2.8. Линейная стационарная система (2.2) при I — т — \ невырожденным преобразованием координат приводится к каноническому виду (2.18) тогда и только тогда, когда пара {С, А} наблюдаема. Доказательство. Необходимость. Если система приведена к виду (2.18), то для исследования наблюдаемости пары {С, А} достаточ- но найти матрицу наблюдаемости Калмана для указанного представле- ния: 7V(C,A) = ' 1 0 ... 0 ' О 1 ... О = /, rank7V(C,A) О 0 ... 1 Достаточность. Если пара {С, А} наблюдаема, то векторы С, С А, ... ,САп~{ образуют базис в Rn. В этом базисе С = [1,0,..„О] = ех. Найдем строки матрицы А в этом базисе: ei А = С А = 62, е2А = (СА)А - С А2 = 63, en-i А = (САп-2)А = САп~1 = еп, епА = (САП“1)А = САп = СД-аД - а2А - апАп~х) = = -aid - q262 - ... - апеп. Последнее равенство следует из теоремы Кели-Гамильтона. Найдем столбец В в указанном базисе. Заметим, что значения величин САгВ инвариантны к замене переменных. Действительно, при переходе к новому базису с матрицей Р С А1 В = (CP-'^PAP-'ytPB) = С А1 В.
2.2. Передаточная функция и канонические формы 25 Пусть В = (6ь6П)Т. Тогда, учитывая явное представление для мат- риц С и А в новом базисе, найдем СВ = 6Ь С АВ = Ь2, CAn~iB = bn. Теорема доказана. □ Для наблюдаемой пары {С, А} имеет место альтернативное канони- ческое представление (далее второе наблюдаемое представление) О 0 ... О — а\ 1 0 ... О —СЕ2 С = (О,...,О, 1); В = , (2.19) О 0 ... 1 — ап Wn где аг (i = 1,...,п) и (3j (J = l,...,n) — коэффициенты полиномов из (2.17). Теорема 2.9. Линейная стационарная система (2.2) при I = т = 1 невырожденным преобразованием координат приводится к каноническому виду (2.19) тогда и только тогда, когда пара {С, А} наблюдаема. Доказательство. Необходимость. Если система приведена к виду (2.19), то для исследования наблюдаемости достаточно исследо- вать пару {С, А}, заданную в этом виде. Непосредственной проверкой находим - 0 .. .00 1 - 0 . ..01* N(C,A) = 0 .. 1 * * 1 ... * * * где * — возможно ненулевые элементы, зависящие от коэффициен- тов ai. В силу того, что rankA^C, А) = п, пара {С, А} — наблюдаема. Достаточность. Пусть пара {С, А} наблюдаема. Тогда строки С, С А, ...,САп~х образуют базис в пространстве Вп. Тогда базисом будут
26 Гл. 2. Наблюдаемость также и векторы — С > еп—1 = С А + апС, е2 = САп~2 + апСАп~3 + ап_, САП~4 + ... + а3С, ei = CAn~l + апСАп~2 + an_tCAn-3 + ... + а2С. Действительно, матрицы прямого и обратного перехода от базиса С, САУ... ,САп~{ к базису е\,...,еп невырождены и имеют следующий вид: В новом базисе {ej (г = 1,... ,п) вектор С имеет, очевидно, требу- емый вид: С = (0,...,0,1). Найдем представление матрицы А в этом базисе. Первая строка А имеет вид eiA = CAn + anCAn~' +... + а2СА = = (САп + апСАп~1 + ... + a2CA + aiC)-aiC. По теореме Кели-Гамильтона C(An + anA’l~1 + ... + Q1) =0, поэтому е\А = —оцС = —сцеп. Вычисляя остальные строки Ai матрицы А, получим 62^4 — САГ 1 + апСАп ос^СА = ej — су2^п> ^п—1А — СА И- otnCА — еп—2 dn—\en СпА — С А — еп—[ с^пеп Таким образом, матрица А в указанном базисе также имеет требу- емый вид: ’ 0 0 ... 0 — а\ 1 0 ... 0 — &2 0 0 ... 1 -ап
2.2. Передаточная функция и канонические формы 27 Пусть в указанном базисе В — (bi,Ъп)Т. Найдем передаточную функцию системы, учитывая явное выражение для А и С: W(s) = С (si - А)-1 В = C-^-Ir v ’ v 7 det(s/-A) Матрица А является сопровождающей для полинома a(s) = а\ + a^s 4- + ... 4- ansn~x + sn, поэтому det(sl — Л) = a(s). Так как С = [0,...,0,1], то для нахождения числителя передаточной функции достаточно найти последнюю строку матрицы adj(sl — А) (т.е. [adj(sl — А)]п): [adj (si — А)] п s 0 ... 0 а\ — 1S... 0 «2 = [1, S, S2, s”-1 0 0 ... -1 (s + an) Поэтому числитель передаточной функции ’ bi (3(s) = [1, s, s2,sn *] • = bi + b%s 4- ... + bnsn Учитывая обозначения для коэффициентов полинома /?(s) из (2.17), находим bi = (3i-, B = (fa,...,(3n)T. Теорема доказана. Аналогичные канонические формы имеют место для управляе- мой системы. Управляемым каноническим представлением называют представление системы (2.2), где А — / 0 0 1 0 0 ... 0 \ 1 ... 0 В — (2.20) 21 0 \ -«1 0 —СХ-Ч 0 ... 1 -аз ... -ап / .)• 0 1 ) Имеет место утверждение. Теорема 2.10. Линейная стационарная система (2.2) при I = = т = 1 невырожденным преобразованием координат приводится к виду (2.20) тогда и только тогда, когда пара {А, В} управляема.
28 Гл. 2. Наблюдаемость Доказательство теоремы опускаем, так как оно аналогично доказа- тельству теоремы 2.9. 2.2.2. Канонические формы для векторных систем. Опишем теперь канонические формы для векторных систем, т. е. для случая I > 1 (т > 1). Пусть, как и ранее, пара {С, А} наблюдаема, тогда гапкА^С, А) = п и среди строк матрицы наблюдаемости N(C, А) мож- но выбрать п базисных. Обозначим строки матрицы С как С;, i = 1,...,Z, тогда базисные строки будем искать среди строк Укажем два способа построения канонического базиса. Способ 1. Будем перебирать строки Ci, С\А,..., С\Ащ~х до тех пор, пока строка С\АЩ не будет выражаться через предыдущие строки. Если щ — п, то система наблюдаема по выходу у\ — С\х (т. е. наблюда- ема пара {Ст; А}) и задача сводится к построению канонической формы для системы со скалярным выходом. Если < п, то последовательно присоединяем строки Сг, С2А,..., С^А^2-1 до тех пор, пока строка С^А"2 не будет выражаться через строки {С\, С\А,..., С\А171”1, С2,..., С^А172-1}. Если v\ + z/2 < то последовательно присоединяем строки Сз, С3А,...,СзА^-1 и т.д. В результате получим систему из п линейно независимых вектор- строк {Cx-C\A-...-CiAu'-x-C4\.-.\C2Av^-,...-Ck-,...-,CkAUk-x}, (2.21) I. Если к < Z, то, значит, система Ук) (т. е. наблюдаема пара {С; А}, причем щ + г/2 4- • • • 4- Vk = 1 к наблюдаема по выходу у = (yi, / G \ где С = Возьмем набор векторов (2.21) в качестве нового базиса. Заметим, что для базисных векторов ej в случае, если j ф у\ +1/2, v\ 4- ^2 4- + 1/3, ... , и\ 4-... 4- Vk = п, имеет место равенство eg А = . Если же j = v\, pi + 1/2, ...л + ••• 4- = п, то ejА = CiAUi, а, следовательно, е^А выражается через предыдущие базисные векторы. Таким образом, в новом базисе матрицы А и С имеют следующую структуру: С1 0 0 ... О “ о с2 о ... о с = ООО. .. Ск (2.22) L °fc+l • -^к •• ° fc+1 J
2.2. Передаточная функция и канонические формы 29 здесь Ci = [1,0, ...,0] е R1XP<, С^+1 G k>/v' — некоторые матрицы; (2.23) . ^4fci Ak2 Akk . ’О 1 0 ... О" О 0 1 ... О е R О 0 0 ... 1 * * * ... * где * — возможно ненулевые элементы матриц Ац и Aij. Так как матрица А в указанном базисе имеет блочно-треугольный вид, то ее характеристический полином равен произведению харак- теристических полиномов диагональных матриц Ац, которые, в свою очередь, имеют вид сопровождающих матриц для некоторых полино- мов. _ Заметим также, что каждая из пар имеет первую кано- ническую форму наблюдаемости. Кроме того, система наблюдаема по первым к выходам, поэтому без ущерба для наблюдаемости последние (Z — к) строк матрицы С могут быть отброшены. Каноническую форму (2.22)-(2.23) называют первой канонической формой наблюдаемости для векторных систем. Отметим, что эта форма определяется неоднозначно, так как процесс перебора векторов можно начать не с вектора С\, а с любого G. При этом количество клеток и их размер могут зависеть от порядка этого перебора. Опишем способ построения альтернативного канонического базиса для системы (2.2). Способ 2. Среди строк матрицы наблюдаемости выберем сначала строки {С\, Если матрица С полного ранга (что предполага- ется), то эти строки линейно независимы. Будем добавлять к этому набору последовательно строки С\А, С%А, ...,CiA так, чтобы набор состоял из линейно независимых векторов. Если СгА выражается через предыдущие векторы, этот вектор в набор не включаем и переходим к Далее перебираем векторы CiA2, потом СгЛ3 и т. д. до CiAy~[, где v — индекс наблюдаемости пары {С,Л}. Заметим, что если СгА3 выражается через предыдущие векторы, то и СгАя при q > j
30 Гл. 2. Наблюдаемость также выражается через эти векторы. Поэтому в результате указанной процедуры (после перенумерации) получим набор базисных векторов где i/j 1, i = 1,..., Z; v\ + . + vi = п. кроме того, max щ = р. Действительно, если maxz/2 < z/, то базисный набор векторов най- дется среди строк матрицы С СА = Nmax„i(C,A). ^^(max Vi) -1 Но это означает, что rank7Vmax^(C', А) = п, и и не является минималь- ным значением, при котором выполняется ранговое условие rank Ny (С, Л) = п, что противоречит определению индекса наблюдаемости. В указанном базисе матрица С имеет блочно-диагональную струк- туру С1 о ... о о с2 ... о О 0 ... Cl Сг = [1,0, ...,0] еГ. (2.24) Найдем матрицу А в этом базисе. Для этого заметим, что если i i/i, р\ + z/2, • ••> И + ... + vi = п. Если же i — р\, р\ + z/2,..., p\ + + ... + vi = n, то вектор eiA выражается через все базисные векторы. Таким образом, матрица А имеет вид >111 >^21 >112 • >122 • • • Ац ' >121 (2.25) А = Ai2 • • • Ац _ где диагональные элементы имеют вид сопровождающей матрицы для некоторого полинома -0 1 0 ... О' 0 0 1 ... 0 Ац — , Ан (2.26) ООО.. . 1 * * *
2.2. Передаточная функция и канонические формы 31 здесь * — возможно ненулевые элементы. Внедиагональные матрицы имеют вид 0 0 .. 0- 0 0 . .. 0 А^- — , Aij е (2.27) 0 0 . .. 0 * * • • * Заметим, что размер максимального диагонального блока равен ин- дексу наблюдаемости пары {С, А}. Каноническую форму (2.24)-(2.27) будем называть второй канонической формой наблюдаемости для векторных систем. Опишем еще одну удобную каноническую форму наблюдаемости, следуя при этом работе Люенбергера [78]. Для этого из матрицы на- блюдаемости вновь выберем строки, как было предложено в способе 2 и составим матрицу ’ Ci ' С\А С\АЩ~{ С2 С2А^-[ CiA^-1 Найдем матрицу У-1; обозначим через G — столбец матри- цы У-1 с номером Oi = и\ 4- ... + щ (i = 1,...,Z). Матрица перехода к каноническому базису Люенбергера имеет следующий вид: В новом базисе х = М 1х матрицы А = М х AM и С = СМ имеют вид Ан А12 ... Ац A2i А22 ... A2i Ац А[2 ... Ац (2.28)
32 Гл. 2. Наблюдаемость где диагональные матрицы имеют форму сопровождающей матрицы: - 0 0 .. 0 * 1 0 . .. 0 * Ац — 0 1 . .. 0 * , Ац еГ4’41'4, (2.29) . 0 0 . .. 1 * внедиагональные блоки имеют вид -о .. 0 .. ,. 0 * .. 0 * , AijeW^. (2.30) Aij — 0 . .. 0 * Матрица С в новом базисе имеет вид 'Cl 0 0 ... 0 С21 С2 0 ... 0 с = Сз1 С32 Сз ... 0 (2.31) .Си С12 С13 ... Ct. Ci GR1*"4, Ci = [О,..„О, 1], CjieRlx,'i> Cji = [О,...,О,*]. где Так как строки Cji (j = i + 1,... J) линейно выражаются через Ci, то невырожденной заменой выхода матрица С может быть приведена к виду Сх 0 ... О О С2 ... О (2.32) О 0 ... Cl В указанном базисе система распадается на I подсистем порядка щ с фазовыми векторами Xi е При этом компоненты выхода (по- сле преобразования матрицы С к блочно-диагональному виду (2.32)) соответствуют последним координатам векторов Xi. Из явного пред- ставления внедиагональных матриц "О ... О * = [0, ...,0,ао], eFxl, О ... О * следует, что AijXj ~ aijyj-
2.3. Каноническое представление с выделением нулевой динамики 33 Таким образом, в каноническом базисе Люенбергера система мо- жет быть записана в виде ' i ii Uijyj 4- BiU, i — 1,..Z, . < Vi — CiXi, т. e. система распадается на l подсистем порядка иг каждая, связь между которыми осуществляется через компоненты yj вектора выхода. Размерность максимальной из подсистем равна в точности индексу наблюдаемости пары {С, А}. Каждая из пар {Ci,Aa} наблюдаема, более того, задана во второй канонической форме наблюдаемости для скалярных систем. Заметим, что в отличие от первых двух наблюдаемых канонических форм переход к форме Люенбергера осуществляется не только заменой координат, но и преобразованием выходов. Аналогичные канонические формы можно указать для управляемых систем. Подробности опус- каем. 2.3. Каноническое представление с выделением нулевой динамики Рассмотрим еще одно каноническое представление системы общего положения (2.2), при котором выделяется нулевая динамика системы. Как и ранее считаем, что система находится в общем положении, т. е. пара {А, В} управляема, а пара {С, А} наблюдаема. Кроме того, будем рассматривать квадратные системы, т. е. системы, у которых размерности входа т и выхода I совпадают (т. е. и, у е Rz). 2.3.1. Нулевая динамика скалярной системы. Рассмотрим вна- чале случай скалярной системы, т. е. когда 1=1. Скалярная систе- ма (2.2) общего положения невырожденным преобразованием коорди- нат может быть приведена к канонической форме управляемости: f Х\ = Х‘2, < ' хп—\ = хп, (2.34) < Хп — О£[Х1 ... + и, у = (3\Х\ + ... + /3п^п. Под нулевой динамикой системы (2.34) по традиции понимают дви- жение в системе, целиком принадлежащее многообразию у = Сх = 0. Для линейных стационарных систем нулевая динамика так же описы- вается системой линейных стационарных уравнений. Поэтому можно определить характеристический полином этой системы, который далее называем характеристическим полиномом нулевой динамики. 2 С. К. Коровин, В. В. Фомичев
34 Гл. 2. Наблюдаемость Для квадратных систем характеристический полином нулевой ди- намики является определителем матрицы Розенброка, [86]: (3(s) = det R(s) = det (2.35) Наиболее просто характеристический полином нулевой динамики определяется для скалярных систем. В этом случае определена пере- даточная функция W(s) = C(sI-A)~lB = ^4, (2.36) а(з) где q(s) и /3(«) — полиномы от s, dega(s) = n, deg/?(s) < n. Полином a(s) является характеристическим полиномом матрицы А, а полином /3(s) — характеристическим полиномом нулевой динамики. Для ска- лярных систем общего положения относительным порядком системы является число г такое, что выполнены условия СВ = 0, САВ = 0,..., CAr~2B = 0, CAr~xB^Q, при этом deg/3(s) = п — г. Из определения относительного порядка следует, что первые (г — 1) производные выхода y(t) по времени не зависят явно от входа u(t), a y^r\t) зависит от u(t) явно, точнее = САгх + САг~хВи. Заметим также, что в канонической форме (2.34) аг и fy являются коэффициентами полиномов a(s) и /?($) соответственно, т. е. справед- ливы представления: Q(s) = sn + ansn-1 -h... + ач, /3(з) =/Зпз”-1 ++ ... +/Зь где старшие коэффициенты (3j могут равняться нулю. Пусть относительный порядок системы равен г, не ограничивая общности рассуждений, можно считать, что CAr~[B = 1 (этого всегда можно добиться нормировкой выхода ?/(/)), тогда /3(з) = sn~r + /3n_rs”-r~1 + ... + /31, где /5п-г+1 = CAr~{B = 1. В этом случае для приведения систе- мы (2.34) к каноническому представлению с выделением нулевой ди-
2.3. Каноническое представление с выделением нулевой динамики 35 намики следует перейти к координатам: хь У - У\ = У — Сх, У2 = у = с Ах, Уг = уО--!) = сАг-'х. Матрица перехода от координат координатам I , I имеет вид х к О О О о о о 1 о О ... О р = С1 О С2 С1 detP = 1. В вид: новых координатах уравнения системы принимают следующий 1 О 1 О О О О Х[ = Х2, -/31X1 - /32х2 - ... - /3, У\ = У2, (2.37) Уг—1 — Уг> Уг = -'YjliXi - ^jyjyj + и, У = У1- 2*
36 Гл. 2. Наблюдаемость Систему (2.37) можно записать в компактном виде: ' х’ = Ацх' + А12у, У1 = У2, Уг—\ = Уг> < Уг = -рх' - уу' + и, (2.37') где матрица Ац имеет вид сопровождающей матрицы полинома /3($), Р = (т/1,... ,7/п-г), 7 = (7ь ••• ,7г), А12 = (0,...,О,1)г. Удобство представления системы в виде (2.37’) заключается в про- стоте получения уравнения нулевой динамики системы в виде: х' = Ацх', которое определяется первой (п — г)-мерной частью системы, в то время как остальные координаты являются производными выхода. Для коэффициентов и 77 имеет место Теорема 2.11. Пусть задана система общего положения (2.2) со скалярными входом и выходом, передаточная функция системы 1У(«) = С {si — А)-1 В = г^е и Z?(5) ~ взаимно простые полиномы dega(s) = n, deg/3(s) = т, старшие коэффициенты по- линомов равны 1, определены полиномы и ^(s), частное и остаток от деления а(з) на (3{s) : a(s) /Ф) / X ^(s) = '’w + W deg 99(5) = n — m = r, deg ^(s) < m = n — r. Тогда ту и из канонического представления (2.37) являются ко- эффициентами полиномов ^(s) и <р($) соответственно, т. е. p{s) = sr + ^rsr~x + ... + 71, _ _i (2-38) 0(s) -snr lr)n-r + ••• + m- Доказательство. Пусть полиномы </>($) и ^(s) имеют структуру (2.38), где pi и — коэффициенты из канонической формы (2.37). Покажем, что они являются соответственно частным и остатком от деления полинома a(s) на /3($). Для этого проведем преобразование Лапласа при нулевых начальных условиях для системы (2.37'). Тогда, сохраняя за преобразованиями Лапласа от координат те же обозначе- ния, что и за прообразами, получим соотношения (si - Ли)/ = Л12У => х' = (si - Лц)-1Л12?/.
2.3. Каноническое представление с выделением нулевой динамики 37 Из последней строки (2.37') следует: sry = —rjx' — ^2 5,7-12/ + и- Отсюда следует, что (sr + 7rsr-1 4- ... + 7i)?/ + r]xf = p(s)y + rj(sl - Ап)"1^^?/ = и. Учитывая явное представление для Ац и А12, получим ^/-л11)-1а12 = ^, тогда / \ V’(s) Так как у = то и — ^^-у. Следовательно, p(s) является частным а(з) Д(з) от деления а($) на /3(s), a ?^(s) — остатком. Теорема доказана. □ 2.3.2. Нулевая динамика векторных систем. Укажем теперь алгоритм приведения векторной системы к каноническому виду, анало- гичному виду (2.37'). Относительно системы (2.2) будем предполагать, что она находится в общем положении, размерности входа и выхода совпадают (т. е. система является квадратной). Кроме того, пусть для системы (2.2) выполнено определение относительного порядка вектор- ной системы по А. Исидори, [60]. Определение 2.8 (по Исидори). Вектор г = (п,... ,г/) — вектор относительного порядка системы (2.2), если выполнены условия: 1) CiAiB = 0,j= ,ri— <2\CiAri~{B для всех i = ’ CiA^-^B ' 2) det H(r\,... ,ri) = det CiAri~{B /0, где Ci — строки матрицы С. Условие 1) определения означает, что производные от выхода yi = = CiX до порядка (77 — 1) включительно не зависят явно от входа и, а п-я производная явно зависит от и. Условие 2) означает, что матрица Я(п,... ,п) = Н(г) при управле- нии u(t) е в уравнениях для 77-х производных выходов невырожде-
38 Гл. 2. Наблюдаемость на, т. е. - СМГ1 “ С2АГ2 х + Н(г)и. CiAri Здесь важно подчеркнуть, что условия определения по Исидори могут быть несовместными для квадратной линейной стационарной системы общего положения, [17], что иллюстрирует Пример 2.1. Рассмотрим систему общего положения: f Х\ = Х2 + Щ, < Х2 = Жз, ч ±3 = U2 У1 =хг, У2 = XI +х2. В этом случае I = 2. Находим п и г2 из определения 1: СМ = (1,0) => П = 1, С2В = (1,0) => r2 — 1. Однако для вектора г = (1,1) матрица Я(г) имеет вид 1 О 1 о Я(1,1) = detH(l,l)=0, т. е. условия 1) и 2) из определения 2.8 несовместны. Следовательно, для рассматриваемой системы относительный порядок в смысле Иси- дори не определен. Покажем, что в случае, когда определение по Исидори выполнено, система (2.2) приводится к специальному каноническому виду с выде- лением нулевой динамики, а именно, система распадается на две части: первая описывает нулевую динамику системы, ее входом является выход системы у(Г)\ вторая представляет собой производные различных порядков от выходов уг. Преобразование разобьем на несколько этапов. Вначале докажем вспомогательную лемму. Лемма 2.3. Пусть система (2.2) наблюдаема, rank С = I, rank В = I, выполнены условия определения по Исидори. Тогда стро- ки Сь СМ,..., СМГ1-1, С2, СМ,..., СМГ2~1, С3,..., СМП-1 - линейно независимы. Доказательство. Покажем, что линейно независим набор век- торов Ci, С\А,..., CiAri~x. Предположим противное, пусть эти век-
2.3. Каноническое представление с выделением нулевой динамики 39 торы линейно зависимы. Тогда найдутся не все равные нулю числа 7*, 7р ..., 7р, 72, • • •, 7? такие, что I Vi =0. (2.39) г=1 J=1 Домножим это тождество на матрицу В справа. Учитывая условие 1) определения относительного порядка, получим 7pCi АГ1~[В + 7рС2АГ2~1В + ... + 7рСМГ1"1В = 0. Из условия 2) определения следует, что строки СгАГг~[В линейно независимы, поэтому 7р = 0 для всех i = 1,... ,1. Таким образом, (2.39) примет вид ££7’см’-'=о. г=1 j=l Домножим это тождество справа на АВ. Учитывая условия 1) и 2), получим, что 7р-1 = 0 для всех i — 1,...,Z. (При этом, если г7- = 1 для какого-либо J, может оказаться, что в линейную комбинацию из CiAri~xB входят не все слагаемые.) Продолжая аналогичные рассуж- дения получим, что все = 0. Лемма доказана. □ Из леммы 2.3 следует, что в качестве части новых координат можно взять следующие переменные: у[=С\х, yl=C2x, y{=Ctx, yl=CiAx, у^ = С2Ах, .... y\=Cix, (2.40) ylri = CrA^x, y2r2 = C2Ar^lx, .... ylri = CiAr‘~lx. Обозначим |r| = п + ... + и — длину вектора г. Тогда (2.40) дает |г| координат. Остальные п — |г| координат выберем по произволу так, чтобы преобразование координат было невырождено. Введем обозначения:
40 Гл. 2. Наблюдаемость а дополнительные координаты обозначим через х' е Rn“'rL В новых координатах система примет вид i X = Ап х' + + Вги, 1=1 ' i/l = у2 У2 = Уз < . Уг,-1 — Уг^ / • 9 9 У1 = У2 < : •2 2 Уг2-1 =Уг2< (2-41) / УГ! \ Уг2 ' у\ = У12’ . У1Г1-1 = у1Г1 I = А2[ Х' + 52^22 yi + H(r\,...,ri)u, i=l \ У1п / где Ац, А21, Л[2, А22 — постоянные матрицы соответствующих разме- ров, однозначно определяемые преобразованием координат и парамет- рами системы. Заметим, что матрица Я(г) = Н(п,...,п) невырождена, поэтому невырожденным преобразованием первых (п — |г|) координат: / Уп \ х' = ~х — В\Н~{(г) • \ У1п / можно на 2-м шаге добиться того, что первые (п - |г|) координат не будут явно зависеть от и(Г). В новых координатах первые (п — |г|) уравнений системы примут следующий вид: i X = Ап + й, (2.42) г=1
2.3. Каноническое представление с выделением нулевой динамики 41 где матрицы Ац, А[2 однозначно определяются указанной заменой координат. В представлении (2.42) координаты х' зависят явно не только от выходов yi, но и от их производных (т. е. от полных векторов у^. Покажем, что можно избавиться от этих производных. Для этого покажем, что в представлении (2.42) можно избавится от зД = у^'1) — старшей (и — 1)-й производной первого выхода. Запишем (2.42) подробнее: I Г1 X = Ап x' + ^Ai2 t/i + 52(A}2 ) у}, (2.43) i=2 j=l 3 где (a}2) — столбцы матрицы Л}2. Учитывая, что y^_t = у^, прове- дем замен^ х'= х'- [а\^ у\_х. (2.44) Тогда ) . у} - И12)п • Ут, = 7 3 — А^х1 + Ац • (А}2 ) \ / Г1 I Г\ -1+ Vi + У? (-412 i=2 j=l I Г1 — 1 = An? + £ (Jr12) у, + £ (a}2) y}. (2.45) г=2 V j=\ X Уравнение (2.45) отличается от (2.43) тем, что в него не входит ухГ{, при этом изменились столбцы при (j = 1,..., п - 1). Таким образом, замена координат позволяет избавиться от у\х в первой (п — |г|)-мерной части системы. На следующем шаге аналогично можно избавиться от y^-i (учи- тывая, что у^-2 ~ потом от у^-2 И т- Д-> пока от вектора у1 не останется только координата у\ = yi, т.е. первый выход системы. После этого по той же схеме можно избавиться последовательно от производных остальных выходов системы. При указанных заменах координат в оставшейся части системы уравнения для у* (г = 1,... J, j = 1,..., п — 1) не изменятся, изменятся только уравнения для высших производных yi, т. е. для координат угг,. Таким образом, доказана Теорема 2.12. Пусть линейная стационарная квадратная систе- ма (2.2) находится в общем положении, для нее определен вектор
42 Гл. 2. Наблюдаемость г = (г1,...,п) относительного порядка по Исидори. Тогда система невырожденным преобразованием приводится к виду: х' = Анх' + Л123/, у'= Уг1+1’ г = - 1; У2=У2+1, г = 1,...,г2 - 1; y\=yli+H г=1,...,п-1; Уг\ \ I : = A2\x' + ^Аг22 yt + Н(г)и, \ у1п / (2-46) который является каноническим представлением системы с выде- лением нулевой динамики. Следствие 2.2. Нулевая динамика системы соответствует [п — \г\)-мерной первой части системы и описывается уравнением xf = Апа?'. Следствие 2.3. Легко проверить, что для системы (2.46) выпол- нено определение векторного относительного порядка по Исидори для вектора г = (ri,...,rj). Следовательно, приводимость системы общего положения (2.2) к виду (2.46) является необходимым и достаточным условием выполнения условий определения относи- тельного порядка. 2.4. Нестационарные линейные системы Опишем теперь каноническое представление для линейной неста- ционарной системы (см. [87]). Далее будем рассматривать однородную систему вида x(t) = A(t)x(t), у = C(t)x(t). Рассмотрим преобразование координат с матрицей L(t): x(t) = L(t)x(t). (2-47) (2.48) Пусть L(t) е Rnxn обратима при всех t, | det L\ const > 0, L(t), L(t) и b-1(t) — непрерывные и ограниченные матрицы (осуществляющие преобразование Ляпунова). Имеет место следующее утверждение, [87].
2.4. Нестационарные линейные системы 43 Лемма 2.4. Пусть система (2.47) равномерно дифференциаль- но наблюдаема (в смысле определения 2.5). Тогда найдется невы- рожденное (ляпуновское) преобразование (2.48), приводящее систе- му (2.47) к виду _ Г j(t) = A(t)x(t), \ y(t) = C(t)x(t), где Aoo(t) Aoi ... Ло/ A(t) = - L~\t)L(t) = Лю(£) Ац ... Ац Aio(t) Ац ... Ац _ _ _ _ (2.50) C(t) = C(t)L(t) = [Ci^jO], Ci(t) G RixZ, Ci(i) > 0 (положительно определена). _ _ Матрицы Aij при j 1 из блочного представления матрицы A(t) не зависят от t и имеют вид ’О 1 0 ... о- 0 0 1 ... О Ац G j=l О 0 0 ... 1 О 0 0 ... О Aoi = [ел0], ei G R;xl — г-й базисный вектор; Aoi G R(x(l?i Ai3=0, Azj G R^-Ox^-l), iyj= Здесь, как и ранее, щ — индексы наблюдаемости, щ + и% + ... + щ = = п. Матрицы A^t) е i = 1,...,1, и Aw(t) е RZxZ содержат все зависящие от времени компоненты матрицы А. Замечание 2.6. Если указанное преобразование проводится для системы (2.1), то матрица B(t) переходит в B(t) = L~\t)B(t). Замечание 2.7. В новом базисе система (2.47) может быть записана в виде совокупности (Z + 1) подсистемы, т. е. в следующем виде: ±0 = Aoo(t)xQ + ^Ог^г, < i=\ Xi= АцХг+ Aio(t)xo, у = Ci(t)rr0.
44 Гл. 2. Наблюдаемость Указанное каноническое представление подобно наблюдаемому представлению Люенбергера и обобщает наблюдаемое представление Туела для зависящих от времени линейных систем, [106, 117]. Процедура построения ляпуновского преобразования L(f) для при- ведения системы к описанному каноническому виду может быть осу- ществлена по алгоритму, описанному в [87]. а) . Для любого момента времени t 0 однозначно определяется матрица наблюдаемости полного ранга, (2.6): N(t) = : , Qi(t) = С(£); = Qi(t)A(t) + Q^t). Qn(t) Из строк этой матрицы выбираются базисные в соответствии с про- цедурой, подробно описанной для стационарных систем (способ 2). Кроме того, предполагается, что набор строк, удовлетворяющий этой процедуре при t = 0, удовлетворяет ей и при всех t 0 (и являться базисным при t 0). Обозначим j-ю строку матрицы Индексы наблюдае- мости z/fc, к = 1,...,/, означают максимальное значение для первого индекса строки т.е. 1 i Vj, при этом индекс j соответствует j-му выходу системы. В частности, q\j(t) = Cj(t) — строки исходной матрицы C(t). Составим невырожденную матрицу M(t) е Rnxn из выбранных ба- зисных строк, упорядочив их следующим образом: M(t) = Mi(t) M2(t) M^t) = где 9^1.1 9^,2 Qvi.l - a содержит оставшиеся строки qij(t), j = 1, ...,Z; г = 1, ...,^ — 1. б) . Пусть i = 1, ...,Z, — г-е столбцы матрицы Af-1(t). в) . Определим векторы kj е Rnxl, i = 1,..., Z, j = 1,..., lu(t) = i = 1, ...,Z; - iij-i(t), i = j = 2, ...,^.
2.4. Нестационарные линейные системы 45 г) . Построим матрицы М*) ~ > ^2,1/2 >•••’ ] > -^г(^) ~ [Уг,1/1 —1 j 2> • • •» ^г,1]> ~ !,•••»/• д) . Окончательно матрица L(t) е Rnxn, осуществляющая искомое ляпуновское преобразование, приобретает вид L(t) = [Lo(t);Li(t);...;L/W]. Заключение. В главе 2 рассмотрены понятия наблюдаемости и идентифицируемости для линейных динамических систем (определе- ния 2.1-2.2). Для линейных стационарных систем приведены критерии наблюдаемости Калмана (теорема 2.2) и Розенброка (теорема 2.3). Для линейных стеционарных систем приведены канонические фор- мы: калмановская декомпозиция, канонические формы наблюдаемости (для скалярных и векторных выходов), каноническая форма Люенбер- гера, каноническая форма с выделением нулевой динамики. Приведена каноническая форма Люенбергера для линейных нестационарных си- стем.
Глава 3 НАБЛЮДАТЕЛИ ПОЛНОГО ФАЗОВОГО ВЕКТОРА ДЛЯ ПОЛНОСТЬЮ ОПРЕДЕЛЕННЫХ ЛИНЕЙНЫХ СИСТЕМ В этой главе рассматриваются полностью определенные линейные стационарные системы х = Ах + Ви, У = Сх, (3.1) где х е — неизвестный фазовый вектор, u(t) е Rm, y(t) G — известные вход и выход системы; А, В и С — известные постоянные матрицы соответствующих размеров, причем С и В — матрицы полного ранга. 3.1. Полноразмерные наблюдатели Рассмотрим задачу о построении асимптотического наблюдателя, формирующего оценку неизвестного фазового вектора x(t). Вначале опишем наиболее простые методы построения наблюдателей, размер- ность которых совпадает с размерностью системы (3.1) (так называе- мые полноразмерные наблюдатели). Докажем следующее фундаментальное утверждение, играющее важную роль в теории наблюдения. Имеет место Теорема 3.1. Пусть пара {С, А} наблюдаема. Тогда для лю- бого полинома <pn(s) = 7i + 72s -I-... + /ynsn~l + sn с вещественны- ми коэффициентами s е С, найдется матрица L g RnxZ та- кая, что <pn(s) является характеристическим полиномом матрицы Al = A — LC, т. е. det(sl - AL) = Vn(s)- Замечание 3.1. Фактически теорема 3.1 утверждает, что для на- блюдаемой пары {С, А} выбором матрицы L спектр матрицы Al может быть назначен по произволу (с естественным ограничением, что спектр должен быть симметричен относительно вещественной оси в С).
3.1. Полноразмерные наблюдатели 47 Доказательство утверждения можно проводить в каком-либо специально выбранном, например каноническом, базисе. Действитель- но, пусть преобразование координат с матрицей Р,_т. е. х = Рх, пере- водит пару {С, А}, в пару {С, А}, где С = СР~Х, А = РАР~\ Тогда характеристические полиномы матриц Al = А — LC и Al = A — LQ, где L = PL, совпадают, а,_следовательно, указав выбор матрицы L, найдем и матрицу L = P~XL. Рассмотрим вначале случай 1=1. Если пара {С, А} наблюдаема, то она невырожденным преобразованием может быть приведена ко второму наблюдаемому каноническому представлению, (2.19): " 0 0 ... О — а\ ' 1 0 ... О —«2 _ 0 0 ... 1 — ап _ С = (0,...,0,1). Пусть L = (Zi, ...,Zn)T• Тогда 0 0 . .. 0 -(«1 + ll) 1 0 . .. 0 -(а2 + Z2) Al = A-LC = 0 1 . .. 0 -(«з + h) О 0 ... 1 — (ап + 1п) _ a det(sl - Al) = sn + (ап + ln)sn 1 4-... + (оц + Zi). Выбрав Ц = ^- — аг, получим det($Z - Al) = ^Pn{s). Таким образом, для Z = 1 утверждение доказано. Перейдем теперь к общему случаю Z > 1. Докажем вспомогательное утверждение. Лемма 3.1. Пусть пара {С, А} наблюдаема и Ci — строки мат- рицы С. Тогда для любой строки Ci ф 0, i = 1, ... ,Z, найдется мат- рица Li е RnxZ такая, что пара {Ci, А — LiC} также наблюдаема. Доказательство. Не ограничивая общности рассуждений, рас- смотрим i = 1. Так как пара {С, А} наблюдаема, то rank N(С, А) = п, среди строк матрицы N(C, А) есть п линейно независимых. Выберем их в соответствии со способом 1 (см. гл. 2). Это будут векторы v\ + ... + Vk = П, к I.
48 Гл. 3. Наблюдатели полного фазового вектора Определим матрицу Р е Rnxn, строками которой является этот набор векторов в указанном порядке. Определим матрицу S 6 RnxZ ei — i-я строка единичной I х I матрицы. Покажем, что матрица Li = = P~{S удовлетворяет условиям леммы 3.1. Запишем матрицу S = PL\ в виде Ci Cl А CkA^-1 S = О О -е2 О О -е3 -Cfc-l О О Это матричное равенство соответствует следующему набору векторных равенств: ' CiLi=0, CiALi=0, = -е2, C2Li=0, C2ALi=0, =-e3> < (3.3) Cfc_iLi=0, Cfe-!ALi =0, .... Cfc-iA^-'-’L! =-efe, k CfcLi = 0, CfcAii = 0, .... CkAv^xLx = 0.
3.1, Полноразмерные наблюдатели 49 Для того чтобы доказать, что пара {Ci, А — L\C} является наблю- даемой, требуется доказать, что линейно независимы строки Ci; Ci(4-LiC); Ci(A-LiCT)2, ...Ci(A - LiC)n~'. С помощью равенств (3.3) найдем Ci =Ci, Ci(A-LiC) =CiA C^A-LiC)2 = СМ2, CiM-LiC)"1-1 = CiA'"1, С, (Л - LiC)"1 = СА^-^А - LiC) = С А1'1 + е2С = CAV' + С2, CiM-LiC)"^1 =СА^ +С2(Л-Ь1С) = С2Л +[...], С1(Л- L\C)V'+2 = С2Л2 + С1(Л - = СкА^~1 + [...]. (3.4) В этой системе скобки [...] использованы для обозначения линейных комбинаций предшествующих векторов. В силу того, что (3.2) представляет собой набор линейно независи- мых векторов, вектора (3.4) также линейно независимы. Лемма доказана. □ Теперь перейдем непосредственно к доказательству теоремы. Пусть пара {С, А} наблюдаема. Тогда рассмотрим матрицу Li такую, что пара {С\,А — L\C} — наблюдаема. Так как для случая I = 1 утверждение теоремы доказано, то найдется матрица L е Rnxl такая, что матрица AL = (А — L\C)—Т! С\ имеет заданный спектр. Рассмотрим матрицу L' = [l'O...O] €R"xZ. Тогда матрица Al из условия (3.4) может быть записана в виде Al = (А - (Li + L')C) = А - LC, где L = L\ + L'. Теорема доказана. □
50 Гл. 3. Наблюдатели полного фазового вектора Замечание 3.2 (к лемме 3.1). Из наблюдаемости пары {С, А} не следует, вообще говоря, наблюдаемость пары {Ci, А} для какого-либо i = 1,...J. Более того, матрица А может быть ненаблюдаема ни по какому вектору Cf е R1Xn! Рассмотрим следующий Пример 3.1. Пусть задана система с матрицами /0 1 0\ А = | 0 0 0 I , \о о о/ _ /1 0 0\ \0 0 1J ' Тогда матрица наблюдаемости для пары {С, А} имеет вид N(C,A) = -1 0 о _0 о о- О 1 1 о о 0. rank7V(C, А) = 3, т. е. пара {С, А} наблюдаема. Однако для любого вектора С' = (сьС2,сз) матрица наблюдаемости 7V(C",A) = С\ С2 Сз О С2 О ООО имеет ранг не выше второго. Таким образом, пара {С', А} ненаблю- даема ни по какому вектору С*', в том числе и по векторам С\ и С^, строкам матрицы С. Перейдем теперь к задаче построения асимптотического полнораз- мерного наблюдателя для линейной стационарной системы (3.1). Это легко сделать, опираясь на теорему 3.1. Пусть задана линейная стационарная система, (3.1): !х = Ах + Ви, у = Сх. Полноразмерный наблюдатель для этой системы построим в виде х = Ах + Ви — L(Cx — у), х Е Rn, (3.5) где матрицу обратной связи L выберем из условия гурвицевости матри- цы Al = А — LC. Это всегда можно сделать при наблюдаемости пары {С, А}. Ошибка наблюдения е = х — х в этом случае удовлетворяет дифференциальному уравнению ё = х — х = Ах + Ви — Ах — Ви — L(Cx — Сх) = Al£, и, в силу гурвицевости матрицы Al, e(t) 0 при t —> ос. Более того, так как ошибка оценивания е удовлетворяет указанному выше
3.1. Полноразмерные наблюдатели 51 линейному стационарному уравнению, то e(t) —> 0 экспоненциально, причем выбором матрицы L скорость сходимости может быть задана по произволу. 3.1.1. Алгоритмы синтеза наблюдателей с использованием раз- личных канонических форм. Укажем некоторые явные алгоритмы для синтеза матрицы обратной связи L. В случае, если I = 1, наиболее просто коэффициенты матрицы L находятся, если система (3.1) задана во второй наблюдаемой канони- ческой форме. Метод синтеза L для этого случая изложен в доказа- тельстве теоремы 3.1. Рассмотрим случай, когда I = 1, а система задана в первой наблю- даемой канонической форме, (2.18): /О 1 0 ... О \ О 0 1 ... О А= .............. О 0 0 ... 1 С = (1,0,...,0). \ -Ql -Q2 -«3 ••• ~ап / Так как указанная пара наблюдаема, то существование вектора L следует из доказанного выше. Однако можно указать и явный метод для нахождения L. _ Пусть L = (1п,..., 1\)т. Тогда / -In 1 0 0 0 1 ^п— 1 0 1 0 0 Al = -к 0 0 1 0 ~к 0 0 0 1 \ -(Г1 + «1) —02 —оз •• ^п— 1 / Найдем характеристический полином матрицы Al: (5 + In) -1 0 .. 0 0 In— 1 s -1 .. 0 0 det(s/ — Al) = det к 0 s .. -1 0 h 0 0 . s -1 . (k + 01) CE2 «3 . . . OLn— 1 (s + on) .
52 Гл. 3. Наблюдатели полного фазового вектора = (71 4- cq) 4- /2(^71 4" з) 4- Z3 det I , \ ) 4" 1 уСУ-п 4~ s) J / s -1 0 \ 4- /4 det I О s — 1 I 4- ... 4~ \О!П_2 OLn— 1 (<*п 4“ з)/ /s -1 ... О \ + ... + Tn-i det О s ... О \аз а4 ... (an + s)/ Xs + (1п + s) det О \<*2 -1 ... О \ s ... О a3 ... (an + s)/ — (7i 4- ai) 4- hpz^s) 4- 1зРз(з) 4-... 4- /п-1Рп-1(з) 4- (Zn 4- s)pn(s). Каждый из полиномов pi(s) = $г-1 + ..., поэтому для коэффици- ентов характеристического полинома det(s/ — Al) = sn 4- ^nsn-1 4- 4-'0n-isn-2 4- ... 4-^i имеет место представление п — Ц 4~ tpijlj. Приравнивая fa к заданным коэффициентам 7?, получим линейную систему относительно неизвестных коэффициентов Ц. При этом матри- ца этой системы будет треугольной с единицами на главной диагонали /1 <£1,2 9^1,п—1 0 0 . 1 !рп-2,п— 0 0 . 0 1 \0 0 . 0 0 ^1,п \ ^71-2,71 9-^п—1.П 1 Таким образом можно найти требуемый вектор обратной связи для слу- чая, когда пара {С, А} задана в первом каноническом представлении. 3.1.2. Синтез наблюдателей с использованием 1-го канониче- ского представления векторных систем. Опираясь на скалярный случай, можно предложить метод синтеза матрицы L &ля. векторного случая I > 1. Пусть система задана в первом каноническом представ-
3.1. Полноразмерные наблюдатели 53 лении для векторных систем (2.22)-(2.23), т. е. Г Ац 0 ... О 1 А = А21 А22 _ A/и Ак2 ... Акк _ Ci = [1,0,...,О] €Rlx"\ щ + ... + vk = п. Так как каждая пара {С^ Ац} задана в первой канонической форме для скалярной системы, то для нее по изложенному выше алгоритму может быть найдена матрица Ц е RPiX1 такая, что матрица А^ = Ац — ЦСи имеет заданный спектр. Общая матрица L е RnxZ может быть выбрана в виде /Li 0 ... О 0\ О Т2 ... О О \0 0 ... Lk 0) В этом случае / Aft 0 ... О \ Al = А - LC = A21 А22 о \ Ак\ Ак2 ... Акк / а, следовательно, характеристический полином а($) матрицы Al явля- ется произведением характеристических полиномов матриц Af- и может быть сделан гурвицевым (с любым наперед заданным показателем устойчивости). Заметим, что указанный метод синтеза налагает ограничения на выбор спектра Al, это связано с тем, что вещественные характери- стические полиномы матриц А^ могут не допускать некоторые со- четания комплексно-сопряженных корней для спектра Al- Например,
54 Гл. 3. Наблюдатели полного фазового вектора если п = 2, а матрица А состоит из двух блоков (т. е. к = 2), то характеристический полином a(s) = det(sl — Al) = a\(s)az(s), где аДз) = det(sl - А^) — полиномы 1-го порядка, а, следовательно, при указанном способе синтеза матрицы L спектр матрицы Al обяза- тельно будет вещественным. Для того, чтобы иметь возможность получить произвольный спектр матрицы Al, необходимо строить матрицу L в более общем виде. 3.1.3. Синтез с использованием формы Люенбергера. Еще один способ синтеза наблюдателя связан с канонической формой Лю- енбергера для систем с векторным выходом (2.33), когда система рас- падается на I подсистем i Xi = AiiXi -I- UijUj + BiU, i = Xi G yi = CiXi, Ci = [0,...,0,l], Так как каждая из пар {С^Ац} находится во втором каноническом представлении, то в соответствии с алгоритмом, изложенным в до- казательстве теоремь£_ ЗЛ, находится вектор Li G такой, что матрица А^ — Ац — LiCi — гурвицева (и имеет заданную степень устойчивости). Наблюдатель построим в виде i Xi — AuXi “F 0>ijyj “I- BiU Li (C iXz yi), i — 1,...,/. (3.6) Ошибки наблюдения ег = хг — Xi для каждой из подсистем удовле- творяют уравнениям Ci АцСи и, следовательно, e;(t) 0 экспоненциально при t —> оо. Замечание 3.3. На спектр матрицы системы в отклонениях в це- лом, как и в предыдущем случае, накладываются незначительные огра- ничения, связанные с невозможностью задания некоторых спектров, содержащих комплексно-сопряженные значения.
3.1. Полноразмерные наблюдатели 55 3.1.4. Синтез наблюдателей при восстанавливаемой паре {С, А}. Рассмотрим теперь случай, когда пара {С, Л} не полностью наблюдаема. Для восстанавливаемой пары {С, А} имеет место следую- щее утверждение Теорема 3.2. Пусть пара {С, А} восстанавливаема. Тогда най- дется матрица L е RnxZ такая, что матрица Al = А — LC — гурвицева. Доказательство. Прежде всего заметим, что доказательство теоремы достаточно провести для системы, записанной в каком-либо каноническом базисе. Действительно, если пара {С, А} преобразовани- ем координат_переводится в пару {С, А}, где С = СР^1, А = РАР~Х, а для пары {С, А} найдется матрица L такая, что Al — А — LC — гурвицева, то такой же спектр имеет и матрица Al = А — LC, где L = P~XL. Для доказательства достаточно заметить, что Аь = РАР~Х - (PL)(CP~X) = РАЬР~\ т. е. матрицы Al и Al подобны. Поэтому, не ограничивая общности рассуждений, можно считать, что пара {С, А} задана в форме калмановской декомпозиции для непол- ностью наблюдаемой системы, (2.8): А = 'Ап 0 1 _ А21 А22 J ’ C=[Ci;0], (3.7) где Аи е Rexe, A2i е А22 е сх е RZx< Ап соответствует наблюдаемой подсистеме размерности £ = rankN(С, А), т. е. пара {<71,Ац} наблюдаема. В силу теоремы 2.5 для восстанавливаемой пары {С, А} спектр ненаблюдаемой части, т. е. матрицы А22, лежит в С_ (левой открытой полуплоскости С). Так как пара {С1,Ац} наблюдаема, то для нее найдется матрица L\ 6 R^x/ такая, что Ац = Ац — L\C\ обладает заданным спектром, в частности, эта матрица может быть сделана гурвицевой надлежащим выбором матрицы L\. Рассмотрим матрицу L = е RnxZ. При такой матрице обратной связи An-LiCi 0 А21 А22. 0‘ А21 А22. В силу гурвицевости диагональных матриц Ац (при соответствую- щем выборе Li) и А22 матрица Al также является гурвицевой. Теорема доказана. □
56 Гл. 3. Наблюдатели полного фазового вектора Замечание 3.4. Пусть пара {С, А} не полностью наблюдаема; Ль ..., Хп-£ е С — те значения, на которых вырождается ранг матрицы наблюдаемости Розенброка: Я(С,А) - ‘ XI - А ‘ С (причем, если на некотором Л ранг матрицы 7?(С, А) уменьшается на к, то это число входит в набор к раз, т. е. имеет кратность к). Тогда характеристический полином матрицы Al имеет вид — неизменяемый полином, корни которого определяются свой- ствами С и А; корни полинома a$(s) степени £ могут задаваться по произволу соответствующим выбором матрицы L. Доказательство. Как было отмечено в доказательстве теоремы, исследование спектра матрицы Al можно проводить в любом базисе. Рассмотрим вновь пару {С, А}, заданную в форме (3.7). Пусть матри- ца L записана в блочном виде: Тогда L2 Li6R?xi, L2eR(n-e)xi. Al = A-LC = Ац-LiCi О А21 — L2Cr А22 Таким образом, спектр матрицы Al состоит из двух частей: спек- тра А22 и спектра (Ац - L\C\). В силу неполной наблюдаемости пары {С, А} имеет место равенство spec(A22) = {Ль ... ,Лп_^}. Пара {С1,Ац} наблюдаема, поэтому спектр (Ац — L\C\) задается по произволу соответствующим выбором L\ (а, следовательно, матри- цы L). Утверждение доказано. □ Таким образом, в случае, если пара {С, А} восстанавливаема, то для системы (3.1) также можно использовать асимптотический наблю- датель типа (3.5), где матрица обратной связи L выбирается из усло- вия гурвицевости матрицы Al = А — LC. Отличие от случая полной наблюдаемости заключается в том, что теперь часть спектра Al не изменяема (и устойчива), а другая часть назначается по произволу. Скорость сходимости ошибки e(t) = x(t) — x(t) теперь не может зада- ваться по произволу, а определяется неизменяемой частью спектра Al (т. е. спектром ненаблюдаемой подсистемы).
3.1. Полноразмерные наблюдатели 57 Для задачи управления могут быть сформулированы и доказа- ны аналогичные результаты. Ограничимся формулировкой основных утверждений, [1]. Теорема 3.3. Пусть пара {А, В} управляема. Тогда для любого полинома ipn(s) = sn + 7nsn-1 4-... 4-71 с вещественными коэффици- ентами 7*, s е С, найдется матрица К е Rmxn такая, что (рп(з) является характеристическим полиномом матрицы Ак = А — ВК, т. е. det(sl — Ак) = <Рп($). Доказательство теоремы 3.3 аналогично доказательству тео- ремы 3.1. В этом случае для стабилизации системы (3.1) по полному фазовому вектору (т. е. в том случае, если известен весь вектор x(t)) может быть использована линейная обратная связь вида u(t) = —Kx(t) (3.8) с постоянной матрицей обратной связи К. Замкнутая такой обратной связью система (3.1) удовлетворяет уравнению х = Ах — ВКх = Акх, и, если матрица К выбрана из условия гурвицевости матрицы Ак, то переходной процесс x(t) —> 0 при t —> 00. Более того, ж —> 0 экс- поненциально, а скорость сходимости целиком определяется выбором матрицы К. Если же пара {А, В} только стабилизируема, то имеет место следу- ющее утверждение. Теорема 3.4. Пусть пара {А, В} стабилизируема. Тогда найдет- ся матрица К е Rmxn такая, что матрица Ак = А — В К будет гурвицева. Замечание 3.5. Спектр матрицы Ак состоит из двух частей. Часть спектра Ль ... , Ап-т? 6 С не зависит от выбора матрицы К и соот- ветствует неуправляемой части системы, т. е. составляет спектр матри- цы А22 из калмановской декомпозиции (2.9) для неполностью управля- емых систем. Эта часть спектра устойчива в силу стабилизируемости пары {А, В}. Остальная часть спектра Ак назначается по произволу выбором матрицы К. При этом обратная связь (3.8), по-прежнему, стабилизирует систему (3.1) асимптотически (экспоненциально), од- нако теперь скорость сходимости определяется неизменяемой частью спектра матрицы Ак и не может устанавливаться по произволу. Рассмотрим систему (3.1). Использование полноразмерного наблю- дателя (3.5) и линейной обратной связи (3.8) позволяет решить за- дачу стабилизации системы (3.1) по выходу (т. е. при ограничении u = w(j/(f))).
58 Гл. 3. Наблюдатели полного фазового вектора Для линейной стационарной системы (3.1) имеет место принцип разделимости задач наблюдения и стабилизации. Теорема 3.5. Пусть пара {С, А} наблюдаема, а наблюда- тель (3.5) дает асимптотическую оценку x(t) неизвестного фазо- вого вектора x(t). Пусть пара {А, В} управляема, а обратная связь по полному фазовому вектору (3.8) стабилизирует систему (3.1) в нуле экспоненциально. Тогда обратная связь по оценке x(f) и = —Kx(t) (3.9) стабилизирует систему (3.1) в нуле экспоненциально. Доказательство. Достаточно рассмотреть совместно уравнения системы (3.1), замкнутой обратной связью (3.9), и уравнения (3.6) для ошибки наблюдения e(t) = x(t) — x(t). Управление (3.9) можно представить в виде и = — e(t)). Тогда имеет место система уравнений ( х = Ах — ВК(х — е) — Ак% 4- ВКе, 1 ё = ALe. (3.10) Матрица системы (3.10) имеет блочно-диагональный вид: Т_/Ак ВК\ А \ 0 ’ причем на диагонали стоят гурвицевы матрицы Ак и Al. Следователь- но, А также гурвицева, a x(t), e(t) 0 при t —> оо экспоненциально. Теорема доказана. □ Замечание 3.6. В случае наблюдаемости пары {С, А} и управляе- мости пары {А, В} спектр матриц Al и Ак назначается^ произволу, а, следовательно, и степень устойчивости матрицы А может быть задана по произволу. Таким образом, если система (3.1) находится в общем положении, то скорость сходимости к нулю фазового вектора системы (3.1), замкнутой обратной связью (3.9), может быть задана по произволу. Если же пара {С, А} только восстанавливаема (или пара {А, В} только стабилизируема), то утверждение теоремы остается верным, однако скорость сходимости фазового вектора системы при u(t) из (3.9) определяется спектром ненаблюдаемой (или неуправляемой) части. 3.2. Наблюдатели Люенбергера пониженного порядка В теории автоматического управления часто выдвигается требова- ние к размерности наблюдателя, которая должна быть понижена до минимальной. Выше была описана схема построения полноразмерных
3.2. Наблюдатели Люенбергера пониженного порядка 59 наблюдателей для линейных стационарных систем без неопределенно- сти (т. е. наблюдателей, размерность которых совпадает с размерностью самой системы). Однако для таких систем могут быть построены на- блюдатели пониженного порядка. Впервые методы построения таких наблюдателей были предложены в работах Люенбергера, см. [87]. Далее вновь рассматриваем систему (3.1) и считаем, что пара {С, А} наблюдаема. Последнее предположение не ограничивает общности рассуждений. Если пара {С, А} только восстанавливаема, то система (3.1) может быть приведена к калмановской декомпозиции, (2.8): хх = Ацгг1 + В\и, X2 = А21Х1 + А22^2 + У = С\х', где пара {С1,Ац} наблюдаема. Если для первой подсистемы построен наблюдатель, дающий оценку х1, то наблюдатель для второй подсисте- мы имеет вид х2 = А21Х1 + А22Х2 И- B2U. (3.11) Ошибка наблюдения е2 = х2 — х2 удовлетворяет уравнению ё2 — А2262 + А21С1, откуда в силу стремления е1 = х1 — х1 —> 0 и гурвицевости матри- цы А22 следует, что е2 —> 0. Порядок наблюдателя (3.11) равен (п — £) и не может быть изменен. Таким образом, порядок наблюдателя для всей системы в целом зависит от порядка наблюдателя для первой полностью наблюдаемой подсистемы. Рассмотрим вначале случай скалярной полностью наблюдаемой си- стемы, т. е. I = 1. В этом случае система может быть записана в одной из канонических форм, при этом выход y(t) является одной из координат фазового вектора, т. е. неизвестны (п — 1) координаты. Покажем, что при этих условиях может быть построен наблюдатель порядка (п — 1). Изложим один из методов построения такого наблюдателя, сле- дуя [1]. Пусть пара {С, А} задана во втором каноническом виде
60 Гл. 3. Наблюдатели полного фазового вектора В этом базисе хп = у — известная координата. Рассмотрим уравнения для первых координат системы (3.1): х' = А'х' + а'у + В'и, (3.12) где х' = (ti, ...,xn-i), Af е R(n-1)x<n-1) — главный минор порядка (п — - 1) матрицы А; а’ е R(n-1)xl — последний столбец матрицы А без апп, В' е R(n-1)xm — матрица, состоящая из первых (п - 1) строк матрицы В. Наблюдатель для х' будем строить в виде х = А'х'+ а'у + В'и. (3.13) Тогда ошибка наблюдения е' — х' — х' удовлетворяет уравнению ё' = А'е', и е' 0 экспоненциально, если А' — гурвицева. Для матрицы Л, заданной в каноническом базисе, г0 0 ... 01 1 0 ... 0 0 1 ... о 0 0 ... 1 J при этом a(s) = det(sl — А) = sn не является гурвицевым. Однако можно указать такое преобразование первых (п— 1) коор- динат, при котором матрица А' будет иметь любой наперед заданный спектр. При этом указанное преобразование не изменяет вектор С, а, следовательно, в новом базисе наблюдатель (3.13) решает задачу экспоненциально. Укажем такое преобразование в явном виде. Пусть задан полином порядка (п - 1) с вещественными коэффициентами: <Pn-l(s) = s”-1 + 7„_is”-2 + ... + 71. Рассмотрим матрицу преобразования вида ’1 0 ... 0 -71 0 1 ... 0 —72 р = , = 1 0 ... 0 71 0 1 ... 0 72 0 0 ... 1 -7п-1 0 0 ... 0 1 0 0 ... 1 7п-1 0 0 ... 0 1 Это преобразование, очевидно, не меняет хп = у, а, следовательно, и вектор С = [0, ...,0,1].
3.2. Наблюдатели Люенбергера пониженного порядка 61 При указанном преобразовании матрица А примет вид РАР~1 = о о ... О -71 I {(ttn -7п-1)71 -«1} 1 о ... О -72 I {(ап - 7п-1)72 ~ OL2 + 71} О 0 • • • 1 7n-l | {(с^п 7п—1)7п—1 1 7п—2} О 0 ... О 1 I {«п + 7п} " А' | а' ' _ 0 ... 01 | (ап 4-7п) _ а характеристический полином матрицы А' имеет вид det(sZ - А') = 99n_i(s). Если выбрать <^n_i(s) гурвицевым, то наблюдатель (3.13) порядка (n — 1) восстанавливает неизвестные координаты фазового вектора. Для фазового вектора, записанного в исходном каноническом бази- се, оценку дает х — Р 1 х' У Заметим, что если пара {С, А} восстанавливаема, то для ее наблю- даемой части можно построить наблюдатель порядка (£ - 1). Вместе с наблюдателем (3.11) порядка (п - £) они образуют наблюдатель полного фазового вектора порядка (п - £) 4- (С — 1) = п — 1, т. е. того же порядка, что и наблюдатель Люенбергера для наблюдаемой пары {С, А}. Отличие заключается в том, что скорость сходимости в случае восстанавливаемой пары {С, А} зависит от спектра ненаблюдаемой части системы. Предложенный метод построения наблюдателей пониженного по- рядка обобщается на случай I > 1. Для этого рассмотрим систему, записанную в канонической форме Люенбергера: i Х{ — AaXi 4- Oijyj 4- BiU, i — 1 > • • •, I, j=\j:£i Vi ~ CiXi. (3.15)
62 Гл. 3. Наблюдатели полного фазового вектора Обозначим через Уш УШ \У1 / новый известный вход. Тогда подсистемы из (3.15) можно записать в виде _ _ | Xi — AaXi 4” В i'll i, i — 1,...,/, где Bi — известная матрица, определяемая Bi и j = 1, ...,Z, j i. Каждая из подсистем (3.16) может рассматриваться как независи- мая система порядка щ с известным входом щ и известным скалярным выходом yi. Для нее можно построить наблюдатель порядка - 1. Совокупность таких наблюдателей образует наблюдатель полного фа- зового вектора. Порядок такого наблюдателя равен i i - 1) = [52^] -l = n-l. i=\ г=1 Как и в скалярном случае, при I > 1 для восстанавливаемой пары также можно построить наблюдатель порядка (п — Z). Таким образом, имеет место следующее утверждение, [1, 87]. Теорема 3.6. Пусть пара {С, А} наблюдаема (восстанавливае- ма). Тогда для системы (3.1) можно построить наблюдатель поряд- ка (п-l) с заданной скоростью сходимости (скорость сходимости определяется ненаблюдаемой частью системы). Для построения наблюдателя заданного порядка р (в частности, ми- нимального порядка р = п — I) часто используется следующий подход, предложенный Люенбергером. Как и ранее, рассмотрим линейную стационарную систему (3.1) {х = Ах + Ви, у = Сх. Выберем матрицу F е №хп так, что (3-17)
3.2. Наблюдатели Люенбергера пониженного порядка При этом, очевидно, что р п — I. Обозначим z = Fx, тогда С , для восста- новления вектора х достаточно построить оценку для z(t). Далее для простоты считаем, что р = п — I. В этом случае Для оценивания z(t) можно использовать наблюдатель Люенбергера вида z = Dz 4- Еу 4- Gu, (3.18) где z е D, Е и G — постоянные матрицы, параметры наблюда- теля, которые подлежат дальнейшему определению. Рассмотрим ошибку наблюдения е = z — z. Эта ошибка удовлетво- ряет уравнению ё = De + (DF + ЕС- FA)x 4- (G - FB)u. (3.19) Параметры наблюдателя выбираются из условий ( G = FB, ЕС = FA- DF, D— гурвицева. (3.20) При выполнении условий (3.20) ошибка оценивания e(t) удовлетворяет уравнению ё — De, и, в силу гурвицевости матрицы D, e(t) —> 0 при £ —> оо. Оценку неизвестного фазового вектора x(t) дает F С = Если система (3.1) полностью наблюдаема, то система матричных уравнений (3.17), (3.20) разрешима, см. [76, 87], (т.е. из нее опреде- ляются матрицы D, Е, G и F), причем матрица D может иметь лю- бой наперед заданный симметричный (т. е. комплексно-сопряженный) спектр. В случае, если пара {С, Л} только восстанавливаема, спектр D содержит неизменяемую часть, которая соответствует ненаблюдаемой части системы (3.1). Синтез наблюдателя может быть произведен, например, на основе следующих соображений. Пусть Р — матрица левых собственных
64 Гл. 3. Наблюдатели полного фазового вектора векторов матрицы Al = A — LC, причем спектр Al задан гурвицевым, вещественным и различным. Тогда матрица Р удовлетворяет уравне- нию Р(А - LC) = АР, где Л = diag{Ai,..., Ап}. Очевидно, что rankF = п и среди ее строк можно выбрать (п — Z) в виде F так, что F(A - LC) = AfF, ( F \ и rank ( q ) = n. Сравнивая это с (3.20), находим, что D = Ар, Е = = FL. V Заключение. В главе 3 рассмотрена задача синтеза наблюдателей фазового вектора для линейных стационарных полностью определен- ных систем. Описаны алгоритмы синтеза полноразмерных наблюдате- лей для скалярных (/ = 1) и векторных систем (I > 1). Так же описаны наблюдатели Люенбергера пониженного порядка (п — Г).
Глава 4 ФУНКЦИОНАЛЬНЫЕ НАБЛЮДАТЕЛИ ДЛЯ ПОЛНОСТЬЮ ОПРЕДЕЛЕННЫХ ЛИНЕЙНЫХ СИСТЕМ 4.1. Постановка задачи. Функциональные наблюдатели люенбергеровского типа Вновь рассмотрим n-мерную линейную стационарную полностью определенную наблюдаемую систему с Z-мерным выходом {х = Ах + Ви, г (4Л) у = Сх. Далее везде считаем, что матрица С — полного ранга, т. е. rank С = I. В этой главе решается задача о построении функциональных наблюда- телей, т. е. задача о восстановлении линейного функционала от неиз- вестного фазового вектора а = Fx, (4.2) где F е Rpxn — известная матрица. Эта задача возникает, например, при решении проблемы стабилизации системы (4.1) в нуле. Для этого можно, в частности, использовать обратную связь вида и = —Кх. Если известна оценка полного фазового вектора x(t), то задачу стабилиза- ции решает и = — Кх. Однако в данном случае не обязательно восста- навливать весь n-мерный вектор x(t), а достаточно построить оценку функционала <j(t) = —Кх, a(f) е Rm. При этом размерность функцио- нального наблюдателя (т. е. наблюдателя, формирующего оценку 5(t)) должна оказаться меньше, чем размерность наблюдателя Люенбергера. Задача о построении функционального наблюдателя для систе- мы (4.1)—(4.2) рассматривалась подробно в работе О’Рейли [87], где описан наблюдатель, напоминающий по структуре наблюдателя Лю- енбергера (3.18). При этом для построения наблюдателя порядка к предложена следующая процедура. Пусть для матрицы F имеет место разложение F = PT + VC, 3 С. К. Коровин, В. В. Фомичев
66 Гл. 4. Функциональные наблюдатели где Р G Т е Rfcxn, V е RpxZ. Тогда а = Fx = РТх + VCx = Pz + Vy, где z(f) е - неизвестный вектор, подлежащий оценке. Для его восстановления используем наблюдатель люенбергеровского типа: z = Dz + Еу + Gu. (4.3) Тогда оценку для искомого функционала <т(£) дает &(t) = Pz+ Vy. (4.4) Для того чтобы оценка 5(f) сходилась к cr(f), достаточно, чтобы (z(f) — — z(t)) —> 0 при f —> ос. Рассмотрим уравнение для ошибки е = z — z\ e = z — z — Dz + Ey + Gu — T(Ax + Bu) = = D(e + Tx) + ECx + Gu — TAx — TBu = = De + (DT + EC- TA)x + (G - TB)u. (4.5) В [87] доказана следующая Теорема 4.1. Наблюдатель (4.3)-(4.4) порядка к восстанавлива- ет функционал о из (4.2) для системы (4.1) тогда и только тогда, когда выполнены условия F = PT + VC, G = TB, (4.6) ТА - DT = ЕС, v 7 D — гурвицева. При этих условиях, очевидно, ошибка оценивания e(f) удовлетво- ряет уравнению e(f) = De(t), и, в силу гурвицевости матрицы D, e(t) 0 при f —> ос. Общую схему синтеза наблюдателя можно представить, например, следующим образом. Пусть 0 — матрица левых собственных векторов матрицы Al — А - LC, отвечающих различным вещественным устой- чивым собственным значениям, образующим диагональную матрицу Л, т. е. QAl = Л0.
4.1. Постановка задачи. Функциональные наблюдатели 67 / Т \ Пусть Т — совокупность к строк из 0 такая, что rank I I = к + I, тогда матрицы Р и V находятся из уравнения F = (FV)P Y \ о / / т \ т Умножим справа это равенство на матрицу I ) , получим где Nk е R(fc+Z)x(fc+O. Минимальное число к, при котором матрица Nk обратима, и дает решение задачи, так как / Г \ Т F р N^ = (PV). у О J При этом D = Лт — часть диагональной матрицы Л, т. е. TAl = АтТ, a Е = TL. Заметим, что det Nk = det(CCT — СТт (ТТт)~гТСт) и определе- ние минимального к связано с перебором наборов из к строк матри- цы 0, линейно независимых со строками матрицы С. Очевидно, что при к = п — I матрица Nn~i обратима. Поскольку в общем случае никакого ясного алгоритма не было предложено, возникают следующие вопросы: 1) как при заданном к найти матрицы Р, Т, V, G, Е и D, удовле- творяющие условиям (4.6)? 2) каково минимальное значение к, при котором возможно построе- ние функционального наблюдателя? В общем случае, когда y(t) и a(t) — векторы (т. е. I > 1, р > 1), эти вопросы трудны для изучения. В работе [87] приведены результаты для случаев, когда y(t) или a(t) являются скалярными величинами. В частности, относительно порядка наблюдателя имеет место следую- щее утверждение. Теорема 4.2 (Roman and Bullok, [93]). Наблюдатель порядка к с любым наперед заданным (симметричным) спектром i) восстанавливает функционал а = Fx, ст е F для системы со скалярным выходом (т.е. при I = 1) тогда и только тогда, когда к п — 1; i ii) восстанавливает скалярный функционал о = Fx = Г*хг г=1 (где Xi е К17* — части фазового вектора х в каноническом пред- ставлении Люенбергера^.11); Fi eRlxi/i) тогда и только тогда, когда к d — 1, где d — длина максимальной ненулевой части среди з*
68 Гл. 4. Функциональные наблюдатели векторов Fi(d—\,v — индекс наблюдаемости пары {С, Л}, и = maxi/;). Для р = 1 в работе [87] приведен способ построения наблюдателя порядка (у - 1). Для I = 1, р > 1 из теоремы 4.2 следует, что минималь- ный порядок наблюдателя с полностью назначаемым спектром равен п — 1 = и — 1 и совпадает с размерностью наблюдателя Люенбергера для полного фазового вектора. Однако в ряде случаев, если отказаться от условия полностью на- значаемого спектра, можно понизить порядок наблюдателя. Эта задача активно рассматривается в последние годы. В частности, в [122] полу- чены условия существования наблюдателей порядка р, совпадающего с размерностью функционала. В работах авторов [25-29] получены необходимые и достаточные условия синтеза наблюдателей заданного порядка. Чуть позже аналогичные условия были приведены в рабо- те [123]. Способ определения минимальной размерности функционального наблюдателя указан в работах [27, 28]. Изложим его, следуя указан- ным работам. 4.2. Восстановление скалярных функционалов Рассмотрим вначале случай скалярного выхода и скалярного функ- ционала, т. е. р = I — 1. В этом случае, как следует из теоремы 4.2, можно построить функциональный наблюдатель порядка (п - 1). Раз- мерность этого наблюдателя (а, следовательно, и способ построения) совпадает с размерностью наблюдателя Люенбергера. Интерес пред- ставляет возможность построения наблюдателя порядка к < п — 1. Изучим эту возможность. Не ограничивая общности рассуждений, считаем, что пара {С, А} задана в канонической форме: /О 0 ... О -ад 1 0 ... О —с^2 С = (0,0,...,0,1), (4.7) \0 0 ... 1 -aj где аг — коэффициенты характеристического полинома матрицы А, т. е. a(s) = det(sl — А) = sn + ansn~x + ... + a\. Пусть пара {F, А} наблюдаема, а вектор F в указанном базисе имеет вид F = (/i,...,/n).
4.2. Восстановление скалярных функционалов 69 4.8) Далее, не ограничивая общности рассуждений, считаем, что вектора С и F не коллинеарны. Для решения задачи используем метод псевдов- ходов, а именно, рассмотрим систему !х = Ах + Ви 4- Lv, у = Сх с дополнительным входом v е R («псевдовходом»). Вид вектора L е е Rnxl будет определен ниже. В случае, когда псевдовход v = 0, эта система совпадает с систе- мой (4.1). Для системы (4.8) определены передаточные функции от нового входа v к выходу y(f) и к функционалу a(t): W\(s) = C(sl - у = W\v, W2(s) = F(sl - A)~XL, a = W2v (в последних выражениях для простоты за преобразованиями Лапласа для y(t) и cr(t) сохранены те же обозначения, что и для прообразов). Функции Wi(g) и W2($) являются дробно-рациональными, т. е. пред- ставляют собой отношение полиномов: Т/Г/ч Ж5) сцз) ct(s) где /3i(s) и /82(5) — полиномы степени не выше (п — 1). Полиномы /31 (g) и /?2(s) определяются выбором вектора L — (Zi, I2,...,/п)т- Более того, так как матрицы А п С заданы в канонической форме, то /3i(s) = Sn-4n + sn-2Zn_i + ... + Zi. Пусть вектор L выбран так, что полиномы (3\(g), /82(g) и a(g) не имеют общих корней, т. е. тройки {С, A, L} и {F,A, L} находятся в общем положении. Тогда определена передаточная функция от измеря- емого выхода системы y(t) к неизвестному функционалу cr(t): а = тгг;у = <4-9) Для построения асимптотического наблюдателя достаточно, чтобы передаточная функция VH(g) была физически реализуема, т. е. выпол- нялось условие deg/32(s) deg/31 (s), (4.10) а знаменатель VK(g), т. е. полином /31(g), был гурвицев. Кроме того, если deg/31(g) = к, то функциональный наблюдатель, восстанавливаю- щий a(t), будет иметь порядок к. Таким образом, задача о построении функционального наблюдателя порядка к сводится к поиску вектора L
70 Гл. 4. Функциональные наблюдатели такого, чтобы выполнялось условие (4.10), a /31 (s) удовлетворял усло- виям deg /31 (s) = k, /3i(s) — гурвицев. (4.H) При выполнении условий (4.10)—(4.11) нетрудно указать алгоритм построения наблюдателя порядка к. Если deg/31 (s) = к, то, не ограни- чивая общности, /3\(s) = Sk +1к8к~' + ... + /1, т.е. L = (Zi, ...,/ь 1,0, ...,0). В силу несократимости полиномов /31 (s) и а($) система (4.8) невырожденным преобразованием координат приво- дится к канонической форме управляемости: х = Ах + Ви + Lv, < у = Сх, k (у = Fx, (4-12) где C=(Zi,...,Zfc,l,O,...,O) (за фазовым вектором х, входами и и v, выходами у и а сохранены старые обозначения). Так как относительный порядок системы (4.12) по выходу а не ниже, чем по выходу у (в силу условия (4.10)), то г = (/1,...,К,К+1,о,...,о). При этом некоторые из первых (fc+ 1) компонент fa вектора F могут равняться нулю. Так как у = 1\х\ + ... + IkXk + хь+i, в указанных координатах неизвестный функционал cr(t) имеет следующий вид: fc+l к ~ (Т = ^2/fiXi = ^2fiXi + fk+l(y - l\Xl - ... - 1кхк) = i=l г=1 к ~ fk+lli)xi “Ь ffc+iy.
4.2. Восстановление скалярных функционалов 71 Таким образом, для восстановления cr(t) достаточно построить оценки первых к координат фазового вектора х. Для этого рассмотрим пер- вые к уравнений системы (4.12): Х[ = Х2 + Ь\и, Д?2 = Хз + Ьъи, < k Хк — Хк+1 + bkU. к Учитывая, что ^4-1 = У ~ И ^Xi, эти уравнения можно записать в г=1 виде ~ ±1 = Х2 + b{U, Х2 = Хз + b2U, < : (4.13) Хк— 1 = Хк 4“ bk—lU, , хк = -1\Х\- ...-1кХк + Ьки + у. Так как вход системы u(t) и выход y(f) известны, то для восстановле- ния х' — (xi, ...,хк)Т можно использовать наблюдатель Х\ — Х2 + b\U, )Хк—\ — Хк 4~ Ьк— 1К-, Хк = -1\Х\ - ... - 1кхк + ьки + у. Ошибка наблюдения ef = xf — х' удовлетворяет системе ' ei = е2, < ё/c-i = ек, < ^к = ^1^1 ••• ^k^ki и, в силу гурвицевости полинома /?i(s) (характеристического полинома системы (4.15)), е' 0 при t —> оо. Оценку для a(t) дает к 5(t) = - 7k+\li)xi + fk+iy- i=i Таким образом, для построения функционального наблюдателя поряд- ка к достаточно, чтобы нашелся вектор L = (Zi,...,Zfc,l,O,...,O) (4.16) (4.14) (4-15)
72 Гл. 4. Функциональные наблюдатели такой, чтобы были выполнены условия (4.10)—(4.11). Выясним, когда такой вектор существует. Пусть вектор L имеет вид (4.16), = sk + lkSk~{ + ... + Ц — гурвицев полином порядка к. Далее вектор L1 = (li,.-.,lk) или его расширенный вариант = (£', 1), задающие гурвицев полином ft(s), также будем называть гурвицевыми. В силу условия (4.10) deg/^s) к. Это означает, что относительный порядок передаточной функции W2(s) от псевдовхода v к неизвестному выходу a(t) не ниже (п - &), т. е. выполнены условия FL = 0, FAL = 0, ...,FAn~k~2L = Q. (4.17) Так как F = (/i, то, учитывая явный вид матрицы А из (4.7) и вектора L из (4.16), условия (4.17) можно записать в виде fih + /2^2 4- ... 4- fklk 4- Л+i — 0, < /2^1 + /з^2 + ... + fk+llk 4- /к-1-2 = о, < fn-k-lll 4- fn-kh 4- ... 4- fn-2lk 4- fn-1 — 0. Последнюю систему можно записать как линейную систему относи- тельно неизвестного вектора L' = (Zi,..., Zk)T: / /1 /2 fk \ /2 /з ••• А+1 \fn—к— 1 fn — k ••• /п—2/ /А+1\ А+2 \fn-J (4.18) Матрица этой системы имеет размер (п — к — 1) х к, столбец сво- бодных членов — размер 1 х (п — к - 1), матрица и столбец полностью определяются параметрами вектора F, задающего функционал а = Fx в каноническом базисе. Таким образом, если система (4.1) наблюдаема, имеет скалярный выход (т. е. I = 1) и задана в канонической форме (4.7), то скалярный функционал а = Fx восстанавливается наблюдателем порядка к, если найдется гурвицев вектор L' = (Zj,..Z^)T, удовлетворяющий уравне- ниям (4.18). Теперь покажем необходимость указанных выше условий. Если существует наблюдатель порядка к, то он описывается системой диф- ференциальных уравнений z = Dz + Еу + Gu, а = Pz 4- уу, где z е Rfc, D, Е, G, Р и 7 — постоянные матрицы соответствующих размерностей. В этом случае для (4.19) определена передаточная функ-
4.2. Восстановление скалярных функционалов 73 ция от у к а: W(s) = 7 + P(sl - D)-lE = Pl(s) где /?i(s) = det(sZ - D) — гурвицев полином порядка k, a /3z(s) — полином степени не выше к. Тогда а = W(s)y = ^7-тЗЛ Р1(«) Пусть, как и ранее, а($) — характеристический полином систе- мы (4.1). Обозначим через v сигнал, удовлетворяющий условию V ШУ' Тогда Ж«) /31 (в) а ~ —гт77’ у ~ —гт V. Из этого следует, что существует псевдовход v и вектор L = (Zi, ... ,/ь 1,0, ...,0) такой, что подвектор L' = (Zi, ...,1k) — гурви- цев и удовлетворяет системе (4.18). Таким образом, имеет место Теорема 4.3. Пусть в системе (4.1) I = 1, пары {С, А} и {F, А} наблюдаемы, rank I I — 2. Скалярный функционал а — Fx вос- уС/ J станавливается наблюдателем порядка к тогда и только тогда, когда существует гурвицев вектор L' = щий (4.18), где fi базисе. (l\,...,h), удовлетворяю- — коэффициенты вектора F в каноническом Замечание 4.1. ранговое условие Система (4.18) имеет решение, если выполнено rank /2 /2 /з fk \ ••• Л+1 \fn-k-l f-, h = rank Л /2 ••• А+1\ ••• Л+2 , (4.20) \fn—к—1 fn—k поэтому легко проверяемое условие (4.20) является необходимым для существования такого наблюдателя.
74 Гл. 4, Функциональные наблюдатели Рассмотрим скалярную систему с одним выходом (Z = 1). Условие существования наблюдателя k-го порядка для функционала а = Fx в этом случае имеет вид (4.18), где L — гурвицев столбец. Пусть к — 1, п > 2. Тогда (4.18) превращается в систему где li > 0. Эта система линейных уравнений эквивалентна уравнениям h = fi = -hfi-i, г = 3,... ,n - 1. /1 Таким образом, учитывая, что 1\ > 0, получаем, что разрешимость системы равносильна условиям (4.18') Л = ^Л-М = 3,...,n- 1. Л Следствие 4.1. Условия (4.18') являются необходимыми и доста- точными для существования наблюдателя 1-го порядка. Пусть теперь к — 2, п > 5. Условия (4.18) принимают вид где li > 0 и 1% > 0. Легко видеть, что если Л/з ~ /2 7^ 0, то h h Л лГг/з' /2 /з _Л_ или , /2/4 - /з . /2/3 - /4/1 1 /1/з-/22’ 2 /1/з-/22 '
4.2. Восстановление скалярных функционалов 75 Таким образом, разрешимость (4.18) эквивалентна Л/4-Л2 flf3~fl 0; /2/3,.>0; /1/з-Л2^0; /i/з - /2 /2/4 - fl f /2/3 - /4/1 Jt~l flf3- fl i = 5,... ,n — 1. (4.18") Имеет место Следствие 4.2. Условия (4.18") являются необходимыми и до- статочными для существования наблюдателя 2-го порядка. Используя теорему 4.3, можно указать алгоритм построения функ- ционального наблюдателя минимального порядка. 1. Найти минимальное значение к = к*, при котором выполняется условие (4.20). При любом к* система (4.18) разрешима. 2. Перебором значений к (к* к п — 1) найти минимальное зна- чение к = /с**, при котором среди решений системы (4.18) есть гурвицев столбец L'. 3. Для найденных /с** и Lf построить наблюдатель минимального порядка к**. Рассмотрим несколько примеров реализации данного алгоритма. Пример 4.1. Рассмотрим систему третьего порядка (п = 3): х — Ах, У = Сх, где С = [0,0,1]. Нетрудно заметить, что пара {С, А} наблюдаема и задана в кано- нической форме. Пусть требуется восстановить функционал — х\ — 2х2 + б^з, при этом F = [1; —2;6]. Сначала найдем минимальное к*, при котором выполнено условие (4.20). Для к = 1 это условие принимает вид rank[l] = rankfl; —2], следовательно, к* = 1. Проверим, есть ли среди решений систе- мы (4.18) при к = 1 гурвицев столбец. При к = 1 система (4.18) имеет вид [1]/. = И.
76 Гл. 4. Функциональные наблюдатели Решение этого уравнения L' = [Zi] = [2] отвечает гурвицеву полиному /3(s) = з + 2, т. е. столбец Lf — гурвицев. Следовательно, для cr(t) можно построить наблюдатель первого порядка. Оценку для a(t) дает наблюдатель z ( z = -2г + 24?/, 1 5 = z + 2у. Пример 4.2. Рассмотрим систему 4-го порядка, где “ООО г 10 0-1 0 10 3 -0 0 1 2. С = [0,0,0,1]. Пара {С, А} вновь наблюдаема и задана в каноническом виде. Рассмотрим задачу восстановления фунционала а(Г) = х\ + 2x2 + З^з + 4а?4. Найдем fc*, минимальное к, при котором выполнено условие (4.20). При к = 1 rank т. е. условие (4.20) не выполнено. При к = 2 rank[l 2] = rank[l 2 — 3], 7^ rank т. е. условие (4.20) выполнено, к* = 2. Проверим, есть ли среди решений системы (4.18) при к = 2 гурви- цев столбец. При к = 2 система (4.18) имеет вид [1 2] М = [-3]. \ 2/ Общее решение этого уравнения: 1[ = —2/2 — 3, /2 Е R. Этому решению соответствует полином з2 4- /18 + (-2/1 - 3), который является гурвицевым тогда и только тогда, когда /1 >0, -2/1 - 3 > 0, Эта система неравенств не имеет решений, а, следовательно, ми- нимальная размерность наблюдателя, восстанавливающего заданный функционал <т(£) равна к = 3 = (п - 1), т. е. совпадает с размерностью
4.2. Восстановление скалярных функционалов 77 наблюдателя Люенбергера, восстанавливающего полный фазовый век- тор системы. Заметим, что в данном примере все коэффициенты вектора fa > 0. Для этого случая, опираясь на теорему 4.3, можно получить простое следствие. Следствие 4.3. Пусть для системы (4.1) и функционала о — Fx выполнены условия теоремы 4.3. Пусть, кроме того, fa>0 при всех i = 1. Тогда функционал a(t) = Fx не может быть восстановлен наблюдателем порядка ниже (п — 1) (т. е. его восста- новление возможно только наблюдателем максимального порядка). Доказательство. Рассмотрим уравнение (4.8) при указанных условиях на функционал. Так как fa > 0, то все коэффициенты матри- цы / /1 У*2 ••• fk \ Hk = h fa ••• A+i а также коэффициенты столбца hk — /fk+l\ fk+2 при любом k < n — 1 строго положительны. Следовательно, любое решение L'k = (1\,..., lk)T уравнения HkL'k = -hk должно содержать отрицательные элементы Ц. Поэтому столбец L' не может быть гурвицевым ни при каком k < п— 1. Утверждение доказано. □ Рассмотрим еще один пример. Пример 4.3. Пусть система 4-го порядка задана в канонической форме, матрицы АиС имеют вид -о 0 0 -2- 1 0 0 -3 А = 0 1 0 2 , (7 = [0,0,0,1]. .0 0 1 -1. Пусть требуется восстановить функционал a(t) = Fx, где F = [1,1, -5,3].
78 Гл. 4. Функциональные наблюдатели / rank Найдем минимальное значение к, воспользовавшись предложенным выше алгоритмом. Если к = 1, то условие (4.20) не выполняется, так как rank При к = 2 rank[l 1] — rank[l 1 —5], поэтому к* = 2. Рассмотрим уравнения (4.18) при к = 2: [1 1] R1] = [5]. I/2J Общее решение этой системы 1% = 5 - 1\. Среди этих решений есть гурвицевы столбцы (ZiJ2)T, когда 1[ > 0, /2 > 0. В частности, этому ЛА условию удовлетворяет столбец L' = ( 3 ), соответствующий гурвицеву полиному /?($) = з2 + 3s + 2 с корнями Ai = — 1, А2 = —2. Наблюдатель для cr(t) можно построить в виде ' z\ = -Z\ + 3?/, < i2 = -2^2 + 4?/, k a(t) = 3zi — 2z2 — 13y. В этом случае A;** = fc* = 2. Из приведенных примеров видно, что для скалярного случая (Z = р= 1) могут реализовываться различные ситуации, в частности, некоторые функционалы могут быть восстановлены скалярными на- блюдателями, некоторые — только наблюдателями Люенбергера для полного фазового вектора, а некоторые — наблюдателями порядка к, где 1 < к < п — 1. 4.3. Восстановление векторных функционалов Предложенный подход к построению функциональных наблюдате- лей обобщается на случай векторного функционала <j(t) = Fx, где F е Rpxn, р > 1. Пусть строки матрицы F имеют вид ^ = (Л,Д.-,Л), г=1,...,р. (4.21) Каждой строке соответствует скалярный функционал аг = Flx, г — 1, ...,р. Для решения задачи вновь используем метод псевдовходов. Рассмотрим систему (4.8). При заданном векторе L е Rnxl будут
4.3. Восстановление векторных функционалов 79 определены передаточные функции от псевдовхода v к выходу у и к каждому из скалярных функционалов у = ТУ*(ф, |y*(s) = C(sI-A)~1L= a(s) ai = Wi(s)v, Wi(s)=Fi(sI~A)-'L=^-. a(s) Следовательно, определены передаточные функции от выхода у к функ- ционалам (Ji a^W^y, = Для построения наблюдателя порядка к для всех аг (т. е. для a(t) е Rp) достаточно, чтобы полином /3*($) имел порядок к, был гурвицевым, а степени полиномов /ЗДз) не превосходили бы к. Алгоритм построения наблюдателя в этом случае аналогичен алгоритму для скалярного слу- чая. Подобно скалярному случаю, имеет место Теорема 4.4. Пусть система (4.1) наблюдаема, I = 1, пары {С, А} и {F, А} наблюдаемы, функционал а = Fx, где F е Rpxn, [р\ rank I I =p + 1, имеет в каноническом бызисе вид (4.21). Этот функционал может быть восстановлен наблюдателем порядка к тогда и только тогда, когда среди решений линейной системы / Л1 А1 - flk \ А /з ••• fk+l fl fl Jn—k—1 Jn—k Л-2 I2 f2 f2 Jn—k—\ Jn—k A3 A3 \fpM fpn.k ... /£_2/ /А+Л fk+2 Л-1 /fc+1 f2 J n— 1 /fe+1 Vn₽-J (4.22) найдется гурвицев столбец L' = • Замечание 4.2. Обозначим через Hk и hk матрицу и столбец свободных членов системы (4.22) при заданном к, т. е. HkL' = -hk.
80 Гл. 4. Функциональные наблюдатели Тогда необходимым условием существования наблюдателя порядка к будет ранговое условие гапк[Я/с] = rank[#fc,7ifc]. (4.23) Минимальное значение к*, при котором оно выполняется, дает оценку снизу для минимальной размерности функционального наблюдателя. Для определения минимальной размерности наблюдателя в слу- чае векторного функционала можно воспользоваться описанной выше процедурой определения минимальной размерности функционального наблюдателя для скалярного случая с естественной заменой усло- вий (4.18), (4.20) на условия (4.22) и (4.23), соответственно. Кроме того, в этом случае так же справедлив аналог следствия 4.3, где надо потребовать положительность всех /J (j = 1,... ,п - 1, i = 1,... ,р). 4.4. Метод скалярных наблюдателей Для решения задачи о построении минимального функционального наблюдателя может быть использован иной подход, основанный на скалярных наблюдателях. Этот метод дает тот же результат, что и метод псевдовходов, однако его легче обобщить на случай, когда I > 1. Рассмотрим вначале наиболее простой случай, когда выход систе- мы (4.1) у (Г) и неизвестный функционал a(t) из (4.2) — скалярные величины (т. е. I = 1, р = 1). Для указанного случая исследуем вопрос, когда функционал а (Г) может быть восстановлен скалярным наблюда- телем. Этот наблюдатель будем строить в виде а ~ Ха + hu + gy, где константы A, h и g подлежат дальнейшему определению. Ошибка наблюдения £ = ст - ст удовлетворяет уравнению ё = а — а = Ха + hu + gy — FАх — FBu. Учитывая, что а = а + е = Fx + £, а у — Сх, получим £ = (-FA + дС 4- XF)x + Ле + (Л - FB)u, и, если выполнены условия h = FB, F(XI - А) = —дС, (4.24) А < 0, то £ = А£, следовательно, e(f) —> 0 при t оо экспоненциально.
4,4, Метод скалярных наблюдателей 81 Первое из условий (4.24) может быть выполнено выбором h при любых заданных F и В (поэтому далее для простоты считаем и = О, так как влияние известного управления всегда можно компенсировать). Однако не для всякого F найдется А < 0, удовлетворяющее (4.24). Выясним, какова при заданных А и g структура вектора F, удовлетво- ряющего второму уравнению (4.24). Далее считаем, что пара {С, А} задана в канонической форме (4.7). Пусть в указанном базисе F = (Л,..., fn). Тогда второе уравне- ние (4.24) примет следующий вид ' /2 = АД, /з = Л/2, < ; (4.25) fn = Xfn-if < 4- ... 4- o^nfn) 4- A/n = —g. Пусть /i = q, тогда из первых (п — 1) уравнений системы (4.25) следует, что /2 = Aq, /3 = A2q,..., fn = Xn~{q, а из последнего уравне- ния получаем равенство — q(cii 4- Аа2 4- .. • 4- An -h An) = д. Учитывая, что а* — коэффициенты характеристического полинома q(s) матрицы А, последнее равенство можно записать в виде -qa(A) = д. Если А е spec(A), то д = 0, a q — любое. Если же А spec(A), то для любого д найдется единственное q = -д/а(Х) / 0, отвечающее уравнению (4.26). При этом вектор F имеет вид F = д[1, А,.... А"'1]. Таким образом, если пара {С, А} задана в канонической форме, то скалярными наблюдателями могут быть восстановлены функцио- налы а = Fx, порождаемые векторами F, коллинеарными векторам F(A) = [1; А; А2;...; Ап-1], где А < 0. Заметим, что, если А е spec(A), то F(A) — собственный вектор матрицы А, отвечающий А. Пусть Ai,A2,...,An_i G R, Xi Ф Xj при i ± Ъ А; < О (г = 1, ... ,n — 1). Тогда каждому Xi можно поставить в соответствие вектор F(Xi), причем каждый функционал ai = F(Xi)x может быть восстановлен скалярным наблюдателем. Кроме того, векторы F(Ai), F(A2), ... ,F(An-i) и вектор С — [0, ... ,0,1] образуют базис в про-
82 Гл. 4. Функциональные наблюдатели странстве Rn. Это следует из невырожденности матрицы ’1 А, А, . ... А”-2 А”-1' ^(А1) - 1 А2 А2 \ п—2 •• Л2 \П—1 л2 F(A2) 1 Ап-1 А„-1 • \п—2 •• Лп-1 \п—1 Лп-1 Г(А„_!) 0 0 0 0 1 С для которой главный минор порядка (n- 1) представляет собой опре- делитель Вандермонда и невырожден, если Xi ± Xj (г ± j). Если задан произвольный вектор F е Rlxn, то этот вектор един- ственным образом разлагается по указанному базису п— 1 F = ^niF(Xz)+rinC. (4.27) г=1 При этом функционал а = Fx имеет вид п — 1 i=l Так как каждый функционал (i = 1,п — 1) восстанавливается скалярным наблюдателем, a y(t) — известный выход, то имеет место следующее утверждение. Теорема 4.5. Пусть система (4.1) наблюдаема, пара {С, Л} задана в канонической форме. Пусть задан набор вещественных чисел Xi, i = 1, ... , п — 1, таких, что Xi < 0, Xi / Xj при i j. Тогда для каждого Xi определен вектор F(Xi) = [1, Xi,..., А™-1], векторы {F(Ai), ... F(An_i),C} образуют базис в Rn. Функционал а = Fx, где F е Rlxn, может быть восстановлен наблюдателем порядка к, где к — число отличных от нуля коэф- фициентов ту (г = 1, ... ,п — 1) в разложении (4.27) вектора F по указанному базису. При этом k п — 1. Замечание 4.3. Если в условиях теоремы взять набор комплексных чисел, т.е. Xi е С, Re(A$) <0, (г = 1, ... ,п — 1), то каждому Xi по-прежнему будет соответствовать вектор F(A;) е С1хп. При этом векторы {F(Ai), ... ,F(An_i),C} образуют базис в Сп, если Xi — раз- личные. Кроме joro, нетрудно заметить, что комплексно-сопряженным значениям А и А соответствуют комплексно-сопряженные векторы, т. е. F(A) = F(X). Рассмотрим теперь подробнее возможность понижения порядка наблюдателя для заданного вектора F. Для этого надо найти та-
4.4. Метод скалярных наблюдателей 83 кой набор А;, при котором число ненулевых коэффициентов (г = 1, ... ,72 — 1) в разложении (4.27) будет минимальным. Пусть задан вектор F = (/i,...,/n) Из теоремы 4.5 следует, что функционал а = Fx может быть восстановлен наблюдателем порядка k < п — 1, если найдется такой набор {Ai, ... , Afc}, Ai <0, Аг А;, что вектор F раскладывается по векторам F(Ai), ... ,F(Afc) и С (т.е. в разложении (4.27) отличны от нуля только первые к из (п — 1) коэффициентов щ). Это условие выполнено, если rank / F \ F(Ai) \ С / (4.28) Учитывая явные выражения для векторов F, F(Ai) и С, запишем условие (4.28) в виде Z/1 /2 ... /п-1 fn \ 1 А1 ... а;-2 А”-1 1 Afc ... АГ2 АГ1 \0 0 ... 0 1 / = к+ 1. Это условие эквивалентно условию //1 /2 ••• /п-1\ rank 1 - ЛГ2 = rank Н(F, Ai,..., А^) = к, \1 Afc ... АГ2/ полученному из предыдущего удалением последней строки и последне- го столбца из исследуемой матрицы. Далее проведем преобразования матрицы H(F,X\, ... , Afc), не ме- няющие ее ранг: вычтем из каждого столбца, начиная со второго, предыдущий, домноженный на Аь В результате получим матрицу /У1 /2-Л1/1 /3-AJ2 ... /п-1-Л1/п-2\ 10 О ... 0 1 А2 — Ai (А2 — А1)Аг ... (А2 — AJA2 3 \1 (Afc-АО (Afc-AOAfc ... (Afc-АОАГ3/
84 Гл. 4. Функциональные наблюдатели Вычтем вторую строку из следующих за ней, после чего, учитывая, что Xi ± Х3, поделим соответствующие строки на (А; - Ai) / 0. В ре- зультате получим матрицу </1 /2-А1/1 /3-А1/2 ••• /п-1 - А1/п_2\ 10 0 ... 0 О 1 А2 ... А”"3 \0 1 Хк ... А”-3 / Вычтем из первой строки вторую, домноженную на /1, после чего поменяем местами первые две строки. В результате перечисленных преобразований, не меняющих ранг исследуемой матрицы, получим матрицу /10 о ... О (4.29) при этом выделенная подматрица, находящаяся в строках (2,3, ... ,к) и столбцах (2,3, — 1), имеет ту же структуру, что и исходная матрица H(F, Ai, ... , А&), а, следовательно, для нее можно провести аналогичные преобразования. Для удобства изложения введем следующие обозначения. Опреде- лим функции Pi(x\,^+1) рекуррентно: W,) = Ib (4.30) Pi+l(xi,...,xi+2) = Pi(x2, ...,Xi+2) - XiPi(xi,...,xi+i').
4.4. Метод скалярных наблюдателей 85 Тогда матрица (4.29) в новых обозначениях примет вид / 1 0 0 0 \ 0! ВДь/г) Pl(fn-2, fn—l ) 0! 1 Аг \ п—3 л2 Выпо НИЯ, 0 j 1 Хк \ i |днив для выделенной подматрицы получим матрицу 4 0 0 0 0 10 0 0 0 Р2(/1,/2,/з) ЖЛ./з.А) 0 0 1 А3 А”"3 ) описанные выше преоб[ 0 0 ... Р2(/п-3,/п-2,/п-1) \п—4 Л3 )с (зова- 0 0 1 А/с А""4 ) Выполнив указанную процедуру к раз, перейдем к матрице / 1 0 ... О 0 ... О \ О 1 ... о о ... о О О ... 1 о ... о \0 0 ... О Pk(f 1,...,ffc+1) ... / Очевидно, что указанная матрица порядка (к + 1) х (п — 1) имеет ранг к тогда и только тогда, когда имеют место равенства < Pk(f2, ;fk+2) = 0, (4.31) Ffe(/n_fe_i,...,/n_i) = 0. Изучим подробнее функцию многих переменных Рк(х\, ...,хк+\). Рассмотрим полином степени к к <Pk(s) = JJ(s — Аг) — + 1к8к 1 + ... + Z1- г=1 (4-32)
86 Гл. 4. Функциональные наблюдатели Имеет место Лемма 4.1. Функция (k 4- 1) переменной Pk(xi, ...,Xk+i), опреде- ленная рекуррентно уравнениями (4.30), имеет следующий вид: Pk(xi,...,Xk+i) = 1\Х\ +12Х2 4- ... + lkXk + Zfc+1, (4.33) где Ц — коэффициенты полинома рк($) из (4.32). Доказательство. Докажем утверждение леммы по индукции. Для к = 1 задано одно значение Ai, при этом ^i(s) = s - Al = + s, т. e. Zi = —Ai. Из (4.30) следует, что Po(xi) = XI, Р[(х\,Х2) = Ро(^2) - AiFo(^l) = Х2 - А1Ж1 = 1\Х\ 4- Х2, т. е. для к = 1 утверждение справедливо. Пусть оно верно для (к - 1), покажем, что оно верно и для к. Рассмотрим полином ^(s): ^fc(s) = pk-\(s)(s - Хк) = (sfc-1 + Tk-isk~2 4-... +?i)(s - Xk) = — + sk 1 (lk-1 ~ Afc) 4- sk 2(/fc_2 — Afc/fc_i) + ...4- + ...4-s(?i -Aj2) + HiAfc), (4.34) ~ k-i где Ц — соответствующие коэффициенты полинома <pfc_i(s) = П (s ~ г=1 — Ai). Из (4.34) следует, что Ц=Ц-ХкТ+1 i=l,...,k; (tk = 1; To = 0). (4.35) Так как для (к — 1) формула (4.33) верна, то из рекуррентных соотно- шений (4.30) и (4.35) следует Pk(xi, ...,Tfc+i) = Pfc-l(^2,...,^fc+l) - XkPk-i(xi, ...,Хк) = = (TlX2 4-^3 + ••• + Tk-lXk 4- Xk+l)~ Xk(l\x\ 4- I2X2 4~ ... 4~ lk—\Xk— 1 4“ Xk) — = (-AUi)^i 4- (li — Xkh)x2 4-... 4- • •• 4- (Ik—2 ~ Xklk-i)xk-2 + (lk-1 — Xk)xk-i 4- Xk+i = = llXi 4- I2X2 + ... 4- lk-2Xk-2 + Ik-lXk + Xk+l, т. e. соотношение для к выполнено. Лемма доказана. □
4.4. Метод скалярных наблюдателей 87 Теперь, учитывая явное выражение для функции Рк(х\,..., тьи), уравнения (4.31) можно записать в виде /Zi h ... Ik 1 О ... Ik— 1 Ik \0 0 ... Z1 о ... 0\ 1 ... о ... Ik у / /1 \ /2 \/п-1/ где Ц — коэффициенты полинома k-го порядка с корнями Ai, ... ,Ль Последние уравнения можно рассматривать как уравнения относитель- но Ц, а именно: ' /1 /2 ... fk \ /2 /з ... Л+1 .fn—k—i fn—k fn—2/ \lj ffk+\\ fk+2 \fn-J (4.36) Из приведенных рассуждений и теоремы 4.5 следует Теорема 4.6. Пусть система (4.1) задана в канонической форме, I — 1. Функционал а = Fx, где F — (Д, ... , fn) е Rlxn, может быть восстановлен наблюдателем порядка к, если среди решений систе- мы (4.36) найдется столбец L = (1\, ... ,Zfc)T, отвечающий гурвицеву полиному <£&($) = l\ + I2S + ... + lksk~} + sk, имеющему различные вещественные корни. Для построения наблюдателя на основе теоремы 4.6 надо найти указанное решение системы (4.36), столбец L, а также отвечающие ему значения Xi, i= l,...,k. Каждому Xi ставится в соответствие вектор F(Xi) и функционал = F(Xi)x. Все функционалы аг вос- станавливаются скалярными наблюдателями, а функционал а = Fx раскладывается по функционалам а\,...,ак и у. Заметим, что уравнения (4.36) полностью совпадают с уравнения- ми (4.18). Таким образом, теорема 4.6 является частным случаем теоремы 4.2. Условие на гурвицев столбец L, налагаемые в теореме 4.6 (а именно, требование, чтобы соответствующий вектору L полином имел различ- ные вещественные корни), связано с методом доказательства теоре- мы 4.6 и может быть снято (в этом случае теоремы 4.2 и 4.6 будут давать одно и то же достаточное условие существования наблюдателя, которое является и необходимым). Чтобы снять требование вещественности и различности спектра полинома pk(s) = li + I2S + ... + lksk~' + sk, рассмотрим случай, когда у этого полинома есть кратные корни, либо комплексно-сопряженные корни. Покажем, что и в этом случае с помощью небольших изменений
88 Гл. 4. Функциональные наблюдатели алгоритма синтеза наблюдателя на основе скалярных наблюдателей удается решить поставленную задачу. 4.4.1. Случай кратных корней. Рассмотрим вначале случай, ко- гда полином имеет корень А кратности т. Докажем вспомога- тельное утверждение. Лемма 4.2. Пусть пара {С, А} наблюдаема, вектор F(A) удовле- творяет уравнению F(X)(A — XI) = дС при заданном А и некотором д. Пусть D eRnxl — вектор обратной связи такой, что А е spec(A — DC). Тогда F(X) — левый собствен- ный вектор матрицы (А — DC) = Ad, отвечающий собственному значению X. Доказательство. Пусть А задано. Для простоты доказательства положим, что пара {С, А} находится в наблюдаемой канонической форме. Тогда вектор F(A), как было показано выше, имеет вид F(A) = р[1, А,..., А”-1]т. Пусть вектор D = (di,...,dn)r таков, что А е зрес(Л — DC). Тогда из явного представления (4.7) для А и С следует, что det (si — Ар) = sn + (an + dn)sn ' + ... + (ai + d\). Так как А е spec Л р, то А” + (an + dn)Xn ' + ... + (aj + cJj) — 0. Тогда Г(А)(Л - DC) = Лемма доказана. 1 А А2 /0 о ... о 1 о ... о О 1 ... о \0 0 ... 1 —(ai + di)\ -(«2 + d?) -(аз + <7з) (ап + dn)J □
4.4. Метод скалярных наблюдателей 89 В силу наблюдаемости пары {С, Л} спектр матрицы Ad = A- DC целиком определяется выбором вектора D. Выберем D так, что det(sl - AD) = <pfc(s)^n_fc(s), где — гурвицев полином, определенный выше, a ^n_fc(s) — полином порядка (п - к), не имеющий общих корней с ^(s). Пусть А — корень кратности т полинома ^(s) (и полинома det (si — Ad), соответственно). В этом случае матрица Ad невырож- денным преобразованием координат может быть приведена к форме Жордана, причем, в силу наблюдаемости пары {С, А}, вещественному собственному значению А будет соответствовать ровно одна клетка Жордана размера т. Обозначим через Fi(A) — собственный вектор матрицы Ар, отвеча- ющий А. В исходном базисе (отвечающем канонической форме наблю- даемости) Fi(A) = [1, А, ... ,АП-1]. Обозначим через F2(A),...,Fm(A) — корневые векторы матрицы Ар, отвечающие А. Эти векторы определя- ются соотношениями Гг+1(А)Ар = AFi+i(A) + F,(A), i = l,2,...,m— 1. Заметим, что, если Ai,..., Ар — вещественные корни полинома <pk(s) кратностей mi, ... ,тр соответственно, (mi + ... + тр = к), то век- торы Fi(Ai), ... ,Fmi(Ai), Fi(Аг), ••• ,Fmp(Ap) линейно независимы, так как они составляют часть базиса Жордана для матрицы Ар. Наряду с векторами F(A), где А < 0, рассмотрим функциона- лы сц(Х) = Fi(X)x. Так как Д(А) — собственный вектор матрицы Ар = А - DC, то функционал ср (А) удовлетворяет уравнению ai = F\(X)x = Fi (А) Ат = = Я (A) (A - DC)x + F{(X)DCx = Ха{ + (F{(X)D)y, а, следовательно, если А < 0, то функционал ai(A) может быть восста- новлен скалярным наблюдателем 5i=A?i + (Fi(A)P)7/. (4.37) Функционал аг (А) — F2(X)x удовлетворяет уравнению <т2 = F2(A)At = F2(A)(A - DC)x + F2(X)DCx = Х<г2 + + (F2(X)D)y. Так как (4.37) дает экспоненциально сходящуюся оценку 51 функцио- нала ai, то для восстановления <72(А) можно использовать наблюдатель а2 = А52 + 51 + (F2(X)D)y. (4.38) Таким образом, два скалярных наблюдателя (4.37) и (4.38) вместе дают оценку для двух функционалов <71 и <72.
90 Гл. 4. Функциональные наблюдатели Продолжая указанную процедуру, можно построить оценки для остальных функционалов аДА). Пусть известна оценка 5; (А). Так как <Тг+1 = А^г+1 + + (Fi+1(A)D)T/, то для восстановления функционала аг+1 (А) можно использовать на- блюдатель 5г+1 = А5г+1 + 5г + (Fi+i (A)Z>)?/. (4.39) Из проведенных рассуждений следует, что если ^($) имеет веще- ственные корни Ai, ... , Ар кратностей mi, ... , mp, соответственно, то система наблюдателей вида (4.37)-(4.39) восстанавливает экспоненци- ально функционалы СГ1 (А1) , ..., <7mi (А1),<71(А2),...,<тШр(Ар), (4.40) причем число используемых скалярных наблюдателей совпадает с чис- лом функционалов и равно к. Вернемся к задаче восстановления произвольного заданного функ- ционала а = Fx. Так как система функционалов (4.40) восстанавлива- ется наблюдателем порядка к (т. е. к скалярными наблюдателями), а выход у = Сх известен, то для восстановления функционала сг = Fx наблюдателем к-го порядка достаточно, чтобы этот функционал рас- кладывался по системе (4.40) и у, или, иначе, р тр F = ЕЕ +7fc+i2/- г=1 j=l Последнее условие имеет место, если Л(А0 rank ♦ = к + 1. (4.41) Fmp(Ар) . с . Рассмотрим последнее условие подробнее. Введем следующие обозна- чения, пусть т. е. — j-я координата вектора F^(A). Тогда в силу определения векторов Fi(A), а также явного представления для матриц А и С,
4.4. Метод скалярных наблюдателей 91 имеют место соотношения /f+1(A)-A/f(A)=O, /f+1(A)-A7f(A) = (A-A9/f(A), //+i'(A) - A'/f+i(A) = (A-A')/4j(A) +//(А), i = l,...,m(A) - 1, (4.42) где m(A) — кратность корня А. Проведем для матрицы из усло- вия (4.41) преобразования, аналогичные преобразованиям, проведен- ным для случая простых корней. Далее учтем, что С = [0,...,0,1], поэтому условие (4.41) можно записать в виде /1 /2 /з - /п-1 //(АО Л2(А1) /,3(А1) ... /”-1(А1) rank //(А.) /2(А1) /23(А1) - /Г‘(А1) /т,(А1) /^,(А>) ... /А(Л0 /((Аг) Л2(а2) /3(А2) ... /Г‘(А2) А(АР) Д(АР) С(АР) ... /А (Ар). (4.43) Учтем явное выражение векторов Я(А0 = [1,\, А2,..., А”-1]. Тогда условие (4.43) примет вид rank ’ /1 /2 /з .- /п-1 1 Ai А* ... А”"2 //(А.) /2(А1) /2(А1) - /Г1 (А.) Д, (АО Л. (АО /Д,(АО ... А‘(АО 1 А? А2 \п—2 Л2 А,(АР) А(АР) А(АР) ... /™;‘(Ар). Проведем преобразования, не меняющие ранг этой матрицы, анало- гично случаю простых корней. Вычтем из каждого столбца, начиная со второго, предыдущий столбец, умноженный на Аь Учитывая соот- ношения (4.42), получим матрицу
92 Гл. 4. Функциональные наблюдатели
4.4. Метод скалярных наблюдателей 93 Далее, вычтем вторую строку, умноженную на соответствующий коэф- фициент, из всех остальных. После этого поделим строки, соответству- ющие векторам Fi(Ai), на (Xi - Ai) ± 0, i > 1 (корни Xi — различные). После этого будем последовательно делить строку, отвечающую Fj(AJ, j 2, на (Ai — Ai) и вычитать ее из следующей. Если обозначить, как и ранее, Ро(#1) = Р\(^1,^2) = Po(^i) - X\Pq(x\) = х% - Х\х\, и поменять местами первые две строки преобразованной матрицы, то получим матрицу вида 1 0 0 0 0 Fl(/2,/3) • Pl(/n-2,/n-l) 0 1 Aj A"-3 0 /2'(Ai) Л2(А1) - /2n’2(Ai) 0 1 to ч ' 0 1 A2 \ n—3 a2 0 /^(Ap) Д(АР) . ; 1 CM 1 Минор этой матрицы, расположенный в строках (2,3,..., к) и столбцах (2,3,..., n — 1), имеет ту же структуру, что и исходная матрица, а, следовательно, для него могут быть проведены описанные выше пре- образования. Отличие от случая простых корней заключается в том, что первые т\ шагов проводятся с одинаковым коэффициентом Ai, следующие шагов — с коэффициентом А2 и т. д. После проведения т\ + m2 + ... + тр = к шагов матрица примет вид 1 0 . .. 0 0 0 0 1 .. .. 0 0 0 0 0 . .. 1 0 0 0 0 . .. 0 Pk(fl, Pk(fn-k-\, , где, как и ранее, функция Рк(р\ > ’ • “Ь 1к%к “Ь .. • 4“ и Ц — коэффициенты полинома ^fc(s) = IK* - = sk + lksk~l + ... + h.
Гл. 4. Функциональные наблюдатели Таким образом, ранговое условие принимает стандартный вид: ' П(/1,..,А+1) = 0, < ... ч Pfc(/n-fc-l, = О, или, с учетом явного представления для Pk(x\, ...,Хк), вид систе- мы (4.36) с той лишь разницей, что теперь Ц — коэффициенты полино- ма с кратными корнями. Таким образом, для теоремы 4.6 имеет место следующее Следствие 4.4. Теорема 4.6 остается справедливой, если вектор L' = (/i, ...,Zfc)T — решение системы (4.36) — соответствует гурви- цеву полиному с вещественными (возможно кратными) корнями. 4.4.2. Случай комплексных корней. Теорема 4.6 остается спра- ведливой и в том случае, когда компоненты вектора L' отвечают гурвицеву полиному с комплексно-сопряженными корнями, при этом наблюдатель можно построить с помощью метода скалярных наблюда- телей. Для определенности рассмотрим случай простой пары комплексно- сопряженных корней Л и Л. Случай, когда имеются кратные ком- плексно-сопряженные корни, может быть рассмотрен по схеме, анало- гичной случаю кратных вещественных корней, однако это приводит к громоздким выкладкам, поэтому подробности опускаем. Рассмотрим гурвицев полином второго порядка q(s) = s2 + ot^s + + ai, корнями которого являются А и А. Ему отвечает сопровождающая матрица —П1 — П2_ Пусть матрица Fx е R2xn удовлетворяет уравнению FXA - AFX = КС, (4.44) где К е R2x1. Тогда двумерный линейных функционал сгд = Fxx е GR2xl удовлетворяет уравнению ах = Л(тА + Ку, и, следовательно, в силу гурвицевости матрицы Л, его асимптотиче- скую оценку дает следующий двумерный наблюдатель: сгд = Летд + Ку. (4.45) Матрица Л невырожденным преобразованием с комплексной матрицей Р е С2х2 может быть приведена к диагональному виду: Р~'ХР = А О' О А
4.4. Метод скалярных наблюдателей 95 Обозначим F' = Р [FX € С2хп; Kf = Р {К е С2х1. Тогда уравне- ние (4.44) после преобразования с матрицей Р~х примет вид F'A - AfFf = К'С. Так как матрица Л' — диагональная, последнее уравнение можно рассматривать как систему из двух уравнений относительно строк F[ и F2' матрицы F', а именно: F!(A — XI) = К'С, (4.46) F'(A - XI) = К'2С, i = 1,2, — коэффициенты матрицы К'. Из (4.46) следует, что с точностью до коэффициентов F[ = K{F(X), Ц = K'2F(X), где, как и ранее, F(A) = [1, А, ... ,АП-1].^Гак как F' = P~XF\, то ком- плексно-сопряженные строки F(A) и F(A) выражаются через строки матрицы Fx е R2xn. Таким образом, если при заданном функционале а = Fx систе- ма (4.36) имеет решение L' = (Zi,...,Zfc)T, где Ц — коэффициенты гурвицева полинома с парой комплексно-сопряженных корней А и А, то вектор F раскладывается по к векторам, _в число которых входят ком- плексно-сопряженные векторы F(A) и F(A) (это следует из процедуры доказательства теоремы 4.2 и следствия 4.3). Однако в этом случае найдется действительная матрица Fa е R2xn такая, что функционал ах = Fxx восстанавливается двумерным наблюдателем, a F(A) и F(A) выражаются через строки матрицы Fa. Следовательно, в разложении F комплексные строки F(A) и F(A) можно заменить на действительные строки матрицы Fa. Аналогичную процедуру можно проделать для всех пар комплекс- но-сопряженных корней полинома^($). Если же полином <pk(s) имеет кратные сопряженные корни А и А кратности т, то соответствующими двумерными действительными матрицами заменяются и пары ком- плексно-сопряженных корневых векторов {F(A); Fj(A)}. Подробности опускаем. Таким образом, имеет место Следствие 4.5. Теорема 4.6 верна, если решение системы (4.36) — вектор L1 — гурвицев. Таким образом, в случае скалярного функционала и скалярного вы- хода методы псевдовходов и скалярных наблюдателей дают одинаковые результаты.
96 Гл. 4. Функциональные наблюдатели 4.5. Системы с векторным выходом Обобщим метод скалярных наблюдателей на случай систем с векторным выходом, т. е. рассмотрим системы (4.1) в случае, если у = Сх Е Rz, I > 1. Рассмотрим задачу восстановления скалярного функционала а = Fx, F е R1Xn. Далее считаем, что пара {С, А} наблюдаема, / F \ rank I I = 1+ 1, а индекс наблюдаемости равен и. Тогда систе- ма (4.1) невырожденным преобразованием координат и выходов может быть приведена к канонической форме Люенбергера: Xi — АцХъ 4" (lijyj 4“ BiU, i — 1 __ 3 = 1 < yi — CiXi, (4-47) где v = max иц v\ + ... + vi = n\ в канонической форме: пары {С;;Ап} наблюдаемы и заданы ГО 0 ... О *1 Л 1 0 ... О * 7=7 Гг. Ац — , Ci — [0,..., 0,1 ], 0 0 ... 1 * где * — возможно ненулевые элементы матрицы Ац. Обозначим i Vi = a^yj + BiU, i =1,...,I известные входные сигналы подсистем из (4.47). Тогда (4.47) можно рассматривать как I независимых систем со скалярными выходами yi Xi = Ацх{ + щ, yi = CiXi, i=l,...,l. (4.48) В новом базисе функционал а имеет вид i o = Fx = ^FiXi, = (4.49) 2=1 Так как входы щ известны и их влияние в наблюдателе всегда можно компенсировать, далее, не ограничивая общности рассуждений, счита- ем, что Vi = 0, i — 1,..., I. По аналогии со скалярным случаем рассмотрим линейные функцио- налы, которые могут быть восстановлены скалярными наблюдателями. Это — функционалы сг\ = F(X)x, где вектор F(A) е Rlxn удовлетворя- ет уравнению _ _ F(A)A = AF(A) 4- DC,
4.5. Системы с векторным выходом 97 где D е RlxZ — некоторая постоянная матрица, Л < 0. Как и в скаляр- ном случае, непосредственной проверкой можно найти явное выраже- ние для F(A): F(A) = [F1(A);F2(A);...;F,(A)]> F,(A) = 7,(А)[1, А, А2,..., APi-1], ГДА) е Rlxi7i. Здесь 7г(А) — константы, зависящие от параметров системы, выбран- ного А и строки D; выбором D значение 7г(А) можно задавать по произволу; Fi(X) — вектор-строка длины соответствующая г-й ска- лярной подсистеме из (4.48). Как и в скалярном случае, выберем к различных действительных значений параметра А (т. е. Ai, Аг,...»Аь Xj < 0, Xi ± Xj) и попыта- емся разложить вектор F из (4.49) по системе векторов F(Aj) и Ci = [0, ...,0, Сг,0, ...,0] е Rlxn (г = 1,...,Z). Для того чтобы F рас- кладывался по указанной системе векторов, необходимо и достаточно, чтобы было выполнено ранговое условие: " F Ш.) F(A2) rank = к + 1. L Cl J Учитывая явное представление для векторов, последнее условие имеет вид Л 711Fi(Ai) 721-Fl (А2) f2 712F2(A1) 722F2(A2) Fi ... 7uF/(Ai) • •• 721F(A2) rank 7fei F[ (Afc) Ci 0 7fc2F2(Afc) 0 c2 ••• 7fe(F(Afc) 0 0 = rank M = к + I 0 0 Ci (4.50) Здесь yij = 7j(Xi) — задаваемые по произволу константы. 4 С. К. Коровин, В. В. Фомичев
98 Гл. 4. Функциональные наблюдатели Заметим, что векторы РДАД j = l,...,fc, образуют матрицу Ван дер Монда 'Fi(Xiy Fi(A2) — 1 А! . 1 а2 . .. Ар-1' .. а2 Fi(Afc)_ J Хк • ^р-1. поэтому, если задан набор Ai,..., А^, Xi Ф Xj, к и — 1, то векторы F(A,) = {F{{Xj\F2(Xj').....Fl{Xj)], j = линейно независимы. Для того чтобы выполнялось ранговое условие (4.50), необходимо и достаточно, чтобы для каждой из подсистем выполнялось ранговое условие rank Fi(Ai) = rank Mi = к + 1, i = 1,. ,.,z. (4.51) Д(Ак) Действительно, если выполнены условия (4.51), то Fi выражается через Fi(Xi),..., Fi(Xk) и Ci, а, следовательно, выбором 7^ можно добиться, чтобы выполнялось условие (4.50). Заметим, что условия (4.51) будут выполнены для всех подсистем, если к = и — 1, где индекс наблюдаемости и = max 17 — размер макси- мальной подсистемы. Таким образом, для системы с векторным выхо- дом можно построить наблюдатель порядка (р — 1) с любым наперед заданным вещественным спектром. Учитывая явные представления в каноническом базисе для Fi(Xj) и Ci, условия (4.51) можно записать в виде rank Mi = rank (ft fi fi( \ 1 A! ... A^-1 1 At ... Ap-1 \0 0 ... 1 / или, что то же самое, rank Л/,' -= (fl fi Д-1\ 1 А1 ... Ар-2 i = \1 Afc ... Ар-2/
4.5. Системы с векторным выходом 99 Проводя для матриц М- преобразования, подробно описанные для ска- лярного случая, получим уравнения относительно компонент вектора F Л Л - Л 1 fi fi fi J2 J3 fi fi fi -J Vi—k—1 ••• J Vi— 2- //.\ h \lj fk+i fk+2 z=l,...,Z. (4.52) Заметим, что вектор Lf = (Zi,..Z&)T является общим решением всех Z систем из (4.52), так как этот вектор определяет полином к (pk(s) = П (5 ~ = sk + lksk~} + ••• + Zi. Таким образом, имеет место Теорема 4.7. Пусть система (4.1) наблюдаема, I > 1, пара {С, А} задана в канонической форме (2.11). Функционал а — Fx, где F е eRlxn, rank ( J ) =1+ 1, F=(F1;...;F/), К = (Л,...,Л^, может быть восстановлен наблюдателем k-го порядка, если среди решений системы линейных уравнений Г Л1 А1 - Л 1 Л Л - Д fvt-k-l Л,-к ••• /Ji-2 Л2 л л ’2 г2 fk V2 — k—\ J V2~k — J Vk~2 /fc+1 Л+2 /2,-. /fc+i f2 J 1/2— 1 (4.53) -Д-fc-l ... Д_2. найдется гурвицев столбец L' = (Zi,..Z^)T, отвечающий полиному с вещественными и различными корнями. Замечание 4.4. Так же, как и в случае скалярного выхода, требова- ние вещественности корней полинома ^(s) = sk + lksk~{ + ... + Zi, a также требование отсутствия у этого полинома кратных корней, можно снять. Для этого, как и в скалярном случае, необходимо рассмотреть i 4*
100 Гл. 4. Функциональные наблюдатели более подробно случай кратных корней и случай комплексно-сопря- женных корней по схеме, описанной выше. Подробности опускаем. Покажем теперь, что условия теоремы 4.7 являются не только достаточными, но и необходимыми для построения функционального наблюдателя k-го порядка. Пусть существует такой наблюдатель. Тогда он описывается систе- мой линейных дифференциальных уравнений z = Pz + Qu + Ry, Ъ = Tz 4- Gy, (4.54) где z e R\ P e R/exfc, Q e Rfcxm, R e Rfcx/, T e Rlxfc и G e RlxZ - постоянные матрицы. Для простоты рассмотрим случай, когда соб- ственные значения матрицы Р действительны и различны. Кроме того, для того, чтобы наблюдатель (4.54) давал оценку функционала a(t), требуется, чтобы матрица Р была гурвицевой. Таким образом, specP = {Ai,..., Afc}; Xi < 0, г = 1,..., fc; Xi Xj. В этом случае невырожденным преобразованием наблюдатель (4.54) может быть приведен к виду, где матрица Р диагональная. По- этому, не ограничивая общности рассуждений, считаем далее, что Р = diag(Ai, ... ,Хк\ В работе [87] приведены условия на матрицы Р, Q, R, Т и G, при которых наблюдатель (4.54) дает экспоненциальную оценку функцио- нала cr(f) F = TH + GC, Q = НВ, HA — PH = RC, (4'55) P — гурвицева, где Н G Rfcxn — постоянная матрица, такая, что z является асимпто- тической оценкой функционала Нх. В случае диагональной матрицы Р при Xi < 0 последнее условие из (4.55) выполнено. Второе условие из (4.55) выполняется соответ- ствующим выбором матрицы Q. Пусть Н\,...,Нк — строки матрицы Н, a t\, ... ,tk — компоненты строки Т. Тогда первое условие из (4.55) означает, что к Р = ^2ищ + сс, г=1
4.5. Системы с векторным выходом 101 т.е. строка F линейно выражается через строки Н\,...,Нк и строки матрицы С, а, следовательно, выполнено условие “F" rank = к + 1. (4.56) Нк Кроме того, в силу диагональной структуры матрицы Р, третье условие из (4.55) может быть записано в виде системы уравнений относительно Hi, ...,Нк, а именно: р2(а - а2/) = я2с, . Нк(А - ХкГ) = RkC, где Pi,..., Rk — строки матрицы R. Из (4.56) следует, что, с точностью до переобозначений, _ Нг = Р(А0, а, следовательно, условия (4.56) имеют вид F “ F(Ai) rank k + l. F(Afc) С Следовательно, выполнено условие, которое после преобразований, не меняющих ранг матрицы, дает условие (4.53) теоремы 4.7. Подобные рассуждения можно провести и для случая, когда спектр матрицы Р имеет более сложную структуру. Подробности опускаем. Таким образом, имеет место утверждение. Теорема 4.8. Пусть система (4.1) при I > 1 наблюдаема, пара {С, А} находится в канонической форме Люенбергера. Функционал а = Fx, где F е Rlxn, rank [ ) = I + 1, \ о j F = (Fi,...,Fl), Fi = U\,-..Jiy может быть восстановлен наблюдателем порядка к тогда и толь- ко тогда, когда среди решений системы (4.53) найдется гурвицев столбец L' = (1\,..., lk)T.
102 Гл. 4. Функциональные наблюдатели Заключение. В главе 4 приведены условия существования и ал- горитмы синтеза функциональных наблюдателей для линейных ста- ционарных полностью определенных систем для различных случаев: скалярный и векторный выход, скалярный и векторный функционал. В работах [87, 93] показано, что функционал сг = Fx е Rp мо- жет быть восстановлен наблюдателем порядка v — 1 (где и — индекс наблюдаемости пары {С, А}) с любой наперед заданной скоростью сходимости. В данной главе описаны новые подходы к синтезу функциональных наблюдателей заданного порядка к (к < v - Г), впервые предложен- ные в [26-28]. Для решения задачи предложены два метода: метод псевдовходов и метод скалярных наблюдателей. Оба метода позволяют получить необходимые и достаточные условия существования функци- ональных наблюдателей к— го порядка. Эти условия для скалярного случая (/ = 1,р = 1) дает теорема 4.3, для случая I = 1,р > 1 — теорема 4.4, для случая I > 1,р = 1 — теорема 4.8. На основе этих теорем предложен алгоритм синтеза наблюдателей минимального порядка, а так же получены оценки снизу на порядок наблюдателя.
Глава 5 АСИМПТОТИЧЕСКИЕ НАБЛЮДАТЕЛИ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ С НЕОПРЕДЕЛЕННОСТЬЮ (5.1) В этой главе рассматривается задача о построении наблюдателя для линейной стационарной системы, подверженной воздействию неизвест- ного возмущения. Рассмотрим постановку этой задачи более строго. Пусть задана динамическая система х = Ах + Ви + Df У = Сх, где А е Rnxn, В е Rnxfc, D е Rnxm, С е R/Xn — известные постоянные матрицы; u(t) е R\ y(t) е Rz — известные вход и выход системы, соответственно; f(t, х) е Rm — неизвестное возмущение. Требуется по информации об известных входе u(t) и выходе y(t) построить асимпто- тическую оценку x(t) неизвестного вектора состояния x(f) е Rn. Далее относительно системы (5.1) предполагаем, что пара {С, А} наблюдаема. В случае отсутствия возмущения f(t) задача построения оценки x(t) была изучена выше, в частности, ее решает полноразмер- ный наблюдатель х = Ах + Ви — L(Cx — у), (5.2) где матрица L выбирается из условия устойчивости системы в откло- нениях е = х - х, описываемой уравнением ё = (А - LC)e = ALe. В силу наблюдаемости пары {С, А} спектр матрицы Al целиком определяется выбором матрицы L, а, следовательно, предложенный полноразмерный наблюдатель решает задачу восстановления вектора x(t) экспоненциально точно с любой наперед заданной скоростью схо- димости. Ситуация существенно меняется, если в системе есть неопределен- ность f(t, х). В этом случае система в отклонениях имеет вид ё = ALe - Df,
104 Гл. 5. Асимптотические наблюдатели для линейных систем и если f(t,x) не стремится к нулю, то наблюдатель (5.2) уже не дает асимптотическую оценку для x(t). Поэтому требуются другие подходы к решению данной проблемы. Задача синтеза наблюдателей в условиях неопределенности имеет богатую историю. К настоящему времени предложено много методов и подходов к решению этой проблемы. При этом практически все они позволяют решить задачу при одних и тех же условиях на систе- му (5.1). Изложим подробно два таких подхода, следуя [13], после чего дадим краткий обзор остальных методов. 5.1. Гипервыходные системы Одним из основных случаев, рассматриваемых в литературе, яв- ляется случай систем с числом выходов, превышающим размерность вектора возмущений f(t), т. е. случай, когда I > т. Такие системы будем называть гипервыходными. Так как влияние известного входа u(t) в наблюдателе всегда можно компенсировать, далее для простоты изложения считаем, что u(t) = 0, т. е. рассматривается система f х = Ах + Df, г (5-3) [ У = Сх. Пусть относительно системы (5.3) выполнены следующие предпо- ложения. Предположение П.1. Пара {С, А} — наблюдаема, пара {A,D} — управляема, т. е. система (5.3) находится в общем положении. Предположение П.2. Матрицы С и D полного ранга, т. е. rank С = I, rank!) = т. Предположение П.З. Число выходов больше числа неизвестных входов, т.е. I > т. Предположение П.4. Имеет место ранговое условие rank CD = т, т.е. матрица CD е R/Xm — полного ранга. В силу предположения П.4 в матрице CD найдется невырожденный минор порядка т. Не ограничивая общности рассуждений, можем считать, что он находится в первых т строках матрицы CD (этого всегда можно добиться перенумерацией выходов). Пусть С{ (i = 1, ...J) — строки матрицы С. Тогда C=(g,), С"= ; €ГХП, С" = : gR(‘-m)Xn. V 7 \ст) \ Ct )
5.1. Гипервыходные системы 105 Из сделанных выше предположений следует, что главный минор матрицы CD = невырожден, т. е. det(C'D) 0. Матрица С' соответствует первым т компонентам выхода, а С" — оставшимся (I - т), т. е. Из невырожденности матрицы C'D следует, что нулевая динамика системы (5.3) по выходу у' имеет максимальный порядок (п — т). В этом случае существует невырожденная замена координат, приводя- щая систему (5.3) к виду xf = А\\х' + Л12г/\ yf = A2[x' + A22y' + (CfD)f, (5-4) где х' е Rn~m, Aij — матрицы с постоянными коэффициентами соот- ветствующих размерностей. Заметим, что в указанном представлении системы первые (п — т) неизвестных компонент фазового вектора х' не зависят явно от неизвестного возмущения f. Для перехода к форме (5.4) в качестве первых (п — т) базисных векторов достаточно взять какой-либо базис подпространства, допол- нительного для подпространства, натянутого на столбцы матрицы D. Кратко изложим один из способов такой декомпозиции, следуя [7]. Так как det(C'D) / 0, то для С е Rmxn выполнено условие rank С' = т, а, следовательно, в матрице Сг найдется невырож- денный минор порядка т. Не ограничивая общности рассужде- ний, будем считать, что он расположен в последних столбцах мат- рицы С = [Сп_т,Ст], т.е. det (7^ 0 0 (здесь Сп_т е С'т е Rmxm). Этого всегда можно добиться перенумерацией компонент вектора х. Требуемую декомпозицию системы дает преобразование где (1п—т
106 Гл. 5. Асимптотические наблюдатели для линейных систем при ЭТОМ матрицы Qn_m € R(n и е RmXm задаются СООТНО- шениями = D(C'D)-\ а 1п-т G R(n~m)x(n~m) — единичная матрица. После приведения системы к виду (5.4) для восстановления фазово- го вектора системы достаточно построить оценку неизвестной части ж' . (х'\ фазового вектора I t I. Если нулевая динамика системы (5.4) по выходу уг устойчива, т. е. матрица Ац гурвицева, то такую оценку дает, в частности, наблюда- тель порядка (п - т) х = А\\х' + А\2Уг- (5.5) При этом ошибка оценивания ег = х’ - х' удовлетворяет уравнению ё' = Аце', и, следовательно, ошибка е’ —> 0 экспоненциально при t —> оо. В этом случае скорость сходимости оценки определяется спектром матри- цы Ац и не может быть изменена. В случае неустойчивости матри- цы Ац наблюдатель (5.5) неприменим. Однако если I > т, то для построения асимптотического (а точ- нее, экспоненциального) наблюдателя для х' возможен другой под- ход. Заметим, что в наблюдателе (5.5) не используется вторая часть измеряемого выхода у" = С"х е R/-m. Покажем, что использование дополнительной информации качественно меняет ситуацию. Запишем вектор у" = С"х в новых координатах: у" = С"Р~ = С^х' + С^', (5-6) где С" Е С2 € R(/~m)xw — матрицы с постоянными коэффициентами, определяемые параметрами системы. — pr'l — Тогда в новых координатах у = С л, где матрица С имеет следу- ющую блочную структуру: С = СР'Х = о 1т Ц" С'' и, в силу полноты ранга матрицы С, заключаем, что и матрица С" — также полного ранга, т. е. rank С" = I - т. Так как yf и у" — известные векторы, определим новый выход Ti — 7/" - C1,fii' У — У ^2 У •
5.1. Гипервыходные системы 107 Из представления (5.6) следует, что у = C['xf. Тогда первое уравнение системы (5.4) и у можно рассматривать как линейную систему порядка (п — т) с известным выходом у порядка (/ — т) и известным входом у' порядка т, т. е. ( х' = Ацх1 + Ai2y', Заметим, что, в отличие от исходной системы, система (5.7) не зави- сит явно от неизвестного входа f(t,x). Поэтому, если пара {С", Ли} наблюдаема, то задачу восстановления вектора х' решает, в частности, полноразмерный наблюдатель порядка (п — т): х = Апх + Л12?/' - L(C"xf - у), (5.8) где матрица L е выбирается из условия гурвицевости матрицы Al = Ли - LC". При этом ошибка оценивания е' = х! - х' удовлетворяет уравнению ё' - Аье' и, следовательно, сходится к нулю экспоненциально. Более того, в отличие от наблюдателя (5.5), при наблюдаемости пары {С*!",Ли} скорость сходимости целиком определяется выбором матрицы L и может задаваться произвольным образом. При этом устойчивость мат- рицы Ли не предполагается. Наблюдатель (5.8) решает задачу и в том случае, когда пара {С}', Ли} не наблюдаема, а только восстанавливаема. В этом случае выбором матрицы L определяется часть спектра матрицы Al, осталь- ная часть неизменяема и устойчива. При этом скорость сходимости наблюдателя может определяться неизменяемой частью спектра матри- цы Ль. Кроме того, для системы (5.7) может быть построен наблюдатель Люенбергера пониженного порядка (n — m) - (Z — m) = (n — I). Из вышесказанного следует, что фундаментальное значение при построении наблюдателя для х' играет наблюдаемость (восстанавлива- емость) пары {С",Ли}. Для ее анализа исследуем свойства инвари- антных нулей системы (5.1), [32, 86]. Инвариантными нулями системы ( х = Ах + Df, г (5-9) } у = Сх называют значения s е С, понижающие ранг системной матрицы Ро- зенброка R(s), т.е. такие, что z ч (si-A —D\ rankE(s) = rank I I < n + m, где 7?(s) G C(n+z)x(n+m\
108 Гл. 5. Асимптотические наблюдатели для линейных систем Инвариантные нули определяют нулевую динамику системы (5.9), т. е. ее динамику при условии y(t) = 0. В случае, когда I > т, для определения характеристического поли- нома нулевой динамики используется следующий алгоритм. Рассмот- рим всевозможные квадратные «подсистемы» (5.9), т. е. системы вида ( х = Ах + Df, \ Уг\ ..Лт • • •> £ {!,•••>/}, ip 7^ iq При Q, Cix,...,Cirn матрицы С. При этом ^i...im = : е — m-мерный Z.\ \yirn/ выход, часть полного вектора y(t) е К . Каждая из систем (5.10), соответствующая ц, является квад- ратной, т.е. для нее размерность выхода yix...im совпадает с размер- ностью входа /. Поэтому для каждой из систем (5.10) характеристи- ческий полином нулевой динамики /^...^(з) является определителем соответствующей матрицы Розенброка: 0ii...im(s) = det si-A —D ii ...im Характеристический полином /?(<$) нулевой динамики системы (5.9) по полному /-мерному выходу y(t) представляет собой наибольший общий делитель всех полиномов (всего их С™). В общем случае при I > т полином = 1, т. е. у системы нет инвариантных нулей (точнее, среди всех систем (5.9) системы, у которых есть инва- риантные нули, образуют множество меры нуль). Если инвариантные нули системы отсутствуют либо устойчивы (т. е. нулевая динамика системы отсутствует либо устойчива, соответственно), то систему (5.9) называют минимально-фазовой. Далее будем считать, что выполнено Предположение П.5. Система (5.9) минимально-фазовая, т. е. ее инвариантные нули отсутствуют либо лежат в С_. Для системы (5.9) имеет место следующее утверждение. Теорема 5.1. Пусть для системы (5.9) выполнены предположения П.1-П.4. Тогда, если у системы нет инвариантных нулей, то пара {С", Ац} наблюдаема. Если у системы есть инвариантные нули, то они являются неизменяемой частью спектра матрицы Al = — Ац — LC"', если инвариантные нули устойчивы, то пара {С", Ац} восстанавливаема.
5.1. Гипервыходные системы 109 Доказательство. Рассмотрим подробнее матрицу Розенброка системы (5.9). Заметим, что множество инвариантных нулей системы инвариантно относительно невырожденной замены координат и неосо- бых преобразований входа и выхода. Поэтому для определения мно- жества инвариантных нулей достаточно записать матрицу Розенброка для системы, приведенной к виду (5.4). При этом 0 1т С{' и матрицу Розенброка можно записать в следующем блочном виде (sln—m Ац А12 0 -д21 s/m-A22 -(С'П) 0 1т 0 \ q' о / По предположению П.4 det(C'D) 0, поэтому rank.R(s) = п + т тогда и только тогда, когда (sln—m >111 >112\ о 1т С[' C'J = rank R' (s) = n. Проведем над матрицей R'(s) преобразования, не изменяющие ее ран- га, а именно, вычтем из первой и третьей блочных строк вторую блочную строку, умноженную на (—А\%) и (-С2), соответственно, тогда получим (sln—m Ац 0 0 1т С[' о) = rank Rff(s). Очевидно, что rank7?"(s) = п тогда и только тогда, когда (SIfi_т -^411 \ I = rank R'"(s) = п- т, С" J v 7 т. е. матрица R'"(s) полного ранга. Полнота ранга матрицы Я'"($) для всех s е С при условии полноты ранга С" (а это условие выполнено) является необходимым и достаточным условием наблюдаемости пары {C'J7, Ац}. Точки понижения ранга матрицы R"'(s) определяют спектр ненаблюдаемой динамики пары {С", Ац}. Из сделанных выше неособых преобразований следует, что ранг матрицы Розенброка 7?($) теряется тогда и только тогда, когда теря- ется ранг матрицы Rn,(s), причем множества точек понижения ранга
по Гл. 5. Асимптотические наблюдатели для линейных систем этих матриц совпадают. Таким образом, нулевая динамика исходной системы определяет ненаблюдаемую динамику пары {С", Ац}. Теорема полностью доказана. □ Замечание 5.1. Тот же результат можно получить, используя пред- ставление (5.4). Этот подход позволяет в явном виде выписать струк- туру наблюдателя. Рассмотрим подробнее полностью определенную систему (5.7). За- метим, что, в силу управляемости пары {A,D}, пара {Ац,А12} в системе (5.7) так же должна быть управляема (т.е. первая подсистема в системе (5.4) управляема посредством Тогда для системы (5.7) существует калмановская декомпозиция, которая разбивает эту систему на наблюдаемую и ненаблюдаемую части: Г х\ = А'пх\+А\2у', \ х2 = А”хх'х + А”[х2 + А”2у', где х\ — наблюдаемая часть системы (5.7), а х^ — ненаблюдаемая часть этой системы (если она существует, т.е. если пара {С",Ац} ненаблюдаема). При этом (с точностью до невырожденного преобразо- вания координат) л Р" Лп = L" \ ^-11 0 \ 4 М>2 А'" / 12 \ А" л11/ \^12 = (<?{'; о>. Так как оставшаяся часть фазового вектора полной системы (5.4) является частью выхода у', то, очевидно, нулевая динамика полной системы (5.4) совпадает с нулевой динамикой системы (5.7*) (при «входе» yf = 0). Исследуем ее. При таком движении у' = 0, у” = 0 и, кроме того, в силу наблю- даемости части х\ из у" = 0 следует, что и х\ = 0 при О 0. Поэтому нулевая динамика системы (5.7*) при у' = 0 (а, следовательно, и ну- левая динамика исходной системы (5.4)) определяется ненаблюдаемой частью системы (5.7*) и описывается уравнением ±2 — АцЯ^- Таким образом, если нулевая динамика системы отсутствует, то у системы (5.7*) нет ненаблюдаемой части и пара {CJ', Ац} наблюдаема. Если же у исходной системы есть устойчивые инвариантные нули (или, что то же самое, устойчивая нулевая динамика), то ненаблюдаемая часть системы (5.7*) устойчива и пара {С", Ац} восстанавливаема.
5.3. Синтез наблюдателей методом псевдовходов 111 5.2. Функциональные наблюдатели Предложенный выше подход позволяет решить также задачу син- теза функционального наблюдателя для системы (5.9) в случае, когда число выходов больше числа неизвестных входов, т. е. Z > т. Рассмотрим задачу восстановления функционала а = Fx, а е Rp, где F е Rpxn — известная матрица. Пусть, как и ранее, для систе- мы (5.9) выполнены предположения П.1-П.4. Тогда, как было показано выше, неособым преобразованием система приводится к виду (5.4). При указанном выше преобразовании координат с матрицей Р функционал а = Fx примет вид а = Fx = FP [У J = F 'х' + F"yf = а' + У', где Ff € RPx(n-m), F" е Rpxm — известные матрицы. Заметим, что функционал а" = F"yf известен, а, следовательно, для построения оценки функционала а достаточно построить оценку его неизвестной части У = F'xf. Но для этого достаточно вновь рассмотреть редуцированную систе- му без неопределенности (5.7) порядка (п — т): ( х' = А\\х' + А12У, 1 У = С''х', для которой требуется построить функциональный наблюдатель для функционала У = F'x'. Методы решения этой задачи, в том числе условия построения функционального наблюдателя минимального по- рядка, подробно изложены в гл. 4. Условия наблюдаемости для этой системы дает теорема 5.1. 5.3. Синтез наблюдателей методом псевдовходов При указанных выше условиях на систему (5.9) для синтеза наблю- дателя полного фазового вектора системы x(t) может быть применен подход, основанный на декомпозиции системы с использованием так называемых псевдовходов. Изложим этот метод подробнее, следуя [13]. Пусть, как и ранее, для системы выполнены условия П.1-П.4, а инвариантные нули системы отсутствуют либо устойчивы (т. е. вы- полнено условие П.5). Так как число выходов системы I больше числа неизвестных входов т, то дополним систему (Z — т) «псевдовходами» /' е R(z“m\ В результате получим квадратную систему с I входами и I выходами: z ___ [ х = Ах + Df + D'ff = Ах + Df, 1 r (51°) I У = Сх,
112 Гл. 5. Асимптотические наблюдатели для линейных систем где f = , D = [D; D'], способ выбора матрицы D' е Rnx</-m) будет описан ниже. Заметим, что при /' = 0 система (5.10) совпадает с системой (5.9), поэтому наблюдатель, построенный для системы (5.10) при условии /' = 0, будет восстанавливать фазовый вектор и исходной системы. Так как система (5.10) — квадратная, то характеристический поли- ном ее нулевой динамики является определителем матрицы Розенбро- /3(з) = det R’(s) = det (Sln~ A . \ C Uy Если полином /3(s),-Зависящий от выбора матрицы Z)', имеет порядок (n — I) (т. е. det(CD) ^0), то для системы (5.10) можно провести описанную выше декомпозицию с матрицей Р с выделением нулевой динамики, при этом система примет вид J х' = Лия/ + Л123Л ( У = А2\х' + А22у + CDf, где х' е a det(sZ - Ли) = /?($). Если матрица D' выбрана так, что полином /3(з) — гурвицев, то задачу восстановления неизвестной части фазового вектора х' решает наблюдатель порядка (п - /): х = Лц5' 4- Л12?/. (5.11) При этом ошибка наблюдения е’ — х’ - х1 удовлетворяет уравнению ё' = Ацб', а, следовательно, скорость сходимости наблюдателя целиком опре- деляется степенью устойчивости полинома /3(з). Размерность наблю- дателя (5.11) совпадает с размерностью наблюдателя минимального порядка, описанного выше (когда для полностью определенной реду- цированной системы (5.7) строится наблюдатель Люенбергера). Таким образом, задача сводится к поиску такой матрицы D', что полином /3(s) имеет степень (п-l) и является гурвицевым. При этом имеет место следующее утверждение. Теорема 5.2. Пусть для системы (5.9) выполнены предположе- ния П.1-П.5. Тогда если у системы нет инвариантных нулей, то корни полинома /3(s) порядка (п — I) целиком определяются выбором матрицы D'. Если у системы есть инвариантные нули, то они являются корнями полинома /3(з), остальные корни определяются выбором матрицы Df. Замечание 5.2. Таким образом, необходимым условием гурвицево- сти полинома (3(s) является минимально-фазовость системы (5.9).
5.3. Синтез наблюдателей методом псевдовходов 113 Доказательство. Рассмотрим матрицу Розенброка расширен- ной системы (5.10): si-A —D —D' С 0 0 -D' 0 где R'(s) — матрица Розенброка системы (5.9). Заметим, что если точ- ка 5* — инвариантный нуль системы (5.9) (т.е. rank/? ($*) < n + m), то и гапкй'(з*) < п + т.е. з* — корень полинома /?(з) = detJ?(s). Следовательно, все инвариантные нули системы (5.9) содержатся в множестве корней полинома /3(з) при любом выборе D'. Далее, не ограничивая общности, будем считать, что матрица пол- ного ранга D имеет вид Этого всегда можно добиться невырожденным преобразованием коор- динат и входов системы. Представим матрицы системы (5.9) в блочном виде: (Д1 А2 \ } п—т A3 А4 J } т с= ( С{ , с2 ). п—тп тп Матрицу Розенброка Л'(з) также запишем в блочном виде: (sln—m А\ -Аз Ci п—m — А2 0 \ } п—т slm А4 Im ^2 I } m С2 0 0 / } I т т 1—т Тогда очевидно, что rank Rf = m-I-rank Д"(з), где Я"(з) = sln—m A\ A2 D\\ f ( c, C. 0 M (s -D' Заметим, что для исходной системы rankles) = т + rankles), и, следовательно, множество точек понижения ранга R (з) определяет множество инвариантных нулей исходной системы. По предположению П.4 rankCD = rank((Ci;C2) = rankC2 = т. D = lm е Rmxm 0 Так как С2 € RZxm, а I > т, то невырожденным преобразованием вы- ходов (т.е. строк матрицы С) матрицы С\ и С2 могут быть приведены
114 Гл. 5. Асимптотические наблюдатели для линейных систем к виду > С2 = '2 / С[' е к(/-т)х(п~т)ф Тогда sln—m Al -а2 1т О rank R" (s) = т + rank^"'(s), где sln—m A Dy С" о -D' О А = Ai - А2С'Х. 1гп о О О и 5.12) При этом множество точек понижения ранга матрицы R'(s) (и R"(s)) совпадает с соответствующим множеством матрицы R (з). Рассмотрим (п — т)-мерную линейную стационарную систему с (Z — т) входами и (Z - т) выходами: {z = Az + D'ycc, е = C{fz, для которой матрица Rm(s) является матрицей Розенброка. С другой стороны, матрица R (з) определяет наблюдаемость (восстанавливае- мость) пары {С{',А}. Следовательно, пара {С", А} наблюдаема тогда и только тогда, когда у исходной системы нет инвариантных нулей (когда матрицы R (з) и R (з) полного ранга при всех з € С). Пара {С", А} восстанавливаема тогда и только тогда, когда инвариантные нули матрицы R (з) устойчивы, причем множество инвариантных нулей исходной системы совпадает со спектром ненаблюдаемой части систе- мы (5.12). Кроме того, в силу невырожденности проведенных преобразований, множества точек вырождения матрицы Розенброка Я'(з) системы с псевдовходами (5.10) и матрицы Rm(s) совпадают, более того, с точ- ностью до знака имеет место равенство /?(«) = detfl'(s) = ±det7?"'(s), т. е. характеристические полиномы нулевой динамики систем (5.10) и (5.12) совпадают. Рассмотрим нулевую динамику системы (5.12) подробнее. В силу полноты ранга матрицы С матрица С" € R(z~m)x(n-W) также имеет
5.3. Синтез наблюдателей методом псевдовходов 115 полный ранг, т. е. r&nkC" = I - т. Проведем в системе (5.12) невы- рожденную замену координат с матрицей Q: РЛ =Qz; z = Q-1 (Z ) ; / G R(n-Z). \e J \e/ В новых координатах система (5.12) примет вид ( zf = A\\z' 4- Л12в 4- D'xxwy t в — А21 4“ ^22^ 4“ (5.13) где матрицы D'u и Г>'12 определяются выбором D'x: = d'xq- В силу невырожденности матрицы Q верно и обратное утверждение, а именно, матрица Dx целиком определяется выбором D'n и Z>'12. Выберем матрицу Z)'12 е R(n-m)x(n“m) невырожденной, например, р'12 = /п_т. Найдем уравнение нулевой динамики системы (5.13) при этом условии. Так как в этом случае ё = е =^0, то из второго урав- нения (5.13) имеет место равенство ш = — А21/, и, следовательно, нулевая динамика описывается уравнением z' = (An~D'nA2i)zf. С другой стороны, матрица Розенброка системы (5.13) имеет блочную структуру: ^sIn-i—A[\ -А12 -А21 sli-m — А22 —D'X2 \ о л_т о Учитывая, что система (5.13) есть преобразованная система (5.12), получаем тождество det = det/?""(«). В матрице R'"'(s) рассмот- рим подматрицу -—НН , . R (*) = Gln-i — Ац -А21 \ о -А12 Sll-m ~ А22 Л—т / Множество точек вырождения ранга матрицы R (з), с одной стороны, совпадает с соответствующим множеством матрицы R (з) (а, следова- тельно, и матрицы R (s)), с другой стороны, определяется вырождени- ем матрицы _ -^v / ч (sln-i - Ап R is) = I ~ \ -А21
116 Гл. 5. Асимптотические наблюдатели для линейных систем Указанная матрица связана с наблюдаемостью пары {АгцАп}. Имен- но, если у исходной системы нет инвариантных нулей, то пара {А21, Ац} наблюдаема, если же у^сходной системы есть устойчивые инвариантные нули, то пара {А21, Ац} восстанавливаема. Для завершения доказательства теоремы осталось заметить, что матрица нулевой динамики системы (5.13) имеет вид Анд = Ац - Р'ИА21, и, следовательно, в случае, если у исходной системы нет инвари- антных нулей, спектр матрицы Анд может назначаться по произволу выбором D'n (в силу наблюдаемости {АгцАц}). Если же у исходной системы есть устойчивые инвариантные нули, то в силу восстанавли- ваемости пары {АгьАц} спектр Анд выбором D'{i может быть сделан устойчивым (при этом часть спектра совпадает с инвариантными нуля- ми исходной системы, а остальная задается по произволу). Теорема доказана. □ Замечание 5.3. При псевдовозмущении /' = О утверждение теоре- мы 5.2 можно сформулировать в эквивалентном виде. Теорема 5.2'. Если для системы (5.9) выполнены предположения П.1-П.4 и система минимально-фазовая, то неособым преобразова- нием она может быть приведена к виду {х' — А\\х' 4- A12V, , = Л^ + Лга + СЩ. где спектр матрицы Ац содержит все инвариантные нули системы (5.9), а остальная его часть может быть выбрана произвольно (и определяется выбором матрицы преобразования). Заметим также, что количество псевдовходов может быть любым числом р от 1 до I — т. В этом случае по выходу определяем (т + р)-мерный выход так, что по нему выполнены свойства П.1-П.4, для этого выхода можно применить предложенный выше алгоритм разложения системы. Имеет место следующее утверждение. Теорема 5.2". Пусть для системы (5.9) выполнены предположе- ния П.1-П.4, 1 р I — т, система (5.9) — минимально-фазовая относительно выхода ур = Срх е Rm+p, где Ср — матрица, образо- ванная из строк из матрицы С. Тогда неособым преобразованием система может быть приведена к виду ( хР = Апхр + А^ур, I УР = А<2\хр + А^Ур + CpDf, где матрица Ац — гурвицева, хр е Rn~m~p.
5.4. Классические методы синтеза наблюдателей 117 5.4. Классические методы синтеза наблюдателей в условиях неопределенности Для решения задачи синтеза наблюдателя для неопределенной си- стемы (5.1) при условии I > т предложено много различных методов, однако практически все они дают решение при одних и тех же условиях на систему (5.1). Это условия указаны в теоремах 5.1 и 5.2. Дадим краткий обзор этих методов, не приводя подробных доказательств. Результаты укажем лишь для случая и = 0, т.е. для системы (5.9). Анализ опубликованных работ показывает, что с определенной до- лей условности все известные методы синтеза наблюдателей для таких систем используют одну их следующих идей: 1) исключение возмущения из уравнения для ошибки оценивания; 2) выделение из системы подсистемы, не зависящей явно от возму- щения; 3) использование специальных канонических форм многосвязных систем; 4) решение задачи наблюдения как задачи стабилизации; 5) использование фиктивных (или псевдо-) входов (выходов). Рассмотрим каждый из этих методов и приведем основные резуль- таты. 5. 4.1. Исключение возмущения из уравнения для ошибки оце- нивания. Наблюдатели этого типа предложены в работах [115, 41] и по структуре сходны со структурой классических наблюдателей Лю- енбергера для определенных систем. Для решения задачи наблюдения для системы (5.9) предлагается использовать наблюдатель вида z = Ez 4- Fy, х — Hz + Ly, (5.15) где z G Rp, x G Rn, H, E, F и L — постоянные матрицы соответству- ющих размерностей, подлежащие определению. Для полноразмерного наблюдателя размерность вектора z равна размерности х, т. е. р = п, и можно положить Н = I. В качестве оценки неизвестного вектора x(t) в это случае используется выход наблюдателя x(t). При этом ошибка наблюдения £(t) = x(t) — х(£) удовлетворяет уравнению £ = Е£ 4- (РА - FC - ЕР)х 4- PDf, где Р = I - LC. Матрицы наблюдателя выбираются так, чтобы исклю- чить из последнего уравнения неизвестное возмущение (сигнал /) и неизвестный фазовый вектор х(£). Это условие будет выполнено, если имеют место равенства РА — FC — ЕР = О, PD = 0. (5.16)
118 Гл. 5. Асимптотические наблюдатели для линейных систем При этом ошибка удовлетворяет уравнению £ = ЕЕ, а, следовательно, £(t) стремится к нулю экспоненциально при условии, что матрица Е — гурвицева. В работе [41] доказано следующее утвер- ждение. Утверждение 5.1. Если для системы (5.9) выполнены предполо- жения П1-П4, то найдутся матрицы Е, F и L, удовлетворяющие условиям (5.16). Более того, если выполнено предположение П5, то матрица Е может быть выбрана гурвицевой. Часть ее спектра совпадает с инвариантными нулями матрица Розенброка исходной системы, остальная часть назначается по произволу. Недостатком предложенного подхода является то, что приходится решать громоздкую систему матричных уравнений (5.16), решение которой, вообще говоря, не единственно. Кроме того, размерность на- блюдателя, построенного в работе [41], равна размерности системы п, она больше размерности наблюдателя пониженного порядка (п — /), ко- торая достигается другими методами. По-видимому, этот подход можно обобщить и на случай р < п, в частности, р = п — I. Кроме того, он обобщается также на задачу построения функциональных наблюдате- лей. Эта задача рассматривалась в работе [104], где восстанавливался функционал а = Fx, F е RgXn. Опишем основную идею этой работы. Пусть известно разложение матрицы F вида F = КТ + WC, где К е RQXp, Т е RpXn, W е RgxZ, a q р п. Обозначим х' = Тх е G Rp, тогда cr(i) = Fx(t) = Кх' + Wy. Для восстановления функционала достаточно построить оценку х', которую дает наблюдатель порядка р, аналогичный по структуре на- блюдателю (5.15): | z = Ez + Gy, S ~ (5.17) [ а = Kz + Wy, V 7 где матрицы Е е RpXp и G е RpxZ подлежат определению, a z(t) — оценка вектора x'(t). Ошибка оценивания e(t) = z(t) - x'(t) удовлетво- ряет уравнению ё = Ее + (GC -ТА + ЕТ)х - TDf, а параметры определяются из соотношений GC - ТА + ЕТ = 0, TD = 0, (5.18) Е— гурвицева.
5.4. Классические методы синтеза наблюдателей 119 В работе [104] доказано следующее утверждение. Утверждение 5.2. Пусть для системы (5.9) выполнены предпо- ложения П.1-П.5. Тогда существует решение системы (5.18), а наблюдатель (5.17) дает экспоненциальную оценку неизвестного функционала a(t). В [104] предложена процедура решения системы (5.18) при устой- чивой матрице Е и доказано существование решения этой системы, но только при условии, что ю > - о I — т Отметим, что при q > I — т выполняется неравенство р > п — Z, т. е. размерность функционального наблюдателя превышает размерность на- блюдателя для полного фазового вектора. Это, по-видимому, связано с методом доказательства утверждения, а не со свойствами метода. 5. 4.2. Метод исключения возмущения из уравнения системы. Другой подход к построению асимптотических наблюдателей связан с преобразованием системы таким образом, чтобы исключить явное присутствие возмущения в уравнениях системы. Этот метод реализо- ван в работах [51, 54, 55]. Основная идея метода заключается в преобразовании уравнений системы таким образом, чтобы заменить явное присутствие /(t) на известный сигнал y(f) (или функцию от него), который, разумеется, несет информацию о сигнале /(£). Рассмотрим вновь исходную систему (5.9). При выполнении пред- положений П.1-П.4 в этой системе введем новую переменную £ = х - Ну. Тогда уравнение относительно £ запишется в виде ё = (А - ЯСА)е + (А - НСА)Ну + (D - HCD)f с уравнением выхода у = + СНу или (7 - СН)у = Се. Если матрица Н такова, что (Я — HCD) = 0 и СН — 7 0, то урав- нения относительно новых переменных е не зависят явно от /: ё = Ае + АЯт/, А = А- НС А, У = СС, у = (/ - СН)у, и исходная задача сводится к задаче наблюдения для системы с извест- ным входом y(t), которая решается стандартными методами, если пара {С, А} наблюдаема (восстанавливаема). В работе [54] доказано следующее
120 Гл. 5. Асимптотические наблюдатели для линейных систем Утверждение 5.3. Пусть для системы (5.9) выполнены предполо- жения П.1-П.5. Тогдсц если система (5.9) не имеет инвариантных нулей, то пара {С, А} наблюдаема, а если эта система имеет инвариантные нули в С_, то пара {С, А} восстанавливаема, причем неизменяемые собственные значения матрицы Al — A- LC совпа- дают с инвариантными нулями исходной системы. Для системы (5.19) могут быть синтезированы стандартные наблю- датели как полного порядка п, так и пониженного порядка (п — Г). В качестве оценки для х берется х = £ + Ну, где £ — оценка для 5. 4.3. Методы, основанные на приведении системы к специ- альному каноническому виду. Укажем алгоритмы синтеза наблюда- телей, основанные на сведении системы к специальному виду, когда часть переменных не зависит явно от возмущения f(t) и может быть восстановлена. Известно несколько подходов к такому преобразованию. Один из них предложен в работе [48]. Изложим этот метод. Сначала преобразуем систему (5.9) с помощью матрицы Т е Rnxn такой, что где Т, е Т2 € Rmxn, D е Rmxm, detD / 0. В силу полноты ранга матрицы D такая матрица Т всегда найдется. Преобразование Г xf \ I ,/ I = Тх приводит систему (5.9) к виду х' = А\х' + А2х", х" — А%х' + А^х" + Df, у = С\х'+ С2х". (5.20) Заметим, что при выполнении рангового условия П.4 rank 62 = гп\ кроме того, С2 € RZxzn, С\ е R/x(n-m), а уравнение для х' не зависит явно от возмущения f(t). В силу сделанных замечаний, найдутся матрицы Q е RZxZ и Ре е Rmxm такие, что QC2P= (С2Р = (С2 ) , detC2^0, detP^O. Матрица Q осуществляет преобразование выходов у, а матрица Р — части фазовых переменных х". В работе [48] предложена процедура построения матриц Р и Q. При сделанных предположениях выход у
5.4. Классические методы синтеза наблюдателей 121 преобразуется к виду (у\\ ~ ( QiC\x'+ С2Р~'х" \ \У2/ \QzyJ \ Q2C[Xf J и, следовательно, часть фазового вектора х" может быть выражена через вектор х' и компоненту выхода у\ = Q\y, т.е. х" = РС%\у\ - Q1C1X'). Подставив выражение для х" в первое уравнение (5.20), получим систему относительно х1 порядка (п - т): х' = А>х' + A2PC2'(yi - QiCix') = ^(Ai-A2PC2]QlCl)x' + A2PC21yi (5.21) А с известным входом y\(t}, не зависящую явно от возмущения /(f), с выходом y2(fy порядка (Z — т), т. е. у2 = - Сх’. (5.22) Имеет место доказано утверждение. Утверждение 5.4. Пусть для~системы (5.9) выполнены предпо- ложения П.1-П.5. Тогда пара {С, А} наблюдаема, если у исходной системы нет инвариантных нулей, и пара {С, А} восстанавливае- ма, если у исходной системы есть инвариантные нули в С_, причем эти нули принадлежат спектру матрицы Al = A — LC. Для системы (5.21)-(5.22) можно построить как наблюдатель пол- ного порядка (п — т), так и пониженного (п — т) — (Z — гп) = п — I. Эти наблюдатели дают оценку х' части фазового вектора х’, для х" оценку дает x" = PC2l(yi -Q\C\x'). На идее приведения системы к специальному каноническому виду основан также и подробно описанный выше метод квазирасщеплений. Отметим, что он проще в реализации и, кроме того, на его основе мож- но решать также задачу построения функциональных наблюдателей, в том числе минимального порядка. 5. 4.4. Метод псевдовходов. Метод псевдовходов был подробно изложен выше, он также позволяет привести систему к специальному представлению. Этот подход восходит к работам С. К. Коровина и опи- сан в работе [13].
122 Гл. 5. Асимптотические наблюдатели для линейных систем 5.4 .5. Методы синтеза наблюдателей с управлением. Еще один подход к построению наблюдателей для неопределенных систем ос- нован на использовании в наблюдателе управления, направленного на стабилизацию в нуле системы в отклонениях, которая зависит, конечно, от возмущения /. При этом используют различные методы стабилизации неопределенных систем. Впервые такой подход использован, по-видимому, в работах [109, 100]. Опишем его подробнее. Для восстановления фазового вектора системы (5.9) используем наблюдатель х = Ах + L(y — Сх) — v, (5.23) где v — управление, направленное на стабилизацию системы в откло- нениях е = х - х, описываемую уравнением ё - (А - LC)e — v — Df = ALe — (v + Df). Матрица L выбирается из условия гурвицевости Al (такой выбор всегда возможен в силу наблюдаемости пары {С, А}). В работе [109] относительно неизвестного возмущения вводится дополнительное предположение. Предположение П.6. Сигнал f(t) равномерно ограничен и из- вестна его мажоранта — константа р> 0 (т. е. |/(t)| А р при t 0). При этом в качестве стабилизирующего управления предложено использовать разрывную обратную связь с = pD • Sgn(W% - у)), где W € RmxZ, у = Сх, a Sgn(z) € — разрывная вектор-функция с компонентами sgn(^). Система в отклонениях в этом случае имеет вид ё = ALe - D(p • Sgn(W'e) + /). (5.24) Для исследования ее устойчивости используется функция Ляпунова у(е) = етре, Р > 0. Ее производная в силу системы (5.24) имеет вид V = eT(PAL + AjF)e - 2(р • Sgn(TyCe A f)DTPe. В работе [109] доказано следующее утверждение. Утверждение 5.5. Если для системы (5.9) выполнены предпо- ложения П.1-П.6 (и система не имеет инвариантных нулей), то найдутся матрицы Р, Q > 0, а также параметры наблюдателя W и L, удовлетворяющие системе уравнений pal + a[p = -q, DTP = WC. При этом V < -AV, А = const > 0.
5.5. Статические и астатические методы оценивания 123 В работе [45] предложена процедура построения матриц W и L для наблюдателя вида (5.23), отличающегося более общим видом стабили- зирующего управления: v = pG-Sgn(Wy-WCx) с варьируемой матрицей G вместо фиксированной D в [109]. К недостаткам этого метода можно отнести дополнительные огра- ничения, накладываемые на сигнал f(t). 5.5. Статические и астатические методы оценивания в условиях неопределенности 5.5.1. Наблюдатели для квадратных систем с неопределенно- стью. Описанные выше методы построения асимптотических наблю- дателей для систем с неопределенностью (5.1) существенно использо- вали предположение П.З о том, что число выходов I превышает т — размерность неизвестного входа f(t). Рассмотрим теперь ситуацию, когда эти размерности совпадают, т. е. I = т. Такие системы принято называть квадратными, так как в этом случае квадратной является передаточная матрица системы (5.1) W(s) = [C(s/ - Л)-‘Р] е CZx' от неопределенности f(t) к выходу y(t). Скалярные системы с первым относительным порядком. Рас- смотрим вначале более простой случай скалярной системы, т. е. систе- мы со скалярными входом f(t) и выходом y(t) (т. е. I = т= 1). Как и ранее, не ограничивая общности рассуждений, считаем, что u(t) = 0, так как влияние известного входа всегда можно компенсировать в наблюдателе. Таким образом, рассматривается система х = Ах + Df, У = Сх, где A eRnXn, D е Rnxl, С е Rlxn. Для этой системы определена передаточная функция от входа f к выходу у: 1У(в) = С'(з1-Л)-|Г> = ^44, (5.26) ^п(^) где /3m(s) и an(s) — полиномы от s соответствующих степеней тип. При этом an(s) = det(sZ — А) = sn + ansn~i + ... + а\ (5.27) — характеристический полином матрицы А, а полином Pm(s) = /3m+ism 4-/3msm 1 + + (5.28)
124 Гл. 5. Асимптотические наблюдатели для линейных систем — характеристический полином нулевой динамики системы, который является определителем матрицы Розенброка: /?m(s) = det -D 1 О Относительным порядком системы (5.25) является число г = п — т, для него имеют место соотношения СП-0, СЛР-0,...,СЛг-2П = 0, CAr~xD = (Зт+х 0. (5.29) Относительно системы (5.25) предполагается, что ее нулевая динамика асимптотически устойчива, т.е. полином /3m(s) — гурвицев. При этом система является минимально-фазовой. Кроме того, будем считать, что пара {С, А} — наблюдаема, а пара {A,D} — управляема, т.е. система (5.25) находится в общем положении. В общем случае для системы (5.25) имеет место условие CD 0 (не ограничивая общности рассуждений, считаем, что CD = 1; этого все- гда можно добиться нормировкой выхода), т.е. относительный порядок системы г = 1, тогда deg(/?m(s)) = т = п — 1. В силу управляемости пары {A, D} система (5.25) неособым преобразованием координат мо- жет быть приведена к управляемому каноническому представлению при этом CD — (Зп — \. Сделаем стандартное преобразование координат с выделением нулевой динамики системы. Для этого перейдем от коор- динат (ац, ...,жп)т к координатам (ац, ...,хп-\,у)Т. Так как /Зп = 1, то у = (3\х\ + ... 4-^п, поэтому в новых координатах система примет вид ' Xi = Х%, ±2 = < Хп—2 ~ Хп— 1, хп-1 = -/31X1 - /32х2 - ... - /3П_1Х„_1 + у, . У = -71X1 - 72х2 - ... - 7n-ixn-i -упу + f, (5.30) где 7n = (/3„_1 - а„), 74 = -7nA + /З4-1 - ait i = 1, ...,п - 1. Заметим, что первые (п — 1) уравнения из системы (5.30) описывают нулевую динамику системы, которая не зависит явно от неизвестного возмуще-
5.5. Статические и астатические методы оценивания 125 ния f(t). Для восстановления первых (п — 1) координат системы (5.30) используем наблюдатель Х\ = Х2, < 1 ~ (5.31) Хп—2 = Хп — 1, ч Хп—\ = -р\Х\ -02X2 - ... - (Зп-\Хп-1 + У- При этом ошибка наблюдения е' = х' — х' (где х' — (xi, ...,xn_i)T, х! = (xi, ...xn_i)T) удовлетворяет уравнению 61 = 62, 6п—2 ~ Сп_1, , ёп-1 = -/3161 - Д2б2 — ... - /3n-ien_i. Очевидно, что характеристический полином этой линейной системы совпадает с /3m(s) и, в силу гурвицевости последнего, е' —» 0 экспо- п— 1 ненциально при £ —> оо, оценку для хп дает хп = у — ^2 Таким г=1 образом, имеет место утверждение. Теорема 5.3. Пусть система (5.25) находится в общем положе- нии, имеет первый относительный порядок и является минималь- но-фазовой. Тогда наблюдатель (5.31) восстанавливает неизвест- ную часть фазового вектора экспоненциально точно. Замечание 5.4. Скорость сходимости наблюдателя определяется полиномом Z?m(s) и не может быть изменена. Замечание 5.5. Размерность наблюдателя (5.31) равна (п — 1) и совпадает с размерностью наблюдателя Люенбергера для полностью определенных систем. Замечание 5.6. В случае, если на возмущение f(t) не наложено никаких ограничений, требование устойчивости нулевой динамики си- стемы (5.25) является необходимым для решения задачи наблюдения. Действительно, пусть полином /3m(s) неустойчив. Рассмотрим си- стему в виде (5.30) для частного случая возмущения: f(t) = 71^1 +72x2 + ... + 7n-ixn-i +7n?/. Тогда у = 0, т. е. y(t) = const. При этом любые два начальных состо- яния (xj(O), ...,х^_1(0),?/(0))т и (х2 (0),...,х^—1 (0),?/(0)) порождают один и тот же выход y(t) — ?/(0) = const, t 0,
126 Гл. 5. Асимптотические наблюдатели для линейных систем и неразличимы, при этом разность e(t) = xf(t) — x"(t) между решени- ями системы, соответствующими этим начальным состояниям, удовле- творяет уравнениям r ei = в2, < 6п—2 — ^п— 1, ёп—1 = ... (Зп_\еп_\, < &П — О, и в силу неустойчивости /Зт($) e(t) —> сю при t —> сю. Таким образом, два экспоненциально разбегающихся решения нераз- личимы. Проведенные при доказательстве теоремы 5.3 преобразова- ния системы удобно записывать в блочном виде. Обозначим х' = (яц, ... ,xn-i)T — (п — 1)-мерную часть фазового вектора. При f xf \ (х'\ переходе от координат ) к координатам I ) система принимает уЯ'п J \У / вид (5.30), который можно записать в блочном представлении: х' = Ацх' + Л12У, У = + А22у + CDf, (5.30') где А22 = 7„ G Rlxl; CD=\. Матрица Ац определяет нулевую динамику системы и в представ- лении (5.30') имеет вид сопровождающей матрицы полинома /3n_i(s). В случае квадратных систем с векторным входом f и выходом у (т. е. I = т > 1), если система находится в общем положении, а мат- рица CD — полного ранга (т. е. det CD / 0), то система стандартным неособым преобразованием также может быть приведена к виду (5.30')
5.5. Статические и астатические методы оценивания 127 с той лишь разницей, что матрицы Aij имеют другие размерности, а именно: Лц € Л)2 е R(n—Z)xZ, Лг) g RZx(n-Z), Лг2 е RZxZ_ (5.33) При этом матрица Ац по-прежнему определяет нулевую динамику си- стемы, и в случае минимальной фазовости, т. е. гурвицевости матрицы Ац, задачу решает наблюдатель х = А\\х' + А12?/, (5.34) аналогичный наблюдателю (5.31) (и совпадающий с ним при I = гп = 1). Размерность этого наблюдателя равна (п — /), т. е. совпада- ет с размерностью наблюдателя Люенбергера. Наблюдатель восстанав- ливает (n — I) компонент фазового вектора, остальные компоненты в представлении (5.30'), явно зависящие от возмущения /(f), являются измеряемым выходом y(f) е Rz. Таким образом, теорема 5.3 может быть обобщена на векторные квадратные системы. Теорема 5.3'. Пусть система (5.25) находится в общем поло- жении, квадратная (т. е. I = т) и является минимально-фазовой, det CD Ф 0. Тогда наблюдатель (5.34) восстанавливает неизвест- ную часть фазового вектора экспоненциально точно. Скалярные системы с произвольным относительным порядком. При синтезе описанных выше наблюдателей существенную роль играет невырожденность матрицы CD. В случае, если эта матрица вырож- дена, решение задачи значительно усложняется. Рассмотрим подробно этот случай для скалярных систем, т. е. когда I = т = 1. В этом случае CD е R. Вырождение CD означает, что CD = 0, т.е. относительный порядок системы г > 1. Полином /?(«) имеет степень (п — г), а вектор С имеет, соответственно, вид C = (/?i,...,/?n_r,/?n_r+i,0,...,0). В случае, когда относительный порядок равен г, первым в цепоч- ке (5.29) отличным от нуля коэффициентом будет CAr~xD = (Зп-г+\. Не ограничивая общности рассуждений, будем считать, что CAr~xD — /Зп-г+1 = 1 (этого всегда можно добиться нормировкой выхода y(t\). Тогда у = (3\Х\ + ^2 + ... А (Зп-гХп_г + хп_г+1. Пусть система (5.25) находится в общем положении и приведена к канонической форме управляемости. Проведем для нее стандартное преобразование с выделением нулевой динамики. Для этого перейдем
128 Гл. 5. Асимптотические наблюдатели для линейных систем от координат (xi,...,жп)т к координатам (д?ь ...,xn_r,yi, ...,?/г)т, где у\=Сх = у, У2 = С Ах = у, уг = САг-{х = у(г~[\ В новых координатах система принимает вид Х\ = Х2, Хп —11 ~ Хп—2, Хп-г = ~/3lXl - ... - (3n-rXn-r + у, (5.35) У\ = Уч. Уч--1 = У Гу „ Уг = 7^1 + • • • + Чп-Г^п-Г + 7{'ш + • • • + УгУг + Л где 7' и 7г" — константы, однозначно определяемые параметрами ис- ходной системы. Представление (5.35) — аналог представления (5.30) для систем с относительным порядком г. Для него также можно использовать блочную форму записи. Обозначим х' = (х\, ... ,a?n_r)T, yf = (уь ... ... ,уг)т, тогда ' х! = Апхг + А^у, < у' = W + В'(/ + 7'х'), (5.35') У = У1 = Су', где 412 = 0 V/ е R(«-r)xl
5.5. Статические и астатические методы оценивания 129 7' = eRlx(n-r); С' = [1,0,...,0] eRlxr. Матрица Ан определяет нулевую динамику системы и det(s7 - An) = 0n-r(s) = sn r + (3n_rsn r 1 + ... 4-/31. Если полином /3n_r(s) гурвицев (т. e. система минимально-фазовая), то первые (п - г) неизвестных координат х' восстанавливает наблюдатель X = А\\х' + А127/, (5.36) который отличается от наблюдателя (5.34) только размерностью. Еще одна координата у\ = у известна, так как совпадает с измеряемым вы- ходом системы. Однако, при г > 1 возникает проблема восстановления оставшихся (г — 1) координат у2, ... ,уг, которые по сути являются про- изводными выхода соответствующих порядков. Существуют несколько подходов к решению этой задачи. Опишем два из них, следуя [10] и [14]. Первый подход, предложенный в [10], основан на использовании линейной обратной связи с иерархией коэффициентов усиления. Рас- смотрим его подробнее. Вначале исследуем случай системы с максимальным относительным порядком г = п. В этом случае система (5.35') имеет вид ( у' = А?!?/ + B'f, 5 (5-37) I У = У\, размерность нулевой динамики системы равна нулю (т. е. /3(s) = 1). Для решения задачи используем стандартный полноразмерный наблю- датель у = A2iy'-L(C'y'-y). (5.38) Ошибка наблюдения е — у' — у' удовлетворяет уравнению ё = (A2i - LC')e - B'f = ALe - B'f. (5.39) Заметим, что пара {C",A2i} — наблюдаема, поэтому выбором вектора L е Rnxl спектр матрицы Al может назначаться по произволу. 5 С. К. Коровин, В. В. Фомичев
130 Гл. 5. Асимптотические наблюдатели для линейных систем Докажем вспомогательное утверждение. Лемма 5.1. Пусть матрица Al G Rnxn такова, что ее спектр может быть назначен по произволу. Обозначим коэффициенты разложения матричной экспоненты через о^(Г), i = 0, ... ,п - 1 : eAbt = г=0 Тогда для любого у > 0 спектр Spec{Ai,} может быть выбран так, что для всех oti(t) справедлива оценка N-p-v1 |оД£)| —г——, г = 0, (5.40) М где Ni = const > 0 и не зависят от у. Доказательство. Пусть Spec{AzJ = {Ai, ... , Ап}. Выберем Xi таким образом, что Xi / Xj при i j. Тогда &i(t) будут удовлетворять системе уравнений, [31]: п—1 j=l,...,n. (5.41) i=0 Введем обозначения 1 Ai ... АГ1 1 А» А”-1 ’ «о (<) &п — 1 (t). Тогда систему (5.41) можно записать в виде Ma(t) = R. (5.42) Выберем спектр Al таким образом, чтобы Xi = yXi, где Xi < 0, |Ai| = 1; |Ai+i| > |Ai|, i = 1, ... ,n- 1, т.е. спектр Al «пропорционален» с коэффициентом усиления у > 0 некоторому фиксированному, веще- ственному, различному и устойчивому спектру {А^Аг, ... , Ап}. Тогда матрицу М можно представить в виде М = 1 Ai ... А? "1 0 ... О' 0 у ... 0 = MD^. о о Решая уравнение (5.42), получим a(t) = M-lR=(MDlx')-1R = D~1M 'r =
5.5. Статические и астатические методы оценивания 131 ’1 0 . 0 - .. 0 .. 0 М XR. (5.43) 0 0 1 - м”-1- Так как eXit = eXi^ = (е а |д.| 1 ПрИ j — 1,...,п, то для вектора R очевидна оценка \R(t)\ ^гое~^, t >0. Учитывая это неравенство, а также то, что матрица М 1 не зависит от /1, из (5.43) следует, что 1 __ 1 р pt ____ 1 ЛА р \aAt)\ = hM-lR\^e^r0\M-l\ = ^—, р р р где Mi — г-я строка матрицы М . Лемма доказана. □ Для решения задачи наблюдения используем, как было указано вы- ше, стандартный полноразмерный наблюдатель (5.38), при этом спектр матрицы Al будем выбирать в соответствии с леммой 5.1, т. е. Spec{Az,} = {/1А1,...,/zAn}, А* < 0, г=1,...,п, /z > 0 |Л1| = 1, |АЖ|>|М г=1,...,п-1. (5.44) Тогда имеет место следующее утверждение. Теорема 5.4. Пусть система (5.25) находится в общем положе- нии, ее относительный порядок г = п, система приведена к кано- ническому виду (5.37). Пусть, кроме того, неизвестный вход f(t) равномерно ограничен известной константой Fq, т.е. \f(t)\ Fq при t 0. Выберем вектор обратной связи L в наблюдателе (5.38) так, чтобы спектр матрицы Al удовлетворял условиям (5.44). Тогда ошибка наблюдения е = у' — у' удовлетворяет оценке . К? \e(t)\ + —, (5.45) где константа К2 не зависит от коэффициента усиления у. Доказательство. Как показано выше, при использовании на- блюдателя (5.38) ошибка наблюдения удовлетворяет уравнению (5.39), т. е. ё = ALe - B'f, 5*
132 Гл. 5. Асимптотические наблюдатели для линейных систем и e(t) можно найти с помощью формулы Коши для решения линейного уравнения t t e(f) = e(0)eAbt — еЛь(^~г^В’ f (t) dr = e(0)eAbt — | eAbrBff(t — т) dr. о о Оценим норму вектора е(Г) |e(f)|^|e(O)e^| + | eA^B'f(t-r)\dr. О Выберем L так, чтобы спектр Al удовлетворял условиям (5.44). В этом случае матрица Al — гурвицева, а для eAbt имеет место оценка \eALt\ Кое^, где Kq = const > 0 (вообще говоря, зависит от //). Кроме того, для матричной экспоненты имеет место разложение п— 1 ?Alt = i=Q где функции ai(r) удовлетворяют оценкам (5.40) (в силу выбора спек- тра AlY Тогда для |e(f)| имеет место оценка |e(t)| \е(Р)\К0е~^ + ‘п-1 о i=0 п-1 MOW* + £[ Ыт)| • lA^B'l • - т)|] dr. i=° 5 Рассмотрим более подробно структуру матриц АгьВ'. В соответ- ствии с (5.35') заданы явные представления матриц: -0 1 0 ... о - О 0 1 ... О О 0 0 ... 1 _ 77 _77 Л/7/ _7/ L -71 -72 -7з ••• -7„J /1(м) 0 ... о - W) о ... о /п(ц) 0 ... О где Щ/л) — компоненты вектора обратной связи L; заметим, что только они зависят от выбора /л. Из вида матрицы Al следует, что (А^)0 = = 1п не зависит от /л, а у матрицы (А/,)1 от /л зависит только первый столбец. Рассмотрим подробнее квадрат (А^)2, имеем
5.5. Статические и астатические методы оценивания 133 -liifj.) 1 0 ... О 1 Г -Zi(m) -Ш) о 1 ... о -г2(д)
134 Гл. 5. Асимптотические наблюдатели для линейных систем где знаком * обозначены элементы, зависящие от Отсюда следует, что у матрицы (Дс,)2 от р зависят только первые два столбца. Продол- жая явные вычисления, найдем, что у матриц Агь от р зависят только первые i столбцов (г = 1, ... ,n — 1). При этом умножение матрицы на столбец В' дает последний столбец матрицы. Так как для всех г = 1, ... - 1 у матрицы Агь последние столбцы не зависят от /1, то где Qi — константы, независящие от д и определяемые только пара- метрами системы. Учитывая это, а также равномерную ограниченность f(t) и оценки (5.40) для функций имеем следующую оценку для ошибки измерения e(t): 71-1 N Г \e(t)\ |e(O)|Koe-^ + e~^dr = И Че(оЖое~мЖУ |e(O)|/foe"Mt + - У Не ограничивая общности рассуждений, считаем, что р р* > 0. Тогда Ж* FoNjQi < Ж FpNjQi к рг (ц*)г 2’ где константа не зависит от выбора коэффициента усиления /г. Обозначив |е(О)|Ко = Fi, получим окончательную оценку: |e(t)4 4e-^ + —. м Теорема доказана. □ Следствие 5.1. Из оценки (5.45) следует, что, при назначе- нии спектра матрицы Al из условия (5.44), выбором достаточно большого коэффициента р > 0 ошибку оценивания в асимптотике можно сделать меньше любой наперед заданной величины. Следствие 5.2. Константа К\ в оценке (5.45) зависит от неиз- вестного начального отклонения е(0) и от р. Более того, К\ —> ос при /1 —> ос. Поэтому для наблюдателя (5.39) при больших значениях коэффи- циента р характерен «начальный всплеск», когда ошибка в первый мо-
5.5. Статические и астатические методы оценивания 135 мент «быстро» нарастает, а затем «быстро» убывает и далее держится в заданном диапазоне. Следствие 5.3. Условия (5.44) устанавливают иерархию коэф- фициентов матрицы обратной связи L по степеням коэффициента усиления р. Наиболее просто коэффициенты Ц(р) выглядят в том случае, если все у" = 0, т. е. А21 из (5.37) имеет вид / 0 1 0 ... О \ О О 1 ... о ^21 = О 0 0 ... 1 \о о о ... о/ (5.46). Тогда Al = Л21 - LC' = / -Zi(m) 1 О ... О \ -Z2(m) О 1 ... О -Zn_i(/i) О О ... 1 \ -Zn(M) 0 0... О/ det(sl - Al) = sn + li(p)sn 1 + ... + ln(p). Выберем набор Xi из условия (5.44). Этому набору соответствует гурвицев полином ¥>(s) = f[(s - АО = sn + /,«”-1 + ... +~ln. (5.47) 2=1 Тогда набору /1А1,..., рХп соответствует полином 9?(s) — J^J(s ~ — Sn + pl\Sn 1 + p?12Sn ^ + ... + рП1П' 2=1 Таким образом, для того, чтобы spec{Xz,} = {рХ\, ... ,рХп} при мат- рице А21 из (5.46), вектор обратной связи L в наблюдателе (5.38) надо выбирать в виде L = (/iZi,A,...,Mn«n)T, (5.48) откуда видна упоминавшаяся выше иерархия коэффициентов Ц(р) по степеням параметра р. Если матрица А21 имеет более сложную структуру, т. е. 7" 0, то и вектор обратной связи L будет иметь более сложный, чем (5.48), вид. Непосредственной проверкой нетрудно убедиться, что в этом случае ^г(м) = М 4“ ^г(м) — М 4“ ^(М )’
136 Гл. 5. Асимптотические наблюдатели для линейных систем — полином от /л степени меньше г, т. е. /Д/z) — полином от /z степени £овно i со старшим коэффициентом Ц. Остаточные члены, по- линомы Ц(/л) могут быть найдены в явном виде по коэффициентам 7". На практике, для простоты, в наблюдателе (5.38) и при 7" / О можно использовать вектор L из (5.48). В этом случае det(s/ — Al) не совпадает с требуемым полиномом 7($), однако при у —> оо спектр Al (с L из (5.48)) стремится к заданному спектру из (5.44), т. е. при /л уГ — const спектр Al становится вещественным и различным, а, следовательно, для ошибки наблюдения справедлива асимптотиче- ская оценка (5.45). 5.5.2. Наблюдатели для систем с произвольным относитель- ным порядком г > 1. Предложенный подход к построению наблюда- телей обобщается на системы с произвольным относительным поряд- ком. Пусть относительный порядок системы равен г, где 1 < г < п. Тогда неособым преобразованием система приводится к виду, (5.35'): ( х' = Ацх' + А127/', I y' = A2iy' + B'(f + ^x'), У = Ш = С'у', где часть фазового вектора xf е соответствует нулевой динамике системы. Если матрица Ац гурвицева (т. е. характеристический поли- ном нулевой динамики /3n_r(s) = det(s/-Ац) — гурвицев, система минимально-фазовая), то наблюдатель (5.36) восстанавливает часть фазового вектора х( экспоненциально. Для восстановления у' воспользуемся методом, который был пред- ложен при построении наблюдателя для систем с максимальным отно- сительным порядком, а именно, используем наблюдатель вида у = А2{у' - ЦС'у’ - у) 4- В'Уг', (5.49) где х' — оценка xf из наблюдателя (5.36). Ошибка оценивания e(t) = — & ~ Уг) £ удовлетворяет уравнению ё = ALe - B'(f — у'е'), которое отличается от уравнения (5.39) размерностью и наличием экспоненциально убывающего слагаемого e'(t) —х’ — х' — ошибки на- блюдателя (5.36). По аналогии с теоремой 5.4 выберем вектор L е Rrxl так, чтобы Spec{Al} = {/лХ[,/лХг}, Xi < 0, г=1,...,г, /л > О, 1ЛН = 1, |A,+i|>|M г = - 1.
5.6. Асимптотический наблюдатель для систем с неопределенностью 137 Тогда, проводя оценки, как в доказательстве теоремы 5.4, получим оценку для ошибки наблюдения e(t): |e(t)| + — + K3e~St, М где, как и ранее, = const не зависит от а константа 5 > О характеризует степень устойчивости полинома /3n_r(s) (т.е. степень устойчивости нулевой динамики системы) Spec{An} = {<5i, ...,<5r}, Re(5;) < —<5, г = 1, Следовательно, выбирая параметр ц > 0 достаточно большим, мож- но в асимптотике сделать ошибку оценивания e(t) меньше любой наперед заданной величины. Наблюдатели (5.36) и (5.49) вместе образуют наблюдатель полного порядка п для минимально-фазовой системы с произвольным относи- тельным порядком. При этом часть фазового вектора восстанавливает- ся экспоненциально точно, а часть — с наперед заданной точностью. Для наблюдателя (5.49) справедливы все следствия к теореме 5.4, которые были сделаны для систем с максимальным относительным порядком. 5.6. Асимптотический наблюдатель для систем с неопределенностью Предложенный выше наблюдатель для квадратных систем с отно- сительным порядком г > 1 не является асимптотическим, он позволяет лишь получить оценку неизвестного фазового вектора с наперед задан- ной точностью. В работе [14] предложен метод построения асимптотических на- блюдателей для таких систем, основанный на использовании иерархии разрывных обратных связей. Опишем этот метод, следуя [14]. Как и ранее, рассматриваем задачу восстановления неизвестного фазового вектора системы (5.25). Относительно системы, как обычно, предполагается, что система находится в общем положении и является минимално-фазовой. В этом случае система может быть приведена к виду (5.35'), при этом матрица Ац — гурвицева. 5.6.1. Системы со вторым относительным порядком. Вначале рассмотрим базовый случай системы со вторым относительным поряд- ком. В этом случае CD = О, CAD / 0. Не ограничивая общности, считаем, что CAD = 1. В этом случае система приводится к виду (5.35)
138 Гл. 5. Асимптотические наблюдатели для линейных систем при г = 2, т. е. к виду Х\ = Ж2, (5.50) 5.51) < Хп-2 = - ... - /Зп—2Хп—2 + У У1 = У2, < У2 = “71^1 - ••• - Yn-2xn-2 - 11 УI - 12 У2 + Л У = У1- Первая (п — 2)-мерная часть описывает нулевую динамику си- стемы, и, в силу минимальной фазовости системы, стандартный (п — 2)-мерный наблюдатель (5.36) восстанавливает часть фазового вектора х' = (х\, ... ,хп_2)Т экспоненциально точно. Координата у\ системы (5.50) — измеряемый выход системы, поэтому для восстанов- ления полного фазового вектора исходной системы остается оценить координату у2. Для восстановления у2 используем наблюдатель второго порядка У\ = У2 + У 2 = ~7^1 - ••• - 7^-2^п-2 - 7"У1 - 72 У2 + V2, где Xi — оценки координат х^ формируемые наблюдателем (5.36), а управления гц и V2 будут определены ниже. Ошибка наблюдения 8 = = (£1,^2) = {у\ ~ УГУ2 — У2) удовлетворяет уравнениям 81 = 82 + , < ~ . ?2 = -11 £1 - 12 &2 + V2 + /, где f = f + 7'е' — неизвестное возмущение (здесь 7' = (7}, ...,7^_2), а е' — ошибка оценивания для наблюдателя (5.36); е' —> 0 экспоненци- ально). Пусть неизвестный сигнал f(t) равномерно ограничен известной константой Fo, т-е- 1Ж1«, t^O. Заметим, что в силу стремления е' —> 0 неизвестный сигнал f(t) также ограничен. Выберем управления и в наблюдателе (5.51) в виде обратной связи по ошибке наблюдения 81 = yi — yi = yi — у, т. е. в виде V1 = — к\8\, V2 = -^2^1 - fc3Sgn£i, (5.52)
5.6. Асимптотический наблюдатель для систем с неопределенностью 139 где константы к\, к2 и кз подлежат определению. Тогда ( £\ = -к\8\ + I <% = -- 72 ^2 - к28\ - кз sgnfi 4- f. Рассмотрим уравнение второго порядка относительно ошибки 8г. Ё[ = —к\8\ 4- £2 = ~к\Ё\ - 7{£i - 72 ^2 ~ к28\ - кз sgnfi + 7 Из первого уравнения (5.53) следует, что £2 = 8\ + к\£\. Тогда 8\ = ~(к\ + 72 )Л - (к2 + 71' + Мг )£1 - sgnfi + f. Выберем константы к\, к2 и кз из нижеследующих условий ' к\ 4- 72 = а2 > О, < к2 + 7'1' 4- &172 = щ > О, (5.54) . кз = Ff > Fo. Очевидно, что это всегда можно сделать. Тогда уравнение относитель- но £[ принимает следующий вид Л 4- «2^1 + «1^1 + (F'sgnfi - /) = 0. (5.55) Заметим, что так как е' —> 0, то с некоторого момента времени выполнена оценка |/(t)| F' и, следовательно, при указанном выборе констант ki (г = 1,2,3) уравнение (5.55) асимптотически устойчи- во, [2]. В силу этого асимптотически устойчива и система в отклонениях (5.53) относительно (fi,^), т.е. fi —> 0 и 82 0 при £ —> оо, т.е. наблюдатель (5.51) асимптотически восстанавливает неизвестную ком- поненту фазового вектора y2(t). Отметим, что в этом случае переменная y2(t) является непрерывной функцией времени и имеет разрывную производную. Таким образом, доказано следующее утверждение. Теорема 5.5. Пусть система (5.25) находится в общем положе- нии, является минимально-фазовой, неизвестный сигнал f(t) удо- влетворяет оценке |/(t)| Fo при t 0, с известной константой Fo; система имеет второй относительный порядок. Тогда наблюда- тели (5.36), (5.51) при условиях (5.52) и (5.54) асимптотически восстанавливают фазовый вектор системы. Заметим, что наблюдатель состоит из линейной системы (5.36) и системы с разрывной обратной связью (5.51).
140 Гл. 5. Асимптотические наблюдатели для линейных систем 5.6.2. Системы с произвольным относительным порядком. Обобщим предложенный подход к построению асимптотических на- блюдателей на системы с произвольным относительным порядком. Пусть, как и ранее, система находится в общем положении и яв- ляется минимально-фазовой. Тогда, не ограничивая общности рассуж- дений, можем рассматривать систему, заданную в канонической фор- ме (5.35'). Наблюдатель (5.36), как и ранее, в силу минимальной фа- зовости системы, восстанавливает часть фазового вектора xr е R(n-r\ Таким образом, задача сводится к восстановлению координат у%, ... ,уг (так как yi — известный выход системы). Для получения предварительной оценки этих координат используем стандартный наблюдатель вида ' У\ = У2 - l\(yi - yi), Уг—i =Уг- 1г-\{у\ - У\), , Уг = -71^1 - ••• - 7п-Л»-г - 7l'£l - ... - 7"Уг - /г(У1 - у), (5.56) где Xi — оценки координат х± из (5.35), формируемые наблюдате- лем (5.36). Ошибки оценивания £i = (^ - у^, г = 1, ...,г, удовлетворяют сле- дующим уравнениям: 8\ — —4- £2, £2 — ~h£\ + £з, < ••• (5.57) Гр—1 — —i £i 4- Гр, < £r--Zr£i-(7,e4-7"£)-/, где £ = (£i, ...,£г)т, е = (еь...,en_r)T — ошибка наблюдателя (5.36) (при этом е —> 0 экспоненциально при t -> оо); 7' = (7^ ...,7^_г); 7" = = (7^.-.лЛ- Пусть, как и ранее, неизвестный сигнал f(t) ограничен известной константой, т. е. |/(£)| Fq. Запишем систему (5.57) в матричном виде: £ = Al£ - brf, (5.57') где у = / 4-7'е — неизвестный ограниченный вход, Ьг = (0, ...,0,1)т е € Rrxl, а спектр матрицы
5.6. Асимптотический наблюдатель для систем с неопределенностью 141 целиком определяется выбором коэффициентов Ц. Выберем Ц так, чтобы матрица Al стала гурвицевой. Тогда в силу ограниченности f(t) и ошибка 8(f) также будет ограничена при t 0. Более того, можно получить оценку сверху для ошибки наблюдения £(t). В самом деле, так как e(t) 0 экспоненциально при t ос, то для e(t) имеет место оценка |e(i)| |e(0)|Qie-At, О, где Qi, А > 0 — некоторые известные константы (А определяет сте- пень устойчивости нулевой динамики системы (5.25), т. е. степень устойчивости матрицы Ац в форме (5.35')). Ошибка оценивания £(£), в силу уравнения (5.57), имеет вид t 5(t) = £(0)eALt + j eAL(t~T>brf(r) dr. О Для гурвицевой матрицы Al имеет место оценка |eAit| «= где Q2, 7 > 0 — известные константы, причем 7 может выбираться по произволу. Учитывая, что \f(t)\ Fq, \br \ = 1, |У| = Q3 = const > 0, получим оценку |f(t)| |£(0)|Q2e-7t + Q2 |е-^-т)(Го + СзС1|е(О)|е-Дт)йт = О = |£(0)|Q2e-^ + QzFp /j _ + Q1Q2Q31e(0) I / -At _ = Qie-^ + Q2e“At + —. (5.58) 7 где Q, = |£(0)l<?! - ^ + 7 A — 7 ТУ <21<92<2з|е(О)| Ч/2 ~-----------T----- 7 — A — некоторые константы, определяемые параметрами системы и выбо- ром коэффициентов Ц в наблюдателе (5.56). Заметим, что этот наблюдатель не является асимптотическим. В предыдущем параграфе было показано, что специальным выбором спектра матрицы Al ошибку 8(t) можно сделать в асимптотике меньше наперед заданной величины. В новом методе построения наблюдателей ограничимся фиксированным спектром Al. При этом ошибка оценива-
142 Гл. 5. Асимптотические наблюдатели для линейных систем ния £(t) ограничена и за конечное время стягивается в шар известного радиуса R, где R>^-. 7 Заметим, что константы Q{ и Q2 б оценке (5.58) неизвестны (так как неизвестны начальные отклонения е(0) и £(0)). Поэтому неизвест- но и время, за которое ошибка E(t) попадает в шар радиуса R. Однако это время заведомо конечно, а если известны оценки на е(0) и Е(0), то и время попадания Е(t) в шар радиуса R можно оценить. Для восстановления фазового вектора исходной системы построим асимптотическую оценку неизвестного вектора S(t). Тогда в качестве оценки для yi(t) (i = 2,...,г) можно использовать ^(t) = уг - Eiy где Ei — асимптотическая оценка Si(t). Таким образом, yi дает предвари- тельную (не асимптотическую) оценку yi, a Ei дает асимптотическую оценку рассогласования & и yi. Для восстановления компонент Ei вектора Е предложим следующий пошаговый алгоритм. Рассмотрим первые два уравнения системы в отклонениях (5.57): Г Е\ = —l\E\ 4- £2, £2 — —^2£1 4- £з — как систему второго порядка с измеряемым выходом £\(t) и неиз- вестным входом £з(£). Для этой системы неизвестный вход £з(£) огра- ничен, более того, для него имеет место оценка (5.58). Кроме того, относительный порядок системы (5.59) от £з(£) к £i(t) равен двум. Следовательно, для восстановления неизвестной координаты £2(2) мож- но воспользоваться алгоритмом, предложенным выше для систем со вторым относительным порядком, а именно, использовать наблюдатель (5.59) (5.60) £ 1 — —1\£\ 4- £2 < £2 — —^£1 + ^2’ где управления и} и v2 будут определены ниже (верхние индексы указывают, что это первый в серии подобных наблюдателей). Ошибка оценивания (Ai,Д2) = (£} — £г,Е2 — £2) удовлетворяет уравнениям J Ai = Д2 4-v} I Д2 = vl2 - f, где f = £3 — неизвестный ограниченный вход. По аналогии с (5.52) выберем управления v} и v2 б виде (5.61) 4 = -q|Ai = -qfa} -fi), , «2 = -?2Д1 - 9з sgn(Ai) = -(£{ - fi) - sgn(£{ - £i).
и если Q2F0 где -— 5.6. Асимптотический наблюдатель для систем с неопределенностью 143 где Ai = 5/ — £\ = Еу — (у\ — у) — известный сигнал. В этом случае имеет место уравнение Д1 + Q1Д1 + <?2Д1 + 9з sgn(Ai) + 7=0, 1 п К л 1 *?2^0 91 >0, q2 > 0, q3 >------, 7 константа из оценки (5.58), то начиная с некоторого момента времени _ 1Ж^, а, следовательно, система (5.61) при указанном выборе -у} и v\ (и констант д?) асимптотически устойчива. Таким образом, наблюда- тель (5.60) дает асимптотическую оценку неизвестного сигнала <%. Наблюдатель для компоненты £3 построим по индукции. Рассмот- рим второе и третье уравнения системы (5.57): £2 = ~h£\ + £з, £3 — —I381 + £4 — как систему второго порядка с известным входом 8\, неизвестным ограниченным входом £4, удовлетворяющим оценке (5.58). Для этой системы выход £2(8) неизвестен, однако известна его асимптотиче- ская оценка £2, построенная с помощью первого наблюдателя в серии (наблюдателя (5.60)). Для восстановления £з(7) используем второй наблюдатель в серии, имеющий ту же структуру £2 — — h£\ Н- £3 + £3 = ~h£i + ^2- Как и ранее, управления и выберем в виде обратной связи по ошибке наблюдения, которая в данном случае имеет вид (£2 - £2), т-е- является разностью оценок сигнала £2, построенных с помощью двух разных наблюдателей, (5.62) и (5.60): , «2 = -92 (4 - ^2*) - 9з Sgn(4 - ^2)’ В силу того, что (£J — £2) —> 0 при t оо, при стандартном выборе 2 констант q±: 2^л 2 л 2 Q2F0 Q1 >0, q2 > 0, q3 > ----, 7 наблюдатель (5.62) дает асимптотическую оценку неизвестной компо- ненты £3, т. е. (£3 - £3) —> 0 при t —* ос.
144 Гл. 5. Асимптотические наблюдатели для линейных систем Продолжая рассуждения по индукции, можно построить наблюдате- ли для неизвестных сигналов £*, i = 3, ... ,г — 1. Действительно, пусть на очередном (г - 1)-м шаге построена оценка для сигнала Ei. Рассмотрим два соседних уравнения из системы (5.57): ( Ёг = -Ц£\ 4- £$+1, t £г-И “ 4“ £г+2 — как систему второго порядка с известным входом Е\, неизвестным ограниченным входом Si+2 и асимптотической оценкой выхода Ei. Для нее можно построить наблюдатель £t = -k£i + £zi+l +vj, k = li+l£l “b ^2* где, по аналогии, управления v\2 выбираются в виде ' г\ = -о{(£1-£Г1), при условии, что gj>0, ^>0, qi>^- Тогда £?+1 является асимптотической оценкой неизвестного сигна- ла Ei-± 1. Отдельно рассмотрим схему восстановления последней координаты £г, так как в этом случае соответствующая двумерная подсистема из (5.57) имеет чуть более сложный вид: ( Ег—1 — —1Г~\Е\ £г, ( Ёг = ~1тЕ\ - f 4- 7'е 4- 7f£i 4-... + 7"-А-1 4- 7"^- Построим наблюдатель ( £r~\ ^-ir-^i+ё;-' + vrl-\ S (5-63) I £r~l = -lr£l + 7^1 + 72^2 + •• + + vr2-', где £*~l — асимптотические оценки £t (i = 2, ... ,r — 1), постро- енные на предыдущих этапах. Система в отклонениях (Д1,Д2) =
5.6. Асимптотический наблюдатель для систем с неопределенностью 145 = (£r-i ~ £r-i'^r 1 ~ £г) имеет вид ( Ai = А2 + г>[-1, I а2 = + 7 где / = f + 7'е + 7" (£1~1 — £i\ Так как f(t) — ограничен- г=2 ' ' ный сигнал (с известной мажорантой Fo), е —> 0 экспоненциально, (£г1-1 — £;) —> 0 асимптотически при t —> оо, то и сигнал /(7) ограничен при t е [0;+оо) (более того, с некоторого момента времени |/(7)| R* где R — произвольная константа, такая, что R > Fo). Тогда при стандартном выборе управлений ^Г^-дГ1 fc1- ^), дГ‘>о, vr2-' = - ВД) - <7з-1 sgn^zf - ВД), 5Г1 > О, д3г’1 > То, наблюдатель (5.63) асимптотически восстанавливает неизвестную ком- поненту £г(7). Выпишем окончательный вид наблюдателя состояния исходной си- стемы, заданной в канонической форме (5.35), Ti = Х2, Яп—г—Х — %п—г> %п—г ~ /51^1 ••• ftn—r^n—r У> к ' У\ =У2-11(У1 - у), Уг-1 = Уг - lr-l(yi - у), У Г = 71^1 + ••• + 7п-г^п-г + 7"У1 + ••• + 7г Уг - lr(yi - у), к = -li(yi -y) + f2 +^‘, , т2 = -Ш1 -y) + v'2, ^2 = - W1 - у) +7з + wl- £3 = -1з(У1 -y) + vl,
146 Гл. 5. Асимптотические наблюдатели для линейных систем 5.65 ёг-2 ~ ~1г-2(У1 ~У)+ + Vl^’ < ^г-2 £r-i = -lr-i(yi - у) + Ц'-2, ЛГ-l ~ (5’64) £г-1 = -lr-l(yi -y) + Er~l + «[’'- С' = -1ЛУ1 - У) + -vf (2/1 - У) + Е 7^"’ + гГ1, г=2 где управления v\, выбираются в виде I 4 = -gi(£T‘ - £/) - «hg^^r1 - £*). здесь считаем 5? — у\—у\ выбор констант Zi, q\ описан выше. В ка- честве оценки для Xi (г = 1, ... ,п — г) из (5.35) используем xif а в качестве оценки (г = 2, ... , г) используем = (yi — £гг“1) (yi — известный выход) системы. Таким образом, доказано следующее утверждение. Теорема 5.6. Пусть система (5.25) находится в общем положе- нии и является минимально-фазовой. Тогда ее можно привести к виду (5.35). Если относительный порядок системы г > 1, а неиз- вестный сигнал f(t) ограничен известной константой F$, тогда наблюдатель (5.64)-(5.65) порядка n + 2(r — 1) при соответству- ющем выборе констант Ц и q[ асимптотически восстанавливает фазовый вектор системы. Замечание 5.7. Наблюдатель (5.64) восстанавливает часть коорди- нат xi (г = 1, ... ,п —г) экспоненциально точно, при этом оценки Xi являются непрерывными и дифференцируемыми. Другая часть коор- динат yi (г = 2, ... , г) восстанавливается асимптотически точно, при этом оценки yi являются непрерывными функциями времени, однако их производные претерпевают разрывы, т. е. оценки не являются гладкими. Заключение. В главе 5 рассмотрена задача синтеза асимптотиче- ских наблюдателей для линейных стационарных систем в условиях неопределенности. При решении этой задачи можно выделить два случая: гипервыходные системы (когда размерность выхода превышает размерность неизвестного входа) и квадратные системы (когда эти размерности совпадают). Для гипервыходных систем предложены два подхода к решению за- дачи: метод квазирасщепления и метод псевдовходов. Оба этих метода позволяют получить решение задачи при одних и тех же требованиях
5.6. Асимптотический наблюдатель для систем с неопределенностью 147 к системе. Основные результаты сформулированы в теореме 5.1 и теореме 5.2 соответственно. Предложенные методы позволяют так же решить ряд вспомогательных задач, в частности метод квазирасщепле- ния позволяет решить задачу синтеза функциональных наблюдателей (параграф 5.2), а метод псевдовходов позволяет получить ряд представ- лений, которые удобны для решения задач стабилизации и наблюдения в условиях неопределенности (теорема 5.2' и теорема 5.2"). В главе 5 приведен обзор известных методов синтеза наблюдателей для гипервыходных систем (параграф 5.4). В параграфах 5.5-5.6 рассмотрена задача о синтезе наблюдателей для квадратных систем. При этом предложены два подхода к решению этой задачи. Первый, основанный на иерархии коэффициентов усиле- ния обратной связи, позволяет получить оценку неизвестного фазвого вектора с любой наперед заданной точностью, однако не является асимптотическим (теорема 5.4). Второй подход основан на иерархии разрывных обратных связей и позволяет получить асимптотическую оценку неизвестного фазового вектора (теорема 5.6).
Глава 6 НАБЛЮДАТЕЛИ ДЛЯ БИЛИНЕЙНЫХ СИСТЕМ В этой главе рассматривается задача о построении наблюдателей для одного из классов нелинейных динамических систем — для били- нейных систем вида х = Ах + иВх + vD, У = Сх, (6.1) где, как и ранее, х е Rn — неизвестный фазовый вектор системы, и е Rm и v 6 Rfc - известные входы системы, а у € R1 — измеряемый выход; A, B,C,D — известные постоянные матрицы соответсвующих размерностей. Необходимость рассмотрения задачи наблюдения для этого класса систем объясняется тем, что при вырождении матрицы билинейности, т.е. матрицы В в (6.1), и линейном выходе синтез наблюдателей состояния и, соответственно, функциональных наблюдателей может проводится методами, предложенными в предыдущих главах. При от- сутствии такого вырождения задача наблюдения для систем вида (6.1) довольно сложна, что и демонстрируется на примере планарных (т.е. при п = 2) билинейных систем. Так как влияние известного входа v(t) всегда можно компенсиро- вать в наблюдателе, далее будем рассматривать билинейные системы вида / . I х = Ах 4- иВх, ( у = Сх. Особенность этой системы в том, что при любых матрицах А, В и С эта система теряет управляемость в точке х = 0. (6.2) 6.1. Асимптотические наблюдатели билинейных систем на плоскости Постановка задачи. Рассматривается стандартная задача наблю- дения: для билинейной динамической системы (6.2), где х е R2, А и В G R2x2 — известные матрицы с постоянными коэффициентами;
6.1. Асимптотические наблюдатели билинейных систем 149 и е R — скалярная, и при необходимости известная, входная функция системы; требуется по непрерывным измерениям скалярного выхода у = Сх, где С е Rlx2, сформировать экспоненциальную оценку x(t) фазового вектора x(t) системы (6.2). Такая задача является класси- ческой задачей наблюдения для управляемых динамических систем. Сложность ее решения для билинейной системы обусловлена наличием в правой части, вообще говоря, знакопеременной функции и(1). Пояс- ним это. Так, при использовании стандартного наблюдателя Люенбер- гера, х = Ах + иВх — 1(Сх — у) — ид(Сх — у), (6.3) где I и д — параметры обратной связи, проблема оценивания сводится к устойчивости системы в отклонениях е = х — х: ё = AieиВде, (6.4) где Ai = А - 1С, Вд = В - дС, и из гурвицевости матриц Ai и Вд при переменном u(t), вообще говоря, не следует устойчивость линей- ной системы (6.4) с матрицей Ai+u(t)Bg. В работе [8] показано, что гурвицевости матрицы Ai — А - 1С достаточно для устойчивости системы (6.4) при достаточно малых управлениях и(£), однако при «больших», пусть даже равномерно по t ограниченных функциях u(t), наблюдатель Люенбергера (6.3) уже не решает поставленную задачу. Поэтому следует искать способы устранения влияния функции u(t) на устойчивость процессов оценивания. Рассмотрим алгоритмы синтеза наблюдателей состояния системы (6.2), решающие задачу экспоненциально точно (по возможности с заданной степенью устойчивости) при любых равномерно по t ограни- ченных функциях входа, т. е. при условии |w(t)| ио, t 0. (6.5) Для этого докажем ряд вспомогательных утверждений. Для дву- мерной билинейной системы (6.2), не ограничивая общности рассмот- рения, можно считать, что rank В =1, т. е. В = bh, где b и h — известные векторы столбец и строка, соответственно. Действительно, возьмем строку h такую, что det h С * 0. Пусть 61 и Ь2 — столбцы матрицы В = h г> h С В С -1 . Обозначив 1 •61, Ь" = • Ь2, перепишем систему (6.2) в виде х = Ах 4- ub'hx + ub"y. В этом случае с помощью вспомогательной системы х = Ах 4- ub'hx 4- ub"y (6.6)
150 Гл. 6. Наблюдатели для билинейных систем задача оценивания фазового вектора х = х + е сводится к задаче на- блюдения для системы в отклонениях ё = Ае + иВе, В = b'h, (6.7) где rank В = 1. Для удобства дальнейших ссылок приведем вспомогательные утвер- ждения. Лемма 6.1. Для произвольных (2 х 2) матриц Аи = А + иВ и строки С е Rlx2 имеет место равенство С САи = det С СА + izdet С СВ (6-8) Если, кроме этого, имеет место факторизация В = bh, то С САи Доказательство дается прямой проверкой. □ При синтезе наблюдателей состояния полезна Лемма 6.2. Пусть тройка {С,А,Ь} находится в общем положе- нии 9 и при СА~ХЬ А = А* = ———det А (6.10) О ь выполнено условие', det Ад* = det(A*/ — А) 0. Тогда строка d* = CA^ (6.11) ортогональна вектору b, т. е. d*b = 0, и, кроме того, det Доказательство. В силу теоремы Гамильтона-Кэли А2 - A tr А + I det А = 0. Тогда А — I tr А + А 1 det А = 0 для любой невырожденной матрицы А в том числе и для Ад при всех А spec{A}. Домножим это тождество для Ад слева на С, а справа Ь. САХЬ - Cb tr Ад - СА;1 det Адb = 0. 9 Поясним, что речь идет о двумерных векторах и (2x2) матрицах, и, кроме того, det А / 0, СЬ / 0, det С СА ^0 и det(b, Ab) / 0.
6.1. Асимптотические наблюдатели билинейных систем 151 Заметим, что в силу выбора А* из (6.10) CA*xb - Cb tr = С(А*1 - A)b - Cb tr (А*/ - А) = = С6А* - CAb - Cb 2А* + Cb tr А = -CAb + Cbtx А- СЬХ* = = С(—А + I tr А - A"1 det A)b = 0. и, значит, d*b = 0, где d* определено в (6.11). Для доказательства второго утверждения заметим, что d* — = С Ад*1 = * (СА - Ctr А), поэтому aet -/1 . Г С 1 1 J Г С 1 det , = ------— det Л d* J det Ад* |_ С А и, в силу условий леммы, det Лемма 6.2 доказана. С d* /0. Замечание 6.1. Если тройка {С, А, Ь} находится в общем положе- нии, то для нее можно ввести передаточную функцию ТУ(з) = C(sE - Л)-'б = ^4, при этом в условиях леммы 6.2 deg (/?(«)) = 1. В этом случае А* — нуль передаточной функции, т.е. /?(А*) = ИДА*) = 0. Действительно, в условиях леммы 6.2 /3($) = /32з + А, a(s) = s2 + &2S + а\, при этом cti = det A, q2 = — trA, а /32 = Cb. Кроме того, ИДО) = fa/ai = — СА~1Ь. Отсюда непосредственно следует, что /31 = —CA~xb • det А, а корень числителя /3($) определяется равенством Z?i СА~ХЬа.л v Условия равномерной по t наблюдаемости. Рассматриваемая си- стема равномерно по t 0 наблюдаема, если С С(А + u(t)B) min det >0, (6.12) t^o Поскольку по лемме 6.1 С САи — det С СА + uCb det где г/(t), вообще говоря, произвольная равномерно ограниченная функ- ция (удовлетворяющая условию (6.5)), нетрудно убедиться в справед- ливости следующего утверждения.
152 Гл. 6. Наблюдатели для билинейных систем Теорема 6.1. Билинейная система х = Ах + ubhx на плоскости со скалярным выходом у — Сх и произвольной ограниченной функ- цией |w(£)| uq равномерно по t наблюдаема тогда и только тогда, когда С СА + rt(t)C6det ^0, ’ С ' h Из этого утверждения можно получить достаточные и необходимые условия равномерной наблюдаемости. Лемма 6.3. 1°. Пара {С, A + ubh}, где |u(t)| ио, равномерно по t наблюдае- ма, если выполнено одно из следующих условий'. а) СЬ ф 0, det с СА > мо|С7>| det b) наблюдаема пара {С, Л} и вектора С uh- коллинеарны; с) наблюдаема пара {С, А} и СЬ = 0. 2°. Если пара {С, A + ubh}, где |u(t)| < ио, равномерно по t на- блюдаема, то пара {С, Л} — наблюдаема. Таким образом, в случае общего положения равномерная наблюда- емость гарантированно имеет место при соблюдении ограничения det ио < (6.13) Cbdet Это условие далее будем называть условием строгой равномерной на- блюдаемости. При различных вырождениях задачи (условиях Ь) и с) леммы 6.3) ограничение на управление u(t) отсутствует. Наблюдатели состояния для вырожденных билинейных систем на плоскости. Начнем рассмотрение с наиболее простого случая Ь) леммы 6.3, когда det = 0. Без потери общности рассмотрения, по- лагаем у — z = hx (этого можно добиться нормировкой входа). В этом случае задачу решает наблюдатель вида х = Ах + uby — 1(Сх — у), (6-14) где х — оценка фазового вектора, I — вектор обратной связи, назна- чаемый по произволу. С учетом равенства у — z, ошибка оценивания г — х — х удовлетворяет уравнению ё = Aie, Ai = А — 1С. (6.15) ^0 С h С h С ' С А ' h
6.1. Асимптотические наблюдатели билинейных систем 153 При этом в случае наблюдаемости пары {С, А}, выбором вектора I спектр матрицы Ai может быть сделан любым, следовательно, имеет место Теорема 6.2. Пусть в билинейной системе х = Ах + ubhx на плоскости со скалярным выходом у — Сх выполнены условия'. 1) det = 0; h 2) пара {С, А} — наблюдаема. Тогда наблюдатель (6.14) экспоненциально точно решает задачу наблюдения с любым наперед заданным показателем при любой функции u(t). Замечание 6.2. Вообще говоря, необходимости в полноразмерном наблюдателе вида (6.14) нет, можно ограничиться наблюдателем перво- го порядка. Ниже при анализе другого вырожденного случая опишем способ построения такого наблюдателя пониженного порядка. Рассмотрим теперь случай с) леммы 6.3. В данной ситуации СЬ — 0, и удобно от исходных переменных х перейти к пространству производ- ных выхода (у, у). Полагая yi = у, у2 = у, находим алгебраическую связь между новыми и старыми переменными в виде У1 У2 С СА При наблюдаемости пары {С, А}, что и предполагается впредь, в качестве оценки х можно принять с Г1 [У1 с A J у2 (6.16) где у2 — оценка переменной у2. Для решения поставленной задачи найдем уравнение рассматрива- емой билинейной системы в координатах (yi,yz). Имеем У2 = У — С Ах = СА?х + uCAbhx (очевидно, что при сделанных предположениях САЬ 0, так как в противном случае 6 = 0). Так как А2 = Atr А - / det А, то У2 = — у\ det А + у2 tr А + uCAbh СА У\ . Уъ . Для простоты дальнейших выкладок введем обозначения CAbh С I -1 СА =[ai,«2], (6-17)
154 Гл. 6. Наблюдатели для билинейных систем в этих обозначениях искомая система принимает вид ( У\ = У2, 5 (6-18) [ уч = (иа\ - det А)у\ + (tr А + а2^)?/2 с уравнением наблюдения У = У\- (6.19) Согласно традициям линейной теории управления, для системы (6.18)—(6.19) наблюдатель возьмем в виде f Ух = т - ш - у\ ..... < . (O.ZU) I У2 = (uai - det А)у + (tr А + a2w)?/2 - fci (ш - у). где к\ и к2 — настраиваемые параметры обратной связи наблюдателя. Такой подход приводит, однако, к довольно сложной проблеме анализа устойчивости нестационарной системы в отклонениях 9 е\ = у\ — у\, ^2 = У2~У2 | 6 = S2 - к2в\, < (6.21) I S2 = (tr А + а2и)ё2 - к[€[, Вместо этого попытаемся синтезировать наблюдатель пониженного порядка, в данном случае — одномерный, что сильно упростит синтез наблюдателя и анализ его свойств. Для удобства перепишем (6.18) в виде I У1 = У2, 1 У2 = («1 + а\и)у\ + («2 + CL2u)y2, здесь принято а\ = - det А, а2 = trA. Введем новую переменную ст = у2 + dyi, (6.23) где d — некоторая константа, отличная от нуля, выбор которой будет указан ниже. Перейдем к новым переменным (т/i,сг). В этом случае имеем а = [(of 1 + сци) - (m2 4- а2и + d)d]y\ 4- (а2 4- а2и 4- d)a. Обозначим /31 = (ач 4- щи) — (а2 4- а2и 4- d)d, (32 = а2 4- а2и 4- d. В этих обозначениях уравнения оцениваемой системы в переменных (зд, а) примут следующий вид ( У1 = -dyi 4- СТ, 1 d = &\у\ + (32а, У = У1^ 6.24) 9 Далее этой проблеме будет уделено специальное внимание.
6.1. Асимптотические наблюдатели билинейных систем 155 Так как переменная у\ — у известна, то достаточно оценить только переменную <т, эту задачу при 02 < 0 решает скалярный наблюдатель а = 0{у + 02д. (6.25) Действительно, в этом случае ошибка оценивания е — а — а удовле- творяет скалярному уравнению е = 02С, которое экспоненциально устойчиво с заданным показателем ту > О, если (в силу равномерной ограниченности u(t)) d —\a2\u0 — tr А — у. (6.26) В качестве оценки исходного фазового вектора х используем формулу (6.16), которая, с учетом введенных обозначений, примет следующий вид: У a-dy (6.27) Г с 1 Таким образом, доказана Теорема 6.3. Пусть в билинейной системе х = Ах + ubhx на плоскости со скалярным наблюдением у = Сх выполнены следующие условия’. 1) пара {С, А} — наблюдаема’, 2) СЪ = О, САЪ ф 0. Тогда задачу экспоненциального оценивания фазового вектора с любым наперед заданным показателем и при любой ограниченной функции u(t) решает наблюдатель У v -dy ]' ? = 0\У + 02°, где параметр d удовлетворяет условию (6.26) (значения коэффици- ентов 0i и 02 указаны выше). Вернемся к упомянутой выше проблеме устойчивости системы вида (6.21), т.е. {£\ = £2 ~ £2 = а(и)£2 — к\£{, где для краткости а(и) = tr А + а2и. Сделаем невырожденную замену переменных у = £2 — £ = £1 (при этом будем предполагать, что = const, в то время как параметр
156 Гл. 6. Наблюдатели для билинейных систем к\ может быть функцией, зависящей от u(t)). Тогда вместо (6.28) получим ( £ = Г], < (6.29) [ fj = -(к? - а(и))т] - (Ач - a(w)A;2)e. 2 Рассмотрим функцию Ляпунова v = — 4- q — const > 0. Ее производная, в силу системы, v = er] + qrj[-(k2 ~ - (к\ - а(и)к2)е]. Положим к\(и) = а(и)к2 + к®, где к® = const > 0, при этом обозначении v = (1 - qk®) er] - qrf(k2 - а(и)\ и при выполнении условий кх = 1/q, к2 > trA + |«2|^о шах а(и) (6.30) |u|^Uo следует, что v 0 и, по теореме Барбашина-Красовского (так как многообразие rj = 0 не содержит целых траекторий), система (6.29) асимптотически устойчива, что и решает задачу наблюдения. Ясно, что при надлежащем увеличении параметров обратной связи кх и к2 можно получить любую наперед заданную степень устойчиво- сти наблюдателя (доказательство опускаем). Имеет место Теорема 6.4. Пусть в билинейной системе х = Ах + ubhx на плоскости со скалярным выходом у = Сх выполнены следующие условия'. 1) пара {С, А} — наблюдаема, 2) СЬ = 0, САЬ ± 0. Тогда наблюдатель вида f У\ = У2 - Ыш ~ у\ [ У2 = (uai - det А)у + (tr A + а2и)у2 - ki (y\ - y) с переменным коэффициентом k\ = (tr A + a2u)k2 + k®, при надле- жащем выборе констант к® и k2 экспоненциально точно решает задачу наблюдения с любым наперед заданным показателем и при любой ограниченной функции u(t). Разберем, наконец, случай а) леммы 6.3. В этом наиболее общем случае выполнены условия: СЪ^О, ^0, det С СА > uq|Cb\ det В отличие от предыдущих пунктов, теперь ограничение на «ам- плитуду» управления u(t) существенно. Рассмотрим ряд возможностей
6.1. Асимптотические наблюдатели билинейных систем 157 для синтеза наблюдателей, они различаются свойствами числителя передаточной функции 1Г(з) = C(sE - A)~lb = ^4. a(s) Заметим, что в силу того, что СЬ / 0, deg/3(s) = 1 и поэтому уместно рассмотреть два варианта: А. Полином /?($) — гурвицев; Б. Полином Z?(s) — негурвицев. Вариант А. В этой ситуации для оценивания фазового вектора билинейной системы х = Ах + Ьи, и = uhx с наблюдением у = Сх, невырожденным преобразованием приведем систему к каноническому виду: 4,=Л“|+,Л- ~ (6.31) У2 = &1У1 + &2У2 + СЬи, где у = у2 — выход системы, а А < 0 — корень числителя передаточной функции, определенный в лемме 6.2 (qi и «2 — константы, определяе- мые параметрами системы). Для восстановления фазового вектора {yx^yi), а> следовательно, и исходного вектора х, достаточно построить наблюдатель для первой координаты у\, так как у% — известный выход систмы. В данных условиях можно использовать наблюдатель пониженного порядка У\ = *У\ + У- (6.32) При этом ошибка наблюдения е = у\ - у\ удовлетворяет уравнению е = Аг, которое, очевидно, является асимптотически устойчивым. Таким обра- зом имеет место Теорема 6.5. Пусть для билинейной системы х = Ах + ubhx на плоскости со скалярным выходом у = Сх и произвольной ограничен- ной функцией \u(t)\ uq выполнены следующие условия: 1) пара {С, А} — наблюдаема; 2) пара {А, Ь} — управляема; 3) СЪ ф 0; 4) det 9* ' п /0;
158 Гл. 6. Наблюдатели для билинейных систем 5) передаточная функция VK(s) = C(sE — А)-16 — минимально- фазовая. Тогда наблюдатель (6.32) экспоненциально точно решает задачу оценивания. Замечание 6.3. Стоит отметить, что степень устойчивости ука- занного наблюдателя не может выбираться по произволу, как в ранее описанных наблюдателях, а определяется параметрами системы. Вариант Б. Пусть теперь числитель передаточной функции VK(s) = “ негурвицев, тогда указанный выше наблюдатель пони- женного порядка использовать нельзя. Возможность оценивания фазового вектора системы значительно расширяется при использовании в наблюдателе нестационарной обрат- ной связи, зависящей от функции u(t). Покажем это. От исходных ГС1 Х2 переменных х = перейдем к переменным х = где у — измеряемый выход, а а = dx, где вектор d указан в лемме 6.2, в этом d С случае det Ф 0 и указанная замена координат невырождена. Примем для удобства следующие обозначения: Cbh СА = (21,22) • В этих обозначениях и с учетом свойств вектора d, указанных в лемме 6.2, уравнения рассматриваемой системы в новых координатах принимают вид ( д — Лет — у, ( у — (21 + иа\)а + (<?2 + иа?)у, (6.33) здесь Л — число из леммы 6.2. Для оценки фазового вектора используем полноразмерный наблю- датель f г = лг(634) 1 У = (ai + иа\)а + + иа2)у - к\(у - у), где выбор параметров обратной связи наблюдателя к\ и к% направим на обеспечение экспоненциальной устойчивости системы в отклонениях: £1 = Аб1 — &2ё2, £2 = a(u)ei - fci62, (6.35) где а(и) = а\ + иа\ , si—2-сг, а 62 = У — У — известный выход системы.
6.1. Асимптотические наблюдатели билинейных систем 159 Покажем, что такой выбор параметров к\ и возможен, более того, может обеспечить любую наперед заданную степень экспоненциальной устойчивости системы (6.35). Заметим, что в условиях строгой равномерной наблюдаемости функ- ция а(и) является знакопостоянной и, более того, О < а* |а(^)| а* - (6.36) Действительно, условие строгой равномерной по t наблюдаемости (6.13) инвариантно относительно замены переменных, поэтому в силу системы (6.33), где h = (ai,0,2) \ С = (0,1) )’ оно принимает вид det ио < СА C'bdet |qiI l«i Г Г С 1 h откуда непосредственно следует, что функция а(и) =а\и + а\ знакопо- стоянна, а* = |2i| — |ai|uo , а* = |ai| + |ai |uo. Очевидно, что для решения задачи наблюдения достаточно, чтобы £1 —> 0. При /с2 = const эта переменная удовлетворяет уравнению ё\ + Q2(ti)ei + ol\(u)s\ = 0, (6.37) где = к\ - А, а оц(и) = къа(и) — Хк\. Для анализа устойчивости этого уравнения используем функцию Ляпунова V = еТРе, где ет = (б1, £1), Р = ( 7 V 0. \ 7 Ф J Производная функции V в силу системы имеет вид V — sTD(u)e, где D(u\= ( -2ai7 ф- А27- Ai^ \ \ — А27 — Х\ф 2(7 — ф&2) ) Для того чтобы уравнение (6.37) было экспоненциально устойчиво с заданным показателем 2т; > 0, достаточно, чтобы при всех t 0 было выполнено матричное неравенство max(D(?i) + 2rjP) < 0, (6.38) которое в силу критерия Сильвестра и условия строгой равномерной наблюдаемости эквивалентно следующим неравенствам: max (—2ai7 + 2т]ф) < 0, min det(D(?z) + 2т]Р) > 0. (6.39) |u|^uo |u|^u0
160 Гл. 6. Наблюдатели для билинейных систем В дальнейшем полагаем 7 > 0, тогда из (6.39) имеем си (и) > = wi > 0. (6.40) Так как, [8], det(P(u) + 2г]Р) = 4у2 det Р + 27?(tr D tr Р — tr PD) 4- det D, (6.41) а непосредственной проверкой нетрудно убедиться, что detP = = 4а 1 det Р - (ф 4- а\ф - а2'у)2, a tr D tr Р - tr PD = -2q2 det P, то решение поставленной задачи дает следующий выбор: fc2 = &£ х х sgn(a(u)) = const (в силу знакопостоянства функции а(и)), к® > 0; а к\ = к[(и) такая, что при всех u(t) выполняется равенство ф 4- а\ф — а2У = 0, т. е. fclW = *±4^>l^2, ЙЛ + ^О. (6.42) фл + 7 При этом а2(^) = (Ф + С учетом последнего равенства и того, что detP > 0, условие (6.41) переходит в неравенство у2 - а2(и)т] 4- а\(и) = -(а\(и)(^ - фу) - (фу - 7т/2)) > О, 7 которое при 7 > фу > 0 эквивалентно неравенству ai(ti) > у——= W2. (6.43) 7 — фу Таким образом, при к\(и) из (6.42) для экспоненциальной устойчивости системы (6.37) с показателем 2у достаточно выполнения оценки а\(и) = к®|«(u)| — AA?i > max{wi, w2} = w. Последнее имеет место, если ,Oi / м 7 4- А27 ~ к9\а(и) —----- > w 4——-------— w — const. 21 v 71 Хф 4-7 Хф + у Пусть ф — \ ;7 > тах{т/, А} \ф > 72, тогда поставленную задачу решает выбор /и (и) из (6.42) и (6.44) (i*7 Таким образом, доказано Теорема 6.6. Пусть для билинейной системы х = Ах + ubhx на плоскости со скалярным выходом у = Сх выполнены следующие условия'. — тройка {С, А, Ъ} находится в общем положении, — имеет место условие (6.13) строгой равномерной по t наблю- даемости.
6.2. Асимптотические наблюдатели для п-мерных билинейных систем 161 Тогда найдется число к2 и функция к\(и) такие, что наблюда- тель ( X J (У = Ad - у - &2(з/ - у), I У = (Si + uai)a + (а2 + иа2)у - к\(у - у) экспоненциально точно решает задачу наблюдения с любым задан- ным показателем точности при любой равномерно ограниченной функции u(t) : |u(t)| 710- Замечание 6.4. Разумеется, наблюдатель, указанный в теореме 6.6, годится и для минимально-фазовых систем. 6.2. Асимптотические наблюдатели для некоторых классов n-мерных билинейных систем 6.2.1. Постановка задачи. Рассматривается задача построения асимптотического наблюдателя для билинейной управляемой системы с линейным выходом z . „ • \ х = Ах + иВх, L=с., (6Л5) где х е Rn, А, В е Rnxn, С е RZxn — известные параметры системы, u(f) — скалярный вход, a y(t) е Rz — измеряемый Z-мерный выход системы. Требуется построить оценку x(t) асимптотически (экспонен- циально) сходящуюся к неизвестному фазовому вектору x(t). Для билинейных систем трудность представляет не только постро- ение самого наблюдателя, но и получение условий наблюдаемости системы (6.45). В частности, если рассмотреть (6.45) как нелинейную аффинную по и систему, то, в соответствии с [84], условие восстанав- ливаемости имеет вид: (C^CQ^CQxQ^CQxQ^, ---)) = п, Qi = А или Qi = В, где conv (.) — выпуклая оболочка указанного множества векторов. Условие (6.46) означает, что любое начальное состоние т(0) восстанав- ливаемо по измерениям выхода y(t) при подходящем входе u(t). Однако при построении наблюдателей функция u(t), как правило, задана и не может быть изменена для решения задачи наблюдения. Нетрудно указать ситуацию, когда условие (6.46) выполнено, а система ненаблю- даема. Например, при наблюдаемости пары {С; А} dim (conv (С;С'А;СА2,... ,С'АП-1)) = п и условие (6.46) выполнено при любой матрице В, но при В = А и и = — 1 система 6.45) принимает вид х = 0, у = С'х(О) и, следовательно, по измерениям y(t) нельзя восстановить т(0). 6 С. К. Коровин, В. В. Фомичев
162 Гл. 6. Наблюдатели для билинейных систем Таким образом, условия (6.46) не являются равномерными отно- сительно и(£). Если функция u(t) известна, то систему (6.45) мож- но рассматривать как линейную систему с нестационарной матрицей А(Г} = А + u(t)B: ~ {х = A(t)x, у = Сх. Если функция u(t) достаточное число раз дифференцируема, то условие наблюдаемости имеет вид dim (Qi(t), <?2(0’ •• • >Qn(f)) = п, (6.47) <21 = С; Q^^+Q^t). at Если функция и(Г) не обладает требуемой гладкостью или неизвестна, указанное сведение к задаче линейного наблюдения невозможно. Целью данного параграфа является получение достаточных усло- вий равномерной по u(t) наблюдаемости системы (6.45) и построение асимптотических наблюдателей при этих условиях. Вообще говоря, независимость решения задачи от конкретного входа u(t) возможна лишь при вырожденной матрице В, поэтому специфика предлагаемых далее наблюдателей определяется различными видами вырождения матрицы В, что сводит рассматриваемую задачу к задаче наблюдения для линейной системы с неизвестным входом. 6.2.2. Системы со скалярным выходом и вырожденной матри- цей билинейности. Пусть в системе (6.45) со скалярным выходом (т. е. I = 1) матрица билинейности В имеет минимальный ранг, т. е. rank В — 1. Тогда В = bh, где Ь и h — известные вектор-столбец и вектор-строка, соответственно. В этом случае нетрудно получить достаточные условия равномерной по u(t) наблюдаемости системы. Действительно, если СЬ = О, САЬ = = 0,...,САп~2Ь = 0, то Qi(t) в (6.47) имеют следующий вид: Qi=C, Q2 = CA,..., Qn = CAn~', и, следовательно, все Qi не зависят от u(t), а система (6.45) равномерно относительно u(t) наблюдаема в случае, если dim (С,СА,... ,САп~[) = п, т. е. если пара {С, А} — наблюдаема. Таким образом, справедлива Теорема 6.7. Для равномерной по u(t) наблюдаемости системы (6.45) достаточно выполнения условий'. \)В = Ыг, Ь(Лп*[, heRlxn; 2) СЬ = О, САЬ = 0,..., САп~2Ь = 0; 3) пара {С, А} — наблюдаема.
6.2. Асимптотические наблюдатели для п-мерных билинейных систем 163 Укажем способ построения наблюдателя для таких систем. В этом случае билинейную систему (6.45) можно записать в стандартном для линейных систем виде {х = Ах + Ъй, У = Сх, где й = uhx — неизвестный скалярный входной сигнал. Пусть, кроме того, пара {А, Ь} — управляема. Тогда для системы (6.48) определена передаточная функция W(s) = C(sI — A)~lb = ^44, (6.49) (s) где /3rri(s) и an(s) — несократимые полиномы от s порядка тип, соответственно (0 < т < п). При условии 2) из теоремы 6.7 относительный порядок системы г = п — т максимален, т. е. г = п, т = 0. Тогда невырожденным преобразованием координат с матрицей Р система (6.45) приводится к каноническому виду с выделением нулевой динамики (размерность которой, в данном случае равна 0): ' Х\ = Х2, ^п—1 ~ ч хп — сцх^ ... (I'fiXfi -Н uhx, (6.50) где h = hP~{, otn(s) = det(s/ - A) = sn + ansn~{ + ... + щ, у = x\ (здесь для простоты за фазовым вектором сохранены старые обозначе- ния). Если вход u(f) известен и равномерно ограничен, т. е. \u(t)\ < uq при t 0, для построения оценки вектора x(t) используем наблюдатель ' ХХ=Х2- к\(х\ - у), : ~ (6.51) = хп- кп-\(х\ - у), < — Ц1 1 ... dfiX72 -f- uhx кп(х\ у). Тогда решение задачи наблюдения сводится к обеспечению устойчиво- сти системы в отклонениях е = х — х, описываемой уравнением ё = Ake 4- b(uhe — ае), (6.52) 6*
164 Гл. 6. Наблюдатели для билинейных систем где Характеристический полином матрицы Ak имеет вид ф(з) = det(sl — - Ak) = sn + k\sn~{ + ... + kn и определяется надлежащим выбором параметров к[,...,кп. Если положить ki = Kzqi, К = const > О, (6.53) где К — коэффициент усиления, a qi — коэффициенты задаваемого по произволу гурвицева полинома V>o(s) = sn + qisn~{ + qn = (s 4- Ai) x x...-(s + An), корни которого (—Xi) удовлетворяют соотношениям Ai = 1, Ai+i > Xi ,г=1,...,п — 1, тогда (—К Xi) — корни полинома ф(з). Имеет место Теорема 6.8 Пусть для системы (6.45) при С е Rlxn выполнены условия’. 1) rank В = 1, В = hb; 2) пара {А, Ь} управляема, пара {С, А} — наблюдаема’, 3) СЬ = О, САЬ = 0, ..., САп~2Ь = 0, САп~хЪ 0; 4) управление u(t) ограничено, т. е. |u(t)| ио при t^O. Тогда наблюдатель (6.51) с коэффициентами (6.53) при К > Ко, где Ко = const, зависит только от параметров исходной систе- мы (6.45) и ио, экспоненциально восстанавливает фазовый вектор системы. Для ошибки оценивания e(t) = x(t) — x(t) имеет место оценка \e(t)\ Q|e(0)|е~(к~, где Q = const — зависит от пара- метров системы и от К (вообще говоря, Q +оо при К —> +<х>). Доказательство. Для матричной экспоненты eAkt справедливо разложение г=0 Как было показано в главе 5, при указанном выше выборе коэффи- циентов ki имеют место оценки l«iWI (6-54) где Ni = const > 0 не зависят от коэффициента усиления К. При этом для фазового вектора e(t) системы в отклонениях (6.52) справед- лива оценка
6.2. Асимптотические наблюдатели для п-мерных билинейных систем 165 |e(t)| < |e^fcte(O)| + | r4u(r)dr\ < о t Q|e(O)\e~Kt + |e^fcT6|\u(t - т)| dr = о fn-1 = <2|e(O)|e-Kt + £ Ыт)114b|\u(t - r)\dr, о i=o где Q = const > 0, a и = uhe — ae. Прямой проверкой можно убедиться, что Qi — \АгкЬ\ >0 (i = 0,..., п - 1) так же не зависят от выбора коэффициента усиления К. Не ограничивая общности рассуждений положим К > 1, а входную функцию u(t) будем считать ограниченной, т.е. \u(t)\ ио . Тогда |e(t)| sj Q|e(0)|e~Kt + (М&) • (и0|7г| + |а|) e~KT\e(t -r)\dr = г=0 о t = Q'e~Kt 4- Kq e~K^t~r>>\e(T>)\ dr, о где Ко не зависит от К, a Q' = <J|e(O)|. Домножив обе части послед- него неравенства на eKt, получим t |e(t)|eKt Q' + KQ [ leMle^rfr, О откуда в силу леммы Гронуолла-Беллмана |e(t)\eKt Q' + Q'(eKot - 1) = Q'eKt>t. Окончательная оценка имеет вид |e(t)| Q'e-(K-Ko)t, откуда следует, что при К > Ко наблюдатель (6.51) решает задачу экс- поненциально точно с любой наперед заданной скоростью сходимости. Заметим, однако, что величина константы Q' > 0 зависит от К (вообще говоря Q' растет с ростом К). Теорема доказана. □ Если в системе (6.45) вход u(t) неизвестен, но ограничен, то данный подход применим лишь в асимптотике при —> ос.
166 Гл. 6. Наблюдатели для билинейных систем Предложенный подход распространяется на билинейные системы с вырожденной матрицей билинейности с произвольным относитель- ным порядком. Пусть, например, относительный порядок системы (6.48) равен г < п, т. е. СЬ = 0, САЬ = 0, саг~2ь = о, саг~'ь^о, а числитель передаточной функции W(з) — полином /?m(s) — гурвицев (при этом т = п — г). Тогда система (6.48) невырожденным преоб- разованием приводится к каноническому виду с выделением нулевой динамики: х' = А\\х' 4- Л12?/, 1У1 = У2, : (6.55) У1—1 ~ У г Уг = -а'х' - а"у 4- и(Ь'х’ + Ь"у), y = yi, где xf е Rn-r, у = (?/i,... ,уг)Т, а векторы а', а", Ь' и 6", соответству- ющих размерностей, определяются параметрами исходной системы, а Л12 = (0,... ,0,1)т. Кроме того, det(sl — Ац) = /3m(s), далее считаем, что матрица Ац — гурвицева. / х' А Требуемую экспоненциальную оценку фазового вектора I _ 1 дает следующий наблюдатель: х1 = А\\х' 4- А\2У, ' У\ =У2- Ы£1 - у)> : (6.56) Уг—1 = Уг - кг-\{у\ -у), k уг = -а’х' - а"у + и(Ь'х' 4- Ь”у) - kr(yi - у), где у = (уь... ,Уг)т• Его работоспособность основана на устойчивости системы в отклонениях: е' = Аце' f e’i = в2 — к\е\, : (6.57) । к'р—i е 1, , ёг = —кге\ — (а" 4- ub")e — (af 4- ubf)e',
6.2. Асимптотические наблюдатели для п-мерных билинейных систем 167 где в' = х' - х' е Rn-r, е = у - у € Rr. Как и ранее, выбирается устой- чивый полином V'o(s) = (« + Ai) • ... • (з + Лг) = sr + q\sr~x + ... 4- qr с корнями (—Аг), где Ai = 1, Аг-ы > Аг при г= l,...,r — 1, а коэффи- циенты наблюдателя ki полагаются в виде ki = Kzqi, К = const > 0. Тогда имеет место Теорема 6.9. Пусть для системы (6.45) выполнены условия 1), 2) и 4) из теоремы 6.8, относительный порядок системы равен г, полином /Зт(з) — гурвицев. Тогда существует константа Ко, зависящая от параметров системы и ио, такая, что при К > Ко наблюдатель (6.56) экспоненциально восстанавливает фазовый век- тор системы (6.45). Доказательство теоремы 6.9 аналогично доказательству тео- ремы 6.8 с тем отличием, что в оценке появляется дополнительное экспоненциально убывающее слагаемое, связанное с оценкой е'. □ Замечание 6.5. Если относительный порядок г < п, то степень устойчивости системы в отклонениях (6.57) не превышает степень устойчивости полинома /Зт(з), в отличие от случая г — п. Замечание 6.6. Без существенных изменений описанный метод оценивания фазового вектора переносится на системы с вырожденной матрицей билинейности вида В = bh + dC. В этом случае задачу решает наблюдатель вида (6.51) с дополнительным членом dy в правой части, т.е. _ _ _ х = Ах — к(Сх — у) + dy. 6.2.3. Системы с векторным выходом и вырожденной матрицей билинейности. Дополнительные возможности для синтеза наблюда- телей для билинейных систем появляются в случае векторного выхода, т.е. при I > 1, С е R/Xn, rank С = I. ___ _ Рассмотрим вырождение матрицы билинейности вида В = ВН, где В е Rnxm, Н е Rmxn, при условии т < I. При этих предположениях система (6.45) вновь может быть записана в виде линейной системы с неизвестным входом, аналогично (6.48), имеем х ~ Ах + Вй, (6.48') У = Сх, где й = иНх — неизвестный входной сигнал. Методы синтеза наблю- дателей для таких систем опираются на алгоритмы синтеза наблюдате- лей для линейных систем с неопределенностью, подробно изложенные в гл. 5, укажем только основные результаты. Для построения экспоненциального наблюдателя для системы (6.48') достаточно выполнения условий: 1°) rankCj= I, rank В — т, т < I; 2°) rankCB = т, СВ е R/xm; 3°) инвариантные нули системы (6.48') отсутствуют либо устойчивы.
168 Гл. 6. Наблюдатели для билинейных систем При этих условиях система (6.48') невырожденным преобразовани- ем координат приводится к виду х' = А\\х' + Л12 у', (6.58) у' = А2\х' + А22 у' + В'и, где у' — т координат из вектора выхода у, х' е — оставшаяся неизвестная часть фазового вектора; А^, В' — матрицы с постоянными коэффициентами соответствующих размерностей; det В' ± 0. Для системы (6.58) по оставшимся (/ — т) компонентам выхода у определяется новый выход у = Сх’. При этом для восстановления неиз- вестной части фазового вектора х' можно использовать наблюдатель вида ~ х = Апх' + А122/' - ЦСх' - у), (6.59) где матрица L е выбирается из условия гурвицевости матрицы Al = А\\ — LC. В главе 5 показано, что если у системы (6.48') нет инвариантных нулей, то пара {С, Ац} — наблюдаема, а при наличии устойчивых инвариантных нулей эта пара восстанавливаема. Поэтому при выполнении условия 3°) указанная матрица L сущест- вует. Имеет место Теорема 6.10. Пусть для системы (6.45) матрица билинейности В имеет вырождение вида В = ВН, В е Rnxm. Пусть, кроме того, выполнены условия 1°)-3°). Тогда наблюдатель (6.59) дает экспо- ненциальную оценку неизвестной части фазового вектора. Замечание 6.7. Подчеркнем, что в отличие от скалярного выхода, при построении описанного наблюдателя информация о входе u(f) не используется. Замечание 6.8. Предложенный подход обобщается на следующие классы билинейных систем. 1°. Системы с матрицей билинейности вида В = ВН + DC. 2°. На системы, в которых помимо билинейной имеется и линейная составляющая, т. е. на системы вида I х = Ах + иВх + Du', где D е Rnxg. Если функция и'(Г) известна, то при использовании модели {х = Ах + иВх + Du', у = Сх
6.2. Асимптотические наблюдатели для п-мерных билинейных систем 169 задача сводится к построению наблюдателя для системы в отклонениях е = х — х: f I ё = Ае 4- иВе, [ £ = Се, которая идентична системе (6.45). 3°. Аналогичным образом решается задача построения наблюдателя и для билинейной для системы с /с-мерным входом при вырождении матриц билинейности. Поясним это на примере системы f х = Ах + Zki=l UiBiX, (6.45„) I У = Сх, в которой все матрицы билинейности Bi имеют минимальный ранг (случай вырождения матриц билинейности с произвольными рангами может быть рассмотрен по описанной выше схеме) Bi = bihi, bi еГх1, hi eRlxn. Положив , j . / u\h\x \ ~B = (b\,... ,bk), U = ' , \ ukhkx / сведем систему (6.45") к стандартному виду (6.48'): {х = Ах 4- Вй, у = Сх. Наблюдатель системы строится по описанной выше схеме. 6.2.4. Системы с векторным выходом и известным входом. Рассмотрим систему (6.45) с произвольной (не обязательно вырожде- ной) матрицей билинейности. При достаточно большом I для наблю- даемости такой системы при заданном u(t) может оказаться достаточ- но выполнения условия dim Q2W) = Так как Q\(t) = С, и Q2(t) = С А 4- CBu(f), то такое достаточное условие наблюдаемости примет вид rank С _ С А 4- CBu(f) = п, t 0. (6.60) Заметим, что в этом условии не требуется непрерывности или диффе- ренцируемости функции u(t). Поскольку С е Rlxn, то условие (6.60) может выполняться только при I п/2. Рассмотрим систему (6.45) при этом условии. Так как rank С = I, то, не ограничивая общности рассуждений, считаем, что С — [Лхь 0/хг] .
170 Гл. 6. Наблюдатели для билинейных систем Рассмотрим невырожденное преобразование координат системы (6.45) где матрица Н е RrXn (г = п - I) выбирается из условия det Для этого достаточно, например, выбрать Н = [Н,1ГХГ] при любой Н е RrxZ. Понятно, что для решения исходной задачи достаточно получить оценку вектора z е Rr. Запишем матрицы А и В исходной системы (6.45) в блочных видах Ai А2 _ В\ В2 ~ [ Аз А4 J ’ L В4 ] ’ где Ai,Bi е R/xZ, а А4,В4 6 RrXr. Тогда уравнение для компоненты z примет вид Z = (Р[ + иР2)у + (jRl + uR2)z , где Рх= HAi + А3 - НА2Н - А4Н, Р2 = НВ{ 4- В3 - НВ2Н - В4Н, R\ = НА2 4- А4, R2 = НВ2 4- В4. При известном u(t) построим наблю- датель для z в виде z = (Р\ + иР2)у 4- (R\ + uR2)z. (6.61) При этом ошибка наблюдения е = z — z удовлетворяет уравнению ё = (Ri + uR2)e, и если R2 = 0, гурвицева, то е —> 0 экспоненциально. Выберем теперь матрицу Н из условий R2 — НВ2 4~ В4 = 0 ; (6.62) Ri = НА2 4- А4 = А', где А' — произвольная гурвицева матрица с заданной степенью устой- чивости. Решение уравнений (6.62) при заданных А4, В4 и А' существу- ет, [4], если rank [В2, А2] = rank В2 А2 —В4 —А4 4“ Af (6.63) Таким образом, имеет место Теорема 6.11. Пусть для системы (6.45) при некоторой гурвице- вой матрице А' выполнено условие (6.63). Тогда найдется матрица Н е RrxZ такая, что наблюдатель (6.61) восстанавливает фазовый вектор системы экспоненциально при любой известной функции входа и(Г).
6.2. Асимптотические наблюдатели для п-мерных билинейных систем 171 Замечание 6.9. Если I г, т.е. I п/2, а гапкВг = г, то су- ществует В, удовлетворяющее первому уравнению (6.62). При таком Н уравнение для ошибки наблюдения не зависит от управления u(t), однако устойчивость матрицы R\ = НА% + А4 не гарантирована и определяется параметрами системы и степенью произвола в выборе решения Н. Замечание 6.10. Для того, чтобы условие (6.63) было выполнено при любых А4, В4 и любой наперед заданной матрице А' (которая определяет асимптотику наблюдателя (6.61)), достаточно выполнения условия rank [В2, А2] = 2г. Учитывая, что [В2, А2] е R/x2r, для этого необходимо выполнение со- отношения I 2r = 2(п — I), т. е. Замечание 6.11. В рассматриваемом случае С ] - [ J| 0 С A -f- CBu(t) Ai -И uBi А2 WB2 и достаточное условие наблюдаемости принимает вид rank [А2 + UB2] ~ г — п — I. Имеет место следующее достаточное условие равномерной наблю- даемости, верна Теорема 6.12. Пусть rankC = Z, I 2(п - /) (т.е. I |п), а rank [А2, В2] = 2(п — I). Тогда Г с 1 rank А / х = п С А 4- CBu(t) для всех u(t), т. е. система (6.45) равномерно по u(t) наблюдаема. 6.2.5. Асимптотические наблюдатели на основе метода деком- позиции. Как и в п. 6.2.4., рассмотрим систему (6.45) с произвольной матрицей билинейности. Вновь, считая, что rank С = I (Се RZxn), перейдем к координатам Г2/1 _ Г С 1 _ Z ] [ Н ] Х’ где матрица Н е R(n-/)xn выбирается из условия невырожденности указанного перехода.
172 Гл. 6. Наблюдатели для билинейных систем Как и в п. 6.2.4. после преобразования координат система может быть записана в блочном виде у = А\у + A2z + и(В\у + B2z), , (6.64) z = А$у + A±z + и(В$у + В4г). Так как выход системы y(t) известен, то эту систему можно рассмат- ривать как линейную систему с неизвестным входом f = (uz) е и известным входом и' = (иу) е т. е. ’ У ’ z У z + В'и' + B"f, (6.65) где Г Л А = t L Аз А2 а4 _ В'=Р1. [в3 J В" (6.66) = А = - В2- .в4. ’ Рассмотрим случай, когда I > п - I, т. е. I > При этом условии систему (6.65) можно рассматривать как линейную стационарную ги- первыходную систему с неопределенным входом /(£), а, следовательно, для решения задачи наблюдения можно использовать методы синтеза наблюдателей для гипервыходных систем, подробно изложенные в гл. 5. Приведем основные результаты. Для построения наблюдателя в соответствии с теоремой 5.2 требу- ется, чтобы были выполнены следующие условия: i) пара {С, А} — наблюдаема, пара {А, В"} — управляема; ii) rank С = I, rank В" = г < Z, rank СВ" = г; iii) инвариантные нули, определяемые матрицей Розенброка Я(з) = si - А -В" ’ С О либо отсутствуют, либо лежат в С_. Учитывая блочную структуру матриц А и В" в системе (6.65), а также вид С = [ДхьО] для этой системы, указанные условия можно записать в явном виде. Рассмотрим подробнее условие i). В силу критерия наблюдаемости Розенброка (теорема 2.3) пара {С, А} наблюдаема тогда и только тогда, когда при всех s е С выполняется условие rank sin А С = rank " sli - Ai -А2 -Аз h sln-i - А4 = п. О Это условие, очевидно, выполняется тогда и только тогда, когда rank sln—i А4 -А2 = п — Z, (6.67)
6.2. Асимптотические наблюдатели для п-мерных билинейных систем 173 т.е. если наблюдаема пара {Лг, Ai}- Заметим, что А4 е RZx<n~z), поэто- му для выполнения условия (6.67) достаточно, чтобы было выполнено условие rank А4 = п — I. Перейдем к рассмотрению условия и). При указанной структуре матрицы С и при I > п - I первые два условия выполнены автоматиче- ски. Третье же, так как СВ" = В2, имеет вид rank [В2\ — rank ' В2' . В4. (6.68) Заметим, что если rankВ2 = п — I, то, в силу размерностей матриц В2 е R/X(n-/), В" е Rnx(n-0 и условия I > (n - Z), условие (6.68) имеет место при любой матрице В4. Рассмотрим, наконец, условие Ш), для этого запишем матрицу Ро- зенброка в блочном виде: " si - Ai -Аз I Я(5) = —А2 —В2 si — А4 —В4 О о Очевидно, что инвариантные нули этой матрицы совпадают с инвари- антными нулями матрицы W) = si — А4 —В4 —А2 —В2 Для того чтобы у исходной системы не было инвариантных нулей, требуется, чтобы при всех s е С выполнялось условие rank-R'(s) = rank si — А4 ~а2 -В4 - -в2 _ (6.69) = п — I + г . Из полученных условий следует Теорема 6.13. Пусть для билинейной системы (6.45) rank С = Z, I > Тогда невырожденным преобразованием координат матрицы А, В и С могут быть приведены к блочному виду (6.66). Пусть так же выполнены условия'. i) пара {А2М4} наблюдаема, а пара {А, В"} — управляема; ii) rank [В2] = rank В2 В4 = г (г < п — Z); Ш) для всех s е С (s е С_) имеет место условие (6.69). Тогда для системы (6.45) может быть построен экспоненциаль- ный наблюдатель с любой наперед заданной скоростью сходимости (со скоростью сходимости, определяемой инвариантными нулями матрицы Розенброка из условия (6.69)).
174 Гл. 6. Наблюдатели для билинейных систем Заключение. В главе 6 рассмотрена задача о синтезе наблюдателей для одного класса нелинейных систем — для билинейных систем. При этом рассмотрены условия наблюдаемости таких систем, получен ряд достаточных условий равномерной по управлению u(f) наблюдаемости таких систем (теоремы 6.1, 6.7). Подробно рассмотрен случай планарных билинейных систем, где предложены алгоритмы синтеза наблюдателей при различных условиях на параметры системы (теоремы 6.2-6.6). Для билинейных систем произвольной размерности рассмотре- ны различные случаи вырождения матрицы билинейности (теоре- мы 6.8-6.9), а так же рассмотрены алгоритмы синтеза наблюдателей для систем с векторным выходом (теоремы 6.10-6.13).
Глава 7 НАБЛЮДАТЕЛИ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ Теория наблюдателей для дискретных систем в значительной сте- пени подобна теории наблюдателей для непрерывных систем, хотя и отличается некоторой спецификой. Поэтому в этой главе лишь в краткой форме рассматриваются основные идеи и методы, подробно рассмотренные в предыдущих главах. 7.1. Математические модели дискретных объектов В теории дискретного наблюдения за состоянием стационарных линейных объектов имеют дело с регрессионными моделями Уп+к 4“ ЯпУп+к— 1 4“ •••4“ ОЛУк ~ bm+lUm+k 4“ ... 4“ b\Uk (7-1) либо с динамическими моделями в пространстве состояний хк+\ = Ахк 4- Вик, Ук = Схк, ( } где ик — вход объекта в момент времени к = 0,1,2,..., а ук — выход объекта; х — фазовый вектор или вектор состояния объекта из Rn; (ai,...,an), (bi,..., bm+i) или {А, В, С} — параметры объекта, ска- лярные или матричные соответственно. Здесь п — порядок объекта, г = п — т — относительный порядок объекта; для физически осуще- ствимых моделей, удовлетворяющих причинно-следственным отноше- ниям, всегда г 1. Модели (7.1) и (7.2), вообще говоря, не эквивалентны, так как из (7.1) не всегда следует (7.2). Каждая модель для заданной входной последовательности {uaJ и произвольного начального состояния (Уп-1,Уп-2, ••• ,Уо) ИЛИ Xq G Rn порождает единственное решение — дискретную последовательность выхода {ук}^ или состояния {^/с}о° соответственно.
176 Гл. 7. Наблюдатели для дискретных систем Дискретной последовательности {6c}q°, которая растет не быст- рее степени некоторого положительного числа Л, т. е. |&| к = 0,1,2,..., может быть поставлена в соответствие функция ком- плексной переменной £(z), z е С, с помощью Z-преобразования по- средством выражения c(z) = Z\£k] = Y^kZ~k При |z| > Л. О При замене z = eAs, Л = const > 0, Z-преобразование переходит в так называемое дискретное преобразование Лапласа. Из этой формулы прямо видно, что для получения обратного Z-1-преобразования, доста- точно разложить функцию £(z) по степеням z~k. Коэффициенты при этих степенях образуют искомую последовательность {^}о°- Посредством Z-преобразования рекуррентное уравнение, связыва- ющее вход и выход объекта, сводится к алгебраическому уравнению. Для уравнения (7.1) при нулевых начальных условиях получается соотношение Y(z) = W(z)U(z), (7.3) где У (г) = Z[yk], U(z) = Z[uk], a W(z) — передаточная функция объекта в виде отношения двух полиномов: 9 W(z) = =_____________________ /7 4^ 0m(z) (z^anz-i + ... + ai)’ Аналогично, передаточная функция определяется для объекта, задан- ного в пространстве состояний, из (7.2) при нулевом начальном условии xq = 0 имеем W(z) = C(zE-А)'1 В. (7.5) Для так называемого скалярного объекта выход у и вход и объ- екта — скаляры, а его передаточная функция — скалярная функция комплексной переменной z. В противном случае W(z) — матричная передаточная функция. Для скалярного объекта формула (7.3) позволяет установить про- стой переход от (7.1) к (7.2). Действительно, из равенства W(z) = а(г) и уравнения (7.3) можно получить соотношение /3(г) a(z) ’ *) Ниже, там где это непринципиально, нижний индекс полинома, указыва- ющий его степень, может опускаться.
7.1. Математические модели дискретных объектов 177 используя которое можно ввести скалярную переменную х\. по следу- ющей формуле: X‘(z) = K(z) _ £(z) £(*) a(z) ’ здесь Xl(z) = Z • Последнее эквивалентно двум следующим урав- нениям: a(z)Xl(z) = U(z), Y(z)=(3(z)X'(z). (7-6) Теперь, при помощи обратного преобразования Z ', от (7.6) пере- ходят сначала к регрессионным уравнениям: ^+fc+fln^+fc + ... + ai4 = Mfc, yk = bm+ixxm+k +... + biXlk, а затем, с помощью новых переменных состояния х\ х2, х3, хп, связанных следующими соотношениями: переходят к уравнениям в пространстве состояний: п ж2+1 = -^aiX^ + uk, ni=i (7-9) yk = Ьгхк, bi = 0 для i > т + 1. i=\ Использование векторж э-матричных обозначений - 0 1 0 . .. 0 - -0- 0 0 1 0 0 А = , ь = 0 0 0 . 1 0 . -ai -0,2 -а3 . - . 1. С = [61, &2, ... ,bm+l,0, ... ,0] делает уравнения (7.8), (7.9) по форме идентичными уравнениям (7.2). По этой причине имеет смысл рассматривать в дальнейшем модели, заданные в пространстве состояния.
178 Гл. 7. Наблюдатели для дискретных систем (NS) 7.2. Дискретные наблюдаемость и наблюдатели. Канонические формы Основному рассмотрению предпошлем следующее Определение 7.1. Динамическая дискретная система (рекуррент- ное уравнение) xk+\ = х е Rn, ук = h(xk), yd1, к = 0,1,2,... называется: — наблюдаемой, если конечная выходная последовательность {уо, у\,..., yN-\}, N п, позволяет восстановить начальное со- стояние хо системы; — наблюдаемой равномерно по к 0, если восстановление возмож- но по конечной последовательности {ук, yk+i,..., ^+(yv-i)} при любом к. Рассмотрим скалярную линейную стационарную So-систему с нуле- вым входом j — Ахк, (S°) ) , П 1 Q I yk = cxk, к = 0, 1,2,... , и запишем следующие очевидные соотношения: Уо = CXQ, У\ = сАхь, yN-\ = cAN~xx0, которые образуют систему линейных алгебраических уравнений отно- сительно неизвестного вектора х$ начальных условий. В соответствии с теоремой Кели-Гамильтона можно ограничиться первыми п соотноше- ниями, т. е. N = п. Тогда разрешимость полученной системы уравнений связана с обратимостью матрицы Х(с,А) = (7.Ю) сАп~' которую называют матрицей наблюдаемости. Таким образом, So-система наблюдаема если и только если rank А/” (с, А) = п. (7.Н)
7.2. Дискретные наблюдаемость и наблюдатели 179 Равенство (7.11) определяет критерий наблюдаемости в форме ран- гового условия Калмана-Красовского. Этот результат верен и для стандартной S-системы Г xk+i = Axk + buk, ( } I Ук=сик, к = Ш- , при известном входе ик. Для S-систем с векторными наблюдениями, т. е. когда у е и I > ( £k+i = Ахк + Ьик, 1 Ук = Сик при дополнительном естественном предположении rank С = I, критерий наблюдаемости принимает следующий вид: rank Af (С, А) = rank (7-12) САп~1 Невырожденная замена координат £ = Мх, det М 7^ О, сохраняет наблюдаемость в силу того, что N (СМ~1,МАМ~1) = М(С, А)(М~1), где J\f(CM 1,МАМ *) — матрица наблюдаемости для преобразован- ной системы &+1 = МАМ~^к, ук = СМ-^к. Как и в непрерывном случае для наблюдаемой пары {С, А} опре- делен индекс наблюдаемости и как минимальное число, при котором выполнено ранговое условие rank J\f„ (С, А) — rank С СА САУ~1 Для и справедлива оценка и п — I + 1, при I = 1 имеет место равен- ство и = п. Для дискретных линейных стационарных наблюдаемых систем име- ют место те же канонические формы наблюдаемости, что и для
180 Гл. 7. Наблюдатели для дискретных систем непрерывных систем (подробно описанные в гл. 2). В частности, ска- лярные S'-системы невырожденным преобразованием координат могут быть преобразованы к первой канонической форме наблюдаемости {с, А, Ь}: /010 с = (1,0,... ,0). А = 0 0 1 \ -ai -а2 -аз 0 0 1 сАп 1Ь ) либо ко второй канонической форме наблюдаемости {с, А, Ь} : Наблюдаемость канонических пар {с, Л} проверяется непосредственно. Для векторных S-систем также имеют место первая, вторая канони- ческие формы наблюдаемости и каноническая форма Люенбергера (см. гл. 2). Методы приведения систем к каноническим формам полностью совпадают с соответствующими методами для непрерывных систем, подробности опускаем. По аналогии с непрерывным случаем вводится понятие обнаружи- ваемое™ Определение 7.2. Динамическая дискретная система ( Zfc+1 = f(xk), х G Rn, (WS) <! ( Уь = h(xk), У 6 R, к = 0,1,2,... . называется обнаруживаемой, если ненаблюдаемая (скрытая) динамика асимптотически устойчива. Рассмотрим подробнее линейную стационарную S-систему ( = Ахк + Вик, [ ук = Схк, к = 0,1,2,... . Пусть пара {С, Д} ненаблюдаема (не полностью наблюдаема). В этом случае имеет место условие rank Л/” (С, А) = q п.
7.2. Дискретные наблюдаемость и наблюдатели 181 Тогда преобразованием подобия М (det М / 0) е = Мх, S-система преобразуется к набору подсистем S1 и S2, где (S1) : £‘+1 = Аи^ + ЯЧ. (S'2) : Cfc+i = A2iCfc + A^k + B2uk, Ук = c1^, здесь вектор e R9, вектор £2 € Rn~9, матрицы Ли, Л21, Л22 ,Bl, В2 и С1 имеют соответствующие размерности, пара {С1,Ли} наблюдаема. Таким образом, ненаблюдаемые переменные £2 в результате преоб- разования выделены в 52-подсистему «скрытых» движений. Перемен- ные £2 могут зависеть от наблюдаемых переменных и от входа и. Передаточная функция системы может быть записана через исход- ные уравнения (S): W(z) = c(zE - A)~xb= а(г) либо через уравнения подсистем (S1), (S2): ^(z) = c\zE - An Г1 ь~х = ^4. а \z) Выражение Wi(s) следует из VT(s) после сокращения (n — q) общих нулей полиномов (3(z) и a(z). Такое вырождение позволяет понизить порядок S-системы до q. Физически это сокращение нулей и полюсов передаточной функции оправдано, если они устойчивы, т.е. лежат в единичном круге. Обнаруживаемость предполагает гурвицевость мат- рицы Л22- Наряду с задачей наблюдения для дискретных систем рассмотрим задачу стабилизации. Стабилизируемость — одно из основных свойств управляемого объекта, имеет место Определение 7.3 Система (NS) I Xk+1 = f(Xk’Uk>’ Ж0)=0- J I Ук = Цхк), к = 0,1,2,..., где /г(-) и /(•>•) — некоторые функции, определенные на Rn, называется стабилизируемой 9 в нуле Rn, если существует обратная связь ик = и[ук,Хк\ 9 Здесь и далее система стабилизируется в нуле и это может специально не оговариваться.
182 Гл. 7. Наблюдатели для дискретных систем такая, что замкнутая система управления ( хк+\ = f(xk,u[yk,xk]), [ Ук = h(xk) асимптотически устойчива в нуле. Здесь и далее под символом и[у, ж] понимается обратная связь, зави- сящая от каждой переменной или их значений в предыдущие моменты времени. Эта зависимость может быть статической или динамической, соответственно, построенная обратная связь является статической или динамической. В частности, S'-система ( xk-^i = Ахк + Ьик, I Ук = схк стабилизируема в нуле по состоянию, если при обратной связи ик = -qxk, q = (Qi,...,Qn) замкнутая система Xfc+i = (Л - bq)xk асимптотически устойчива. Иначе говоря, матрица Aq = А — bq — гурвицева. Достаточным условием стабилизируемости служит условие управ- ляемости системы объекта (NS), которое вводит Определение 7.4 Система /дгт f Хк^ = f(Xk’Uk), [ Ук = h(xk), управляема по состоянию в Rn, если для любой пары точек х2 из существует последовательность входов uq, гц, ..., и^-i, переводящая систему (NS) из состояния х{ в состояние х2 за конечное время N. Для анализа управляемости по состоянию S-системы запишем сле- дующую цепь очевидных соотношений: х\ = Ах$ 4- Ьи$, Х2 = Л2хо 4- AbuQ 4- Ьщ, xn = ANxo 4- AN~{buo + ... 4- buN-i.
7.2. Дискретные наблюдаемость и наблюдатели 183 Положив xq = хх, х^ = х2, получим из последних соотношений урав- нение / uq х2 = ANхх + (AN~xb, AN~2,... ,Ь) \ w-i 7 которое должно быть разрешимо относительно неизвестных uq, щ, ..., un, для любых х1 и х2. Для этого векторы AN~[b, AN~2b, ..., b должны образовывать базис в Rn. Таким образом, S'-система управляема если и только если rank /С(А, 6) = rank(b, Ab,..., An~xb) = п. (7.13) Это условие управляемости называют ранговым критерием Калма- на-Красовского. При его выполнении пару {А, Ь} называют управляе- мой. Если линейная система является векторной, т. е. и е Rm, у е Rz, {Xk+\ = Axk + Buk, Ук ~ Cxk, где матрица В имеет максимальный ранг т, то критерий Калма- на-Красовского отличается от (7.13) тем, что матрица 1С(А, В) являет- ся прямоугольной п х [т(п — т + 1)]-матрицей, но, как и прежде, rank /С( А, В) = rank (В, АВ,..., Ап~тВ) = п. Для управляемой пары {А, В} определен индекс управляемости р как минимальное число, для которого rank /СДА, В) = rank (В, АВ,..., Ам-1 В) = п. При этом р < п — т + 1, а если т = 1, то р = п. Если пара {А, В} неуправляема (не полностью управляема), rank /С(А, В) = р < п; тогда существует преобразование подобия е = Q2 J - мх,
184 Гл. 7. Наблюдатели для дискретных систем которое расщепляет S-систему на две подсистемы Si и со следую- щими уравнениями движения: (5i) ek+i=Au& (s2) ek+2=A2lek+A22ek+B2uk, ^(^.С2)^' ), где (п - р) — размерность системы Si и р — размерность системы S2; Ац, А21, А22, В2, С1, С2 — матрицы соответствующих размерностей, причем пара {А<22,В2} управляема. Из этих уравнений видно, что управление и не оказывает никакого влияния на компоненту вектора £. Следовательно, S-система ста- билизируема если и только если матрица Ац — гурвицева. Другими словами, не поддающаяся управлению часть динамической системы должна быть асимптотически устойчивой. Таким образом, в произвольной S-системе можно выделить следу- ющие подсистемы: (i) управляемую и наблюдаемую подсистему (S1); (ii) управляемую, но ненаблюдаемую подсистему (S2); (Ш) неуправляемую, но наблюдаемую подсистему (S3); (iv) ненаблюдаемую и неуправляемую подсистему (S4). Такое разложение S-системы называется калмановской декомпози- цией', S1-система соответствует так называемой минимальной реализа- ции S-системы, которая имеет физический смысл, когда собственные движения S3- и 54-подсистем асимптотически устойчивы. Следую- щие уравнения движения соответствуют калмановской декомпозиции S-системы: (S1) С1 =Auek + A^k + Bxuk, (52) С2 — ^21Cfc + ^22^fc + ^23^ + ^24Cfc + B2Uk, (s3) a+i=AS3a, (s4) ek+x=A43ek+Ai4& / 6 \ y = (C',0,C3,Q) •_ =C1(1+C3(3, \6/ где e при этом тц min(p, g); щ + = p', n\ + пз = g; n\ + + П2 + пз 4- П4 = п. Ясно, что случаю общего положения отвечает только минимальная реализация S-системы.
7.2. Дискретные наблюдаемость и наблюдатели 185 Управляемость и наблюдательность, стабилизируемость и обнару- живаемое^ дуально связаны. Именно, из выражений для матриц управляемости и наблюдаемости S'-системы непосредственно следуют тождества /С(А,В) =ЛГ (ВТ,АТ), ШС,А] = К7 (Лт,СТ). Матрицы слева связаны с системой (5) xfc+i = Ахк + Вик, у к = Схк, а матрицы справа — с 5т-системой ( &+1 = Лт& + CT£fc> ( [tk = B^k, называемой дуальной системой. Указанные тождества вводят так на- зываемые отношения дуальности, из которых, в частности, следуют два важных вывода: 1°. S-система управляема (наблюдаема) тогда и только тогда, когда ST-система наблюдаема (управляема); 2°. S-система стабилизируема (идентифицируема) тогда и только то- гда, когда ST-система обнаруживаема (стабилизируема). Понятия наблюдаемости и обнаруживаемое™ полезны при оценке состояния динамической системы по измерениям выхода системы. Понятие дискретного наблюдателя вводит Определение 7.5. Динамическая система Xk+i = F[xk,yk] называется асимптотическим наблюдателем TVS-системы вида хк+1 = f(xk), Ук = h(xk), А: = О, 1,2,..., если lim \\хк - 5?/с|| = 0. /с—>ос Если существует число к* такое, что Хк = хк для всех к к* то наблюдатель называется финитным. Для S-систем проблема оценки фазового вектора решается следую- щим линейным наблюдателем: Хк+\ = Ахк - L(Cxk - Ук) = АА + LCyk, (7.14) где L — (п х /)-матрица обратной связи наблюдателя.
186 Гл. 7. Наблюдатели для дискретных систем Ошибка оценивания в = х — х удовлетворяет следующему уравне- нию: Sfc+i = Аьвк, и наблюдатель решает проблему оценивания асимптотически, если мат- рица Al — гурвицева, либо финитно, если Al нильпотентна. Как было показано в гл. 2, при наблюдаемой паре {С, А} спектр наблюдателя spec{AzJ назначается произвольно. Если пара {С, Л} обнаруживаема, то часть спектра наблюдателя врес{Ль} фиксирована и совпадает со спектром ненаблюдаемой подсистемы, а остаток спектра spec{AzJ на- значается произвольно (конечно, распределение спектра относительно действительной оси должно быть симметричным). Размерность наблюдателя может быть уменьшена на размерность выхода, если rank С = I. Такие наблюдатели пониженного порядка традиционно называются наблюдателями Люенбергера. Основанием для этого служит следующее утверждение. Лемма 7.1 Пусть в векторной дискретной So-системе ( хк+\ = Ахк, \ук = Схк, к = 0,1,..., х е Rn, пара {С, Л} — наблюдаема, тогда неособым преобразованием эта система может быть приведена к следующему виду'. ( 4+1= Л14 + А\2ук, \ Ук+1 = Ацх'к +А22Ук, k = 0,1,..., х' е ;, уе№1, при котором (п - Г) х (п — Z) матрица Ли имеет любой наперед заданный спектр. Конструктивное доказательство этой леммы может быть получено с помощью метода псевдовходов (см. §5.3), здесь оно не приводятся. Возможно также обобщение этой леммы на случай обнаруживаемости пары {С, Л}. В условиях леммы 7.1 наблюдатели, решающие задачу наблюдения для So-систем, даются следующими уравнениями: 4+1 = Аих'к + А^Ук, (7.16) хк = м(Хк\, (7.16') \Ук J х' е Rn-/, а М — матрица преобразования, о котором говорится в лемме 7.1. Ошибка оценивания е — х — хг подчинена уравнению = ЛИ£ь к -0,1,2,... , (7.17) и при надлежащем выборе матрицы преобразования, о которой идет речь в условиях леммы, ошибка вк асимптотически или финитно ухо- дит в ноль.
7.2, Дискретные наблюдаемость и наблюдатели 187 Заметим, что уравнения наблюдателя (7.16)—(7.16') верны и для случая обнаруживаемости пары {С, А}, отличие состоит лишь в том, что в спектре матрицы Ац имеется фиксированная гурвицева компо- нента скрытой динамики. Тем самым показано, что размерность наблюдателя, восстанавлива- ющего полный фазовый вектор, не может быть меньше числа г = п — I, где I — размерность выхода. Заметим, что для векторной системы наблюдатель любой проме- жуточной размерности выше (n — I) может быть построен по той же схеме, основанием для этого служит Лемма 7.2. Пусть в векторной дискретной So-системе !хк+\ = Аж/-, k = 0,1,..., yk = Cxk, X e Rn, у e Rz, rankC = Z, а пара {С, A} — наблюдаема. Тогда для любого числа р, 1 < р < I найдется р-мерный выход ур = Сру G и такое преобра- ( х' \ зование подобия I р 1 = Мрх, что (п — р) х (п — р) матрица Ац в преобразованной системе: Г 4+1 =А1<4 + 4^4- | 4+1=а214 + а224, fc = o,i,..., — гурвицева и имеет наперед заданный спектр (здесь х' G Rn-p). В этом случае задачу наблюдения решает наблюдатель ' 4+1 = 4114 + 4124, xk = M~x ( Хкр } Р \Ук J размерности (п — р). Полезно отметить, что при условии rank С = I для системы (7.18) определен так же (Z — р)-мерный выход yl~p = Ci~px' (он определяется по выходу у е R* и ур е Rp). Тогда уравнение (7.18) можно переписать в виде уравнения состояния с известным внешним сигналом ур и новым выходом у1~р, т. е. в виде совокупности следующих уравнений: f 4+1 = ^п4+ 41г4’ fc = o,i,..., I 7/l~P — C1 l Ук —^n-pXk. Здесь важно подчеркнуть, что в условиях леммы 7.2 пара матриц {С/_р,Ац} наблюдаема. Это факт будет использоваться при синтезе наблюдателей в условиях неопределенности.
188 Гл. 7. Наблюдатели для дискретных систем Заметим, что если имеют дело с управляемой S'-системой, т.е. с системой, имеющий вход, то для нее вместо (7.14) наблюдатель берут в виде _ _ _ £fc+i = Axk - L(Cxk - yk) + Buk. (7.20) 7.3. Метод псевдовходов в задаче синтеза функциональных наблюдателей Рассматривается задача оценивания р-мерного линейного функцио- нала а = Fx (7.21) по измерениям /-мерного выхода (Z < п) Ук = Схк (7.22) стационарной дискретной системы Tfc+i = Axkl £ = 0,1,2,..., (7.23) с помощью наблюдателя минимально возможного порядка. Здесь все матрицы предполагаются известными, F и С — матрицы полного ранга, пары {С, А} и {F, А} наблюдаемы. 7.3.1. Скалярная система, скалярный функционал. Как и в главе 4, сначала разберем случай скалярного функционала и скалярного наблюдателя, т.е. когда I =р = 1, и для решения зада- чи применим метод псевдовходов. Полученное означает, что наряду с (7.23), рассматривается также система хк+\ = Ахк + Lvk, к = 0, 1,2,... , (7.24) с «псевдовходом» vk и с вектором входа L. Последнее является лишь удобным методическим приемом и позволяет естественным образом ввести две передаточные функции: Wy(z) = C(zI-A)~lL=^, (7.25) Wa(z) = F(zI-A)~lL = ^, «(г) с одинаковыми полиномами в знаменателе, совпадающими с характе- ристическим полиномом матрицы А, т. е. а(г) = det(^7 — А) = zn + anzn~{ + ... + а\, и, вообще говоря, различными полиномами в числителе (7.25) (есте- ственно полагать, что С F). В силу сделанных предположений, полиномы /3y(z), /3a(z) и a(z) взаимнопросты, того же можно добиться и для полиномов /3y(z) и /?а(г) надлежащим выбором вектора L.
7.3. Метод псевдовходов в задаче синтеза 189 В этих условиях передаточная функция Wb(z) искомого наблюда- теля а = WQ(z)y (7.26) погружается в семейство передаточных функций, заданных отношени- ем полиномов /3a(z) и /3y(z), т.е. W = (7.27) Py\z) Физически реализуемые передаточные функции функциональных на- блюдателей образуют в этом семействе передаточных функций подмно- жество, выделяемое условиями deg/3(T(z) <Jdeg/3y(z), (/.2о) /3y(z) — гурвицев. Так как порядок искомого наблюдателя определен числом deg (3y(z), то в подмножестве (7.28) предстоит выделить передаточные функции (7.27), для которых степень deg/3y(z) минимальна. Подчеркнем, что проблема минимизации степени полинома deg/?2/(z) решается при степенном ограничении (7.28) и является, тем самым, неклассической проблемой оптимизации. Сформулируем эту проблему в более привычной алгебраической форме. Для этого заметим, что полиномы (3a(z) и /3y(z) имеют степень не выше (п - 1) и могут быть записаны с использованием марковских параметров триплетов {F,A,L} и {С, А, L}, соответственно, следую- щими выражениями: ДДг) = zn-\FL) + zn~2(FAL + anFL) + + zn-\FA2L + anFAL + an_lFL) + ... (7.29) /3y(z) = zn~'(CL) + zn~2(CAL + anCL) + + zn~3(CA2L + anCAL + an^CL) + ... где ai,a2,...,an — параметры характеристического полинома a(z) = zn + anzn~l + ... + aj. Пусть x — искомая минимальная степень гурвицева полинома /3y(z), доставляющая решение рассматриваемой задачи, тогда, очевид- но, одновременно должны выполнятся следующие равенства: CL = CAL = ... = CAn-*-2L = О, „ (7-30) FL = FAL = ... = FAn-”-2L = 0, причем CA^^L^Q. (7.31)
190 Гл. 7. Наблюдатели для дискретных систем Таким образом, полином /3y(z), отвечающий за устойчивость на- блюдателя, дается уравнением /3*(z) = z*(CAn-”~'L)+z*-\CAn-*L+anCAn-*-lL) + ... , (7.32) и, без ущерба общности рассмотрения, можно положить СЛп-х-!£ = । Тогда вместо гурвицевости полинома (3y(z) можно говорить о гур- вицевости столбца (7.33) состоящего из коэффициентов полинома /3^(г) (здесь L* е Rx+1, Lr е еГ). Определение условий разрешимости данной задачи и синтез наблю- дателя удобно производить в специальном базисе при минимальном числе свободных параметров. Таким естественным базисом является базис, в котором пара {С, А} имеет каноническую форму наблюдаемо- сти, т.е. с = (0,... ,0,1), А = / 0 ... 0 -ai \ 1 ... 0 —CL2 \ о ... 1 —ап / и пусть в указанном базисе векторы F и L имеют следующие компо- ненты: F=(/i,/2,...,/„), L = GiJ2,...Jn)T. Тогда из первых равенств (7.30) следует, что Zn ln—l ••• 0, т. е. вектор L имеет следующую структуру: ( \ а совокупность (п — я — 1) вторых равенств в (7.30) эквивалентна следующей системе линейных уравнений: / /1 \ h / /1 h h /з /х \ /х+1 ( fx+i /х+2 \ fn—>c—\ fn-2 / которая, конечно, эквивалентна системе (4.18) в гл. 4.
7.3. Метод псевдовходов в задаче синтеза 191 Так как компоненты вектора (Zi, I2,... являются параметрами полинома (3y(z), т. е. то наличие при некотором х гурвицева решения системы (7.34) являет- ся необходимым и достаточным условием существования функциональ- ного наблюдателя порядка х. При этом в терминах Z-преобразования уравнение такого наблюдателя, формирующего оценку а функционала ст, имеет следующий вид: а = , .у, (7.35) а ошибки оценивания е = а — а удовлетворяют, соответственно, следующему уравнению: ^(z)e = О, что и решает задачу наблюдения, так как полином /3y(z) — гурвицев. Открытым остался вопрос о минимальном порядке х* функцио- нального наблюдателя (7.35). Вычисление х* возможно в рамках сле- дующей итерационной процедуры: — сначала из уравнения rank Н„ — rank {Нх, h„} (7.36) находится минимальное число хт, при котором разрешима си- стема (7.34); если при данном хт среди решений (7.34) найдется гурвицев вектор L*m, X* = Хт, то задача решена; — в противном случае, следует увеличить хт на единицу и так как при любом х > хт условие (7.36) выполнено, то следует повто- рить процедуру. После конечного числа итераций будет найден искомый минимальный порядок х* функционального наблюдате- ля; — синтезировать искомый наблюдатель по формуле Тем самым доказана следующая Теорема 7.1. Для наблюдаемой п-мерной системы со скалярным выходом xk+\=Axk, yk = Cxk, к = 0,1,2,... ,
192 Гл. 7. Наблюдатели для дискретных систем и линейного скалярного функционала а = Fx, такого, что F \[С и пара {F, Л} — наблюдаемы, существует функ- циональный наблюдатель порядка х вида (7.35), восстанавливаю- щий функционал а, тогда и только тогда, когда система линейных уравнений, заданная в каноническом базисе наблюдаемости соот- ношением (7.34): Н„Г = -h„, / I* \ имеет решение IF такое, что вектор IF = I ) — гурвицев. Замечание 7.1. Требование общности положения пар {С, А} и {F, А} не является необходимым, для решения задачи достаточно свойства обнаруживаемости этих пар. 7.3.2. Скалярные наблюдения, векторный функционал. Син- тез функционального наблюдателя наименьшего порядка методом псев- довходов для системы (7.22) и (7.23) без существенных изменений переносится на p-мерные векторные функционалы а — Fx, где, конечно, уместно предположить, что rankF = р, (7.37) Для измеряемого выхода системы уь и каждой г-й компоненты ог = = Fzx (i = 1,2,... ,р) функционала а определим передаточные функции от псевдовхода v (см. (7.24)) к соответствующему выходу у или аг, т. е. X = Fi(zl - A)-'Lv = i=\,2,...,p, (7.38) a^z) y = C(zI-A)-lLv=^F-v. (7.39) a\z) Это позволяет определить в общей форме передаточную векторную функцию наблюдателя, т.е. передаточные функции от у к каждой компоненте функционала, в следующем виде: = г=1-2,...,р. (7.40) Py\z) Если теперь вектором псевдовхода L распорядиться так, что будут обеспечены следующие условия: {deg (Зга deg f3y для всех i = 1,2,..., р, (7.41) (3y(z) — гурвицев,
7.3. Метод псевдовходов в задаче синтеза 193 то задачу наблюдения решает наблюдатель с векторной передаточной функцией W(z) = 1 Ру И / ш \ \ /%& / т. е. оценка а функционала а удовлетворяет уравнению / ш \ (7-42) и при этом, как видно из (7.42), степень наблюдателя равна deg/J^z). Среди всех наблюдателей, удовлетворяющих условиям (7.41), требуется найти наблюдатель минимального порядка, как и в скалярном случае, для этого используется итерационная процедура. Для описания ее введем следующее обозначения, пусть х = deg/^(z), это означает, что CL = CAL = ...= CAn~*~2L = О, САП-Х-1L ± 0; (7.43) и, кроме этого, для каждого г — 1,2, ...,р имеют место следующие равенства: FZL = F1 AL = ... = = 0. (7.44) Как и в предыдущем пункте, при решении систем уравнений (7.43) и (7.44) будем рассматривать исходную систему в каноническом базисе наблюдаемости, тогда, как и ранее, вводятся следующие векторы и матрицы: / Г* \ LT= ( 0 j =(ZiJ2,...J>f>l,0,...,0)T; где /J (j = 1,...,п) компоненты г-й строки F1 функционала а = Fx в каноническом базисе. Определим также составные матрицу и 7 С. К. Коровин, В. В. Фомичев
194 Гл. 7. Наблюдатели для дискретных систем вектор следующими выражениями: Ях = .. Ьц tr! X X - 1 , hyc — —• X сч X . . , । (7.45) Нр L х J -hl . В этих терминах справедливо следующее утверждение, распростра- няющие теорему 7.1 на случай векторного функционала. Теорема 7.2. Для наблюдаемой п-мерной системы %k+\ = Ая>+1, к = 0, 1,... , со скалярным выходом ук = Схк и линейным р-мерным векторным функционалом а = Fx 7 F \ таким, что rankF = p, rank I j = pF а пара {F, A} — наблю- даема; существует функциональный наблюдатель порядка х вида (7.42), восстанавливающий функционал сг, тогда и только тогда, когда в каноническом базисе наблюдаемости линейное уравнение Н„Г = -h„, (7.46) имеет решение V* = •••, 1ж)Т такое, что вектор I/* = I j j — гурвицев. Алгоритм вычисления минимального х, описанный в предыдущем пункте годится и для рассматриваемого случая. Замечание 7.2. Требование наблюдаемости пар {С, А} и {F, А} может быть понижено до обнаруживаемости. Скалярный функционал, векторное наблюдение. Ограничим- ся описанием основных идей синтеза функционального наблюдателя в этом случае, детали опустим, так как они могут быть легко восста- новлены по материалам предыдущего изложения. Итак, рассматриваем n-мерную систему Xk+i = Ахк, к = 0, 1,2,... , с векторным Z-мерным выходом у к = Схк, который следует использовать для оценивания скалярного функцио- нала сг = Fx, F е Rn.
7.3. Метод псевдовходов в задаче синтеза 195 Предполагаем, что rank С = Z, пара {С, А} — наблюдаема и и — ее индекс наблюдаемости, т. е. и — минимальное число, такое, При этих предположениях рассматриваемая система неособыми преоб- разованиями состояния и выхода: х = Рх, у = Му, det Р 0, det М ф О, приводится к канонической форме Люенбергера-Исидори, состоящей из совокупности I подсистем со скалярным выходами уг, следующего вида: i 4+1 = Аа 4 + 52 а^ук' j=l,i=£j Угк = cixk’ & = 0,1,2,... , (7-47) где i — 1,2, ...,Z; хг G RPi, / х1 \ / у1 х = : ,у= : ; \ х1 / \ у1 ) Ci = (0,...,0,1), max i При таком преобразовании в новом базисе функционал а = Fx можно представить в виде суммы /-функционалов вида сгг = Ргхг, т.е. i i = (7-4S) i=\ г=1 Нетрудно убедится, что если пара {F,A} наблюдаема (а это мы будем предполагать), таковыми же будут и все пары {F\ ...л- Это означает, что рассматриваемая задача может быть сведена к совокупности I подзадач оценивания скалярных функционалов с/ = FV по скалярным же выходам Ук = СЛ 7*
196 Гл. 7. Наблюдатели для дискретных систем систем хгк+\ = Ацхк, к = 0, 1,2,... . Заметим, что в правой части каждого г-го уравнения имеется из- i вестный вход 52 ачУк> что’ как неоднократно отмечалось, не влияет г=1 i/J на синтез ядра наблюдателя. Но именно с такой задачей мы имеем дело в методе псевдовходов, и ее решением, как установлено, служит наблюдатель вида у - ю»’’ (7-49> здесь /%(г) и /3y(z) — числители передаточных функций системы 4+1 = + Llv[, от псевдовходов vk, действующих по векторам L\ к выходам сА = Fixi и уг = сгх, соответственно, т. е. где <У(г) = det (г/ — Ац). Таким образом, общий вид искомого наблюдателя дается суммой (7.50) Порядок наблюдателя (7.50) совпадает с порядком наибольшего общего кратного полиномов в знаменателе, и, следовательно, наблю- датель имеет минимальный порядок тогда, когда его нули полиномов (3ly(z) совпадают (т. е. (3y(z) = /3y(z) для всех i = 1,...,Z), устойчивы, а степень полинома /3y(z) минимальна. В этом случае окончательный вид искомого функционального на- блюдателя дается следующим операторным выражением: i г=1 (7-51) здесь следует только учесть, что уг — компоненты преобразованного вектора у = Му, где у — измеряемые переменные выхода. Наблюдатель (7.51) физически реализуем, если deg/%(z) «С deg4(z), г =1,2,...,/. (7.52)
7.4. Метод скалярных наблюдателей 197 Эти неравенства, а также условия гурвицевости полинома (3y(z), и предопределяют условия выбора векторов псевдовходов L\ которые при х = deg (3y(z) должны иметь одинаковую структуру: — гурвицев, а вектор /х = (Zi,... ,ZX)T — являться решением следующей совокуп- ности линейных уравнений: Н\Г = -h^ i = 1,2,...,/. В этой системе уравнений матрица Нг„ и вектор имеют уже знакомый вид: Для вычисления минимального порядка наблюдателя следует при- менить указанную ранее итерационную процедуру, начав с того значе- ния х*, для которого выполнены условия гапк{Н^*} = гапк{Я^*, Н**} 1А. Метод скалярных наблюдателей в задаче синтеза функционального наблюдателя минимального порядка Вновь рассмотрим задачу синтеза наблюдателя минимального по- рядка, восстанавливающего линейный р-мерный функционал а — Fx по измерениям /-мерного входа yk = Схк, к = Q, 1,2,... , n-мерной стационарной линейной системы — АЯ'к) к — 0, 1,2,... • Предполагается, что F и С — матрицы полного ранга, т. е. rankF — р, rank С = /,
198 Гл. 7. Наблюдатели для дискретных систем при этом ранг расширенной матрицы ( I максимален, т. е. / F \ rank I I = р + I С п, у G / кроме того, пары матриц {С, А} и {F,A} наблюдаемы. При этих предположениях понятно, что задача синтеза функцио- нального наблюдателя минимального порядка х содержательна, если р х < п — Z, и, следовательно, должно выполняться строгое неравенство р + I < п. Идею метода скалярных наблюдателей поясним на примере, когда р = 1 = 1. 7.4.1. Скалярный функционал, скалярное наблюдение. Допу- стим, что строка F удовлетворяет уравнению FA = XF 4- рС (7.53) при вещественном и устойчивом числе А, т.е. |А| < 1, и некотором ц. Тогда очевидно, что асимптотическую оценку Ъ функционала сг = Fx дает скалярный наблюдатель вида CTfc+i = Xak + цуь, k = 0,1,2,... . (7.54) Поскольку в общем случае строка F не удовлетворяет уравнению (7.53), постольку рассматриваемая задача наблюдения не решается скалярным наблюдателем вида (7.54). Но она может быть решена совокупностью скалярных наблюдателей вида (7.54). Покажем это. Пусть вектор L сообщает матрице Al = A-LC вещественный различный гурвицев спектр <t(Al) = {А1,А2,...,Л(п-1),0}; А* 7^ Xj, i j\ |Ai| <1, i = 1,2,...,n- 1. Обозначим gi — левые собственные вектора матрицы Ль, отвеча- ющие собственным значениям А*. Тогда набор векторов gi,... ,gn-i, С образует базис, а строка F единственным образом разложима по этому базису. Каждый функционал & = giX восстанавливается скалярным наблюдателем, аналогичным наблюдателю (7.54), т.е. ~ “1“ РпУк) P'i — 9iL, (7.55)
7.4. Метод скалярных наблюдателей 199 а у = Сх — известный выход. Поэтому можно утверждать, что искомый функционал а восстанавливается совокупностью скалярных наблюда- телей (7.55), т.е. п— 1 gfc = 5? WjCfc + wnyk, fc = 0,1,2,..., (7.56) i=l O-fc - = ^2 W*4> £k = Tk~ C- i=l Именно это обстоятельство и определяет название метода 9. Для нахождения наименьшего числа скалярных наблюдателей, решающих рассматриваемую задачу, надлежит найти такой базис д\,... ,дп_\, С в Rn, при которой вектор w = (wi,...,wn) в разложе- нии (7.56) имеет максимальное число нулевых компонент. Этот выбор зависит от вектора L (или набора {Ai,... An_i}), следовательно, надле- жащий выбор вектора L может решить рассматриваемую задачу. Поэтому необходимым и достаточным условием существования функционального наблюдателя порядка х является условие существо- вания «гурвицева» решения у следующей системы линейных уравне- ний: Н„Г = -h„, (7.57) где в каноническом базисе наблюдаемости (7.58) Здесь fi — координаты строки F в указанном базисе, т. е. F = (/ьЛ,---,fn)- Для нахождения минимального х* следует вос- пользоваться описанной в предыдущем пунктах итерационной проце- дурой процедурой, при этом х* п — 1. Приведенные рассуждения суммирует аналог теоремы 7.1, формулиров- ку которой мы опускаем. Замечание 7.1. 1°. Синтез семейства скалярных наблюдателей, восстанавливаю- щих заданный функционал решается в следующей последовательности: 9 Отметим, что приведенные соображения обосновывают гипотезу 60-х годов Емельянова-Тарана о возможности замены при синтезе обратной связи дифференциаторов выхода инерционными звеньями
200 Гл. 7, Наблюдатели для дискретных, систем после определения минимального порядка х* находят Г* — решение / /х \ системы (7.57) — компоненту гурвицева вектора = I । ); опреде- ляют диагональную х х х матрицу Лх = diag{Ai, А2, ••• > Ах); наконец находят собственные вектора git ас ними и оценки функционалов £г; окончательно, искомый наблюдатель дается формулой ( + wnyk, < -х -х (7.59) Ufe+i = A^fe+^fe, fc = 0,1,2,..., где = (wi,, wx). 2°. И в рассматриваемом случае вместо наблюдаемости пар {F, А}, {С, А} можно ограничиться требованием их обнаруживаемости. 3°. Спектр сг(Аь) = {Ai, А2,..., Ап-ь0} может содержать совпада- ющие корни либо комплексно-сопряженные пары, тогда базис gi будет состоять из собственных и корневых векторов, подробности опускаем. 7.4.2. Скалярные наблюдения, векторный функционал. Тех- нология синтеза функциональных наблюдателей минимального поряд- ка, изложенная в предыдущих пунктах, в целом сохраняется, поэто- му отметим только основные моменты. Итак, пусть rankF — р > 1, (jfT \ / . X (j I = Р+ 1 и G е R^n~^xn — матрица из левых собственных векторов gi матрицы А^, т. е. Al = AG. Матрица F единственным образом «разлагается» по строкам матрицы G и строке С, т. е. F = w'G 4- wnC, где wf = (wi,..., wn_i), и поэтому / а’ \ ст = : = w'f + wny, £ = Gx. vd Обозначим Л = diag{Aj,..., An-i}- Так как Cfc+i = A£fc + GLyk, k = 0,1,2,..., обобщенное уравнение наблюдателя имеет вид Г ffc+i — Mfc + GLyk, [ ст/с = + wnyk, и теперь должна быть проведена минимизация по L его порядка (т. е. L выбирается так, чтобы среди гщ было максимальное число нулей).
7.5. Синтез наблюдателей в условиях неопределенности 201 Пусть х < п — 1 — порядок функционального наблюдателя, тогда необходимое и достаточное условие разрешимости задачи для данного х формулируется в виде существования «гурвицева» решения у систем линейных уравнений Н^Г = -h\, i = 1,2,...,/), где Нг„ и h\ имеет вид, указанный в (7.58) для каждой строки Fz матрицы F в каноническом базисе наблюдаемости. В целом верен аналог теоремы 7.2, точную формулировку которой опускаем. 7.5. Синтез наблюдателей в условиях неопределенности Рассматривается задача наблюдения фазового вектора n-мерной ли- нейной стационарной системы xk+i = Ахк 4- Dfk, к = 0,1,2,..., (7.60) по измерениям ее /-мерного выхода ук = Схк. (7.61) Обратим внимание на то, что наблюдаемая система подвержена воз- действию внешнего сигнала fk, о котором априори ничего не известно, кроме его размерности т, т.е. fk е Rm. Далее при полной наблюдаемости пары {С, А}, а впредь это свой- ство считаем выполненным, стандартный полноразмерный наблюдатель = Акхк + Lyk поставленной задачи не решает, ибо в правой части уравнения для ошибки оценивания s = х — х, т. е. уравнения =ALek-Dfk, Al = A-LC, к = 0,1,2,... имеется, вообще говоря, неизвестная помеха {fk}, препятствующая решению задачи. Однако при ряде дополнительных условий решение этой задачи возможно сформулируем эти условия в виде следующих предположений: (П.1.) система (7.60), (7.61) — гипервыходная, т.е. I > т, либо квадратичная, когда I = т\ (П.2.) матрицы С, D и CD — полного ранга, т.е. rank С = I, rankP = т, rank CD = m (/ > m); (П.З.) триплет {С, A,D} находится в общем положении, т.е. пара {С, А} наблюдаема, а пара {A, D} управляема;
202 Гл. 7, Наблюдатели для дискретных систем (П.4.) триплет {С, A, D} — минимально-фазовый или, иначе, ин- вариантные нули матрицы Розенброка системы, т. е. (n + Z) х (п + + т) матрицы / zln - А | —D \ R(z) = - - - , \ С | 0 / устойчивы либо отсутствуют. Заметим, что указанной набор предположений является стандарт- ным в теории наблюдения при неопределенности. 7.5.1. Квадратные системы. Рассмотрение начнем с квадратных систем (7.60) и (7.61), когда I = т. В этом случае существует невы- рожденное преобразование координат М, detM / 0, ( Х } =Мх, \ У ) такое, что в новых координатах х' е Rn-m, у е уравнения движе- ния система распадается на две подсистемы уравнений: f x'k+x = Aux'k + A\2yk, + , (7.62) [ Ук+\ = ^21^4 + А^ук + CDfk, к = 0,1,2,... , первая из которых не зависит явно от внешнего возмущения Д, вли- яние которого оказывается только на вторую компоненту, переменная состояния которой yk измеряется непосредственно. Таким образом, если матрица Ац в (7.62) устойчива, то проблему наблюдения решает наблюдатель размерности (п — т) вида х'к+\ = Ацхк +Ai2yk, fc = 0,1,2,..., (7.63) со статическим преобразователем Хк = М~х ( Хк Y (7.64) \ Ук J Но спектр матрицы Ац, как уже отмечалось, состоит из множества всех инвариантных нулей матрицы Розенброка системы 7J(z), которые, в свою очередь, устойчивы, если триплет {С, A, D} — минимально- фазовый (П.4). Таким образом, имеет место следующая Теорема 7.3. Пусть квадратный (т. е. I = т) минимально- фазовый триплет {С, A, D} находится в общем положении, v&nkCD — т; тогда задачу наблюдения полного фазового вектора системы (7.60), (7.61) при наличии помехи fk решает наблюдатель (7.63) и (7.64) размерности (п — т), причем сходимость оценки Хк к Хк полностью определяется нулями матрицы Розенброка R(z) системы.
7.5. Синтез наблюдателей в условиях неопределенности 203 Что касается синтеза функционального наблюдателя (в том числе и минимального порядка), то возможности здесь не очень большие и состоят они в следующем. Оцениваемый функционал а = Fx представляется в виде суммы а = F.\r'‘ ( Х ) = F'x’ + F"y, \ У / вторая компонента которой известна, поэтому решаемая задача сводит- ся к оцениванию функционала </ = ??, F' е r1x («-">). Последнее принципиально возможно. Так, например, для матрицы Ли простой структуры в Rn~m существует базис из ее левых собственных векторов Нг (г = 1,2,...,п — т), отвечающих ее собственным значени- ям {Ai,A2,...,An-m}, т.е. hzA\i = Xih\ i = 1,2,... ,п — т. Вектор F' единственным образом разлагается по этому базису п —т F' = 52 г=1 количество ненулевых коэффициентов разложения и определяет мини- мальный порядок функционального наблюдателя. Известным способом (см. гл. 5) этот результат распространяется на матрицу Ац — произ- вольной структуры. В любом случае, влиять на порядок наблюдателя или темп сходимости оценки к оригиналу невозможно, то и другое пол- ностью определяется свойством исходного триплета {С, A, D}. Иначе обстоит ситуация в так называемых гипервыходных системах, когда I > т. 7.5.2. Гипервыходные системы. В этом случае при выполнении предположений (П.1.)-(П.4.) в уравнениях рассматриваемой системы необходимо проделать следующие преобразования: сначала разбить вектор у на две компоненты у' и у" размерности т и (Z — т) [ у' \ ( \ }т V ~ I у" J ~ I С"х J }1 — т таким образом, чтобы det C'D^O. Отметим, что для этого может потребоваться не только перестанов- ка строк в матрице С", как сказано выше, а и неособое преобразование вектора выхода. Однако это технический вопрос и на существо дела
204 Гл. 7. Наблюдатели для дискретных систем это не влияет (подробности см. в гл. 5). После этого преобразования надо рассмотреть «квадратную» систему ( Xk+i = Ахк + Dfk, I Ук = С'хк, для которой проделать указанную в предыдущем пункте замену пере- менных , \ I х \ } т X = М /17 I У J }1~т и получить следующую систему: Г х'к+1 = Aux'k + Ai2y'k, \ Ук+1 = A2ix'k + А22ук + (СD)fk, = '' ’ Важное отличие систем (7.65) от систем (7.62) состоит в том, что в случае (7.65) первую подсистему сопровождает выход ( xf \ yff = с"х = С"М I , = С['х' + С%у, (7.66) в уравнении которого вторая компонента известна и поэтому далее при решении задач наблюдения при наличии помех можно иметь дело с (п - т)-мерной системой с выходом размерности (Z - т) > 0, т. е. система вида ( 4+1 = Апх'к + Апу'к, \ук = С”х'к, к = 0,1,2..... Принципиальное значение для дальнейшего использования системы (7.67) в рассматриваемой задаче оценивания имеет вопрос об общности положения пары {С", Ац}, ответ на этот вопрос дает Лемма 7.3. Пусть минимально-фазовый триплет {C,A,D} на- ходится в общем положении, t&vlkCD = т. Тогда найдутся такие неособые преобразования выхода и состояния системы, при кото- рых в преобразованной системе (7.65) и (7.66) пара {С{',Ац} — наблюдаемая (восстанавливаемая), когда у матрицы Розенброка системы R(z) нет инвариантных нулей (есть устойчивые инвари- антные нули). Доказательство леммы 7.3 можно провести с помощью рассужде- ний, содержащихся в доказательстве теоремы 5.1 из гл. 5. Таким образом, полноразмерный наблюдатель для системы (7.67) не содержит неопределенности, может быть взят в стандартном для теории наблюдения виде (п - т)-мерной системы хк+1 = A^xk + Lyk + А122/ь (7.68)
7.5. Синтез наблюдателей в условиях неопределенности 205 где матрица = Ли - LC”. (7.69) При этом в условиях леммы 7.3 спектр матрицы Ац — гурвицев и содержит две компоненты: неизменяемую, состоящую из инвари- антных нулей матрицы Розенброка R(z), и переменную, назначаемую по произволу выбором вектора L в (7.69). Наблюдатель (7.68) вместе с преобразованием 9 / х'к \ хк = М{ * (7.70) \Ук / решает рассматриваемую задачу наблюдения при неопределенности, тем самым доказана Теорема 7.4. Для минимально-фазового гипервыходного (Z > т) триплета {C,A,D} общего положения при условии rank СР = т задачу наблюдения полного фазового вектора при наличии неиз- вестной помехи {fk} решает наблюдатель (7.68)-(7.70) порядка (п — т). При этом асимптотика оценивания определяется мат- рицей А= Ац — LC", спектр которой образован всеми инвари- антными нулями матрицы Розенброка R(z) системы и элемен- тами назначенными по произволу надлежащим выбором вектора L с к(п-т)х(/“т). Таким образом, сравнивая теоремы 7.3 и 7.4, можно заключить, что наличие дополнительных выходов позволяет кардинально влиять на динамику систем оценивания, а в некоторых ситуациях ее можно назначать по произволу. Помимо описанного выше полноразмерного (порядка (п — т)) на- блюдателя для оценивания фазового вектора системы (7.67), можно использовать наблюдатель пониженного (п - Z)-ro порядка. Для этого нужно воспользоваться леммой 7.1 из §7.2, согласно которой неособым преобразованием уравнения (7.67) приводятся к системе уравнений вида Г х"+1 = Ап^ + А^ + А^, I Уь+1 = ^21^' + A22yk + А'[2у'к, £ = 0,1,2,... , где первое уравнение имеет размерность (п — I) с матрицей Ац со спектром, состоящим из всех инвариантных нулей матрицы Розенброка R(z) системы и назначенных по-произволу элементов этого спектра, в (7.71) (А'12) и А"2 — матрицы, полученные из матрицы А12 в резуль- тате упомянутого выше преобразования координат. 9 Заметим, что если использовать преобразование выхода при получении уравнений (7.65), в (7.70) придется заменить «преобразованную» компоненту у'к на ее прообраз.
206 Гл. 7. Наблюдатели для дискретных систем Теперь, как и раньше, для оценивания вектора х% е Rn-/ подходит наблюдатель вида xk+\ — А\\х^ + Л\2Ук + АуГУк’ & = 0,1,2,... , (7.72) который вместе с соотношением __( х^ \ хк = М\ , (7.73) \ Ук 1 при некоторой неособой матрице М, доставляет искомую оценку пол- ного фазового вектора исходной системы. Суммируем сказанное в виде следующего утверждения, имеет место Теорема 7.5. Для минимально-фазового гипервыходного (I > т) триплета {C,A,D} общего положения при дополнительном усло- вии xmkCD = т задачу наблюдения полного фазового вектора при наличии неизвестной помехи {fk} решает наблюдатель (7.72), (7.73) минимально возможного порядка (п -1). При этом динамика оценивания определяется всеми инвариантными нулями матрицы Розенброка R(z) системы, остальные точки спектра назначаются по произволу. Для полноразмерных наблюдателей результат, установленный в тео- реме 7.5 является предельно возможным с точки зрения минимизации динамического порядка наблюдателя. Дальнейшее понижение порядка возможно только для функциональных наблюдателей. Приминительно к системе (7.67) синтез наблюдателя, оценивающе- го функционал 9 У = F'x', х' сводится к одной из описанных ранее последовательности действий. Например, для наблюдаемой пары {С{,Ац} в случае С{ е Rlx/ в соответствии с методами скалярных наблюдателей следует найти мат- рицу Hf левых соответственно векторов матрицы = Ац — LC", т. е. Н’А^ = AHf, где Л = diag {Ац А2,, An-z-i} — матрица собственных значений матрицы Ац. Далее найти параметры w = (w\,... ,wn-i-\,wn_i) = = (w',wn-i) разложения F'= w'H'+ wn-iC" 9 Оценка функционала а = Fx, как указывалось выше, заменой — ( х' \ х = М I ) сводится к оценке функционала а = Fx .
7.5. Синтез наблюдателей в условиях неопределенности 207 и свести задачу векторного оценивания к совокупности скалярных задач оценивания a'i = hix' l,2,...,n —Z — 1), где h1 — строки матрицы Н', отвечающие соответствующему значению Xi. Тогда искомую оценку доставит сумма оценок п-1-1 o’ = 5? wi^i + wn-iy, (7-74) г—1 где Wi — компоненты строки w, — оценка функционала ст- = Нгх', формируемая скалярным наблюдателем (^)fc+i = + diyk, k = 0,l,2,..., (7.75) здесь di некоторая строка, по которой воздействуют все выходы ук исходной системы. Минимизация числа компонент в разложении (7.74) достигается применением итерационного процесса, сводящаяся к на- хождению минимального числа х, при которых система линейных уравнений (7.76) имеет решением вектор 1Ж, являющегося гурвицевой компонентой век- / /х \ тора । I . В (7.76) матрицы и вектор — состоят из координат вектора F' в каноническом базисе наблюдаемости пары {С{',Ац}, подробности опускаем (см. в главе 4). Как и ранее, в сход- ных случаях укажем, что требование наблюдаемости пары {С",Ац} может быть ослаблено до свойства восстанавливаемости. 7.5.3. Метод псевдовходов при синтезе наблюдателя состоя- ния. Альтернативой изложенному в предыдущем пункте подходу, когда для получения полноразмерного наблюдателя состояния мини- мального порядка требуется, вообще говоря, два произвольных по- следовательных преобразования подобия, в излагаемом ниже методе псевдовходов можно обойтись одним таким преобразованием. Вновь рассмотрим гипервыходную (т. е. I > т) систему (7.60) и (7.61) и проведем ее «оквадрачивание» путем добавления (Z — т) новых нулевых входов, воздействующих на систему через матрицу D' так, что система будет описываться уравнениями Г Zfc+1 = Ахк + Dfk + D’f'k = Ахк + Dfk, fc = 0,l,2,..., I ук Схк.
208 Гл. 7. Наблюдатели для дискретных систем Конечно, это прежняя система, так как ffk = 0, но погруженная в класс квадратных (Z х Z) систем. Важное отличие преобразованной системы в том, что у матрицы Розенброка расширенной системы / zln- А | D : D' \ R\z) = ---------------------- (7.78) \ С | 0 J появляются новые инвариантные нули, зависящие от матрицы D', являющиеся также нулями характеристического полинома нулевой ди- намики /3'(z) = det Я'(г), deg /З'(г) = п — 1. (7.79) Более точно об этом говорится в следующем утверждении, имеет место Лемма 7.4. Пусть минимально-фазовый триплет {C,A,D} на- ходится в общем положении, rank CD = т. Тогда множество (п — 1} нулей характеристического полинома нулевой динамики расширен- ной системы состоит из множества инвариантных нулей матрицы Розенброка R(z) исходной системы и множества нулей, назначаемых по произволу надлежащим выбором матрицы псевдов- ходов D', при этом rank[C(D:D')] = I. Доказательство опускаем, оно может быть восстановлено с помо- щью рассуждений из главы 5, см. доказательство теоремы 5.2. С опорой на лемму 7.4 можно реализовать разовое невырожденное преобразование х = м( Х ) \ У J исходного уравнения (7.60) (или, что тоже самое — расширенного уравнения (7.77)) к виду, аналогичному совокупности уравнений (7.65) и (7.71), а именно, к системе уравнений вида ' 4+1 = ^114 + ^123/Ь < _ Ук+1 = A2ix'k+A22yk + C(D:Dr)fk, к = 0, 1,2,..., которое с учетом того, что (D:D')fk = Dfk, окончательно принимает следующий вид f 4+i = Ai4 + ^i2j/fe, [ Ук+\ = A21xfk + A22yk + CDfk, к = 0,1,2,..., в (7.80) xf е Rn-Z, а спектр матрицы Ац совпадает с множеством нулей полинома /3'(z) в (7.79), и если матрица Ац — гурвицева, то рассматриваемую задачу оценивания полного фазового вектора систе-
7.5. Синтез наблюдателей в условиях неопределенности 209 мы (7.60), (7.61) при наличии неизвестной помехи решает наблюдатель минимально возможного (n — Z)-ro порядка x'k+i = Аих'к + Ai2yk, к = 0,1,2,... , (7.81) и статический преобразователь ( % к \ хк = М[ к , (7.82) \ ук / где М — упомянутое выше неособое преобразование исходной системы к виду (7.80). Таким образом, окончательно установлена Теорема 7.6. Для минимальнофазового гипервыходного (Z > т) триплета {С, A, D} общего положения при дополнительном условии rank CD = т задачу наблюдения полного фазового вектора при на- личии неизвестной помехи {fk}^ решает наблюдатель (7.81), (7.82) минимально возможного порядка (п — I). В качестве комментария к этой теореме отметим два обстоятель- ства. 1°). Функциональные наблюдатели, в том числе и минимального порядка, для системы (7.60) и (7.61) должны опираться на первые из уравнений (7.80) и использовать описанные выше итерационные процедуры. 2°). Не всегда нужно стремиться к минимальной размерности на- блюдателя «очищенного» от помех, можно использовать любую раз- мерность от (n — т) j\o (п - I) включительно. Теоретическую основу для этого дает следующая теорема. Теорема 7.7. Пусть р — любое число такое, что 0 р I — т. Тогда для любого гипервыходного (I > т) минимально-фазового триплета {C,A,D}, находящегося в общем положении, удовлетво- ряющего условию r&rikCD = т, найдутся такие неособые преоб- разования векторов системы и ее фазового вектора, что система приводится к следующей совокупности уравнений'. Czp)/c+i = Ац(х'р)к + Aw(yp)k, < (z/p)fc+i = ^21 (x'p)k + A22(yP)k + CpDfk, (7.83) < {У l—m—p)k ~ Cl—m—p(xp) к > к = 0, 1,2,..., где x'p e Rn~m-P; yp e yl~m-p e — часть преобразо- ванного выхода системы, у — Рр ( ) ; rank (CPD) = т; мат- у У1—т—р J рица Ац — гурвицева, при р > 0 ее спектр частично назначается по произволу.
210 Гл. 7. Наблюдатели для дискретных систем (7.84) векто- в той Кроме того, наблюдатель, решающий задачу оценивания полного фазового вектора системы, дается следующими уравнениями ~ 4“ -^12(yp)k, < ( (Юк \ хк = м„ ; р. , к = о,1,2,..., р (Ур)к J где Мр — матрица упомянутого выше преобразования фазового ра. Отметим, что теорема 7.7 обобщает теоремы 7.5 и 7.6 и части, что пара Лц} восстанавливаема или наблюдаема в зависимости от наличия или отсутствия устойчивых инвариантных нулей у матрицы Розенброка R(z) системы. 7.5.4. Некоторые классические методы синтеза наблюдателей состояния в условиях неопределенности. Кратко опишем класси- ческие схемы синтеза наблюдателей состояния при неопределенности, ограничившись изложением (в отличие от рассмотренных в гл. 5 для систем непрерывного времени) результатов для квадратных систем, т. е. систем вида | хк+1 = Ахк + Dfk, < (7.85) [ Ук = Схк, к = 0,1,2,... , где х е Rn, f и g е Rm. Распространение этих результатов на ги- первыходные системы (/ > т) можно сделать на основе соображений, содержащихся в гл. 5 или в оригинальных работах. Впредь, не ограничивая общности, будем полагать, что для квад- ратного триплета {С, A, D} выполнены предположения (П.1.)-(П.4.), т.е. триплет минимально-фазовый, общего положения и det(C'D) / 0. 7.5.5. Метод исключения возмущения из уравнения для ошиб- ки оценивания. Наблюдатель выбирается в виде n-мерный динами- ческой системы Wfc+i = Ewk + Qyk, к = 0,1,2,... , (7.86) и статического преобразователя хк = wk + Lyk. (7.87) В этом случае уравнение движения для ошибки оценивания е = х — х имеет следующий вид: = Еек + (ЕР + QC- РА)хк - PDfk, (7.88)
7.5. Синтез наблюдателей в условиях неопределенности 211 где матрица Р = In — LC. Правая часть уравнения (7.88) не зависит от неизвестных функций Хк и fк, когда выполнены равенства PD = 0, (7.89) РА = ЕР + QC. Если, кроме этого, матрица Е — гурвицева, то наблюдатель, заданный уравнениями (7.86) и (7.87), решает рассматриваемую задачу наблюде- ния, ибо асимптотически устойчиво уравнение £к+\ = Еек, к = 0,1,2,... . Рассмотрим условия (7.89) подробнее, из равенства PD = 0 следует, что Р = In-D(CD)~lC, (7.90) т. е. Р — является матрицей оператора косого проектирования «вдоль С на Dx = 0». Умножим теперь второе равенство в (7.89) справа на матрицу D, получим уравнение относительно матрицы Q: PAD = QCD, его решением служит п х т матрица Q = PAD(CD)~X. С учетом последнего равенства второе соотношение в (7.89) принимает следующий вид: РАР = ЕР, (7.91) из которого следует равенство СЕР = 0. Последнее означает, что в качестве матрицы Е годится любая матрица, удовлетворяющая соотношению СЕ~А\С, (7.92) где Л1 — диагональная (т х т) — матрица. Вновь рассмотрим уравнение (7.91) и предположим, что (п - т) х х п — матрица Н — матрица иных, отличных от С левых собственных векторов матрицы Е с диагональной матрицей собственных значений Л2, т.е. ЕЕ = Л2Я, ( С \ / А1 0 \ ( С \ такчто^д. ДД 0 д2 Тогда HP является матрицей левых собственных векторов матрицы АР, так как (НР)АР = НЕР = Л2(ЯР). Последнее означает, что Л2 — матрица отличных от нуля собственных значений матрицы АР, но последнее суть спектр нулевой динамики
212 Гл. 7. Наблюдатели для дискретных систем или, что то же самое — инвариантные нули матрицы Розенброка R(z) системы. Тем самым доказано следующее Утверждение 7.1. Пусть квадратный минимально-фазовый три- плет {C,A,D} находится в общем положении и det CD ф 0. Тогда существует гурвицева (п х п) матрица Е, спектр которой состав- лен из всего спектра нулевой динамики системы, а остальная часть назначается по произволу, такая, что задачу оценивания полного фазового вектора системы при наличии неизвестной помехи реша- ет наблюдатель (7.86), (7.87). Замечания. 1. Аналогичный результат можно сформулировать и для гипервы- ходной системы (Z > т), когда rank СВ = т. 2. Размерность наблюдателя может быть понижена до (п — т), когда динамика оценивателя будет полностью определяться спектром нулевой динамики. 3. Уравнения (7.86) могут быть использованы для синтеза функци- ональных наблюдателей, подробности опускаем. 7.5.6. Метод исключения возмущения из уравнения систе- мы. Вновь рассмотрим в условиях (П.1.)-(П.4.) квадратную (т х тп)-систему | xk+{ = Ахк + Dfk, I ук = Схк, к = 0,1,2,... , первое уравнение которой преобразуется с помощью косого проекти- рования, упоминавшегося в предыдущем пункте, т. е. введем новую переменную £ = Рх, P = In-D(CD)~1C, (7.93) тогда будем иметь следующее уравнение (так как PD = 0): а+1 = РА& + PAD(CD)~lyk, (7.94) правая часть которого не зависит явно от внешнего возмущения fk. Заметим, что использованная замена (7.93) не является обратимой, более того, имеет место очевидное равенство С£к = 0, к = 0, 1,2,.... Это означает, что в (7.94) содержится только (п — т) линейно-незави- симых строк и, следовательно, число уравнений в (7.94) может быть сокращено. Например, это может быть сделано следующим образом: полагая, что в разложении G=(Cn_wiCm)
7.5. Синтез наблюдателей в условиях неопределенности 213 матрица обратима, выразим из уравнения = 0 последние m-компонент вектора £ через его первые (п - т) компонент, т. е. СГ = С-{Сп_тСк~т- (7-95) Затем в уравнении (7.94) нужно отбросить последние т-строк, а в остальных сделать замену (7.95), в результате получаем уравнение (п - т)-го порядка + А127/ь к - 0,1,2,... , (7.96) заметим, что у к не выражается через так как Ук = Схк = C(Cfc + D(C£>)-1yfc) = ук. Поэтому для получения полных уравнений движения нужно (7.96) дополнить уравнением для ук+i, т. е. уравнением Ук+\ — С(АцХк + m + А227//с + CDfk- (7.97) Для минимально-фазового триплета {С, A, D} матрица Ац — гур- вицева, поэтому наблюдателем служит динамическая система = АпГк~т + к = 0,1,2,... , (7.98) и статический преобразователь (Е \ rJ~m Tk~m + D(CD)-{yk, (7.99) ^п—т j что и решает рассматриваемую задачу оценивания фазового вектора при неопределенности, более того, имеет место Утверждение 7.2. Для квадратного минимально-фазового три- плета {С, A, D} общего положения и такого, что det CD 0, за- дачу оценивания полного фазового вектора системы при неизвест- ном возмущении {fk}> решает наблюдатель (7.98) и (7.99) порядка (п - т). Сходимость оценки полностью определяется инвариант- ными нулями матрицы Розенброка R(z). Замечания. 1. Описанный метод преобразования назван методом квазирас- щепления и предложен в 1984 году Коровиным С.К. Он описан, напри- мер, в [6]. 2. Этот метод, разумеется, распространяется на гипервыходные системы, когда вместо (7.96) и (7.97) приходится иметь дело с уравне-
214 Гл. 7. Наблюдатели для дискретных систем ниями вида < у'к+1 = Л21егт + A22y'k + (CD)fk, (7.100) у’ = С"$-т, к = 0,1,2,..., где С' - (тп)-строчная матрица такая, что det (C'D) / 0, С" - (Z — т)- строчная матрица укороченного выхода у". Здесь важно, что пара {С", Ан} наблюдаема, когда матрица Розен- брока R(z) системы не имеет инвариантных нулей, и восстанавливаема, когда такие нули есть, которые, конечно, в условиях (П.1.)-(П.4.) — устойчивые. Поэтому уравнения наблюдателя, решающего рассматриваемую за- дачу можно взять в следующем виде: —п—т . г —п—т —г £/с+1 — А1£/с + Л12Ук, хк = нГк'™ + Nyk, (7.101) при некоторых матрицах Н и 7V, здесь А^х = Ац - LC” — устойчивая матрица, спектр которой образуют все инвариантные нули системы, а остальные назначаются по произволу. При этом верен полный аналог утверждения 7.2, формулировку которого мы опускаем. 3. Размерность наблюдателя вида (7.101) может быть понижена до (п-1). 4. Для синтеза функциональных наблюдателей можно использовать уравнения (7.100) или их аналоги. 7.5.7. Методы, основанные на специальных канонических формах. Методы этой группы основаны на двух последовательных преобразованиях, дающих в результате уравнения, аналогичные урав- нениям (7.100). Сначала находят обратимую матрицу (n х п) Т такую, что и проводят замену переменных
7.5. Синтез наблюдателей в условиях неопределенности 215 позволяющую преобразовать исходную систему (7.60) и (7.61), в усло- виях (П.1)-(П.4), к следующему виду: ' х'к+1 =Л14+Л2х", < 4+1 = A3x'k + A^ + Dfk, (7.102) . Ук = С\х'к +С2хк, £ = 0,1,2,..., где detC2 / 0. Отбрасывая в (7.102) второе рекуррентное уравнение и выражая в первом х" через у и хг, можно получить стандартные уравнения, не содержащие в явном виде неизвестное возмущение {Д}, т.е. уравнения {^+1 = Апхгк + А^ук, _ 7.103 у’к = С^ А; = 0,1,2,..., где пара {СцАц} — наблюдаема при отсутвии у исходной системы инвариантных нулей и только восстанавливаема в противном случае (напомним, что инвариантные нули устойчивы по предположениям (П.1.)-(П.4.)). Это означает, что искомым наблюдателем может быть динамическая система (п — т)-го порядка следующего вида: ( х'к+1=А^х'к + А12г/к, \хк = Hx’k+Nyk, £ = 0,1,2,..., где матрица = Ац — LC\ имеет гурвицев спектр с обычными свойствами. Более того имеет место Утверждение 7.3. Для гипервыходного (I > т) минимально- фазового триплета {С, A, D} общего положения и такого, что det CD — т, задачу оценивания полного фазового вектора системы при наличии неизвестного возмущения {fk} решает наблюдатель вида (7.104) (п — т)-го порядка. Сходимость оценки к оригиналу определяется матрицей Ац, спектр которой образуют все инвари- антные нули матрицы Розенброка R(z) системы и назначаемые по произволу значения. Замечания. 1. Стандартным образом порядок наблюдателя может быть понижен до (n - Z). 2. Для синтеза функциональных наблюдателей при неопределенно- сти можно использовать уравнения (7.103) и им подобные, подробности опускаем. 3. Видно, что описанные выше методы применимы в одних и тех же условиях и основаны на сходных идеях. Главное различие между ними в вычислительных методах, которые приходится использовать при решении задач синтеза наблюдателей.
216 Гл. 7. Наблюдатели для дискретных систем Заключение. В главе 7 рассмотрены методы синтеза наблюда- телей для дискретных систем. Приведенные результаты аналогичны соответствующим результатам, подробно описанным в главах 2-5 для непрерывных систем. В параграфе 7.1 приведены общие сведения из теории дискретных динамических систем. В параграфе 7.2 рассмотрены понятия наблюдаемости и восстанав- ливаемости для дискретных систем, приведены критерии наблюдаемо- сти, канонические формы для дискретных систем. В параграфе 7.3 изложены методы синтеза наблюдателей полного фазового вектора для дискретных систем. В параграфе 7.4 рассмотрена задача синтеза функциональных на- блюдателей, а в параграфе 7.5 рассмотрена задача синтеза наблюдате- лей в условиях неопределенности.
Список литературы 1. Андреев Ю.Н. Управление линейными конечномерными объектами. — М.: Наука. Физматлит, 1976. 2. Барбашин ЕЛ. Введение в теорию устойчивости. — М.: Наука. Физмат- лит, 1967. 3. Воронов А. А. Устойчивость. Управляемость. Наблюдаемость. — М.: Нау- ка. Физматлит, 1976. 4. Гантмахер Ф.Р. Теория матриц. — М.: Наука. Физматлит, 1967; М.: ФМЛ, 2004. 5. Емельянов С.В., Коровин С.К., Нерсисян A.JI. Об асимптотических свойствах наблюдателей состояния для неопределенных систем с линей- ной стационарной частью // ДАН СССР. — 1090. — Т. 311, №4. — С. 807-811. 6. Емельянов С.В., Коровин С.К. Новые типы обратной связи. Управление при неопределенности. — М.: Наука. Физматлит, 1997. 7. Емельянов С.В., Коровин С.К. // В сб.: Мат. моделирование: Проблемы и результаты. — М.: Наука. Физматлит, 2003. — С. 12-35. 8. Емельянов С.В., Коровин С.К., Шепитько А.С. Стабилизация билиней- ных систем на плоскости посредством постоянных и релейных управле- ний // Дифференц. уравнения. — 2000. — Т. 36, №8. — С. 1021-1028. 9. Ильин А.В., Коровин С.К., Фомичев В.В. Алгоритмы обращения линей- ных управляемых систем // Дифференц. уравнения. — 1997. — Т. 34, №6. - С. 744-750. 10. Ильин А.В., Коровин С.К., Фомичев В.В. Робастное обращение векторных систем // Дифференц. уравнения. — 1998. — Т. 34, № 11. — С. 1478-1486. II. Ильин А.В., Коровин С.К., Фомичев В.В. Алгоритмы обращения ли- нейных скалярных динамических систем: метод управляемой модели // Дифференц. уравнения. — 1997. — Т.ЗЗ, №3. — С. 329-339. 12. Ильин А.В., Коровин С.К., Фомичев В.В. Алгоритмы робастного обраще- ния векторных линейных систем // Нелинейная динамика и управление. Вып.4. Сб. статей под ред. С.В. Емельянова и С.К. Коровина. — М.: Физматлит, 2004. — С. 17-22. 13. Ильин А.В., Коровин С.К., Фомичев В.В., Хлавенка А. Синтез асимп- тотических наблюдателей для линейных векторных неопределенных си- стем // Дифференц. уравнения. — 2005. — Т. 41, № 1. — С. 73-81. 14. Ильин А.В., Коровин С.К., Фомичев В.В. Асимптотические наблюдатели с разрывным управлением для скалярных линейных неопределенных си- стем // Дифференц. уравнения. — 2005. — Т. 41, № 10. — С. 1310-1317. 15. Ильин А.В., Коровин С.К., Фомичев В.В., Хлавенка А. Наблюдатели для линейных динамических систем с неопределенностью // Дифференц. уравнения. — 2005. — Т.41, № 11. — С. 1443-1457. 16. Коровин С.К., Медведев И.С., Фомичев В.В. Функциональные наблюда- тели для линейных систем с неопределенностью // Дифференц. уравне- ния. - 2006. - Т. 42, №10. - С. 1307-1317. 17. Ильин А.В., Коровин С.К., Фомичев В.В. Об уравнениях и свойствах нулевой динамики линейных управляемых стационарных систем // Диф- ференц. уравнения. — 2006. — Т. 42, № 12. — С. 1626-1636.
218 Список литературы 18. Коровин С.К., Ильин А.В., Фомичев В.В. Метод управляемой модели в задачах обращения динамических систем // Докл. РАН. Теория управле- ния. - 1997. - Т. 354, №2. - С. 171-173. 19. Коровин С.К., Ильин А.В., Фомичев В.В. Робастное обращение управ- ляемых линейных систем // Докл. РАН. Теория управления. — 1998. — Т.356, №2. - С. 121-123. 20. Коровин С.К., Ильин А.В., Фомичев В.В., Хлавенка А. Асимптотические наблюдатели состояния неопределенных векторных линейных систем // Докл. РАН. Теория управления. — 2004. — Т. 396, №4. — С. 469-473. 21. Коровин С.К., Фомичев В.В. Асимптотические наблюдатели билинейных систем на плоскости // Дифференц. уравнения. — 2001. — Т. 37, № 12. — С.1605-1611. 22. Коровин С.К., Фомичев В.В. Экспоненциальные наблюдатели билиней- ных систем на плоскости // Докл. РАН. Теория управления. — 2001. — Т. 385, №5. - С. 713-728. 23. Коровин С.К., Фомичев В.В. Построение экспоненциальных наблюдате- лей для билинейных управляемых систем // Дифференц. уравнения. — 2002. - Т. 38, №1. - С. 139-140. 24. Коровин С.К., Фомичев В.В. Асимптотические наблюдатели TV-мерных билинейных систем // Нелинейная динамика и управление. Вып. 3. Сб. статей под ред. С.В. Емельянова и С.К. Коровина. — М.: Физматлит, 2003. - С. 19-26. 25. Коровин С.К., Фомичев В.В. Асимптотические наблюдатели для неко- торых классов билинейных систем с линейным входом // Докл. РАН. Теория управления. — 2004. — Т. 398, №1. — С. 38-43. 26. Коровин С.К., Фомичев В.В., Медведев И.С. О минимизации порядка функционального наблюдателя // Дифференц. уравнения. — 2005. — Т.41, №8. - С. 1148. 27. Коровин С.К., Фомичев В.В., Медведев И.С. Синтез минимальных функ- циональных наблюдателей // Докл. РАН. Теория управления. — 2005. — Т. 404, №3. - С. 316-320. 28. Коровин С.К., Фомичев В.В., Медведев И.С. Функциональные наблюдате- ли минимального порядка // Нелинейная динамика и управление. Вып. 5. Сб. статей под ред. С.В. Емельянова и С.К. Коровина. — М.: Физматлит, 2006. - С. 51-70 29. Коровин С.К., Медведев И.С., Фомичев В.В. Функциональные наблюдате- ли для линейных неопределенных стационарных динамических систем // Докл. РАН. Теория управления. — 2006. — Т.411, № 1. — С. 316-320. 30. Крутько П.Д. Обратные задачи динамики управляемых систем. Линей- ные модели. — М.: Наука. Физматлит, 1988. 31. Ройтенберг Я.Н. Автоматическое управление. — М.: Наука. Физматлит, 1992. 32. Смагина Е.М. Вопросы анализа линейных многомерных объектов, с ис- пользованием понятия нуля системы. — Томск: изд-во Томского ун-та, 1990. 33. Фомичев В.В., Медведев И.С. Построение функциональных наблюдателей для неопределенных систем // Дифференц. уравнения. — 2004. — Т. 40, №8. - С. 1146-1147.
Список литературы 219 34. Aguilar R., Martinez-Guerra R., Maya-Yescas R. State estimation of partially unknown nonlinear systems: a class of integral high gain observers // IEEE Proceedings Control Theory and Applications. — 2003. — V. 150, №.3. - P. 240-244. 35. Aguilar-Lopez R. Integral observers for uncertainty estimation in continuous chemical reactors: algebraic differential approach // Chemical Engineering Journal. - 2003. - V.93, №2. - P. 113-120. 36. Basile G., Marro G. On the observability of linear time-invariant systems with unknown inputs // Journal of Optimization Theory Application. — 1969. - V.3. - P. 410-415. 37. Bastin G., Gevers M. Stable adaptive observers for nonlinear time varying systems // IEEE Transactions on Automatic Control. — 1988. — V. 33, №7. - P. 650-658. 38. Bhattacharyya S.P. Observer design for linear systems with unknown input // IEEE Transactions on Automatic Control. — 1978. — V. 23. — P. 483-484. 39. Chang J.L. Robust sliding-mode control with disturbance attenuation using only output feedback // JSME International Journal. Series C — Mechanical Systems Machine Elements and Manufacturing. — 2003. — V. 46, №1. - P. 239-244. 40. Corless M., Tu J. State and input estimation for a class of uncertain systems // Automatica. —1998. — V. 34. — P. 757-764. 41. Darouach M., Zasadzinski M., Xu S.J. Full-order observers for linear systems with unknown inputs // IEEE Transactions on Automatic Control. — 1994. - V.39, №3. - P. 606-609. 42. Dochain D. State and parameter estimation in chemical and biochemical processes: a tutorial // Journal of Process Control. — 2003. — V. 13, №8. — P. 801-818. 43. Dochain D. State observers for processes with uncertain kinetics // International Journal of Control. — 2003. — V. 76, № 15. — P. 1483-1492. 44. Doyle J. C, Stein G. Robustness with observers // IEEE Transactions on Automatic Control. — 1979. — V. 24, №4. — P. 607-611. 45. Edwards C, Spurgeon S.K., Hebden R.G. On the design of sliding mode output feedback controllers // International Journal of Control. — 2003. — V. 76, №9-10. - P. 893-905. 46. Engell S., Konik D. Zustandsermittlung bei unbekanntem Eingangssignal // Automatisierungstechnik at. — 1986. — V. 34, № 1. — P. 38-42. 47. Fairman F. W., Hinamoto T., Hirschorn R. Disturbance decoupled observers having unrestricted spectrum // Journal of Franklin Institute. — 1982. — V.313. - P. 123-133. 48. Fairman E W., Mahil S.S., Luk L. Disturbance decoupled observer design via singular value decomposition // IEEE Transactions on Automatic Control. - 1984. - V.29. - P. 84-86. 49. Ficklscherer P., Muller P.C. Robuste Zustandsbeobachter fiir lineare Mehrgrossenregelungssysteme mit unbekannten Storeingangen // Automa- tisierungstechnik at. — 1985. — V. 33. — P. 173-179. 50. Green M.t Limebeer D.LN. Linear robust control. — Prentice Hall, 1995.
220 Список литературы 51. Guan Y.-P., Sail M. A novel approach to the design of unknown input observers // IEEE Transactions on Automatic Control. — 1991. — V. 36, №5. - P. 632-635. 52. Hermann R., Krener A. Nonlinear controllability and observability // IEEE Transactions on Automatic Control. — 1977. — V. 22, №5. — P. 728-740. 53. Hostetter G., Meditch J.S. Observing systems with un-measurable inputs // IEEE Transactions on Automatic Control. — 1973. — V. 18, №3. — P. 307-308. 54. Hou M., Muller P.C. Design of observers for linear systems with unknown inputs // IEEE Transactions on Automatic Control. — 1992. — V. 37, №6. — P. 871-875. 55. Hou M., Muller P.C. Disturbance decoupled observer design: A unified view point // IEEE Transactions on Automatic Control. — 1994. — V. 39, №6. — P.1338-1344 56. Hou M., Muller P.C. Fault detection and isolation observers // International Journal of Control. - 1994. - V.60, №5. - P. 827-846. 57. Hou M., Pugh A. C., Muller P.C. Disturbance decoupled functional observers // IEEE Transactions on Automatic Control. — 1999. — V. 44, №2. - P. 382-385. 58. Hui R., Zak R. Robust output feedback stabilization of uncertain dynamic systems with bounded controllers // International Journal of Robust and Nonlinear Control. - 1993. - V.3. - P. 115-132. 59. Imai H., Akashi H. Disturbance localization and pole shifting by dynamic compensation // IEEE Transactions on Automatic Control. — 1981. — V. 26, №1. - P. 226-235. 60. Isidori A. Nonlinear control systems. — London: Springer Verlag, 1995. 61. Jiang B., Staroswiecki M. Adaptive observer design for robust fault estimation // International Journal of Systems Science. — 2002. — V. 33, №9. - P. 767-775. 62. Kailath T., Sayed A.H., Hassibi B. Linear estimation // Prentice Hall. Upper Saddle River. - NJ, 2000. 63. Kalman R.E. Mathematical description of linear systems // SIAM J. Control. - 1963. - V. 1. - P. 152-192. 64. Kalman R.E. Lectures on controllability and observability // C.LM.E. — Bologna, 1968. 65. Kimura H. Pole assignment by gain output feedback // IEEE Transactions on Automatic Control. — 1975. — V. 8. — P. 509-516. 66. Kobayashi N., Nakamizo T. An observer design for linear systems with unknown inputs // International Journal of Control. — 1982. — V. 35. — P. 605-619. 67. Koshkouei A.J., Zinober A.S.I. Sliding mode state observation for non-linear systems // International Journal of Control. — 2004. — V. 77, №2. — P. 118-127. 68. Kreisselmeier. Adaptive observers with exponential rate of convergence // IEEE Transactions on Automatic Control. — 1977. — V. 22, №1. - P. 2-8. 69. Krener A. J., Respondek W. Nonlinear observers with linearizable error dynamics // SIAM Journal on Control and Optimization. — 1985. — V. 23, №2. - P. 197-216.
Список литературы 221 70. Kudva Р., Viswanadham N., Ramarkrishna A. Observers for linear systems with unknown inputs // IEEE Transactions on Automatic Control. — 1980. - V. 41. - P. 113-115. 71. Kurek J.E. The state vector reconstruction for linear systems with unknown inputs // IEEE Transactions on Automatic Control. — 1983. — V. 28, №12. - P. 1120-1122. 72. Kwon S., Chung W.K. Combined synthesis of state estimator and pertubation observer // Journal of dynamic systems Measurement and control — transactions of the ASME. — 2003. — V. 125, № 1 — P. 19-26. 73. Lee C.Y., Lee J.J. Adaptive control for uncertain nonlinear systems based on multiple neural networks // IEEE Transactions Systems. Man and Cybernetics. - Part B. - 2004. - V. 34, № 1. - P. 325-333. 74. Lin H., Zhai G., Antsaklis P.J. Set-valued observer design for a class of uncertain linear systems with persistent disturbance and measurement noise // International Journal of Control. — 2003. — V. 76, №16. — P. 1644-1653. 75. Lin Sheng-Fuu, Wang An-Ping. Design of observers with unknown inputs using eigen-structure assignment // International Journal of Systems Science. - 2000. - V. 31, №6. - P. 705-711. 76. Luenberger D.G. Determining the state of linear system with observers of low dynamic order // Ph. D. dissertation. — Stanford University, 1963. 77. Luenberger D.G. Observers for multivariable systems // IEEE Transactions on Automatic Control. — 1966. — V. 11. — P. 190-197. 78. Luenberger D.G. Canonical forms for linear multivariable systems // IEEE Transactions on Automatic Control. — 1967. — V. 12. — P. 290-293. 79. Mareels I., Polderman J. Adaptive systems: An introduction. — Boston: Birkhauser, 1996. 80. Marino R., Santosuosso G., Tomei P. Robust adaptive observers for nonlinear systems with bounded disturbances // IEEE Transactions on Automatic Control. — 2001. — V. 46. — P. 967-972. 81. Marino R., Santosuosso G.L., Tomei P. Adaptive compensation of multiple sinusoidal disturbances with unknown frequencies // Nonlinear and Adaptive Control (A. Zi-nober and D. Owens, eds.). — Springer, 2003. — P. 207-226. 82. Marquez H.J. A frequency domain approach to state estimation // Journal of Franklin Institute - 2003. - V. 340, №2. - P. 147-157. 83. Miller R.J., Mukundan R. On designing reduced order observers for linear time-invariant systems subject to unknown inputs // International Journal of Control. - 1982. - V.35. - P. 183-188. 84. Nijmeijer H, Van der Schaft. Nonlinear dynamical control systems. — Springer Verlag, 1990. 85. Rosenbrock H.H. State-space and multivariable theory. — London: Nelson, 1970. 86. Rosenbrock H.H. The zeros of a system // International Journal of Control. — 1973. - V. 18, №2. - P. 297-299. 87. OReilly J. Observers for linear systems. — London: Academic Press, 1983. 88. Park J.H., Park G.T. Adaptive fuzzy observer with minimal dynamic order for uncertain nonlinear systems // IEEE Proceedings — Control theory and applications. - 2003. - V. 150, №2. - P. 189-197.
222 Список литературы 89. Park К, Stein J.L. Closed-loop, state and inputs observers for systems with unknown inputs // International Journal of Control. — 1988. — V. 48, № 3. — P. 1121-1136. 90. Peter K., Scholing I., Orlik B. Robust output-feedback Л-infinity control with a non-linear observer for a two-mass system // IEEE Transactions on Industry Applications. — 2003. — V. 39, №3. — P. 637-644. 91. Rajamani R., Cho Y.M. Design of observers for nonlinear systems // International Journal of Control. — 1998. — P. 719-731. 92. Rapaport A., Gouze J.L. Parallelotopic and practical observers for non-linear uncertain systems // International Journal of Control. — 2003. — V. 76, №3. - P. 237-251. 93. Roman J.R., Bullock T.E. Design of minimal-order stable observers for linear functions of the state via realization theory // IEEE Transactions on Automatic Control. — 1975. — V. 20. — P. 613-622. 94. Saberi A., Sannuti P. Squaring down by static and dynamic compensators // IEEE Transactions on Automatic Control. — 1988. — V. 33. — P. 358-365. 95. Saberi A., Sannuti P. Time-scale structure assignment in linear multivariable systems using high-gain feedback // International Journal of Control. - 1989. - V.49, №6. - P. 2191-2213. 96. Saberi A, Chen В. M., Sanutti P. Hx-optimal control. — Prentice Hall, 1996. 97. Sannuti P., Saberi A. A special coordinate basis of multivariable linear systems — finite and infinite zero structure, squaring down and decoupling // International Journal of Control. — 1987. — V. 45. — P. 1655-1704. 98. Sayed A.H. A framework for state-space estimation with uncertain models // IEEE Transactions on Automatic Control. — 2001. — V. 46, №7. — P. 998-1013. 99. Sebald A., Haddad A. Robust state estimation in uncertain systems: Combined detection-estimation with incremental mesa criterion // IEEE Transactions on Automatic Control. — 1977. — V. 22, №5. — P. 821-825. 100. Slotine J., Hendricks J., Misawa E. On sliding observers for nonlinear systems // Transactions of the AMS. Journal of dynamic systems, measurement and control. — 1987. — V. 9. — P. 245-252. 101. Sundareswaran K.K., McLane P.J., Bayoumi M.M. Observers for systems with arbitrary plant disturbances // IEEE Transactions on Automatic Control. - 1977. - V.22, №5. - P. 870-871. 102. Takahashi R.HC. Discrete-time singular observers: -optimality and unknown inputs // International Journal of Control. — 1999. — V. 72, №6. — P. 481-492. 103. Tan C.P., Edwards C. Sliding mode observers for robust detection and reconstruction of actuator and sensor faults // International Journal of Robust and nonlinear control. — 2003. — V. 13, №5. — P. 443-463. 104. Trinh H, Ha Q.P. Design of linear functional observers for linear systems with unknown inputs // International Journal of Systems Science. — 2000. — V.31, №6. - P. 741-749. 105. Tsui C.C. A new design approach to unknown input observers // IEEE Transactions on Automatic Control. — 1996. — V. 41, №3. — P. 464-467.
Список литературы 223 106. Tuel W.G. Jr. An improved algorithm for the solution of discrete regulation problem // IEEE Transactions on Automatic Control. — 1967. — V. 12. — P. 522-528. 107. Utkin V.I., Guldner J., Shi J. Sliding mode control in electromechanical systems // Systems and Control Series. — Taylor and Francis, 1999. 108. Valcher M.E. State observers for discrete-time linear systems with unknown inputs // IEEE Transactions on Automatic Control. — 1999. — V. 44, №2. — P. 397-400. 109. Walcott B.L., Zak S.H. Comparative study of nonlinear state-observation techniques // International Journal of Control. — 1987. — V. 45. — P. 2109-2132. 110. Wang Z., Unbehauen H. A class of nonlinear observers for discrete-time systems with parametric uncertainty // International Journal of Systems Science. - 2000. - V. 31, № 1. - P. 19-26. 111. Wonham W.M. Linear multivariable control: A geometric approach // Lecture Notes in Economics and Mathematical Systems. — Berlin: Springer, 1974. 112. Xiong Y., Saif M. Sliding mode functional observers and its application for robust fault diagnosis // Technical report. — Simon Eraser University, 1998. 113. Xiong Y., Saif M. Unknown disturbance inputs estimation based on a state functional observer design // Automatica. — 2003. — V. 39, №8. — P. 1389-1398. 114. an Xing-Gang, Lam J., Xie L. Robust observer design for non-linear interconnected systems using structural characteristics // International Journal of Control. - 2003. - V. 76, №7. - P. 741-746. 115. Yang F., Wilde R.W. Observers for linear systems with unknown inputs // IEEE Transactions on Automatic Control. — 1988. — V. 33, №7. — P. 677-681. 116. Yiiksel Y.O., Bongiorno J.J. Observers for multivariable systems // IEEE Transactions on Automatic Control. — 1971. — V. 16. — P. 603-621. 117. Youssouf A., Kinnaert M. Partial state estimation in presence of unknown inputs // European Control Conference. — Brussels, 1-4 July, 1997. 118. Zak S.H., Hui S. Output feedback in variable structure controllers and state estimation of uncertain nonlinear dynamical systems // IEE Proceedings — Control Theory and Applications. — 1993. — V. 140. — P. 41-50. 119. Zhou K., Doyle J. Essentials of robust control. — New York: Prentice Hall, 1998. 120. Zhou K., Doyle J.C., Glover K. Robust and optimal control. — New York: Prentice Hall, 1996. 121. Zinober A., Owens D. Nonlinear adaptive control // Lecture Notes in Control and Information Sciences. — Springer Verlag, 2001. 122. Darouach M. Existence and design of functional observers for linear systems // IEEE Transactions on Automatic Control. — 2000. — V. 45, №5. - P. 940-943. 123. Trinh H., Tran T.D., Nahavandi S. Design of scalar functional observers of order less than (i/ - 1) // International Journal of Control. — 2006. — V. 79, №12. - P. 1654-1659.
Научное издание КОРОВИН Сергей Константинович ФОМИЧЕВ Василий Владимирович НАБЛЮДАТЕЛИ СОСТОЯНИЯ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ С НЕОПРЕДЕЛЕННОСТЬЮ Редактор И.Л. Легостаева Оригинал-макет: ИТ. Андреева Оформление переплета: И.В. Гришина Подписано в печать 12.04.07. Формат 60x90/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 14. Уч.-изд. л. 15,4. Тираж 400 экз. Заказ № 1112. Издательская фирма «Физико-математическая литература» МАЙК «Наука/Интерпериодика» 117997, Москва, ул. Профсоюзная, 90 E-mail: fizmat@maik.ru, fmlsale@maik.ru; http://www.fml.ru Отпечатано с готовых диапозитивов в ППП «Типография «Наука» 121099, г. Москва, Шубинский пер., 6