Текст
                    ТЕОРЕТИЧЕСКИЕ
ОСНОВЫ
ТЕХНИЧЕСКОЙ
КИБЕРНЕТИКИ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУР Ы
МОСКВА 1976

А. В. СОЛОДОВ МЕТОДЫ ТЕОРИИ СИСТЕМ В ЗАДАЧЕ НЕПРЕРЫВНОЙ ЛИНЕЙНОЙ ФИЛЬТРАЦИИ ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1 9 7 С
6Ф6.5 С 60 УДК 62-50 Методы теории систем в задаче непрерывной линейной фильтрации, Солодов А. В., Главная редакция физико-математической литературы издательства «Наука», М., 1976, 264 стр. Интенсивно развивающееся научное направление, получившее наименование теории систем, обобщает и развивает ряд основных результатов в области уп- равления и контроля на базе современного математи- ческого аппарата функционального анализа. Книга знакомит широкий круг научно-техниче- ских работников с основными идеями и концепциями теории систем применительно к решению конкретной задачи многомерной линейной фильтрации. Приводятся основные определения теории систем, дается совре- менная трактовка свойств линейных динамических систем и элементов теории марковских процессов и на этом материале достаточно подробно излагается теория фильтров Калмана — Бьюси. Книга рассчитана па широкий круг специалистов, работающих в области проектирования систем управ- ления, а также на студентов втузов. Табл. 5. Илл. 105. Библ. 28 назв. 30501—063 С 053(02) 76 106‘7С © Главная редакция физико-мачематической литерату ры издательства «Наука», 1970.
ОГЛАВЛЕНИЕ Предисловие................................................................ 7 Введение................................................................... 9 Глава 1. Основные определения общей теории систем . 13 § 1. Вводные замечания.................. 13 § 2. Множества, пространства и отображения ... 14 § 3. Динамическая система........................ 35 § 4. Управление........................ 47 Глава 2. Линейные динамические системы................................ 57 § 5. Линейные пространства.................. 57 § 6. Линейная динамическая система.............. 73 § 7. Переходная матрица и матрица импульсных пе- реходных функций линейной системы.................. 76 § 8. Пространство состояний системы................................. 91 § 9. Структурные схемы линейных систем............................. 100 § 10. Управляемость и наблюдаемость объектов уп- равления ......................................... 121 Глава 3. Описание случайных процессов.................................... 128 § 11. Случайный процесс и его характеристики . . . 128 § 12. Преобразование случайного процесса линейной системой.......................................... 138 § 13. Диффузионный процесс Маркова.................................. 146 Глава 4. Фильтр Колмогорова — Випера..................................... 165 § 14. Задача линейной фильтрации случайных процес- сов. Уравнение Винера — Хопфа..................... 165 § 15. Оптимальная передаточная функция фильтра при стационарном входном сигнале ..................... 170 § 16. Выбор оптимальных параметров фпльтра методом моделирования..................................... 181 § 17. Линейная (фильтрация на ограниченном интервале времени с равной нулю динамической ошибкой 188
6 ОГЛАВЛЕНИЕ Глава 5. Фильтр Калмана — Бьюси....................... 199 § 18. Задача оценки состояния объекта управления при наличии случайных воздействий.................... 199 § 19. Ортогональные проекции в линейных простран- ствах н векторно-матричное уравнение Винера — Хопфа............................................ 205 § 20. Общая теория фильтра Калмана — Бьюси . . . 212 § 21. Определение матрицы дисперсий ошибок филь- трации .......................................... 226 § 22. Фильтрация шума измерителей системы управ- ления летательного аппарата....................... 232 Литература............................................ 257 Предметный указатель.................................. 259
ПРЕДИСЛОВИЕ Теория систем — это современная трактовка обобщен- ного описания свойств и качеств сложных взаимодей- ствующих объектов. Отличительной особенностью тео- рии систем является ее построение как раздела приклад- ной математики. Это обстоятельство определяет строгость изложения и применение современного математического аппарата, однако оно же почти исключает непосредствен- ные практические рекомендации. В частности, строгая постановка и решение в теории систем задачи многомер- ной линейной фильтрации случайных процессов, вызвав- шая большой интерес специалистов по проектированию автоматических систем, все еще остается мало доступной широкому кругу инженерно-технических работников. Одной из причин этого является довольно абстрактный уровень изложения в большинстве имеющихся руководств, с привлечением понятий функционального анализа, не входящего пока, к сожалению, в курс математики боль- шинства технических высших учебных заведений. Естественным выходом из создавшегося положения является популяризация методов современной теории систем и ознакомление с их возможностями путем крат- кого и относительно простого изложения теории с бо- лее детальным рассмотрением конкретной задачи. В предлагаемой читателю книге такой задачей яв- ляется построение линейных фильтров для многомерных марковских случайных процессов, получивших наимено- вание фильтров Калмана — Бьюси. В основу книги, состоящей из пяти глав, положен прочитанный автором курс лекций, что, естественно, наложило свой отпечаток на стиль изложения. Первая глава посвящена изложению основных опре- делений теории систем. Для этой цели вначале приводятся краткие сведения из функционального анализа, что поз- воляет в дальнейшем формулировать определения па со- временном уровне.
8 ПРЕДИСЛОВИЕ Во второй главе рассматриваются современные аспек- ты теории линейных систем — общее определение в тер- минах векторных пространств, понятия переходной мат- рицы, пространства состояний, управляемости и наблюдае- мости линейных объектов. В третьей главе даны в сжатой форме элементы описа- ния случайных процессов, причем основное внимание уделено рассмотрению диффузионного процесса Маркова. Четвертая глава носит, главным образом, методический характер и является связующим звеном между класси- ческой теорией фильтрации Колмогорова — Винера и современной теорией Калмана — Бьюси. Помимо этого, важно было показать как различие, так и общность упо- мянутых двух подходов к решению задачи линейной фильтрации. Наконец, пятая глава посвящена достаточно подроб- ному изложению теории фильтра Калмана — Бьюси по той схеме построения, которая дана ее авторами. Иными словами, рассмотрено содержание математической задачи фильтрации, поставленной и решенной упомянутыми выше авторами, без привлечения целого ряда имеющихся в на- стоящее время интерпретаций теории. Это сделано с целью привлечения внимания к самой сути задачи, что позволя- ет в дальнейшем изучать другие аспекты теории более целеустремленно. Автор хорошо понимает, что материал книги ни в коей мере не охватывает большинство поставленных в ней вопросов. Скорее его можно рассматривать как краткое введение в круг тех увлекательных задач современной тео- рии систем, которые сейчас являются ее основным содер- жанием. Наряду с другими причинами, это объясняется и недостаточным опытом создания подобных руководств. Автор весьма признателен члену-корреспонденту АН СССР Е. П. Попову за поддержку и советы при созда- нии книги и рецензенту доктору технических наук про- фессору И. Е. Казакову за ряд ценных замечаний, поз- воливших улучшить ее содержание. Он выражает искреннюю благодарность кандидату технических наук доценту Ф. С. Петрову за большую работу по редактированию книги. А. В. Солодов
ВВЕДЕНИЕ Характерной особенностью развития теории автомати- ческого управления в последнее десятилетие является все большее ее разделение на две ветви — математическую и прикладную. В недалеком прошлом такие разделы теории автомати- ческого управления, как оптимальные системы, статисти- ческая динамика систем, дискретные системы и другие, изучались начиная с изложения теоретических вопросов и кончая вопросами проектирования. При этом теоретическая часть соответствующих руко- водств обычно строилась как обеспечивающая исходными математическими соотношениями прикладную часть, в которой детально рассматривались и решались задачи проектирования. Используемый математический аппарат, как правило, не выходил за рамки обычных курсов выс- шей математики для втузов. Рассмотрению методологиче- ских основ теории, исходных фундаментальных положе- ний и формулировок не придавалось доминирующего значения в силу практической направленности изложения. На определенном этапе такой подход к изучению раз- делов теории автоматического управления был оправдан и в методическом отношении, по-видимому, был наиболее целесообразен. Однако, по мере все более интенсивного расширения задач управления и их усложнения в мате- матическом отношении, построенные по традиционной схе- ме руководства становятся громоздкими и содержат до- вольно разнородный материал. В то же время постоянно возрастал интерес к задачам управления со стороны математиков, работы которых
10 ВВЕДЕНИЕ характерны общностью постановки задач и строгим сти- лем изложения. Наметилась совершенно четкая тенденция к обобще- нию основных, фундаментальных аспектов большинства разделов теории автоматического управления в единую ветвь — математическую теорию с характерными для нее точными и строгими формулировками и доказатель- ствами. Оказалось, как это нередко бывает, что целый ряд тео- ретических результатов разделов теории автоматического управления известен современной математике в другой, чисто математической, интерпретации. Это обстоятель- ство довольно быстро привело к появлению ряда работ, в которых известные теоремы математики в несколько ви- доизмененной форме излагались как строгие обоснования соответствующих положений теории автоматического управления. С другой стороны, уже довольно давно назрела настоя- тельная необходимость в обобщении ряда результатов теории автоматического управления на единой методоло- гической основе, как это, например, имеет место в теории информации. При этом сразу выявилась узость аппа- рата классического анализа для подобных обобщений, поскольку он не мог освободиться от влияния конкрет- ной физической природы тех или иных задач управления. А там, где пришлось иметь дело со множествами элемен- тов и явлений, не выражаемых в явном виде числами, клас- сический анализ вообще оказался непригодным. Функциональный анализ, как новый математический аппарат, получивший наиболее интенсивное развитие в последнее двадцатилетие, явился тем средством, с по- мощью которого стало возможным как обобщение изве- стных результатов, так и получение новых. Таким образом возникло научное направление, назы- ваемое сейчас теорией систем
ВВЕДЕНИЕ 11 Достаточно полное представление о предмете теории систем и ее содержании дают книги Н. Н. Красовского 116], Р. Калмана, П. Фалба и М. Арбиба [12]. К этому же направлению относятся работы А. М. Летова [18], У. Портера [21], Л. Заде и Ч. Дезоера [8]. Наряду с обобщением и более строгим в математическом отношен!.и изложением ряда основных положений теории автоматиче- ского управления, теория систем содержит ряд новых важ- ных результатов. Большинство из них опирается на по- нятие пространства состояний (фазового пространства) системы, являющееся естественным приложением понятий функционального анализа к теории систем. Однако, как и во всякой математической теории, новые результаты теории систем ограничены той степенью детализации, которая необходима для завершенности принципиальных выводов данной задачи. Что касается практических ре- комендаций, то они чаще всего требуют порой значитель- ных дополнительных исследований и разработок, приво- дящих, как правило, к самостоятельным новым резуль- татам. Такова логика научного исследования. Одним из результатов теории систем является разра- ботка строгой теории линейной фильтрации многомер- ных марковских процессов, принадлежащая Р. Калману и Р. Бьюси [11]. Эта работа, которая вначале не привлек- ла к себе особого внимания специалистов в области проек- тирования систем, в дальнейшем вызвала большой ин- терес и стала предметом изучения значительного числа научно-технических работников этой области. Причиной такого повышенного интереса к ней является как сам подход к задаче фильтрации, опирающийся на понятие переменных состояния систем, так и математическая форма представления оптимального фильтра. Последнее обстоя- тельство оказалось наиболее существенным с точки зре- ния практической реализации результатов теории, по- скольку описание оптимального фильтра получено в форме
12 ВВЕДЕНИЕ векторно-матричных дифференциальных уравнений. Как известно, в этом случае в полной мере реализуются все достоинства современной вычислительной техники. Привлекательность новой теории фильтрации привела к тому, что ее результатами стали пользоваться и в тех случаях, когда правомерность их применения не вытекала из постановки задачи и метода ее решения. Это явилось следствием недостаточно глубокого изучения теории. В свою очередь, последнее обстоятельство объяснялось довольно значительным разрывом между уровнем изложе- ния теории и той математической базой, на которую опи- рается значительная часть специалистов-практиков по системам управления. Одно следствие влечет за собой дру- гое, и перед специалистом, желающим на практике исполь- зовать достижения теории, возникает длинная цепочка задач по изучению как основ современной теории систем, так и соответствующего математического аппарата. По всей видимости, эту цепочку необходимо было бы реализовать при подготовке соответствующих специали- стов, но это требует значительного времени. Поэтому важно ускорить процесс проникновения достижений тео- рии систем в практику проектирования систем управ- ления и контроля. Для этого особенно целесообразны популяризация идей и концепций теории систем, ознаком- ление с отдельными ее результатами на необходимом уров- не строгости и в то же время с максимальной доступно- стью для широкого круга научно-технических работни- ков. Предлагаемая книга и является попыткой внести определенный вклад в решение этой важной и трудной задачи.
ГЛАВА 1 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ § 1. Вводные замечания Общая теория систем все больше развивается в русле строгих определений и доказательств. Это обстоятельст- во предопределяет характер ее построения, приближаю- щийся к принципам построения разделов математики. Как известно, в математике существуют некоторые поня- тия, не поддающиеся вполне строгим определениям и до- казательствам. Это те начальные, исходные понятия, которые кладутся в основу всех дальнейших предложе- ний — теорем, составляющих рассматриваемую теорию. Обычно они определяются набором утверждений и пере- числением их свойств в форме так называемых аксиом. Система аксиом и является той базой, тем фундаментом, на котором стоит вся теория. Хорошо известна, напри- мер, система аксиом Гильберта в геометрии, определяю- щая понятия точки, прямой и плоскости. В теории чисел натуральные числа определяются аксиомами Пеано, и т. д. Важно подчеркнуть, что системы аксиом должны удов- летворять ряду логических требований — полноте опре- деления, непротиворечивости и другим. В каждом кон- кретном случае эти требования определяются особо. Понятно, что если подобным образом строится общая теория систем, то в ее основе должен лежать ряд опреде- лений в форме системы аксиом. Вполне естественно начать изложение с определения самой системы и затем' пе- рейти к определению понятия управления. При этом с самого начала уместно заметить, что стремление дать аксиоматическое определение системы и управления не является самоцелью. Опо необходимо хотя бы для того, чтобы говорить на одном языке в пределах тех концеп- ций, которые имеют место в общей теории систем. С другой стороны, вводимые определения должны обес- печить возможность развития соответствующей теории
14 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 на основе определенного математического аппарата. Ины- ми словами, эти определения должны формулироваться в терминах того математического аппарата, который ис- пользуется прщ построении теории. Во введении уже упоминалось, что таковым в общей теории систем является функциональный анализ. Дело заключается в том, что обобщенное представление системы и управления, при- годное для изучения и исследования широкого класса процессов управления в технических, биологических, эко- номических и других системах, приводит к целесообраз- ности их рассмотрения, как некоторого установленного соответствия между элементами классов входных и вы- ходных сигналов. Такое рассмотрение, в свою очередь, предопределяет использование аппарата функциональных пространств, элементами которых являются функции входных и выходных сигналов. Теория функциональных пространств и является сердцевиной функционального анализа. Понятно, что рассмотрение основных положений функ- ционального анализа не входит в нашу задачу, но в то же время мы практически на протяжении всей книги бу- дем пользоваться его определениями и терминологией. Для этого в необходимых местах будут даваться краткие сведения из тех разделов функционального анализа, ко- торые необходимы по ходу изложения основного мате- риала. § 2. Множества, пространства и отображения Множества. Множеством А называется некоторая совокупность элементов или объектов, объединенных в единое целое в соответствии с некоторым правилом. Если элемент множества обозначить через х, то сим- волическая запись того, что элемент х принадлежит множеству А, записывается так: х^А. (1.1) Если элемент х не принадлежит множеству А, то это об- стоятельство записывается так: х^А. (1.2)
§ 21 МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 15 При определении множеств необходимо указать свойства их элементов. В развернутом виде это можно сделать не- посредственно,’ например: А — { состоит из х, где х — целые числа} или А = {состоит из х, где х — почетные числа}. Однако такая запись не экономична и не всегда может точно определить свойства множества. Поэтому в теории множеств применяется следующая символическая за- пись: А = {х: р (.г)}, (1.3) которая читается так: множество А состоит из всех эле- ментов х, таких, что они обладают свойством р (х). Рассмотрим, например, множество чисел х = 2П, где п принимает значения 0, 1, 2,. . ., Q. Это множество мож- но записать так: А = {х: х = 2П, п — 0, 1, 2,. . ., ()}. Из множества элементов х можно выделить подмножество, которое содержит часть элементов х. Символически это записывается так: В<=А, (1.4) т. е. В является подмножеством множества А. Подмножество удовлетворяет следующему определе- нию: В называется подмножеством А (В С Л) тогда и только тогда, когда из условия х ЕЕ В следует, что х GE ЕЕ А. При этом не исключается и случай, когда В — А. На практике часто попользуются подмножества веще- ственной числовой оси. Если а и 6 — два вещественных числа, причем а < Ъ, то имеют место следующие терми- нология и обозначения. Отрезок с началом а и концом Ъ [a, ft] = {х: а х ft}. (1-5) Промежуток, открытый в а в замкнутый в ft, (a, ft] — {х : а <Ех 6}. (1.6) Промежуток, замкнутый в а и открытый в ft, [а, Ъ) = {х: а х < ft}. (1-7)
If, ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 Интервал с концами в а и Ъ (a, b) = {х: a <Z х < Ь}. (1.8) Иногда бывает необходимо использовать понятие пустого множества, определяемого условием: ф = {х: х Ф х}, (1.9) где символ ф обозначает пустое множество. Из условия (1.9) следует, что множество ф не содержит элементов, так как не существует х, которое бы удовлетворяло ус- ловию х х. Два множества А и В эквивалентны (или равны) в том случае, когда они состоят из одних и тех же элементов, т. е. из условия х е А следует, что х ЕЕ В, и наоборот. Для множеств имеют место следующие алгебраиче- ские операции. Объединение (обозначается символом (J) A [J В — {ж: х Е: А или х ЕЕ В}. (1.10) В объединенном множестве имеются все элементы, при- надлежащие либо множеству А, либо множеству В, либо обоим одновременно (рис. 1.1, а). Пересечение (обозначается символом f]) А В = {х: х ЕЕ А и х ЕЕ В). (1.11) В пересечении одновременно имеются элементы как из множества А, так и из множества В (рис. 1.1, б). Отсюда, в частности, вытекает следствие, что А будет подмножест- вом В тогда и только тогда, когда пересечение А в В образует множество А (рис. 1.1, в) Лс В=> А П В = А (1.12) (символ => обозначает логическое следование). Разность (обозначается символом \) Л \ В = {ж: жЕ Л и хе£ В}. (1.13) При вычитании из множества А множества В из первого выбрасываются все элементы, попадающие в пересечение А и В (рис. 1.1, г). Следствием этого правила является условие, при котором А является подмножеством В (т. е. А сг В) тогда и только тогда, когда А \ В = ф.
§ 2] МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 17 Дополнение (обозначается штрихом над буквой) А' = {х: х А}. (1.14) При дополнении множества А оно как бы окружается множеством А', не имеющим элементов в А (рис. 1.1, д). Для наглядности в таблице 1 приведены рассмотрен- ные выше алгебраические действия над множествами. Важнейшим понятием теории множеств является по- нятие произведения множеств. Пусть даны два непустых множества и Х2. Тогда произведением этих множеств (обозначается символомх) будет множество, определяемое формулой •Х* X Х2 — {(я^, я?2): GS А* и %2 ЕЕ Х2}. (1.15) Таким образом, произведением двух множеств будет но- вое множество, представляющее собой совокупность всех упорядоченных пар элементов этих двух множеств (хц, x2j), таких, что х-ц принадлежат множеству Хг и x2j принадлежат множеству Х2. Хорошей иллюстрацией подобного произведения яв- ляется множество точек на плоскости, представляющей
18 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ 1ГЛ. 1 Таблица 1 м Наименова- ние операции Обозначение и формула Графическое изображение 1 Объедине- ние A U В = {х: х £ А или х е В} А В f/Л //т////^к \////////Шш71 /Л AUB 2 Пересече- ние А р| В = {х: х £ А и хе В} А В AfiB 3 Разность А\В = {г: х е А и х & В} А В А\В 4 Дополнение А' = {ж: х & Л) Ff Ж. J/////
§ 2] МНОЖЕСТВА, ПРОСТРАНСТВА II ОТОБРАЖЕНИЯ 19 собой прямоугольник со сторонами в виде числовых осей (рис. 1.2). Если одна ось представляет собой множество чисел Хх, а вторая ось — множество чисел Х2, то все возможные точки с координатами (ж1;, гг27) образуют мно- жество Х12, являющееся произведением множеств Хл X Х2. Определение произве- дения множеств легко обобщается на случай п множеств. Соответствую- щая формула будет иметь вид Х\ X Х2 X . . . X Хп = {С*!, • ч Э“п)- GE Xlt х2 (ЕЕ А2, . . ., хп^Хп}. (1.16) Если все перемножаемые множества эквивалентны, упростится: хп = {xt е х, Рис. 1.2. то формула произведения i = 1, 2,. . ., п}. (1.17) Последняя формула имеет хорошую иллюстрацию в ви- де n-мерного числового пространства. Действительно, чис- ловая ось является множеством вещественных чисел (обозначается R1). Тогда вещественная плоскость есть произведение двух одинаковых множеств R1 X R1 = R2, трехмерное пространство — произведение трех одина- ковых множеств R1 X R1 X R1 — R3, n-мерное прост- ранство — произведение п одинаковых множеств в виде числовых осей. Рассмотрим теперь подмножество А множества В, та- кое, что А =/= В. В этом случае множество А называется собственным подмножеством множества В и обозначается A GZ В. (1.18) Пусть А есть некоторое ограниченное подмножество мно- жества В. Ограниченность подмножества А определяется существованием такого х0 ЕЕ В, что для любого х х0 справедливо соотношение х ЕЕ А: | х | хй ЕЕ В. (1.19)
20 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 Тогда верхней гранью множества А называется элемент xs €Е В, такой, что если хЕЕ А, то все элементы х бу- дут меньше (или равны) xs: xEE:A=^x^xsEEB. (1.20) Наименьший из элементов, образующих верхние грани, называется точной верхней гранью (обозначается supremum или sup). Аналогично точной нижней гранью (обозна- чается infimum или inf) множества А называется наи- меньший из элементов xi} таких, что если хЕЕ А, то все элементы х будут больше (или равны) хр. x^A=^x^xt^B. (1.21) Точная верхняя грань множества А обозначается sup (А), нижняя грань множества А обозначается inf (Л). Если наибольший и наименьший элементы принадле- жат множеству А, то последнее имеет максимум и минимум, обозначаемые шах (А) и min (А). Очевидно, что если sup (А) = А, тотах (А) = sup (А). Это же условие отно- сится и к нижней грани и минимуму. Однако обратная за- висимость места не имеет. Иллюстрируем сказанное сле- дующим примером. Пусть множество В определяется все- ми действительными числами на отрезке [0, 1]: В = [а, Ъ], где а — 0, b = 1. Множество А определим как все числа 1 — eq, где чис- ло q принимает значения от 0 до оо: А = {х: 1 — е-9, q [0, оо)}. Ясно, что число х ЕЕ А будет изменяться от х = 0 (при значении q = 0), асимптотически приближаясь к единице по мере стремления q к бесконечности. Однако элемент х никогда не примет значения, равного единице, следова- тельно, число 1 множеству А не принадлежит. Таким об- разом, верхней гранью множества А будет число 1, а максимума множество А не имеет. Пространства. Множество с определенными соотно- шениями между элементами или операциями над ними называется пространством. Одним из простейших соотношений между элементами множества является расстояние между ними. Например, расстояние между числами х и у числовой оси определяется числом | х — у |, на плоскости из двух
§ 2] МНОЖЕСТВА, ПРОСТРАНСТВА II ОТОБРАЖЕНИЯ 21 взаимно перпендикулярных числовых осей это величина (см. рис. 1.3) d = /(zi — уД2 + (а-2 — у2)2, и т. д. Однако понятию расстояния между элементами мно- жества можно придать более общий характер. Важно лишь, чтобы это понятие было строго определено. Рис. 1.3. Пусть А есть некоторое непустое множество. Расстоя- нием или метрикой элементов множества А называется некоторая зависимость р (х, у) пары элементов х и у множества А, такая, что всегда выполняются следующие три условия, называемые аксиомами метрического про- странства'. 1) р(а“, у)>0, причем р(х, у) — О, если х = у; 2) р (ж, у) = р (у, х) (аксиома симметрии); 3) p(z, z)<p(z, у) + р(у, z) (z,y,zeX) (аксиома неравенства треугольника). Теперь дадим следующее определение. Метрическим пространством называется некоторое непустое множество А с метрикой р, определенной в этом множестве. Понятно, что определить метрику в множестве можно не единственным образом. Различные метрики приводят к различным метрическим пространствам. Для иллю- страции сказанного приведем три примера метрических пространств.
22 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ 1ГЛ. 1 Евклидово пространство Еп. Вначале рассмотрим мно- жество точек в трехмерном пространстве Я3, образован- ном произведением трех одинаковых множеств в виде ве- щественных числовых осей R1. Расстояние, или метрика, между любыми двумя точками хну этого пространства Гис. 1.4» определится как длина диагонали прямоугольного парал- лелепипеда со сторонами (л^ — уг), (х2 — у2), (х3 — Уз) (рис. 1.4): d = — yj2 + (х2 — у2)2 4- (х3 — у3)2. Обобщая зту формулу на случай произведения п число- вых осей, получим метрику n-мерного евклидова прост- ранства Р У) = (®i — У»)2- (1-23) Легко проверить, что она удовлетворяет аксиомам (1.22). Пространство ограниченных по спектру сигналов. Рассмотрим некоторое множество сигналов в виде непре- рывных функций времени х (/), имеющих максимальное значение Хт, минимальное значение 0 и обладающих
§ 2] МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 23 свойствами: X (/со) при СО С0с, О при СО С0с, где X(/со) = J х(f)e~}u,tdt, 0 —со Таким образом, каждый из этих сигналов является ог- раниченным по спектру и по времени. В соответствии с известной теоремой отсчетов [25] такие сигналы прибли- женно можно представить следующим рядом: п «(/) = S % (kbt) fc=l sin <вс (t — k&t) сос (t — k&t) где n = 2FT; F — ширина спектра сигнала, Гц; сос = = 2rtF; Т — длительность сигнала, с. Это позволяет пред- ставить непрерывную по времени функцию X (t) в виде серии импульсов специальной формы (функции отсчетов), максимумы которых отстоят друг от друга на интервалы времени Д£ (рис. 1.5). Обозначив А-й импульс через xk(t): xk(t) = X (7сД£) sin toc (t — k&t) ыс (t — k&t) видим, что все импульсы рассматриваемой последова- тельности отличаются друг от друга только значением X (k&t). Следовательно, для данной позиции к на оси
24 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 времени значение импульса определяется множеством дей- ствительных чисел в пределах от 0 до Хт. При этом мно- жество всех возможных значений сигнала х (£) во все мо- менты времени kht (к = 1, 2,. . п) есть произведение множеств чисел на данной позиции. Это произведение множеств после введения метрики образует метрическое пространство, в котором каждая из конкретных функций времени х (f) представляется в виде одного элемента — произведения значений функции в моменты k&t. Рассмотрим в полученном множестве две функции вре- мени — x(t) и y(t), фиксируем момент времени на к-м интервале (рис. 1.6) и введем метрику р(т, y)^V2F(Ec-2TKxv), где Ес — полная энергия сигналов (полагаем, что энер- гии сигналов х (Z) и у (t) одинаковы), п Xxv = -^- 2 X (кЫ) Y (А-Д«), п = 2FT, К=1 — коэффициент взаимной связи сигналов x(t) и y(t). Можно показать [25], что энергия одного импульса сигна- ла равна Ехк = ^-ХЦк^)
§ 2J МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 25 ИЛИ Еук = -^-¥ЦкМ). Тогда полная энергия сигналов будет п п ес=^-^ X2(k/W> = 4г 2 у2 (АДо- к=1 к=1 Подставляя эти выражения в формулу для метрики р (.г, у), получим Р (*, У) = = [4- 2 Х2 + 4~ 2 уг (*до - 2 х (*до Y (АДо] ’ fc=l /с=1 Л,=1 или, окончательно, Р у) = [Х(кЫ)~ У (ЛАП2- (1.24) Сравнивая полученное выражение с формулой (1.23), ви- дим, что введенная метрика (1.24) определяет простран- ство сигналов как «-мерное евклидово пространство. Пространство двоичных кодов Хэмминга. В теории кодирования для исследования корректирующих двоич- ных кодов Хэмминга [2а] введено специальное метриче- ское пространство, называемое кодовым пространством или пространством Хэмминга. Рассмотрим множество чисел, записанных в двоичной системе счисления, N II = х = 2 аг2*| , где щ = 0; 1, 1 4=0 J причем двоичное число образуется последовательной за- писью коэффициентов аг, начиная со старшего разряда. Очевидно, в каждом разряде может быть только два зна- чения чисел — 0 и 1. Рассматривая каждый разряд как множество чисел, состоящее всего из двух элементов D = {0; 1},
26 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ 1ГЛ. 1 получим множество всех двоичных чисел как произведение N одинаковых множеств D: Н = DN. Введем в множестве Н следующую метрику: р (х, у) = 21. (х © у), (1.25) где х ф у обозначает сумму двоичных чисел х и у по мо- дулю 2, a 2j — число единиц в полученной сумме. Правило суммирования двоичных чисел по модулю 2 определяется следующими соотношениями: 14-1 = 0; 0 + 1 = 1 + 0 = 1; 0 + 0 = 0. Теперь легко видно, что метрика (1.25) удовлетворяет пер- вым двум аксиомам метрического пространства, так как сумма по модулю 2 действительно дает число единиц, большее или равное нулю, и коммутативна. Соответствие метрики (1.25) условиям третьей аксиомы проще всего проверить на примере. Рассмотрим три произвольных двоичных 9-разрядных числа: х = 110010101 (405); у = 101101111 (367); z = 111101111 (495), где в скобках показаны их значения в десятичной системе. Согласно третьей аксиоме имеем р (х, z)< р (х, у) + р (у, z) или, используя формулу (1.25), 21 («Ф z)< 2Х (х ф у) + 2Х (у ф z). Применяя формулы сложения по модулю два, получим следующие суммы: X Ф Z = 001111010, х ф у = 011111010, у ф z = 010000000.
§2] МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 27 Легко видеть, что число единиц в каждой из сумм будет 21 (ж ф z) = 5, 2i (« Ф У) = 6, 2Х {у ф z) = 1, и третья аксиома метрического пространства удовлетво- ряется. Если представить в полученном метрическом прост- ранстве систему координат из N осей, на каждой из кото- рых откладывается лишь два значения разряда, О или 1, то все двоичные числа будут располагаться на вершинах TV-мерного куба, длина ребер которо- го равна единице. На рис. 1.7 показана трехмер- ная модель для TV = 3. Таким образом, расстоя- ние в пространстве Хэм- минга есть, по существу, наименьшее число ребер, которое необходимо прой- ди из точки х в точ- ку у. На рис. 1.7 показа- но расстояние р = 2 меж- ду точками 011 и 101. В рассмотренных трех примерах метрических прост- ранств уже довольно наглядно видна общность подхода к изучению множеств независимо от их физической струк- туры. Используя одно и то же понятие метрического про- странства, изменяя лишь его метрику, мы получили воз- можность представления в этом пространстве совершен- но различных по структуре множеств. Перейдем теперь к изложению важного в теории функ- циональных пространств понятия сходимости последова- тельности элементов некоторого множества. Последовательность элементов х (обозначается {ж,,}) метрического пространства X будет сходящейся, если су- ществует предел х ЕЕ X.
28 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 Не приводя общего доказательства, опирающегося на понятие метрики, рассмотрим в общих чертах ход дока- зательства на примере двумерного метрического прост- ранства R2 всех вещественных чисел. Напомним вначале, что последовательность веществен- ных чисел хг, х2,. . хп называют сходящейся, если су- ществует такое вещественное число ж, являющееся преде- лом последовательности, что для произвольного числа е^> > 0 найдется некоторое по- ложительное целое число п0, такое, что если п п0, то |«п — «| < е- Рассмотрим теперь на плоскости R2 числа хт, хп и х и определим для них рас- стояния (метрики) р(хт, х), р (хп, х) и р (хт, хп). Опишем рис j 8 вокруг точки х окружность радиуса е (рис. 1.8). Если при каждом значении е О всегда найдется такое число ТУ, что при т N расстоя- ние р (хт, х) будет меньше с, последовательность элемен- тов хт будет сходящейся. Если при п N р (хп, х) < с, последовательность элементов хп также будет сходящейся. Но по третьей аксиоме метрического пространства будем иметь Р жп)< р (хт, х) + р (хп, х) < 2е. Следовательно, последовательность всех элементов х про- странства будет сходящейся, если для т, N всегда р (^mi Я'п) <^- а. Дадим теперь общее определение.. Последовательность {жп} элементов метрического про- странства X будет сходящейся (или, иначе, последователь- ностью Коши), если для каждого с 0 всегда найдется такое целое число N, что р (хт, х„) < с при любых т^> N и п^> N. Важно заметить, что не всегда предел х, к которому схо- дится последовательность {^„}, принадлежат данному про- странству. Пусть, например, имеется последовательность
§ 2] МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 29 чисел вида *п=('+Я‘- Как известно, предел для этой последовательности существует Jim п—>ОО С+4-)’- Следовательно, данная последовательность сходится к ир- рациональному числу е. В этом случае метрическое про- странство X, состоящее из всех рациональных чисел, не будет содержать предела последовательности. Мет- рическое пространство всех действительных чисел будет содержать и число е, предел рассматриваемой последова- тельности. Метрическое пространство X называется полным, ес- ли любая последовательность {ж,г} CZ X сходится к не- которому пределу х, принадлежащему X. Рис. 1.9. Отображения. Одним из основных понятий математи- ческого анализа является понятие функции. Функцией называется соответствие (не обязательно однозначное) между множествами чисел. В функциональном анализе понятие функции носит более общий характер. Рассмотрим элементы множества X, принадлежащие подмножеству Ха, и элементы множе- ства У, принадлежащие подмножеству Уь (рис. 1.9): ХОСД, х^Хи; YbCZY, y<=Y,„.
30 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 Если мы установим некоторое соответствие между эле- ментами множеств Ха и Yb в виде правила /, то тем са- мым мы и определим функцию у = f (х). Полное опре- деление упомянутого соответствия формулируется сле- дующим образом. Соответствие /, связывающее с каждым элементом х непустого множества X некоторый элемент у непустого множества Y, называется функцией или отображением I --------------------------------------------------------V--------------------------------------------------------- I I У а I Рис. 1.10. X в Y. Подмножество Ха, на котором зто отображение определено, называется областью определения функции, а подмножество Yb — областью значений этой функции. Символически отображение X в Y записывается сле- дующим образом: /: X-+Y (1.26) и читается так: на множествах X и У задано соответст- вие /, такое, что множество X отображается в У. В более конкретных случаях применяется известная запись в виде У = / (я). Пусть теперь задано отображение X в У с помощью соответ- ствия / (1.26). Тогда подмножество F множества X X У F = {(х, у): у=Цх), х^Хп} (1.27) называется графиком. На рис. 1.10 показана графическая иллюстрация этого определения. Здесь множества X и У
§ 2] МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 31 являются числовыми осями, а их произведение Х'Х У есть множество точек па плоскости. Соответствующие под- множества Ха и Yb определяют подмножество F при ус- ловии выполнения соотношения (1.27). Другими словами, из всего множества точек Ха X Yb график F определяют только вполне определенные пары (ж, у), причем такие, что при данном конкрет- ном значении zE Х(1 значение у определяется из зависимости у = / (ж). Важно отметить, что подмножество F может служить графиком функ- ции /: X У только в том случае, когда для каждого конкретного значения ж ЕЕ Ха в под- множестве F будет толь- ко один элемент (ж, у). В геометрической интер- претации подмножество F может служить графиком функции /: X -> У лишь тогда, когда для каждого элемента ж ЕЕ Ха «вертикаль- ная»*) прямая, проходящая через ж, пересекает F в од- ной точке (рис. 1.11). Отображение (функция) /: X -> У называется взаим- но однозначным, если из равенства / (жД = / (жг) следует равенство жх = ж2 для всех хЕ= Ха- Поскольку для взаимно однозначной функции для каждого значения у из подмножества Уь существует лишь одно значение ж из подмножества Ха, можно поставить задачу отыскания обратного отображения вида g: У-> X, т. е. отображения,! связывающего каждый элемент у с элементом ж. Пусть задано взаимно однозначное отображение /: X У с областью определения Ха С" X и областью значений Уь = У. Если для отображения g: У -> X *) Слово «вертикальная» взято в кавычки по той причине, что это наименование прямой условно.
32 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 на множестве Y X X справедлив график G = {(г/, х) е Y х X: (х, у) е Ха}, то это отображение взаимно однозначно с областью опре- деления Y и областью значений Ха. Отображение g назы- вается обратным и обозначается через /-1, так что Г1 : Y -> X. (1.28) Для иллюстрации введенных понятий рассмотрим пример. Рис. 1.12. Заданы множества X = {х‘. —2 х 2} и Y = R, где R — числовая ось вещественных чисел. Рассмотрим отображение, задаваемое функцией У = / (х) = ж2, с областью определения Ха = {х : 0 ж<^ 2}. Оче- видно, областью значений заданной функции будет Y = {У 0 < у < 4} с графиком (рис. 1.12, а) Р = {(я, У) У = 0< ж< 2). Следовательно, функция у = ж2 с областью определения Ха — {ж : 0 ж 2 } взаимно однозначна и имеет об- ратную функцию ж = У у = / 1 (у)
§ 2] МНОЖЕСТВА, ПРОСТРАНСТВА И ОТОБРАЖЕНИЯ 33 с областью определения Y = {г/:0<^2/<^4}и областью значений Ха = {х : 0 х 2}. График обратной функ- ции показан на рис. 1.12, б. Ес .пи расширить область определения этой же функции у = хг на всё множество X, то она не будет взаимно одно- значной, так как не удовлетворяет определению взаим- ной олаозначности: для одного значения у из Y сущест- вуют два значения х из X (рис. 1.12, а). Одним из важных понятий теории функций является понятие непрерывности. В классическом анализе функция / (ж) называется не- прерывной в точке х = ж0, если, каково бы ни было число е > 0. всегда найдется такое число б 0, что будут спра- ведли :,н неравенства: -ели | х — ж0|< б, то|/(ж)—/ (ж0)[ < е. (1.29) В терминах функционального анализа это определение можнс записать так: отображение / : R -> R будет непре- рывным в точке х0 GE R, если, каково бы ни было число е 0 всегда найдется такое число б 0, что будут спра- ведливы неравенства (1.29). Поскольку в метрических пространствах близость то- чек определяется расстоянием (метрикой), приведенное выше определение естественным образом обобщается на отображения одного метрического пространства в другое. Приведем следующее определение. Ес.т и имеется отображение / : X -> Y, где X и Y яв- ляются метрическими пространствами с метриками рх и р2 ссч гветственно, то отображение (функция) будет не- прерывным в точке х0 GE X при выполнении условия: для к ’ждого е 0 существует такое б 0, что если Pi (ж, ж0) < б, то р2 [/ (ж), / (ж0)] < е. Грг- (пческая иллюстрация данного определения пока- зана н рис. 1.13. Легко видеть, что для случая, когда X и Y являются числовыми осями с метриками рг = | х — х0 | и р2 = у — г/п |, это определение эквивалентно определе- нию непрерывности в классическом анализе. Отображение метрического пространства X в простран- ство Y называется непрерывным на X, если оно непрерыв- но в каждой точке пространства X. 2 А. В Голодов
34 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ 1ГЛ. 1 В данном выше определении непрерывности для каж- дого значения е необходимо подбирать такое значение 6, чтобы выполнялись условия непрерывности Pi («о, ж) < 6 =*> Р2 [/ (ж), / («о)1 < е. Отсюда становится ясным, что 6 зависит как от е, так и от выбора точки хв. Если имеется отображение / : X -> У, Рис. 1.13. для которого при каждом значении е можно найти б, одновременно удовлетворяющее условиям непрерывно- сти для всех точек пространства, то это отображение на- зывают равномерно непрерывным. Существует важный практический вид равномерно не- прерывного отображения, свойства которого определяются следующим образом. Если в метрических пространствах X и У с метрика- ми pj и р2 соответственно имеет место равенство Pl Хо) = Р2 [/ (Д f (Ж(>)] для всех х GE X, то отображение / : X -> У называется изометрическим. Если при этом область определения отображения Ха = X и область значений отображения У(, = У, про- странство X изометрично пространству У. Практически при зтом пространства X и У идентичны. В заключение данного параграфа отметим следующее важное положение. При первоначальном ознакомлении
§ 3] ДИНАМИЧЕСКАЯ СИСТЕМА 35 с введенными здесь понятиями множеств, пространств и отображений невольно возникает вопрос, сколь необхо- димы эти понятия и связанный с ними аппарат для приме- нения в задачах управления? Ведь известны и хорошо разработаны методы описания систем и процессов на ос- нове классического математического анализа. В связи с этим необходимо подчеркнуть, что построе- ние действительно общей теории систем, основные положе- ния и формулировки которой были бы применимы к раз- личным классам систем, возможно лишь на соответствую- щем уровне абстракции. При применении понятий множеств и отображений нам нет необходимости в каждом конкретном случае при- бегать к подчас сложному и искусственному преобразо- ванию исходных данных в привычные математические сим- волы. Эти понятия позволяют непосредственно устанав- ливать функциональную связь совершенно различных по физической природе объектов на строгом математическом уровне. Мы можем, например, говорить о множествах зву- ковой и цветовой гамм и их функциональной связи в задачах исследования цветомузыки, или о системе под- готовки кадров для определенной отрасли 'промышлен- ности, как совокупности множеств людей, знаний, умений и навыков и их отображений на номенклатуру, качество и стоимость продукции, и т. д. В настоящее время возникает все больше задач, в ко- торых задание функции в классическом понимании просто невозможно. Во многих случаях единственная возмож- ность определения функции заключается в перечислении ее значений по мере того, как в отображаемом множестве элемент получает все возможные значения из области оп- ределения. В таких ситуациях классический анализ бес- помощен, в то время как применение функциональных пространств и отображений в них ничем не ограничено. § 3. Динамическая система Обычно, когда что-либо называют системой, то имеют в виду совокупность взаимосвязанных элементов или ча- стей, взаимодействующих с окружающей средой по опре- деленным закономерностям. Более конкретно, система — это устройство, комплекс, объединение, характерное 2*
36 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 наличием входов, т. е. элементов, воспринимающих внешние, входные, воздействия окружающей среды, и наличием выходов, т. е. некоторых физических величин или явлений, характеризующих результат воздействия внешней среды на движение самого устройства, комплекса, объединения. В этом довольно общем описании понятия системы спе- циально не предусматривается конкретизация физичес- ких параметров системы, поскольку мы хотим сформули- ровать строгое определение понятия системы в самом об- щем виде, пригодном для широкого класса задач. Рис. 1.14. Для изучения процессов, протекающих в системах, необходимо уметь определять по текущим значениям входных воздействий выходные величины системы. Для этого необходимо, очевидно, тем или иным образом опи- сать саму систему па языке математики, илп, как принято говорить, создать математическую модель системы. В тео- ретическом плане описание системы предполагает лишь знание ее состояния в данный и последующие моменты времени. Это состояние должно полностью определяться математическими соотношениями, однозначно установлен- ными для данной системы. Таким образом изложенные физические и логические представления приводят нас к общей схеме системы, по- казанной на рис. 1.14. Рассмотрим теперь входные воздействия, состояние си- стемы и выходные величины подробнее, с целью получе- ния более точных формулировок. Входные воздействия естественно в общем случае от- нести к некоторому определенному множеству их мгновен- ных значений, которое обозначим через U, и к множеству моментов времени, которое обозначим через Т. Это будет означать, что конкретное входное воздействие и (f) при-
§ 3] ДИНАМИЧЕСКАЯ СИСТЕМА 37 надлежит в данный момент времени t множеству U. Оче- видные физические соображения требуют, чтобы множест- во моментов времени Т было упорядоченным, иными сло- вами, в нем должно быть определено направление време- ни. Очевидно, это направление должно быть выбрано так, чтобы прошлое предшествовало будущему. В общем случае нельзя считать, что входное воздей- ствие и (t) является любой произвольной функцией вре- мени. Обычно необходимо в каждом конкретном случае вводить определенные ограничения. Они диктуются, глав- ным образом, условиями решаемой задачи, свойствами воздействующей окружающей среды и т. п., но всегда должны иметь место. Если обозначить абстрактное прави- ло построения допустимых функций и (t) через <о, то мно- жество О допустимых значений функций и (i) можно оп- ределить следующим образом: Q = {со : Т U}. Напомним, что зто выражение читается так: на множест- вах Т nU задано соответствие (правило) са, такое, что мно- жество Т отображается в множество U, образуя множество отображений Q. Очевидно, О есть подмножество множе- ства Т X U. Для конкретных значений величин приве- денное выше выражение можно было бы записать так: и (t) = со (t). В дальнейшем, применяя запись и (£), мы всегда будем подразумевать, что эта функция принадлежит до- пустимому множеству. ' Поскольку в реальных системах мы 'имеем дело только с отрезками вход- ных воздействий (так как протяженность времени всегда ограничена), класс функций на множестве Q должен быть таким, чтобы две различных функции (Oj и со2"на соседних отрезках времени /2] и [Z2, /31 могли быть’ заменены одной функцией ®3 на суммарном отрез- ке [fj, f3] (рис. 1.15). Это условие запишем следующим
38 [ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 образом. Пусть <0j, (Од, (Од (— £2, h. < Ч < ^3 £= Т, тогда должно иметь место условие] <о3 — С,)1 ПРИ t ^2, со3 = <о2 при t2 <Z t f3. Описание входных воздействий приведенными выше вы- ражениями оказывается вполне достаточным для их ис- пользования в дальнейшем. Рассмотрим теперь понятие состояния системы. Пока, не имея более строгих формулировок, можно говорить о состоянии системы как о таких данных о ее настоящем и прошлом, которые необходимы для определения теку- щего и будущего значений выходных величин системы. Говоря более конкретно, мы должны предположить, что существуют некоторые величины (обозначим их через х), характеризующие состояние системы в данный момент вре- мени, которые зависят от предыдущего состояния, теку- щего времени и входных воздействий. Запишем зту за- висимость в общем виде так*): х (fi) — Ф ^о> х (20), где — данный момент времени; t0 — некоторый пред- шествующий момент времени t0 < х (/„) — состояние системы, предшествующее данному; со — входное воздей- ствие, причем (о Q. Если рассматривать величины х как элементы некото- рого множества X, а все моменты времени (в том числе t0 и t) принадлежащими множеству Т, то формулу для состояний х можно записать в более общей форме Ф = {ф : Т х Т х X х £2 X}. Множество Т X Т X X X £2 содержит в качестве своих элементов упорядоченные четверки в виде t±, /0, х (20), со; следовательно, соответствие (правило) <р устанавли- вает отображение (функциональную связь) этих четверок *) Здесь и далее точкой с запятой выделяется главный аргу- мент функции, по которому развивается процеес.
S 3j ДИНАМИЧЕСКАЯ СИСТЕМА 39 на множество X, содержащее элементы х. Полученное отображение <р принадлежит некоторому множеству Ф и имеет специальное наименование — переходная функция состояния системы. Переходная функция состояния должна удовлетворять ряду требований, определяющих однозначность введен- ного определения. Во-первых, естественно потребовать, чтобы переходная функция состояния была определена для всех t t0, а при t = t0 имело бы место равенство <р [t0; t0, х (t0), <о] = х (f0) для всех (Е У, жЕ X и Это равенство опреде- ляет согласованность функции ср с ее начальным значением и независимость начального значения х (t0) от данного значения входного сигнала со (рис. 1.16). Далее, знание состояния системы х (<0) в момент t = t0 и отрезка вход- ного воздействия w на отрезке времени Ио, (обозначим со Ио, <il) должно быть необходимым и достаточным усло- вием, позволяющим определить состояние системы х (/,)
40 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИЙ СЙСТЁМ [ГЛ. 1 в момент t = tA. Поэтому должно иметь место соотно- шение х (fj = <р [tx; t0, х {t0), со {t0, fj]. Система, удовлетворяющая этому соотношению, называ- ется динамической. При этом два одинаковых входных воздействия на за- данном отрезке времени и при заданном начальном со- стоянии системы х {t0) должны давать один и тот же резуль- тат; иными словами, должно выполняться равенство ф t0, х {t0), coj — ф t0, х {t0), со2], если ец = <д2 при t0 < t ij. Наконец, одно и то же входное воздействие <о должно определять состояние системы на конце заданного проме- жутка времени [t1( t8l независимо от того, действовало ли оно отдельно на промежутках времени и [t2, t3] или сразу на всем промежутке [^, £3] (рис. 1.17). Это ус- ловие определяется равенством Ф [Г3; х (ij, cd] = ф {t3, t2, ф [i2; tv x {t±), o], <u} для всех жЕХиоейи любых < t2 < t3 T. Свойства переходной функции состояния системы, устанавливаемые рассмотренными соотношениями, пол- ностью определяют ее как основную характеристику си- стемы. Выходные величины системы могут быть определены, если заданы входные воздействия и известна переходная функция состояния системы. Поскольку последняя уже
§ 3] ДИНАМИЧЕСКАЯ СИСТЕМА 41 включает в себя эффект входного воздействия, выходная величина [обозначим ее у (/)] может быть представлена в виде У (t) = Л [i; X («)]. Обычно на множество выходных величин не накладывает- ся особых ограничений, однако в случае необходимости они должны принадлежать некоторому множеству Г. Поскольку моменты времени t принадлежат множеству Т, а значения х — множеству X, множество выходных ве- личин можно представить в более общей форме так: Г = {т] : Т X X У}. Теперь мы подготовлены к тому, чтобы дать полную формулировку определения динамической системы, при- надлежащую Р. Калману, П. Фалбу и М. Арбибу [12]. Определение 1.1. Динамической системой называется математическая модель совокупности взаимосвязанных элементов, удовлетворяющая следующим аксиомам: 1. Заданы множество моментов времени Т, множество состояний системы X, множество мгновенных значений входных воздействий U, множество их допустимых зна- чений Q = {© : Т -> U}, (1.30) множество мгновенных значений выходных величин У и множество их допустимых значений Г = {т] : Т X Х-+ У}. (1.31) 2. Множество Т есть некоторое упорядоченное подмно- жество множества вещественных чисел (направление вре- мени): УСЙ. 3. Множество входных воздействий удовлетворяет условиям: а) множество Q непусто; б) отрезок входного воздействия со на промежутке времени (t,. f3l обладает следующим свойством (свойство «сочленения»): если (0ц со2, со3ЕЕ £2 и tx t2 t9 ЕЕ Т, ТО COg = При t СОд (Од ПрИ t £д, (1-32)
42 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 4. Существует переходная функция состояния Ф = {(р:ГхТхХх(2->Х), (1.33) значениями которой являются состояния системы х (0 = <р U; /0, х (t0), со] GE X, (1-34) в которых она оказывается в момент / Е У, если в на- чальный момент времени t0 она была в начальном состоя- нии х (t0) GE X и если на нее действовало входное воздей- ствие о Е й. Переходная функция состояния обладает следующими свойствами: а) функция определена для всех t t0 и не обяза- тельно определена для всех t < t0 (направление времени)-, б) функция согласована со своим начальным значени- ем, т. е. равенство х (t0) = ф Ио; t0, x(t0), со] (1.35) выполняется для любых t е Т. х е X и йЕЙ; в) для всех отрезков входных воздействий се»!, со2 ЕЕ ЕЕ fi, таких, что Oj — со2 для всех tu < t 0, имеет ме- сто равенство Ф [0; <0, х (/0), coj = ф [0; t0, х (t0), coaJ; (1.36) г) функция обладает полу групповым свойством, т. е. для любых t1 < t2 < t3, х Ez X и о E Й имеет место равен- ство Ф [0; tr, х (0), со] — ф {t3; t2, ф [i2; tr, x (0), ©I, to}. (1.37) 5. Задано выходное отображение Г = {ц : Т X X-+Y}, (1.38) определяющее значения выходных величин системы у (0 = ц [<; х (01. (1.39) Приведенное определение в наиболее общем виде описы- вает математическую модель динамической системы. Схе- матически ее можно представить в виде структурной схе- мы, изображенной на рис. 1.18. Эта математическая мо- дель применима к различным классам физических систем,
s Я] ДИНАМИЧЕСКАЯ СИСТЕМА 43 что с теоретической точки зрения весьма важно, так как при этом большое количество частных приложений объе- диняется общей терминологией, основными понятиями и фундаментальными результатами теории. Мы не имеем возможности дать здесь ряд иллюстраций из различных об- ластей, где применяется понятие системы,— предостав- ляем сделать это читателю. Однако в дальнейшем мы ис- пользуем это определение для построения разделов тео- рии линейных систем. Отдельные дополнительные термины конкретизируют математическую модель динамической системы. Так, со- стояние системы z в момент t0, или пара элементов множе- ства Т X X, называется событием (или фазой) системы. Само множество Т X X называется пространством собы- тий, или фазовым пространством. В том случае, когда некоторое множество входных воздействий £Д используется для управления системой, оно называется управлением. Управление переводит (или преобразует) состоянием (f0) в состояние ср If; t0, х (f0), со]. При этом система находится в движении, описывая в про- странстве состояний траекторию. Динамическая система называется свободной или авто- номной, если множество допустимых входных воздействий £2 содержит только один элемент. Практически это озна- чает, что входные воздействия отсутствуют и система со- вершает движение лишь из-за наличия начальных откло- нений.
1& ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 Важным классом динамических систем являются си- стемы, переходная функция состояния которых удовлет- воряет дифференциальному уравнению. Построим опре- деление такой системы на основе общего определения 1.1. Введем метрики на множествах моментов времени Т, Входных воздействий Q и состояний системы X. Тогда перечисленные множества будут метрическими простран- ствами. Примем в качестве элементов этих пространств действительные числа R. При этом получим: Т = R, (2 = = 7?m, X = Вп, где m и п — размерности *) пространств, а сами пространства будут нормированными (векторными). Потребуем, чтобы переходная функция состояния <$>: Т X Т X X X Q -* X была непрерывным отобра- жением в любой точке х е= X для каждого / Е ? в смысле определения (1.29). Если теперь состояние системы в момент времени t определяется соответствующим значением переходной функции состояния х (f) = <р [t; t0, х (f0), о], то приращение х при бесконечно малом изменении t в силу непрерывности функции <р может быть записано следующим образом: dx — <р [t; t0, х (t0), со] dt. Положим, далее, что функцииф [/; tQ, x(t0), со] однознач- но соответствует некоторая непрерывная функция / (/; х, ы). Тогда состояние системы будет определяться следую- щим дифференциальным уравнением: я,и(0], где и (t) = © (/). Назовем систему, удовлетворяющую перечисленным выше условиям, обыкновенной динами- ческой системой и дадим полное ее определение. Определение 1.2. Обыкновенной динамической системой называется математическая модель совокупности взаимо- связанных элементов, удовлетворяющая аксиомам опре- деления 1.1, у которой: *) Понятия размерности и нормы пространства относятся к линейным пространствам и рассмотрены в гл. 2.
SI ДИНАМИЧЕСКАЯ СИСТЕМ А 45 | 1. Множество моментов времени Т есть числовая ось вещественных чисел, а множества мгновенных значений входных воздействий U. допустимых значений входных воздействий О и состояний системы X есть векторные пространства. 2 Функция f (t, х, со), называемая производящей и за- даваемая функцией (р [Z; t0, х (t0), со] , непрерывна для 3. Переходная функция состояния системы является решением дифференциального уравнения ^- = f[t-x,u(t)} (1.40) с начальными условиями х (t0) = -т0 для всех f Е 7 , iE X и iz ЕЕ где х — вектор состояний системы, и — вектор входных воздействий. В ряде случаев в динамической системе имеют место условия, при которых физические элементы и их взаимо- связи не меняются с течением времени. При этом состоя- ние системы, определяемое переходной функцией состоя- ния, не зависит от начала отсчета времени. Если, например, задано входное воздействие со (t) из класса воздействий Q и система имеет значение переход- ной функции состояния ср (£; t0, х, со), то сдвиг по времени па величину т этого воздействия повлечет за собой сдвиг на такую же величину переходной функции состояния без изменения ее формы (рис. 1.19). Более точно такие системы определяются следующим образом. Определение 1.3. Динамическая система называется стационарной (или с независимыми от времени парамет- рами), если выполняются следующие условия:
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1. Пространство допустимых содержит все функции сщ (?) — 2. Справедливо равенство <р [f; t0, х (t0), со] = <p[i 4- т; t0 входных воздействий S2 (1) (Z + т) для любых t, + т, х, © (Z + т)] (1.41) для всех т ЕЕ Т. 3. Отображение ц : Т X X —> У, определяющее вы- ходные величины у (t) = 1] [i; х (?)]. не зависит от t, т. е. выполняется равенство У (0 = n (*)- (1-42) Динамическая система будет системой с непрерывным временем, когда Т есть множество всех вещественных чи- сел. Когда Т есть множество целых чисел, система будет с дискретным временем. Наиболее простой, с точки зрения методов исследо- вания, является стационарная динамическая система, у которой множествах, U и Y конеч- ны, и Т есть множество целых чисел. Такая система называется конечным автоматом. Для пояснения понятия конеч- ного множества рассмотрим следу- ющий пример [21]. В прямоуголь- ном треугольнике множество всех точек А, лежащих на гипотенузе, спроектируем на горизонтальный Таким образом, мы установим вза- катет В (рис. 1.20). имно однозначное соответствие между множествами А и В, хотя ясно, что множество/? является некоторой частью множества А. Множество называется бесконечным в том случае, ког- да его элементы можно привести во взаимно однозначное соответствие с элементами некоторой собственной его части. Следовательно, множество А бесконечно. Всякое множество, не являющееся бесконечным, конечно. Для исследования копечпых автоматов вполне доста- точен аппарат современной алгебры, в том числе и ее ло- гических разделов. Вопросов исследования конечных ав- томатов мы не будем затрагивать совсем.
4] УПРАВЛЕНИЕ 47 § 4. Управление В определении динамической системы, которое было сформулировано в предыдущем параграфе, уже в неко- торой степени нашел отраженпе тот факт, что динамиче- ская система может рассматриваться как объект управ- ления. В частности, входные воздействия, предназначенные для изменения состояния системы некоторым предпи- санным образом, были названы управлением. Теперь нам необходимо конкретизировать понятие управления и дать ряд достаточно строгих определений. Предварительно заметим, что система управления создастся для осуществления целенаправленных дейст- вий, в результате которых^объект управления совершает движение в соответствии с установленными критериямп. Это приводит к задаче нахождения входных воздействий, приводящих выходные величины к некоторому заданному виду и установленному критерию эффективности действия системы. Такая задача называется задачей оптимального управления, или просто задачей управления *). Рассмотрим задачу управления в общем виде, опираясь на понятия определения 1.1 [121. Пусть объектом управления является динамическая система в соответствии с определением 1.1. Объект управ- ления будет иметь переходную функцию состояния ср : Т X Т X X X со значениями х (t) — <р И; t0, х (/0), со] и выходную функ- цию 11 : Т X X -> Y со значениями у (i) = ц [ц х (<)]. При изменении состояния объекта х (t) его выходная величина также будет изменяться, следовательно, на мно- жестве Т X X X Y можно определить пары (х, у) для данного момента времени t. Выделим на этом множестве некоторое подмножество So CZ Т X X X Y, элементами которого являются заданные значения (х, у, /). Назовем подмножество So целевым множеством. На множестве £1 *) Термин «оптимальное управление» в теории систем можно заменить термином «управление», поскольку других управлений, кроме оптимальных, в теории не рассматривается.
48 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. выделим подмножество й0, которое назовем множеством допустимых управлений. Если теперь найдется такое входное воздействие к (i) ш (i) (из множества допустимых управлений), которое преобразует событие (rr0, t0), а следовательно, и Рис. 1.21. выходную величину у (t0), таким образом, что множество значений величин Ф [i; t0, х (t0), u], i] [f; x (<)I пересекается co множеством So, то время за которое совершается этот процесс, назовем временем достижения (рис. 1.21). Подчеркнем, что совсем не обязательно на мно- жестве Qo будет иметься входное воздействие, обеспечи- вающее такое преобразование. Образуем некоторую вещественную функцию, завися- щую от значений входных и выходных величин и и у, состоянпя объекта х и его свойств, определяемых функ- циями ф И Г], I — I (и, у, X, ф, 1], /).
5 4] УПРАВЛЕНИЕ 49 Очевидно, при наличии управления и (t), переводящего объект из состояния (х0, t0) в состояние [ж Zx], функция I примет конкретное численное значение, равное Л = Л {и, у (М, £(*i), ф IG; t0, х (Zo), u], т] [Zx; x (fj)], Zj. Назовем функцию I функцией потерь качества управления и надлежащим выбором ее вида обеспечим уменьшение числа 1Х при повышении качества управления. В общей постановке задачи нет необходимости дальнейшей конкре- тизации этого понятия. Теперь мы имеем все данные для формулировки общей задачи управления [12]. Определение 1.4. Общей задачей управления называет- ся математическое понятие, образованное следующими условиями: 1. Объектом управления является динамическая сис- тема в соответствии с определением 1.1, имеющая переход- ную функцию состояния ф [Z; t0, х (Zo), п] и выходную функцию ц [Z; х (Z)]. Для объекта управления указано целевое множество So CZ Т X X X У и множество допу- стимых управлений Qo CZ Q. 2. Задана функция потерь качества управления I = I (и, у, х, ф, к], Z), и получен функционал потерь качества управления Л = Л {и-> У (Д), х (^i), Ф Zo, х (Q, и], т] [Z; х (Zx)], Zx} (1-43) для данного момента времени достижения Zx, начального момента времени Zo, начального состояния х (Zo). 3. Необходимо для каждого данного события (Zo, т0) определить допустимое управление и (Z) ЕЕ Но, которое преобразует событие (Zo, х()) таким образом, что множество значений ф [Z; Zo, х (Zo). ц], ц [Z; х (Z)] пересекается с це- левым множеством {ф [Z; Zo, х (Zo), и], ц [Z; z(Z)l} f~| So, (1.44) п которое минимизирует функционал потерь качества управления. к. Даппое определение задачи управления является наи- более общим и пригодно для любого объекта, описывае- мого аксиомами определения 1.1. Естественно, что для
50 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 объектов определенных классов условия определения 1.4 могут быть конкретизированы и развиты в направлении получения практических результатов. Как уже отмечалось, важным классом динамических систем являются обыкновенные динамические системы, у которых переходная функция состояний удовлеворяет дифференциальному уравнению (см. определение 1.2). В этом случае функционал потерь качества управления можно описать более конкретно. Пусть LK есть некоторая вещественная функция вида = LK {0i Ф tO ^о> х (^о), ^1}» зависящая от управления и (/), времени достижения и вида переходной функции состояний <р. Функция LK должна выбираться таким образом, чтобы уменьшение ее значения определяло повышение качества управления. Определим, далее, непрерывную вещественную функцию Лп = Ln {t‘, Ф R; t0, х (f0), и], и (<)}, зависящую от управ- ления и (/), текущего времени t и вида переходной функ- ции состояния ф, интегрируемую на промежутке [<0, ijL Запишем функционал потерь качества управления в следующем виде: I\ — LK {fj, <р [0> f0, х (to), u]} t> + Ln {t; <p [t; t0, x (t0), и], и (t)} dt. (1.45) to Первое слагаемое этого выражения, функция LK, харак- теризует качество управления в конечный момент време- ни и поэтому называется терминальной составляющей функционала. Второе слагаемое характеризует качество процесса перехода из состояния в момент t0 в состояние в момент и называется переходной (или нестационарной) составляющей функционала. В случае, когда обыкновенная динамическая система линейна, производящая функция примет вид *) f[t; х, и (01 = F (t)x + G (t)u, *) Подробно линейные динамические системы рассматриваются В гл. 2.
УПРАВЛЕНИЕ 51 S «1 а выходная функция — т] (i; х) = Н (i) х. При этом одним из распространенных критериев качества управления является квадратичный критерий. Функцио- нал потерь качества управления формируется следующим образом. Пусть задано отображение z : Т -> У, значениями ко- торого являются величины у = z (i). Будем называть это отображение желаемым выходным сигналом. Тогда раз- ность между желаемым выходным сигналом и текущим значением выходной величины будет характеризовать ошибку управления с (0 = z (0 — у (t) = z (0 — Н (i) х (/), и функционал потерь качества управления примет простой вид: п fi = |e(Z1)|2= J [|e(0|2 + |u(0l2]d«. Io В этом случае задача управления сводится к выбору та- кого управления и (/), которое бы минимизировало ошиб- ку управления и расход энергии управляющих органов. Перейдем к формулированию понятия закона управ- ления. Предварительно заметим, что принцип обратной связи в тсорпп автоматического регулирования составляет ее основу и широко п всесторонпе используется в техни- ческих приложениях. Однако методологическая основа этого принципа долгое время оставалась неясной. Под- тверждением этого обстоятельства является хотя бы то, что и до сих пор во многих руководствах по автоматиче- скому регулированию приводится классификация систем управления на системы замкнутого и разомкнутого цик- лов регулирования. Именно здесь техническая сторона вопроса заслонила собой методологическую. Введенные определения динамической системы и задачи управления естественным образом приводят к формули- ровке понятия закона управления. В самом деле, переход- ная функция состояния <р И; t0, х (i0), coj определяет со- стояние системы, а следовательно, и значения выходных величин в момент t, если известно состояние системы в
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ 1ГЛ. 1 момент t0 и отрезок входного воздействия со па промежут- ке [£0, t). Таким образом, вся информация, необходимая для определения требуемого управляющего воздействия и (t) = со (0, заключена в текущем состоянии системы. Законом управления будет называться отображение k : Т X X U, значениями которого будут величины и (0 к [0 х (01 управлений. В общем случае определение функции к затруднено тем обстоятельством, что соотношение и (t) = к {t; ср [t; t0, х (t0), tc]} не указывает область существования функции к при ус- ловиях, накладываемых на множество допустимых уп- равлений Q *). Помимо этого, знание переменных состояния х (t) воз- можно лишь по данным о выходных величинах **), что требует операции определения обратного отображения rf1 : F -> X, значениями которого и будут искомые величины х (0 = Tf1 [у (01. Сверх того, если такая операция осуществима, необходи- мо иметь возможность оценить точность определения х (0, т. е. получать оценку состояния х0 (0. Дадим строгое определение понятия автоматического управления. Определение 1.5. Автоматическим управлением ди- намической системой называется протекающий во време- ни процесс, удовлетворяющий следующим условиям: 1. Для объекта управления, удовлетворяющего оп- ределению 1.1, указаны целевое множество /ц, CZ Т X Хх X У и множество допустимых управлений Qo CZ £2- 2. Определено отображение, называемое законом уп- равления, k-. Т X X U, (1.46) *) В случае линейных систем эта задача решается строго (см. гл. 2). **) Исключая частный случай, когда у (t) = х (t).
S 41 УПРАВЛЕНИЕ 53 значениями которого являются величины управлений и (0 = к {£; <р [f; t0, х (t0), и (£)]}. (1.-47) 3. Управление и (Z) GZ О0 переводит объект управле- ния из состояния х (t0) ЕЕ Т X X в состояние х (<) ЕЕ 50 за отрезок времени tA — t0, называемый временем перехода, и минимизирует функционал потерь качества управления Л = Л {^> у (О, х (^i), <р I*; <о, х (U, i] U; % (G)L М- 4. Выходная функция q (t, х) определяет попадание выходной величины у в целевое множество 50 всякий раз, когда х (i) ЕЕ ^о, и допускает обратное отображение (1.48) со значениями х (I) = т]-1 [у (f)]. (1.49) 5. Существует оценка х0 (t) состояния системы по зна- чениям выходной величины у (t0) : t0 t. Из приведенного определения мы видим, что часть условий относится к некоторой системе, решающей за- дачу автоматического управления. Назовем регулятором математическую модель систе- мы, состоящую из элемента, обеспечивающего оценку состояния объекта управления, и элемента, формирующе- го закон управления. Структурно-логическая схема управления объектом показана на рис. 1.22. Принадлежащее множеству Qo управление и воздействует на объект управления, обус- ловливая конкретные значения состояний х е X и вы- ходных величин Е У. По значениям выходных величин определяются состояния х или (при необходимости) их оценки х0 из множества X, и формируется закон управ- ления к. Он и обеспечивает выбор из множества Qo нуж- ной величины управления и. Качество управления конт- ролируется значением функционала потерь качества уп- равления 1г, а возможность управления — принадлеж- ностью значений х и у целевому множеству So. Сформулированные выше основные определения поз- воляют перечислить ряд задач общей теории систем, от- носящихся к проблеме управления. а) Задача идентификации (реализации) системы.
54 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 В том случае, когда множеству управлений и (0 ЕЕ однозначно соответствует множество выходных величин у (0 ЕЕ Y, можно указать семейство функций, определя- емых отображением fr : Т X Q -> Y, каждая из которых ставит в соответствие управлению Рис. 1.22. и (t) выходную величину у (Q: у (t) = fri [и (t)], (1.50) где I — номер данной зависимости. В более сложном случае соответствие между и (t) и у (0 устанавливается, в свою очередь, через некоторые функции F и М этих величин р [у (01 = fri УМ (и (0]. (1.51) Построение математической модели динамической системы по этим данным и является задачей идентификации.
управление 55 § 4] Чаще всего задача идентификации возникает тогда, когда по набору i-ro количества экспериментальных дан- ных, определяемых соотношениями (1.50) и (1.51), необхо- димо определить внутренние свойства системы, например, переходную функцию состояний ф [i; t0, х Go), б) Задача управляемости и наблюдаемости системы. Решение общей задачи управления требует выполнения условия, при котором необходимо найти такое управление и (<), которое переводило бы систему из состояния х (t0) в состояние х (Ч). Однако выполнить это условие далеко не просто. В действительности мы не можем заранее знать, найдется ли такое множество управлений и (i) GE Qo, которое обеспечило бы пересечение множества {ж G), У G)} с целевым множеством So за конечное время Ч- Возможно, что лишь некоторое подмножество Qo будет обеспечивать пересечение подмножеств из множеств {х (£), у (<)} и So, т. е. часть управлений и (t) будет неполностью решать задачу управления. Может оказаться, что вообще не най- дется непустого множества Qo, удовлетворяющего условию общей задачи управления, т. е. система будет неуправ- ляема. Таким образом ставится задача определения управля- емости динамической системы, заключающаяся в нахож- дении условий, при которых переходная функция состоя- ния (p:7’x7’xXxfi->X со значениями х (t) = = <р G; t0, х (Ч), о] существовала бы и была отлична от нуля для всех управлений и G) GE О0. Выполнение одного из условий управления объектом требует знания теку- щего состояния системы х G) по значениям выходной величины у (i), т. е. существования отображения ц : Y -> —► X. Задачей определения наблюдаемости динамической системы и является установление условий, при которых это отображение существует и отлично от нуля для всех у G) е Y и х (t) е х. в) Задача оптимального управления. Одной из основных задач теории систем является на- хождение способов построения закона управления к : Т X X -> U при заданных множествах X, Y и й0, обеспечивающего минимизацию функционала потерь ка- чества управления А = А (и, у, х, ф, ц, ч)- Это — задача оптимального управления.
56 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ ОБЩЕЙ ТЕОРИИ СИСТЕМ [ГЛ. 1 Развитие теории и получение результатов по оптималь- ному управлению идет, в основном, по двум направле- ниям. Первое из них объединяет задачи детерминированного оптимального управления, второе — задачи стохастиче- ского оптимального управления. Как в том, так и в дру- гом направлениях получен ряд фундаментальных резуль- татов. Достаточно лишь упомянуть принцип максимума Понтрягина [12, 20], методы аналитического констру- ирования регуляторов [15, 18], методы нелинейной и ли- нейной фильтрации [6, 13, 24]. В последнее время большой интерес вызвали работы Р. Калмана и Р. Бьюси по за- дачам линейной фильтрации. На них мы в дальнейшем и сосредоточим внимание.
ГЛАВА 2 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ § 5. Линейные пространства Введение понятия расстояния между элементами мно- жества позволило сформулировать определение метриче- ского пространства (§ 2). Однако метрика не является единственной характеристикой множества. Введем (не- строгое) понятие вектора как элемента метрического про- странства. Будем рассматривать вектор как отрезок оп- ределенной длины и нап- равления в пространстве. Для уяснения некоторых свойств вектора рассмот- рим двумерную модель метрического пространства в виде плоскости с осями координат 1 и 2 (рис. 2.1). В этом пространстве рассмотрим векторы X, Y и Z и их проекции на оси 1 и 2 Xj, г/и, Zj и х2, р2, z2 (далыле векторы будем обозначать большими бук- вами, а числа — малыми). Рис. 2.1. С помощью простых геометрических построений можно убедиться, что координаты вектора Z равны Zi = Xj + Зо = .Т2 + y2J (2-1) если вектор Z является диагональю параллелограма со сторонами X и Y. В этом случае мы будем говорить о век- торе Z как сумме векторов .ЗГ и Y и записывать это сле- дующим образом: X + Y =Z.
58 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Поскольку сумма векторов определяется как сумма их проекций на оси координат, т. е. как сумма соответст- вующих чисел, будут справедливы следующие соотноше- ния: X + У = Y + X, X + (Y+Z) = (X + Y) + Z, X 4- Y = X, если Y = 0 (уу = 0, у, = 0). Если положить Z = 0, тона основании соотношений (2.1) получим = — У1, = — у2, следовательно, существует вектор X = — У и X -|- Y = 0, если X = —Y. Обозначим длину вектора X через || X || и умножим про- екции вектора на постоянное число а 4* 0- На основании рис. 2.1 получим: (а + + (а 4- Р)Ч2 = (а + Р)21X ||2, или «Ш + Р 11X11=11^11, где || Хг || — длина нового вектора, совпадающего по на- правлению с вектором X. Следовательно. (а + р) X = аХ 4- РХ. Аналогичным образом легко показать, что справедливы тождества (Тб)Х = Т (6Х), где 7 и б — постоянные числа, aZ = аХ 4- aY, а(Х -|- У) = аХ 4- аУ. Таковы некоторые свойства векторов в простейшем дву- мерном пространстве. Однако эти свойства можно обоб- щить на случай произвольного метрического прост- ранства. Линейное пространство. Определение 2.1. Множество Хл называется линейным (или векторным) пространством, если на этом множе- стве определены операции сложения элементов (векто-
S 5] ЛИНЕЙНЫЕ ПРОСТРАНСТВА 59 ров) множества и умножения их на число (скаляр), удов- летворяющие следующим аксиомам: 1. X 4- Y = У -|- X для всех X, Y ЕЕ Хл (коммута- тивность сложения). 2. (X 4- У) Z = X 4- (У -f- Z) для всех X, У, Z ЕЕ Хл (ассоциативность сложения). 3. Существует нулевой элемент (нулевой вектор) О ЕЕ Хл, такой, что X 4- 0 = X для всех X ее Хл. 4. Существует для любого X ЕЕ Хл противоположный элемент У ЕЕ Хл, такой, что X 4- У = 0. 5. (а 4" ₽) X — аХ 4- |ЗХ для любого X ЕЕ Хл и лю- бых а и р, где а и Р — числа (дистрибутивность умно- жения). 6. (уб)Х = у (б А') для любого X ЕЕ Хл и любых чи- сел у и б (ассоциативность умножения). 7. 1-Х = АД n „.Y Q. ___Q J ДЛЯ ВС6Х -A (zz Ал. 8. а (X 4- У) = аХ 4- «У для всех X, У ЕЕ Хл и любого числа а. Заметим, что аксиомы линейного пространства справед- ливы и для комплексных пространств. Линейное пространство может иметь в качестве своих векторов элементы множества любой физической природы, лишь бы они удовлетворяли аксиомам определения 2.1. В дальнейшем это послужит важным фактором для соот- ветствующих обобщений в теории линейных систем. Перейдем к рассмотрению одного из важнейших свойств линейного пространства. Обратимся опять к простей- шей модели пространства в виде плоскости и зафиксируем на ней два вектора X и У так, чтобы они были взаимно перпендикулярны. Зададим на плоскости некоторое мно- жество точек Q таким образом, чтобы границами этого множества были векторы X и У (рис. 2.2, а). ( Воспользовавшись формулами аксиом (1) и (5) опре- деления 2.1, можем записать Z 4- о^Х 4- <%2Y (2.2) И ПОЛОЖИТЬ 0 а1, «2^1.
60 линейные динамические системы (ГЛ. 2 Если теперь воспользоваться аксиомой 7 определе- ния 2.1, то можно утверждать, что каждый вектор, опи- рающийся своими концами в точку пересечения векторов X и Y и в любую точку множества Q. может быть определен соотношением (2.2) путем надлежащего выбора значений чисел и а2 (рис. 2.2, б). В самом деле, любые координаты на осях X, Y можно получить, умножая величины длин векторов X и Y (которые в данном случае являются одновременно значениями проекций векторов на самих себя) на числа и а2 в пределах от 0 до 1. С другой стороны, векторы X и Y не могут быть по- лучены один из другого никакой операцией умножения и сложения, установленных для линейного простран- ства. Иными словами, равенство агХ + а2У = 0 при X ф 0 и Y ф О возможно лишь тогда, когда = а2 = 0. В нашем примере множество векторов Z образует ли- нейное пространство, все элементы (векторы) которого получены из двух векторов X и Y по формуле (2.2). При этом говорят, что линейное пространство Z натя- нуто на векторы X и Y. Рассмотренный пример позволяет перейти к общим формулировкам интересующего нас свойства линейного пространства. Если в линейном пространстве Хя имеется непустое множество элементов (векторов) {Х15 Х2, ..., Хп}, то из
ЛИНЕЙНЫЕ ПРОСТРАНСТВА 61 § 5] них может быть образована сумма Z = а1Х1 + а2Х2 + ... 4- апХп, (2.3) называемая линейной комбинацией, где а1; а2, ..., ап — числа. Это множество элементов (векторов) называется линейно независимым, если равенство + «2-^-2 + ••• + ап-Кп = 0 (2.4) имеет место лишь при условии, когда все числа аг (i = = 1, 2, ..., п) равны нулю, = а2 = ... = ап = 0. Если найдутся числа аг, не все равные нулю и такие, что справедливо равенство (2.4), множество векторов на- зывается линейно зависимым. Пусть в линейном пространстве Хл выделено некото- рое множество элементов (векторов), каждый из которых получен как линейная комбинация (2.3) векторов Хг, Х2, ..., Хп. Это множество называется линейным подпро- странством, Zn сг Хл, натянутым на множество элемен- тов (векторов) {Xj, Х2, ..., Хп}. Система координат и базис. Выберем п векторов Хг, Х2, ..., Хп линейного пространства Хл таким образом, чтобы они образовали линейно независимое множество. По аналогии с рассмотренным выше двумерным простран- ством, в котором линейно независимые векторы X и Y об- разуют прямоугольную систему координат (рис. 2.2, б), будем трактовать это множество как взаимно перпенди- кулярные оси координат в и-мерном пространстве. Тогда любой вектор X этого пространства можно разложить по осям на проекции X = сс1Х1 -]- а2Х2 ... + а,пХп, (2.5) где — числа, определяющие масштаб измерений по осям Xt. Полученное разложение есть не что иное, как линей- ная комбинация векторов Хъ Х2, ..., Хп, являющихся по условию линейно независимыми. Следовательно, все ли- нейное пространство Хл натянуто на множество векторов {Xlt Х2, ..., Хп}. Множество линейно независимых векторов {Xlt Х2, ... ...,ХП}, на которое натянуто пространство Хл, называ- ется базисом этого пространства. На рис. 2.3 в качестве примера приведено трехмерное пространство Хл с базисом в виде осей Х2, Х3.
62 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Легко видеть, что любой вектор X с началом в точке пе- ресечения осей базиса и с концом в произвольной точке объема параллелепипеда представляется формулой Рис. 2.3. представить двумя линейными -У — ai-^i Н- щХ2-]-а3Хз, где числа аг изменяются в пределах —1 СС], а2, а3 1. Нетрудно показать, что любой элемент (вектор) пространства Хл определя- ется с помощью базиса однозначно. В самом деле, предположим, что один и тот же вектор X можно комбинациями X = а1А’1 + а2-Х"2 + ... + апХп, •X = + ••• + По условию эти комбинации линейно независимы, сле- довательно, разность (Pi — ai)^i “Ь (Рг — аг)^г “1“ ••• “1“ (Pn ап)-^п будет равна нулю лишь в случае, когда все |Зг — аг равны нулю. Но при этом аг = |Зг (г = 1, 2, ..., п), следователь- но, вектор X представляется с помощью базиса единст- венным образом. Легко показать также, что каждый вектор простран- ства Хл, линейно зависимый от любой совокупности ос- тальных векторов этого пространства, можно отбросить, не меняя при этом множества Хл. Представление любого вектора X пространства Хл с помощью базиса называется разложением вектора X по базису {X-!, Х2, ..., Х'п}, а числа сс15 а2, ..., а„ называ- ются координатами разложения. Число п линейно независимых векторов в линейном пространстве Хл называется размерностью этого прост- ранства. Размерность пространства обозначается dim Хл. Необходимо отметить, что каждое линейное пространство
6 51 ЛИНЕЙНЫЕ ПРОСТРАНСТВА 63 имеет, по меньшей мере, один базис. Однако оно может обладать и многими различными базисами. Рассмотрим два примера линейных пространств. Пространство решений дифференциального уравнения. Некоторая функция х (0 является решением линейного дифференциального уравнения n-го порядка + • • • + °0 (О ж = О Ur UL с начальными' условиями d'x ж, =----, (=0 v ='1, 2,.. ./(п — 1). Известно (см., например, [26]), что решение этого уравне- ния может быть записано в виде х (0 = Ф1 (0Ti + ф2 (0Т2 + ••• + фп (0Тп, где фг (0 — частные решения, являющиеся линейно неза- висимыми функциями; Yt — постоянные, зависящие от начальных условий. Таким образом, приведенное выра- жение является линейно независимой комбинацией функ- ций фг (0, следовательно, эти функции при фиксирован- ном значении времени t можно трактовать как векторы n-мерного линейного пространства, образующие его ба- зис. Все значения функции ос (0, которая теперь также бу- дет трактоваться как вектор, образуют n-мерное линей- ное пространство. Особенностью этого пространства яв- ляется непрерывное изменение положения его элементов с течением времени. При этом каждый вектор ос (0, опре- деляемый конкретными значениями постоянных уг, опи- сывает своим концом в пространстве траекторию, харак- теризующую поведение вектор-функции ос (0 во времени. Базисные векторы фг (£), не меняя своей ориентации в про- странстве, с течением времени изменяют свою длину. На рис. 2.4 в качестве примера показан трехмерный случай рассмотренного пространства. Пространство ограниченных по спектру сигналов. Рас- смотрим множество сигналов х (0 в виде функций време- ни на интервале Т, характерных тем, что их комплексный
64 Линейные динамические системы (гл. i спектр ограничен: Х(/со) = X(/со) О при СО%СОс, при СО С0с, оо где X (/со) = J х (t) е~^ dt, сос = 2nF, F — ширина спект- —оо ра сигнала. В соответствии с известной теоремой отсчетов [25] рассматриваемая функция .времени приближенно представляется в виде ряда п х (7) s 2х (лдо L—1 sin <ос (t — 7гД7) СОС (t — к At) (2-6) где Д7 = M2F. При устремлении п к бесконечности это разложение становится точным. В примере § 2 мы показали, что множество функций х (7) в этом случае образует метрическое пространство. Покажем теперь, что это пространство линейное. Рассмотрим функцию Sa (у) = sin у У
5 5] Линейные пространства 65 называемую функцией отсчетов. Ее график показан на рис. 2.5. Функция Sa (у) во всех точках у = in (i — 1, 2, ...) равна нулю, кроме точки у = 0, где она равна еди- нице. Функция отсчетов относится к классу ортогональ- ных функций, следова- тельно, ее линейная ком- бинация линейно неза- висима. В дискретные моменты времени t = k\f (к = 1, 2, ..., п) функция Sa[o>c(t—АД/)] принимает значения, равные единице, образуя на интервале вре- мени Тпоследовательность из п единичных импульсов Рис. 2.5. (рис. 2.6) в форме функции отсчетов. Так как эти им- пульсы линейно независимы, их можно принять в качестве базиса некоторого n-мерного линейного пространства. Са- мо пространство будет образовано множеством функций Рис. 2.6. х (£), определяемых формулой (2.6). Координатами разло- жения будут значения функции х (kAt) в дискретных точ- ках kAt. Однако для точного представления функции х (i) на ограниченном интервале времени Т необходимо безгранично расширять полосу частот F сигнала. Тогда при оо At -> О и число отсчетов п устремляется к бесконечности. В этом случае рассматриваемое линейное пространство становится бесконечномерным. Нормированное и банахово пространства. Введенные выше понятия вектора и базиса естественно приводят к необходимости введения понятия длины вектора. Так, при рассмотрении вектора X в трехмерной декартовой системе 3 А. В. Солодов
66 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 координат его длину обычно определяют как длину диагонали прямоугольного параллелепипеда, построен- ного на проекциях этого вектора (рис. 2.7), по формуле: || X || = + 4- Знаком || || обозначена длина вектора. Однако, как и в случае введения метрики пространства, длину вектора можно вводить различным обра- зом, лишь бы выполнялись не- которые аксиомы, определяю- щие свойства длины вектора. Понятно, что термин «длина» будет теперь условным. Вместо него вводится термин «норма вектора». Определение 2.2. Линейное пространство Хп называется нормированным, если каждому вектору X Хл однозначно соответствует вещественное чис- ло,. называемое нормой (обозначаемое || X ||), удовлетво- ряющее следующим аксиомам: 1. II II > О и II X II = 0 тогда и только тогда, когда X = 0. 2. || X 4- Y || <Д| X || || Y || (неравенство треуголь- ника). 3. || аХ || = | а | • || X || (однородность нормы). Если сопоставить эти аксиомы с аксиомами метриче- ского пространства (1.22), положив р (х, у) = Ц X - Y ||, (2-7) где || X — Y || — норма разности двух векторов, то ста- новится очевидным, что линейное нормированное про- странство является и метрическим. В дальнейшем, если не будет специально оговорено, метрикой линейного норми- рованного пространства будет соотношение (2.7). Напомним (§ 2), что метрическое пространство Хл на- зывается полным, если любая последовательность его элементов сходится к некоторому пределу X ЕЕ Хл. Для пас достаточным будет тот факт, что любую норму линей- ного пространства можно представить в виде сходящихся
§ 51 ЛИНЕЙНЫЕ ПРОСТРАНСТВА 67 числовых или функциональных рядов по осям коорди- нат. Отсюда следует, что все конечномерные нормирован- ные линейные пространства полны. Определение 2.3. Нормированное линейное простран- ство, полное относительно своей нормы || X — Т" [|, назы- вается банаховым. Рассмотрим два примера банаховых пространств. Пространство ограниченных по спектру сигналов. В предыдущем примере мы показали, что пространство ог- раниченных по спектру сигналов х (£), определяемых фор- мулой п sin ок (t — TcAZ) lc=l c является линейным и n-мерным. В гл. 1 для этих сигналов была найдена метрика (1.24) р (х, у) = 4=-1/ 2 [X (kM) - Y (кМ)]\ г 2 К=1 причем п п 2 хз (км) = Лг 2 У2 =Ес, к=1 fc=i где Ес — полная энергия сигнала. Для получения нормы || X || достаточно положить в формуле (2.7) Y = 0 и использовать выражения для р и Ес. В результате будем иметь р (х, у) = || X - Y || = II X | при У — О, ЦХ|| = /2Р^. Полученное выражение показывает, что «длиной» векто- ра рассматриваемого пространства является число, опре- деляемое энергией сигнала. Это пространство банахово, так как любой сходящийся на Т функциональный ряд не- прерывных функций будет непрерывной функцией, т. е. функцией, принадлежащей данному пространству. Пространство интегрируемых функций. Пусть имеет- ся множество функций / (/), интегрируемых на интервале (я, Ъ). Определим норму на этом множестве следующим з*
68 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 образом: ь U(oii = [Ji/wM La (2-8) где 1 оо. В частности, для s = 2 получим норму в виде 11/(011 = ]/f 1/(012^, а что соответствует норме предыдущего примера для не- прерывного случая, когда п —> оо. Легко видеть, что норма (2.8) удовлетворяет аксиомам 1 и 3 определения 2.2. Что касается аксиомы 2, то для зна- чений 1 оо справедливо следующее неравенство (из- вестное под названием неравенства Минковского [21]): ь 1 Ь 1 ь 1 [J 1/(0+ £(0Гdip <[J|/(0|8^]’ +[f|g(0|M<]s, откуда получаем l|/(0 + ?(0||<ll/(0ll+||g(i)l|, и аксиома 2 удовлетворяется. Любая последовательность интегрируемых функций /п (0 будет сходиться к функции / (Z) заданного множест- ва, если мы условимся, что это множество функций интег- рируемо в смысле Лебега *). При этом рассматриваемое линейное нормированное пространство будет полно, сле- довательно, будет банаховым. Гильбертово пространство. Последовательно рассмат- ривая метрическое пространство, мы ввели понятия век- тора как элемента этого пространства, операции над векторами и, наконец, ввели обобщенное понятие длины вектора2— норму. Теперь кажете,неестественным ввести понятие' угла между векторами, что позволит опреде- лить операцию умножения векторов. •) Упрощенно говоря, последовательность интегрируемых в обычном смысле (по Риману) функций не всегда приводит к пределу, также интегрируемому по Риману. Интеграл Лебега устраняет эту трудность, так как он определен на более универсальной мере.
§ 5] ЛИНЕЙНЫЕ ПРОСТРАНСТВА 69 Рассмотрим вначале трехмерное линейное пространст- во с векторами X и Y, имеющими проекции на оси коорди- нат соответственно хх, х2, х3 и ух, у2, у3 (рис. 2.8). Введем Рис. 2.8. между векторами угол у. Определим произведение двух векторов X и F следующим образом: XY = ххух + х2у2 + х3у3. (2.9) Так как метрикой этого пространства является обычное расстояние, то согласно формуле (2.7) можем записать: IIY || = (Y - F)'/s = Vyl+yl+yl. (2.10) Длина разностного вектора Y — X на основании рис. 2.8 будет ||F-X||2 = ||X||2 + ||F||2-2||X||.||F||.coST. (2.11) Но, с другой стороны IIF — Х||2 = (У1 — хху + (у2 — т2)2 + (у3 — ж3)2, откуда, раскрывая скобки и используя соотношения (2.9), (2.10) и (2.11), получим XY, = jX|.|FJ-cosT. (2.12)
70 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Формулы (2.9) и (2.12) определяют для рассмотренного случая трехмерного пространства скалярное произведение двух векторов. Как видно из этих формул, скалярное про- изведение является числом (может быть, и комплексным). Для скалярного произведения векторов введено специаль- ное обозначение XY = <Х, Г>. Два вектора называются ортогональными, если их ска- лярное произведение равно нулю. В геометрической ин- терпретации угол между ортогональными векторами pa- rt вен т. Из формулы (2.12) непосредственно следует, что нор- ма линейного пространства, в котором определено ска- лярное произведение, может быть выражена следующим образом: || X I = / (.X, Х>. (2.13) Определение 2.4. В линейном пространстве число (как вещественное, так и комплексное) (X, К) называется скалярным произведением, если удовлетворяются следую- щие аксиомы: 1. <Х, У) = <У, JT> (коммутативность)*). 2. <Х, Y + Z> = (X, Yy -|- (X, Zy (дистрибутив- ность). 3. (аХ, Т"> = а (X, У) для любых а. 4. <Х, Ху 0, причем <Х, Ху = 0 только при X = = 0. Опираясь на эти аксиомы, можно получить ряд дополни- тельных соотношений. Мы их будем находить по мере на- добности. Определение 2.5. Линейное пространство Хл назы- вается гильбертовым (обозначается Н), если в нем опре- делено скалярное произведение, а пространство полно относительно нормы, полученной из скалярного произ- ведения. Иными словами, гильбертовым называется банахово пространство со скалярным произведением. *) Чертой над буквами обозначается комплексно-сопряженное число для случая, когда скалярное произведение — комплексное.
i 5] ЛИНЕЙНЫЕ ПРОСТРАНСТВА И В литературе по высшей алгебре и линейным прост- ранствам гильбертовым называют бесконечномерное ли- нейное пространство, а конечномерное пространство со скалярным произведением называется евклидовым. Од- нако для наших целей в таком разделении понятий нет необходимости, и мы будем придерживаться определе- ния 2.5. Рассмотрим два примера гильбертовых пространств. Евклидово пространство. Линейное n-мерное прост- ранство с метрикой Р(Ж)У) = ||Х-Г|Н1/ 2(х4-у02 i=l и нормой называется евклидовым Е*. Евклидово пространство будет и гильбертовым, если определено скалярное произведение п (X, Y> = S х^. (2.14) i=l Пространство интегрируемых функций. Пусть на ин- тервале (а, Ь) заданы непрерывные функции х (t) и у (£), множество которых образует пространство £2 (а, Ь) *). Определим скалярное произведение по формуле ь <Х, У> = ^x(t)y(t)dt. (2.14') а Тогда согласно приведенным выше соотношениям норма и метрика будут определяться формулами Ь „ La J b р(х, р) = ||Х — F|| = [J|s(Z) —1/(0|М/] *) Так обычно обозначается в функциональном анализе прост- ранство непрерывных на интервале (а, Ь) интегрируемых функций.
72 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Таблица 2 Наименование пространства О п ре де ляющие характеристики Аксиомы Метрическое Метрика Р (х, у) 1. р(я, у)>0, причем р (я, у) =0 при х — у 2. р (х, у) = р (у, х) 3. р (х, z)< р (х, у) + р (у, Z) Линейное Операции сложения 1. X-\ Y--Y X 2. (X+Y)+Z = X + (Y + Z) 3. X4-0 = J£ 4. X + Y = 0, если X = — Y 5. (a+P)X = aJV+ pJT 6. (T»)X = T(«X) 7. t-X = X, 0-X=0 8. a (X + Y) = aX + aY Нормирован- ное (линейное) Норма jf X || 1. ||X||>0 и Ц X || = 0, если X =0 2. ||JV + Y||<|]JV|| + ||Y|| 3. ||aX|| = |a|.||2T || Банахово (линейное) Норма || X Н и полнота Те же, что и для линейного про странства Гильбертово (линейное) Скалярное произведение <х, г> 1. <х, г> = <г, л> 2. <2Г, F + Z> = <ЛГ, Г> + + <х, z> 3. <aJV, Y> = a<JT, Y> 4. <X, X>>0 и рассматриваемое пространство является банаховым, а следовательно, на основании формулы (2.14') и гильбер- товым. Два вектора X и Y гильбертова пространства будут ортогональными, если <Х, Y) - 0.
§ 61 ЛИНЕЙНАЯ ДИНАМИЧЕСКАЯ СИСТЕМА 73 При этом формула (2.11) примет вид m2+mi2 = ii* + n2- (2.15) В заключение данного параграфа систематизируем наши данные в области функциональных пространств в виде табл. 2, из которой наглядно видно наращивание свойств этих пространств. § 6. Линейная динамическая система Понятие линейной динамической системы на уровне физических представлений обычно опирается на так на- зываемый принцип суперпоэиции, заключающийся в том, что общий выходной эффект от совокупности входных воз- действий на систему может быть получен суммированием выходных величин от каждого воздействия в отдельности. Существует даже мнемоническая формула суперпозиции: «Следствие от суммы причин является суммой следствий от каждой из причин в отдельности». Однако с точки зре- ния общих определений, сформулированных в предыду- щих параграфах, нам нет необходимости прибегать к столь неточным и туманным, с точки зрения математики, исход- ным данным. Сформулируем понятие линейной динамиче- ской системы, опираясь на определения 1.1 и 1.2 гл. 1. Определение 2.6. Линейной динамической системой на- зывается математическая модель совокупности взаимосвя- занных элементов, удовлетворяющая аксиомам определе- ния 1.1 (гл. 1) и следующим условиям: 1. Заданы линейные (векторные) пространства состоя- ний системы X, мгновенных входных воздействий U, их допустимых значений £2, мгновенных значений выходных величин Y и их допустимых значений Г. 2. Переходная функция состояния ф: Т X Т X X X X £2 —> X со значениями х (t) = ф И; t0, х (t0), со] является линейной на множестве X X £2, т. е. имеет мес- то соотношение Ф И; t0, х (Zo), со] = ф (f; t0, х, 0) + ф (i; t0, 0, со), (2.16) и удовлетворяет дифференциальному уравнению = (2.17)
74 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 3. Выходное отображение к): Т X X -> Y линейно на множестве X, т. е. справедливо соотношение У (t) = т] U; х (<)I = h (t)- х (t). (2.18) Мы дали определение обыкновенной линейной динами- ческой системы, т. е. системы, движение которой описы- вается дифференциальными уравнениями. Конкретизи- руем это общее определение, используя свойства линей- ного пространства. Пусть в линейном пространстве X определен базис и установлена размерность пространства п *). Пусть, да- лее, пространство входных сигналов £2 имеет размерность тп п. Состояние системы в данный момент времени t будет определяться вектором X в пространстве состоя- ний. Тогда производная этого вектора , также являю- щаяся вектором, может быть разложена по координатам базиса на п составляющих dxjdt, dx2/dt, ..., dx-Jdt. В си- лу условия 2 определения 2.6 правая часть уравнения (2.17) линейна на множестве X X £2, т. е. она является линейной комбинацией векторов X и U. Следовательно, составляющие вектора dX'dt можно представить в виде -|- /123"2 + . . . + f щхп ф- giiMj -]- g12u2 + .. . • • • + ё1тиmt I -jp = /21^1 + /'22X2 + • • • I /гп^п + ?21W1 + ?22U2 + • • • • • • 4" — fnlxl 4" /п2ж2 + - - • 4~ fnnXn 4" ёп!и1 + ёп2и2 + • • • • • 4" ёптЧш . (2.19) где функции fij и g-lk являются координатами векторов X и U. *) Вопрос об установлении размерности пространства состоя- нии рассмотрим ниже.
S 61 ЛИНЕЙНАЯ ДИНАМИЧЕСКАЯ СИСТЕМА 75 Введем запись векторов в виде матриц-столбцов (2.20) ^22 ' " '£2m ёц ^21 Л.2 ' ' ’ fin In"' fin /11 /21 F(t) = G(t) = fn2 ' ’ f пп_ _fnl _^nl &n2 ' * * *>nm _ (2.21) Матрица F (7) имеет n строк и n столбцов, матрица G (t) имеет n строк и m столбцов. Используя правило умноже- ния матриц (§ 9), уравнения (2.19) можно записать в виде ±*=F(t)X + G(t)U. (2.22) Пусть пространство выходных величин Y имеет размер- ность р. Тогда, в силу условия 3 определения 2.6, форму- ла (2.18) может быть представлена в виде линейной ком- бинации составляющих вектора X и проекций вектора Y: У1 (0 — ^иж1 + fhzxz + • • • + ^in^m У2 (0 = ^21Х1 4“ ^22^2 • 4” ^2пхт Ур (0 — /ipi^i 4* hp2x2 4" • • • 4_ hpnxn‘ Записывая вектор Y в виде матрицы-столбца Ух(0 Y= Уг-° _УР и вводя матрицу координатных функций кц Лц h12 ... /г1п Н (7) = Л.21 , _^Р1 ^Р2 ’ ' ' ^рп_ (2.23) (2-24) (2.25)
76 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 получим соотношения (2.23) в виде Г (0 = Н (f)X. (2.26) Определение 2.7. Линейная динамическая система (ко- нечномерная и с непрерывным временем) описывается сле- дующей системой линейных дифференциальных урав- нений: = F (t) XG(t)U, Y(t)=H(t)X. (2.27) Если матрицы F, G и Н не зависят от времени, линейная динамическая система будет стационарной. Первое уравнение (2.27) называется уравнением со- стояний системы, второе — уравнением выходных величин. § 7. Переходная матрица и матрица импульсных переходных функций линейной системы Определения линейной динамической системы, при- веденные в предыдущем параграфе, устанавливают прин- ципиальную основу исследования линейных систем. Для получения ряда конструктивных результатов не- обходимо иметь такую характеристику системы, которая бы однозначно ей соответствовала и наиболее полно рас- крывала свойства системы. К получению этой характерис- тики мы и приступим. Рассмотрим дифференциальное уравнение линейной системы ^-=F(t)X, (2.28) полученное из уравнения состояния системы ^L = F(t)X + G(t)U (2.29) путем приравнивания нулю вектора входных воздействий r(z). Уравнение (2.28) будет описывать движение системы, возникающее только из-за начальных отклонений, кото- рые определяются вектором начальных условий X в
ПЕРЕХОДНАЯ МАТРИЦА 11 § 7J момент t — t0. Введем для этого вектора специальное обоз- начение X (t0) = Л. (2.30) Всякий вектор А' (£), удовлетворяющий уравнению (2.28) при любом заданном векторе начальных условий Л, на- зывается решением уравнения X (t) = X (t, Л), причем для t = t0 должно быть X (£0, Л) = Л. Обычно рассмотрение уравнений (2.28) и (2.29) начи- нается с доказательства теорем существования и единст- венности решения. Поскольку основной задачей дальней- шего рассмотрения является, главным образом, изучение свойств решения, мы ограничимся лишь формулировкой основной теоремы без доказательства. Если матрица F (t) непрерывна по t, для каждых зна- чений t0 ulET и начальных условий Л, || Л || <; оо, суще- ствует единственное решение уравнения (2.28) A (t, Л). Таким образом, для определенного значения i0 су- ществует множество векторов (функций) X (Zo, Л), зави- сящих от вектора начальных условий Л. Это множество образует линейное пространство решений, так как в со- ответствии с определением 2.6 пространство состояний системы является линейным (векторным). Теперь возникает вопрос, какова размерность это- го пространства? Покажем, что пространство решений X (I, Л) уравнения (2.28) является п-мерным, где п — число строк матрицы F (t). Поскольку вектор Л начальных условий является про- извольным, выберем в линейном пространстве п линейно независимых постоянных векторов Хг, каждый из которых является начальным вектором уравнения (2.28) и входит в числовое пространство Rn, так как начальные условия являются числами. Эти векторы образуют базис n-мерного линейного про- странства Rn. Таким образом, любой вектор начальных условий может быть разложен по этому базису: Л = а111 -Т сс2^2 + ••• + an^ni (2.31) где аг, а2, ..., ап — координаты разложения. В соответствии с теоремой о существовании и единст- венности решения для каждого вектора начальных усло- вий, в пространстве решений всегда найдется п однознач-
/8 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 но определенных решений Xt (t, kt) для п различных на- чальных условий уравнения (2.28). причем •^-i (^01 ^i) = Составим из них линейную комбинацию X (t) = axXi(t, Хх) + a^X^t, ^2) 4- ... 4 anXn(t, ^n), (2.32) которая также будет решением уравнения (2.28). Покажем, что эта комбинация линейно независима. Предположим обратное. Тогда, при некоторых аг, от- личных от нуля, функция X (t) по крайней мере при од- ном произвольном значении t = т будет равна нулю: X (т) = а1Х1 (т, 4- а2Х2 (т, Х2) 4- ... 4- — апХп (т, 1п) = 0. Но в силу теоремы о единственном решении при заданных функция X (т) должна быть равна нулю для всех т (Е (= Т, следовательно, и для т = t0. Прп этом мы получим (учитывая, что Xt (t0, Xf) = Хг) X (<«) = «1^1+ а2^2 + ••• ~ ~ 0. Однако это противоречит условию линейной независимо- сти векторов Кг, следовательно, комбинация (2.32) являет- ся линейно независимой. Так как координаты разложения (2.32) взяты теми же, что и в разложении (2.31), то при t — t0 получим «1X1 (г0, KJ 4- а2Х2 (t0. 12) 4- ... 4- an-X'n (Л, 1„) = А. Следовательно, X (<) действительно является решением при любом векторе начальных условий А. Таким образом, функции Xt (f, 1,-), i = 1, 2, ..., п, являются линейно не- зависимыми векторами в n-мерном пространстве и обра- зуют его базис. Рассмотрим понятие фундаментальной матрицы реше- ний. Для большей наглядности проведем необходимые рас- суждения на примере системы уравнений 2-го порядка. Вводя матрицу ^(o=f!llS !12/nl (2-33) 4 ' 1/21 (О /22 (' )J
J 7] ПЕРЕХОДНАЯ МАТРИЦА 79 и матрицу-столбец (2-34) получим уравнение (2.28) в следующем развернутом виде (для простоты записи аргумент t опустим): = АЛ 4" /12а:2> (2-35) — АЛ 4" /22^2- Если задать пару начальных условий в виде xr (t0) = ж10, ж2 (А) = 0> то уравнениям (2.35) должны удовлетворять некоторые частные решения хг (t, х10, 0), х2 (t, х10, 0), ко- торые обозначим (f, t0) и у21 (t, t0). Первый индекс у этих решений обозначает номер функции х (t) в уравне- ниях (2.35), а второй — номер отличного от нуля началь- ного условия. Меняя теперь местами значения начальных условий, т. е. задавая xr (t0) = 0, х2 (t0) = х20, аналогично преды- дущему запишем соответствующие частные решения в виде Т12 (f> А) и Т22 (А А)- Очевидно, функции yi} (t, А) явля- ются составляющими соответствующих векторов-решений, а значения начальных условий — составляющими на- чальных векторов: (t, ^) = Г7’1 [J’ '’И , °’ 11 LT21(t, *o)J X2 (t, 12) = p12J‘,<ojl 2V’ 27 LY22(«. to)J’ (2.36) При t = t0 мы должны получить (t0, = Kj, X2 (t0, ^2)=л2. Обобщая эти соотношения на уравнения п-го порядка, можем записать (А к) = T2i (i. to) (2.37) Tni(t. «о) где первый индекс у функции у обозначает номер строки матрицы F (/), а второй — номер начального вектора Xf.
80 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Положим в нашем примере системы 2-го порядка на- чальные условия единичными, т. е. х10 = 1, j"20 = 1. Соответствующие частные решения обозначим через ф/j (t, t0). Тогда будут иметь место соотношения Ты (t, t0) = Хцфц (t, t0), Т12 (t, t0) = ^2<Pi2 (t, to), T21 t0) = ^тфгг (t, t0), y22 (t, t0) = ^гФгг (6 ^o)> или, в матричной форме, Xj(t, ч=^Г<Р11!^°!1. 1 ' ’ 17 1 L<P21 (t, *o)J x2(t,i2) = /.2Гф12!'’''oJ] . 7 L<₽22 0- MJ Обобщая эти соотношения на уравнения и-го порядка, мо- жем записать: <рн (t, to) Xt (t, ^i) = *P2j (t, to) (2.38) Tnl(t. M и при t = t0 Xt (t, Kz) = так как Фу (to, t0) = 0 при i =/= j, 1 (2 фу (to, t0) = 1 при i = j. j Вернемся к уравнениям (2.35). Полученные частные ре- шения (2.36) приводят при их подстановке в уравнения (2.35) к следующим тождествам: = /11Т11 + /12Т21» ~ /11Т12 -г /12Т22, = /21Т11 + /22Т21, — fziiu Т /ггТг-л- Эти соотношения можно записать в виде элементов матриц dyn ttyt2~ dt dt d'(2! dyg - dt dt - /пТп + f 12T21 /21Т11 + /22721 /11Т12 т /12722I /21712 -r /22722J ’ (2.40) где каждый элемент правой матрицы равен соответствую- щему элементу левой матрицы. Применяя формулу умно- жения двух матриц (см. § 9), можно установить, что
S 71 ПЕРЕХОДНАЯ МАТРИЦА 81 правая матрица является произведением двух матриц Г/11Т11 + /12Т21 /11Т12 + /12Т22 I _ Г/11 /12 | ГТИ Т121 L/21T11 + /22Т21 /21712 + /22722 J I /2I /22 J [Tai 722J ' Введем обозначение г(Мо) = Гг11 Т12] ' 1Т21 722J и, используя выражение (2.33), запишем соотноше- ние (2.40) в виде ^^•=F(/)r («,/„). (2.41) Для системы n-го порядка матрица Г (t, t0) будет иметь вид 1 (С М — 7ц 7 21 7]2 • 722 • • 71п • • 72п (2.42) _7П1 7я2 • . . 7 • ,пп_| Матрица Г (/, t0) называется фундаментальной матрицей решений. Столбцы этой матрицы линейно независимы, следовательно, определитель матрицы отличен от нуля. В самом деле, используя формулу (2.37), матрицу (2.42) можно записать в виде 1 (t, t0) = (/, КД Хг (/, 12) ... Xn (/, Xn)l. где функции (векторы) JT, (/, 1г), играющие здесь роль столбцов, линейно независимы. Подставляя в последнее выражение значения Х;(/, 1;), определяемые формулой (2.38), получим: Г(Мо) = фи 4'12 . • чч ф21 422 . • ‘Ггп _ ^711 ЧИ2- • • пп_ li 1>2 412 • 4'22 • ?п| Введем обозначения фи <р21 Ф(Мо) = _Ч>П1 Ч>П2- • -Ч1 "11" Ха л_ (2.43)
82 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Тогда Г (t, t0) = Ф (t, /0)Л0. Матрица Ф (t, /0) называется переходной матрицей систе- мы. Смысл этого наименования установим ниже. Заметим, что вектор Ло — это начальный вектор, по- строенный на составляющих с координатами разложе- ния az, равными единице [см. формулу (2.31)]. Если все составляющие начального вектора Ло сделать единич- ными, = ... = = 1. то фундаментальная мат- рица решений совпадет с переходной матрицей. Послед- няя при t = t0 становится единичной, так как имеют мес- то значения определяемые (2.39): Г1 Ф(Мо) = 0. . ,0~ 1 . . .0 0. . .1 (2.44) о На основании соотношения (2.41) можно заключить, что переходная матрица удовлетворяет уравнению ^^ = Б(г)Ф(Мо). (2.45) Сравнивая это выражение с уравнением (2.28), видим, что Ф (t, t0) можно трактовать как вектор в n-мерном прост- ранстве с линейно независимыми составляющими в виде строк матрицы (2.43). Введение понятия переходной матрицы позволяет по- ставить задачу отыскания непосредственной связи меж- ду вектором состояний системы и вектором входных воз- действий. Будем искать решение уравнения (2.29) в виде X (0 = Ф (t. t0)K (t, tn), (2.46) где К (t, t0) — некоторая матрица, зависящая от вектора входного сигнала U (£). Дифференцируя соотношение (2.46) по времени, полу- чим f = Ф(^о)^ + ^^(Мо).
ПЕРЕХОДНАЯ МАТРИЦА 83 S 71 Подставляя значения X (Z) из (2.46) и полученное dX/dt в уравнение (2.29), будем иметь Ф (t, t0)d-^ + ^ К (t, t0) = F(t)& (t, t0) К (t, t0) + G (t)U, ИЛИ л W Ф(Мо)^ = £(0*Л (2.47) так как на основании (2.45) имеет место тождество ^К(Мо) = ^)Ф(Мо)-К(Мо)- Поскольку столбцы переходной матрицы Ф (t, Zo) линей- но независимы, матрица является невырожденной (см. § 9) и имеет обратную матрицу Ф'1 (t, t0). Умножая со- отношение (2.47) слева па Ф-1 (Z, Zo) и учитывая свойство обратной матрицы Ф1 (z, *0)Ф (z, /0) = Л получим ^ = Ф-1^. Интегрируя это выражение в пределах от t0 до t, будем иметь t К (t, t0) = С J Ф"1 (s, ZG) G (s) U (s) ds, b причем, когда t = t0, С — К (Zo, Zo). Умножая соотно- шение (2.46) слева на Ф-1 (t, t0), положив затем t = t0 и учитывая на основании (2.44), что Ф~1 (t0, t0) = I, полу- чим С - X (Zo). Подставляя значения К (t, t0) и С в формулу (2.46), окон чательно будем иметь: i X (0 = Ф (/, Zo) X (Zo) 4- Ф (Z, t0) J Ф'1 (s, Zo) G (s) U (s) ds. (2.48) Формула (2.48) устанавливает связь между вектором со- стояния системы X (Z), вектором начальных условий
84 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ 1ГЛ. 2 X (/0) и вектором входных воздействий V (f) через пере- ходную матрицу системы Ф (t, t0). Таким образом, пере- ходная матрица является характеристикой линейной си- стемы, полностью определи?чщей ее динамические свой- ства. Если входное воздействие отсутствует, U (£) = О, вектор состояния системы определяет так называемое свободное движение системы. На основании формулы (2.48) 011 будст равен х (0 = Ф (f, t0) X 70), и («) = 0. (2.49) Полученное соотношение показывает, что матрица Ф (t, t0) определяет переход системы из начального состояния в момент t0 в состояние X (f , соответствующее моменту времени t. По этой причине Ф (t. t„) п называется переход- ной матрицей системы. Если до подачи входного воздействия система находи- лась в покое X (to) = 0, век гор состояния системы после подачи входного воздействия бхдет определять вынужден- ное движение. При этом формула (2.48) примет вид i Х(£) = Ф(£, i0) J Фг1 (s, t01G (s) U (s) ds, X(/n) = 0. to Установим теперь некоторые свойства переходной мат- рицы. Используя формулу (2.491. можем записать х (ч) = ф (/L. ta) х (tt), х (Q ~ Ф (t, Q x (tl), откуда X (tj = Ф (f2, t± Ф (G, to) X (to). С другой стороны, имеем X (t2) = Ф (L. to) X (Q, следовательно, Ф (i2, to) = Ф (t*, h) Ф (G, to). (2.50) Полученная формула является конкретной реализацией полугруппового свойства переходной функции состоя- ний, данного в общем определении 1.1 гл. 1. Положив в формуле (2.50) t2 = t0, G = t, получим Ф (t0, to) - Ф (Г, <)Ф (G to) = I,
§ 71 ПЕРЕХОДНАЯ МАТРИЦА 85 откуда Ф"1 (i0, 0 = Ф (t, t0). (2.51) Формулы (2.50) и (2.51) можно применить для преоб- разования соотношения (2.48) к более удобной форме. Заменим в нем обратную матрицу Ф'1 (s, tB) по формуле (2.51) на Ф (i0, s), введем под знак интеграла матрицу Ф (t, to), так как она не зависит от переменной интег- рирования s, и заменим полученное произведение Ф (t, to) Ф (to, s) по формуле (2.50) на Ф (t, s). Окончательно получим t X (t) = Ф(г,/0)Х(£0) + j Ф(;, s)G(s)V (s)ds. (2.52) t(> Эта формула более удобна для расчетов, чем (2.48), так как не содержит обратной матрицы. Рассмотрим линейную систему, состояние которой для моментов времени t £ характеризуется нулевым на- чальным вектором X (£) =0. В момент t = £ на систему подается входное воздействие U (t) = X6(t- £), (2.53) где V матрица-столбец чи- сел (2.54) П1 П2 Рассматриваемое входное воз- действие представляет собой набор импульсных входных сигналов в виде дельта-функ- ций с «площадями» nlt п2, ..., пт (рис. 2.9). Последние определяются как предел выражения со 7?i = lim ( ба(/ — l)dt, а—X где ба (t — £) — любая непрерывная четная функция с
86 ЛИНЕЙНЫЕ ДИНАМИЧЕ'КИЕ СИСТЕМЫ [ГЛ. 2 параметром а, такая, что при а -> 0 будет ба (t — £) -> —> б (t — £). Сама дельта-функция определяется соотно- шениями t = l, (2.55) ОО б) /(£)= J —со Подставим в формулу (2.52) выражение (2.53) и положим X (f0) = 0. Будем иметь t X (t) = j Ф (t, s)G s. X6 (s — £) ds. to Интегрирование матрицы есть интегрирование каждого из ее элементов. Поэтому к полеченному выражению при- менима формула (2.556), определяющая основное свойство дельта-функции. В результате получим X(t) = Ф(/. ;)G(g)X. (2.56) Положим теперь «площади» всех действующих на входе дельта-функций равными единице. При этом Получаемое при таком воздействии множество выходных сигналов есть не что иное, как множество импульсных пе- реходных функций [26]. Поэтому получаемой матрице це- лесообразно дать специальное обозначение и наименова- ние матрицы импульсных переходных функций W (t, В) = Ф С B)G (£). (2.57) Так как матрица Ф (t, |)—квадратная (содержит п строк и п столбцов), а матрица G (j имеет п строк и т столб- цов, их произведение будет иметь п строк и т столбцов
ПЕРЕХОДНАЯ МАТРИЦА 87 Запишем матрицу W (7, £) в развернутом виде “wu(t,5) wi2(t, . wlm(t, у W21 (t, 5) W22 (t. Е) . . . W2m (t, у где функции wij (t, £) являются реакцией i-ro выхода си- стемы на /-й вход (рис. 2.10, а). Тогда, очевидно, реакция ЮЦ а) Wf2 li>j- wlm Рис. 2.10. i-го выхода на все т входов (рис. 2.10, б) будет равна сумме элементов г-й строки матрицы (2.58). Формулу (2.56) с учетом соотношения (2.57) можно записать в виде X (0 = w (t, или, заменяя £ на t0, X (t) = W (i, t0) X. (2.59)
88 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Сравнивая эту формулу с соотношением (2.49) для опре- деления вектора состояний при свободном движении си- стемы, видим, что матрица импульсных переходных функ- ций отображает вектор «энергий» дельта-функций в те- кущее состояние системы. Это обстоятельство позволяет осуществить пересчет вектора начальных условий X (tQ) в эквивалентный вектор входных сигналов Uo (t) = = jV6 (t — tB). Тем самым во всех случаях вектор состоя- ний системы можно определять как результат входных воздействий па систему, находившуюся до этого в покое. При этом формула (2.52) может быть заменена следующей (с учетом соотношения (2.57)]: t X (0 = J W (t, s) [Г, + иэ (S)l ds, (2.60) /о где иэ (0 = Ж (t - t0). (2.61) Подставляя (2.61) в формулу (2.60), легко убедиться в справедливости такой замены. Для определения значений матрицы-столбца -V, соот- ветствующих значениям вектора начальных условий X (/0), воспользуемся выражениями (2.56) (заменив Н на t0) и (2.49): X (0 = Ф (t, t0)G (Q.V, X (i) = Ф (t, t0)X (f0). Приравнивая правые части этих соотношений и определяя X, получим -V = G-1 (t0)X (Zo). (2.62) В заключение данного параграфа рассмотрим пример. Пример. В линейной системе заданы следующие матрицы: f(o=[=i о]: G(t)=[o]: и(о=[е^Т x<to)=°- Требуется найти переходную матрицу и матрицу-столбец вектора состояния системы. Подставляя в уравнение состояний (в данном примере — ста- ционарной системы)
S 7) ПЕРЕХОДНАЯ МАТРИЦА 89 Для нахождения переходной матрицы положим V (t) — О (e~at = 0) и запишем уравнения в операторной форме рх± = —бау + 5х2, рх2 = — Получим (р2 + 6р + 5)^ = 0, (р2 + 6р + 5)х2 = 0, следовательно, хг и х2 имеют одинаковые корни характеристиче- ского уравнения. Они равны Pi = —1» Ра = —5- Общее решение имеет вид ж1,2 (f) = Cie~f + cae~il- (2.64) Дифференцируя его по t, получим da;, „ = — Си”' — 5C2₽-3f • (2.65) Переходная матрица для рассматриваемой системы имеет следую- щий общий вид: ф (t, t0) = <{>11 (t, to) Cf21 (t, to) <pl2 (t, to) ф22 (t, to) Для определения элементов матрицы Ф (t, t0) необходимо задать начальные условия согласно следующей таблице: Элемент матрицы Ф11 Ф21 Ф12 Ф22 Начальные условия ?! (to) 3’2 (to) 1 0 1 0 0 1 0 1
90 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ 1ГЛ. 2 Подставляя эти значения в уравнения (2.63) и положив t = t01 найдем начальные значения производных. Они определятся сле- дующей таблицей: x, (to) X2 (to) (M X2 (to) 1 0 —6 -1 0 1 5 0 Все значения <р определяются одной формулой (2.64), однако для каждого <р необходимо найти свою пару постоянных (\ и С2. Они находятся совместным решением уравнений ад,2 (/о) = Cie -j- Cze 5f“, 1 . ' 1 (2.66) ад,г(£о) =— 016"'°—5Сце 5l°, J полученных из уравнений (2.64) и (2.65) подстановкой t = f0. Подстановка начальных условий из приведенных выше таблиц в уравнения (2.66) осуществляется по следующей схеме: Фп “ -> (f0), .T± (f0) Ф21 - ** X2 (^0)» #2 (Q, Ф12 - * Go), Л Go) Ф22 _ * X2 (^0)» $2 (^o)' В результате вычислений получим следующую таблицу постоянных Ci и С2‘ Элемент матрицы Vn Q21 Ф12 Ф22 Ci -1/4 —1/4 5/4 5/4 Cz 5/4 1/4 -5/4 —1/4 Подставляя эти значения в соотношение (2.64), найдем элементы переходной матрицы. Она будет иметь вид o(/,t0)=4- __ g-(i-to) । 5e~5(f-to) __ g-(f-ti>) j g~5(t-to) 5e (( (o)— 5g 5(f to)- 5g-U-M _ g—5(1—to) Легко проверить, что при t = t0 Ф (t0, t0) = I.
§ 8] ПРОСТРАНСТВО СОСТОЯНИЙ СИСТЕМЫ 91 Для нахождения вектора состояний X (/) воспользуемся фор- мулой (2.52). Учитывая, что X (t0) = 0, получим X(t) = ж, 1 1 f Г- e-(<-s) + 5e~s(f~s) ]= 4 J |_ e-(t-3) + e-S(t-s) 5е-(<-«) _ 5e~3(f”s> Выполняя умножение матриц, будем иметь: t xi (i) = I- e~(f“S) + 5e~5('-s)] e~as ds, to t X2 (0 = “Г 5 e<,s) + e-S(<-s)l e~as ds- to Выполняя интегрирование, получим искомый вектор состояния: 7 , —ту (е at —е *) — 7-7-----------(е~а( — е 5<) 4 (а — 1) ' ' 4 (а — 5) ' ' 1— ту (Еа' - е~г) - , * .. (е-а< - е^1) L4(a — 1) ' 4 (а — 5) v § 8. Пространство состояний системы Введенные выше определения устанавливают, что со- стояние линейной динамической системы в данный момент времени однозначно характеризуется вектором состояния X (i)> удовлетворяющим дифференциальному уравнению d^ = F(t)X(t) + G(t)U(t), X(Q = A, (2.67) где F (i) и G (t) — матрицы размера п X п и п X т, опре- деляющие физические параметры системы, U (f) — вектор входных воздействий, Л — вектор начальных условий (начальный вектор). Определим пространство состояний системы следующим образом. Определение 2.8. Множество векторов X (t), удовлет- воряющих уравнению (2.67) для всех Г Е й и всех t GE GE Тл называется пространством состояний линейной
92 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 системы. Пространство состояний натянуто на «-мерный базис, следовательно, оно и-мерно. Выше мы показали, что размерность пространства ре- шений уравнения (2.67) для случая TJ (t) = 0 равна п. Теперь необходимо показать, что решение неоднородного уравнения (2.67) также принадлежит n-мерному линей- ному пространству и удовлетворяет теореме о существо- вании и единственности решения. Введем диагональную матрицу Р (t) размера п X п сле- дующего вида: О О (2.68) Элементы этой матрицы ра-столбца, являющегося G (Z) и U (Z): определим как элементы векто- произведением двух матриц G(t)U(t) = (2.69) где pt (t) = gnU! + gi2u2 4- ... + gimum. Составим из матриц F (Z) и P (Z), каждая из которых имеет размер п X X и, новую матрицу L (t) размером 2п X 2п: L(t) = (2.70) О О J ’ где О — нулевая матрица размером п X п: '0 . . . 0- -о . . . 0- С помощью матрицы L (Z) образуем однородное дифферен- циальное уравнение ^L(Z)F. (2.71)
§ 8J ПРОСТРАНСТВО СОСТОЯНИЙ СИСТЕМЫ 93 Поскольку это уравнение эквивалентно но виду уравне- нию (2.28), для него справедливы все выводы о существо- вании, единственности решения и возможности его пред- ставления через базисные векторы, если задан вектор на- чальных условий. Для уравнения (2.71) примем вектор начальных условий (2.72) в виде матрицы-столбца размером 2n X 1. В соответст- вии с результатами предыдущего параграфа уравнению (2.71) будет удовлетворять любой вектор F(0 = yi ~ Уг -У^ в виде линейной комбинации из 2п линейно независимых частных решений, образующих базис 2и-мерного про- странства решений. Представим вектор Y (i) в виде двух матриц-столбцов из и элементов в каждом: F(i) = YF (t)l YP (i)J ' Вектор YF (t) принадлежит n-мерному линейному про- странству, следовательно, всегда может быть определен через базисные векторы, образующие п линейно независи- мых решений однородного уравнения (2.28). Подставляя значения вектора Y (t) и матрицы L (i) из соотношения (2.70) в уравнение (2.71), получим £rrF(0] И(0 р(0’| [ГИ01 dt (0.1 “ L 0 0 J 1Тр (0J ’ или, после перемножения матриц в правой части, - Y„ (/) dt F — YP (t) dt p ' [F(t)YF(i) + P(t)Yp (t)l L O-YF(t) + O.Yp(t) j’ (2.73)
94 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Вектор начальных условий, учитывая выражение (2.72), примет вид Yp (io) YP (io). или Yf (Q = Л, Приравнивая соответствующие элементы матриц (2.73), получим -ОТ = РYp (i) + Р (t) YP (t), Fp (t0) = A, dYp Г1 — = o, FP(M= : . Li J Решение второго уравнения очевидно и равно YP (£) = = const. Учитывая значение начального вектора и усло- вие единственности решения, получим Найдем произведение Р (t)YР (£). Используя значение мат- рицы Р (£) из соотношения (2.68), будем иметь: Р(0Ур (0 = Pi 0 0 Р2 .6 о Г1 о . 1 pi (ty P2.(i) -PnW Но согласно выражению (2.69) эта матрица-столбец равна G (t)U (i). Следовательно, первое уравнение примет вид dYp -sP = F(t)YP (t) + G(t)U(t), Yf (ie) = A.
§ 8] ПРОСТРАНСТВО СОСТОЯНИЙ СИСТЕМЫ Сравнивая это уравнение с уравнением (2.67), заключаем, что Yp (t) = X (t). Следовательно, вектор решения неод- нородного уравнения (2.67) совпадает с n-мерной состав- ляющей вектора решения однородного уравнения (2.71), т. е. принадлежит «-мерному пространству состояний. Кроме того, для уравнения (2.67) соблюдается теорема и о существовании и единственности решения. Рассмотрим теперь вопрос о базисе пространства со- стояний. В § 7 мы установили, что любой вектор решения однородного уравнения = ^(М = л можно разложить по базису Xt (t, 1,): -Л (i) = a1X1(t, lj) 4-а2Х2 (^ К) + ••• + “n-^n G» Ki) г (2.74) где Xt(t, Хг) есть вектор решения для заданного вектора начальных условий 1г, определяемый как матрица-стол- бец [см. формулу (2.38)] Xi (^ К) — К Фн G. М Ф2; (г- to) (2.75) Фпг (<> fo) Обратим внимание на следующее обстоятельство. Вектор Xt (it К) определяется только через значения стандартных частных решений <р3/ (/ = 1, 2, . . ., п), отвечающих еди- ничному вектору начальных условий. Рассмотрим как проекции этого вектора на «-мерную систему коорди- нат. Поскольку (рл линейно независимы, они также обра- зуют базис для «-мерного пространства. Направления осей координат совпадают с направлением осей ..базиса на- чального вектора Л, так как при t = t0 Фл = 0 (j =# i) и фн = 1. Сказанное иллюстрируется двумерной моделью, по- казанной на рис. 2.11. На ней изображены векторы Xx(f, li) и Х2 (t, Х2), образующие базис пространства X (t), и их разложение по базису пространства начальных усло- вий Л.
5б Линейные динамические системы 1гл. 2 Введем в качестве базисных векторов решения для единичных начальных условий Ф1{ ('• 'о) <P2i о. м _ФП1 (' '<>) (2.76) а в качестве координат разложения используем числовые значения составляющих вектора А. При этом формула (2.74) запишется в виде X (0 = (t, 1) + Х2Х2 (z,l) + ... +КА\ (t, 1). (2.77) При t = t0 все векторы Рис. 2.11. Х( (t, 1) принимают еди- ничные значения и совпа- дают по направлениям с векторами базиса началь- ных условий, а вектор X(t0)=А. Выражепие(2.77) примет вид *) A (i0) = А= • 1 —|- Z2-l + ... + V1 (2.78) (не следует забывать, что это векторная сумма). Определим, далее, со- ставляющие вектора A (/) через составляющие векто- ров Xi (t, 1). Записывая вектор X (t) в виде матри- (2.77) выражение цы-столбца и подставляя в соотношение (2.76), после сложения матриц-столбцов получим а.! (t) а-2(1) Х1ф11 (1, <о) + /.2ф12 (t, to) + + ^пФ1п (г> М Х1ф21 (t, ?о) + Х2ф22 (t , to) + • • • + ^ПФ2И (* • М (f. *о) + ^2фп2 М + • +1^71 Ч’пп (6 to\ *) Эта формула отличается от (2.31) тем, что здесь в качестве компонент вектора Л используются числа Xj, а нс аД;. Очевид- но, такая замена не меняет существа дела.
8] ПРОСТРАНСТВО СОСТОЯНИЙ СИСТЕМЫ 97 Таким образом, j-я составляющая вектора X (7) будет определяться соотношением Х1 (О = М + КМн 70) + . . . + ^n^jn ^о) (2.79) Все составляющие вектора -¥ (7) линейно независимы, по- скольку линейно независимы функции <pj; столбцов пере- ходной матрицы, следовательно, они могут быть приняты в качестве базиса пространства состояний. Легко видеть, что при t — to имеет место равенство A(Q= Xi (to) ' Х2 (to) L хп (to) что совпадает с соотношением (2.78), по записано в форме матрицы-столбца. В результате проведенного рассмотрения мы устано- вили, что базис пространства состояний однородного урав пения (2.28) с векторами Xi (t, к,) однозначно пре- образуется в базис этого же пространства с векто- рами Xj (7). Оба базиса совпадают при t = t0. До- стоинством базиса по эле- ментам Xj (7) является не- изменность ориентации его векторов в пространстве с течением времени, что дает определенные практичес- кие удобства. На рис. 2.12 для двумерного случая по- казано расположение век- Рпс. 2.12. торов рассмотренных базисов и разложение по ним про- извольного вектора X (7). Рассмотрим одну особенность пространства состояний для случая, когда движение системы описывается одно- родным уравнением. При этом вектор состояний опреде- ляется выражением X (7) = Ф (7, to) X (to). (2.80) 4 А. В. Солодов
98 ЛИНЕЙНЫЕ ДИН МИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Выделим некоторый промежуточный произвольный момент времени tlt t0 <8 G <8 t. Тогда, используя соотношение Ф (/, t0) = Ф («, Л)Ф (0, t0), получим X (0 = ф (t, ОФ (0, о х (О- Но согласно формуле (2.8J) будем иметь Ф (0, t0)X (t0) = X (О, следовательно, х (0 = ф («, 0) х (tl). Таким образом, состояние системы в момент G, определя- емое переходом из начальн го состояния X (Q с помощью переходной матрицы Ф (tl. t0), можно рассматривать как новое начальное состояние системы. Поскольку моменты времени t и 0 относительно t0 произвольны, переход си- стемы в любое новое состояние всегда можно представить в виде последовательной серии начальных состояний. Иными словами, в этом случае все пространство состояний образовано векторами начальных условий. Оно натянуто на базис из п векторов вида (2.79). Такое пространство в теории систем называется фазовым пространством [12]. Перейдем к рассмотрению свойств вектора решения неоднородного уравнения -.67), когда система находится под воздействием входных сигналов. Состояние системы в этом случае определяется формулой t X (0 = Ф (?, 0) X (0) + Ф (/, s) G (s) и (s) ds. (2.81) to Нас будет интересовать составляющая вынужденного дви- жения. Поэтому, введя обозначение Z (0 = G (t)U (0 (2.82) и учитывая соотношение Ф (0 s) = Ф (0 0)Ф (G, s), (2.83) запишем t Хв (0 = Ф (0 ,\) Ф (0, s) Z (s) ds, to
§ 8] ПРОСТРАНСТВО СОСТОЯНИЙ СИСТЕМЫ 99 где Х„ (t) — составляющая вектора состояния, определя- ющая вынужденное движение системы. Если рассмотреть последовательные состояния системы через малые промежутки времени Af, то можно убедиться, что при этом процедура отыскания значений вектора со- стояния подобна рассмотренной выше процедуре для од- нородного уравнения. Пусть tL = tB + At, тогда Хв (tx) = Ф (И, Zo) Ф (Zo, s) Z (s) ds. Интеграл при малом значении At практически не зависит от верхнего предела и дает некоторую постоянную мат- рицу-столбец /о+Д t Ф (t0, s) Z (s) ds. Следовательно, ЛГВ — Ф (t1T tQ) Xг (t0), где Хх (t0) играет роль начальных условий. Таким образом, пространство состояний из векторов вынужденного движения системы подобно рассмотренному выше пространству состояний свободного движения. Оно я-мерно и в качестве векторов базиса имеет составляющие (t) вектора состояния. Для общего случая движения системы при наличии входных воздействий и начальных условий, используя соотношения (2.81), (2.82) и (2.83), запишем вектор состоя- ния в виде X (Z) = Ф (Z, Zo) Г X (Z„) 4 Ф (Z,„ s) Z (s) ds Подставляя в эту формулу значение Ф (t, t0) из выраже- ния (2.43) и раскрывая векторы-столбцы X (Z), X (Zo) и 4*
100 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 ds При этом /-я составляющая вектора X (f) определится вы- ражением (0 = Фл (F Q + Ф.?2 (F Q К Н--------+ ф3„ (t, tB) Ki + t + \ [фй (to, s) Z1 («) + ф3-2 (to, s) z2(s) +-F «Pin (to, s) z„(s)J ds. d (2.84) Сравнивая формулы (2.79) и (2.84), видим, что базисные векторы пространства состояний для общего случая зави- сят и от составляющих входного воздействия, однако при t = to они совпадают с базисом пространства начальных условий. ? 9. Структурные схемы линейных систем Линейные системы общего вида описываются, как было показано выше, векторпо-матрпчным дифференциальным уравнением. Поэтому различные преобразования урав- нения связаны с действиями над матрицами. С другой сто- роны, в большинстве случаев нагляднее и удобнее рас- сматривать преобразования систем с помощью их струк- турных схем. Структурной схемой системы называется графическое условное изображение взаимосвязанных элементов или звеньев, составляющих систему и различающихся своими д ин амически ми с в ойст в ами. Предварительно изложим некоторые сведения из тео- рии матриц, поскольку в дальнейшем они будут применять-
i 9] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ 101 ся более широко как при рассмотрении теоретических во- просов, так и при построении структурных схем. Матрицей называется таблица коэффициентов в виде чисел или функций; состоящая из строк и столбцов. Коэф- фициенты называются элементами матрицы. Обычно эле- менты матрицы индексируются парой чисел, у которой первый индекс обозначает номер строки, а второй — помер столбца. Так, а^ — это элемент, находящийся на пере- сечении i-й строки и /-го столбца. Матрица обычно обозначается, как и вектор, большой буквой и изображается следующим образом: т столбцов «И «12 ... «i,n (/21 й22 ’ ’ ' аЧт °ni пп2, ’ ‘ ‘ "т п строк. Размер (порядок) матрицы определяется числом строк и столбцов и обозначается п X т, где п — число строк, т — число столбцов. Если число строк равно числу столб- цов, п = т, то матрица называется квадратной порядка п. Элементы аи, а22, . . ., апп называются главной диагональю квадратной матрицы. Матрица, состоящая из одной строки, называется матрицей-строкой и обозначается А = [йц Gio ... Щщ]. Матрица из одного столбца называется матрицей-столб- цом (или вектором) г Ьн -« Матрицы при определенных условиях можно склады- вать, вычитать и умножать. Если имеются две матрицы одного и того же порядка (n X т), то можно найти их сумму, складывая одноименные элементы матриц: А + В — С, Си = ац 4- bij, i = 1, 2, . . ., п, 7 = 1, 2, . . ., т.
102 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Очевидно, что матрица С также будет иметь порядок п X т. Произведение двух матриц А и В определяется только при условии, когда число столбцов матрицы А совпадает с числом строк матрицы В. Произведение записывается так: С = АВ, а элементы матрицы С определяются формулой п Oj — 2 (2.8э) к=1 где aik — элементы матрицы А, bkj — элементы матрицы В, п — число столбцов матрицы А (строк матрицы В). Если матрица А имеет размер п X т и матрица В — раз- мер т X р, то размер матрицы С определяется по мнемо- ническому правилу: (п X т)(т X р) = (п X р). (2.86) Произведение матриц в общем случае не обладает комму- тативностью АВ ф ВА, однако ассоциативный закон выполняется: А (ВС) = (АВ)С = АВС. При умножении матрицы на скаляр (число или функ- цию) каждый ее элемент умножается на этот скаляр: с А = (саи). Матрицы, элементами которых являются функции, могут дифференцироваться и интегрироваться. При диф- ференцировании матрицы каждый ее элемент дифферен- цируется 4л = [4w] • <2-87> и при интегрировании каждый ее элемент интегрируется A dt= ац (t) dt^ . (2.88) Квадратная матрица, у которой все элементы, кроме элементов главной диагонали, равны нулю, а каждый
§ 9] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ 103 элемент главной диагонали равен единице, называется единичной и обозначается 10 ... о -00 ... 1 В некоторых случаях можно найти матрицу, обратную квадратной матрице А, обладающую свойством АА'1 = A~rA = I, (2.90) где А"1 — обратная матрица. Очевидно, обратная матрица также будет квадратной па основании формулы произве- дения матриц (2.86). Обратная матрица вычисляется следующим образом. Из элементов матрицы А находится определитель cii «12 • • «1П «21 «22 ’ • д2п det A = • °nl «П2 ann затем вычисляются алгебраические дополнения (адъюнкты ad Atj) этого определителя путем вычеркивания г-й строки и у-го столбца по формуле «11 «12 . 1 ’ I'5 ' • am «21 «.X» • • «23 • ad/li3- = (- 1)г+3 • 1 el — /1 in am «П2 • ' 1" ’ ann Из значений ad Atj и det А составляются элементы обрат- ной матрицы по формуле Uij ad ,li3- del A
104 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ 1ГЛ. 2 При этом получается матрица следующего вида: ad 4U ad.,421 . • adXnJ-| Л-1 _ 1 А del .1 ad Л]2 sd Л22 • • ad^„2 • (2.91) ad А1п adX2n . Построение обратной матрицы показывает, что она может быть получена лишь в том случае, когда определитель исходной матрицы не равен нулю: det А 0. Матрицы, обладающие этим свойством, называются не- особыми или невырожденными. Чтобы матрица была невы- рожденной, необходима линейная независимость строк (или столбцов) этой матрицы. Транспонированной называется матрица, у которой произведена замена ее строк столбцами (и наоборот). Транспонированная матрица обозначается индексом Т вверху (иногда штрихом): Й11 Са • • • °П1 Я12 °22 * * а П2 "ill П2п ' ' ’ апп. Для транспонированных матриц имеют место соотно- шения: (АБ)Т = ВТАТ, (А1С)Т = (’Т11Т (2.92) п т. д. Если походная матрица имеет порядок п X тп, то для определителей произведения А-А'г справедливы зависи- мости: | АЛТ | > О, | ААТ | = 0, | ААТ | > 0, если п т; если п^> т: если ранг (Л) = т.
§ 9] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕ ИНЫХ СИСТЕМ 105 Матрица-строка может быть представлена как транспо- нированная матрица-столбец, и наоборот: fill - 012 Т А = [аиа13 . . . а1п]. Рангом матрицы А (обозначается В (Л)) называется наи- высший порядок отличных от нуля миноров определителя матрицы. Поскольку максимальное число линейно неза- висимых строк всякой матрицы равно максимальному чис- лу ее линейно независимых столбцов, ранг матрицы ра- вен этому числу. Если известны ранги двух матриц А и В, то, вообще говоря, мы не можем связать их однознач- ным соотношением с рангом их произведения АВ. Однако можно указать на ряд свойств матриц относительно их рангов. Так, например, В (АВ) < В (В). (2.93) Строки матрицы АВ согласно формуле (2.85) являются линейными комбинациями строк матрицы В, поэтому число линейно независимых строк матрицы АВ не больше, чем у матрицы В. Если В есть невырожденная квадратная мат- рица, то В (АВ) = В (Л). (2.94) И, наконец, В (ААТ) = В (Л). (2.95) Перейдем теперь к рассмотрению структурных схем линейных систем. Введем следующие звенья, составляющие структурную схему системы. Интегрирующее звено осуществляет операцию инте- грирования действующего на его входе сигнала. Будем различать одномерное интегрирующее звено, имеющее один вход и один выход, и многомерное интегрирующее звено, имеющее несколько входов и несколько выходов. Суммирующее звено осуществляет операцию суммиро- вания сигналов. Матричный блок осуществляет линейное преобразо- вание вектора входных сигналов в вектор выходных сиг- налов. Векторы на структурной схеме будем обозначать двойными линиями. Условные обозначения перечисленных звеньев показаны на рис. 2.13.
106 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 На рис. 2.14 изображена с помощью введенных обозна- чений обобщенная структурная схема линейной системы, Рис.S2.13. Рис. 2.14. отвечающая основным уравнениям: ^ = F(t)X(t) + G(t)U(t), Y(t) = H(t)X(t). (2.96) Вектор состояния X (t) при нулевых начальных условиях на основании формулы (2.52) определится выражением t X (?) = ф (I, s) G (s) U (s)ds. (2.97) io Обобщенная структурная схема не позволяет получить достаточно эффективные способы ее изучения, однако она весьма наглядно устанавливает основные связи в системе
S S1 СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ Щ7 т//? х2а)=^и)^а) Рис. 2.15. Для более детального изучения структурных схем раскроем схему операций в матричном блоке. С этой целью введем еще один элемент структурной схемы — блок пере- менного коэффициента. Блок переменного коэффициента осуществляет умножение вхо- дного сигнала на заданную функцию времени (рис. 2.15). Операция линейного преобра- зования матричным блоком входного вектора есть < пера- ция умножения матрицы на матрицу-столбец. Применитель- но к рассматриваемой структурной схеме можем записать Y (0 = Н (О А- (О или в развернутом виде Vi (О = (t) Xi + h12 (t) х2 + ... + hln (0 xn, У2 (О — ^21 (О Я-1 "Ь ^22 (0 • Ч~ ^2П (О Ур (О ^pi (0 -Ь (О 3-2 “Ь • • • kpn (0 ^п- Теперь легко построить структурную схему матричного блока. Она изображена на рис. 2.16. Рис. 2.16. Формирование выходных векторов всеми матричными блоками структурной схемы рис. 2.14 однотипно и
108 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. ?. осуществляется по схеме матричного блока рис. 2.16. Сле- довательно, можно построить структурную схему линейной системы в более детальной форме. Она изображена на рис. 2.17. Воспользуемся выражениями для матриц (2.20) и (2.21) предыдущего параграфа и запишем первое уравнение (2.96) в развернутом виде: ~ /1Й 4“ /12Ж2 4" ’ ’ ‘ + /1А> + gll^l 4" ‘ ‘ 4“ gim^m’ ~ТГ- = /2Л + /22^2 + • • + /2пхп 4“ f>21wl + • • • + SimU-mi — /пг^1 4” /n2^2 “Ь * ‘ ’ 4~ /ппхп + gniMl 4~ * " ‘ 4~ gnm^m- (2.98) Введем обозначения Ру ~ fllxl + /13^3 + • • • + /1А 4~ gll/h + . . . + glmUm, Р2 = /’А 4“ /22^2 4-/24^4 4- • • • 4~ /2 мА 4- g2iui 4* • • • • • 4~ g2m^mt Pn-i — /(n-i)i 4- • • . 4- /(n-D(n-i) xn-i + 4- • • • • • • 4~ g(n-iym ит, Fn = gnlul 4- gn2u2 4- • • + gnmum и запишем уравнения (2.98) в следующем виде : - /12^2 4- Fi, 'dt2 ' = /гз^з 4" Р2, (2.99) — = /(n-i)n^n + F-, —= /пА 4* fn2X2 По этим уравнениям легко построить структурную схему, изображенную на рис. 2.18.
S 9] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ 109 Положим теперь в уравнениях (2.99) Л = = . . . = Fn-X = 0 (это означает, что коэффициенты при соответствующих переменных равны нулю), /12 = /гЗ ~ • = /(п-1)п = 1, /п1 «0, /м2 * • •» /пп вп-1" Рис. 2.18. Получим: dx, 1Г = :С1' dx-> ~dt~ = Жз’ dx «0^1 ^1^2 " ’ * «n-l^n | &П' Взаимной подстановкой первого уравнения во второе, второго в третье и т. д. и .заменой в последнем уравнении значений х->, х3,хп из предыдущих уравнений будем
но ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 иметь: d । , dx, , „ —~ п^-l + •' ‘ + Й1 ~т,—h aoxi = ^n- (2.100) at at UL Структурная схема, отвечающая этому уравнению, приведена на рис. 2.19. Она легко получается из структур- ной схемы, приведенной на рис. 2.18, если учесть введен- ные выше значения коэффициентов уравнений. Рис. 2.19. Уравнение (2.100) описывает линейную динамическую систему с одним входом Fn и одним выходом хг. Многие практические задачи приводят к необходимости исследо- вания уравнений этого вида, и проведенный переход от общего уравнения (2.98) к данному показывает, что урав- нение (2.100) есть изоморфное преобразование уравнения (2.98). Отсюда следует важный вывод о том, что в систе- мах, описываемых уравнениями типа (2.100), роль состав- ляющих вектора состояния X в и-мерном пространстве состояний играют выходной сигнал хг и его производные до (п — 1)-й производной включительно. Решение ряда теоретических и практических задач исследования линейных систем опирается на понятие сопряженных и инверсных систем. С помощью преобразо- ваний структурных схем эти понятия вводятся наиболее наглядно. Перейдем к их рассмотрению. Если в уравнении (2.100) использовать в качестве вход- ного сигнала Fn дельта-функцию, действующую в момент t = и принять начальные условия нулевыми, то выход- ной сигнал будет представлять собой импульсную переход- ную функцию системы w (t, |). Мы будем иметь: dnw (4, £) .. dn~1w (4. У ---+ Оп-1 (0 Ч------------------1- a0W (t, g) = б (t - g), Cl C Cll w(t, £) = 0 при t <3. (2.101)
§ а] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ 111 Функция w (t, удовлетворяющая этому уравнению, является функцией t при фиксированном значении Нам в дальнейшем необходимо будет получить дифферен- циальное уравнение, которому бы удовлетворяла функция w (t, £), как функция своего второго аргумента Для этого применим следующий прием [26]. Воспользуемся уравнением (2.100) и известной интегральной связью между входным и выходным сигналами системы t x±(t) = j* w(t, s)xI!X (s) ds, (2.102) 6 где в данном случае а?вх (/) = Fn (t), и положим a?i = 6 (Z — В). Подстановка этого значения в уравнение (2.100) и формулу (2.102) даст -^-6(?-^) + «n.1(Z)^6(?-g)4-...4-an(06(Z-g) = = (0 ’ I 6 (i — g) == w (i, s) явх (s) ds. о Подставляя, далее, значение хвх (£) из первого выражения во второе и учитывая свойство дельта-функции, определя- емое тождеством t (-l)n^r[/©] = ^/(o5-S(i-g)^, i0<l<K (2.103) to получим (- 1Г- -^пД) + (- ...+а0(£)щ(1Л) = б(/-£). (2.104) Как видим, полученное уравнение определяет w (t, S) как функцию второго аргумента Это уравнение назы- вается сопряженным относительно исходного уравнения (2.101).
112 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Мепяя местами в уравнении (2.104) аргументы t и учитывая четность дельта-функции, получим (- 1)" + (- I)"'1 [®n_i (О (Z, g)J + ... ...4-a0(Z)ir*(Z,g) = 6(Z-g), (2.105) где гг* (Z, g) = w (g, Z). (2.106) Эта операция необходима для того, чтобы можно было построить структурную схему сопряженной системы. Она приведена на рис. 2.20, а. Рассматриваемая структурная схема легко преобразуется в схему, показанную на рис. 2.20, б, если учесть, что выход пг-го коэффициента сначала i раз дифференцируется, а потом п раз интегрируется. При этом можно исключить i дифференциаторов, если выход «гго коэффициента подать на вход (г + 1)-го интегратора.
§ 9] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ ИЗ Сравнивая структурные схемы исходной (рис. 2.19) и сопряженной систем, легко выявить правило построения структурной схемы сопряженной системы по структурной схеме исходной системы. Для этого необходимо в последней поменять ролями входы и выходы каждого элемента струк- турной схемы и поменять знаки при нечетных коэффици- ентах. Найдем теперь сопряженное уравнение и построим структурную схему линейной системы, описываемой об- щими уравнениями (2.97). Для решения этой задачи при- меним тот же прием, что и в предыдущем случае. Запишем первое уравнение (2.97) в виде dxj dt dx2 ~dT dxn dt / u-Tj + /12«3 + + fmxn /2Л + + • • + f2nxn + G(t)U(t) (2.107) /ПЛ 4” /?Т2Ж2 4" • • 4" 1 nnxn и воспользуемся формулой (2.52) для случая нулевых на- чальных условий А' (<0) = 0- Будем иметь: t A(f)= fO(i,s)G(s)r7(s)ds. (2.108) I fl Положим д?! (/) = 6 (t — Н), а:2 (/)=... = хп (/) = 0 и подставим эти значения в уравнения (2.107). Будем иметь: ' d 0 б fn (О МО) W0 6(i-i) + G(0r(Z). (2.109) С другой стороны, после раскрытия матрицы-столбца А (/) формула (2.108) примет вид 6 (t - у 0 t = j Ф (G s) G (s) U (s) ds. to Подставляя в нее значение матрицы Ф (/, s) из формулы (2.43) и значение G(t) U (/), полученное из уравнения
114 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 (2.109), можем записать б («-$)’ 0 О фИ (<.S) . . . ф1п(/, s) фш (t,S). . ,фпп (t, S) d ~d^s-V О б — Ф(1,в) '/и (s) fnl (s) ds 6(8-^)} или, используя формулу (2.103) и правило перемножения и интегрирования матриц, 6 (t-ii)’ О 6 d Гфи(1,£) < [фщ (*. S) Ф(*Л) 7n.U) М: (5) . (2.110) Полагая, далее, в выражениях (2.107) и (2.108) х2 (t) — = 6 (t — g), хх (f) = z3 (/)=...= xn (Z) = 0, совер- шенно аналогично предыдущим выкладкам получим О 6 d Гф12 (/,£)! ГМ£) < фп2(’«,у]Й) (2.111) Подобные системы уравнений будут для всех значений х{ = 6 (t — |) до хп включительно: ° d pH "ФУ Г/mU) = -4- „ Р -Ф(^) , = • (2.112) : Фпп ([> Е) inn (Е.) .6 (f - yj Транспонируем левые и правые части уравнений (2.110), (2.111), (2.112) согласно формулам (2.92). Напомним, что матрицы-столбцы при этом станут матрицами строками: [6(z-g)0...0] = -A|(P11(/,g)...(pnl(Z,g)]_ -|/11(5)..-/п1©]ФГ(«Л), )0 б (t - I). . . 0] = - А [(Г12 (/,£). . . сРи2 (/ Д)] - -|/12©---/п2©]ФТ(/Л)’ [0 0... б (1 -1)] = - -Д- [q>ln(f, g)... <pm, (f, g)]- -1/ш(В)..-/ЭТп(1)]Фт(«Л).
§ 9] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ 115 Полученные уравнения можно, очевидно, записать в виде следующего матричного соотношения: 0 О О О . О 6 d £)...<Pnn («,£)_ — f 12 (£)... fn2(£) _/m (E,).. -fnn (£)_ ФТ(«,В). Легко видеть, что стоящие в правой части матрицы являются транспонированными относительно своих значе- ний, определяемых формулами (2.43) и (2.21). Переставляя члены и вводя диагональную матрицу дельта-функций 76 (/ — £), получим: - 4г Фг (*. В) = Рт (В) Фг М) + /б (/ - £). (2.113) Это уравнение сопряженной системы, в которой переходная матрица является функцией своего второго аргумента. Так как согласно формуле (2.57) W (t, I) = Ф (/, £) G (?), то, транспонируя это соотношение, получим: WT (t, g) = GT(^T(t, g). (2.114) Заменим в уравнении (2.113) и соотношении (2.114) £ на t. При этом будем иметь: А- фт (|, t) = FT (О Фт (£, 0 + 76 (7 — £), WT (|,о = сг(ОФт(В, t). (2.115) Уравнениям (2.115) отвечает обобщенная структурная схема, изображенная на рис. 2.21, а. Вернемся к исходному уравнению (2.97). Если в нем положить U (t) = 6 (/ — £), то Л' (t) = (t, |) и обоб- щенная структурная схема будет иметь вид, показанный на рис. 2.21, б. При сравнении этих двух структурных схем легко уста- навливается правило построения структурной схемы
116 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 Столбцы Рпс. 2.22.
8 У СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ 117 сопряженной системы. Для этого необходимо в структур- ной схеме исходной системы поменять ролями входы и вы- ходы элементов схемы, заменить матричные блоки па тран- спонированные и изменить знак па выходе блока FT (7). Правило замены выхода на вход, и обратно, является общим при построении сопряженных систем. Рассмотрим структурную схему матричного блока, изображенного на рис. 2.16. Заменяя в нем входы на выходы и обратно W0(t4) б) Рис. 2.23. (при этом сумматоры превращаются в узлы разветвления, а узлы разветвления — в сумматоры), убеждаемся, что в результате этой операции получается структурная схе- ма транспонированного матричного блока (рис. 2.22). Рассмотрим последовательпое соединение двух систем общего вида с матрицами импульсных переходных функций W, (t, g) и W2 (t, g) *) (рис. 2.23, а). Матрица импульсных переходных функций последова- тельного соединения определяется по формуле (2.60) путем подстановки вместо входного воздействия выходного *) Такое соединение возможно лишь при условии, что число строк матрицы W2 (t, £) равно числу столбцов матрицы Wr (t, Е,). Иными словами, количество выходов первой системы должно быть равно числу входов второй.
118 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ !гл 2 сигнала первой системы. Мы получим t f W2 (t,s) WL(sd)ds. к Транспонируя это соотношение, получим t Wl (t, g) = J Wi (s, £) W% (Z, s) ds, а после перемены местами £ и t (под интегралом s) £ Ж0Т (L о = f & s) W* (s, t) ds. (2.116) t Этой формуле соответствует структурная схема, приве- денная на рис. 2.23, б. Сравнение двух рассматриваемых схем подтверждает правило построения сопряженной системы для последовательного соединения путем пере- мены ролями входов и выходов в каждой системе. С помощью сформулированного правила перестроим обобщенную структурную схему линейной системы (рис. 2.14) в структурную схему соответствующей сопря- женной системы. Она будет иметь вид. показанный на рис. 2.24. Звездочками на схеме отмечены величины, соот- ветствующие аналогичным в исходной структурной схеме. Вектор состояний Д’* (/) сопряженной системы (при условии нулевых начальных значений) определится фор- мулой ^0 X* (Z) = J Фт (s, Zo) Нт (s) и (s) ds, (2.117) t эквивалентной формуле (2.97) для исходной системы.
§ 9] СТРУКТУРНЫЕ СХЕМЫ ЛИНЕЙНЫХ СИСТЕМ 119 Использование рассмотренных выше структурных схем в аналоговой вычислительной технике для решения прак- тических задач требует их видоизменения. Прежде всего обратим внимание на следующее обсто- ятельство. Импульсная переходная функция w (t, Е) си- стемы с одним входом и одним выходом отлична от нуля для значений t > Е, а для значений t Е тождественно равна нулю. Это так называемое условие физической реализуе- мости системы. Оно определяется условиями w (*» £) = | ^(г,£), о, (2.118) t<l Импульсная переходная функция сопряженной системы w* (t, Е), удовлетворяющая уравнению (2.105), опреде- лена в области физически нереализуемых систем. В самом деле, как видно из соотношения (2.106), она получается путем перемены местами аргументов £ и t. Производя эту операцию в соотношениях (2.118), получим w (Е., ?) = w* (t, Е) = w*(z,E.), о Е< t (2.118') Отсюда видно, что w* (Z, Е) отлична от нуля в области вре- мени до подачи входного воздействия. Естественно, что такую систему непосредственно моделировать невозможно. Поскольку при построении сопряженной системы нас интересует изменение импульсной переходной функции w (/, Е) при некотором фиксированном значении t = tH по переменной Е (или, для функции w* (Z, Е), где роль tH играет Е = Ен, по переменной t), то естественным выходом из создавшегося положения является замена t на —t и Е на —%. При этом условия (2.118') примут вид ?/’*(—i, — Е) | w* t, — Е.) при £ I 0 при Е > t, и функция iv* (—t, —Е) принадлежит области физически реализуемых систем. Так как в аналоговых вычислительных машинах обыч- но за начало отсчета времени принимается момент вклю- чения машины на вычисления, то целесообразно, помимо реверса времени, осуществить его сдвиг вперед на величину
120 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 £н = tn, т. е. вместо аргумента —t использовать аргумент т = tn — t. Подставляя т в выражение (2.105), получим л?г лп-i — w* (tn, Т) 4- [а (tn — т) ш* (tn, т)] 4- ... • ••4-«(, -Н — t)w*(t„, т) = б (г). (2.119) Система, описываем я уравнением (2.119), называет- ся инверсной [26]. Ее структурная схема приведена на рис. 225. Поскольку рассмот~-нная система является изоморф- ной по отношению к системе общего вида, если в последней некоторые коэффициенты равны нулю или единице, ука- занное правило построения инверсной системы распро- страняется па все рассмотренные выше структурные схе- мы. Так, уравнения инверсной системы, полученные из соотношений (2.115), примут вид ФГ (<Н, Т) = F(tn— Т) Ффт (tn, т) 4- б (т), 1<(/п,Т) = 6'Ч«н-Т)Ф^(/н,Т), (2.120) где индексом * обозначены матрицы, элементы которых удовлетворяют соотношениям фУ (g, t) - (L о = ФЯ (С £), wTt (L t) - Wji (g, t) = шд (t, g). Структурная схема инс рсной системы, удовлетворяющей уравнениям (2.120), из 'ражена на рис. 2.26.
§ 10] УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ 121 С помощью инверсных систем на аналоговых или циф- ровых вычислительных машина х можно получать импульс- ные переходные функции (и их матрицы) как функции своего второго аргумента при заданном значении первого. Рис. 2.26. Это позволяет решать многие практические задачи иссле- дования линейных систем, находящихся под воздействием случайных сигналов. Некоторые из них будут рассмотрены в 4 и 5 главах книги. § 10. Управляемость и наблюдаемость объектов управления В том случае, когда линейная динамическая система рассматривается как объект управления, возникает за- дача отыскания таких входных воздействий (называемых управлениями), при которых объект управления пере- водится из одного заданного состояния в другое. Следует отметить, что свойства объекта и его структура в ряде слу- чаев ограничивают возможности управления, а иногда делают его невозможным. В этих условиях возникает необходимость в строгом определении понятия управля- емости объекта управления и в нахождении условий, при которых управляемость обеспечивается. Определение 2.9. Объект управления называется пол- ностью управляемым в момент t0 тогда и только тогда, когда найдется такое управление U (f) и такое t > t0, которое переведет объект из состояния X (£0) в состояние Л’ (t) = 0. Заметим, что, перевод объекта в начало коор- динат пространства состояний удобен с математической точки зрения и не нарушает общности результатов.
122 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ 2 Обеспечение полной управляемости объекта, по су- ществу определяет усл< вгя существования регулятора как математической модели Итак, объект управления представляет собой линейную динамическую систему, состояние которой определяется вектором состояния -V(<) в л-мерном пространстве состоя- ний, входное воздействи* (управление) принадлежит про- странству Qo. Если известна переходная матрица системы, вектор состояния определится сормулой (см. выражения (2.52) и (2.50)) t X (Z) = Ф (Z, t0) X (Zo) + Ф (f. Zo) f Ф (Zo, S) G (s) U (s) ds. fo (2.121) В соответствии с определени: м 2.9 необходимо найти век- тор управления U (/), талой, чтобы X (t) = 0. При этом условии выражение (2.121) примет вид t X(t0) + ]‘ф(„г (s) (s) ds = 0. (2.122) io Поскольку вектор _V (t0) пр ^надлежит пространству со- стояний системы и произволен, соотношение (2.122) может удовлетворяться для всех Д’ (/,) лишь в том случае, когда значение интеграла такж принадлежит пространству со- стояний и принимает в нем нс. возможные значения. Ины- ми словами, число линейно независимых строк матрицы- столбца подынтегральног > выражения должно быть рав- ным числу строк матрицы-столбца A" (t0), а их значения должны быть равны. Выберем вектор управления следующим образом: U (1) = GT ()Ф~ (t0,t) Z (t0), (2.123) где GT (£) и Фт (i0, t) — тр шспопированные матрицы; Z (t0)—вектор начальных значений из пространства со- стояний системы. Подставляя соотношение (2.123) в выра- жение (2.122), получим t Y (М = ~ [ J Ф «) G G Ст («) Фг (tti, s) ds] Z (t0). to
S 10] УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ И 23 Введем обозначение t К (t0, t) = J Ф (t0, s) G (s) GT (s) Ф7' (i0, s) ds, (2.124) 0 будем иметь X(f0) = -r(f0,OZ(f0). (2.125) Это условие, в отличие от (2.122), выполняется для любых X (i0), если матрица К (i0, t) имеет ранг п (т. е. число ли- нейно независимых строк равно п), поскольку вектор Z (t0) принадлежит тому же пространству, что и вектор -X (to). Остановимся подробнее на равенстве (2.124). Так как в подынтегральном выражении соотношения (2.122) стоит матричное произведение, единственным способом точного установления ранга этого произведения является такая подстановка произвольного вектора U (t), которая дает матрицу вида ААТ. Этой подстановкой и является выра- жение (2.123). Тогда, согласно соотношению (2.95), будем иметь R [Ф (i0, s) G (s)GT(s)®T (t0,s)] = R {[®(t0,s) G (s)] X X [Ф (io, s) G (s)]r> = R 1Ф (i0, s) G (s)]. Таким образом, ранг подынтегрального выражения равен- ства (2.124) будет равен рангу матрицы Ф (i0, s)G(s). Матрица Ф (i0, s) имеет размер п X п и невырожденная, следовательно, ее ранг равен п. Отсюда, на основании соотношения (2.94) следует, что матричное произведение Ф (i0, s) G (s) будет иметь ранг п в том случае, когда мат- рица G(s) имеет ранг п. Интегрирование матрицы вида ААТ не уменьшает ранга получаемой матрицы, следовательно, при рассмот- ренных выше условиях ранг матрицы К (i0, i) будет п. Сформулируем теперь условие управляемости линей- ного объекта управления. Определение 2.10. Объект управления в виде линейной динамической системы с переходной матрицей Ф (i, i0) размером п X п и входной матрицей G (i) размером п X m полностью управляем, если линейное преобразование t К (i0, i) = J Ф (i0, s) G (s) GT (s) Ф7 {to, s) ds fo
124 ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. 2 имеет ранг п. Для этого достаточно, чтобы п строк мат- рицы O(U s) G (s) были линейно независимыми [12]. Завершая рассмотрение вопроса об управляемости, заметим, что конкретный вид управления U (t) опреде- ляется при решении вариационной задачи об оптимальном управлении в соответствии с тем или иным критерием ка- чества. Как было показано в § 4, формирование закона управ- ления для регулятора состоит в отыскании отображения k-. Т X X -+ U, значениями которого будут величины и (/) = к [Z, х (f)l управлений. Таким образом, нам необходимо знать вектор состояния системы в каждый момент времени, имея в своем распоряжении значения выходных величин Y (/). Иными словами, мы должны установить существование отобра- жения г]"1: У->Х, (2.126) где т] обозначает операцию однозначного определения век- тора X по значениям вектора X. Это задача наблюдаемости системы или объекта управления. Определение 2.11. Объект управления называется вполне наблюдаемым в момент t тогда и только тогда, когда можно построить операцию т] однозначного определения состояния объекта A” (f0) по значению вектора выходных величин X (£). Вектор выходных величин в соответствии с определе- нием 2.7 связан с вектором состояния соотношением X (0 = Я(0Х(0, (2.127) где Н (t) — матрица размером п X р. В случае, когда H(t) = /, т. е. выходным вектором является вектор состояний, задача наблюдения стано- вится тривиальной — объект управления всегда будет наблюдаемым. Следовательно, ограничения на процесс наблюдения накладываются свойствами матрицы И (t). Природа этих ограничений заключается в том. что, если при изменении некоторых составляющих вектора X (Z) выходной вектор не изменяет своего значения, нарушается жесткая взаимосвязь между этими двумя величинами. Легко заметить, что описанная картина напоминает ту, которая проявляется и в задаче управляемости системы.
§ 10J УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ 125 Теперь рассмотрим объект, обладающий свойствами полной управляемости за счет того, что G(t) = I. Это означает, что в обобщенной структурной схеме объекта отсутствует матричный блок G(t) (рис. 2.27, а). Посколь- ку, как уже было отмечено, ограничения на вектор F (t) ФЫ Utt) а) Рис. 2.27. накладывает матричный блок Н (£), рассмотрим его влия- ние в задаче управляемости. Для этой цели построим по изложенным в предыдущем параграфе правилам структурную схему сопряженной системы. Она показана на рис. 2.27, б. Мы видим, что теперь матричный блок II (t) (точнее, его транспонированный аналог) играет роль ограничивающего элемента в задаче управляемости, а сама система полностью наблюдаема, так как выходного блока нет. Поэтому подберем управляющее воздействие таким образом, чтобы обеспечить принадлежность векто- ра F(0 n-мерному пространству состояний объекта. На основании формулы (2.117) связь между входным и выходным сигналами сопряженной системы запишется
126 Линейные динамические системы [гл. 2 в виде (при условии нулевого значения начального век- тора) io Y (t) = J Фт(х, t0) Нт (s) U (s) ds. t Выберем входное воздействие в виде U(t) = H(t)®(t, t0)X(t0) и подставим его в интеграл. Будем иметь to T(t) = «o)tfT(s)tf(s)<D(s, t0)ds]x(t0). Введем обозначение to N (t, t0) = j‘ Фт (s, t0) HT (s) H (s) Ф (s, t0) ds. (2.128) t Тогда F(t) = 7V(t, t0) X (to). Поскольку вектор X (t0) принадлежит пространству со- стояний объекта управления, все значения вектора К (t) также будут принадлежать пространству состояний, если ранг матрицы 7V(t, i0) будет равен п. Подынтегральное выражение в формуле (2.128) можно рассматривать как произведение матриц ААТ, где А = = Фт (s, t0) Нт (s) и Ат — II(s) Ф (s, t0). Так как ранг ААТ равен рангу А (см. формулу (2.95)), то условие R \N (t, t0)l = п эквивалентно условию R [Фт (s, t0)X X Нг (s)I = п. Поскольку при транспонировании матри- цы ее ранг не изменяется, можно записать и так: R [Ф7’ (s, i0) 1IT (s)] = R [II (s) Ф (s, t0)l = п. (2.129) Преобразуя структурную схему сопряженной системы обратно в структурную схему исходной системы, мы мо- жем утверждать, что соотношение (2.129) определяет условие полной наблюдаемости объекта управления. Сформулируем следующее определение. Определение 2.12. Объект управления в виде линейной динамической системы с переходной матрицей Ф (t, t0) размером п X п и выходной матрицей II (t) размером
§ 101 УПРАВЛЯЕМОСТЬ II НАБЛЮДАЕМОСТЬ 127 п X р вполне наблюдаем в момент t, если линейное преоб- разование «о А’ («, /0) = j ФГ (*’, i0) НТ («) Н («) Ф (s. М ds 't имеет ранг п. Для этого достаточно, чтобы п строк матри- цы Н (s) Ф (s, f0) были линейно независимыми [12]. В заключение заметим, что рассмотренные здесь ус- ловия наблюдаемости линейного объекта управления от- носятся только к структурным свойствам системы. Воз- можна и другая постановка задачи наблюдаемости, свя- занная с вопросами точности наблюдения по тем или иным критериям.
ГЛABA 3 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ § 11. Случайный процесс и его характеристики Для решения ряда задач теории систем возникает необ- ходимость расе отрения входных воздействий в виде случайных функций времени. В физическом представле- нии всякий разбивающийся во времени эксперимент со случайными исходами всегда можно трактовать как не- который случайный процесс. Однако для количественно- го описания этс"о процесса необходимо построить опре- деленную матем тическую модель эксперимента. Мы бу- дем в дальнейшем полагать, что такой моделью является линейная динамическая система с детерминированными параметрами, находящаяся под воздействием входных сигналов в виде случайных функций времени. Случайной называется такая функция х (i), значения которой при фиксированных значениях аргумента t яв- ляются случайными величинами. Семейство этгх случайных величин при заданном мно- жестве значений t ЕЕ Т и составляет случайный процесс. Конечная ш следовательность случайных величин хг, х2, . . ., хп может быть полностью характеризована n-мерной функцией распределения вероятностей F (х1г х2, . . ., хп). Однако в общем случае бесконечного числа значений х (/) для непрерывной случайной функции за- дание любых конечных функций распределения не будет достаточным для полного описания процесса. Кроме того, функции распределения не дают возможности рассматри- вать свойства случайной функции в целом, т. е. в совокуп- ности всех ее значений. Поэтому в ряде случаев удобно пользоваться более сжатой характеристикой распределе- ний, так называемыми моментными функциями, определя- емыми следующем общим соотношением: т;„ г,.;п (Z, t,.tn) = М {[.т (К)]51 [X . [х щ>0 (А = 1, 2, . . .,/г), (3.1)
§ 11'1 СЛУЧАЙНЫЙ ПРОЦЕСС И ЕГО ХАРАКТЕРИСТИКИ 129 где М — символ операции определения математического ожидания. Сумма индексов ix i2 + • - + in называ- ется порядком моментной функции. Как показано в теории случайных процессов [4], слу- чайная функция с гауссовым (нормальным) распределе- нием полностью характеризуется моментами первого и второго порядков. Момент первого порядка — мате- матическое ожидание тх (f) = М [х (/)! (3.2) и момент второго порядка центрированной случайной функции — корреляционная функция к (tlt t2) = М {[ж (/,) — тх (/х)] [я (/2) — тх (f2)]}. (3.3) Как видно из приведенных формул, математическое ожи- дание и корреляционная функция в общем случае зависят от моментов времени и тем самым характеризуют неста- ционарный процесс. Поскольку на случайную функцию х (/) не наклады- вается дополнительных условий относительно ее аргу- мента t, она может быть равна нулю за пределами некото- рого интервала и, следовательно, может описывать ре- альный входной сигнал, который, как отмечалось, всегда ограничен во времени. При решении многих практических задач часто вводят предположение о стационарности процесса и применяют для этой цели соответствующий математический аппарат исследования. Стационарным в широком смысле называ- ется такой процесс, у которого математическое ожидание постоянно, а корреляционная функция зависит только от разности аргументов: тх (О = тх = const, (3.4) /с (ix, t2) = к (£х — i2) = к (т). (3-5) В действительности реальные входные сигналы являются всегда нестационарными и могут рассматриваться как стационарные лишь при соблюдении определенных усло- вий. Для доказательства сделанного утверждения рас- смотрим гипотетический источник стационарного про- цесса жвх (£), который в некоторый момент времени, при- нимаемый за начало отсчета, включается на вход системы (рис. 3.1, а). 5 А, В. Солодов
130 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 Очевидно, входной сигнал xBX (Z) будет представлять собой «отрезок» стационарного случайного процесса дли- тельностью Т, где Т является временем работы системы (рис. 3.1, б). Учитывая только момент включения систе- мы и считая, что включатель срабатывает мгновенно, 5) Рис. 3.1. входной сигнал можно записать в виде Гвх (0 = З-ВХ (О 1 (/)> где (О, £<0, «>0, (3.6) является единичной функцией. Считая для простоты, что математическое ожидание стационарного процесса xBX (i) равно нулю, найдем кор- реляционную функцию входного сигнала. В соответствии с (3.3) будем иметь /свх (i, t — т) = М [хвх (£) 1 (t) xBX (f — т) 1 (t — т)] = = 1 (<) 1 (t — т) М [жвх (0 хвк (t — т)], так как единичная функция является неслучайной. В по- лученном выражении М [xBX (t) xBX (t — т)] является кор- реляционной функцией стационарного процесса; следо- вательно, согласно (3.5) получим /свх (Z, t — т) = 1 (0 1 (t — т) к (т),
§ 111 СЛУЧАЙНЫЙ ПРОЦЕСС И ЕГО ХАРАКТЕРИСТИКИ 131 или для t > 0, когда 1 (f) — 1, /свх (f, t - т) = 1 (t - т) к (т). (3.7) Итак, корреляционная функция входного сигнала зависит от времени t и, следовательно, характеризует не- стационарный процесс. Графики функций 1 (t — т) и к (т) в осях t, х приведены на рис. 3.2, а и б. Введем теперь понятие интервала корреляции тк, определив его как отрезок на оси т, за пределами которого корреляционная функция к (т) практически равна нулю (см. рис. 3.2, б). При этом практическое отсутствие кор- реляции понимается в том смысле, что при т тк аб- солютное значение корреляционпой функции остается меньше некоторой наперед заданной величины. Тогда график корреляционной функции входного сигнала при- мет вид, показанный на рис. 3.3. Из приведенного графика 5*
132 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 видно, что корреляционная функция квх (t, t — т) от- лична от функции к (т для t < тк. Аналогичная карти- на будет и на другом конпе отрезка Т для момента выклю- чения системы, так как корреляционная функция четна относительно своего аргумента. Нестационарность рассматриваемого сигнала хорошо иллюстрируется с помощью схемы статистической об- работки процесса (рис. 3.4). Фиксируя некоторый про- извольный момент tL, рассмотрим операцию обработки процесса при нахождении корреляционной функции. Если взять интервал тг < Zt, то в этом случае в интервал обработки попадают все элементы реализаций множества п получаемое значение корреляционной функции (при условии Tj < тк) будет отлично от нуля. Если же взять другой интервал, т2 то в этом случае для всех реали- заций множества элементы, лежащие левее точки t — О, будут равны нулю, вследствие чего будет равно нулю и соответствующее значение корреляционной функции. В результате график корреляционной функции для момента t — окажется усеченным слева (см. рис. 3.4). Очевидно, что для моментов времени t тк отмеченное явление наблюдаться не будет, и корреляционная функ- ция не будет зависеть от времени вплоть до t Т — тк.
§ И] СЛУЧАЙНЫЙ ПРОЦЕСС И ЕГО ХАРАКТЕРИСТИКИ 133 Для моментов времени, больших Т — тк, корреляцион- ная функция окажется усеченной справа. На основании проведенного рассмотрения можем записать ,|,х( ’ ( 1 (/-т)Л(т), тк>^>Г-тк. Таким образом, входной сигнал в виде отрезка ста- ционарного процесса длительностью Т может рассматри- ваться как стационарный лишь на интервале тк t < Т — тк. Во многих задачах обычно длительность работы си- стемы Т много больше интервала корреляции тк, в связи с чем можно практически не считаться с наличием неста- ционарности подобного рода. Однако в ряде случаев сигнал может быть настолько коррелирован или длитель- ность работы системы настолько мала, что окажется необходимым в полной мере учитывать нестационарность процесса. Будем в дальнейшем называть сигналы в виде отрезков стационарного процесса почти стационарными. Большой интерес при описании входных сигналов представляют процессы с очень малыми интервалами корреляции. Рассмотрение таких процессов удобно про- изводить с привлечением спектральных представлений. Известно, что если случайная функция х (t) выража- ется каноническим представлением в виде .г (I) = тх (I) + 2 Vvxv (0> С3-9) то ее корреляционная функция дается каноническим представлением (G> М — D„xv (tr) xv (12), (3.10) где V., — некоррелированные случайные величины с рав- ными нулю математическими ожиданиями; x.,(t) — за- данные функции, называемые координатными', D, — дисперсии случайных величин V„. Разложим корреляционную функцию стационарного процесса на интервале (тк, Т — т„) в ряд Фурье: /г(0= 2 D^z, (3-11) V=:—ОО
134 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 где Г—тк = Г—2т~ 5 к^е dx- тк Тогда, положив т = tL — t2, получим: A-(/1-Z2)= 2 (3.11') т. е. согласно формуле (3.10) — каноническое представ- ление корреляционной функции к (т). При этом соответ- ствующая случайная функция примет вид *) х(/) = 2 (3.12) v=—оо Очевидно, выражение (3.12) является разложением в ряд Фурье случайной функции х (f) с гармониками, амплитуды которых представляют собой случайные вели- чины с дисперсиями Dv. Полагая время работы системы Т достаточно большим по сравнению с интервалом корре- ляции тк, запишем формулу (3.11') в виде т Р, = к (т) e^dx.' (3.13) о Дисперсии ТК зависят от значений частот гармоник и характеризуют распределение полной мощности про- цесса по гармоникам (рис. 3.5, а). Полная мощность процесса равна со рх = 2 V——сю (3.14) Рассмотрим теперь процесс, у которого Pv одинаковы для всех у (см. рис. 3.5, б). При этом интеграл (3.13) должен иметь постоянное значение независимо от величи- ны cov, что возможно лишь в случае, когда корреляционная *) Для простоты здесь взято mx (t) = 0.
§ ш СЛУЧАЙНЫЙ ПРОЦЕСС И ЕГО ХАРАКТЕРИСТИКИ 135 функция является дельта-функцией: к (т) = 56 (т), 5 = const. В самом деле, т Dv = ~ J 86 (т) e'^dt = 4- • О (3.15) (3.16) Полная мощность процесса при этом оказывается бес- конечной. Таким образом, процесс с равномерным на всех Гис. 3.5. частотах спектром обладает полным отсутствием корре- ляции и имеет бесконечно большую мощность. Рассмотрен- ный процесс называется белым шумом. Очевидно, белый шум физически не реализуем и является лишь удобной математической абстракцией при построении теории. Од- нако реальные процессы, обладающие настолько малым интервалом корреляции, что при решении конкретных задач им можно пренебречь, хорошо аппроксимируются белым шумом. Если время работы системы Т настолько велико, что его практически можно считать бесконечно большим, процесс будет стационарным в точном смысле. При этом можно ввести в рассмотрение спектральную плотность мощности, определяемую формулой со 5(w) = J k(x)e~iazdx. (3-17) —оо Заметим, что размерность спектральной плотности будет [хг с], где [ж] — размерность процесса.
136 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 Обратное преобразование Фурье дает откуда /с(т) 5 (со) e;“Tdco, (3.18) k(0) = Dx = S (со) dw, о (3.19) так как спектральная плотность является четной функцией частоты. Подставляя в формулу (3.17) значение корреля- ционной функции для белого шума (3.15), получаем 5 (со) = S. Таким образом, коэффициент 5 в выражении (3.15) является спектральной плотностью белого шума и ха- рактеризует его интенсивность. Часто применяют понятие нормального белого шума. Это понятие означает, что любой n-мерный закон распре- деления вероятностей данного шума является нормаль- ным. Однако никакой конечномерный закон распределе- ния не может полностью характеризовать белый шум, поэтому практическая польза понятия нормального бело- го шума заключается лишь в том, что его преобразование любым линейным фильтром дает нормальный случайный процесс. В частности, если рассмотреть идеальный фильтр, равномерно пропускающий гармоники только в некоторой полосе частот F Гц, то при подаче на его вход нормального белого шума по формуле (3.19) на выходе фильтра получим 2пК Dx = ~ Sdco = 2 SF. о (3.20) Сравнивая формулы \3.16) и (3.20), будем иметь Dx = 2FTD.. (3.21) Мы видим, что полная мощность процесса в 2FT раз больше мощности отдельной гармоники, следователь- но, величину 2FT можно трактовать как количество гар- моник в процессе. При этом 2/’71-мерный закон распре-
§ 111 СЛУЧАЙНЫЙ ПРОЦЕСС И ЕГО ХАРАКТЕРИСТИКИ 137 деления будет полностью характеризовать рассматривае- мый процесс. Так как для случая белого шума п-мерный закон распределения является произведением п одномер- ных нормальных функций распределения, функцию плот- ности вероятности можно записать в виде 2FT ~2 !Г| ___* 1М. V 2лз К—1 /2РТ СП» ^2* • • "^71, е 2а“ • Процесс, полученный ограничением белого шума по спектру, иногда называют ограниченным белым шумом. Ограниченный белый шум имеет корреляционную функ- цию, показанную на рис. 3.6. Последняя легко может быть получена из формулы (3.18): 2TtF к (т) = 2S cos 2nFx dF = о S sin 2л Fx л т (3.22) Очевидно, корреляционная функция, определяемая полученным выражением, нигде не обращается тождест- венно в нуль. В качестве интервала корреляции в этом случае необходимо выбирать такой отрезок тк на оси т, за пределами которого абсолютной величиной функции к (т) можно пренебречь. Наконец, применяется понятие нестационарного бело- го шума, когда спектральная плотность зависит от вре- мени. Корреляционная функция нестационарного белого шума записывается в виде к (tlt tj = S (tj 6 (t± - t2). (3.23)
138 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 § 12. Преобразование случайного процесса линейной системой В целях изучения в дальнейшем вопросов фильтрации целесообразно установить общую взаимосвязь между характеристиками случайнее процесса, возникающего на выходе линейной системы, и характеристиками вход- ного случайного процесса, в общем случае не являющего- ся белым шумом. Рассмотрим вначале линейную систему с одним вхо- дом и одним выходом. Если до подачи входного сигнала система находилась в по'км, то при подаче в момент вре- мени t = 0 любой реализации х \t) случайного процесса выходная реализация определится по известной формуле У (0 = 5 и- I) X (I) dl, (3.24) О где w (t, |) — импульсная переходная функция системы. Пусть входной случайный процесс характеризуется ма- тематическим ожиданием тх (t) = М [х (0J (3.25) и корреляционной функцн.и кх (h, t2) = М {[ж (0) — ^ix (0)1 [x (Q — mx (i2)]}. (3.26) Соответственно, выходной случайный процесс будет иметь математическое ожидание т,, (0 = М [у (i)l (3.27) и корреляционную функшгу ки (0, «2) = М {II/ («1) — («1)1 Гу («2) — ти («г)]}- (3.28) Выполняя операцию определения математического ожи- дания левой и правой частей формулы (3.24) и учитывая выражения (3.25) и (3.27 получим t f ir t. (3.29) 0 Подставим теперь в формулу (3.28) значения у («) и mv (£)
§ 12J ПРЕОБРАЗОВАНИЕ ПРОЦЕССА ЛПНЕЙНОЙ СИСТЕМОЙ 139 для соответствующих значений аргумента t из соотноше- ний (3.24) и (3.29). После группирования членов получим tl (*х> М = М | j w (tv Е) [X (Е) — тх (£)] d% х 1о X j и' (fail) [х (и) — тх (и)] du}. Перенося операцию определения математического ожи- дания на случайные функции, будем иметь к и (h, t >) = j J «’ (fi, E) w (l2, u) x о о X M {[.*; (£) — mx (Ej] [a’ (u) — mx (u)]} dZ du или ku Gi» ^) = j j w (tlt E) w (t2, и) kx (Ё, u) dg du, (3.30) о 0 так как согласно формуле (3.26) кх (£> и) = М[х (Е) — тх (Е)1 [х (и) — тх (и)]. Соотношение (3.30) устанавливает связь между корреля- ционными функциями входного и выходного случайных сигналов, действующих в линейной системе, если извест- на ее импульсная переходная функция. Для получения дисперсии выходного сигнала достаточ- но в выражении (3.30) положить = t2 = t, поскольку дисперсия равна D;l (/) = ки (/, /). При этом t t Dv (Г) = j J гс (f, E) w’(£, u)/с.,. (E, w) dE du. (3.31) о о Полученная формула позволяет вычислить дисперсию на выходе линейной системы. Поскольку корреляционная функция не меняет своего значения при перестановке аргументов, она обычно задается только для значений и Е- При этом непосредственное применение формулы (3.31) затрудняется, и ее целесообразно преобразовать таким образом, чтобы всегда удовлетворялось условие и >
140 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 Рассматривая двойной интеграл (3.31), легко видеть, что его область интегрирования представляет собой квад- рат со стороной t (рис. 3.7), заданный неравенствами 0 u Z и 0 | t, причем диагональ квадрата и = 1 разделяет область интегрирования В на части Bv и В.2< определяемые неравенст- i вами и __________о-*-Д' \ для В, 0 «С ё С и Z,) \ Bi в о - t J у ( (3-32) \ 1 для в2 ’ Таким образом, символиче- ^2 'к ски можем записать: 4—и=л+и- <мз> Т| > в в, в2 Рис. 3.7. Рассматривая поверхность, определяемую произведением w (t, £) iv (Z, и) кх (и, £), являю- щимся подынтегральным выражением в (3.31), можно убедиться, что эта поверхность симметрична относитель- но диагонали и = | (рис. 3.8), так как ясно, что w (t, £) w (t, и) — iv (t, и) w (Z, £), а функция кх (и, |) равна функции кх (£, и) по самому определению корреляционной функции. Поэтому соот- ношение (3.33) можно записать в следующих двух равно- сильных видах: в в, в вг Используя первое из этих соотношений, будем иметь Dv (Z) = 2 J J w (t, Ё) w (t, и) kx (и, Ё) du dt,. Переходя от двукратного интеграла к формуле после- довательного вычисления простых интегралов и учиты- вая определение (3.32) области интегрирования Bt, окон- чательно получаем: / t Dv (/) — 2 J w (Z, Ё) dt | w (Z, u) kx (u, t) du, (3.34) о i'
§ 12] ПРЕОБРАЗОВАНИЕ ПРОЦЕССА ЛИНЕЙНОЙ СИСТЕМОЙ 141 где переменная и находится в пределах, определяемых неравенством (3.32). Рассмотрим теперь линейную динамическую систему, описываемую уравнением где X — вектор состояния, F (?) и G (?) — матрицы, харак- теризующие параметры системы. (и£) Рис. 3.8. Как было показано в гл. 2, эта система характеризу- ется матрицей импульсных переходных функций (см. выражение (2.58)) Ч1(г-С) «'12(t,y • • w’2m («• У wnm '(*- Q w(U) = W21 (?, 'Q «22 (й 5) • • , (3.35) 5) - - где wtj (t, £) является импульсной переходной функцией для i-ro выхода и /-го входа системы. В дальнейшем ограничимся рассмотрением случая, когда на всех т входах системы действуют случайные входные воздействия, не коррелированные друг с другом.
142 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 Тогда они могут быть зад ны матрицей-столбцом Ки (ti, — /ci (tl, f2) <2) (3.36) U'm ('1> t2) где kj (tr, t2) — корреляппонная функция случайного воз- действия на /-м входе. Utf) X(t) с) Рис. 3.9. Если на /-м входе системы имеется входное воздейст- вие, а на остальных входах оно отсутствует, на всех п выходах системы возникнут выходные случайные процес- сы, характеризуемые определенными корреляционными функциями (рис. 3.9, а). Обозначим их рц, где первый индекс указывает номер выхода, а второй индекс — но- мер входа. Теперь по формуле (3.30) можно определить корре- ляционную функцию i-ro выходного сигнала. Она будет
§ 12] ПРЕОБРАЗОВАНИЕ ПРОЦЕССА ЛИНЕЙНОЙ СИСТЕМОЙ 143 равна h i, Ра (П, М = j j w-,j (tb В) wi} (t2, u) kj (и, I) du d%. 6 0 При наличии входных воздействий на всех т входах си- стемы корреляционная функция z-ro выходного сигнала определится комбинацией импульсных переходных функ- ций и корреляционных функций от т входов к z-му выхо- ду (рис. 3.9, б) и будет выражаться суммой т Pi (Gi ^г) = 2 Р’З (^1’ ^2)" 1=1 После подстановки значения pi}- зта формула примет вид ь ь Pi (G, ti) = J J [Wi! (Zb £) U’i! (t2, u) (u, g) + 0 6 + wi2 (fj, g) wi2 (t2, и) k2 (и, I) +... ... +wim(t1, tywim(t2, u) km(u, £)] dt, du. (3.37) Введем матрицу произведений импульсных переход- ных функций следующего вида: М (И, t2.1, и) == “£i’ll(il^),'’ll(/2.!t) • • • и'1т^2 и) ^21 Gl-£) ,t;21 (Z2-«) • • • a,2m^2. «) (3.38) Произведение этой матрицы с матрицей-столбцом (3.36) даст новую матрицу-столбец, каждая строка которой будет являться подынтегральным выражением соотно- шения (3.37). При этом последнее можно записать в виде и <2 р (fi, h) = J f м (п, t2, в, и) Ки (iz, I) du dl, (3.39) 6 6 где/5 (/1? £2)является матрицей-столбцом корреляционных
144 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 функций выходных сигналов: -Pi (fj. - _ Pz (G > У -р„0ьУ- Формула (3.39) устанавливает связь между корреляцион- ными функциями входи гоп выходного сигналов линейной системы общего вид В некоторых слуи их представляет интерес рассмотре- ние входного вездеЁ.пгя в виде белого шума. Корреля- ционная функция т д: :7’ воздействия имеет вид кх (Л, О = s (zi) 6 (zi — где s (/J — спектральная плотность мощности белого шума. Поставляя эт заражение в формулу (3.30) и учи- тывая тождество w(t2,l)s(z - u)s(u)6(u — %) du, i получим 1» ky^t. = (3.40) i или, в силу четности - •.рреляционной функции, (tlt [») = к»/□, и) w (<!, и) s(и) du. (3.40') г В том случае, когд ' _ый шум стационарен, его спект- ральная плотность е с дянпа. При этом формулы (3.40) и (3.40') упрощаются, "зж как величина з выносится за знак интеграла. При вычислении ц гормуле (3.34) дисперсии при на- личии белого шума нь -хде необходимо иметь в виду, что в силу четности дельт -функции имеет место тождество 4-/ ; = /(t)S(f-^)dt.
§ 12] ПРЕОБРАЗОВАНИЕ ПРОЦЕССА ЛИНЕЙНОЙ СИСТЕМОЙ 145 Следовательно, формула (3.34) для рассматриваемого частного случая примет вид t = (3.41) 6 Если белый шум действует па всех т входах линейной системы общего вида, корреляционную матрицу-столбец входного воздействия можно записать в виде rsi (Ц) К-и М — S2 (tl) 6 (tx — i2), (3.42) или где Ки (h, Q = S fe) 6 (t, - t2\ S(h) = [~Sl(fl) S2 (<1) является матрицей-столбцом спектральных плотностей. Подставляя соотношение (3.42) в формулу (3.39) и учи- тывая свойство дельта-функции, получим я Р((х, t2) = t2, d^, 0 (3.43) где элементами матрицы М (ilf t2, £) являются произведе- ния wif (t2, g). Дисперсия для этого случая может быть найдена по формуле (3.43), если положить в пей = t2 = t: t = (3.43') О Здесь матрица М2 (t, £) имеет элементы Шу (i, £), а мат- рица-столбец D (t) характеризует дисперсии на п выходах системы.
146 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 § 13. Диффузионный процесс Маркова Рассмотрим в качестве характеристики случайного про- цесса «-мерную плотность распределения вероятностей функции х (Z) Рп (^1» ^1» ^2> • • • ’ ^п)т характеризующую вероятность совместного появления значений функции хг, х2, . . ., х„ в моменты времени tv, t2, . . ., tn. Как видим, в общем случае все п значений функции взаимозависимы, и появление, например, значения хп в момент tn будет зависеть от всех предыду- щих значений. Эта зависимость определяется условной плотностью вероятностей Рп (^n> *^2» ^2> • • •» 1» ^и—1)* Если вероятность появления значения хп в момент tn зависит только от предыдущего значения а:п_1 в момент in-i, то такой процесс классифицируется как простой процесс Маркова. При этом условная плотность вероят- ности будет иметь вид Рп ^2> ^21 • Ч ^n-l) ^п-1) ~ P‘i(%ni ^nl^n-11 ^п-1) (3.44) и будет двумерной. Более сложные процессы Маркова определяются зави- симостями данного события от двух предыдущих Рз (%пг ^П-Ц -^п-2» ^п-2) и более. Однако в большинстве практических случаев используются простые процессы Маркова, их теория наи- более развита. Поэтому их обычно называют просто про- цессами Маркова, или марковскими процессами. Если воспользоваться известной формулой, устанав- ливающей связь между совместными и условными плотно- стями распределения вероятностей, Pk (-И» К> ^2' ^2> • • > ^к> Д) = Pk-i Сп, К; х.г, /2; ..., xk_lt lkl) х х Pk (*k< fk/K; ^2- . •; ^-1. ^-i). (3.45)
§ 13] ДИФФУЗИОННЫЙ ПРОЦЕСС МАРКОВА 147 то, учитывая соотношение (3.44), легко получить выражение Pn(«l, Hi • • •! Я-п, ^п) — Pl (^Г, ^1) P3(,x2i t2/xl< ti) X X p^Xs, t3/x2, t2)...= п * = Р1(Ж1Д1) Ц Pi(xk> ?к/хк-1> ^fc-l)> И ^>2. (3.46) fc=2 К Приведенные выше формулы характеризуют нестацио- нарный процесс, когда функции плотностей вероятностей зависят от моментов времени. Для стационарного случая одномерная плотность ве- роятности не зависит от времени, а двумерная будет за- висеть только от интервала времени между двумя сосед- ними значениями функции. При этом будем иметь 71 рп (a?!, ...; хп, tn) = р1(ж1) П р/(хк/хк_и Ык), 1 к-2 К I ^к = 1к — ^к-1- Входящие в формулы (3.44) и (3.46) функции плотности вероятности pt (xY, 1г) и р2 (хк, tklxk.A, tk ,) должны удов- летворять известным общим соотношениям Рп (Х1, • • • 1 ХП1 ^п) О, оо f Рп(хп, ^n/xh К, • - •> хп-1г ^n-1) dxn = 1, (3.48) Жп-1, рп(хп, tn/Xi, ty, . . . > xn-i, ^n-i) dx^... dxn~i — pi (хп, tn). Кроме того, функции плотностей вероятностей процессов Маркова должны удовлетворять еще одному условию. Рассмотрим теперь функцию плотности вероятности р (х2, t3'xi, ij. Она характеризует вероятность перехода от значения xY в момент к значению х2 в некотором интер- вале значений х в момент t2. Однако, начав со значе- ния х± в момент можно перейти к значению х в некото- рый произвольный момент времени t. Приняв это новое значение в качестве отправного, можно определить
148 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 вероятность появления значения х2 в некотором интер- вале х в момент t2 (рис. -3.10). Для получения сосиетствующей зависимости рассмот- рим трехмерную плоте ть вероятности р3 (rT. х, х2, t2), [ц t ^2, и на основании формул!' (3.45) запишем ее в виде Рз (“Л» ^1’ ^2’ Аг) = Г- (*^1» All 0 Pi (®2» ^2^1» ^1» *А» О* Проинтегрируем леву»: и правую части этого равенства по х СО J Рз(*1, —оо tp, х, t;x2, t2)dx = (xlt tp, x, t) p2 (x2, t2fxu ti, x, t) dx. Используем извести ю соотношение для многомерных функций плотностей вероятностей оо J Ps (^i, ti, х, i; г,. t2) dx = р2 (хъ tp, х2, t2) — ОО
$ 13j Диффузионный процесс Маркова 149 и условие (3.44) для второго сомножителя под интегра- лом р2 (ж2, t2!xY, tp, х, t) = р2 (ж2, t2lx, t). При этом получим со р2 (жь tp, х2, t2) = J р2 (xlt tp, х, t) р2 (яг2, t2/x, t) dx. ~оо На основании формулы (3.45) можем записать А (Л, <i‘> Ъ, t2) = Pi (rep tY) p2 (x2, t2IXi, tj), p2 (xu tp, x, t) = Pi (хи Q p2 (x, t/Xi, tj). Подставляя эти соотношения в предыдущее выражение и сокращая левую и правую части на pY (xt, tj, оконча- тельно получим со р2 (х2, t2JXi, ti) = J р2 (х2, t2Jx, t) р2 (х, t/Xi, ti) dx. (3.49) •—co Это соотношение называется уравнением Смолуховско- го — Чепмена — Колмогорова и устанавливает связь между двумерной условной плотностью вероятности марков- ского процесса и вероятностями переходов от к х2. Рассмотрим теперь стационарный эргодический про- цесс в виде ступенчатой функции времени w (t), прираще- ния которой Дш (t) на малых интервалах времени Д< по- стоянны, случайны и взаимно независимы (рис. 3.11).
150 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 Примем, что математическое ожидание приращений процесса равно нулю: М [w (t ф- AZ) — w (Z)l — 0, (3.50) где w (Z + AZ) — w (Z) = Air (Z). В силу принятого предположения о стационарности и эргодичности процесса найдем дисперсию как среднее по времени от квадрата приращений т D [Д?г (Z)] = М [?z’(Z ф- AZ) — zz?(Z)]2 = lim-^Д Д«’2 (t)dt. О Учитывая, что на интервале Zi+1 — /; = \Z функция Ап: (/) постоянна, Ап?2 (/) = Airf, получим оо D [Ап1 (Z)] = lim 4г 2 Т-хх, i=1 Соотношение оо lim -^г2 &wi = характеризует среднюю мощность процесса, следователь- но, дисперсия определится формулой D [Аш (Z)] = XAZ. (3.51) В силу того, что дисперсия приращений непрерывна, а математическое ожидание равно нулю, рассматриваемый процесс Au? (Z) с независимыми приращениями непреры- вен, имеет гауссово распределение и является марков- ским [4]. Плотность вероятности процесса Ain (Z) опреде- лится формулой 2 1 ------------— р (wA = — - е 2ХД<, Корреляционная функция может быть вычислена но формуле т 1 г kw (т) = lim гтт \ Aw (t) Aw (Z ф- т) dt. Т—оо 1 J о
§ 13] ДИФФУЗИОННЫЙ ПРОЦЕСС МАРКОВА 151 Однако ее вид легко устанавливается из графической схемы применения формулы для kw (т). Рассматривая про- изведение двух сдвинутых по времени друг относительно друга на величину т функций Дш (t) (рис. 3.12), видим, что среднее значение произведения соседних участков (заштрихованы на рисунке) будет равно нулю, так как их значения независимы. Оставшиеся же участки дадут среднее значение произведения, пропорцональное интер- валу т. При сдвиге па величину, большую т, среднее значение произведения функций будет равно нулю в силу независимости соседних участков процесса. Следова- тельно, с ростом т корреляционная функция будет линей- но убывать и обратится в нуль при т AL Таким образом, будем иметь р(Дг-|т|) при |т|<Д£, о при т>Д/. (3'52) График корреляционной функции показан на рис. 3.13. Рассмотренный процесс w (t) называется процессом броуновского движения, так как является математической моделью одноименного физического явления. Суть его заключается в том, что наблюдается движение безынер- ционной макрочастицы в однородной среде (например, однородной жидкости) под действием хаотического теп- лового движения ее молекул. Координата частицы в дан- ный момент времени постоянна и случайна. Рассмотрим более сложный случай нестационарного марковского процесса. Пусть в неоднородной среде (жид-
152 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ !гл. 3 кости или газе) безынерционная макрочастица совершает движение. Неоднородность среды обусловлена различной концентрацией молекул по объему, что характерно для смесей различных веществ. В этом случае в среде будет наблюдаться некоторое «квазистационарное» движение молекул в направлении выравнивания концентрации их по объему — будет наблюдаться известный в физике про- ного движения среды в точке цесс диффузии. При этом перемещение макрочасти- цы в среде будет состоять из двух компонент: «усред- ненного» смещения за счет скорости квазистационар- ного диффузионного дви- жения молекул среды и флуктуаций смещения за счет хаотического теплово- го движения молекул. Пусть скорость диффузион- х в момент t равна v (х, f). Флуктуационная составляющая перемещения является, по существу, процессом приращения броуновского дви- жения, так как за малый промежуток времени, на кото- ром рассматривается перемещение, свойства среды в ок- рестности точки х можно считать неизменными. Эти свойства можно характеризовать некоторым числовым коэффициентом а (х, t). Тогда перемещение частицы может быть записано следующим образом: х (Z -Т А«) — х (Z) = = v {х, Z) AZ -|- а (х, Z) [w (Z -|- Az) — w (Z)] (3.53) где AZ — малый интервал времени; w (t) — функция, ха- рактеризующая процесс броуновского движения. Если в соотношении (3.53) перейти к дифференциалам, получим dx (Z) = v (х, Z) dt + а (х, Z) dw (г). (3.54) Интегрируя это уравнение, будем иметь t t х (Z) = х (Zo) + f v (x, Z) dt fa (x, Z) dw (t). ip h (3.54')
i 131 Диффузионный процесс Маркова 153 Важным теоретическим аспектом рассматриваемого про- песса является вопрос существования решения уравне- ний (3.54) или (3.54'). Этим уравнениям нельзя придать строгого определения в обычном смысле, так как функция w (t) не имеет произ- водной. Однако задача может быть решена, если приме- сить стохастический интеграл Ито [10] ь ь J / (t) dw (t) — IP lim J fn (t) dw (t). a a (3.55) Здесь w (t) — функция процесса броуновского движения, /п (0 — ступенчатая функция, такая, что ъ J [/ (0 — /п (О]2 > 0 при /г —> ос, а Р lim — предел по вероятности, означающий, что сущест- вует предел интеграла с вероятностью, равной единице. Замена в уравнении (3.54') функции а (х, t) на соот- ветствующую ступенчатую функцию позволяет с вероят- ностью, сколь угодно близкой к единице, доказать су- ществование решения х (t) [10]. Таким образом, записывая уравнение (3.54) в виде ^ = v{x,t) + a(x,t)^, (3.56) можно утверждать, что оно имеет решение в виде реализа- ции х (t) случайного процесса диффузии. Выясним теперь, что представляет собой процесс, ха- рактеризуемый функцией dw (t)'dt. Обращаясь к соотно- шению (3.53), можем записать, что W (*+ At ~~ W (0 + Д/)- (3.57) Дисперсия этого процесса будет равна М [и2 (t + Д/)] = А. М \w (t + At) - w (t)]2 или, учитывая формулу (3.50), M[n2(t-|-At)] = A. (3.58)
154 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ (ГЛ. 3 Корреляционная ьузкцпя па основании (3.52) и (3.58) запишется в виде Ыт) = О при при (3.59) т^> At. Если теперь устремить At к нулю, выражение для корре- ляционной функции будет приближаться к дельта-функ- ции, что отвечает случайному процессу в виде белого шу- ма. Таким образом, lim -w(t) =dw=n (3 60) At->0 — где n (f) — белый шум. Окончательно уравнение диффу- зионного процесса пр ет вид = г(х, t) а(х, t)n (t). (3.61) Если существуют пределы а(х, Г) = |,= М1.« + А<)-М01, Ь (х, <) = 1 " ‘ t C + M-.WF , <3 в2> то условная плотность вероятности р {х2, t2 хх, 1Л), опре- деляющая процесс Mips ва, является решением уравне- ния Фоккера — План?. *_(<р) + 4-Д(М, (з.бЗ) причем [4] р(Ж)() = 4(г,0-4-^1 а (х, t) = } 6(z. t). (3.64) Если в уравнении (3 функцию п (/) рассматривать как входное воздействие, в функцию a: (t) как выходной сигнал, то этому уравнению м жно придать смысл уравнения ди- намической системы. этом случае термин «диффузион- ный процесс» утрачпь т свое физическое значение и будет означать лишь опрел, ленный класс случайных марков- ских процессов.
! 13J ДИФФУЗИОННЫЙ ПРОЦЕСС МАРКОВА 155 Найдем приближенное выражение условной плотно- сти вероятности диффузионного процесса для конечного малого интервала времени Д/. Возвращаясь к уравнению (3.53), можем записать xi+1 — xt = v (Xi, ti) Д« + a (xi, ti) Aw (/), (3.65) где Xi фиксировано в момент времени tu *^i+i — (g Az). Поскольку в фиксированный момент времени коэффи- циенты v (xt, и a (Xi, tt) постоянны при условии задан- ного значения xit значение х через малый интервал вре- мени AZ, xi+1, является случайной величиной только из-за наличия случайной функции Aw (t). Но последняя являет- ся приращением процесса броуновского движения, сле- довательно, имеет нормальное распределение. Таким образом, функцию плотности вероятности вели- чины х;+1 при условии фиксированного значения xt можно записать в виде p(-^4i/-Ki)= ,7—СХР V 2.-ГЙ (3.66) где тх и с2 — математическое ожидание и дисперсия ве- личины xi+1 соответственно. Найдем эти значения. Из’ со- отношения (3.65) имеем xi+1 = v (xh ti)At + Xi + a (xh ti) Aw (t), откуда mx = 71/ [xi+1] = v (xt, tt) At + xit (3.67) так как M [a (Xi, t^ Aw (Z)] = 0 (см. условие (3.50)). Дисперсия с учетом формулы (3.51) запишется в виде Ох = М [хг+1 — тх}2 = = 71/ [а (х,-, t^ Aw (Z)P = а2 (хг, Zj KAt. (3.68) Подставляя из формул (3.67) и (3.68) значения тх и Ох в выражение (3.66), окончательно получим р (xi+i/Xi) = - 1— ехр Г — .—I, (3.69) где t = t} и At = Zj+1 — t^
156 ОПИСАНИЕ . 1УЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 Итак, диффузионный процесс Маркова описывается дифференциальным ст хаотическим уравнением первого порядка (3.61), а егс условная плотность вероятности является в общем случае решением уравнения Фоккера — Планка (3.63). Для малых иптерв лов времени между последователь- ными значениями процесса, когда коэффициенты v (х, t) и а (х, t) уравнения 3.61) можно положить постоян- ными, и для случая стро- мает вид гого постоянства этих ко- эффициентов условная плотность вероятности имеет нормальный закон распределения (3.69). Вид уравнения (3.61) показывает, что его можно интерпретировать как уравнение нелинейного нестационарного фильтра, входным сигналом которо- го является белый шум п (/), а выходным сигналом процесс х (/). Структурная схема фильтра изображена на рис. 3.14, а. В случае, когда коэф- фициент а (х, I) равен еди- нице, а функция v (х характеризует безынерционную нелинейную характере тику, уравнение фильтра прини- ^ = г(а;) + «(0, (3.70) а его структурная схема упростится (рис. 3.14, б). Пользуясь уравнением Фоккера — Планка, можно найти одномерную функцию плотности вероятности про- цесса х (1) при заданной нелинейной функции v (х). Поло- жив в функции пло’яхти вероятноеги р (а?2, t2lxv ?х) tA = t2, получим xL = = х, следовательно, Р . Л. Д) = Р (*)•
5 (31 ДИФФУЗИОННЫЙ ПРОЦЕСС МАРКОВА 157 При этом уравнение (3.63) примет вид — -^[ар(.х)] + ±-^[Ьр(х)] = 0. (3.71) Коэффициенты а и Ъ можно вычислить непосредственно по формулам (3.62). Проинтегрируем приближенно урав- нение (3.70) па малом интервале времени Л/ = ti+1 — tit полагая, что х (t) мало изменяет на этом интервале свое значение. При этом получим 4 xi+1 — Xi = v (Xi) At -|- J n (t) dt. fi+l Подставляя это соотношение в формулы (3.62), будем иметь: h I (rr, t) = lim -^т-Гл/[i> (a:,) Ai] + Л7рг (t)] dtl = р (ж4), так как М In (/)] = 0, и далее ЪI х, t) = lim рИ [р2 (хл) At2] -|- 4 4 + M[n(t)n(u)]dtdu-{-v(xi') At М [zz (t)] dt^ = 5, 4+1 4+1 так как M [п (/) п (и)] = 56 (t — и), где 5 — спектральная плотность белого шума, и 4 4 it Й SW-uJMdu =4t dt = S. 4+1 4+1 Подставляя найденные значения коэффициентов а и b в уравнение (3.51), получим - 4[р р + 4 р = °- Решение этого уравнения имеет вид X J v(x)dx р(х) = Се 0 , (3.72)
158 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 что легко проверяется непосредственной подстановкой в уравнение. Произвольная постоянная С определяется из условия нормировки функции плотности вероятности оо f p(x)dx = 1. —оо Формула (3.72) показывает, что вид одномерной функ- ции плотности вероятности процесса на выходе нелиней- Рис. 3.15. пого фильтра, описываемого уравнением (3.70), целиком определяется функцией v (х). В частности, когда урав- нение (3.70) линейно, т. е. v (х) = — кх, будем иметь к х? р (х) = Се 8 2 , и выбирая постоянную С = 1/)/ 2ло, а величину k/S = = 1/з2, получим нормальный закон хг 1 --— р(х) = —-^е 202. v ' 1Л2Я<5 Если в уравнении (3.61) функция v (х, t) линейна по х, а функция а (х, /) от величины х не зависит, получим ^- = v(t)x + a(t)n(t). (3.73) Получаемый при этом процесс называется линейным марковским. Этот процесс гауссов, все его функции рас- пределения вероятностей являются нормальными. Уравнение (3.73) показывает, что линейный марков- ский диффузионный процесс формируется из белого шума линейным фильтром первого порядка. Его структурная схема показана па рис. 3.15. Найдем выражение для корреляционной функции ли- нейного марковского процесса, определяемого уравнением
§ 13] ДИФФУЗИОННЫЙ ПРОЦЕСС МАРКОВА 159 (3.73), при условии, когда v (t) = — а, a (/) = b, а и Ъ — постоянные. Импульсная переходная функция цепи, изображенной на рис. 3.15, определится на основании формулы (2.57) выражением w (t, g) = Корреляционная функция процесса х (t) для случая белого шума на входе с постоянной спектральной плот- ностью s может быть найдена по формуле (3.40) t} кх (*1, М = S j W (*1, В) W (Ль В) о или h кх (<!, /2) = sb2 J е-“Й1-5)-а(12-5)^^ — о = — е-а(<2+(1)]. (3.74) В общем случае формула (3.74) характеризует неста- ционарный процесс, однако для достаточно больших зна- чений и t2 (физически это означает, что процесс в форми- рующем фильтре установился) получим kx(t1,t2) = kx(r)^^e-M, (3.75) где т = t2 — В задачах, где рассматривается воздействие случайных входных сигналов на многомерные системы, важным яв- ляется распространение понятия диффузионного процесса Маркова на многомерный случай. Понятно, что вводя вместо одномерного движения частицы в среде, рассмот- ренного в предыдущем параграфе, многомерное движе- ние в «-мерном пространстве, можно записать соотноше- ние, аналогичное (3.61): (0 '^1 Г7О = О “F (^li ^2» ••• > 0 (3.76) К—1
0ПИСАН1П ‘.ТУЧаййЫх Процессов 1гл. з Здесь — перемещена частицы в направлении i-й оси /л-мерной системы коютлинат; v (х1? яг2, • •> xmi О — ско- рость частицы в данной точке пространства; ак (хи х2, . . . хт, t) пк — флуктуации в виде белого шума по к-й координате. Рассматривая в выражении (3.76) координаты xt (f) как компоненты m-мерлого вектора X (г), а флуктуации и* (f) как компоненты "г-мерного вектора X (£), систему уравнений вида (3.76 можно записать в виде векторного уравнения = Г X. t) - а(Х> О х (0- (3.77) Уравнение (3.77) описывает в общем виде многомерный диффузионный процесс Маркова, реализацией которого является функция X Г Векторные функции V (X, f) и а (X, t) имеют тот же смысл, что и функции v{xh f), a. xt, t) в уравнении 3.76). Если функция V (X. линейна относительно вектора X, а функция а (X, t) от вектора X не зависит, уравне- ние (3.77) имеет вид 4г = -4 0 -Т4- B(t) X (t), (3.78) где A (t) — матрица кос-ффициентов размера т X т, т. е. Д(0 = cI; fluff). • aim V) • а2т (О В f) — диагональная матрица размера т: -ч (t) о ... О О Ьз У) . . . О L . О . . . bm{t^ X (f) и X (/) — векторы матрицы-столбцы): (3.81)
§ 13] ДИФФУЗИОННЫЙ ПРОЦЕСС МАРКОВА 161 Таким образом, при подстановке матриц (3.79) — (3.81) в уравнение (3.78) и выполнении операций умноже- ния получим следующую систему уравнений: = а11х1 -f- л12ж2 4~ • • • 4" а1тхт 4- (£), + ^22^2 4" • • • + ^2тхт 4" ^2n2 (t), dxm — amlxl 4- атгх2 4" • • • 4- аттхт 4“ ЪтПт Структурная схема формирования многомерного ли- нейного марковского процесса с помощью линейных филь- тров показана на рис. 3.16. 6 А, В. Солодов
162 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 Мы видим, что в формировании каждой составляющей рассматриваемого процесса помимо белого шума прини- мают участие все остальные составляющие. Таким обра- зом, любая составляющая многомерного марковского про- цесса описывается линейным дифференциальным урав- нением 772.-ГО порядка. Так как многомерный линейный марковский процесс, так же, как и простой, одномерный, имеет нормальный вакон распределения вероятностей, то в качестве его характеристики достаточно иметь набор корреляционных функций вида ki} (<i> tz) = -V [жг (Z2) х} (Z2)J. (3.83) Построить этот набор можно следующим образом. Возь- мем матрицу-столбец функции X (Z) ^(0 = г-»1(0 п жа (Z) -*т(0- транспонируем ее и заменим аргумент Z на и. При этом получим матрицу-строку Хт (и) = [zx (и.) г2 (и). . . хт (w)]. Умножим матрицу X Z) справа на транспонированную матрицу ХТ (и) и произведем операцию определения мате- матического ожидания M[X(t)XT(u)] = M 'Т(г) -| Л [Z) ki (и) х2(и)...хп(и)] -V (')J или И (IJ -Г1 (и) M[X(t)XT(u)]=M TS. (•) П (u) (t) Ж2 (и) - Х)П(П) ... ~М[Ж1(«)Ж1(и)] .V |n(Z)a:2(u)] •• . AZ | (Z) (w) ] “ М ]a:2(Z)xi(u)] .V |xi(t)®2(w)] • . AZ [®2(Z) (и)1 JH [»CT(Z) X! (и)] it [rm (t) ха (и)] . . . М[хт (Z) Хт (и)]_
§ 131 ДИФФУЗИОННЫЙ ПРОЦЕСС МАРКОВА 163 Учитывая формулу (3.83) и вводя обозначение Кх (t, и) = М [Д’ (Г) Хт (и)], (3.84) окончательно получим *п (t, и) Кх (*. и) = *12(«• Д *22 (^ и) • ,С1П (<- М) ‘ (*’ “) .(3.85) *21 (*“) L_ тих' ’ / 7п2' ’ ' ттп х / Выражение (3.85) и определяет полный набор корре- ляционных функций, характеризующих случайный вектор (многомерный случайный процесс) X (?). Величина Кх (t, и) называется корреляционной матрицей процесса X (t). Для процесса X (Z), представляющего собой многомер- ный белый шум, корреляционная матрица становится диагональной, так как взаимные корреляционные функ- ции отдельных составляющих равны нулю. Кроме того, учитывая общее выражение для корреляционной функ- ции белого шума кп (/, й) = s (/) 6 (t — и), где s (/) — спектральная плотность белого шума, получим JEjv (t,u) = Si (t) S (t — u) 0 0 0 S2 (t) 6 (t — u) 0 0 0 • sm (0 6 (t — «) L 0 0 . . .^(t)J Введем обозначение о /?(«) = _ о о . . . о - S2(t). • . 0 О • • .sm(0- (3.86) 6*
164 ОПИСАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 3 где R (?) — матрица спектральных плотностей белого шума. Тогда корреляционная матрица многомерного бело- го шума будет иметь следующий окончательный вид: KN (t, и) = R(t)8(t — и). (3.87) В заключение сделаем замечание относительно приме- няемой терминологии. В зарубежной литературе часто корреляционной функцией называют выражение т к (т) lim х (£) х (t + т) dt, Т—оо -1 J о определяющее среднее по времени от произведения х (?) х (i + т) реализации случайной функции. В отличие от него, среднее по множеству называется ковариацион- ной функцией (или ковариацией) кх Gl> Q = М [х (Q х (f2)]. Во-первых, осреднение по времени возможно только для стационарных эргодических процессов [4], что сужа- ет вводимое таким образом определение. Во-вторых, и это важнее, без всякого различия это определение применяет- ся и к случайным и к неслучайным функциям, что вносит уже методологическую путаницу. Мы будем придерживаться определения корреляцион- ной функции, вытекающего из определения моментных функций (3.1) и устанавливаемого соотношением (3.3).
ГЛABA 4 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА § 14. Задача линейной фильтрации случайных процессов. Уравнение Винера — Хопфа Задача оценки случайного процесса по критерию ми- нимума средней квадратической ошибки, поставленная л решенная А. Н. Колмогоровым в 1941 г. [13] и позднее выполненная Н. Винером применительно к непрерывным процессам, дала толчок целому ряду работ в этой обла- сти. Если упомянутые авторы рассматривали только тационарные случайные процессы, то в дальнейшем их результаты были распространены и на определенный класс нестационарных процессов. Будет, однако, спра- ведливым именовать класс линейных систем, осуществля- ющих оценку случайных процессов на основе процедуры, предложенной Колмогоровым и Винером, фильтрами Колмогорова — Винера независимо от того, какого вида случайный процесс рассматривается. Ниже мы рассмотрим задачу линейной фильтрации случайных процессов системой с одним входом и одним выходом и ее решение с помощью классического метода вариационного исчисления. Эта задача и ее решение широко известны [2, 19, 26], поэтому нам она необходима лишь в методических целях, для сравнения в дальней- шем с тем подходом, который применяется при построении эильтра Калмана — Бьюси. Постановка задачи фильтрации по Колмогорову — Винеру заключается в следующем. 1. Заданы взаимно не коррелированные случайные процессы в виде функций времени и (t) и п (<) с корреля- ционными функциями ^2) = М [и (Zi) и (£2)], 1 /АН 2. Задана линейная система с импульсной переходной функцией штр (t, %), обеспечивающая необходимое линей-
166 ФИЛЬТР Ж ЛМСГОРОВА — ВИНЕРА [ГЛ. 4 ное преобразование случзйз й функции и (t) в случайную функцию х (/): x{t)= (4.2) i 3. Требуется найти импульсную переходную функ- цию шопт (t, Е) фильтра ’’итимальным образом выделяю- щего реализацию случайного процесса х (t) в виде неко- торого процесса х0 (t) в условиях, когда на его вход по- ступает аддитивная см ь тучайных процессов и (<) -р + п (t) = z (0. 4. Критерием оптим-льеости является минимум сред- ней квадратической ошябки 8 (0 = х (t) — х0 (t), т. е. М г ] = min. (4.3) Структурная схема фильтрации показана на рис. 4.1. Рассмотрим решение п вставленной задачи. Общая связь между входом и выходом линейной систе- мы для случая, когда ехолл й сигнал подается в момент t = 0, дается выражение t i0(t)= w ‘,E,)z(£)d£. i Применяя эту зависимо ~ь к соотношению 8 (0 = Г 0 — хо (0,
$14) ЗАДАЧА ЛИНЕЙНОЙ ФИЛЬТРАЦИИ 167 будем иметь: t 8 (7) = х (f) — J w (t, g) z (g) dl 0 и, далее, после возведения в квадрат: t 82 (7) = ж2 (7) — 2 J w (t, |) z (£) х (7) d% + О t t + J J w(t,£)w(t, X)z(B)z(X) о 0 Выполняя в этом выражении операцию определения математического ожидания случайных функций ж2 (7), z (|) х (7), 82 (7), z (|) z (X) и учитывая, что М [ж2 (7)] = Dx (7), M[z(l)x(t)] = kzx(l,t), M[z®z(K)] = kz&K), (4.4) где буквой к обозначены соответствующие корреляцион- ные функции, получаем: t М [82 (7)] = Dx (7) - 2 f w (t, I) kzx (g, 7) dl + 6 t t + J J zr(7, g)zr(7, X)AZ(B, 'kjdld'k. (4.5) о о Предположим теперь, что импульсная переходная функ- ция фильтра w (t, %) отличается от оптимальной на не- которую функцию yh (7, £): w (7, £) = шопт (7, %) + yh (7, |). Подставляя эту зависимость в соотношение (4.5), после некоторых преобразований будем иметь: t М [е2 (7)] = Dx (7) - 2 J wonT (7, |) kzx (g, 7) + О t t + J j Мопт (t, В) Мопт (t, X) kz (В, X) d&K — 0 0
168 фет-ьт? Колмогорова — Винера [гл. 4 — 2у J h (t,£) kzx ; : Л О t t 4-2Tf -стгг,л)ЛаД)А:г(5Л}« + 0 • f f - '' f h(t,|)h(t,X)kz(I,X)d&K. (4.6) • i Сравнивая соотн~ени* (4.5 с первыми тремя слагаемыми выражения (4.6 легко видеть, что последние представ- ляют собой значение минимальной средней квадратиче- ской ошибки, поев спеку в них входит оптимальная им- пульсная перехсннсн функция шОпт (£> В)- Последнее же слагаемое — суш-стеенно неотрицательная величина, яв- ляющаяся математическим ожиданием квадрата интеграла е ]AM)z(g)c£, i так как t M^h(t,t)z®dC = t t = й f.S h(t, X)M[z(g)z(X)]dgdX = £2. • i Таким образом, выражение (4.6) примет вид Л/ [82 (£)] = Dx min С — - 2Т Ил (t, I) f ”'гропт(/, X) h(t, |) к&, X) dk\+ Lo oii J + Т2Я2- (4.7) Чтобы величин- е2 (1)1 приняла минимальное зна- чение, т. е. чтобы 3/ [es СО] = min, необходимо выпол- нение условия t t е _ ^3T(f, 1)кг& X)dgdX = O, о « « (4.8)
§ 14) ЗАДАЧА ЛИНЕЙНОЙ ФИЛЬТРАЦИИ 169 так как согласно правилу вариационного исчисления не- обходимым условием экстремума функции М [е2 (Z)] яв- ляется соотношение ^{М [е® (£)]}Y=0 = О, которое после подстановки в него формулы (4.7) и примет вид выражения (4.8). Уравнение (4.8) является также и достаточным услови- ем минимума средней квадратической ошибки. В самом деле, подставляя выражение (4.8) в (4.7), будем иметь М [82 (/)] = £>ят1п (0 + у2£2, но так как у2Е2 > 0, то М [s2 (/)] Dxmin (t) и, следова- тельно, функция шопт (t, |) действительно определяет си- стему с минимальной средней квадратической ошибкой. Уравнение (4.8) можно записать также в виде t t J h (t, I) (g, t) - J zzwG, X) kz (£, X) dx] di = 0, о L 0 Физический смысл этого выражения состоит в том, что оно изображает реакцию системы с импульсной переход- ной функцией h (t, I) на входной сигнал в виде функции, стоящей в квадратных скобках, т. е. является обычной интегральной связью между входом и выходом некоторой системы. Очевидно, что реакция системы для всех | 0 может быть равна нулю в том случае, когда входной сигнал равен нулю, т. е. ! А2Ж(|,0 = J^onTG,k)M£»M^ Для £>°- (4-9) о Здесь kz (£, X) — корреляционная функция полного вход- ного сигнала, т. е. суммы и (t) + п (t), kzx (g, t) — взаим- ная корреляционная функция процессов z (Z) и х (t). Соот- ношение (4.9) называется интегральным уравнением Ви- нера — Хопфа. Оно устанавливает связь между опти- мальной импульсной переходной д функцией фильтра и корреляционными функциями kz и kzx. '% Выразим корреляционные функции kz (|, X) и кгк (5, t) через заданные корреляционные функции ки и кп.
170 ФЕЛВТГ КОЛЧ : ГОРОВА — ВИНЕРА [ГЛ. 4 Так как .’) = и !) -г п (0 (4.10) и процессы и ( и . (t) ер коррелированы, то очевидно соотношение К С; л) = К (1, X) + кп (|, X). (4.11) Далее имеем kzz ; .) = V I: (?) х (<)] или, учитывая с .те шенил 4.2) и (4.10), г kzx&t) = M - и©] .^(f, X)u(X)d?i} = t f = ( ги-гр (t , X) M [l ; X)]d'. — tPTp (f, k)M (n(|) u(k)]dk. 6 Так как и (/) и ” /) не ке р г-.тированы, второй интеграл равен нулю, и, учЕтывая (4.1 , окончательно будем иметь t к^ г, t = J IT- *. Х)А„(В, k)dk. (4.12) о Итак, уравнение -.9 с формулами (4.11) и (4.12) позво- ляет найти оптем льзую импульсную переходную функ- цию фильтра п~ з’данных корреляционных функциях К и кп. Задача отысеаеля реш зля уравнения (4.9) далеко не проста. В слелуиоч парагр фе мы рассмотрим случаи, при которых эт росение возможно получить в явном виде. § 15. Оптимальна» передаточная функция фильтра при стационарном входном сигнале Решение инт--р а.тьного уравнения Винера — Хопфа можно получить в явном виде. если входной случайный процесс z (<) ст : зэк Арен. Очевидно, при этом должны быть стадионарЕтгмл г процессы и (/) и п ([). Рассмотрим для этого случая пве задачи. 1 задача. Нестационарный линейный фильтр. а) Входной случайный сигнал z (?) стационарен, его корреляционная тункция будет функцией разности
§ 15] ОПТИМАЛЬНАЯ ПЕРЕДАТОЧНАЯ ФУНКЦИЯ ФИЛЬТРА 171 аргументов; kz (1, X) = kz (| - X). (4.13) б) Линейное преобразование процесса и (/) осущест- вляется нестационарным линейным фильтром с импульс- ной переходной функцией штр (/, |). Обычно решение уравнения Винера — Хопфа произ- водится с помощью интегрального преобразования Фурье. Основная трудность здесь заключается в том, что непос- редственное применение преобразования Фурье к урав- нению (4.9) [при условии, когда kz (g, X) определяется со- отношением (4.13)1 невозможно в силу того, что это урав- нение определено лишь для значений £ О, т. е. для физически реализуемых систем. Поэтому основной задачей при решении уравнения (4.9) является такое преобразование его, при котором вместо функции /с2 (т), т = | — X, не равной нулю при т < 0, в нем была бы функция, обращающаяся в нуль при т <; 0. При этом общая схема решения ничем не отличает- ся от решения задачи Колмогорова — Винера, за исклю- чением того, что в данном случае приходится иметь дело со спектральной плотностью нестационарного процесса, характеризуемого корреляционной функцией kzx, как это следует из формулы (4.12). Если корреляционная функ- ция kz определяется выражением (4.13), т. е. характеризу- ет стационарный случайный процесс, то ее изображение по Фурье будет спектральной плотностью вида оо 52(со) = j kz (г) dt. (4.14) —оо Поскольку в большинстве практических случаев спек- тральная плотность является дробно-рациональной функ- цией от со2, ее можно представить в виде Sz (со) = Tz (со)^ (со), (4.15) где Tz (со) и Wz (со) — комплексно-сопряженные функ- ции, одна из которых имеет полюсы в верхней полуплос- кости со, а другая — в нижней. Предположим, что функ- ция (со) является изображением Фурье некоторой функции времени фх (/): оо Tz(co) = (4.16) о
172 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 обме~'?’щей свойством (Z) = О при t < 0. (4-17) Тогд ОО 0 Yz (со) = J (Z) e^’dt = J ф2 (р) e-^dp, (4.18) 0 —оо ПрИЧё ф2 (р) = 0 при р>0. (4.19) П<-.множая выражения (4.16) и (4.18) и учитывая (4.15), ^удем иметь Ж о Sz (со = гр! (Z) e~jwtdt § ф2 (р) g-M'-dp = О —оо оо сю = J e-’^'+WdZ J ipi (£) ф2 (р) dp или : кс нчательно оо оо 52(со)= J e-^diq J (ц — р) ф2 (р) dp, (4.20) —оо —оо где г = t + р и пределы интегралов расширены в силу свопе — функции (4.17) и (4.19). Ср-енивая выражения (4.14) и (4.20), заключаем, что 30 О Мп = J МП — Н) Фг (и) Ф = J Мп — н) Фг (н) dp, (4.21) —оо —оо так кгк ф2 (р) = 0 при р > 0. Фю-нческий смысл выражения (4.21) заключается в том что корреляционная функция kz (ц) может рас- сматргч^ться как реакция некоторой физической системы с пост генными параметрами и импульсной переходной функкгек ф2 (р) на входной сигнал в виде функции tpj (/), начпЕё.? щийся в бесконечно отдаленный момент времени. Следеь сельно, можно предположить, что корреляционная функеле kzx может тоже рассматриваться как реакция этой же физической системы, но уже на другой входной сигнал с параметром t (в силу нестационарности соответ- ствую ссего процесса), т. е. оо -.-ГХ(П.О= J МП —M)MpW. *>°. (4.22)
5 15] ОПТИМАЛЬНАЯ ПЕРЕДАТОЧНАЯ ФУНКЦИЯ ФИЛЬТРА ]73 где <рх — пока неизвестная функция. Преобразуя по Фурье выражение (4.22), будем иметь оо оо оо [ ^zx (Ч» 0 [ Ф1 (т, t) eri^dt [ ф2 (р) g-^dp, --ОО -ОО -ОО где т = ц — р. Отсюда, учитывая формулу (4.18) и пола- гая оо 5гх(й,0= J ^(Ti.Oe-i^dri, —оо • (4.23) получаем р . S (со, 1} \ Ф1 (т, О e~,u>zdx = —---------- 1 Обратное преобразование Фурье даст значение искомой функции в виде 1 р 5 (со, t) ♦.«.0-^- 5 “*“ (4-24> Теперь можно приступить к решению интегрального уравнения (4.9). Учитывая стационарность входного про- цесса, запишем это уравнение в виде t kzx (t, I) = J »опА w) kz (g — u) du, I > 0. о Выражая корреляционные функции k2 и kzx с помощью соотношений (4.21) и (4.22), получаем уравнение J <Р1 (6 — И» 0 Ч>2 (И) ^Р- = -оо f оо = J м>опт(^ w) du J фх (£ — и — р) фа (р) dp, О —оо которое можно переписать в виде оо t J ф2 (р) dp [фх (| — р, t) — J гг>опт(/, w)фх (g — w — р) di^=0. —оо 0
174 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 что в свою очередь дает ! (Т> О = J ^’опт(С и)Ф1 (t — w) du, о (4.25) где т = £ — р. Уравнение (4.25) аналогично уравнению (4.9), однако теперь под интегралом вместо корреляционной функции kz, не равной нулю для и X, стоит функция обра- щающаяся в нуль для значений и т на основании выра- жения (4.17). При этом легко может быть осуществлено одностороннее преобразование Лапласа уравнения (4.25) оо J (т. 0 e~sxdr = о J e~sxdr f wom(t, и) (т — и) du, 6 о которое после замены переменной X — т — и примет вид ОО ОО оо J <рх (т, t) e~‘xdr = J е-аХф1 (X) dk J w?onT (t, и) e~sudu. о оо Введем понятие нестационарной параметрической пе- редаточной функции оптимального фильтра, определяе- мой как преобразование Лапласа от импульсной переход- ной функции t РГопт («» 0 — J wom(tf u)e~sudu. (4.26) о Подставляя в полученное выражение соответствующие значения из формул (4.16) и (4.24) и учитывая выражение для нестационарной параметрической передаточной функ- ции, окончательно будем иметь: 1 ( г («, t) Wom(s,t)= 2^(s) j e~”dx (4.27) Эта формула позволяет определить оптимальную парамет- рическую передаточную функцию системы для стацио- нарного входного сигнала. Следует подчеркнуть, что оп- тимальная система, построенная на основе изложенной выше теории, может, вообще говоря, иметь отличную от нуля динамическую ошибку.
J 15'j ОПТИМАЛЬНАЯ ПЕРЕДАТОЧНАЯ. Ц1УНКЦИН щщппгл 2 задача. Стационарный линейный фильтр. а Входной случайный сигнал z (t) стационарен. 6 Линейное преобразование процесса и (<) осуще- ствляется стационарным линейным фильтром с импульс- ной переходной функцией wTV (и). Это классическая задача Колмогорова — Винера. По- кажем ее решение методом Боде — Шеннона [2]. Как было отмечено выше, применение преобразования Фурье к решению уравнения Винера — Хопфа затруднено из-за необходимости соблюдения условия физической реализуе- мости фильтра w (т) = 0 при т < 0. Если это условие отбросить, уравнение Винера — Хопфа (49) с учетом стационарности фильтра примет вид оо —оо где t kzx (t — £) — J w’rp G — ки (£ — ?.) dk, о а звездочкой отмечено, что импульсная переходная функ- ция не обязательно соответствует физически реализуемому фильтру. Замена переменных t — | = т, t — к = и даст ОО kzx(t) = $ w'om(u)kz(u — x)du —оо иле, учитывая четность корреляционной функции kz, ОО А«(т) = J wom(u)kz(x-u)du. —оо Умножая левую и правую части этого уравнения на и интегрируя по т в пределах от — оо до оо, получим (за- меняя в правой части т на s + и) Szx (<о) = Шочт (/со) Sz («о), (4.28)
-----Ill) (ГЛ. 4 WlJlbTP КОЛМОГОРОВА — ВИНЕРА где оо <$»(«) = j fczX(T)e-J“"dT, —co 5г (co) = оо J kz (s) e~ju>sds —co явла:": - спектральными плотностями соответствующих слу-.iizi.x процессов. Выражение оо В^опт (j«)= J U’’I1T (u) e-;“u du —оо явлкт"’ ч передаточной функцией оптимального фильтра без ~ значения его условием физической реализуемости. Онг ТгГЕо находится из соотношения (4.27): ^(И=4^Г (4.29) O6f "з преобразование Фурье даст выражение для им- пуль.н.й переходной функции фильтра оо Чпт(0 = (4’30) —оо Импульсная переходная функция, определяемая этой формул ’ будет отлична от нуля для отрицательных зна- ченп± т ;-мени t. Поскольку начало отсчета времени сов- падав зействием импульса на входе фильтра, это озна- чает v предчувствуя» появление некоторого значения входе.- сигнала, фильтр начинает давать на выходе реакйхг за этот сигнал до его появления. Такая система в точном смысле физически нереализуема. Однако прибли- женЕ.Е г строение подобного фильтра возможно. Для этот з-’ 'ходимо реализовать такую импульсную пере- ходную зтнкцию фильтра, которая с момента t = 0 имела бы виз "Еечающий ее значениям для моментов времени t — пс. |4.2). О-гЗеено/ чем больше значение тзап, тем точнее будет воспу. т-Е диться требуемая функция w0WT (<)• При этом,
§ 151 ОПТИМАЛЬНАЯ ПЕРЕДАТОЧНАЯ ФУНКЦИЯ ФИЛЬТРА 177 однако, результат обработки входного сигнала, поступив- шегс в момент t = 0, будет выдаваться фильтром с задерж- кой во времени на величину тзап. Качество обработки покупается ценой потери времени. Тем не менее в тех слу- чаях. когда запаздывание в прохождении сигнала по цепи допустимо и существенно не влияет на качество системы, практическое построение фильтров по формулам (4.29 и (4.30) вполне оправдано. Рассмотрим теперь решение задачи о пост- роении оптимального фильтра с учетом усло- вия его физической реа лизуемости. Иными сло- вами найдем передаточ- ную функцию такого фильтра, который будет осуществлять оптималь- ную бработку сигнала без запаздывания. приближенно оптимальных Рис. 4.2. Предположим, что подлежащий обработке стационар- ный случайный сигнал z (<) образуется посредством пре- образования белого шума некоторым линейным фильтром. Поскольку связь между спектральными плотностями на входе и выходе линейного фильтра с передаточной функ- цией К (/со) определяется формулой *$вых (со) = I К Ца) I 2 5ВХ (со), а спектральная плотность белого шума постоянна и равна единице, получим Sz (ш) = | (со) | % где S. (со) — спектральная плотность сигнала z (7); Ч'ф (со) — передаточная функция формирующего фильтра. При этом очевидно, что Sz (со) = (со) Т; (со), (4.31) где (со) = Тг (—со). Тсгда структурная схема оптимальной фильтрации сигнала z (/) может быть представлена как схема оптималь- ной фильтрации белого шума (рис. 4.3). Схема состоит
178 З-ZZbTP КОЛМОГОРОВА — ВИПЕРА [ГЛ. 4 из последоват т-ного с единения формирующего фильтра и оптимальнс’ фильтра. Общая передаточная функция системы будет ;-ъна О®) = *FZ (<о) Р70’пт (со) или, с учетом -ношений (4.29) и (4.31), (jW) = -^^-. (4.32) 7 V* (со) ' ' Полученнаг система также физически не реализуема, так как соде], нт идеальный фильтр, определяемый фор- мулой (4.29). Однако теперь мы можем провести следующие Рис. 4.3. рассуждения. кольку на входе системы действует белый шум, у к торого отсутствует корреляция между любыми его зЕ'ченпямЕ в разные моменты времени, обра- ботка импуль - гелого шума происходит независимо. Это означает, что сукмарный эффект оптимальной обработки сигнала опред-.тнется оптимальной обработкой любой комбинации с .-авлякщих этого сигнала. В частности, все составил!1 . сигнала для t 0 также оптимально обрабатываю ":. как п составляющие для t <0. Для этих составляй дшх (при t 0) фильтру не требуется «предчувствог их появление для значений t <0. Следователью для построения фильтра с учетом условия его физическ й 'сализуемости достаточно из переда- точной функтг— К (jco выделить ту ее часть, которая от- вечает значением t 0. Известно, что в частотной обла- сти это отвеч г слагаемым, имеющим полюсы в верхней полуплоскости Т гда из формулы (4.32) получим К0(рд) = 'SZXW /Хм _ (4.33)
§ 15] ОПТИМАЛЬНАЯ ПЕРЕДАТОЧНАЯ ФУНКЦИЯ ФИЛЬТРА 179 где знак + означает учет слагаемых функции, стоящей в квадратных скобках, содержащих только положительные частоты. Аналитически это можно сделать путем нахож- дения функции времени, отвечающей значению (jo), и последующего ее преобразования по Фурье для t от О до оо: оо J А'о(/со)с’“Мсо, —оо оо А'о (/<>) = J (0 er^dt. о 4 (4.34) Теперь легко найти искомую передаточную функцию оп- тимального фильтра для общего случая входного сигнала z (t). Для этого достаточно оптимально обработанный бе- лый шум пропустить через фильтр с передаточной функ- цией, обратной передаточной функции формирующего фильтра: И7оп-г (/со) = Ко (/со) . Подставляя в эту формулу выражение (4.33), окончатель- но получим 1 Гб1 (со) VTonT(/co)=-^r^2 . (4.35) Таким образом, для вычисления передаточной функции оптимального фильтра необходимо разложить спектраль- ную плотность полного входного сигнала Sz (со) на ком- плексно-сопряженные множители и, воспользовавшись значением спектральной плотности полезного входного сигнала S2X (со), по формуле (4.35) получить искомый ре- зультат. Напомним, что эта формула справедлива для случая отсутствия корреляции между полезным сигналом и помехой. Пример. Полезный стационарный случайный сигнал переда- ется по каналу при наличии помех в виде белого шума. Требуется построить оптимальный физически реализуемый фильтр для выде- ления сигнала из шума для следующих исходных данных (рис. 4.4): а) спектральная плотность полезного сигнала Р2 5ВХ (®) - р2 + щ2 ;
180 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА 1ГЛ. 4 б "-игральная плотность белого шума 5п(о>) = п2. 1. —* деляем сгектральную плотность полного входного сиг- нала. Тех как сигнал и шум независимы, искомая спектральная нлотн /п *5удет равна сумме спектральных плотностей составляю- щих: ‘?2(®)=‘5'еХ(“) + 6’п(“) = Р2 (л2 + 1) + п2С02 = Р2 Д-СО2 Введем обозначение а2 = Р2 (n2 + 1), тогда а2 + ^со2 (®) = g2 + w2 Пллуч-----ю функции легко представить в следующем виде: ' (а +/псо) (а—/псо) СЗ +/«)(₽-/®) ’ откуп 2 4- /п<о * а — into ^(«0 = 3^ • 2. Е формуле -5.32) определяем К*п (ja): = -УвхИ = Р2 3- /со = р2 — ip* р24-а2 с—/псо (Р + /со) (а — /па) " 3. Пр- изведем у избиение функции К*0(]а) на два слагаемых, однс z- s -орых имеет положительные частоты, а другое — отри- цательнн.- Для этот: запишем следующее тождество: _______р2_____________А В л ! (3 — /со) (а — /псо) — Р + /<о — /псо ’ откута Р2 = А (а — /псо) + В (Р + /со). Прп^^р^т^ля вещественные и мнимые слагаемые в левой и правой частях. Гудем иметь Р2 = Ло+Вр, В-Лп = 0, откуда Р2 пР2 а 4- пЗ ’ а + пР ‘
£ 161 МЕТОД МОДЕЛИРОВАНИЯ 181 Подставляя найденные значения коэффициентов Л и В в выраже- ние для Ко (jсо), получим * . З2 пЗ2 (7е0) — (а ге£) (3 + /®) (а + п3) (а — /псо) Легко видеть, что первое слагаемое имеет положительную частоту, следовательно, ' SBX (®)____________З2 ^’(со) +— (“ + ге3) (3 + /®) 4. Находим передаточную функцию оптимального фильтра. Будем иметь w 1 Г 5вх (®) 1___________3^________Р2/(я+пЗ) оптО®)— ^(со) ^(со) (а +/псо) (а + пР) ~ а + /псо Введем обозначения: З2 п к = —. а , Т=-------, а пр а или, учитывая выражение для о: 14-п24-п /п2 + 1 ’ 3 /п2 +1 При этом передаточная функция при- мет вид гг • к Жопт 0ш) = ущу 1 Таким образом, оптимальный фильтр является простым инер- ционным звеном, у которого коэффициент усиления всегда меньше единицы и зависит от уровня спектральной плотности помехи, а постоянная времени определяется также и спектром полезного сигнала. На рис. 4.5 приведены графики, определяющие значения параметров фильтра в зависимости от уровня помехи. § 16. Выбор оптимальных параметров фильтра методом моделирования Физическая реализация оптимальных фильтров Кол- могорова — Винера в ряде случаев, когда импульсная переходная функция или передаточная функция в явном виде не получены, затруднена. Это объясняется, главным образом, тем, что структура фильтра оказывается при этом неизвестной. Поэтому возникает задача оптимизации си-
J 82 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 стем с заданной структурной схемой, при решении которой отыскиваются такие значения варьируемых параметров системы, при которых имеет место минимально возможное для данной структуры среднее квадратическое значение ошибки фильтрации. Наиболее перспективным и удобным с практической точки зрения методом решения упомяну- той выше задачи оптимизации является ее моделирова- ние [26]. Итак, пусть на вход фильтра заданной структуры с им- пульсной переходной функцией w (i, Е) поступают два случайных сигнала — полезный' сигнал и (t) и помеха п (£), имеющие корреляционные функции, определяемые соотношениями (4.1). Полезный сигнал подвергается за- данному линейному преобразованию с помощью фильтра с импульсной переходной функцией штр (£, с). Задачей фильтрации является наилучшее в смысле среднего квадратического отклонения приближение пол- ного выходного сигнала х0 (<) к его требуемому значению х (£) (см. рис. 4.1). Критерием оптимальности в этом случае является ми- нимум средней квадратической ошибки между требуемым и полным выходными сигналами фильтра: М [х (t) — х0 (Z)]2 = min. (4.36) Для определения средней квадратической ошибки М [е2 (/.)] воспользуемся формулой для дисперсии суммы двух случайных функций х (t) и х0 (t): D [в (£)] = D [х (t) — х0 (£)] = = D [х (£)] + D [ж0 (i)l — 2 М [х (t) х0 («)]. (4.37) На основании общей формулы (3.34) и приведенной на рис. 4.1 схемы получим: t t D [х (t)] = 2 j штр (t, g) dl j wTP (t, i]) ku (tj, g) dt], о 5 t t Z) [ж0 (£)] = 2 j w(t, g)dg j w(i, u)kz(u, %)du, о i (4.38) где ku (t], I) = M [и (tj) и (g)] — корреляционная функция
5 16J МЕТОД МОДЕЛИРОВАНИЯ 183 полезного сигнала; kz (и, |) = М [z (w) z (£)] — корреля- ционная функция полного входного сигнала. Взаимная корреляционная функция определяется фор- мулой ^хо(М) = M[x(t)x0 (£)] = t t = M J w(t,l)x(t)z(l)dl= J w(Z, g)kxz(t, I)dl, (4.39) 0 0 где kxz (t, I) = M lx (Z) z (£)] — взаимная корреляцион- ная функция полного входного и требуемого выходного сигналов. Функцию кхг (Z, g) представим в следующей форме: ^z(Z,g) = M{[W(^) + n(B)]rr(O} = t = J wTp (t, ц) M {u (T]) [w (I) + n (1)1} dr) = 0 t = J w’tp (t, T|) [&« (T), £) + Km (Г), £)] dr), 6 (4.40) где kun — взаимная корреляционная функция входного полезного сигнала и помехи. Тогда выражение (4.39) при- мет следующий вид: t t кх0 (Z, g) = J w (t, g) dl, J wTp (t, т]) [ku (t), g) + ku„ (ц, 1)] dr], о о Так, как двойной интеграл в полученном соотношении имеет областью интегрирования квадрат со сторонами 5 = t и т] — t, то к нему применима формула преобразо- вания (3.34). В результате будем иметь t t kxolKl) = 2 J w(t, g)dg j u-Tp о 5 (t, T)) [&« (Л Д) + km(y], I)] dr], (4.41)
184 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА 1ГЛ. 4 Подставляя выражения (4.38) и (4.41) в (4.37), получаем: i t D [е (<)] = 2 j ШгР (t, |) dl J wTp (i, и) ku (и, I) du 4- o £ t t + 2 J w (t, £) d% К w (t, u) kz (u, £) du — 6 4 i — 2 J wTP (t, т]) [ku (т], I) + kun (t], g)J dT]|. (4.42) Построение схемы моделирования произведем для слу- чая, когда полезный входной сигнал и помеха не корре- лированы. При этом Кп Оъ В) = 0, kz (и, I) = ки (и, I) + кп (и, |), и формула (4.42) запишется в следующем виде: t t D [е (£)] = 2 J wTp (t, I) d% штр (t, u) ku (u, I) du + о i t t + 2 J w (t, I) dt, |J w (t, и) [Л„ (и, I) 4- kn (и, B)] du — -2S wTp (i.T])^^. В) ЙТ]| • После введения функций t 'j Hi (t, I) = f wTp (t, u) ku (и, I) du, £ I t ‘ H2(t,B) = \w(t,u)[ku(u,l)+ kn(u,l)\du — 2.H1(t,l) £ (4.43) выражение для дисперсии примет вид D[e(QJ = Z>t(fH) = t t = 2 j wTP (t, I) Hx (t, B) dl 4- 2 f w (t, I) Нг (t, I) dl (4.44) о 6
Fiej МЕТОД МОДЕЛИРОВАНИЯ185 Формулы (4.43) характеризуют последовательное со- единение линейных систем, причем корреляционные функ- ции рассматриваются как импульсные переходные функ- ции некоторых физических систем. Учитывая зто обстоя- тельство, мы можем составить схемы, показанные на рис. 4.6. Однако полученные схемы будут давать на вы- ходе реакции для фиксированного момента | приложения входных импульсов. Нам же необходимо, как это видно из формулы (4.44), иметь эти реакции как функции £ при фиксированном t, так как интегрирование ведется по пе- ременной Эту задачу можно решить путем построения инверсных схем (см. § 9), для чего достаточно в исходных схемах изменить направления всех связей на обратные, заменить все исходные звенья на инверсные и ввести во всех звеньях переменную моделирования т = tB — t. Получаемые при этом схемы показаны на рис. 4.7, а. Лег- ко видеть, что их можно объединить в одну схему, приве- денную на рис. 4.7, б. Для определения дисперсии в соответствии с формулой (4.44) функции (£н, т) и Н2 (£н, т) должны быть ис- пользованы в качестве входных сигналов систем с им- пульсными переходными функциями штр (t, |) и w (t, g). Вводя в последнюю переменную моделирования т, мы по- лучим окончательную схему моделирования, приведен- ную на рис. 4.8. Схема состоит из следующих элементов: исходного и инверсного фильтров, подлежащих настрой- ке; исходного и инверсного фильтров, определяющих заданное преобразование полезного сигнала; инверсных систем с переменными параметрами, моделирующих кор- реляционные функции полезного сигнала и помехи. Од- нако практически реализация полученной схемы не всег- да целесообразна (хотя принципиально всегда возможна) по следующим причинам. При моделировании исходных систем с новой переменной т необходимо обеспечить со- ответствующие начальные условия, поскольку из-за ре- верса времени конечные значения импульсной переход- ной функции исходной системы становятся ее начальными значениями. Это можно осуществить либо включением соответствующих форсирующих звеньев, либо включением инверсных звеньев в промежуточные связи исходной си- стемы, что для системы высокого порядка усложняет схе- му моделирования.
186 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 Рис. 4.6. а) S) Рис. 4.7.
f В] МЕТОД МОДЕЛИРОВАНИЯ 187 Кроме того, введение в устойчивую исходную систему переменной т делает систему неустойчивой, так как коэф- фициенты при нечетных производных изменяют знаки. Рис. 4.8. Положение ключей запоминающих устройств запись воспроизведение Рис. 4.9. По этой же причине в исходной системе невозможно при- менять в качестве составного элемента системы реальный регулятор. Поэтому во многих случаях целесообразно
188 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 применять запоминающие устройства (ЗУ). При этом мо- делирование производится в два этапа. При первом вклю- чении модели определяются функции Hi и Я2, которые поступают на запоминающие устройства. При втором включении сигналы из запоминающих устройств с ревер- сом времени подаются на исходные системы w и щтр, для которых теперь нет необходимости вводить новую переменную т. Соответствующая схема моделирования показана на рис. 4.9. При таком способе моделирования и надлежащей на- стройке исходной системы можно применять реальный линейный регулятор, который при первом включении вместе с остальной частью схемы используется для опре- деления функций Hi и Я2, а при втором включении — для определения дисперсии. На вопросах выбора первоначальной схемы подлежа- щего настройке фильтра мы останавливаться не будем; это уже более узкая и конкретная задача синтеза схемы. Заметим только, что чисто логические соображения под- сказывают методику построения этой схемы путем присое- динения к фильтру щтр, обеспечивающему требуемое преобразование полезного сигнала, сглаживающих цепей типа инерционных звеньев, поскольку обычно спектр помехи находится в области более высоких частот, чем спектр полезного сигнала. §17. Линейная фильтрация на ограниченном интервале времени с равной нулю динамической ошибкой Рассмотренная выше задача линейной фильтрации в ее классической форме имеет ряд ограничений, сужающих возможности ее практической реализации. По этой причине исследователи шаг за шагом расши- ряли постановку задачи, приближая ее к запросам прак- тики как в области систем автоматического управления, так и в других областях техники. В настоящее время имеется довольно значительное число разновидностей задачи линейной фильтрации в смысле Колмогорова — Винера. Ниже мы рассмотрим типичный пример из этой области, иллюстрирующий возможности обобщений.
S 17] ФИЛЬТРАЦИЯ НА ОГРАНИЧЕННОМ ИНТЕРВАЛЕ 189 На практике возникает необходимость построения оп- тимальной системы (фильтра), находящейся под воздей- ствием не только случайных процессов, но и детерминиро- ванных процессов в виде заданных функций времени. При этом время наблюдения всех прошлых значений входных величин оказывается ограниченным некоторым заданным интервалом. Рассмотрим постановку задачи линейной фильтрации на ограниченном интервале времени по критерию мини- мума средней квадратической ошибки и с равной нулю динамической ошибкой [19]. 1. Заданы взаимно не коррелированные случайные процессы s (£) и п (t) с корреляционными функциями Л, (*i, Q = Af[s (fj) s (f2)], (4.45) /cn (*i, Q = M In (tj) n (i2)]. (4.45') 2. Задана известная функция времени в виде Р (О = ci Л (0 + с2 /2 (0 + •• + /п (0> (4.46) где коэффициенты сх, с2, ..., сп заранее не известны, но фиксированы, а функции h (f), f2 (t), ..., fn (t) заданы. 3. Задана линейная система с импульсной переходной функцией штр (i, £), обеспечивающая необходимое линей- ное преобразование полезного входного сигнала п u(t) = s(O+ 3 Cltfk(t) (4.47) fc=i в некоторую функцию х (£), равную СО X (0 = J w-гр («, £) и (|) dl. (4.48) о 4. Требуется найти импульсную переходную функцию Щэпт (t, I) фильтра, оптимальным образом выделяющего выходной сигнал х0 (£), состоящий из детерминированной и случайной составляющих, в условиях, когда на его вход поступает аддитивная смесь сигналов z (t) = и (t) + п (t) (4.49) и время их наблюдения ограничено интервалом Т.
190 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 5. Критерием оптимальности является минимум сред- ней квадратической ошибки М [е2 (£)], где е (t) = х (t) — х0 (t), (4.50) и равенство нулю динамической ошибки ед (/), равной то т 8д (0 = J wTp (t, g) F (|) сП- - J w (t, |) F (|) dl. (4.51) о 0 Структурная схема фильтрации показана на рис. 4.10. Рассмотрим решение поставленной задачи. Используя выражение для ошибки (4.50) и учитывая на основании структурной схемы, что т х0 (t) = j w (t, и) z (и) du, о можем записать т е (t) = х (t) — \ w (i, и) z (и) du. о Возводя левую и правую части этого соотношения в квад- рат и выполняя операцию определения математического ожидания над случайными функциями, получим т М [е2 (/)] = М [х2 (/)] — 2 J w (t, и) М [a; (t) z (w)] du ф- o т т + f j w(t, u)w(t, s)M[z(u) z(s)]duds. о о
§ 17 ФИЛЬТРАЦИЯ НА ОГРАНИЧЕННОМ ИНТЕРВАЛЕ 191 Введем обозначения dx (0 = м № (0L М [ж (О Z (н)1 = kXz (t. и), (4.52) М [z (и) z (s)I = kz (и, s), (4.52') где два последних выражения являются соответствующими ко । реляционными функциями. Будем иметь т М [е1 /)] = Dx (t) — 2 J w (t, и) kxz (t, u) du + 0 T T 4- J J w (t, u) w (t, s) kz (u, s) du ds. (4.53) о 6 Условие равенства нулю динамической ошибки приводит на о новании (4.51) и (4.46) к соотношению оо Т J w(t, |)Ц©^ = 0, 1 = 1,2,..., п. о о (4.54) Цельнейшая задача заключается в том, чтобы подобрать та- ее значение импульсной переходной функции w (t, Е) = = аг£зт (i, £), при котором значение средней квадратиче- ский ошибки М [е2 (<)] будет минимальным и одновременно будут выполняться условия (4.54). Это типичная задача вариационного исчисления на условный экстремум. Схема ее решения состоит в следующем. Если задана некоторая функция V (ш) с ограничивающими условиями <р4 (1) = О, 1 = 1.2, ..., п, то составляется новая функция п Fx(w) = V(w)-2 2М(О<Рг(О» 1—1 где л, (i) — функции, называемые множителями Лаг- ранжа. Давая функции (ш) вариацию yw, определяем ус- лсвиб экстремума выражением ЭЕ1 (тМ I = q Эт к=о ’ причем вид экстремума (максимум или минимум)
1У2 фильтр Колмогорова — Винера [ГЛ. 4 определяется дополнительно, часто из физических усло- вий задачи. В нашем случае имеем V (w) = М [е2 (£)], 00 Т <Pi (0 = j’ wTp (t, I) © dt - J W (t, g) A © Л = o. о 0 Используя выражения (4.53) и (4.54), составляем функцию (ш): т (w) = Dx (t) — 2 J w (t, u) kxz (t, u) du ф- о T T (* J w (t, u) w (t, s) kz (u, s) du ds — 6 о П оо т -22м (0 [f «'тр (*. B) fi © dl - J w (t, B) /i © d|] • Пусть вариация функции w (t, и) имеет вид w (t, и) — wWT (t, и) + yh (t, u), где h (t, u) — не равная нулю функция. Подставляя ее в выражение для У, (w), получим т Vi (Т^) = Dx (t) — 2 J шОпт(^ и) кхг (t, и) du + о т т + J J w’outGj «) ?/,опт(^>») кг (и, s) du ds — о о П оо Т - 2 2 м (0 [ J ^тр («г В) A (I) dl - J iponT(i, О А (В) d|] - т т т — 2у §h(t, u)kxz(t, и)du -f- 2yaf J^(f, u)h(t, s)kz(u, s)duds+ 0 0 0 г T + 2y J J h (t, u) wonT(t, s) kz (u, s) du ds — о о n г -2т 2 M(0 J h(t,l)fdl)dl. i=i о
5 TI ФИЛЬТРАЦИЯ НА ОГРАНИЧЕННОМ ИНТЕРВАЛЕ ЮЗ Мы видим, что первые четыре члена не зависят от у и при выполнении операции взятия производной по у дадут нуль. Таким образом, будем иметь о т т 4- j j h (t, u)h(t, s) kz(u, s) du ds 4- 0 0 |T T 2 j J h (t, u) wonT(t, s) kz (u, s) du ds — о 0 n т -2 S М0Уми)А®<& i=i 0 Положив у равным нулю и приравняв затем нулю полу- ченное уравнение, будем иметь т j h (t, и) kxz (t, и) du — т т п т — J Jh (i, и) wom(t, s) kz(и, s)duds 4- 2 (0 j MA u) A 0 0 i=l 0 где в последнем интеграле переменная интегрирования Е заменена на и. Запишем это уравнение в следующей форме: т т j h (t, и) Гkxz (t, u) — j ш0ПТ(А s) kz (u, s) ds 4- 0 L 0 71 4- 2 (0 A (H)J = О- Очевидно, этот интеграл может быть равен нулю на ин- тервале 0 < и < Т при условии равенства нулю выраже- ния, стоящего в квадратных скобках (так как по условию h (t, и) =/= 0). Таким образом, получим Т п k„(t,u) — J wom(t,s)kz(u, s)ds+ 2 M0A (u) = °> (4-55) 0 i=l 0 < и < T. 7 А. В. Солодов
ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА ТТЛ. 4 Полученное уравнение обеспечивает экстремум функции V (w) = М [е2 (£)]. Можно было бы показать, что этим экстремумом будет минимум. Однако это следует и из фи- зической постановки задачи. Достаточность условия (4.55) легко доказывается подстановкой в уравнение для функции V (w) любого другого значения импульсной переходной функции. Определим значения входящих в уравнение (4.55) корреляционных функций к , (t, и) и kz (и, s). Используя формулу (4.52) и значения х (£) из (4.48) и z (i) из (4.49) с учетом соотношения (4.47). получим оо kxz(t, и) = М{J wTp (t, I) [s ix) + 0 n n + 2 сйА©] «г [*(“) + 2 + »(«)]} ft=l S=1 Поскольку случайные функции s (f) и n (t) по условию взаимно не коррелированы и являются центрированными, будем иметь М [8 (и и (g)] = О, м [S (01 = о, м (п (01 = о. (4.56) Производя в полученном выражении перемножение чле- нов, выполняя операции определения математического ожидания и учитывая формулы (4.45), (4.45'), (4.56), бу- дем иметь оо kxz (0 “) = J wTp (t, I) kt (I, u) ig 4- 0 П П oo + 22 («) J “’tp (о dmd<%. fc=l 3=1 0 (4.57) Используя, далее, формулу (4.52) и подставляя в нее
S 17] ФИЛЬТРАЦИЯ НА ОГРАНИЧЕННОМ ИНТЕРВАЛЕ 195 значение z (f) из соотношений (4.49) и (4.47), получим п К (и, 5) = М {[s (и) + 2 ckfk (и) + «(w)] х п X [s © + 2 Cjfj (g) + n (£)]} = M [s (u) s (1)1 + n n + M ln(u)n(l)] + 2 2 + k=i ?=1 71 71 + M [s (u) 2 *i/i©] + M [s © 2 + 2M [S(U>©1+ i=l k=l 71 n + м[п (и) 2 cifi ©] + M [n (g) 2 CidMw)] 7=1 fc=l На основании соотношений (4.56) последние пять членов этого выражения будут равны нулю, и с учетом формул (4.45), (4.45') мы получим: 71 71 kz (и Л) = к, (и, £) + кп (и, В) + 2 2 ckcifk(м) fi ©• С1-58) /г=1 7=1 По формулам (4.57) и (4.58) можно вычислить входящие в уравнение для оптимальной импульсной переходной функции корреляционные функции кхг и kz. Однако удоб- нее получить уравнение, непосредственно содержащее заданные значения ks, кп, ск и fk (<). Для этой цели произ- ведем подстановку корреляционных функций из формул (4.57) и (4.58) в уравнение (4.55). Будем иметь ОО 71 71 оо [ Шгр (t, |) к, (I, u)d^+ 2 2 Vi/i (u) J wip («, В) /Ь(В) + 6 fc=l i—l 6 n T + 2 (О Л («) - J «W (+ I) [ks (и, I) + kn (u, £)J dl - 7=1 6 n n T — 2 2 Vj/fcC^) J wom(t, Z)fj(l)dl = 0. fc=l 7=1 о Согласно условию (4.54) сумма второго и пятого членов этого уравнения равна нулю. Следовательно, окончательно 7*
196 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 получим оо п J wTp (t, I) ks (g, и) 4- 3 U (0 Zi (u) = о i=l ,T = J ^OIIT (U)fc s+n (4.59) 0 где ks+n £) = ks (u, I) + kn (и, I). В общем виде реппль зто интегральное уравнение нельзя. Решение отыскю-ртся для некоторых частных случаев и упрощающих пу дположений. Для упрощенЕ.- сведем задачу решения сложного ин- тегрального уравнгаия (4.59) к задаче решения более про- стых интегральных уравнений. Для этой цели введем новые функции (i) и v (i), удовлетворяющие следующим ин- тегральным урав--лиям: г Д(н) = р^.(нЛ)М1Ж i = (4.60) 6 оо Т \гстр(1, с 5, u)dl = J/cs+n(u, £)ф(£, %)d%. (4.61) 6 о Подставляя эти >ажеппя в уравнение (4.59), получим т п т ks+n (и, Н) ф (I, с '; 4- 2 (0 j (w’ 5) (£) di = о i=i о — \ 4’s+n(u, ^)^>011Т(/, В) 6 или Т п J 4’s+n (u, I) [ф ([ ; + 2 ^'i(0'^i(5) — ^опт (tl £)| = 0. О 1=1 Так как корре.тяьионная функция ks+n (и, g) не равна нулю везде на пн'Ервале интегрирования, будем иметь п Ф (t, I - 2 (0® = «опт?) (4.62)
§ 171 ФИЛЬТРАЦИЯ НА ОГРАНИЧЕННОМ ИНТЕРВАЛЕ 197 Для нахождения множителей (I) подставим найденное значение импульсной переходной функции шопт (£, Е) в равенство (4.54). При этом получим оо Т П J И-тр (t, I) fk © dl - J [ф (t, |) 4- 2 h (0 (?)] A- © dl = 0. о 0 i=l (4.63) В соотношении (4.63) все функции, кроме (f), известны [мы полагаем, что в результате решения интегральных уравнений (4.60) и (4.61) найдены функции ф (£, Е) и (£)]. В этом случае можно ввести обозначения для известных интегралов оо т ,[ «Ъ» (t, Е) А (?) Й? - f Ф (0 ?) А (?) dl = ак (t), (4.64) о 6 т U(?)A(?)< = M0, (4.65) 6 и соотношение (4.63) примет вид следующей системы алге- браических уравнений: МО = 2 МОМО- к = 4, 2, ..., п. i=i Запишем их в развернутой форме: ai (0 = Мй1 (0 4' М-Чг (04* 4 Мйп(0- а2 (0 = ^1^21 (0 4* ^2^22 (0 4" ••• 4- М’2п(0- (4 66) МО == М’пЛО 4- ^2^2(0 4* 4* ^n^nn(0- Для решения системы уравнений (4.66) введем матрицу 01 (0 Аг (0 Ь1П 0) Ai (0 Аг (0 • Ап (0 _А1(0 М(0 • • Ап(0_ (4-67)
198 ФИЛЬТР КОЛМОГОРОВА — ВИНЕРА [ГЛ. 4 и векторы А(о = -Л1 ([)- МО (4.68) Тогда систему уравнений (4.66) можно записать в виде А (0 = В (t)K (0, откуда получим л (i) = в-1 (0 А (0. (4.69) Если теперь в- стп вектор-строку 6Т =КМЮ О2 (I) - (1)1, как транспони ванное значение вектора-столбца 1А«). то сумму в формуле (4.62) можно представить в виде Z MB)M0 = 6W(0- С учетом всех пп ученных матричных выражений формула для определения птимальной импульсной переходной функции (4.62 примет следующий окончательный вид: Uta (0 Е = Ф (0 I) + ег (I) 1Я”1 (0 А (01. (4.71) Таково обшее решение поставленной задачи. Ряд ча- стных решений поведенных до конечных результатов, рассмотрен в реб гах советских и зарубежных авторов и представляет, в основном, прикладной интерес.
ГЛАВА S ФИЛЬТР КАЛМАНА — БЬЮСИ § 18. Задача оценки состояния объекта управления при наличии случайных воздействий При построении систем управления в ряде случаев возникает задача учета влияния возмущающих воздей- ствий, имеющих случайный характер. Эти воздействия поступают как на объект управления, так и на измеритель, преобразующий переменные состояния объекта в выход- ные величины. Попятно, что точки приложения случай- ных воздействий в общем случае не совпадают со входами Рис. 5.1. п выходами системы. Схематически описанная картина показана на рис. 5.1. Напомним, что линейная динамическая система опи- сывается системой векторно-матрпчных уравнений: ^- = F(t)X(t) + G(t)U(t), Y (t) = Н (t) X (t), где X (i) — вектор состояния системы; U (t) — вектор входных воздействий; Y (/) — вектор выходных величин; матрицы F (t), G (t) и Н(/) характеризуют параметры си- стемы. В силу линейности системы аналогичным образом можно записать систему уравнений для случайных
200 Si ТЬТГ ’ VIMAHA — БЬЮСИ I Г.П Г, возмущены е: 'уде" четь вид — = л ' X(t) + B(t)W(t), Z = с х (?) + v (t). Здесь X [Д — г-.ктор со< ,яния объекта; W (?) и V (?) — векторы сзуч ±ных воздействий; Z (?) — вектор выход- ных велич к*- 0 — матрица размера п X п, характе- ризующая дг-рм*етры 'ьекта; В (t) — матрица размера Рис. 5.2. п X т, и; зукшая входные воздействия; С (?) — мат- рица раз т’ т п. характеризующая параметры изме- рителя. Структурная схема, соответствующая системе уравнений ’ ' . показана на рис. 5.2. Для езкя задачи управления объектом необхо- димо. как 'ни - казано во 2-й главе, обеспечить такую структур. ;-"з. прЕ которой выполняются условия управляе хтп Если вектор случайных воздействий W (t) иг " ль возмущения, помехи, то идеальным было бы тез; ' -езенп . зри котором объект был бы пол- ностью н тп' Бля.мыл ло этому возмущению. Это изве- стная зал.ч щ-гтроенм инвариантных к возмущениям систем, и мы ее здесь каслться не будем. Если же вектор случайных е ад йствий W (?) является возбуждающим фактором леей, чива- шпм формирование вектора со- стояния X • к.- случайной вектор-функции с заданными характеряттдтзмЕ. то условие управляемости объекта (играющее : в »м случэе роль формирующего фильтра) необходим дальнешпем именно эту задачу мы и будем рассматрг? "ь.
§ 18] ОЦЕНКА СОСТОЯНИЯ ОБЪЕКТА УПРАВЛЕНИЯ 201 Задача измерения состояния объекта состоит в нахож- дении значений вектора X (t) по значениям вектора вы- ходных величин Y (Z). Как было показано во 2-й главе, это задача о наблюдаемости объекта управления. Однако в том случае, когда на измеритель совместно со значения- ми вектора состояния поступают случайные помехи в виде вектора V (£), даже при условии полностью наблюдаемого объекта невозможно точно определить вектор состояний X (t). Самое большее, что можно при этом сделать, это получить подходящую оценку вектора X (t) в виде неко- торого вектора Хо (t), воспроизводящего X (<) с опре- деленной точностью. Вектор ошибки будет равен или Хе (i) = х (О-хо (О, Е1(1) 62 («) _Еп(0_ (5.2) (5.3) где ег (£) = Xi (i) — xi0 (i), i = 1, 2, ..., n. Транспони- руем вектор Xz (/.) xT (0 = К («) e2 (i) ... en (£)1 и умножим его справа на вектор Xt (t). В соответствии с правилом умножения матриц получим хГ (0 ХЕ (0 = 8? (/) + в2 (0 + ... (0. (5.4) Если транспонированный вектор умножить на Хе (£) слева, будем иметь е?(0 e1(t)e2(t)...e1(t)en(t)- V zaytT,.. MOM*) e*(t) .. . e2(t)en(t) AC (t)Ae \l) — . . . -MOMO en(f)e2(l) ... (t) _ Математическое ожидание этого выражения представляет собой матрицу корреляционных функций при одинако- вых значениях аргументов [см. формулу (3.84)], т. е. матрицу дисперсий. Следом матрицы (обозначается Тг) называется сумма ее элементов по главной диагонали. Таким образом, сравни-
202 ФИЛЬТР НАЛМАНА — БЬЮСИ [ГЛ. 5 вал главную диагональ полученной матрицы с выраже- нием (5.4). можем записать (0 Х£ (/) = Тг [Хг (Z) Xf (/)]. (5.5) Если определить математическое ожидание случайной функции (5.4), мы получим среднее значение суммы квад- ратов ошибок п М [ХЕТ (/) ХЕ (t)] = М 2 4 (0. (5.6) *i=l Введем теперь в n-мерном пространстве состояний скаляр- ное произведение следующего вида: <Х,Х> = M(XTY). (5.7) Легко проверить, что это выражение удовлетворяет всем аксиомам скалярного произведения (определение 2.4 *)). Введение скалярного произведения делает простран- ство состояний гильбертовым, и его метрика будет равна [см. формулу (2.13)] II X || 2 = М (ХТХ) = Тг [М (ХХТ)]. (5.8) Сравнивая выражения (5.6) и (5.8), получим п II ХЕ ||2 = 71/24(0. (5.9) 1=1 Таким образом, случайные процессы в виде вектор-функ- ций X (Z), Хо (/), ХЕ (/) рассматриваются как множество векторов в гг-мерном гильбертовом пространстве. Если в качестве критерия точности оценки вектора состояния принять минимум среднего значения суммы квадратов ошибок, задача сводится к минимизации нормы вектора ХЕ. Так как слагаемыми в формуле (5.9) являются составляющие вектора ХЕ по осям базиса, минимизация его нормы есть одновременно и минимизация каждой из его составляющих (рис. 5.3). *) При этом предполагается, что перестановка векторов X и У в формуле (5.7) не меняет места знака транспонирования, т. е. I <У, Х> = М (YTX).
§ 18] ОЦЕНКА СОСТОЯНИЯ ОБЪЕКТА УПРАВЛЕНИЯ 203 Эта операция осуществляется с помощью линейного фильтра, параметры которого должны быть выбраны та- ким образом, чтобы обеспечить минимум нормы вектора ошибки. Пусть матрица импульсных переходных функций фильтра есть L (t, s). Тогда вектор оценки определится формулой Рис. 5.3. Хо (/) — j L(t, s)Z (s) ds, to (5.10) где выходной вектор объ- екта Z (t) согласно соотно- шению (5.1) запишется в виде Z(/) = F(/) + F(Z), 1 У (<)=C(0X(i). J (5.11) Структурная схема фильтрации изображена на рис. 5.4. Рассмотрим геометрическую интерпретацию процесса фильтрации. При отсутствии помехи V (Z) и при условии полной наблюдаемости системы каждому вектору оценки -У о (/) можно поставить в соответствие единственный Рпс. 5.4. вектор состояния X (t), поскольку фильтр в виде ли- нейного усилителя с матрицей С-1 (/) будет осуществ- лять преобразование вектора Y (/) в вектор X (t). При наличии случайной помехи V (Z) каждому вектору оценки Хо (/) уже нельзя поставить в соответствие един- ственный вектор X (/), поскольку будет иметься некоторая неопределенность, обусловленная действием помехи. Геометрически описанную ситуацию можно предста- вить как наличие для данного вектора оценки X0(t)
204 ФИЛЬТР КАЛМАНА — ПЬТОСП [ГЛ. 5 некоторого «пучка» векторов X (Z), плотность которого бу- дет отражать вероятностную связь между векторами Хо и X (рис. 5.5). Таким образом, в пространстве состояний X суще- ствует некоторое Рпс. 5.5. подмножество векторов Хо, являю- щихся оценками векторов X при наличии случайных помех. Расстоя- ние между концами векторов А" и А"о есть норма (длина) вектора ошиб- ки X е. Теперь можно дать геометри- ческую трактовку процесса фильтра- ции. На рис. 5.6 показана двумерная модель этого процесса. Вектор состояния системы X (/) преобразуется с помощью матрицы С (t) в выходной вектор X (Z), кото- рый суммируется с вектором помехи V (t). Положение и величина этого вектора при данной конкретной ре- X (Z) случайны, поэтому суммарный век- ализации сигнала тор И (Z) находится в некотором «конусе неопределенности». Рис. 5.6. Линейный фпльтр с матрицей импульсных переходных функ- ций L (Z, s), обладая определенными избирательными свой- ствами, выбирает из множества векторов Z (Z) такой, ко- торый после его преобразования дает вектор оценки Хо (Z). При этом крптерием выбора является минимальное рас-
§ 19] УРАВНЕНИЕ ВИПЕРА — ХОПФА 2().‘> стояние между концами векторов JV (Z) и JT0 (Z), что соот- ветствует минимуму нормы ошибки ХЕ (Z). Целью даль- нейшего рассмотрения и является построение такого опти- мального фильтра. § 19. Ортогональные проекции в линейных пространствах и векторно-матричное уравнение Винера — Хопфа Построение оптимального фильтра Колмогорова — Винера, рассмотренное в 4-й главе, заключалось в опре- делении импульсной переходной функции как решения интегрального уравнения Випера — Хопфа. Последнее было получено в результате решения вариационной зада- чи на минимум функционала, определяющего значение средней квадратической ошибки. Другой, более общий, подход к нахождению уравне- ния Випера — Хопфа, пригодный для векторных пред- ставлений процессов в линейной системе, опирается на геометрический метод, развитый в работах А. Н. Колмо- горова [13, 14]. В частности, для минимизации выраже- ния (5.6) используются свойства ортогональных проекций векторов в линейных пространствах. Рассмотрим линейное n-мерное полное пространство X, у которого скалярное произведение (.X, Y} опреде- лено для любых двух элементов X и Y. Такое простран- ство будет гильбертовым, а его норма определится соотно- шением цхц = /<х7х>. Одним из важнейших свойств гильбертовых пространств является возможность проектирования вектора на два подпространства, взаимно ортогональные друг другу. Не приводя строгих доказательств, рассмотрим такое пред- ставление на примере трехмерного евклидова простран- ства. Пусть в трехмерном пространстве имеется произволь- ный вектор X с проекциями на оси координат хг, х2, х3. Рассмотрим проекции этого вектора на взаимно перпенди- кулярные плоскости хг, 0, х2; хъ 0, х3, х2, 0, х3 (рис. 5.7) и обозначим их соответственно Ха, Хь, Хс. Легко видеть, что при любом положении вектора X его проекция на ось х2 всегда ортогональна (перпендикулярна) всем
20Г» ФИЛЬТР КАЛМАНА - БЫОС.П |ГЛ. 5 векторам Хь. То же самое можно сказать и о проекциях на оси х1 и х3 и векторах Хс и Ха соответственно. Поскольку плоскость в трехмерном пространстве обра- зуется подмножеством всех лежащих в ней векторов, а пер- пендикулярная ей ось содержит подмножество всех орто- гональных к плоскости векторов, мы можем утверждать, ренпой выше, равенство (5.12) для любых L и Lort. что справедливо равен- ство Е3 = L © Zort- (5.12) Здесь L и Zort — рас- смотренные подмноже- ства, а знак © обозна- чает прямую сумму про- странств. Так как в трехмер- ном пространстве мож- но построить бесчислен- ное множество ортого- , пальных систем коорди- нат, подобных рассмот- является справедливым Обобщая полученный результат на гильбертово про- странство любой размерности, можно сформулировать сле- дующую теорему: Пусть задано гильбертово пространство Н. Выделим в этом пространстве некоторое подмножество векторов (подпространство) М. Тогда любой вектор X, не принадлежащий подмножеству М, представляется единственным образом в виде -Г = Гор + Гоп, где вектор Гоп принадлежит подмножеству М, а вектор Гор ортогонален ко всем векторам Г подмножества М, <Гор, Г> = О, т. е. скалярное произведение Гор и Г равно нулю. Вектор Гоп, обладающий указанными свойствами, называется ортогональной проекцией вектора X на подпростран- ство М.
S 19] УРАВНЕНИЕ ВИНЕРА — ХОПФА 207 На рис. 5.8 в качестве иллюстрации изображено трех- мерное пространство X и двумерное подпространст- во М (оно заштриховано) с ортогональной проекцией 'X'оп в нем. Рассмотрим теперь следующую задачу. Пусть в про- странстве X имеется разность векторов X — У, причем вектор У принадлежит подпространству М. Необходимо Рис. 5.9. найти такой вектор Ym, который бы минимизировал нор- му || X — Y || относительно любого другого вектора У, принадлежащего М. Если изобразить разностный вектор X — Y в трехмерном пространстве, то легко видеть, что он будет иметь минимальную длину при заданном X в том случае, когда будет ортогонален (в нашем примере пер- пендикулярен) плоскости М (рис. 5.9). При этом вектор Ут будет ортогональной проекцией вектора X на подпро- странство (плоскость) М. Сформулируем рассмотренное предложение строго. Норма || X — Y т || минимальна для всех Y, принад- лежащих подпространству М тогда и только тогда, когда Yт является ортогональной проекцией X на М, т. е. тогда, когда Ym = Топ и X—Уоп ортогонален ко всем У, принадлежащим М: р'-У0П||<||Х-У|| для всех УеЛ/, (5.13) <(Х — Уоп), У> = о для всех У £ М. (5.13')
208 ФИЛЬТР КАЛМАНА - БЬЮСИ [ГЛ. 5 Доказательство этой леммы заключается в следующем. Пусть условие (5.13) выполняется. Запишем следующую цепочку преобразований: IIX - Y р = || (X - Гоп) + (Fon — Г) р = = || X - Гоп р + 2 <(Х - Гоп), (Гоп - Г)> + || Гоп - Y p, причем среднее слагаемое получено на основании формул (2.11) и (2.12). Так как разность векторов Гоп — Y принадлежит под- пространству М в силу того, что Гоп является ортого- нальной проекцией на М, на основании (5.13') будем иметь <(Х-Г0„), (Гои-Г)> = 0. Таким образом. ||Х - Г Р = ||Х - Гопр + ||ГОП - Y р. Следовательно, ||Х-Г||>||Х-ГОП||, что и требовалось доказать. Очевидно, равенство будет лишь тогда, когда Y = Топ- Предположим теперь, что условие (5.13') не выполняется. Это означает, что найдет- ся такой вектор Г, из подпространства М, при котором скалярное произведение отлично от пуля: <(Х - Гоп), rL> = а =# о, а неравенство (5.13) остается в силе. Выберем в подпро- странстве М вектор Г такой, чтобы Г = Гоп -J- bYх. Тог- да можно записать X - Г р = || X - Гоп - bY, р = = II X - Гоп Р + *>2IIГ, Р - 2Ъ <(Х - Гоп), Гх>, или, учитывая значение скалярного произведения, IIX - Гоп Р = IIX - г р - || Г, Р + 2аЬ. Легко видеть, что надлежащим выбором значения b (т. е. выбором вектора Г) всегда можно сделать правую часть этого равенства меньше левой, а это противоречит условию минимизации нормы (5.J3). ТТа этом доказатель- ство леммы завершается.
§ 19] УРАВНЕНИЕ ВИНЕРА — ХОПФА 209 Лемма об ортогональных проекциях широко приме- няется в задачах, где требуется найти условия миними- зации нормы вектора. В частности, с помощью этой лем- мы можно найти условия минимизации нормы вектора ошибки фильтрации. Итак, мы имеем (Z) = X (Z) - Хо (Z), (5.14) где Xt (Z) — вектор ошибки фильтрации; X (z) — вектор состояния объекта; Ar0 (Z) — оценка вектора состояния, получаемая с помощью оптимального фильтра в соответ- ствии с формулой I Хо (/) = j L (Z, s) Z (s) ds, (5.15) to где L (Z, s) — матрица импульсных переходных функций фильтра. Введение в пространстве состояний скалярного произ- ведения (5.7) <-Y, F> = М (XTY) (5.16) позволило получить выражение для нормы вектора ошиб- ки в виде п 1=1 Следовательно, минимизация векторной суммы средних квадратических ошибок фильтрации есть минимизация нормы вектора (Z). Рассмотрим, далее, суммарный выходной вектор Z (Z). Он равен Z (Z) = C(t)X (Z) + V (Z) и является линейным преобразованием вектора состояний с помощью матрицы С (Z) размера р х п. Следовательно, множество векторов Z (Z) образует линейное подпростран- ство Z пространства состояний X. Теперь, применяя лемму об ортогональных проекциях, мы можем сформулировать условие минимизации нормы вектора ошибки. Для того чтобы норма вектора ошибки ||Х (Z) — Хо (z)|l была минимальной, необходимо и достаточно, чтобы
210 ФИЛЬТР КАЛМАНА — БЬЮСИ [ГЛ. S вектор Хо (fl был ортогональной проекцией вектора X (t) на подпространство Z, или, что то же самое, чтобы вектор X (t) — XQ (£) = X е (fl был ортогонален ко всем векто- рам Z (fl CZ Z. На рис. 5.10 схематически показано это Рис. 5.10. условие. В соответствии с формулой (5.13') и учитывая равенство (5.16), можем записать условие минимума нормы ошибки в виде <XE(fl,Z (zfl> = = M[Xl (f)Z (И)], (5.17) где переменная и в соответст- вии с пределами интегрирова- ния в выражении (5.15) лежит на отрезке [£0, fl. Раскрывая произведение век- торов под знаком математического ожидания, получим Z1 (и) Xl(t)Z(u) = [ei(fle2(fl ... s„(fl] — (0^1 00 ^2 (0^2 00 “Ь • • • Н~ (0^71 (*0* (5.18) С другой стороны, произведение X е (fl ZT (iz), даст мат- рицу размера п X п в виде pi (О'] (t)ZT (и) = [z1(u)z2(u)... zn(ifl] = ei (0 zi (и) е2 (fl Zj (и) e„(fl zi(“) 81 (fl z2 (и) . . . 8t (fl Z?j (u) e2 (fl z2 (u) ... e2 (fl zn (u) e„(fl z2 (“)••• e„(fl zn(u) (5.19) Сравнивая выражения (5.18) и (5.19). видим, что пер- вое представляет собой след матрицы (5.19). Если опреде- лить математическое ожидание матрицы (5.19) и затем
УРАВНЕНИЕ ВИНЕРА ХОПФА 211 S 19] приравнять полученное соотношение нулю, то тем самым будет равно нулю и математическое ожидание следа мат- рицы. На основании сказанного можно записать: если М \X^t)ZT (И)] = 0, то М |ХЕ7’ (t)Z (и)] = 0. Тогда выражение (5.17) можно заменить другим, также обеспечивающим минимум нормы вектора ошибки, а имен- но: М[Х е (t)ZT (и)] = 0. Подставляя в это равенство последовательно соотношения (5.14) и (5.15), получим t М [X (t) ZT (zi)] = J L (t, s) M [Z (s)ZT (zz)J ds, /о где операция математического ожидания под знаком пн- теграла накладывается только на случайные функции Z (s) и ZT (и). Введем обозначения Kxz(t,u) = M[X(t)ZT (и)\,\ т1 । (o.ZjU) Kz (s, и) = М \Z (s) ZT (u)]; J здесь Kxz (t, и) является корреляционной матрицей век- тора состояний и вектора полного выходного сигнала, а Kz ($, и) — корреляционной матрицей вектора полного выходного сигнала. С использованием введенных обозначений окончатель- но будем иметь z Kxz(t, и) = J L(t, s)Kz(s, и)ds, t0^s^t. (5.21) to Полученное векторно-матричное интегральное уравнение называется уравнением Винера — Хопфа и для одно- мерного случая совпадает с подобным уравнением в те- ории фильтров Колмогорова — Винера. Матрица импульсных переходных функций L (t, s), удовлетворяющая этому уравнению, минимизирует нор- му вектора ошибки фильтрации. Она должна также
212 ФИЛЬТР КАЛМАНА — Г.Ы0С.И 1ГЛ. 5 удовлетворять условию физической реализуемости фильтра L (t, s) = 0 для t <s. Теперь можно приступить к изложению основных по- ложений теории линейной фильтрации Калмана — Бьюси. § 20. Общая теория фильтра Калмана—Бьюси Рассмотрим постановку задачи и математические осно- вы построения линейных фильтров, известных под назва- нием фильтров Калмана — Бьюси по имени авторов разработки их теории [111. Достаточно строгое изложение теории потребовало бы привлечения понятия меры в пространстве и применения интегрирования в смысле Лебега. Мы поступим иначе и изложим общую теорию фильтра с использованием обычных средств анализа и те- ории матриц, полагая во всех необходимых случаях су- ществование интегралов и производных. Такой подход, конечно, снижает строгость изложения, однако делает его более доступным и закладывает методические основы для дальнейшего углубленного изучения теории. Фильтр Калмана — Бьюси отличается от фильтра Кол- могорова — Винера постановкой задачи и способом его описания. Поэтому эти два аспекта теории мы рассмотрим ниже более подробно. Постановка задачи фильтрации по Калману — Бьюси заключается в следующем. 1. Задано и-мерное гильбертово пространство со ска- лярным произведением любых двух его элементов в виде <Х, Г> = М (XTY) с нормой __________ 2. В этом пространстве задай подлежащий фильтра- ции линейный марковский случайный процесс, формируе- мый линейной динамической системой следующего вида: = Л (t)X (t) + В (t)W (/), (5.22) X(t0) -0. где A' (/) — задаваемый случайный процесс в виде п-мер-
§ 20] общая теория фильтра калмана — бьюси 213 него вектора; IF (Z) — случайный процесс в виде белого шума с корреляционной матрицей Kw (t, т) М [IF(Z)JFt(t)] = Q (Z)6 (« - т), (5.23) a Q (/) имеет вид диагональной матрицы (3.86) размера т х т. Матрицы A (t) и В (/) размера п х п и п X т соответ- ственно определяют параметры линейной системы. Линейную систему, формирующую рассматриваемый марковский случайный процесс, будем в дальнейшем име- новать формирующим фильтром. 3. Случайный процесс X (/) наблюдается с помощью измерителя, на выходе которого действует аддитивная по- меха в виде белого шума: Z (/) = С (t)X (Z) + F (/). (5.24) Здесь Z (/) — вектор суммарного выходного сигнала раз- мера р х 1; V (Z) — случайный процесс в виде белого шу- ма с корреляционной матрицей (Z, т) = М [Г(0Гг(т)| = R (Z)6 (t - т), (5.25) а 7? (/) имеет вид диагональной матрицы (3.86) размера р X р; С (t) — матрица коэффициентов измерителя раз- мера р X п. 4. Требуется построить линейную систему, оптималь- ным образом выделяющую реализации векторного слу- чайного процесса X (Z) в виде некоторой оценки A'o (t) при наблюдении процесса Z (/), т. е. оптимальный линей- ный фильтр. Критерием оптимальности является минимум квадрата нормы вектора ошибки ||.¥e(0p = min, (5.26) где Xe(t) = X(f)-X0(t). (5.27) 5. Имеют место следующие условия: а) Белые шумы, действующие на входе формирующего фильтра и на выходе измерителя, некоррелированы: М [W (Z) V г (т)] = 0; (5.28)
214 ФИЛЬТР КАЛМАНА — БЫОСП 1ГЛ. 5 б) Наблюдаемый процесс X (/) и белый шум V (/) не- коррелированы: М IX (Z)Fr(T)] = 0; (5.29) в) Формирующий фильтр удовлетворяет условиям фи- зической реализуемости: Ф (*. Q = 0 ПРИ t < t0, где Ф(1, t0)— переходная матрица формирующего фильтра. На рис. 5.11 изображена структурная схема формиро- вания суммарного выходного сигнала Z (Z) в условиях поставленной задачи. Рис. 5.11. Как видим, постановка задачи фильтрации по Нал- ману и Бьюси аналогична рассмотренной в § 18 задаче оценки состояния объекта управления, находящегося под воздействием случайных возмущений в виде белого шума. В отличие от задачи фильтрации по Колмогорову — Винеру, здесь рассматривается многомерный случайный процесс, задаваемый не корреляционными функциями, а стохастическим дифференциальным уравнением. Помимо этого, ставится задача отыскания способа построения оп- тимального фильтра, а не получение оптимальной им- пульсной переходной функции. В дальнейшем мы еще остановимся на особенностях рассматриваемого метода фильтрации. Перейдем к изложению теории построения фильтра Калмана — Бьюси. Пусть имеется некоторый физически реализуемый ли- нейный фильтр с матрицей импульсных переходных функ-
£ 20[ ОБЩАЯ ТЕОРИЯ ФИЛЬТРА КАЛМАНА — БЬЮСИ 215 ций L (t, s), такой, что его выходной сигнал является опти- мальной оценкой Хо (/) наблюдаемого процесса X (t). Тогда будем иметь t Хо (/) = J L(t, s)Z (s)ds, t„ (5.30) причем ||X(O-^o(O||=min, Xo(/o) = O. Как было показано в предыдущем параграфе, условие ми- нимума квадрата нормы вектора ошибки будет справедли- во тогда и только тогда, когда матрица импульсных пе- реходных функций L (t, s) удовлетворяет векторно-мат- ричному уравнению Винера — Хопфа t Kxz(t,u)~ § L(t,s)Kz(s,u)ds, (5.31) to где Kxz (t, и) = Mix (t)ZT (u)l, (5.32) Kz (s, и) = M \Z (s)ZT (u)] (5.33) являются соответствующими корреляционными функция- ми, определенными в § 19. Продифференцируем выражение (5.32) по t. Будем иметь ST = ^zT МП = M\dSzT Ml • Подставляя в это соотношение значение dX/dt из уравне- ния (5.22), получим = М [Л (/) X(0ZT (и) + B(t)W (0ZT (и)] или, учитывая, что операция определения математическо- го ожидания относится только к случайным функциям, = А (0• М [X (<) ZT (н)] + В (0• М [W (0 ZT (и)]. В соответствии с общим определением корреляционной матрицы [формула (3.84)] можем записать Kwz (t, и) = 71/ [Ж (t)ZT (и)], (5.34)
21G ФИЛЬТР КАЛМАНА — БЬЮСИ [ГЛ. 5 следовательно, используя выражение (5.32), получим dK = A (t) Кхг (t, и) + В (t) Kwz (t, и). (5.35) Рассмотрим выражение для корреляционной функции Kwz. Транспонируя вектор Z (и) с учетом уравнения (5.24), получим ZT (и) = [С (и) X (и) + V (и)}т = ХТ (и) СТ (и) + VT (и). (5.36) Подставляя это выражение в формулу (5.34), будем иметь Kwz (t, и) = М [IV (I) ХТ (и)] СТ (и) + М [W (Z) VT (и)] или, учитывая выражение (5.28), Kwz (Z, и) = М [W (О ХТ (И)] ст (и). (5.37) Как было показано в § 7, выходной сигнал формирующего фильтра определяется через переходную матрицу Ф (t, t0) следующим образом: t X (9 = Ф («, X) В (X) W (X) dl. to Транспонируя вектор X (Z) по правилу, приведенному в § 9, получим t Хт (t) = WT (X) Вт (X) Фг (t, X) dk. (5.38) Подставляя это значение в соотношение (5.37), будем иметь Kwz (t, и) = \ M.[W (t)WT (X)] Вт (X) Фг (и, X)Ст (и) dk Un или, учитывая формулу (5.23), окончательно *): Kwz(t, u) = ^Q (О Вт (X) Фг (и, X) Ст (и) 6 (t - X) dX. ио *) Заметим, что при операциях с произведениями матриц не- обходимо строго соблюдать последовательность их записи, так как операция умножения матриц некоммутативна. Скалярные же функ- ции переставлять в произведении можво.
11 Л НАДПИЛИЛ “ JJU1UUJA / Для значений переменной t внутри интервала (н0, и) спра- ведливо фильтрующее свойство дельта-функции, опреде- ляемое тождеством (2.556), однако для и < t интеграл будет равен нулю, так как в силу свойства дельта-функции (2.55а) подынтегральное выражение обращается в нуль. Таким образом, можем записать К z (t, и) = 0 для и t, и уравнение (5.35) примет вид = А (О Kxz (t,u), и Ct. (5.39) Вернемся к уравнению Винера — Хопфа. Дифферен- цируя его по Л будем иметь t L, (t, s) Kz (s, и) ds + L (t, t) Kz (t, u), (5.40) /с где Lt (t, s) = L (t, s). Рассмотрим выражение для корреляционной функции Kz. Подставляя в формулу (5.33) значение Z (Z) из (5.24), получим Kz (t, и)=М [С (t)X (Z) + V (и)} = = С (t)M [-¥ (Z) ZT (и)] + + М [F (О ХТ (и) СТ (и) + V (/) VT (и)]. Последнее слагаемое записано с учетом выражения для ZT (и) из формулы (5.36). Подставляя в это равенство значения М [X (t) ZT (и)], М [F (t)VT (и) и Хт (и) из формул (5.34), (5.25) и (5.38), будем иметь: (t, и) = С (t) Kxz (t, и) + * ' M [F (/) WT (X)] вт (X) Фт (и, X) CT (u) dl. t* Так как белые шумы F (Z) и W (t) некоррелированы [см. условие (5.28)]. подынтегральное выражение будет равно нулю, и мы получим К. (i, и) = С (t)Kxz (t, и). (5.41)
ФИЛЬТР КОЛМАНА — БЬЮСИ [i'J . 5 Теперь можно подставить в уравнение (5.40) значение производной К хг из соотношения (5.39) и значение K2(i, и) из (5.41). Будем иметь t A (Z) Kxz (t, и)'= Lt (i, s) Kz (s, u)ds + L (t, t) C (t) Kxz(t, u), to t>U. Подставим, далее, в это равенство значение Kxz из (5.31): t A (Q L (t, s) Kz (s, и) ds = to t t — Lt (t, s) Kz (s, u) ds 4- L(t, t) C (t) L (t, s) Kz (s, u) ds. to to Перенося влево все члены, объединяя их под знаком ин- теграла п группируя, получим t [A (t) L (t, s) — Lt (t, s) — L (t, t) C (t) L (t, $)] Kz (s, u) ds =0, to t U, to^S ^t. Так как корреляционная функция Kz (s, и) отлична от нуля для любых конечных s и и, интеграл может быть равен нулю лишь прп условии A (t)L (t, s) — Lt (t, s) — L (t, t) C (Z) L (t, s) = 0; to < « < t. Отсюда находим выражение для Lt (t, s): L't (t, s) = A (0 L (t, s) - L (t, t)C (t)L (t, s), (5.42) to s t. Рассмотрим формулу (5.30). Дифференцируя левую и правую части по t, получим t ^ = \L't (t, s) Z (s) dsA-L (t, t) Z (t). to Подставим в это равенство значение Lt (t, s) из (5.42). Бу-
§ 20] ОБЩАЯ ТЕОРИЯ ФИЛЬТРА КАЛМАНА — БЬЮСИ 219 дем иметь t [ A(t) L (t, s) —L(t, t) C (/) L (t, s)]Z(s)ds+L(Z, t)Z(t)^ to t = [ A (t) — L (t, t) C («)] L (t, s) Z (s) ds + L (t, t) Z (t). to Подставим, наконец, значение интеграла из формулы (5.30): = [Л (0 - L (t, t) С (01 хо (t) + L (t, t) Z (t). Вводя обозначение L (f, t) = К (f), (5.43) окончательно будем иметь = [Л (0 - К (0 С (<)] хо (0 + К (t) Z (/). (5.44) Полученное дифференциальное уравнение устанавливает связь между вектором оценки Хо и вектором суммарного Рис. 5.12. входного сигнала Z (t), следовательно, оно описывает ис- комый оптимальный фильтр. Это один из результатов теории фильтра Калмана — Бьюси. Структурная схема фильтра приведена на рис. 5.12. Важнейшей особенностью этой структурной схемы является то обстоятельство, что она подобна структурной схеме формирующего фильтра и отличается от последнего наличием матричного блока К (f) в прямой цепи передачи воздействий. Это существен- но облегчает практическую реализацию оптимального
220 ФИЛЬТР КАЛМАНА — БЬЮСИ [ГЛ. 5 фильтра и избавляет от необходимости синтезировать его структуру, что приходится делать при построении филь- тров Колмогорова — Винера. Полезно получить еще одно дифференциальное урав- нение для оптимального фильтра. Дифференцируя по времени соотношение (5.27), получим _ dX _ dXn dt dt dt и после подстановки производных из уравнений (5.22) и (5.44) — dX, = Л (0 X (Z) + в (Z) W (Z) - [Л (Z) - К (t) С (Z)] Х() (Z) - -K(Z)Z(Z). Подставляя в это уравнение значение X (Z) из (5.26) и Z (Z) из (5.24) и группируя члены, окончательно будем иметь: dX -1X = [A(t)-K (Z) С (Z)] ЛД (Z) + В (Z) W (t) - К (t)V (Z). (5.45) Рис. 5.13. Это уравнение устанавливает связь между вектором ошиб- ки фильтрации X е и действующими на входе формирую- щего фильтра и выходе измерителя белыми шумами W (Z) и V (Z). Структурная схема, соответствующая уравнению (5.45), приведена на рис. 5.13.
5 20] ОБЩАЯ ТЕ РИН ФИЛЬТРА КАЛМАНА — БЬЮСИ 221 Мы видим, что она аналогична схеме оптимального фильтра и отливается лишь входными воздействиями Это обстоятельство будет использовано в дальнейшем. Оба полученных уравнения содержат в качестве мат- ричного коэффв рента матрицу К (Z), значение которой пока неизвестнс Как следует из ее определения (5.43), это матрица переменных коэффициентов размера п х р [поскольку матрица L (t, s) имеет размер п х р, как это видно из формулы (5.30)]. Таким образом, следующим этапом изложения теории является определение К (Z) в за- висимости от параметров измерителя и характеристик дей- ствующих на систему шумов. Используя с ^ношения (5.27) и (5.30), запишем сле- дующее выражение: t Xz Z) = X (t) — L (t, s) Z (s) ds. i < Умножим его п »ава на транспонированную матрицу- столбец ZT(t). Это сделать можно, так как размер Х£ (Z), X(t) и подынтегрального выражения равен п X 1, а раз- мер Zr(z) равен 1 < р. При этом получим t Xt (Z) z7’ (/) ; - X (Z) ZT (t)-^L(t,s)Z (s) ZT (Z) ds. ъ Подставляя в эт р венство значение ZT (Z) из (5.36) и вы- полняя операции пределення математического ожидания полученного выражения, будем иметь М [ ХЕ (Z) Zт (Z)| = М IX (Z) Хт (Z)] Ст (Z) I + М [X (Z) Гг (Z)l — L (Z, s) М \Z (s) ZT (Z)] ds. (5.45) fo Рассмотрим математическое ожидание M ]ХК (z)Z (Z)J. Подставляя значение X ,,(Z) из (5.27), получим М [Хе (Z) Z1 (41 = м [X (t)ZT (Z) - XC(Z)ZT(Z)J. Если теперь подставить значение Хо (Z) из (5.30) и учесть выражения (5.32 в (5.33), будем иметь t М [Xz (Z) Z (Z ] = Kxz (t,t) — L (Z, s) Kz (s, Z) ds.
222 ФИЛЬТР КАЛМАНА — БЬЮСИ 1ГЛ. 5 Правая часть этого соотношения есть не что иное, как уравнение Винер — Хопфа (5.31) при и = t, следова- тельно: V [Xe(Z)ZT(/)] = 0. (5.47) Рассмотрим, далее, математическое ожидание M[Z (s) стоящее под интьгралом выражения (5.46). Подставляя в него значения Z s) из формулы (5.24) и ZT(t) из соотно- шения (5.36), получим М [Z(s)ZT(t)\ = M{[C(s)X(s) + V(s')][XT(t)CT(t) + + FT(i)l} = = C (s)M [X (f XT (t)]CT(t) + C(s)M [X (s) VT (01 + - M [Г(я).¥г(01СТ (0 + M [F (OFT(OJ. На основании усл ?ия (5.29) второй и третий члены в этом соотношении равны нулю, следовательно, с учетом фор- мулы (5.25) получим М \Z (s)ZT(t)} = С (s)M [X(s) XT(t)]CT(t) + R (s)6(s - t). (5.48) Используя теперь выражения (5.29), (5.47) и (5.48) в со- отношении (5.46), будем иметь М [X(t)XT(t)lCT(r = t = L (t, f) С (s') М [X (s) XT(t)] CT (t)ds + ^0 t -|- L(t, s) R (s) 6 (s — t) ds io или, учитывая свойство дельта-функции, t s — t)ds = M(t,t), io м [X (0 xT(01 Cr(t) = t = L (t, s) С M [A' (s) XT(t)] CT(t) ds + L (t, t) R (t). io (5.49)
i 2UJ ОБЩАЯ ТЕОРИЯ ФИЛЬТРА КАЛМАНА — ЕЬЮСИ 223 Вернемся к формуле (5.30). Умножим ее левую и правую части справа на транспонированную матрицу-столбец [С (£) X (/) 7.. Это сделать можно, так как размерность членов формул (5.30) равна п х 1, а размерность [С (t) X (t ,]г = Хт (t) Ст (/) равна 1 х р. Будем иметь t Хо (t Хт (t) Ст (t) = L(t,s)Z (s) Хг (t) Ст (0 ds. t. Подставляя в подынтегральное выражение значение Z (s) из (5.24) и выполняя над обеими частями равенства опе- рацию определения математического ожидания, получим t M[Xa(t) Xr /)] CT(t)= L(t, s)C(s)M[X(s) XT(t)] + to t + CT!t) ds + L (t, s) M [F (s) XT(t)] CT(t) ds. (5.50) t. В этом выражении последний член на основании условия (5.29) будет равен нулю, так как .и [V (s) Хт (01 = М[Х (t) VT (s)]T. Поскольку в соотношениях (5.49) и (5.50) интегралы одинаковы, их можно исключить. При этом получим {М [X (0 X (01 - М [Хо (0 Хт (<)]} Ст (0 = L (t, t) R (0 или, замеляя Хт (t) на Х[ (t) -)- Хо (t) и X (0 — Хо (t) на Xe(t), М{Х (0 - J0T (01} Ст (0 = L (t. 0 R (t). (5.51) Введем обозначение M [X е (0 Аег (01 = Р (0- (5-52) Р(0 является матрицей дисперсий ошибки фильтрации размера п X п и имеет вид ~eJ(O ex(t)ea(O • • • Pdt-M . (5.53) -«,(04(1) 8,104(0 • • - 4(0 -
224 t •’ЛЬ TP КАЛМАНА — ЕЬТОСП l гл. 5 Рассмотрим тематическое ожидание М [Xe(f) Xj (0[. Так как г X, (f) = ' L («, s) Z (s) ds, i. то после tj панирования этого вектора получим t X U) = ZT (5) LT (t, s) ds. t. Следователь; искомое математическое ожидание будет равно t М [Хе с х; (Г)] = \ М [ХЕ (0 ZT (s)] LT (t, s) ds. t. Ранее мы ш» ти м. равенство (5.47)], что математиче- ское ожидание - )ящее под знаком интеграла, равно ну- лю. Следова- -тино. получим Af !Хе (0 XJ (01 = 0. (5.54) Используя в у; зпенип (5.51) соотношения (5.52) и (5.54) и обозначенп " 43). будем иметь Р (0 Ст (0 = К (0 В (0. (5.55) Матрица спи тт альных плотностей белого шума В (0 является квад: тной и невырожденной (более того, она диагональная п тому она имеет обратную матрицу В~1 (0. Ymhcv-e уравнение (5.55) справа на В~1 (0, мы и получим и кую формулу для определения матрицы коэффициент! I усиления К (0: л : = Р (0 Ст (0 В1 (0. (5.56) Рассмотрт т 'дробнее свойства матрицы К (0. Для этого запише* и;тгвцу спектральных плотностей белого шума В (0 в * ввернутом виде и найдем ее обратную матрицу. Мы t-ем |-п(0 0 ... 0 -1 0 Г2(0 . . . о р I = . . . -0 0 ... Гр (0 -
8 20] ОБЩАЯ ТЕОРИЯ ФИЛЬТРА КАЛМАНА — БЬЮСИ 225 п поскольку произведение двух диагональных матриц да- ет диагональную матрицу с элементами в виде произведе- ний одноименных элементов сомножителей (что легко про- верить непосредственным матрица примет вид Г 1 МО 0 перемножением), то обратная о 1 МО 0 о 1 гр (О . о о плотности белых шумов, дейст- где r{- (Z) — спектральные вующпх па р выходах измерителя. Так как коэффициенты матрицы С (Z) являются задан- ными функциями времени, поведение матрицы К (Z) це- ликом определяется поведением матриц Р (Z) и R"1 (Z). При уменьшении уровней помех V(Z), действующих на выходах измерителя, уменьшаются значения спектральных плотностей rt (Z) и возрастают значения элементов 1/гг (Z) матрицы 7?"1 (Z). В пределе, когда г, (Z) становятся равны- ми пулю, эти значения возрастают до бесконечности. С другой стороны, уменьшение уровня помех приводит к уменьшению ошибок фильтрации, и элементы матрицы Р (Z) уменьшаются, в пределе обращаясь в пуль. Таким образом, поведение матрицы К (Z) при устрем- лении уровней шумов V (Z) к нулю простым образом не определяется. Так, например, для системы второго поряд- ка мы имеем г 1 0 В*1 (9 = 1 Г2 - Р (t) = М е® 8je2 ®1®2 8® п 0 и матрица К (Z) примет впд К (Z) = М е1Г11 + е182г12 е1е2С11 + е2С12 Г1 е1Г21 + ®l*2f22 е1е2Г21 + e2f22 Т3 1/28 А. В. Солодов
226 Т КАЛМАНА — БЬЮСИ [ГЛ. 5 Здесь для предел нгя поведения элементов матрицы при -> 0 п г. 0 к-, хходимо знать асимптотические свой- ства функЕЕл Л/ 1, М [eg (<)], М [е1е2] и коэффициен- тов Сц. ОтыскаЕте зе ченнй матрицы К (t) расчетным путем требует зн геля т'нцы дисперсий ошибок фильтрации Р(0, котс не не найдена. Этому вопросу будет по- священо д онейпге изложение. Сформулируем б торые итоги рассмотрения общей теории фигура гетмана — Бьюси. Основные результаты теории закгьча: ~ - - получении уравнений (5.44), (5.45) и (5.56). поремм является тот факт, что эти результа- ты носят f ее 'геел характер, чем результаты теории фильтра Кд юг г — Винера, поскольку они опирают- ся на попя’_я е стчлеления общей теории систем. Так, например, ~и е -нии фильтра практически отсутст- вуют ограыгченЕЯ б. размерность системы. Однако наи- более суще - венным езультатом теории является описа- ние оптимального фильтра с помощью дифференциальных уравнений Это ' т: ятельство становится решающим в тех случаят к суд р мирующий фильтр имеет высокий порядок, и* при " решение интегральных уравнений крайне ус.- княет лаже при использовании современ- ной вычислительч z техники. Прямей иле те ген Калмана — Бьюси позволяет до- статочно пл то ~ тту : пть структуры оптимальных фильт- ров для ряд частных задач, некоторые из которых мы рас- смотрим нг~=:е. Перейдеч теперь к задаче определения матрицы дис- персий ош: ' ж тЕльтгацип Р (t), знание которой необхо- димо для —ыск нгг матрицы коэффициентов усиления К (/) оптп1 льно рильтра. § 21. Определение матрицы дисперсий ошибок фильтрации ВекторЕлматтЕЕЕте дифференциальное уравнение, оп- ределяющее зектор дтибки фильтрации X е (£), имеет вид [см. уравЕе.Еие 5.45|] с Т -^- = [.4 -K(0C(01Xt(0 + -W(0, (5.57)
§ 21) МАТРИЦА ДИСПЕРСИЙ ОШИБОК ФИЛЬТРАЦИИ 227 где И (0 = В (0 W (0,- К (0 V (0. (5.58) Очевидно, этому уравнению будет отвечать некоторая вполне определенная переходная матрица 'F (£, i0). Она будет удовлетворять уравнению /TG.M /с)> (5.59) причем V (i, 0 = I. (5.60) Теперь можно представить вектор ошибки через переход- ную матрицу Т (/, /0) в следующем виде (учитывая, что Ле («о) = 0): t Xt (t) = 'F (/, u) М (u)du. (5.61) to Структурная схема, соответствующая уравнению (5.61) и соотношению (5.58), показана на рис. 5.14. Рпс. 5.14. Матрица дисперсий ошибок фильтрации определяется следующим образом [см. формулу (5.52)1: P(t) = M[Xe(t) АЕГ (0] (5.62) или в развернутой форме: Рп (0 Р12 (0 • • • Ап (0 РЯ(0 д22(0 • • • Ргп (0 Р(0 = • (0 Дп2(0 • • • ^пп(0_ где Ра = М [ег (0 ej (0]. 8*
228 ФИЛЬ ТР КАЛМАНА — БЬЮСИ [ГЛ. 5 Увы-ывая, что операции определения математического ожг '7зля и дифференцирования перестановочны, запишем выр ~ вне для врос вводной матрицы дисперсий па осно- ван с< рмулы (5.f_ в следующем виде: р (t\ Г (0 т dxl (t)1 т = (0 + ^(0-^]. (5.63) Трашгнпруя почленно уравнение (5.57), получим (ont'ezzn трапспоштт звания п дифференцирования пере- став т^тзы) —I=x[(f lT(t)-CT(t)KT(t)] + MT(t). (5.64) п dXT д:"авим теперь значения производных и из ут ’ гзений (5.57) 5.64) в формулу (5.63). Будем иметь: = м {[Л (0 - А- (0 с («)] Xi (t) xl (о + м (0 xfy)-*- - х£ (О xl (- I ат (0 - ст (Г) кт (01 + Xt (t) мт (t)} или т>я в виду, чл э операция определения математиче- ское непдания относится только к случайным функциям, = [Л (f) - к С с (01МIХг (/) Xl (01 + - м [М (0 X; (01 + м IX (0 Хг (01 Мт (0 - -сТ(ОЯт(О1 + М[Х(омт (01. Г:д льзуя формулу (5.62) и раскрывая скобки, полу- чим =A(t)P (0 - к (0 с(0Р(0 + р (0 (0 - - р -т (Окт (0 - м [ХГ (0 xfj (01 4- м [ХЕ (/) м1 (01. (5.65) Рас '7пм два по теднпх члена этого уравнения. Под- стаг- в первый в? них выражение (5.58) и раскроем скооек м I -Ч о Xl (01 = в (t)M [W (0 xl (0] - -K(t)M [V (t) xl (01. (5.66)
5 21] МАТРИЦА ДИСПЕРСИЙ ОШИБОК ФИЛЬТРАЦИИ 229 Транспонируем соотношение (5.58) MT(t) WT(t')BT, (f)-VT(t) KT(t) и подставим полученное выражение во второй член. Будем иметь М [Хе (0 Мт (01 = М [Xl(t) WT(t)] Вт (0 - - М [X е (0 VT (01 кт (0- (5.66') Определим значения математических ожиданий в равен- ствах (5.66) и (5.66'). Для этой цели найдем транспониро- ванное значение вектора ХЕ (0 из формулы (5.61). Под- ставляя в нее выражение (5.58), получим t Xt (0 = pF (t, и) В (и) W (u) — Т (0 и) К (и) V (и)] du, (5.67) п транспонированный вектор будет равен t xl (0 = [WT (и) Вт (и) ’FT (/, и) - - VT (и) Кт (и) Тг (t, и)] du. (5.67') Далее, используя выражение (5.67'), можем записать t М [W (0 Xl (/)] = (М [W (0 WT (и)] В (и) Тг (t, и) — io - М [FF (0 VT (и)] Кт (гг) (0 и)} du. На основании формул (5.23) и (5.28) имеем М [W (0 WT (и)] = Q (0 6 (« - и), 1 М [TF (0 VT (101 =0, ) ( } следовательно, t М [W (0 xl (<)] = Q («) 6 Р - и) Вт (u) *FT («, и) du. to Используем в полученном выражении известное свойство
230 ФИЛЬТР КАЛМАНА — БЫОСИ [ГЛ. 9 дельта-функции, определяемое тождеством *) t F (u)8(t — и) du — -i-F (t). (5.69) fo При этом будем иметь М [W (0 X? (t) Бт (!) Тг (t, (t) вт (!), (5.70) так как Чгт (i, i) = I. Опять используя выражение (5.67'), получим t M[V(t) X* (!)] = {М [V (!) ТРГ (и)] Вт (и) YT (t, и) - to - М [V (!) VT (и)] Кт (и) Тт (!, и)} du. Согласно соотношениям (5.25) и (5.28), будем иметь М [V (!) FT (и)] = R (!) 6 (! — и), M[V(t) WT(u)J = 0, следовательно, t М [Г (!) X? (!)] = - R (!) 6 (! — и) Кт (и) Тт (!, и) du. to Вновь применяя формулу (5.69) и учитывая, что ЧтТ (!, !) = I, получим М [V (!) X? (!)] = - ± R (!) кт (!). (5.72) Обратимся теперь к соотношению (5.67). С его помощью можем записать t М [Хе (!) WT (!)] = J {Т (!, и) В (и) М [W (и) Wт (!)] - to -чу, и) К (и) М [F (и) WT (!)J) du *) Коэффициент 1/2 всегда имеет место, если один из пределов интеграла совпадает с одним из аргументов дельта-функции. (5.71)
§ 21] МАТРИЦА ДИСПЕРСИЙ ОШИБОК ФИЛЬТРАЦИИ 231 или, учитывая формулы (5.68) и тождество (5.69), t М [А\ (1) WT (t)] = *F (i, w) В (и) Q (и) 6 (и — t)du — to = 4- *F (/, t) В (О Q (0 = 4- В (t) Q (t). (5.73) Наконец, будем иметь t М [А\ (t) Vт (01 = J {'F (Г, и) В (и) М [IF (u) FT( 1)] - to — Y (t, и) К (и) М [V (и) VT (01} du. Используя соотношения (5.71) и тождество (5.69), получим t М [А\ (1) Fr («)] = — J Т (t, и) К (и) В (и) d(u — t)du = to = -4- K(t)B(t). (5.73') Итак, нами определены значения математических ожида- ний, входящих в равенства (5.66) и (5.66'). Подставляя в них соотношения (5.70), (5.72), (5.73) и (5.73'), будем иметь м [И (t) хт (01 = 4- В (0 О (0 вт (0 + 4- к (t) B(t)KT (t), м [ХЕ (о мт (01 4- в (о Q (0 в? (о + 4- K(t)в (0 кт (о. Заменим этими выражениями два последних члена урав- нения (5.65). При этом получим = А (0 р (0 - к (0 с (0 Р (0 + р (0 Ат (0 - - Р (0 ст (0 кт (0 + В (0 Q (t) ВТ (0 + к (0 в (0 кт (t). (5-74) Воспользуемся уравнениями (5.55) и (5.56) для матрицы К (t). Они имеют вид к (о в (о = р (О ст (О, к (о = р (о ст (0 в1 (0.
232 ФИЛЬТР З-ЛПМАНА — БЬЮСИ [ГЛ. 5 Подставляя первое из ш в четвертый член уравнения (5.74), а второе — во второй член, получпм = A(t)P(t) — P €T(t)R^(t)C(t)P(t) + + P(t)AT(t)-K(t В I KT(t) + B(t)Q(t)B^(t) + или, после очевидного сокращения, окончательно -*™- = A(t)P(t)-P t C~(t)B^(t)C(t)P(t) + + Р 7 Ат (t) + B(t)Q(t) BT (t), (5.75) причем P (t0) = Pn. Дифференциальное уравнение (5.75) устанавливает связь между пскомойм-т глей дисперсий Р (t) и парамет- рами системы и входныт воздействий. В теории это урав- нение именуется матрзгчгым дифференциальным уравне- нием Рпккатп. Интересно отметить чт для отыскания матрицы дис- персий ошибок фильтрагтпл нет необходимости в построе- нии собственно оптимального фильтра — достаточно использовать параметры ф; ротирующего фильтра и измери- теля и матрицы спектр плотностей случайных воз- действий. В теории фильтра Колмогорова — Винера по- добного результата не'. Уравнение для матрилы дисперсий (5.75) подверглось довольно детальному и ул нпю, предложен ряд методов его приближенного реш кия для некоторых частных слу- чаев формирующих фи.тЕтр .в. Однако отыскание матрицы Р (/) остается основное трудностью при практической реализации фильтров Калкана — Бьюси. На этом мы завершим ассмотрение общих теоретиче- ских вопросов построена- .помянутых фильтров и перей- дем к изложению неко' рых частных случаев. § 22. Фильтрация шума измерителей системы управления летательного аппарата Одним из типичных примеров практического примене- ния теории фильтра К ла — Бьюси является задача построения фильтров, . уществляющих оптимальную оценку выходных сигнал.® измерителей параметров дви-
§ 22 ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 233 женля летательного аппарата с автоматической системой упр.-вления. Обычно в качестве измерителей в таких си- стемах применяются датчики угловых отклонений и уг- ловых и линейных ускорений, преобразующие эти па- раметры в соответствующие электрические сигналы. При это процесс преобразования сопровождается появле- ние помех из-за ступенчатости электрических потенцио- мет в, паразитных наводок в линиях передачи сигналов, ква товапия сигпала. Последний фактор, в частности, хар ктерен для дискретных систем передачи данных. Е этих условиях возникает задача фильтрации шума измерителей с целью получепия оптимальных оценок измеряемых параметров. Для ее решения с помощью тео- рии фильтра Калмана — Бьюси необходимо иметь диф- фер.нциальные уравнения движения управляемого объек- та и характеристики шума измерителей. I ассмотрим движение летательного аппарата в атмо- сфера относительно некоторой неподвижной системы ко- ордпЕат. Для простоты рассмотрим движение только в вертикальной плоскости. Используем схему действия сил на летательный аппарат, изображенную па рис. 5.15, и учте известные из аэродинамики упрощенные выраже- ния илы лобового сопротивления X = Хп (v, у) + Хаа (v. у) а2, подъемной силы Y = Ya {v, у) а 9 А. Б. Солодов
234 ФИЛЬТР КАЛМАНА — БЬЮСИ лгал и аэродинамического момента Mz = Mz (V, у) Ц>, Mz . у) I + (v, lj) 8, где X0(v,ij) = cXt(M)^-Sk, X-(p,i/) = c“a(JZ)^-5/;; Ya(v, y)^cav(M)^Sk. Uz(v.y) = m“(M)?f-Skba, ^(\y) = maz(M)^-Skba, Vl ,y) = m&z(M)X±skba, где p = p (if) — плотность воздуха на высоте полета; М — via — число, характеризуй Её- отношение скорости полета к скорости звука; а = а (у, — скорость звука на высоте полета; Sk — характернстеческая площадь (пло- щадь миделева сечения, плоедь крыла); Ьа— средняя аэродинамическая хорда крыл : со- — угловая скорость корпуса относительно цент’ масс; а — угол атаки; 6 — угол отклонения рулей; с М), сха (М) — коэффи- циенты силы лобового сопротивления; с“ (М) — коэффи- циент подъемной сплы; ги“ (3f. Ш; (М), mz (М) — коэф- фициенты моментов. Можно записать следуют систему уравнений дви- жения [17]: т = Р со? a ~ А ° <р’~ — А’аа (г, г/) a- — in г ? 0 + Fvb (0> т («) v — Р (t) sin а -ф У“ (г х — -и . -9 4-УеДО, Л(0^- = --^(г,?/)«г-ЗАа(г.У (5‘7С) -Л/1 8 + M:u(t), tlft di) . с. dx а -JT- = СО,, -- = Г S1H 6, -- = V COS 0, М г’ dt ’Л где Р (Z) — тяга двигателя, заданная в виде известной функции времени; т (<) и Jz f) — масса и момент инер-
§ 22 ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 235 цпи гппарата, изменяющиеся во времени вследствие вы- roj ля топлива; 0 — угол между вектором скорости и местным горизонтом; 'О’ — угол тангажа; v — скорость центра масс аппарата; .г, у — координаты центра масс апп »ата относительно точки старта; FVB (t), Fqb (t), J) — возмущающие воздействия. Управление движением летательного аппарата осу- ще.твляется с помощью рулей или аналогичных им по действию других органов управления. Обычно раздельно рас "мгтриваются задачи управления движением отно- сительно центра масс и управления движением цент- ра масс. Если осуществлять автоматическое управление движе- ние аппарата в зависимости от изменения только угла тая- жа, то уравнение системы управления можно запи- сать в общем виде, например, так: 6 = 6 ($). (5.77) Система уравнений (5.76) и (5.77) содержит восемь неи зестных параметров движения аппарата и является замкнутой. Поскольку полученная система уравнений нелинейна, подвергнем ее линеаризации. Идея этого метода, как известно, состоит в том, что изучение сложного возмущенного движения системы за- меняется изучением отклонений от некоторого невозму- щеннсго движения, определяемого системой нелинейных уравнений типа (5.76), записанных, однако, с известными допущениями (возмущения отсутствуют, параметры ап- парате и его системы управления имеют номинальные зна- чения параметры состояния атмосферы характеризуются средними величинами и т. д.). В такой схеме исследования предварительно находятся все параметры, характеризую- щие невозмущенное движение. Так, для рассматриваемого случ-н решением системы (5.76) и уравнения (5.77) на- ходятся параметры РН = МО» 0н = 9н(О> ®zh = ®zit (0, — Фн(0> (п; yg) ctH = осн (£), i/H = i/H(£), жн —= жн(£), 6Н = 6Н (t), у*
236 ФИЛЬТР КАЛМАНА — БЫОСИ [ГЛ. 5 которые и буду определять характер изменения во вре- мени коэффициентов линеаризованной системы. Индекс «н» показывает, что формулы (5.78) выражают изменение параметров при невозмущенном движении. Воспользовавшись одним из известных приемов ли- неаризации, пс лучим следующую систему уравнений возмущенного продольного движения летательного ап- парата в отклонениях: -^ = О1(ОД^-«2(ОД0+ 1 + «з (0 Да + «« (0 Ар + F„ (<), ^. = 61(<)дп_62(Од9 + + ^з (О Да + Ъц (t) Ay 4~ F0 (i), dAco = Ci (0 Ap — c2 (i) Дю2 4- + e3 (0 Ax 4- c4 (0 A у 4- cs (t) A6 -|- Мг (t), dt ~Д®2’ Да = ДФ — Д0, • = d^t) bv + d2(t) ^- = ei(OAn4-e2(i)A0. (5.79) Уравнение системы управления можно, например, представить в таком виде: Дб = б (Aft, А0). (5.80) Коэффициен_ы уравнений имеют следующий вид: ~ т (t) dv «г(0= — gCOS03, P(«)s.na «з(0 = - 6^ 1 ^оСг’н-Ун) ан ^аа(^И’Ун) т (t) dv 2а„ 4П------- ____________1 а*о(рн.ун)_______«I ^аа(у?/н) а*' ) т ([) ду т (t) ду
S 221 ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 237 , _ 1 , % ЭУ“(»п,ун) 1' ' »н dt ' т (t) VH dv сн P (t) cos ан-|-У“ (i’H. ?/н) ---------- _ »„ a,»?<»!'»> _ ал|.<«») С1(0 = J2(t) dv J2(t) dv __ ан эм*(уа,уи) Jz (t) dv С2 (0 — Jz(t) ’ сз (0 = A1z 0?..’ ^z^’h’Vh) J.W • '•(()- -M0 е4 (0 = _ MZH (г-н- Ун) _ aH e;Vz(rH-yH) T Л . T /4\ л.. ^(*н-Ун) Jz(t) dy al (t) = sin 6H, dz (0 — v„ cos 0H, e, (t) = cos 6H, e2 (0 = — VH sin 0H, (t) = Fvti (t)/m (t), Fe (t) = F8b (t)/m (t) v„, Mz (t) = М2Ъ {t)IJz (t). ОС значения отклонений параметров движения лета- тельн иго аппарата от поминальных значений при певоз- мущенном движении получены путем постановки буквы А перед обозначением соответствующего параметра. Полученная система (5.79) и (5.80) представляет собой типичную систему с переменными параметрами, коэффи- циенты уравнений которой изменяются во времени в достаточно широком диапазоне, определяемом характе- ром выбранного невозмущенного движения. Она получена
238 ФИЛЬТР VJMAHA БЬЮСИ [ГЛ. 5 с учетом большого числа факторов, в той или иной степе- ни влияющих на движение .it тательного аппарата. Одна- ко ряд факторов достаточно слабо влияет на возмущенное движение, и оставаясь е рамках приближенной схемы исследования, ими без ущерба для точности можно пре- небречь. Так, например, варпгции отклонения) Ду высоты по- лета практически не отражаются на изменении других параметров движения (к стицпенты а4, и с4 малы по сравнению с другими к >фт клиентами уравнений). Это обстоятельство сразу п:* - тянет упростить исследуемую систему. Кроме того, для ряда практических задач иссле- дования динамики управляемых летательных аппаратов, связанных главным образом с вопросами выяснения маневренных свойств летательных аппаратов, вполне до- пустимым с точкп зрения получаемой точности является пренебрежение связями, о уществляемыми через коэффи- циенты Ь} и с4. Если учесть оба эти допущения и исключить из системы переменные Доу п Да. т второе и третье уравнения си- стемы (5.79) примут виг — = [б, (0 - Ь3 • ДО _ ъ3 (0 да + Fe (О, <РАФ dt2 = е2 (t) dt г,(4)ДЙ~с3(ОДе + — с5 (О (t)- (5.81) и могут решаться незазисизю от остальных уравнений системы. В дальнейшем рассмотрим задачу управления продоль- ным движением летательно" аппарата только по углам тангажа Дй п вектора скорости Д0. Тогда упрощенная система уравнений, описывающая движение управляемого летательного аппарата, будет иметь впд = Ъ (0 Д9 + Ь3 (0 Д€» - Рв (0, dt2 = сИ04г + Сз^ ^-с3(*)Де + -с5(0ДбфМв(0, (5.82) дб = ₽ (Дй, де),
S 22] ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 239 где (учитывая, что cos ан ~ 1> sin ан « ан) g sin 0H V н b(t) т (О г’н <”H’ !/н) с2(t) == МО = m (Г) vH > Л/ГЙ’Н.?/Н) Л<0 ’ Л (О М®(кн-Ун) А (О Рв(О = ^е(О. Мв (0 = ^(0- Структурная схема системы автоматического управле- ния, соответствующая уравнениям (5.82), показана на рис. 5.16. Рис. 5.16. сз (0 — Совершенно аналогично может быть получена и лине- аризованная система уравнений бокового и поперечного движений управляемого летательного аппарата. Мы не будем здесь этого делать, отсылая интересующихся к специальной литературе [17]. Дифференциальное уравне- ние относительно параметра \9 описывает апериодическое
240 ФИЛЬТР КАЛМ НА — БЬЮСИ [ГЛ. 5 движение центра масс летательного аппарата под дейст- вием возмущающей силы F t). Соответствующее звено структурной схемы пазовех апериодическим. Дифферен- циальное уравнение относите ьно параметра Д& описыва- ет колебательное движение летательного аппарата около центра масс под действием возмущающего момента Л1„ (t). Это звено структурной схемы назовем колебательным. Из приведенной структурной схемы видно, что на вхо- ды измерителей системы управления поступают величины параметров движения объекта управления — летательно- го аппарата. Как уже отмечалось выше, в процессе изме- рений возникают шумы измерителей, вызванные рядом причин. Ниже рассмотрим так называемые шумы квантования, возникающие из-за дискрет зости выходных сигналов из- мерителей. Предположим, что выхсдной сигнал измерителя х (t) имеет конечное число воза жных значений т, каждое из которых отличается от ближайшего на некоторую по- стоянную величину б, называемую шагом квантования. Если максимальное и минимальное значения сигнала х (t) имеют величины соответственно Хт и —Хт, то величи- на шага квантования б буде- равна (рис. 5.17, а). 6 = -^-. (5.84)
§ 12] ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 241 Очевидно, в каждый момент времени значение измеряе- мой входной функции X (Z) будет воспроизводиться из- мерителем с ошибкой, равной тъ (Z) == X (t) — .т (Z), причем значение ее случайно и зависит от значения из- меряемой функции X (t) в момент времени t. Эта ошибка и называется шумом квантования. Если измеритель выдает выходные квантованные зна- чения функции X (t) по обычному правилу округления чисел, то в моменты времени, отвечающие достижению функцией X (Z) середины интервала квантования, выход- ная величина х (Z) скачком на величину 6 изменяет свое зяачение (рис. 5.17,6). При этом ошибка ms (?) изменяет- ся во времени также скачкообразно, имея характерный впд. показанный на том же рисунке. Для получения статистических характеристик шума квантования будем полагать, что на интервале времени, отвечающем нескольким колебаниям функции т& (Z), измеряемая функция X (t) изменяется линейно со. скоро- стью dX/dt = Q. При этом период колебаний функции тъ (0 будет постоянным, и ее можно приближенно пред- ставить в виде синусоиды с некоторой постоянной ампли- тудой т0: т& (Z) = т„ sin 2л 1, где 6/й является периодом колебаний. Такое представление позволит достаточно просто ре- шить задачу отыскания корреляционной функции, по- скольку высшие гармоники разложения в ряд Фурье функ- иип ms (Z) практически, как мы увидим ниже, не повлия- ет на конечный результат. Так как произведение Qt даст текущее значение функции X (Z) па рассматриваемом ин- тервале, можем записать m8 (Z) = т0 sin X (Z). (5.85) Очевидно, это выражение справедливо для любого участ- ка функции X (Z). При этом корреляционная функция пума квантования примет вид кт (Д, Z2) = М [m02 sin X (tj sin X (Z2) ]. (5.86)
ФИЛЬТР КАЛМАНА — БЬЮСИ [ГЛ. 5 Рассмотрим случай нормального стационарного про- цесса и определим полезный сигнал корреляционной функцией кх (т) и двумерЕЙ плотностью вероятности р (а”15 х2, т). Последняя характеризует вероятность по- явления двух значений сигнала А’ (/) в бесконечно малых интервалах dxA и dx2 около значений Хг и Х2, отстоящих друг от друга на время т Тогда выражение (5.86) можно записать в виде f*'m ("Г) = [sin — А' 7) sin Y (Z)j, где Y (t) = A f - т). Воспользовавшись тождестве м ,’4 _ -А sin Л —--------------- получим О. / (-Х-У) — е (5.87) Известно, что математическое ожидание случайной функции в виде экспоненты с мнимым показателем есть характеристическая функция соответствующего распре- деления М j = G рч, Х„), (5.88) где G — характеристическая функция; и >.2 — ее ар- гументы, являющиеся коэффициентами при случайных величинах щ и и2 в показателе степени экспоненты. Применив формулу (5.88 к соотношению (5.87), будем иметь
1 12J ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 243 Для двумерного нормального распределения характе- ристическая функция имеет вид [4] [б2 ----2~ (^1 + ^Гх ^1^2 4" ^1) где гх (т) = кх (т)/а£ — нормированная корреляционная функция процесса X (Z); — дисперсия процесса. Применяя эту формулу к соотношению (5.89), получим Легко видеть, что в выражении (5.90) второе слагаемое в скобках пренебрежимо мало по сравнению с первым. В самом деле, отношение ог/б практически равно Хт/38, где Хт — абсолютное максимальное значение сигнала .¥ (Z). Следовательно, <4 Ч 62 962 — 9 ’ где т — число уровней квантования, причем т^> 1. Т ким образом, число 4n2<j2/62 лежит в пределах от не- скольких десятков до нескольких сотен. Учитывая ска- занное, можем приближенно записать: '"п I 4jT2<52 1 /' т (Т) = — ехр |-------62— I1 — rx (t)] J • При т — U корреляционная функция принимает зиа- 1ие дисперсии шума квантования кт (0) = £>6- П.'Скольку величина т0 нам не известна, в дальнейшем □ределим дисперсию шума квантования отдельно. Учитывая введенное обозначение для дисперсии, окон- чательно получим ( 4л2б2 1 кт (т) = Г8 exp j---[1 — rx (т)] (5.91)
ФИЛЬТР КАЛМАН X — БЬЮСИ 244 [ГЛ. 5 Нормированная корреляционная функция шума кванто- вания равна к (т) ( AY-S2 1 гт (т) = = exp I-----37-41 — MT)I j- (5.92) Можно было бы показать в общем виде, что функция гт (т) убывает с ростом т значительно быстрее, чем функ- ция гх (т). Мы ограничимся г лфпческой иллюстрацией для случая, когда гх (т) = ехр(— ат2) (рис. 5.18). Легко видеть, что уже для небольших значений т (т 12) корреляционная функция гт (т) Рис. 5.19. настолько «узка» по сравнению с корреляционной функцией полез- ного сигнала, что шум квантова- ния можно считать ограниченным белым шумом, не коррелирован- ным с полезным сигналом. Отсюда также следует, что учет высших гармоник функции mg (t) не изме- нит окончательного результата. Определим теперь дисперсию шума квантования. Согласно изло- женному ранее принципу кванто- вания всякий раз, когда измеряе- мая функция X (Z) находится в интервале до а”л+1/2, будет пере- даваться измерителем одно значение, отвечающее уровню выходного сигнала zt, где к — номер уровня (рис. 5.19). Нрп этом в данный момент времени t ошибка между изме-
S 22J ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 245 ряемым и квантованным сигналами f\xk является случай- ной и зависит от распределения вероятностей появления значений функции X (t). Пусть одномерная плотность вероятности функции A (f) в момент t равна р (х). Тогда среднее значение квад- рата ошибки на интервале к-го шага квантования будет М (Д4) = f р(х)(Х— хк)2 dx. х " 8 fc--- о Так как интервал квантования 6 мал по сравнению с пол- ным диапазоном изменения функции X (t), можно при- ближенно вынести из-под знака интеграла значение плот- ности вероятности, считая его равным р (хк). При этом получим х. 6 М (Да$ = р (хк) f (X — хк)2 dx = p (хК) . х г 8 к— ~ Если ввести вероятность нахождения значения X (/) в интервале 6, равную Р = Р Ы 6, то будем иметь м (Д4) = ~ р Ы- Суммируя полученное значение дисперсии по всем уров- ням квантования, найдем искомую дисперсию шума кван- тования Ш ТП = 2 W4) = 4г 2 Р (^) = 4г > (5-93) )>=i k=i так как m 2^ы = 1- fc=i
246 ФИЛЬТР КАЛМАНА — БЬЮСИ [ГЛ. 5 Согласно формуле (3.20) ограниченный белый шум имеет спектральную плотность (обозначим ее г) г=А, (5.94) где F — полоса пропускания ограничивающего фильтра. Практически можно считать, чтоГ^1/то, гдет0 — эффек- тивная длительность корреляционной функции шума квантования. На основании полученных выше уравнений движения объекта управления построим структурную схему систе- мы, подлежащей дальнейшему рассмотрению. Будем полагать, что закон управления определяется зависимостью Дб = А0ДО + А’! + А2де. Тогда уравнения движения (5.82) примут вид = ъ (t) де + ь3 (t) до 4- рв (О, —^2 ~ — 1с2 (О 4* сь (О М ——|- [с3 (О -f- 4- съ (О Ао] де - [с3 (0 - с5 (Г) А-2] де 4- мъ (/). , Введем следующие обозначения: т1 — ДО, х2 = ДО, х3 = - > 6(0 = «п, МО = «12, «13 = «21 = «22 = 0, О2з 1, С2 (0 4“ С5 (0 ^-1 = «33’ С3 (0 4- Са (0 ^'о = «32, -- С3 (0 4- С5 (0 6’2 = «31, /,в(0 = «;1(0’ 71/в (0 = ш3 (о, ш2(/) = 0. При этом уравнения (5.95) запишутся следующим зом: (5.95) (5.96) обра- — «1А + <ii2x2 + «is^e 4* wi (О, С?Т2 , , . , . «21«Т 4* &22Х2 4* «23^3 4" W2 (О’ (5.97) dt йхз , . , ... dl — «зЛ + а32Х2 4" «зз-тз 4" w3 (О-
f 22] ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 247 Примем, что действующие на летательный аппарат возмущения (0 = (0 и Мк (0 = w3 (0 твляются независимыми стационарными белыми шумами с корреляционной матрицей [см. формулу (5.23)] Kw (т) = Q (0 S (т), где Q (t) = Q — диагональная матрица вида - <71 0 0 - ООО _ О 0 дз - (5.98) элементами которой являются спектральные плотности jt и q3 возмущений Рв (0 и Мв (I). Выходные величины измерителей представляют собой аддитивную смесь параметров движения объекта управ- ления и шумов квантования (5.99) Z1 = Vi, z2 = + У 2, гз — хз ^3, . причем корреляционная имеет вид [см. формулу матрица inумов (5.25)1 квантования К „(г) = R6 (т), где Г1 0 0 0 Г2 0 0 0 гз (5.100) является матрицей спектральных плотностей с элемента- ми, определяемыми соотношением (5.94). Структурная схема системы, соответствующая урав- нениям (5.97) и (5.99), изображена на рис. 5.20.
248 ФИЛЬТР КАЛМАНА — БЬЮСИ [ГЛ. 5 б) Рис. 5.21.
§ 22] ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 249 Введем обозначения *): W(l) = СП «21 «31 «•12 «22 «32 т 0 w3 4(0 = Тогда уравнения (5.101) (5.97) и (5.99) примут, вид Z(/) = X(0 + F(0, (5.102) соответствующий общей форме записи (5.1), причем мат- рица С (/) равна единичной, С (/) = I. На рис. 5.21, а показана общая структурная схема фильтра Калмана — Быоси в случае, когда С (t) — I. Формирующий фильтр представляет собой собственно объект управления, структурная схема которого изоб- ражена па рис. 5.21, б и соответствует первому из уравне- ний (5.102). На вход фильтра поступает вектор выходных величин измерителя Z (?), на выходе образуется вектор оптималь- ной оценки параметров движения JT0 (/) ' Ж10~ Хо (t) = адо Язо Дальнейшей задачей построения фильтра является, по существу, только определение значений элементов мат- рицы оптимальных коэффициентов усиления К (1). Сог- ласно формуле (5.56) и учитывая, что С (1) = 7, получим К (?) = Р (/) JR 1 («) (5.104) Матрицу дисперсий Р (?) для рассматриваемого случая (5.103) *) Здесь и в дальнейшем для упрощения записи мы не будем показывать, что элементы матриц являются функциями времени.
250 ФИЛЬТР КЛЛМЛНА — БЬЮСИ [ГЛ. 5 в запишем виде рп 7’21 Р31 Д12 Р22 Р32 Р13 Р23 рзз (5.105) где рц = М [еге3], ег = (t) — xi0 (/). Так как матрица спектральных плотностей шумов кван- тования И диагональпа, то ее обратная матрица будет равна И1 о о 1 о Г2 1 О гз (5.106) и о о Подставляя значения (5.104) и выполняя умножения, получим матриц из (5.105) и (5.106) в формулу операцию (5.107) Развернутая структурная схема части фильтра, относя щейся к матричному блоку К (/), показана на рис. 5.22.
§ 22] ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 251 Перейдем к определению значений матрицы дисперсий Р (<). Для этого необходимо использовать матричное дифференциальное уравнение Риккати (5.75). Примени- тельно к рассматриваемой задаче оно запишется в следую- щем виде: = АР - РВ 'Р + РАТ + Q. (5.108) Используя формулы (5.101), (5.105) и (5.106), найдем вы- ражения для отдельных слагаемых уравнения (5.108). Будем иметь АР = [М^Мз], (5.109) где обозначено: j «117’11 «12/121 + «13 7’31 1 /17Х = ! «217’11 + «22/'21 + «237’31 > , I «31741 + «327’21 + «337’31 / «117’12 + ai2f >2 -р «137’32 «21/’12 -р «227’22 + «237’32 «31/42 + «3-2/122 + «33 Д3'2 . an743 + aisT’iS -р «1зРзз «217’13 -р «23’’23 «гзДзз «31Р13 + «32/223-р (из раз Р R гР [Л/4Д/бЛ76] где обозначено: (5.110) Л/4 = мъ '?! , ^2 , Г1 ’ гз Р21Р11 , <7'22 741 , Р23 7’31 1'1 ' ' Г2 Н 13 7’317'11 , 7’327'21 , Г'зз/'з1 ’ Г1 + 12 Н 13 Р117Т2 , Рп '>22 , 7'1 з Г’зг Г1 + 12 Гз /’21 1 ^22 . Т’гз Г1 1 12 ' гз Лз1/^1*з , Р32Р22 РЗЗРЗ! гз
252 ФИЛЬТР КАЛМАНА — БЬЮСИ [ГЛ. 5 мв= ’ Р11Р13 /12/23 Рнрзз ' П ' 12 ' Гз 7'21/13 /22/23 /23/33 Г1 + 12 "Г Гз Рз1 Р32 РЗЗ '1 -г Г2 "г гз причем здесь учтено, что ру = р t и записано p-t = р%.. РАТ = [M7MSMS], (5.111) где обозначено: /поп + / lii«i2 +' 7'13013 7'21011 + 7'22012 4“ 7'23013 4~ /32012 + РззО1з Мв = /11021 + /12022 + 7'13023 7'21021 + 7'22022 + />23023 /31021 + /32022 + /33023 М9 = /11031 4* /12032 4" /13033 /21031 + /22032 4" /23033 /31031 4" /32°32 4" /33033 >Н Л2 Кз’ /’21 Р22 Р 23 1 -^31 ^32 РзЗ- (5.112) где штрихом обозначена производная ио времени. Как известно, в матричных уравнениях каждому элементу матрицы слева равны суммы соответствующих элементов справа. Таким образом, используя выраже- ния (5.109)—(5.112), а также матрицу Q из (5.98), и учи- тывая операции, определяемые уравнением (5.108), мо- жем записать следующую систему дифференциальных уравнений: ' / Р11 Р12 р1з\ Pit = а11Р11 + °12Р21 + а1зРз1 ~ + + Риа11 + Р1^а12 + Р13а13 + Я1>
S 22] ФИЛЬТРАЦИЯ ШУМА ИЗМЕРИТЕЛЕЙ 253 • /Р12 ^22 Рзг\ Р22 = 4" а22р22 4" а2зРз2 ~ 4" ~ 4" J 4" + ZJ21fl21 4" Р22а22 + Р23а23 + ?2> _ , , /Т’гз Ргз г|з\ Рзз — iZ'iis + ^згРгз + аззРзз + г,, + Гз)' 4" Рз1°31 4" Р32^32 4" РзЗаЗЗ 4" Яз'1 Р12 — ®uA.S 4* °Л2Р22 + °1зТз2 I ~ I ~ I Z- I Т 1 \ 1 /2 ' 3 / | 4" Pllfl21 4" Р12а22 + Р13О23! Р1з — Л 4" а12Ргз 4" а1.з_Рзз — I ~ I ) + + Р11а31 4" Р12а32 4" Р13«33; ' . . / Р21Р13 , Р22Р23 . Р23РЗЗ\ , ?23 — ail^l I + а22?23 + a23f33 I ------------1---------1 Г— I + \ * 1 '3/ 4" f21a31 4" Р22а32 4" Р23а33- , (5.113) Поскс.. ыну имеют место равенства Р12 — P2I1 Р13 — Р31< Р23 — Р321 уравнеялм для значений р21, р31 и р32 совпадают с послед- ними трчгкя уравнениями системы (5.113). Ан-ыпгнруя способ построения каждого из уравнений системам ’.113), довольно легко установить их общий вид: Pij — ® flP'X Т (li2P2j 4" аззРзз / PilT'lj I ^i2P2j . ^i3P3j\ . \ П "t" Г2 ГЗ / ' + Pilajl 4- Pi2ai2 4" Pi3aj,3 + Qi qi = 0 при i j), i, j = 1, 2, 3. Перепишем эту формулу следующим образом: Ра = ^.\aikPkj + ajkPik — ~^\, 7,/ = 1,2,3. (5.114) ! -1 L Гк J Тогда вычислительная ячейка, соответствующая членам в квадп тыых скобках формулы (5.114), будет иметь струк- турную схему, изображенную на рис. 5.23, а. Из тре.х таких ячеек и интегратора строится структурная схема
254 ФИЛЬТР Ь ХНА — БЬЮСИ [ГЛ. 5 для вычисления значений . Она показана па рис. 5.23, б. Каждая из таких схем име-т шесть входов вида ри, сле- довательно, осуществляя соединение выходов схем с соответствующими входа’ и. можно построить структур- ную схему вычислителя -ментов матрицы дисперсий. Р‘ 5.23. После нахождения значении они используются для реа- лизации блоков переменных коэффициентов к^ в структур- ной схеме фильтра (см. рис. 5.22). Рассмотрим упрощенный случай построения фильтра измерителен летательного нпшарата. Будем в первом приб- лижении не учитывать в зимного влияния звеньев, ха- рактеризующих колебател ое движение летательного ап- парата около центра Mt и апериодическое движение центра масс. При этом кс ициенты п12 п п31 в уравне- ниях (5.97) будут равны гулю. Учитывая также значения коэффициентов из (5.96). получим уравнения (5.97) в следующем виде: с/л-т . ... — = ^-{-^(f), — = nJ?r2 + a3Sx3 + w3 (t). Мы видим, что система уравнений распадается па две не- зависимых системы первог и второго порядков. Соответ- ствующие структурные схе I показаны па рис. 5.24, а и б.
§ 22] <М1 IbTl’AHHH 1ПУМЛ ИЗМЕРИТЕЛЕЙ 255 Для первой системы (параметр х±) при упрощающем предполо» йвпи о стационарности процесса (an = const) легко вычисляется дисперсия ри, а следовательно, опре- деляется и кспффициент усиления ки. Поскольку вы- ходной сигнал системы не зависит от значений х2 и х3, взаимные дисперсии р12 - p2i и Р13 Рз1 равны пулю. б) Рис. 5.24. При эт' первое уравнение системы (5.113) с учетом ри — 0 (устаЕовпвшийся режим) примет вид Ai — %anriPn ri9i — О, откуда ги = йцГг и коэффициент усиления кг1 согласно формуле (5.107) (5.115) Рис. 5.25. Полная ст] ктлрная схема оптимального фильтра приве- дена на рп:. 5.25.
256 ФИЛЬТР КАЛМАПА — БЬЮСИ [ГЛ. 5 Для второй системы также при упрощающем предпо- ложении о стационарности процесса, учитывая условия Р13 = Рзз — 0, р12 = Р21 ~ О, — Cjg = Й21 = “22 ~ fl31 О, из системы дифференциальных уравнений (5.113) получим следующую алгебраическую систему: 2г2г3Рз2 — r3pl2 — r2pl2 + r2rsq., = О, Psi (Г3 -- Ргз) 4" ГЗа32Р22 4" ГЗаЗзР23 = О, 2г27'з («32P23 4“ аЗзРзз) — Г3р23-- Г2РзЗ 4" Г2Г3*/з = О- (5.116) Совместное ее решение позволяет найти дисперсии р22, Рзз и Р23 — Рзг, 11 по формуле (5.107) коэффициенты уси- ления 7. _ Р22 “22--------- Г2 к — 7,23 — к к — Гзэ “23 — — «32> “33 — Полная структурная схема фильтра для рассматриваемой системы приведена на рис. 5.26. Гис. 5.26. ^30 На этом завершил! рассмотрение задачи построения фильтра Калмана — Быоси для фильтрации сигналов измерителей системы управления летательного аппарата.
ЛИТЕРА IУР 1. Бабич О. А., Об оптимальном оценивании фазовых коор- динат линейной динамической системы, Автоматика л телеме- ханика, № 2, 1973. 2. Б о д е Г. В., Ш е н п о и К. Е., Упрощенное изложение ли- нейной минимально-квадратичной теории сглаживания и пред- сказании. Сб. «Теория информации и ее применение», под ред. А. А. Харкевпча, ИЛ, 1959. 3. Б у я к а с В. И., О регуляторах, обеспечивающих автоном- ность управляемой системы, Автоматика и телемеханика, № 3, 1973. 4. Г и х м а н И. И., Скороход А. В., Введение в теорию случайных процессов, «Наука», 1965. 5. Д’А н ж е л о Г., Линейные системы с переменными парамет- рами. Анализ и синтез, «Машиностроение», 1974. 6. Драган Я. П., Модели сигналов в линейных системах, «Наукова думка», Киев, 1972. 7. 3 а б е л л о Л. Е., Об управляемости линейных нестационар- ных систем, Автоматика и телемеханика, № 8, 1973. 8. Заде Л., ДезоерЧ., Теория линейных систем, «Наука», 1970. 9. Ито К., Вероятностные процессы, вып. I, ИЛ, 1960. 10. Ито К., Вероятностные процессы, вып. II, ИЛ, 1963. 11. К а л м а н Р., Бьюси Р., Новые результаты в линейной фильтрации п теории предсказания, Труды американского об- щества инженеров-механиков, серия Д, № 1, 1961. 12. К а л м а н Р., Фал б П., А р б и б М., Очерки по матема- тической теории систем, «Мир», 1971. 13. Колмогоров А. Н., Интерполяция и экстраполяция ста- ционарных случайных последовательностей, Изв. АН СССР, серия математическая, № 5, 1941. 14. К о л м о г о р о в А. Н., Статистическая теория колебаний с непрерывным спектром, Юбилейный сборник АН СССР, ч. I, 1947. 15. Красовский А. А., Системы автоматического управле- ния полетом и их аналитическое конструирование, «Наука», 1973. 16. Красовский Н. Н., Теория управления движением, «Нау- ка», 1968. 17. Л е б е д е в А. А., Черпобровкин Л. С., Динамика полета беспилотных летательных аппаратов, Оборонгпз, 1962. 18. Летов А. М., Динамика полета и управление, «Наука», 1969. 19. Л э н и н г Дж., Б эттпн Р., Случайные процессы в задачах автоматического управления, ИЛ, 1958.
258 ЛИТЕРАТУРА 20. Понтрягин Л. С., Б о л'т янской В. Г., Г а м к ре- ли д в е Р. В., Мищенко Е. Ф., Математическая теория оптимальных процессов, Физматгиз, 1961. 21. П о р т е р У., Современные основания общей теории систем, «Наука», 1971. 22. Р о з о в а В. Н., О полях регулирования динамических сис- тем, Автоматика и телемеханика, № 3, 1973. 23. Современная теория систем управления, под ред. К. Т. Леон- деса, «Наука», 1970. 24. Снайдер Д., Метод уравнений состояния для непрерывной оценки в применении к теории связи, «Энергия», 1973. 25. Солодов А. В., Теория информации и ее применение к задачам автоматического управления и контроля, «Наука», 1967. 26. Солодов А. В., Петров Ф. С., Линейные автоматиче- ские системы с переменными параметрами, «Наука», 1971. 27. Сю Д., М е й е р А., Современная теория автоматического управления и ее применение, «Машиностроение», 1972. 28. Ту Ю., Современная теория управления, «Машиностроение», 1971.
предметный указатель Автомат конечный 46 Адъюнкта 103 Аксиома неравенства треугольника 21 — симметрии 21 Аксиомы линейного пространства 59 — метрического пространства 21 — определения динамической систе- мы 41 — Пеано 13 — скалярного произведения 70 Анализ функциональный 10, 14, 33 Аналитическое конструирование ре- гуляторов 56 Ассоциативность сложения 59 Базис линейного пространства 61, 77 — пространства состояний 95 Белый шум 135 -----нестационарный 137 — — нормальный 136 -----ограниченный 137, 244 Блок матричный 105, 125, 250 — переменного коэффициента 107, 253 Боде метод 175 Броуновское движение 151 Вариации параметров 238 Вектор 57 — базисный 64 — начальных условий 76, 98 — нулевой 59 — ошибки 201 — состояния системы 45, 99, 199 — — сопряженной системы 118 Векторы ортогональные 70 Величины выходные 36, 48, 199 Винера — Хопфа уравнение 169, 205, 222 Воздействия входные 36, 48, 121, 199 Время достижения 48 — наблюдения 189 — перехода 53 Вход системы 36 Выход системы 36 Вычислительная ячейка 253 Вычитание матриц 101 — множеств 16 Геометрическая модель фильтрации 204 Гильберта система аксиом 13 Гильбертово пространство 68, 70, 202 Грань верхняя 20 — — точная 20 —• нижняя точная 20 График 30 — корреляционной функции 131 Движение апериодическое 239 — колебательное 239 — летательного аппарата 233 — — возмущенное 236 — — — продольное 238 — системы 43, 47, 76 — — вынужденное 84, 98 — — свободное 84 Действия над множествами 17 Дельта-функция 85, 110, 135, 154 Динамика систем статистическая 9 Динамическая ошибка 188 — система 35, 40, 49 — — автономная 43 — — обыкновенная 44, 50, 74 — — стационарная 45, 76 Дискретность сигналов измерителей 240 Дисперсия 134 — выходного сигнала 139 — суммы функций 182 — шума квантования 244 Дистрибутивность умножения 59 Дифференциатор 112 Дифференцирование матрицы 102 Диффузионный процесс Маркова 146 Диффузия 152 Длина вектора 58, 65 Дополнение 17 — алгебраическое 103 Евклидово пространство 22 — — ?1-мерное 22, 25 Задача вариационная 124 — идентификация 53 — измерения состояния объекта 201
260 Е:£^_гтаый УКАЗАТЕЛЬ Задача линейной филкпапит Г5 — — — многомерной 7 — оптимального управл^жг >5 — оценки состояния Z ь — реализации системы Ы — управления 47, 200 — — общая 49 — управляемости и 55, 124, 201 — фильтрации математивтжвл - Й Закон умножения асосшп*та.Еый 102 — управления 51 Звено апериодическое 24 — интегрирующее 105 — — многомерное 105 — — одномерное 105 — колебательное 240 — суммирующее 105 Идентичность пространен Измеритель 199, 233, 2 Импульсная переходная <5'чгнкпее 1 119 -----— оптимальная l&t — — — сопряженной сигтзещ :!? Интеграл двойной 183 — Ито стохастический IK1 — Лебега 68. Интегральная связь 111 Интегратор 105 Интегрирование матрицы Интервал 16 — квантования 245 — корреляции 131 — обработки 132 Интерпретация процесса 203 Калмана — Бьюси теории ции 8 Качество управления 51 Ковариация 164 Коды Хэмминга коррсктя^ут’шх Z5 Колмогорова — Винера т цщ.е тртотг- трации 8, 165 Коммутативность сложеь—£ ' ? Конус неопределенности _ Координаты разложения L Корреляционная функци —• Коэффициент взаимной с? гая сжт±г&- лов 24 Критерий качества упрам - кваг- ратичный 51 — минимума средней тззьцг. ской ошибки 165, 189 — эффективности 47 Максимум множества 20 Маркова процесс диффузионный 8, 146 Математическое ожидание 129 Матрица 101 — диагональная 115 — единичная 82, 103 — импульсных переходных функций 86, 117, 141 — квадратная 101 — координатных функций 75 — корреляционная процесса 163 — корреляционных функций 201 — невырожденная 104 — неособая 104 — нулевая 92 — обратная 85, 103, 225 — переходная 8 — решений фундаментальная 81 — системы переходная 82 — спектральных плотностей 164 — столбец 101 — строка 101 — транспонированная 104 Метод Боде — Шепнона 175 — моделирования 181 Метрика гильбертова пространства 202 — элементов множества 21, 44 Минимум множества 20 — средней квадратической ошибки 182 — функционала 205 Миноры определителя 105 Множество 14 — бесконечное 46 — вещественных чисел 19, 41 — двоичных чисел 26 — допустимых значений функций 37, 41 — — управлений 48 — конечное 46 — линейно зависимое 61 — — независимое 61 — непустое 17, 41 — отображений 37 — пустое 16 — упорядоченное 37 — целевое 47, 49 — эквивалентное 16 Множители Лагранжа 191 Моделирование задачи оптимизации 182 Модель системы математическая 42, 53 Момент аэродинамический 234 Мощность процесса полная 134 Лагранжа множители 19 Лемма об ортогональных 1 ж5- ех 207 Линеаризация нелинейных ний 235 Линеаризованная система ттдтддиж! 239 Линейная динамическая гзшгякь ; " Наблюдаемость объектов 8, 121 Направление времени 41 Норма вектора 66 — разности векторов 66 Область интегрирования 140 Объединение 16 Объект управления 47, 121
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 261 Объект управления вполне наблю- даемый 124, 127 — — полностью управляемый 121 Ограниченность подмножества 19 Однозначность взаимная 33 Однородность нормы 66 Определение наблюдаемости 55 — управляемости 55 Определитель 103 Орган управления 235 Ось числовая 19, 31, 45 Отображение 14, 29, 38 — взаимно однозначное 31 — изометрическое 34 — непрерывное 33 — обратное 31 — равномерно непрерывное 34, 44 Отрезок 15, 39 Оценка выходных сигналов измери- телей 232 — состояния 52, 201 Ошибка динамическая 188 — управления 51 Передаточная функция параметри- ческая нестационарная 174 — — фильтра оптимальная 170 Переменная моделирования 186 Переменные состояния 11 Пересечение 16 Переходная матрица системы 82 — составляющая функционала 50 — функция состояния системы 39, 42, 51 Плоскость вещественная 19 Плотность вероятности двумерная 146 — — трехмерная 148 — спектральная 135 Подмножество 15, 30, 204 — собственное 19 Помеха аддитивная 213 Порядок матрицы 101 — моментной функции 129 Последовательность вещественных чисел 28 — Коши 28 Правило построения схем 113, 117 Предел последовательности 28, 66 Представление корреляционной функ- ции каноническое 133 Преобразование изоморфное НО — Лапласа 174 — случайного процесса 138 — Фурье 171, 179 — — обратное 136 Принцип максимума Понтрягина 56 — обратной связи 51 — суперпозиции 73 Проекции ортогональные 205 Произведение векторов скалярное 70, 202 — матриц 102, 216 — множеств 17 Промежуток замкнутый 15 — открытый 15, 40 Пространство 14, 33, 204 — банахово 65, 67 — бесконечномерное 65, 71 — векторное 8, 44, 58 — гильбертово 68, 70 — двоичных кодов Хэмминга 25 — евклидово 22, 71 — интегрируемых функций 67, 71 — кодовое 25 — линейное 58, 64, 72 — метрическое 21, 27, 33, 44, 57 — — полное 29, 66 — натянутое 61, 92 — п-мерное 19 — нормированное 44, 65 — ограниченных по спектру сигна- лов 22, 67 — решений дифференциального урав- нения 63 — событий 43 — состояний системы 8, 11, 43, 91 — трехмерное 22 — фазовое 11, 43, 98 Процесс броуновского движения 151 — диффузии 152 — марковский 146, 150 — — диффузионный 8, 146, 156 — —• линейный 158 — — многомерный 7, 11, 146, 159 — -— нестационарный 151 — — простой 146 — случайный 128 — — нестационарный 129 — — стационарный 129 — с малым интервалом корреляции 133 — стационарный эргодический 149 Разложение вектора по базису 62 — в ряд Фурье 133 Размер матрицы 101 Размерность пространства 44, 62, 72 Разность 16 Ранг матрицы 105, 123 Распределение гауссово 129 Расстояние между элементами 20, 28, 57 Реверс времени 119, 187 Регулятор 53, 122, 188 Решение уравнения 77 — — Фоккера — Планка 154 Риккати уравнение 232, 250 Ряд Фурье 133 Свойства переходной функции со- стояния 40, 42 Свойство полугрупповое 42 Сигнал входной реальный 129 — почти стационарный 133 Сила лобового сопротивления 233 — подъемная 233 Система 35, 43 — аксиом 13 — — Гильберта 13
262 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Система биологическая 14 — динамическая 35, 40, 49 — автономная 43 — — линейная 57, 73, 199 — — обыкновенная 44, 50, 74 — — свободная 43 — — стационарная 45, 76 — дискретная 9 — изоморфная 120 — инвариантная к возмущении 0 — инверсная 110, 120 — координат 61 — неуправляемая 55 — оптимальная 9 — сопряженная 110 — техническая 14 — управления 47 — уравнений линеаризован™ -36 — экономическая 14 След матрицы 201, 210 Следование логическое 16 Сложение матриц 101 Событие 43 Соединение линейных спсте' 86 Составляющая функционала терял- нальная 50 Состояние системы 36, 43, 51 121 Спектр сигнала 23 Структура фильтра 182 Сумма пространств 206 Сумматор 117 Схема инверсная 186 — моделирования 184 — оптимальной фильтрации — статистической обработки 153 — структурная вычислителя 1- — — инверсной системы 120 — — летательного аппарата L1 — — линейной системы 100, ICf <25 --- матричного блока 117. _50 — — оптимального фильтра 2.9, 255 — — сопряженной системы 1 _ — — фильтрации 203 Сходимость последовательности Теорема единственности 77 — отсчетов 23, 64 — существования 77 Теория автоматического управ№1я — информации 10 — линейной фильтрации 11, =• — линейных систем 8 — матриц 100 — систем 7, 10, 13, 35 — фильтра Калмана — Бьюси 9 11 — фильтрации Колмогорова — ми- нера 8, 165 — функциональных пространсп 14 Траектория в пространстве состоя- ний 43 Транспонирование матрицы 10» Угол между векторами 68 Узел разветвления 117 Умножение векторов 69 Умножение матриц 101 — матрицы на скаляр 102 Управление 43, 47 — автоматическое 52 — движением летательного аппарата 235 — допустимое 49 — оптимальное 47 — — детерминированное 56 — — стохастическое 56 Управляемость линейных объектов 8, 121 — полная 122 Уравнение Винера — Хопфа вектор- но-матричное 205 — — — интегральное 169 — выходных величин 76 — Риккати 232, 250 — системы дифференциальное 45 — Смолуховского — Чепмена — Кол- могорова 149 — сопряженное 111 — состояний системы 76 — Фоккера — Планка 154 Уравнения векторно-матричные 11, 100 Условие минимума средней квадра- тической ошибки 169 — управляемости 123, 200 — физической реализуемости 119 Условия наблюдаемости \ 127 Фильтрация линейная 56 — нелинейная 56 — шума измерителей 232 Фильтр идеальный 136, 178 — Калмана — Бьюси 7, 199, 212, 232, 249 — Колмогорова — Винера 165, 181, 232 — линейный для многомерных мар- ковских процессов 7 — — нестационарный 170 — — стационарный 175 — оптимальный 11, 177, 213, 219 — формирующий 178, 213 Фундаментальная матрица решений 81 Функции отсчетов 23, 65 Функционал потерь качества управ- ления 49 Функция 29 — дробно-рациональная 171 — единичная 130 — импульсная переходная 110, 189 — — — фильтра 189 — ковариационная 164 — координатная 13 — корреляционная 129 — — взаимная 183 — — входного сигнала 130 — — стационарного процесса 130 — — шума квантования 241 — —-----нормированная 244 — непрерывная 33 — передаточная оптимального филь- тра 179
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 263 Функция сереходвая состояния си- стемы 39, 42 — плотности версятвости 137 — потерь качества управления 49 — производящая <5. 50 — распред тения иьг тностей вероят- ности 128 — случайная 128 Характеристика распределения 128 Хэмминга пространство 25 Экстремум условнмй 191 Элементы матрицы 101 Энергия одного импульса сигнала 24 — сигналов полная 24, 67 Шаг квантования 240 Шеннона метод 175 Ширина спектра сигнала 23 Шум белый 135 — — нестационарный 137 — — нормальный 136 — — ограниченный 137, 244 — квантования 240
Александр Васильевич Солодов МЕТОДЫ ТЕОРИИ СИСТЕМ В ЗАДАЧЕ НЕПРЕРЫВНОЙ ЛИНЕЙНОЙ ФИЛЬТРАЦИИ (Серия: «Теоретические основы технической кибернетики») М., 1976 г., 264 стр. с илл. Редактор Ф. С. Петров Техн, редактор Н. В. Кошечева Корректор В. П- Сорокина Сдано в набор 21/XI 1975 г.Подписано к печати 21ДУ1976г. Бумага 84Х10Н1,»- Физ. печ. л. 8,25. Усл. печ. л. 13,86. Уч.-изд. л. 12,66. Тираж 4650 экз. Т-05673. Цена книги 1 р. 24 к. Заказ № 3209. Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 2-я типографии издательства «Наука». Москва, Шубинский пер., 10