Текст
                    ИЗДАТЕЛЬСТВО
«МИР»

TOPICS IN MATHEMATICAL SYSTEM THEORY R. E. KALMAN Stanford University P. L. FA LB 'Brown University M. A. ARB I В Stanford University MC GRAW-HILL BOOK COMPANY NEW YORK ♦ SAN FRANCISCO • ST. LOUIS • TORONTO • LONDON-SYDNEY 1969
р. КАЛМАН, П. ФАЛБ, М. АРБИБ ОЧЕРКИ ПО МАТЕМАТИЧЕСКОЙ ТЕОРИИ СИСТЕМ Перевод с английского Э. Л. НАП ПЕЛЬ БАУМ А Под редакцией Я. 3. ЦЫПКИНА ИЗДАТЕЛЬСТВО <МИР» МОСКВА 1971
УДК 519.95 Книга отражает современное состояние математической теории систем — нового и весьма перспективного направления классической теории управления. Она охватывает элементарную теорию автома- тического управления, основы теории оптимального управления, тео- рию конечных автоматов и новейшую алгебраическую теорию ли- нейных систем. Изложение отличается новыми оригинальными ре- зультатами, необычными аналогиями и четкостью. Авторы — известные математики, а Р. Калмана по праву можно считать одним из основателей современной теории систем. Книга рассчитана на математиков и специалистов по теории управления. Методические достоинства книги делают ее весьма цен- ной для аспирантов и студентов старших курсов соответствующих специальностей. Редакция литературы, по математическим наукам Инд. 2-4-1 30-70 Р. Колман, П. Фалб, М. Арбиб ОЧЕРКИ ПО МАТЕМАТИЧЕСКОЙ ТЕОРИИ СИСТЕМ Редактор Л. Попов Художник Н. Власик Художественный редактор В. Шаповалов Технический редактор Е. Потапенкова Корректор Т. Лаврова Сдано в набор 5/VI 1970 г. Подписано к печати 12/1 1971 г. Бумага кн. журн. 60x90’/ie« 12,50 бум. л. 25,00 усл. печ. л. Уч.-изд. л. 23,30. Изд. № 1/5450. Цена 1 р. 82 к. Зак. 693 ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР. Измайловский проспект, 29
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Теория систем — это настолько широкое и неопределенное по- нятие, что даже при весьма скромном воображении под него можно подвести (как это часто и делается в, современной литера- туре) почти все, что составляет предмет изучения естественных и гуманитарных наук. Несколько менее широкое и чуть-чуть более определенное понятие представляет собой математическая теория систем, которой и посвящена настоящая книга. Написанная тремя крупными учеными, принимавшими непо- средственное участие в формировании математической теории си- стем как самостоятельного научного направления, эта книга дает обзор важных достижений в данной области. Бурное развитие математической теории систем делает безна- дежной попытку систематического ее изложения. Систематизация требует времени, в течение которого многие результаты стареют и исчезают или заменяются новыми. Поэтому чрезвычайно важно иметь пусть моментальный снимок, но снимок, сделанный в наши дни, который передавал бы основные черты современного состоя- ния математической теории систем. Таким снимком, выполненным руками мастеров, и является книга Р. Калмана, П. Фалба и М. Арбиба. Характерная особен- ность этой книги состоит в том, что в ней изложены не только ре- зультаты собственных исследований авторов, но и их (порой раз- личные) точки зрения на уже вошедшие в обиход понятия и ре- зультаты. Книга состоит из введения и четырех частей. Введение представляет собой своеобразный путеводитель по книге, знакомящий читателя с основными понятиями и опреде- лениями и позволяющий составить представление о содержании всех частей книги. Первая часть (автор Р. Калман) посвящена изложению эле- ментарной теории автоматического управления с современной точки зрения. Во второй части (П. Фалб) рассматриваются основы совре- менной теории оптимального управления. Третья часть (М. Арбиб) посвящена теории автоматов. В четвертой части (Р. Калман), завершающей книгу, изло- жена новейшая алгебраическая теория линейных систем. Об этой теории следует кратко сказать. Процесс алгебраизации уже Давно происходит в теории линейных систем. Примером могут
6 Предисловие редактора перевода служить преобразование Лапласа, преобразования Фурье, как не- прерывные, так и дискретные, различного рода интегральные преобразования. Изучение внутренней алгебраической структуры линейных систем, представленное в четвертой части книги, позво- ляет связать между собой теории конечных автоматов, импульс- ных систем и непрерывных систем. Перечисленные выше четыре части книги независимы друг от друга и могут изучаться раздельно. Это обстоятельство, воз- можно, натолкнет на мысль о том, что книга Р. Калмана, П. Фалба и М. Арбиба не монография, а просто сборник их работ. Быть может, это и так. Но в любом случае она отличается от многих книг по теории управления и теории систем новыми ориги- нальными результатами, чрезвычайно интересными взглядами на известные результаты, необычными аналогиями, строгостью и чет- костью изложения. Книга представит интерес и будет полезна широкому кругу читателей, от студентов до научных работников. Изучение книги требует определенных усилий. Но тот, кто затратит их, окажется в центре событий, происходящих сейчас в теории систем. Я. Цыпкин
To CONSTANTINA, FORTUNA, and PRUDENCE ПРЕДИСЛОВИЕ Детище трех отцов, обязанное своим появлением стечению обстоятельств, эта книга не претендует на систематичность. На- против, в ней мы стремились представить математическую теорию систем в ее истинном нынешнем свете — как увлекательную, инт- ригующую, волнующую, трудную, запутанную, многообещающую и в значительной степени неизведанную область знаний, уже се- годня играющую важную роль, а в будущем обещающую новые еще более перспективные открытия. Ограниченность объема книги, сжатые сроки работы и повсе- дневная занятость исследователей полностью исключают возмож- ность систематического описания того переворота, который про- изошел в рассматриваемой области в конце пятидесятых и начале шестидесятых годов. Такого рассказа не следует ожидать в бли- жайшем будущем ни от нас, ни от кого-либо другого. Поэтому мы попытались выделить лишь четыре, по-видимому, основные идеи, связанные с понятиями состояния, управления, оптимизации и реализации. Мы пытались также донести до читателя очень важ- ную для нас мысль о том, что теория систем представляет собой не просто одну из ветвей прикладной математики, а является источником задач и интуитивных представлений, в которых нетри- виальным образом переплетаются математический анализ и ал- гебра. В то же время многие важные вопросы, такие, как проб- лема устойчивости, качественная теория дифференциальных урав- нений, алгебраическая лингвистика, прикладная теория управле- ния, теория переключающихся схем, теория автоматов на базе математической логики и т. д. и т. п., здесь затронуты лишь вскользь или вовсе не упомянуты. Каждая из четырех частей книги независимо написана одним из авторов, как это и видно из оглавления. Мы не предпринимали никаких попыток устранить повторы (они есть, и мы надеемся, что они будут полезными читателю); мы не стремились к единообраз- ной системе обозначений (таковую просто невозможно установить без того, чтобы не ввести читателя в заблуждение относительно существующего разнобоя в литературе), и, наконец, при редакти- ровании книги были сохранены следы индивидуальности стиля каждого из авторов.
8 Предисловие Мы надеемся, что книга будет полезной для самостоятельного изучения, особенно тем читателям, у которых нет личного кон- такта с одним из «центров» в данной области. Материал располо- жен так, что книгу можно использовать для семинаров или для семестровых или полусеместровых спецкурсов по оптимизации, теории автоматов или алгебраической теории линейных систем. Что же касается научных работников или аспирантов, то они най- дут здесь много новых отправных точек для будущих исследова- ний. Выбор материала диктовался лишь личными интересами ав- торов (начиная с 1965 г.) и потребностями изложения. Основное содержание книги было апробировано на семинарах и специаль- ных лекциях. Ядром книги служат лекции, прочитанные авторами в 1965 г. в Стэнфордском университете во время летней школы Американ- ского общества распространения технических знаний и Нацио- нальной администрации по аэронавтике и космическим исследо- ваниям. Различные части книги написаны в разное время. Вторая часть была завершена П. Фалбом в основном к весне 1966 г. и, естественно, не вполне отражает нынешнюю точку зрения автора. Гораздо позже написаны § 3.6 и приложение 4.А этой части. Из- ложение теории автоматов (М. Арбиб) было готово уже в 1965 г. и с тех пор лишь незначительно переработано. Первая часть (Р. Калман) была написана в 1966 г. и пересмотрена в 1967 г., но ее содержание было известно в научных кругах уже в самом на- чале шестидесятых годов. Основу материала четвертой части со- ставляют исследования, выполненные в 1965 г., но окончательный вариант был завершен лишь в конце 1967 г. Всякое мероприятие подобной сложности нельзя осуществить без помощи со стороны, и в нашем случае нам помогали многие. Прежде всего мы хотели бы выразить нашу искреннюю призна- тельность за постоянную и всестороннюю поддержку . правитель- ству Соединенных Штатов, и в частности Управлению научных исследований ВВС США, а также Национальной администрации по аэронавтике и космическим исследованиям. Мы благодарны проф. М. Анликеру — организатору летней школы в 1965 г., кото- рый постоянно вдохновлял нас при завершении работы над руко- писью. Р. Калман весьма обязан руководителям университетов Миннесоты (1965), Нью-Мехико (1966) и Лондонского королев- ского колледжа (1967) за приглашения прочесть специальный курс лекций и, конечно же, руководителям Стэнфордского универ- ситета, в котором часть материала читалась (1965—1968) на стар- ших курсах. П. Фалб выражает благодарность Г. Кушнеру, Э. Джильберту и Д. Клейнману за полезные обсуждения. М. Ар- биб глубоко признателен Р. Свенсон за поддержку его работ, проф. Дж. Весткотту из Лондонского колоревского колледжа и проф. Дж. Блатту из Университета Нового 'Южного Уэльса (Авст-
Предисловие 9 ралия) за приглашение прочесть лекции в период 1964—1965 гг., когда и формировался в основном материал третьей части книги. Каждый из нас имел важные беседы с проф. X. Зейгером, влияние которого ощущается во многих местах книги. Мы обязаны д-ру П. Форру, прочитавшему большую часть рукописи и предло- жившему внести некоторые важные исправления. Мы глубоко бла- годарны также миссис М. Ньюком, Дж. Парсонсу, К. Нолан и миссис К. Омура за квалифицированную помощь. Мы также очень признательны издателям за их сотрудничество, полное юмора и понимания. Наконец, все лавры и претензии, связанные с замыслом этой книгиг возлагаются на издателей, уговоривших П. Фалба и М. Ар- биба уговорить Р. Калмана взяться совместно за столь нелегкое предприятие, в то время как все упреки по поводу неверных ссы- лок на литературу, противоречивых обозначений, опечаток и по- добного рода недочетов следует адресовать одному лишь Р. Кал- ману, взявшему на себя труд общего редактирования. Р. Калман, П. Фалб, М. Арбиб

ВВОДНАЯ ЧАСТЬ Р. Калман, П. Фалб, М. Арбиб 1 В помощь читателю Чтобы дать некое единое представление об увлекательной, но неупорядоченной новой области теории систем, мы посвящаем эту главу общему обзору различных взаимосвязанных вопросов, рассмотренных в этой книге. Принципиальной основой для после- дующего изложения служит содержание § 1.1, в котором дается довольно длинное формальное определение системы (точнее, дина- мической системы) и поясняется используемая в дальнейшем терминология. Если не считать терминологической общности, все четыре части книги являются автономными. Первая часть (гл. 2) очень проста и предназначена для того, чтобы подготовить чита- теля к каждой из трех узких тем книги: проблеме оптимизации (вторая часть, гл. 3—5), проблеме описания системы и ее струк- туры (третья часть, гл. 6—9) и современной теории линейных си- стем (четвертая часть, гл. 10). 1.1 Системы и состояния В этой книге мы будем рассматривать теорию систем как тео- рию динамических взаимосвязей. Такие термины, как «системы», «системные подходы», «системные понятия» и «системотехника», используются в настоящее время настолько широко и свободно, что это приводит лишь к дополнительной путанице. Однако для нас система, а точнее динамическая система — это строгое мате- матическое понятие. Поэтому теория систем в основном, хотя и не полностью, является областью математики. Прежде чем перейти к формальному определению понятия ди- намической системы, рассмотрим вкратце интуитивные представ- ления, с которыми оно связано. Мы рассматриваем систему как структуру, в которую в определенные моменты времени вводится нечто (вещество, энергия или информация) и из которой в какие- то моменты времени выводится что-то. Например, мы можем пред* ставить себе систему как электрическую цепь, входным воздей-
/2 1В помощь читателю ствием для которой служит напряжение, а выходной величиной — показание прибора, измеряющего силу тока. Или мы можем ду- мать о системе, как о системе переключающихся элементов, входными воздействиями для которой являются включения или выключения нескольких входных переключателей, а выходной ве- личиной— картина, образованная горящими и погашенными лам- почками. В первом из этих примеров можно считать, что события происходят непрерывно во времени (поскольку обычно электриче- ские сигналы меняются непрерывно во времени), а во втором естественнее предполагать, что время дискретно (скажем, выклю- чатели можно переключать лишь каждые пять секунд). И в том и в другом случае наше понятие"системы 2 включает вспомогательное множество моментов времени Т. В каждый мо- мент времени I &Т система 2 получает некоторое входное воздей- ствие u(t) и порождает некоторую выходную величину y(t).Будем предполагать, что значения входных воздействий выбираются из некоторого фиксированного множества U, т. е. в любой момент времени t символ u(t) должен принадлежать U. В самом общем случае отрезок входного воздействия системы не может быть со- вершенно произвольной функцией <о :(6,6)-*^, но должен при- надлежать некоторому узкому классу й. Выбор й может дикто- ваться физическими соображениями, но чаще всего он опреде- ляется математическими потребностями. Что касается выходных величин, то любое мгновенное значение выходной величины y(t) также принадлежит некоторому фиксированному множеству Y, и обычно на «допустимые» отрезки выходных величин у : (t2, t3) -> Y накладываются лишь довольно слабые ограничения. Заметим, что одного знания текущего значения входного воз- действия u(t) может оказаться недостаточным для предсказания выходной величины y(t). Предыдущие входные воздействия, пода- вавшиеся на систему, могли изменить 2 (например, из-за накоп- ления энергии в первом приведенном примере или из-за срабаты- вания некоторого внутреннего переключателя во втором) настоль- ко, что это приведет к изменению выходной величины. Другими сло- вами, в общем случае значение выходной величины системы 2 за- висит как от текущего значения входного воздействия, так и от предыстории этого воздействия. Лучше всего было бы не делать специальных различий между текущим и предшествующим вход- ным воздействием системы. Поэтому мы будем говорить, что теку- щее значение выходной величины системы 2 зависит от состояния системы 2, и определим чисто интуитивно текущее состояние си- стемы 2 как такую часть настоящего и прошлого системы 2, которая необходима для определения настоящих и будущих значений выходной величины. Другими словами, мы рассмат- риваем состояние системы 2 как некоторую (внутреннюю) харак- теристику системы 2, значение которой в настоящий момент
1.1 Системы и состояния 13 времени определяет текущее значение выходной величины и ока- зывает влияние на ее будущее. И если рассуждать~совсем упро- щенно, то состояние можно рассматривать как своего рода храни- лище информации, или запоминающее устройство, или накопи- тель прецедентов. При этом нам нужно, конечно, потребовать, что- бы множество внутренних состояний системы 2 было достаточно богатым для того, чтобы вместить всю информацию о предысто- рии системы 2, необходимой для предсказания влияния прошлого на будущее. Однако мы не станем требовать, чтобы состояние со- держало лишь минимум такой информации, хотя, конечно, подоб- ное требование является удобным упрощающим предположением. Для того чтобы заслужить название «динамической», система S должна обладать еще одним свойством. Знание состояния х(Л) и отрезка входного воздействия ® = <*><#,, у должно быть необхо- димым и достаточным .условием, позволяющим определить1) со- стояние x(t2) = ф(/2‘, Л, ®) каждый раз, когда Л < t2. Заме- тим, что в связи с этим придется потребовать, чтобы множество моментов времени Т было упорядоченным, т. е. чтобы в нем было определено направление времени. Обычно упорядоченность мно- жества Т выбирается так, чтобы прошлое предшествовало буду- щему. Заметим также, что введенное понятие «динамической» си- стемы2), грубо говоря, совпадает с понятием «причинной» систе- мы в том смысле, что прошлое влияет на будущее, но не наоборот. Короче говоря, математическое понятие динамической системы служит для описания потока причинно-следственных связей из прошлого в будущее. Теперь мы подготовлены к формальному определению. (1.1) Определение. Динамической системой 2 называется сложное математическое понятие, определяемое следующими аксиомами. (а) Заданы множество моментов времени Т, множество со- стояний X, множество мгновенных значений входных воздействий U, множество допустимых входных воздействий й = {®: Т -> U}, множество мгновенных значений выходных величин У и множество выходных величин _Г = {у:Г->У}. (Ь) (Направление времени.) Множество Т есть некоторое упо- рядоченное подмножество множества вещественных чисел. ’) Мы не собираемся рассматривать здесь вероятностные динамические си- стемы (условные марковские процессы), у которых текущее состояние x(ti) и входное воздействие <в определяют не х(/2), а лишь его вероятностное распреде- ление Рг(/2;х(6), ш). 2) Некоторые авторы предпочитают неологизм «неупреждающая», который, с нашей точки зрения, несет тот же смысл, что и прилагательное «динамиче- ская».
14 I В помощь читателю (с) Множество входных воздействий Q удовлетворяет следую- щим условиям: 1) (Нетривиальное™.) Множество Q непусто. 2) (Сочленение входных воздействий.) Назовем отрезком входного воздействия а»^,, t,i для toe й сужение со на (Л, t2] П Т. Тогда если <о, о'ей и ti < t2 < t2, то най- дется такое о" е й, что со", у = со^ w и со", ,з] = со', <а). (d) Существует переходная функция состояния ср:ГХТхХХЙ -* X, значениями которой служат состояния x(t) = <p(Z; х,х, и) е X, в которых оказывается система в момент времени t е Т, если в начальный момент времени неТ она была в начальном состоя- нии х = х(х) е X и если на нее действовало входное воздействие со е й. Функция ф обладает следующими свойствами: (Направление времени.) Функция ф определена для всех t^x и не обязательно определена для всех t<xl). 2) (Согласованность.) Равенство ф(/;/, х,<о)=х выпол- няется при любых t е Т, любых х е X и любых а е й. 3) (Полугрупповое свойство.) Для любых t\ < t2 < t2 и лю- бых х е X и со е й имеем ф(/з! 6, X, ®) = ф(/з^2, ф (^2» Л» X, со) , со) « 4) (Причинность.) Если со, со' е й и со(т f] = со'г, q, то ф(/; т, х, со) = ф(/; х, х, со'). (е) Задано выходное отображение тр TxX->Y, определяю- щее выходные величины y(t) ~ ц(1, x(i)). Отображение (т, Z] —> К, задаваемое соотношением ел—*г](о, ф(о; т, х, со)), os(t, /]2), на- зывается отрезком выходной величины, т. е. сужением у(т некоторого у е Г на (т, /]. Говоря о тех или иных объектах, введенных в этом формаль- ном определении (1.1), общепринято и удобно пользоваться бо- лее выразительной терминологией. Наиболее распространены сле- дующие термины. Пару (т, х), где х е Т и х е X, называют собы- тием (или фазой) системы 2, а множество Т X X — пространст- вом событий (или фазовым пространством) Системы 2. (Иногда, особенно в физике, фазовым пространством называют и само про- странство состояний, но такая терминология устарела и вносит путаницу.) Переходную функцию состояний ф (или ее график в про- странстве событий) называют различными более или менее экви- валентными терминами; траекторией, движением, орбитой, пото- ком, решением (обыкновенного дифференциального уравнения), *) Таким образом, обозначение <р: ГХГХ^ХЯ-*^ не вполне корректно. г) Символ ai—>Ь означает, что отображение А -> В ставит в соответствие элементу а е А элемент b е В,
1.1 Системы и состояния 15 кривой решения и т. д. Мы будем также говорить, что входное воздействие, или управление со, переносит, переводит, изменяет, преобразует состояние х (или событие (т,х)) в состояние ф(/- т, х, со) (или в событие (t, <p(Z; т, х, со))). Говоря о движении системы, мы будем обычно иметь в виду функцию состояний <р. Назовем систему 2 свободной, если множество £2 содержит лишь один элемент. Этот случай соответствует ситуации, в кото- рой 2 изолирована от входных воздействий и единственным воз- действием является сама «окружающая среда». Например, сол- нечная система в той мере, в какой ее описывают уравнения небесной механики, является свободной системой, поскольку един- ственные силы, действующие в системе, определяются гравитацией и, следовательно, зависят лишь от состояния системы (точнее, от положения различных планет). Если система 2 к тому же и ли- нейна (определение этого понятия приводится ниже), то обычно в качестве Й используется нульмерное векторное пространство, т. е. множество (0). Система 2 называется обратимой, если пере- ходная функция определена для всех значений t и т, а не только тогда, когда Иногда мы будем говорить о динамической системе как о вось- мерке 2= (Г, X, U, й, У, Г, <р, т]). Прилагательное «динамическая» мы будем упоминать лишь тогда, когда нам понадобится лишний раз подчеркнуть это свойство. Понятие динамической системы в том виде, как мы его только что определили, является чрезмерно общим. Такое определение необходимо для того, чтобы выработать общую терминологию, ис- следовать и уточнить основные понятия и разглядеть единство в разнообразии приложений, но недостаточно конкретно для того, чтобы на его основе можно было получить широкий набор глубо- ких математических результатов и практически полезных выводов. Чтобы добраться до сильных теорем и интересных приложений, нам придется заняться конкретизацией и ввести дополнительные структуры. А по мере того как в этой книге мы займемся изуче- нием стандартных задач теории систем — задач устойчивости, управления, идентификации, оптимизации, эквивалентности, струк- туры, декомпозиции и синтеза, — окажется удобным и необходимым ограничиться рассмотрением различных частных классов систем. Разберем теперь наиболее важные свойства систем, которыми мы будем пользоваться в дальнейшем. Система называется постоянной, или стационарной, если ее ре- акция на заданный отрезок входного воздействия при условии, что система находилась в заданном состоянии, не зависит от того, в каком промежутке времени осуществляется этот опыт. Другими словами, для таких систем основные соотношения (структура) не меняются во времени. Придадим теперь этим соображениям фор- му строгого определения.
16 1 В помощь читателю (1.2) Определение. Динамическая система S называется стацио- нарной (постоянной) тогда и только тогда, когда (а) Т есть аддитивная группа (относительно обычной операции сложения вещественных чисел); (b) Q замкнуто относительно оператора сдвига 2Т: со опре- деляемого соотношением со' (/) = <a(t + т) при всех т, t е Г; (с) <р (/; т, х, ®) = <р (/ + s; т + s, х, zso) при всех s е Т; (d) отображение т](<, •):%-» У не зависит от /’)• Литература по теории систем посвящена в основном стацио- нарным системам, поскольку их гораздо проще исследовать, чем нестационарные. Мы последуем этой традиции и построим опреде- ления и выведем результаты в первую очередь для стационарных систем, предоставив читателю самому решать, какие из них можно распространить на более общий случай. Однако во многих слу- чаях, и в особенности в таких фундаментальных вопросах, как определение управляемости, постановка оптимальной задачи упра- вления или эквивалентность систем и т. д., следует помнить, что допущение о стационарности системы не приводит к сущест- венным упрощениям. Метод доказательства для более общего слу- чая может оказаться намного сложнее, но центральные идеи до- казательства, как правило, сохраняются. В связи с этим во второй части книги мы обычно не требуем стационарности системы. Нет необходимости в стационарности системы и для первой части, но здесь это предположение приводит к существенным упрощениям. Для третьей и четвертой части книги стационарность сущест- венна, поскольку там используется в основном алгебраический ап- парат. Другая классификация систем опирается на следующее опре- деление. (1.3) Определение. Динамическая система Б называется системой с непрерывным временем тогда и только тогда, когда Т совпадает с множеством вещественных чисел, и называется системой с диск- ретным временем тогда и только тогда, когда Т есть множество целых чисел. Во многих приложениях теории систем различие между систе- мами с непрерывным и дискретным временем не существенно, и выбор между ними диктуется в основном соображениями матема- тического удобства. Системы с непрерывным временем соответст- вуют моделям классической физики, а системы с дискретным вре- менем появляются естественным образом каждый раз, когда в си- ’) Обозначение /(/,•) означает, что рассматривается функция неуказанного аргумента.
1.1 Системы и состояния 17 е стему входит вычислительная машина. В первой части книги мы рассматриваем системы с непрерывным временем (дифференциаль- ные уравнения) из-за прочной традиции, связанной с физическими приложениями. Во второй части мы снова изучаем системы с не- прерывным временем, так как это позволяет нам воспользоваться методами вариационного исчисления и другими аналогичными ме- тодами. В третьей и четвертой частях, имеющих в основном алге- браический характер, естественным объектом исследования яв- ляются системы с дискретным временем. Наиболее важной мерой сложности системы является струк- тура ее пространства состояния. В связи с этим целесообразным кажется следующее определение. (1.4) Определение. Динамическая система S называется конечно- мерной тогда и только тогда, когда X является конечномерным линейным пространством. При этом dim S = dim .Xs. Система S называется конечной тогда и только тогда, когда множество X конечно.' Наконец, система S называется конечным автоматом то- гда и только тогда, когда все множества X, U и У конечны и, кро- ме того, система стационарна и с дискретным временем. Конечные автоматы образуют простейший общий класс систем, подвергшийся изучению. Как будет видно из материала третьей части книги, исследование конечных автоматов требует привлече- ния лишь финитных методов логики и алгебры. Предположение о конечномерности системы чрезвычайно суще- ственно с точки зрения получения конкретных численных резуль- татов. Ведь даже тогда, когда речь идет о системах с распреде- ленными параметрами, которые безусловно являются бесконеч- номерными системами, последний этап численного анализа предполагает использование конечных приближений, а это, грубо говоря, эквивалентно неявному допущению о конечномерности си- стемы. Однако с теоретической точки зрения естественнее восполь- зоваться аппаратом функционального анализа и предположить, например, что пространство X банахово1)- Именно этой точки зрения мы и придерживаемся во второй части книги. В первой ча- сти и до некоторой степени в четвертой роль основных допущений играют предположения о конечной размерности пространства со- стояний и линейности системы. В-третьей части рассматриваются последствия предположения о конечномерности системы без пред- положения о ее линейности. *) Естественно, что если пространство состояний системы бесконечномерно, очень важно договориться о том, какой топологией мы будем пользоваться. Определение топологии придется ввести в фундаментальное определение систе- мы S; системы, отличающиеся лишь топологиями пространства состояний, нуж- но будет считать различными. В этой книге мы избегаем задач такого рода, так как соответствующая теория недостаточно развита,
18 1 В помощь читателю На протяжении всей книги понятие линейности играет очень важную роль. Прежде всего это объясняется желанием восполь- зоваться многочисленными достижениями «линейной математики». Но, кроме того, теория линейных систем необходима нам и для изучения локального поведения непрерывных нелинейных систем. С технической точки зрения последнее соображение является главным мотивом для изучения линейной теории. Предположение о линейности кажется настолько заманчивым, что авторы многих элементарных учебников по теории систем на- чинают с объяснения «принципа» (а не допущения) суперпози- ции1), не утруждая себя ни должным вниманием к проблемам причинности или понятию состояния, ни даже четким определе- нием самого понятия системы. Каковы бы ни были педагогические достоинства указанного подхода, читателю подобных учебников грозят серьезные трудности, которые встанут перед ним позже при необходимости изучения таких разделов теории систем, как нелинейная механика, теория устойчивости, теория конечных авто- матов и т. п. А так как мы в этой книге делаем специальный упор на единство теории систем, то мы предпочитаем определить ли- нейную систему в духе фундаментального определения. (1.5) Определение. Динамйческая система S называется линейной тогда и только тогда, когда (а) пространства X, U, й, У и Г суть векторные пространства (над заданным произвольным полем К); (Ь) отображение <р(/;т, •, •): ХХЙ->Х является /(-линейным при всех t и т; (с) отображение т] (/, •)• X -> У является /(-линейным при лю- бых t. Если же, кроме того, потребовать, чтобы множества X, U и У были конечномерны, а сама система S стационарна, то теория си- стем начинает все больше походить на классическую линейную алгебру. Именно на этой точке зрения базируется первая часть книги. Однако более пристальное изучение результатов первой части книги показывает, что классическая линейная алгебра не позволяет адекватно выражать результаты теории систем наибо- лее естественным образом. Это приводит нас к необходимости изу- чения модулей с конечным множеством образующих над кольцом многочленов (четвертая часть книги). Такой переход отражает одновременно и те сдвиги в чисто математических аспектах ли- нейной алгебры, которые привели к замене изучения векторных !) Термин «принцип суперпозиции» заимствован, по-видимому, из квантовой механики. Этот термин устарел и вносит путаницу. В квантовой механике «су- перпозиция» означает, что пространство состояний является линейным; в теории систем «суперпозиция» означает, что зависимость выходных величин от входных воздействий линейная.
1.1 Системы и состояния 19 пространств изучением модулей (Бурбаки [1962]). Однако при- чины этих двух перемен совершенно различны. До сих пор, определяя различные свойства систем, мы пользо- вались лишь простейшими теоретико-множественными и алгебраи- ческими понятиями. Но если мы хотим использовать такой слож- ный математический аппарат, как дифференциальное и интеграль- ное исчисление и анализ, то в определение системы S потребуется включить некоторые допущения о непрерывности. В связи с этим придется предположить, что различные множества (Т, X, U, Й, Y, Г) являются топологическими пространствами и что отображе- ния ф и т) непрерывны относительно соответствующей (тихонов- ской) топологии. Более того, нам будет важно знать, насколько гладко во времени происходят переходы в пространстве состояний. Мы не будем здесь углубляться в детали, так как математически они в основном не принципиальны. В гл. 3 приводится строгое определение (2.1) гладкой динамической системы, которое осо- бенно удобно для исследования задач оптимизации. Здесь же мы ограничимся лишь предварительным определением «гладкости». (1.6) Определение. Динамическая система S называется гладкой тогда и только тогда, когда (а) Т = R есть множество вещественных чисел (с обычной то- пологией) ; (b) X и О суть топологические пространства; (с) переходное отображение ф обладает тем свойством, что (т, х, со) I—> ф (т, х, ©) определяет непрерывное отображение Т’ХХХЙ-^С^Т-^Х)1). В § 2.1 доказывается теорема о том, что при определенных до- полнительных предположениях поведение гладкой динамической системы описывается дифференциальными уравнениями. Все классические динамические системы относятся к этому типу. Ко- нечно, дело вкуса, определять ли гладкую динамическую систему как систему, описываемую дифференциальным уравнением (как в определении (2.1) гл. 3), или основываться на определении (1.6), а затем доказывать теорему: если система S является гладкой, то переходная функция ф2 удовлетворяет дифференциальному урав- нению (см. теорему (1.1) гл. 2). Хочется обратить внимание читателя на то, что «входные воз- действия» и «выходные величины» играют в нашем определении системы столь же важную роль, как понятие «состояние». Нас одинаково будут интересовать как взаимодействие системы с окру- жающей средой (описываемое функциями о и у), так и внутрен- нее поведение системы (описываемое ф). *) С1 (Г обозначает семейство С* функций Г->Х.
20 1 В помощь читателю Это замечание особенно важно для третьей и четвертой частей книги, где встречается много примеров систем, исходно определяе- мых своими преобразованиями входных воздействий в выходные величины. При этом мы имеем в виду следующее. Для любого за- данного начального состояния (т, х) и отрезка входного воздейст- вия <°(т, системы S задается реакция системы у(т> т. е. за- дается отображение tТ, X* Ш(Т, f J Y(T, tj* Если предположить известной структуру системы в смысле опре- деления (1.1), то значение выходной величины в момент времени t е (т, 11] определяется из соотношения (1.7) fx х(®(тj<ll)(O = n(t ф(*; т, х, <в)). И обратно, каждое семейство функций, обладающих теми же свойствами, что и функции из соотношения (1.7) (т. е. являю- щиеся композицией функций <р и t|, удовлетворяющих условиям (l.ld) и (1.1е)), можно рассматривать как определяющее систему с точки зрения преобразования входных воздействий в выходные величины. Сформулируем теперь строгое определение. (1.8) Определение. Динамической системой S (с точки зрения ее внешнего поведения) называется сложное математическое поня- тие, определяемое следующим образом: (а) Заданы множества Т, U,Q,Y и Г, удовлетворяющие всем свойствам, перечисленным в определении (1.1). (Ь) Задано множество А, индексирующее семейство функций = TXQ-+Y, ае=Л), где каждый элемент семейства записывается в явном виде как fa(t, со). = y(t), т. е. является выходной величиной для входного воздействия ©, полученной в эксперименте а. Каждое fa назы- вается отображением вход —выход и обладает следующими свой- ствами: (1) (Направление времени.) Существует такое отображе- ние г. Д—*Г, что fa(t,o)) определено при всех t > i(a). (2) (Причинность.) Пусть т, t Т и т < t. Если и, а'е йи ®(т, fl = ®(т, fl» то fa{t,a) = fa(f, ©') при всех а, для которых т = i(a). В соответствии с этим определением динамическую систему можно рассматривать как некоторый абстрактный набор экспери- ментальных данных. Входящие в него «эксперименты» пронуме- рованы с помощью абстрактного параметра а и состоят в том, что на вход системы подаются некоторые входные воздействия и на-
1.1 Системы и состояния 21 блюдаются соответствующие выходные величины (стимулы-*реак- ция). При этом, конечно, нужно подходить к описанию этих экс- периментов с научной точки зрения и не накладывать на них никаких условий, которые могли бы в неявном виде ограничить множество возможных исходов эксперимента еще до его начала. Условие (Ы) просто позволяет судить, когда начался каждый экс- перимент, а условие (Ь2) требует, чтобы два эксперимента полу- чали разные индексы, если они приводят к разным результатам в кажущихся идентичными условиях. Задача реализации состоит в построении динамической систе- мы в смысле определения (1.1) по данным, обеспечиваемым опре- делением (1.8). Таким образом, это просто абстрактная формули- ровка научного подхода к построению моделей. При этом ока- зывается, что на абстрактном уровне решение этой задачи удивительно просто. Здесь мы лишь наметим его основные черты, предоставив подробный разбор читателю в качестве самостоятель- ного нетривиального упражнения. Позже мы приведем исчерпы- вающую теорию эффективного решения проблемы реализации для некоторых важных частных случаев (гл. 10). Множество А, очевидно, соответствует некоторому подмноже- ству из Т X X. Однако множество А может оказаться недостаточно богатым. Некоторые принципиально осуществимые эксперименты могут быть не перечислены в А. Поэтому нам нужно расширить семейство &" таким образом, чтобы оно содержало все функции, полученные следующим образом: если т < t\ < tz, а, w'eQ и « = то функция g, удовлетворяющая соотношению g(t, co') = fa(t, co), Z2]> i(a) = t, должна принадлежать ST. Обозначим эту функцию g через fp, где Тогда нужно положить i(p) — t\ и заменить А на более ши- рокое множество Л U {₽}. Теперь пространство состояний в момент времени х можно определить как ^т = {аеЛ: с(а) = т} и положить те? После этого нетрудно по виду fa найти определения функций <р и т], удовлетворяющих условиям (l.ld) и (1.1е). Например, полу- групповое свойство (l.ld3) оказывается следствием правила по- полнения объясненного выше. Впрочем, нас поджидает одна трудность. Функция <р может быть определена не всюду на (ТхХ), а только для таких (т, х), что хеХ,. Это ограничение является неизбежным для любой экспериментальной ситуации. Его можно обойти (как это и делается в научной практике),
22 1 В помощь читателю предположив, что система стационарна. Переход от представления {A, F} к представлению {X, <р, т|} играет особенно важную роль в теории конечных автоматов (гл. 7). В литературе о проблеме реализации имеется много путаницы. Например, Задэ и Дезоер [1963] пытались использовать в качестве фундаментального определение, которое гораздо ближе к опреде- лению (1.8), чем к определению (1.1); тем не менее они требовали выполнения некоторых условий «самосогласованное™» (наподо- бие условия (1.ЩЗ), налагаемых на результаты эксперимента для того, чтобы объект экспериментирования можно было отнести к числу «динамических» систем. Такие условия «самосогласован- ное™» оказываются излишними, если принять определение типа (1.8) (см. также лекции Уиндекнехта [1967]). Отметим, что пред- мет спора имеет здесь не философский (существует ли вообще пространство состояний или нет), а прикладной математический характер (как эффективно конструировать пространство состоя- ний X). На этом заканчивается описание общей картины, которую дол- жен представлять себе читатель для того, чтобы приступить к ин- терпретации конкретных исследований в этой книге. В ней он встретится с применением многих совершенно различных разделов математики: теории дифференциальных уравнений, вариационного исчисления, функционального анализа (в задачах теории управле- ния), а также комбинаторики и теории полугрупп, групп и моду- лей (в задачах теории конечных автоматов). Он будет свидетелем переплетения аналитических и алгебраических подходов, анало- гичного переплетению алгебраической теории конечных групп и аналитической теории групп Ли в теории групп. И мы надеемся, что, закончив эту книгу, читатель будет в состоянии выбрать для своей задачи теории систем тот метод, который больше всего к ней подходит независимо от существующих традиций или привычек. (1.9) Исторические замечания. Наше определение динамической системы непосредственно обобщает классическое математическое определение системы (см. определение Немыцкого и Степанова [1949]). Это последнее появилось в результате идеализации свойств обыкновенных дифференциальных уравнений, которые со времени создания ньютоновой модели солнечной системы играют важную роль в физике. Решения дифференциальных уравнений обладают двумя особыми свойствами. Они определяют динамические систе- мы, являющиеся гладкими и обратимыми (<р определено для всех t, а не только для t > т). Поэтому на нашем языке класси- ческие динамические системы — это стационарные гладкие обра- тимые свободные (й содержит всего один элемент) и (обычно) конечномерные системы с непрерывным временем и тривиальным выходным отображением ri(t,x) = х.
1.2 Элементарная теория управления 23 «Динамические полусистемы» Бушау [1963] и Халкина [1964] обобщали классическое определение динамической системы допу- щением различных входных воздействий. Аналогичное обобщение предпринял Роксин [1965], который ссылается на многие предше- ствующие исследования. Наше определение было сформулировано работах Калмана (1963с] и Вейсса и Калмана [1965]. Совершен- но независимо от развития классической динамики в любой теории конечных автоматов определение системы (или машины) всегда включало входные воздействия и выходные величины. Арбиб [1965] (см. также гл. 6) решительно указал на до, что динамические си- стемы и автоматы принадлежат к одному и тому же классу объ- ектов. Признание этого взгляда можно заметить в последних кни- гах по конструированию систем (см. Задэ и Дезоер [1963], Уаймор [1967] и Уиндекнехт [1967]), причем рассматриваемые системы ста- новятся все более абстрактными и общими. В настоящее время нет единого мнения по вопросу о том, что следует считать исходным определением системы. Различные воз- можности в этом направлении сравниваются в работах Арбиба [1965] и Калмана [1965Ь]. По-видимому, в данной области никто не может утверждать, что последнее слово осталось за ним. 1.2 Элементарная теория управления Смысл второй главы книги заключается в том, чтобы быстро и без особого труда подготовить читателя к изучению одного раз- дела теории систем, в котором преобладающую роль играют мате- матические соображения. Речь идет о теории регулирования линейных объектов управления. Ее аппарат заимствован из линей- ной алгебры и элементарной теории обыкновенных дифференци- альных уравнений. Математический уровень этой главы довольно скромен, и от читателя требуется лишь определенная глубина по- нимания принципиальных вопросов. Приведенные там результаты относятся к числу весьма тонких и имеют давнюю историю. Мно- гие из тем последующих глав можно рассматривать как естествен- ное обобщение поставленных во второй главе элементарных задач. Во второй главе довольно неторопливо нарисована картина тех основных идей и практических потребностей, которые привели к рождению математического формализма теории систем. Время от времени читатель сможет возвращаться к этой главе в поисках объяснения мотивов последующих исследований и их места в об- щей картине теории. Основной материал гл. 10 можно рассматри- вать как глубокое обобщение критерия управляемости (теоремы (4.3) гл. 2),' в то время как в § 10.13 обсуждается вопрос об управляемости и идентифицируемости нестационарных объектов, являющийся необходимым условием существования регулятора
24 1 В помощь читателю Перечислим основные вопросы, затронутые в гл. 2. В ней ис- следуется задача управления некоторым фиксированным физиче- ским объектом (самолетом, зародом, химическим технологическим процессом и т. п.), который мы называем объектом управления. Для наших целей понятие «объект управления» является синони- мом понятия «динамическая система». Выпишем очевидные абст- рактные свойства объекта, необходимые и достаточные для того, чтобы задача управления имела смысл и допускала решение (управляемость и идентифицируемость). Если объект управления считается линейным, то эти свойства можно эквивалентным обра- зом выразить и как определенные свойства некоторых линейных операторов. Если же дополнительно предполагается, что объект управления стационарен, то критерии управляемости и идентифи- цируемости могут быть изящным образом выражены в замкнутой форме посредством лишь некоторых алгебраических свойств объ- екта. Привлекая дополнительно аппарат, близкий к аппарату классической теории канонических матричных форм, мы оказы- ваемся в состоянии получить в явном виде решение задачи регу- лирования. Весь этот материал служит превосходной иллюстрацией воз- можностей математики. В нем показано, как от совершенно абст- рактных соображений можно перейти к сугубо конкретным ре- зультатам, которые в конце концов оказываются вполне простыми. Такая естественная простота решения этой задачи не была из- вестна в теории управления вплоть до конца 50-х годов, т. е. до тех пор, пока эта задача не получила адекватной математической постановки. 1.3 Теория оптимального управления Теория оптимального управления составляет основную тему гл. 3—5. В этих главах нас будет интересовать создание и описа- ние научной основы решения задачи управления. А так как в гл. 2 уже будет дано основное представление об общей ориентации ис- следований, мы сразу можем приступить к аксиоматическому по- строению теории. Наш подход будет математически совершенно строгим. В общем случае мы станем рассматривать гладкие дина- мические системы с непрерывным временем и бесконечномерным пространством состояний. В самом начале будет отмечено, что теория управления пред- ставляет собой совокупность математических результатов и мето- дов, Относящихся к решению задач управления. Интуитивно ясно, что каждая задача управления состоит из следующих эле- ментов: 1) объекта управления, 2) требуемой выходной величины или цели системы,
1.3 Теория оптимального управления 25 3) множества допустимых управлений (или входных воздейст- вий), 4) меры качества или эффективности управляющих воздейст- вий. Этим интуитивным представлениям придается точный смысл, после чего доказываются различные теоремы, лежащие в основе теории оптимального управления. Эти теоремы должны дать от- веты на следующие фундаментальные вопросы: 1. Существуют ли оптимальные управления? 2. Если они существуют, то ка^ их можно найти? Мы будем пользоваться различными подходами, такими, как теория Гамильтона — Якоби, принцип Понтрягина (необходимые условия), методы функционального анализа и численные методы. Каждому из них будет уделено определенное место. . После уточнения основных понятий, используемых в нашей ра- боте, мы получим достаточные условия оптимальности (так назы- ваемая теория Гамильтона — Якоби) с помощью леммы Кара- теодори, следуя идеям Калмана [1963а]. Центральными здесь являются понятие регулярности гамильтониана и уравнение Га- мильтона — Якоби в частных производных, Основным результатом служит теорема (4.14). Очень важной и полезной областью применения теории Га- мильтона— Якоби является ситуация, в которой наша динамиче- ская система линейна, а функционал качества квадратичный. Эта ситуация особенно интересна из-за своих связей с традицион- ными методами автоматики (классическими методами компенса- ции) и из-за того, что она возникает при необходимости устранять малые отклонения ют номинальных траекторий (так называемые методы теории возмущений второго порядка). Здесь основным мо- ментом является введение (операторного) уравнения Риккати (лемма (5.11)). Мы исследуем различные свойства уравнения Риккати и по этим свойствам убеждаемся, что задача оптимиза- ции линейной системы с квадратическим критерием качества имеет решение (теорема (5.42)). А так как получаемая оптимальная си- стема оказывается системой с обратной связью, этот результат имеет огромное практическое значение. • Главу 3 завершает изучение фильтров Калмана — Бюси. Дру- гими словами, в ней рассматривается вопрос об определении «наилучшего» (в смысле минимума среднеквадратической ошиб- ки) линейного фильтра для «сигнала», генерируемого линейным стохастическим дифференциальным уравнением в гильбертовом пространстве. Мы выводим уравнение типа уравнения Винера — Хопфа (теорема (6.41)), а затем из этого уравнения находим сто- хастическое дифференциальное, уравнение, которому должна удо- влетворять оптимальная оценка. Здесь наиболее важную роль иг- рают два момента: определение корреляционной матрицы как
26 1 В помощь читателю некоторого ограниченного линейного преобразования и использова- ние теоремы типа теоремы Фубини для изменения порядка стоха- стического интегрирования и интегрирования по Лебегу. Отметим, что оптимальный фильтр можно рассматривать как оптимальный регулятор линейной динамической системы, «двойственной»' исход- ной стохастической системе. В связи с этим полученные раньше результаты решения задачи управления линейной системы с квад- ратическим критерием качества можно использовать и для иссле- дования свойств оптимального фильтра. Материал этого раздела опирается главным образом на4 работы Фалба [1967] и Калмана и Бюси [1961] и требует довольно глубоких математических по- знаний. В главе 4 мы переходим к необходимым условиям оптималь- ности. Вначале изучаются необходимые условия первого порядка, аналогичные известным уравнениям Эйлера в вариационном ис- числении. При 3jom используется теория возмущений, а централь- ную роль играют гамильтонианы. Важное значение имеет введе- ние линейных уравнений в возмущениях (1.5), которые описывают поведение системы «вблизи» номинальной траектории. Основ- ной результат здесь ^(теорема (1.12)) состоит в следующем: управление будет оптимальным, если у гамильтониана существует экстремум. Затем изучается принцип максимума Понтрягина и его сотруд- ников, составляющий в случае конечномерной динамической си- стемы значительное усиление необходимых условий. Принцип Понтрягина весьма полезен при конструировании систем управле- ния, и он часто применяется для решения практических задач. За строгой формулировкой принципа максимума следует его эвристи- ческое доказательство на основе понятия полного множества воз- мущений и использования разделения гиперплоскостью соответст- вующего выпуклого конуса и луча возрастания качества. Условия принципа максимума связаны с исследованием канонических си- стем, минимизации гамильтонианов и различных граничных ус- ловий. А так как возможность использования необходимых условий зависит от существования оптимальных управлений, приводится простая теорема существования. Эта теорема основана на понятии достижимости и хорошо известном факте существования мини- мума на компактном множестве у полунепрерывной снизу вещест- венной функции. В общем же случае важнейший вопрос о сущест- вовании оптимальных управлений чрезвычайно глубок, и здесь мы затронули его лишь вскользь. Задачу управления можно рассматривать как частный случай задачи условной минимизации функционалов, определенных на нормированных линейных пространствах. Глава 4 завершается кратким упоминанием о различных элегантных и весьма сильных
1.4 Автоматы 27 обобщениях принципа максимума, принадлежащих Халкину [1967], Нейштадту [1966—1967] и Кенону, Каллуму и Полаку [1968]. Некоторые пути использования теоретических соображений пре- дыдущих глав при решении задач синтеза систем управления об- суждаются в гл. 5. Вначале рассматривается простая задача опти- мизации по быстродействию системы, описываемой двумя интегра- лами, поскольку эту задачу можно решить аналитически. Подход к ее решению основывается на принципе Понтрягина, так как ре- зультаты гл. 4 позволяют просто установить существование опти- мального управления. Затем рассматриваются различные этапы ис- пользования необходимых условий оптимальности для определения оптимального управления в общей задаче управления и отмечаются многие трудности, которые могут встретиться на этом пути. Решение практических задач управления в большинстве слу- чаев требует применения численных методов. Поэтому остальной материал гл. 5 посвящен численным методам. Мы начинаем с об- щих замечаний об итеративных методах, чтобы выявить общие идеи, лежащие в основе различных методов, используемых на практике. Затем мы переносим внимание на косвенные методы оптимизации и особенно пристально изучаем подходы к решению двухточечных граничных задач, возникающих из необходимых ус- ловий оптимальности. Мы рассматриваем градиентный метод, ме- тод Ньютона — Рафсона в подходе к решению двухточечной гра- ничной задачи с точки зрения «окрестностей оптимума» и метод последовательных приближений, связанный с квазилинеаризацией. И снова нас больше всего волнуют основные идеи, а не детали вычислений. Наше изучение численных методов завершается рассмотрением прямых методов. Здесь ключевое место занимает понятие миними- зирующего семейства. Среди приведенных результатов дана аппроксимационная теорема (см. Курант и Мозер [1962]), создаю- щая теоретическую основу для применения оценочных функций. Мы рассматриваем также известный метод Ритца, который, по нашему мнению, недостаточно использовался в задачах конструи- рования систем управления. 1.4 Автоматы Общность различных подходов в задачах теории систем под- черкивалась неоднократно. В гл. 6 мы подробно рассматриваем, каким образом, изучая понятия управляемости, линейности или оптимальности на примере систем с конечным множеством состоя- нии, мы проливаем новый свет и на теорию управления. В част- ности, мы увидим, что такие понятия,- как наблюдаемость, хорошо изученные для линейных систем, могут приобрести много новых свойств в мире нелинейных систем.
28 t В помощь читателю Остальной материал третьей части посвящен обстоятельному! обсуждению алгебраических методов изучения конечных автома-i тов, причем особый упор делается на методы замены системы не-1 которой комбинацией более простых систем. ' I Напомним1), что автомат (или машина) абстрактно описы-| вается пятеркой М = (X, Y, Q, X, б), где X — конечное множеств» входных воздействий, У — конечное множество выходных величин» Q — некоторое (не обязательно конечное) множество состояний» X: Q X X —> Q есть одношаговая переходная функция, а б: Q Х| X X -> У есть одношаговая выходная функция. На языке опреде-| лений из § 1.1 автомат представляет собой стационарную динами-1 ческую систему с дискретным временем. Обычно его пространство! состояний также конечно. I Рассмотрим множество X* — множество всевозможных конеч-| ных последовательностей входных символов — и добавим к нему! А — «пустую последовательность» символов. Множество X* пред-1 ставляет собой полугруппу относительно этой операции сопряжения! (другими словами, операция сопряжения ассоциативна, (Х1Х2)хз=1 = Х1(х2Хз), и для нее имеется единица А). Продолжим затем об-1 ласть определения функций X и б, потребовав, чтобы первая ото-| бражала Q X X* в Q, а вторая — в У. | С каждым состоянием q автомата М можно связывать способ! преобразования входных последовательностей в выходные вели-1 чины. Этот способ описывается функцией Mq\ X* -> У, где Mq (х) — I = 6(q, х). Ясно, что автомат М будет вести себя одинаково, если! он начинает работать в состояниях q или q', для которых функции! вход — выход одинаковы, т. е. Мч (х) = Mq' (х) при любых входных! последовательностях х. Поэтому, если М интересует нас исключи- тельно с точки зрения его поведения, этот автомат можно заме-1 нить приведенным, в котором каждой отдельной функции Mq со- ответствует всего одно состояние. С каждым таким автоматом мы связываем полугруппу, т. е. | совокупность преобразований его пространства состояний, инду-j цированных различными входными последовательностями. Эта ] полугруппа будет конечной тогда и только тогда, когда конечно 1 множество состояний автомата. Теперь для заданной полугруппы S и функции i: S->Y можно определить новый «полугрупповой» автомат с «выходом, завися- щим лишь от состояния», М (S, I) = (S, S, У, X, б), ') Мы будем пользоваться здесь обозначениями, более созвучными с приня- тыми в теории автоматов, чем в остальных разделах книги. Предупреждаем читателя, что разновидностей обозначений в этой новой области почти столько же, сколько исследователей.
1.4 Автоматы 29 где K(s, s') = s-s' (здесь • означает полугрупповую операцию), a d(s.s') = i(s-s'). Будем говорить, что автомат М моделирует автомат М', если после соответствующего кодирования и декодирования входных и выходных символов автомат М оказывается в состоянии преобра- зовывать входные последовательности точно так же, как и авто- мат М'. Потребуем, чтобы кодирование и декодирование выполня- лись без памяти (т. е. осуществлялись посимвольно). Иначе го- воря, потребуем, чтобы автомат М' выполнял всю вычислительную работу, связанную с запоминанием. Если М моделирует М', мы будем обозначать это через М'\М и говорить, что «М' делит М». Если же одновременно М'|Л1 и М|ЛГ, то про автоматы М и М' говорят, что они слабо эквивалентны.. Полезность полугрупповых представлений в теории конечных автоматов становится очевид- ной из следующего: если автомату М соответствует полугруппа S, то функцию i можно определить таким образом, что автомат М (S, i) слабо эквивалентен автомату М. Выясняется, что для полугрупп, а следовательно, и для авто- матов существует естественное понятие делимости. Важная связь между понятиями делимости полугрупп и автоматов с точностью до одного дополнительного условия состоит в следующем. Авто- мат Mi делит автомат М2 тогда и только тогда, когда пара (Si, ii), соответствующая автомату Л4ь делит пару (S2,1'2). соответствую- щую автомату М2. Известно, что любой конечный автомат может моделироваться некоторой схемой из модулей (т. е. конечных автоматов с одним состоянием) при условии, что в схеме могут быть замкнутые кон- туры. Синтез таких схем составляет основное содержание учебни- ков по теории переключающихся схем. На самом же деле можно построить такую схему из модулей всего одного типа (модели- рующих штрих Шеффера). Другими словами, если разрешить су- ществование замкнутых контуров, то для построения произволь- ного конечного автомата достаточно очень простого набора элемен- тов. Здесь же мы приведем некоторые теоремы об ограничениях, возникающих в связи с запрещением использовать замкнутые контуры в схемах (при этом, конечно, не исключается возмож- ность замкнутых контуров во внутренней структуре автоматов, об- разующих схему). Для заданных автоматов М и М' и подходящего отображения Z определяется М' X zM — каскадное соединение М' и М с ото- бражением связи Z, описываемое схемой, представленной на Рис. 1.1. дЛя того чтобы получить последовательное соединение (сохраняя к тому же выход .автомата Л4), нам достаточно поло- жить Z не зависящим от X, а для того, чтобы получить параллель- ное соединение, мы выберем Z (х, у) es х.
30 1 В помощь читателю Строгое определение композиции без замкнутых контуров со- стоит в последовательном применении каскадных соединений с безинерционными устройствами кодирования и декодирования. Автомат М называется тождественно-возвратным, если каждый его входной символ либо возвращает его в состояние, соответст- вующее этому символу (k(q, x) = qx, q&Q), либо оставляет ав- томат в том же состоянии, что и раньше (Х(^> х) — q, q&Q). Рис. 1.1. Особое значение имеет тождественно-возвратный автомат с двумя состояниями, который мы называем триггером F. Он имеет состоя- ния {<7o,tfi} и входные символы {е, ха, xj, где K(q, е) — q (е — ней- тральный входной символ), X(q,Xi) = q{ (т. е. xt возвращает триг- гер в состояние qi), а состояние автомата и его выходной символ совпадают. Заметим, что любой тождественно-возвратный автомат можно построить в виде схемы из триггеров F без замкнутых контуров. Крону и Роудзу [1965] принадлежит следующий важный ре- зультат: любой автомат М можно реализовать в виде схемы без замкнутых контуров из триггеров и автоматов простых групп (не обязательно всех), делящих полугруппу автомата М. Решающее значение здесь имеет вопрос о том, что мы не мо- жем добиться действительно глубокого понимания структуры на- ших систем, не прибегая к мощным алгебраическим методам. Но конечный автомат представляет собой алгебраический объ- ект, наделенный относительно бедной структурой, и по полугруппе удается получить лишь частичную информацию о его декомпози- ции. Если же говорить о более узком классе систем, то соответст- вующую систему, возможно, удастся наделить более богатой структурой, а затем алгебраическими методами получить более подробную информацию о структуре исходной системы. Правдоподобность этого общего тезиса подтверждается в чет- вертой части книги. Если ограничиться изучением линейных си-
1.5 Алгебраическая теория линейных систем 31 стем, то кроме полугрупповой операции можно будет ввести (но- вые) операции свертки и сложения. Получающаяся в результате алгебраическая структура известна как модуль, и мы сможем убедиться в том, что алгебраическая теория модулей действи- тельно служит мощным средством анализа линейных систем. 1.5 Алгебраическая теория линейных систем * Авторы учебников по элементарной теории линейных систем всегда утверждали, что преобразования Лапласа используются для «алгебраизации» процесса решения линейных дифференци- альных уравнений с постоянными коэффициентами. Это утверж- дение еще более укоренилось в результате исследований послед- него двадцатилетия. В настоящее время определение преобразова- ния Лапласа как некоторого интеграла все чаще отодвигается на задний план, в примечания, а алгебраические вопросы (разложе- ние на элементарные дроби или канонические формы матриц) приобретают все больший и больший вес. Кроме того, уже давно известно, что эти методы пригодны не только для систем с непре- рывным временем. Так называемая теория «z-преобразований» ко- нечно-разностных уравнений и импульсных систем (см. Фриман [1965]) вполне установилась и широко используется. В гл. 10 с самого начала изучается внутренняя алгебраиче- ская структура теории линейных систем, для чего воедино связы- ваются три следующих различных направления исследований. 1. Элементарные построения теории конечных автоматов и в первую очередь те из них, которые связаны с определением состоя- ния как некоторого класса эквивалентности входных воздействий (гл. 7). 2. Современное изложение линейной алгебры, подчеркивающее роль модулей как обобщения векторных пространств (см. Ван дер Варден [1931], где впервые использованы модули для получения канонических форм матриц). 3. Общий «опыт», накопленный по мере создания теории им- пульсных систем в пятидесятых годах (см. Фриман [1965]). (Мы имеем в виду при этом лишь исторический аспект создания теории и не требуем от читателя никаких специальных знаний.) Большая часть излагаемой теории линейных систем оригиналь- на и принадлежит Калману [1967]. В этой теории состояния, вход- ные воздействия и выходные величины рассматриваются как рав- ноправные. Все они описываются многочленами или формальными степенными рядами над произвольным полем К- Потребовав, чтобы поле К было конечным, мы могли бы получить большинство ре- зультатов, относящихся к теории линейных конечных переключаю- щихся схем. Состояния системы образуют модуль, для которого входные воздействия играют роль кольца операторов. Описание
32 1 В помощь читателю действия входных воздействий на состояния линейной 'системы с помощью модуля аналогично использованию полугрупп в теории Крона — Роудза, но ни одна из этих теорий не является частным случаем другой. Этот новый подход позволяет ввести передаточную функцию линейной системы без каких-либо ссылок на преобразования или порождающие функции. При этом передаточные функции приобре- тают даже большее значение, чем раньше. Они оказываются осо- бенно полезными для выявления структуры модуля, отвечающего рассматриваемой системе. Очертим теперь основные математические идеи теории. Функцию вход — выход f стационарной линейной системы 2 определим необычным, но очень удобным образом. Пусть й — пространство всевозможных входных функций с компактным но- сителем, которые, кроме того, обращаются тождественно в нуль при t > 0. Аналогично, пусть Г есть пространство всевозможных выходных функций, определенных лишь для t > 0. Тогда отобра- жение f: й ~Г можно интерпретировать следующим образом: на вход системы подается входное воздействие <в, заканчивающееся в момент времени 0, и после этого начинается наблюдение реак- ции системы у- Легко видеть, что для стационарной системы.такое определение функции вход — выход не ограничивает его общности. Естественно, что если система S линейна, то ее функция вход — выход f2 должна быть /(-линейной (где К —некоторое поле). По- этому й”и Г нужно наделить структурой A-векторного простран- ства. А так как f линейно, для него существует каноническая фак- торизация: f = f3f2fi, где fi сюръективно, f2 есть изоморфизм, а f3 взаимно однозначно. Обозначая образ fi через X, а образ f2 через S, мы получаем следующую коммутативную диаграмму: х—Ь—> s л i-i jf. Q——>Г Точно такая же диаграмма получится, если идти от линейного дифференциального (или конечно-разностного) уравнения с про- странством состояний X и выходным пространством Г. Это наво- дит на мысль, что приведенная факторизация отображения вход — выход f соответствует реализации f некоторой динамической си- стемы. Эту идею можно выразить строго следующим образом. 1. Заметим, что й изоморфно некоторому свободному K[z]-mo- дулю и что все остальные пространства диаграммы можно наделить структурой /([г]-модуля, не нарушая коммутативности. (Под /([z] мы понимаем кольцо многочленов с независимой пере- менной z и коэффициентами из поля /(.)
1.5 Алгебраическая теория линейных систем 33 2. Внешние операции /С[г]-модуля X Не отвечают динамическо- му воздействию входных возмущений на состояния системы (здесь K[z]-модуль мы обозначаем тем же символом, что и /(-векторное пространство). Однако оказывается, что множество X в точности совпадает с множеством классов эквивалентности Нерода из тео- рии конечных автоматов (см, § 7.2). Поэтому X можно, по край- ней мере интуитивно, рассматривать как пространство состояний. Но тогда по модулю X нетрудно построить динамическую систему. Например, отображение z: >z • х определяет свободные движе- ния динамической системы. Между описанной процедурой и построением полугрупп в тео- рии Крона — Роудза имеется существенное различие. В нашем случае умножение в пространстве входных воздействий соответ- ствует операции свертки, а в теории Крона — Роудза — операции сочленения. Операция свертки является гораздо более известным видом умножения и в течение длительного времени широко ис- пользовалась на интуитивном уровне в теории линейных систем. В связи с этим «новая» алгебраическая теория полностью согла- суется со «старой» теорией, основанной на преобразованиях Ла- пласа. Кроме того, новая теория позволяет получать более выра- зительные результаты в целом ряде областей, особенно результаты, касающиеся структуры сложных систем. Требование сюръектив- ности одного из преобразований на коммутативной диаграмме эквивалентно требованию полной достижимости. А в силу дуаль- ности взаимнооднозначность эквивалентна полной наблюдаемости. Имея это в виду и пользуясь только коммутативными диаграмма- ми, мы докажем важный результат, согласно которому каждая минимальная реализация f полностью достижима и полностью управляема. Раньше этот результат удавалось получить (§ 10. В) лишь в результате долгих расчетов, существенным образом осно- ванных на линейности системы. Таким образом, «каноническая факторизация» оказывается синонимом «минимальной реализа- ции». С помощью той же диаграммы можно непосредственно по- лучить и много других интересных результатов. Например, суще- ствование передаточной функции можно установить, рассматривая отображения в Г-образующих модуля Q и учитывая предположе- ние о том, что модуль X — модуль с кручением. Два вида умножения, используемых в линейной теории и тео- рии Крона — Роудза, являются по сути дела двумя различными ; «функторами», каждый из которых заменяет динамическую си- стему некоторой алгебраической структурой. Получаемые резуль- таты отдаленно напоминают друг друга и далеко не тождественны. Эти теории пересекаются тогда и только тогда, когда система 2 линейна над конечным полем (т. е. когда пространство состояний системы 3 конечно), но простые теории модулей и теории Крона — Роудза тем не менее оказываются совершенно различными. 2 Зак. 693
ПЕРВАЯ ЧАСТЬ ЭЛЕМЕНТАРНАЯ ТЕОРИЯ УПРАВЛЕНИЯ С СОВРЕМЕННОЙ ТОЧКИ ЗРЕНИЯ Р. Калман 2 Теория регулирования линейных объектов Основная цель этой главы состоит в получении важнейших ре- зультатов, относящихся к задаче регулирования классической теории управления. При этом мы будем в первую очередь стре- миться к математической ясности и не станем останавливаться на физических или технических аспектах проблемы. Это согласуется со второй целью, преследуемой в этой главе: ввести некоторые центральные для нашей книги понятия, связанные с описанием систем, их структурой, оптимизацией и свойством линейности. Ка- ждая из этих тем естественным образом возникает при решении задачи регулирования. В некотором смысле содержание этой гла- вы служит той основой, на которой возникли различные специаль- ные исследования теории систем. Мы займемся здесь достаточно узким вопросом — задачей ана- литического конструирования регуляторов для стационарных (с постоянными коэффициентами) линейных объектов. Чтобы не затягивать чрезмерно это введение, мы оставим в стороне такие более глубокие проблемы, как проблема оптимальности, вопрос о влиянии помех и т. п., а сосредоточим внимание на построении класса стратегий управления, обеспечивающих выполнение фун- даментального требования устойчивости системы. Центральный результат этого раздела теории управления со- стоит в том, что существование, а также и сама конструкция ре- гуляторов предопределяются двумя важнейшими свойствами объекта управления: его полной управляемостью и полной иден- тифицируемостью. Первое из этих свойств означает, что с по- мощью подходящим образом выбранного управления из любого состояния системы можно перейти в начало координат простран- ства состояний. Второе же утверждает, что по наблюдениям предыстории (внешних) входных и выходных величин всегда мож-
2.1 Постановка задачи управления но определить текущее (внутреннее) состояние системы. Очевидно, что наличие этих двух свойств необходимо для существования ре- гулятора. Однако относительно недавно (в 1959 г.) удалось выяс- нить, что, как это ни удивительно, управляемости и идентифици- руемости объекта оказалось достаточно и для существования ре- шения этой задачи. С современной точки зрения все достижения классической теории управления объясняются тем, что в ней изу- чались только такие модели, для которых свойства управляемости и идентифицируемости были естественными. Класс регуляторов, рассматриваемых в этой главе, ни в коем случае не является специфическим или произвольно выбранным. В действительности структура этих регуляторов в точности совпа- дает с той, которую требует теория оптимальных стохастических систем. Лишь значения выбираемых коэффициентов усиления в цепи обратной связи оказываются разными. Для рационального выбора этих значений необходимо задаться критерием оптималь- ности относительно окружающей среды, в которой должна функ- ционировать система. Конкретный расчет значений коэффициен- тов усиления в цепи обратной связи требует привлечения всех средств теории оптимального управления (в этой связи особенно важны § 3.5, 5.4 и 5.5). В настоящей главе от читателя потребуются относительно скромные знания — знакомство с элементарной теорией диффе- ренциальных уравнений и линейной алгеброй. Специальные зна- ния по теории управления не предполагаются. Читателю можно порекомендовать параллельно познакомиться с каким-нибудь со- временным курсом по теории управления (например, с книгой Пе- шона [1963]), что поможет ему оценить широту приложений раз^ виваемого здесь математического аппарата. 2.1 Постановка задачи управления Цель управления состоит в том, чтобы изменить динамику поведения физической системы в соответствии с желаниями чело- века. Эта задача естественным образом распадается на две со- вершенно различные части. 1. Необходимо получить математическое описание динамиче- ских свойств физической системы (объекта), подлежащей управ- лению. 2. Необходимо найти «средство» достижения желаемого пове- дения управляемой системы. Первая из этих задач по существу есть задача моделирования: необходимо предсказать динамику поведения объекта с помощью нашей математической модели с' точностью, по крайней мере не меньшей, чем требуемая точность управления. Этой моделью 2*
36 2 Теория регулирования линейных объектов объекта может быть динамическая система в смысле определения § 1.1. Требуемая модель получается в результате физических экс- периментов или с помощью известных физических законов. По- строение конкретных моделей обычно относится к компетенции физиков и не входит в компетенцию ни специалистов по теории управления, ни даже по теории систем. После того как модель объекта построена, можно переходить ко второй, чисто математической части задачи. Различные «сред- ства», позволяющие осуществлять управление, создаются на базе высокоразвитой технологии, как правило, с привлечением вычисли- тельных машин, для которых математическое описание часто (но, конечно, не всегда) играет роль обычных технических чертежей. Другими словами, вторая половина проблемы такова, что для ее решения требуется некоторый математический результат (теорема). Верно и обратное, каждое эффективное средство управления пред- ставляет собой некоторый математический результат. Или в еще более категорической форме: теория управления не занимается исследованием реального мира, а лишь математиче- скими моделями определенных аспектов реального мира, В связи с этим аппарат, а также результаты теории управления являются математическими. Эта ситуация очень сильно напоминает историю превращения теории вероятностей в чисто математическую дисциплину. Рассмотрим конкретный пример, представляющий в наши дни определенный самостоятельный интерес. Предположим, что нуж- но запустить космический корабль, который должен опуститься в определенную точку поверхности Луны. Специалист по теории управления подойдет к формулировке соответствующей задачи управления следующим образом. 1. Для достижения кораблем заданной точки необходимо вы- вести его на орбиту с высокой точностью, а затем обеспечить его полет по рассчитанной заранее траектории без существенных от- клонений вплоть до момента посадки. Это невозможно сделать без специального управления в связи с трудностями точного вывода на орбиту, наличием случайных возмущений, действующих на ко- рабль во время.полета между Землей и Луной, и т. д. 2. Математическую модель движения корабля можно по- строить, воспользовавшись уравнениями небесной механики, высо- кая точность которых известна. Физические характеристики ко- рабля можно считать заданными, поскольку мы сами его строим. Входные воздействия на систему, с помощью которых осущест- вляется управление, создаются различными реактивными рулями и*двигателями. Выходными величинами являются координаты, ско- рости или другие параметры движения корабля, измеряемые с помощью оптических, инерциальных или других приборов.
2.1 Постановка задачи управления 37 3. Теперь у нас есть строгое описание объекта как некоторой динамической системы. В силу известных свойств уравнений не- бесной механики эта система должна быть конечномерной гладкой и (к сожалению) нестационарной и нелинейной системой с непре- рывным временем. 4. В качестве рабочей гипотезы принимаем, что можно рас- сматривать лишь малые отклонения от заданной траектории по- лета. Это позволит приближенно (естественно в некотором точном математическом смысле) описать поведение объекта линейной не- стационарной системой. 5. Воспользуемся известными или специально для этого случая разработанными результатами линейной теории управления, чтобы получить решение в явном виде, предполагая, если это необходи- мо, даже стационарность системы. б. Исследуем полученное решение и попробуем обобщить его с тем, чтобы освободиться от ограничений, связанных со стацио- нарностью или линейностью. Разберемся теперь более подробно в том, как должен вести себя управляемый космический корабль. В идеальном случае нам хотелось бы, чтобы корабль осуществлял произвольные маневры в ответ на команды его пилотов. Но такая задача слишком слож- на (на современном уровне техники), и поэтому можно удовлетво- риться более простыми целями. Потребуем, чтобы корабль сле- довал по заданной траектории до самого момента посадки. Откло- нения от этой траектории должны быть по возможности малыми в течение всего полета, а особенно в момент достижения Луны. Это типичная задача регулирования, в которой требуется, чтобы в ре- зультате управления объект вел себя заданным образом. Решение задачи регулирования состоит в определении закона управления, устанавливающего значения управляющих воздей- ствий в зависимости от величины измеренного отклонения корабля от заданной траектории. Физическое воплощение закона управле- ния, регулятор, обычно представляет собой какое-то электронное устройство или вычислительную машину. Мы удовлетворимся по- лучением явных уравнений, описывающих регулятор, и будем счи- тать этот процесс нахождения уравнений эквивалентным «кон- струированию» регулятора. Чрезвычайно ценно отметить, что в теории управления совер- шенно не важна физическая природа объекта, описываемого дан- ной динамической системой. Важна лишь математическая струк- тура объекта управления (вот почему теория управления не разбивается на разделы, занимающиеся, скажем, космическими кораблями, самолетами или морскими судами). Таким образом, наша задача чисто математическая. Современные работы по теории управления обычно начинают словами:
38 2 Теория регулирования линейных объектов Пусть объект управления описывается обыкновенным диффе- ренциальным уравнением = X, u(t)), еде t е Rl, х s Rn, и (/) е Rm, a f: R1 X Rn X R™ -* Rn — непре- рывная функция, которая по крайней мере является липшицевой по х), и т. д. ’). Однако нам будет приятнее начать построение теории управле- ния путем вывода приведенного уравнения на основе абстрактных свойств объекта, рассматриваемого как динамическая система в смысле строгого определения (1.1). Для этой цели нам понадо- бится следующая теорема. Среди ее условий центральную роль играет условие (с) гладкости системы S. (1.1) Теорема. Пусть S есть гладкая динамическая система в смысле определений (1.1) и (1.6) гл. 1. Точнее говоря, пусть (а) Т = R, X и U — нормированные пространства-, (Ь) й — нормированное пространство непрерывных функций Т -> U с нормой ||<о|| = sup ||u (О II2); feT (с) <р(-; т, х, ®)е С1 (Т->Х) для каждого т, х и со, а отображе- ние f: Т X X X й -> Т, задаваемое отображением (т, х, ®) »—><p(h х, х, и)3), непрерывно при каждом t относительно тихонов- ской топологии. Тогда переходная функция <р системы 2 является решением дифференциального уравнения (1.2) = х, nta), в котором оператор nt есть отображение Q-+U, определяемое со- ответствием (О н-> u(t) = ®(0. Доказательство этой теоремы представляет собой несложное упражнение на определение непрерывности, и мы опустим его подробности, так как они ничего не дают для наших целей. (1.3) Замечание. Хотя приведенная теорема и кажется чрезвы- чайно общей, она все же не распространяется на системы некото- рого типа. Например, Задэ и Дезоер (1963] доказывают (нестро- го), что nt «нужно» определять следующим образом: nJ: и (и (0, н (0, .... м(1?) (0). *) Всюду в этой книге R обозначает множество вещественных чисел. 2) Значения со будут обозначаться через «(/); в некоторых случаях вместо ш мы будем писать и( •). 3) Точкой сверху (ф) обозначена для краткости производная ПР времени, n-ю производную по времени будем обозначать через <р(п>,
2.1 Постановка задачи управления 39 Для получения этого результата нам пришлось бы видоизменить условия (Ь) и ввести на й следующую норму; ||<B|| = sup[||u(OII + ll«(OII+ ... + Ны^СОН]. fsT Это предположение кажется нам неестественным. Легко видеть, что теорема (1.1) сформулирована таким обра- зом, чтобы обеспечить «поточечную» зависимость правой части уравнения (1.2) от <о. Любой другой характер зависимости от ю означал бы, что система S недостаточно гладка для того, чтобы ее можно было описать дифференциальным уравнением. Например, будем считать S такой, что (1.4) y(f) = u(f), t€=T, U = Y = W, т. е. задано внешнее описание системы S (см. определение (1.8) гл. 1). Такая система строго определена и в смысле определения (1.1) гл. 1. В этом случае т) есть тождественная функция, а Ф (/; т, х, а>) = nta — и (/). Но тогда (1.5) ф (0 =(Я;СО) = отсюда следует, что система (1.4) может считаться гладкой только в том случае, если заменить ее исходное пространство входных воздействий Й пространством й. Интуитивный смысл этого утвер- ждения очевиден. У системы (1.4) нет «памяти» в том смысле, что значение входного воздействия в любой момент времени содержит всю информацию, необходимую для формирования выходной ве- личины. Что же касается системы (1.5), то она «запоминает» u(f), а информация, содержащаяся во входном воздействии, служит тем минимумом (а именно u(t)), который необходим для того, чтобы «освежить» ее память. Заметим также, что требование гладкости системы S не по- зволяет входному воздействию оказывать мгновенное воздействие на выходную величину (что имеет место для системы (1.4)). Это предположение чрезвычайно удобно, поскольку нам хотелось бы, чтобы понятие причинной связи (входное воздействие вызывает изменение выходной величины) было однозначным. (Обратите внимание на то, что в системе (1.4) вход и выход системы можно поменять ролями, а в реальных системах это невозможно.) Поскольку мы выяснили, что объект управления должен описы- ваться дифференциальным уравнением, можно перейти к более строгим математическим определениям.
40 2 Теория регулирования линейных объектов (1.6) Задача регулирования. Пусть объект управления описывает- ся дифференциальным уравнением ^-=f(t,x,u(t)), Ф* (0 = ф(/; т*, х*, а*) — некоторое фиксированное движение (реше- ние) объекта, и пусть (s,x)—некоторое фиксированное событие, где х ¥= ф* (s). Рассмотрим это событие как возмущение в момент времени t = s фиксированного движения объекта и будем искать такое управление (функцию) ьзх, что ф(/; s, х, сож)-> <p*(t) при t -*• оо. Более того, потребуем (строгое определение будет'дано для каждого из случаев), чтобы (а) либо ф(6; fox) = ф*(Л) при некотором t\> s (сходи- мость за конечное время), (Ь) либо регулируемое движение является устойчивым (нечув- ствительным к последующим возмущениям) и сходится к ф* наи- более быстрым образом. (1.7) Замечание. Данная формулировка охватывает лишь малую часть задачи управления, и только ее мы будем рассматривать в этой главе с достаточной глубиной. Вопрос о возникновении воз- мущений мы решаем здесь наиболее примитивно: „каким-то1* об- разом в момент времени s система из состояния ф*($) переходит в состояние хй. На самом деле этот процесс разумнее было бы опи- сать с помощью некоторой статистической модели. Но мы не ста- нем даже объяснять, как на практике задается ф*(/); более того, чаще всего мы будем (для простоты) предполагать, что ф*(0 = 0. 2.2 Гладкие линейные системы Ограничимся пока рассмотрением (1) линейных (2) конечно- мерных и (3) гладких динамических систем 2. Из-за того что нам нужна линейность, пространство состояний должно быть вектор- ным, поэтому в качестве X мы возьмем Rn. А так как переходная функция должна быть линейной на X X £2, ее можно представить в виде (2.1) ф(/; т, х, со) = ф(/; т, х, 0) + ф(/; т, 0, ®) = = Ф(/, т)х + 0(/, т)<о. Линейное отображение хн->ф(^,т)х, определяемое первым чле- ном правой части этого уравнения, называется переходным отобра- жением системы 2. Оно определяет свободное движение системы 2, т. е. движение при воздействии тривиального входного сигнала to = 0. Для исследования второго члена в правой части уравнения (2.1) нам понадобится привлечь факт гладкости системы 2. Для
2.2 Гладкие линейные системы 41 этого положим Т = R. В силу теоремы (1.1) ф удовлетворяет диф- ференциальному уравнению (2.2) -^-<р(/; т, х, = q>(t; т, х, <о), u(t)). Поскольку ф линейно по (х, со), ясно, что правая часть этого урав- нения линейна по своим второму и третьему аргументам. По- этому можно ввести функции F: Т-* {матрицы размера п X п} и q. т {матрицы размера п X т} и переписать правую часть урав- нения (2.2) в виде (2.3) f (t; х, u(t)) = F (t)x + G (0 и (t). В этих новых обозначениях уравнение (2.2) эквивалентно следую- щемуг (2.4) ^-~F(t)x+G(t)u(t)-, в частности, переходное отображение (или переходная матрица) ф удовлетворяет дифференциальному уравнению (2.5) и дополнительному соотношению (2.6) Ф(т, х) = 1, где / — единичная матрица. Отметим, что уравнения (2.5) и (2.6) в совокупности опреде- ляют Ф однозначным образом, причем второе из них соответствует аксиоме (l.ld2) в общем определении динамической системы (см. § 1.1). Наконец, так как т) должно быть линейным на X, имеем (2.7) y(t) = n(t, x(l)) = H(t)x(t), где Н: Т —> {матрицы р X п}. Тот факт, что S — гладкая система, требует непрерывности функций, соответствующих матрицам F, G и Н. С прикладной точ- ки зрения это важные предположения, но в последующем мы не станем останавливаться на них, поскольку нам хочется предельно упростить изложение. Все сделанные выше замечания объединим теперь в следующей теореме. (2.8) Теорема. Каждая конечномерная линейная гладкая динами- ческая система S с непрерывным временем описывается соотно- шениями , ^_=F{t)x + G(t)u(t), (2.9) y(t) = H(t)x(t).
42 2 Теория ресулирования линейных объектов Справедлива и обратная теорема. I (2.10) Теорема. Для заданных соотношений (2.9) имеется един* ственная динамическая система S, обладающая всеми свойствами! упомянутыми в теореме (2.8). Кроме того, такая система является! обратимой. 1 Доказательство. Если Ф определяется уравнениями (2.5) и (2.6) 1 то известно, что общее решение дифференциального уравнения! (2.9) можно представить в виде t (2.11) <р (/; г, х, to) — Ф (/, т) х + ]" Ф (t, о) G (о) и (<т) da. т Легко проверить, что <р обладает всеми свойствами переходной) функции. ) Важно помнить, что соотношение (2.11) справедливо для всех\ (нт, ане только для Поэтому уравнение (2.11) описывает обратимую динамическую систему. Другими словами, линейность вместе с гладкостью обеспечивают обратимость системы. (2.12) Замечание. В соответствии с этими двумя теоремами ка- ждый раз, когда речь идет о конечномерных линейных гладких системах, все расчеты, доказательства и т. п. можно основывать непосредственно на соотношениях (2.9). Это позволит нам вос- пользоваться мощным аппаратом прикладной математики, осно- ванным на математическом анализе и теории дифференциальных уравнений (см. гл. 3—5). Однако не следует забывать, что исполь- зуемые методы имеют в конце концов второстепенное значение. Важно то, что наши результаты есть следствия предположений о «конечномерности, линейности и гладкости». Применяемые здесь методы прикладной математики, возможно, заменятся в будущем какими-либо другими, более эффективными, но крайне мало ве- роятно, чтобы в ближайшем будущем удалось найти класс систем, позволяющих строить более простые или более полезные модели физических объектов. В оставшейся части этого параграфа мы будем опускать при- лагательные «динамическая», «конечномерная» и «гладкая», счи- тая их присущими системе, когда для нее используется термин «линейная». (2.13) Определение. Событие (т, х) для линейной системы S на- зывается достижимым (из начала координат) тогда и только то- гда, когда найдется такое s-Ст и такое входное воздействие ®, что оно переводит систему из состояния ($, 0) в состояние (т, х). Отметим, что как s, так и to могут зависеть и от г, и от х. В силу причинности системы функцию w достаточно определить лишь на множестве [$, т].
2.2 Гладкие линейные системы 43 Изменив ориентацию во времени, получим точный аналог по- нятия достижимости. (2.14) Определение. Событие (т, х) для линейной системы Б на- зывается управляемым (относительно начала координат) тогда и только тогда, когда найдется такое О т и такое входное воздей- ствие <о, которое переведет систему из состояния (т, х) в состояние (t,o). Система 2 называется полностью достижимой (или полностью управляемой) в момент времени т тогда и только тогда, когда ка- ждое событие (т, х), где т фиксировано, а х е X, является дости- жимым (или управляемым). Если же момент времени т не упоми- нается, то эти свойства должны выполняться для всех т. (2.15) Замечание. (Будьте внимательны!) Даже если линейная система полностью достижима и полностью управляема, отсюда еще не следует, что каждое событие (т, х) можно преобразовать в любое другое событие (та, *i), ti > т, с помощью подходящего выбора ®. Для выполнения этого достаточное условие выглядит следующим образом: найдется такое тг е [т, tJ, что одновременно Т2 = t%, х = Sti, хг Наше определение управляемости построено таким образом, чтобы оно описывало очевидные необходимые и достаточные усло- вия существования регулятора. Напомним задачу (1.6): цель ре- гулятора состоит в том, чтобы перевести систему 2 из произволь- ного начального состояния х в некоторое требуемое состояние х*, обычно совпадающее с началом координат. Поэтому как только мы найдем явный критерий полной управляемости, то в определен- ном смысле можно считать, что мы решили математическую часть (вопрос существования) задачи конструирования регулятора. Удобный общий критерий управляемости [Калман, 1960а] имеет следующий вид. (2.16) Теорема. Событие (т, х) линейной системы 2 управляемо тогда и только тогда, когда при некотором t состояние х принад- лежит области значений линейного преобразования t № (г, 0 = / Ф (т> °) G (°) G' (&) Ф' (т, о) da. t Здесь штрихом отмечен сопряженный оператор или транспони- рованная матрица. (2.17) Замечание. Если W(x,t) имеет максимальный ранг при не- котором т и любых t, то система 2 полностью управляема. (2.18) Замечание. Ранг матрицы W(x,t) не убывает с расшире- нием области интегрирования. Для того чтобы убедиться в этом,
44 2 Теория регулирования линейных объектов напомним, что, согласно результатам линейной алгебры, матрица А является неотрицательно определенной тогда и только тогда, когда существует такая матрица В, что А = ВВ'. Но так как под- интегральная функция в правой части равенства теоремы (2.16) неотрицательно определенная, то это справедливо и относительно самого интеграла. Поэтому гапк!Г(т, t) не убывает при,/->оо или т->—оо и rank W(т, /) п. Отсюда следует, что при заданном т найдется некоторое 6 = 6(т), такое, что rank W (т, /) постоянен при всех t > t\ (т). Это значит, что в конечномерной линейной системе либо некоторое событие (г, х) неуправляемо, либо все события (т, х) можно преобразовать в (6(т),0). (2.19) Замечание. В случае линейной системы общего вида инте- грал из теоремы (2.16) нельзя вычислить аналитически, и с прак- тической точки зрения его можно рассматривать лишь как рецепт для численного определения управляемости. С теоретической же точки зрения этот результат чрезвычайно полезен для получения явных критериев управляемости для различных частных случаев. Доказательство теоремы (2.16). Вид оператора W связан с при- менением методов вариационного исчисления. На самом деле для управления <в известно явное выражение, зависящее от IT и пре- образующее (т, х) в (t, 0) оптимальным образом; здесь х принад- лежит области значений оператора W(т, t). Подробности имеются в работе Калмана, Хо и Нарендра [1963]. Простое непосредственное доказательство теоремы (2.16) со- стоит в следующем. Достаточность. Предположим, что х принадлежит области значе- ний оператора 1Г(т, 0 при некотором t, т. е. x = W(x,t)zX! где zx^X. Определим юх: о их(а) таким образом, чтобы (2.20) ‘ иж (о) = — G' (а) Ф' (т, о) гх, а е [т, /]. Подставим теперь это выражение в определение <р (см. уравнение (2.11)) и убедимся в том, что <Р (£; т, х, <вх) = 0. С этой целью нам придется воспользоваться полугрупповым свой- ством переходных отображений (2.21) ' Ф (/, а) = Ф (/, т) Ф (т, а), где последнее равенство справедливо при любых вещественных а, х и t вследствие единственности решений дифференциального уравнения (2.5), определяющего Ф. Заметим, что уравнение (2.21) представляет собой линейный вариант аксиомы (l.ld3) из § 1.1.
2.2 Гладкие линейные системы 45 Отметим также, что Ф не может быть вырожденным. Действитель- но, согласно уравнению (2.21), (2.22) Ф-1(/, т) = Ф(т, /). Необходимость. Напомним, что, согласно одному из результатов линейной алгебры, пространство X можно представить в виде пря- мой суммы области значений оператора W и ядра оператора W: X = range Wф ker W. (Это справедливо для любого симметричного оператора, отобра- жающего любое конечномерное векторное пространство в себя.) Если событие (т, х) неуправляемо, то состояние х = (xlt х2) долж- но иметь составляющую х2 =# 0 из ядра оператора W. Если (т, х2) управляемо, то в силу линейности системы каждое событие вида (т, Xi+x2), где Xt принадлежит области значений оператора W, будет также управляемо. Поэтому достаточно показать, что неко- торый ненулевой вектор, принадлежащий ядру оператора W, яв- ляется неуправляемым. Предположим, таким образом, что х2 =£ 0 принадлежит ядру оператора W(т, t) при некотором t и что со2 е Q преобразует (т, х2) в (t, 0). Тогда x'2W (т, 0 х2 = f || G' (о) Ф' (т, а) х2 II2 do = 0. т Поскольку подинтегральная функция в этом уравнении неотрица- тельна и непрерывна, то (2.23) (ст) Ф'(т, <г)х2=з0 на [т, *]. С другой стороны, Ф (/, т) х2 4- ]* Ф (/, a) G (а) и2 (о) do = 0, т и, если воспользоваться выражением (2.20), имеем t | Ф (т, о) G (о) и2 (о) do = — х2. т Умножая последнее уравнение на х2, получаем, что t х' J Ф (т, a) G (а) и2 (о) da = — х'х2« —1| х2 Ц2. т Но в силу уравнения (2.23) левая часть этого уравнения равна нулю и, следовательно, || х21|2 = 0, а это противоречит предполо- жению о том, что х2 =# 0.
46 2 Теория регулирования линейных объектов Рекомендуем читателю доказать справедливость аналогичного критерия достижимости события (т, х), т. е. следующую теорему. (2.24) Теорема. Событие (т, х) для линейной системы S достижимо тогда^и только тогда, когда при некотором s состояние х принад- лежит области значений оператора где т W (s, т) = J Ф (т, о) G (a) G' (а) Ф' (т, а) do. S (2.25) Пример. Рассмотрим периодическую линейную систему (в которой F(t) и G(t)—периодические функции I). Согласно теореме Флоке1), переходное отображение можно представить в виде Ф(/, T) = P(/)e</_t)QP_I(r), где Q — постоянная матрица размера п X п, а Р: Т —► {матрицы размера п X п} есть невырожденная непрерывная периодическая функция t. Более того, поскольку Ф невырождено, Р невырождено при любом t. Оператор W для рассматриваемой системы не обязательно яв- ляется периодическим. Однако легко доказать, что его ранг дости- гает своего максимума в течение одного периода. Другими сло- вами, справедливо следующее предложение. (2.26) Предложение. Если периодическая линейная система пол- ностью управляема, то систему из любого состояния можно перевести в начало координат за время, не большее периода си- стемы. Если система Z всего лишь почти-периодическая или квази- периодическая, то теорема Флоке уже неверна, и выводы, относя- щиеся к рангу оператора W, не имеют прежней силы. Поэтому даже в этом «несколько» отличном случае аналитическое вычис- ление /Дт) (см. замечание (2.18)) становится нетривиальной за- дачей. 2.3 Стационарные линейные системы В «классической» теории управления практически всегда рас- сматривались объекты, которые были не только линейными, но и стационарными. Интуитивно ясно, что стационарной (с постоянны- ми коэффициентами) динамической системой можно назвать та- кую систему, определяющие свойства которой (переходная функ- ’) См. § 5 гл. 3 книги Коддингтона и Левинсона [1955]. Читателю придется перевести приведенные там результаты на язык обозначений, принятых здесь.
2.3 Стационарные линейные системы 47 ция и выходное преобразование) не зависят от начального момен- та времени. Из гл. 1 (определение (1.2)) и теоремы (2,8) предыду- щего параграфа мы сразу получаем следующий явный критерий стационарности системы. (3.1) Предложение. Линейная система S является стационарной тогда и только тогда, когда все матрицы F, G и Н не зависят от времени. Ясно, что стационарная линейная система 2 эквивалентна си- стеме уравнений (3.2) = Fx + Gu (/), у (/) = Нх (О, где матрицы F, G и Н постоянны. В двух последующих параграфах, называя систему «линейной», мы будем предполагать, что она не только «динамическая», «ко- нечномерная» и «гладкая», но также и то, что она «стационарная». Такое весьма безответственное отношение к терминологии укоре- нилось по крайней мере в технической литературе по управлению. (3.3) Замечание. Очень часто нам приходится предполагать, что объект стационарен (хотя бы на достаточно коротком промежутке времени), поскольку в противном случае нам вообще не удалось бы построить его модель: в произвольной нестационарной системе наблюдения за прошлым поведением системы могут ничего не го- ворить о ее будущем. Напомним, что матрица перехода для (стационарной) линейной системы удовлетворяет следующим соотношениям: Ф (/, т) = exp(t — x)F = e^F « • s=o Матричная экспоненциальная функция вполне определена (приведенный степенной ряд абсолютно сходится) при любых t, т и F (см. § 1 гл. 3 книги Коддингтона и Левинсона [1955]). Обозна- чение e<f~^F сразу, по крайней мере на интуитивном уровне, убе- ждает нас в справедливости соотношений (2.21) и (2.22). Для (стационарной) линейной системы имеется очень простой критерий полной управляемости. (3.4) Теорема. Линейная п-мерная система 2 полностью управ- ляема тогда и только тогда, когда rankC = rank[G, FG, .... F"~'G] = n. Здесь С есть матрица размера п X мп, составленная из столб- цов матриц G, FG, t.. t Fn'lG,
48 2 Теория регулирования линейных объектов (3.5) Следствие. Если линейная система S полностью управляема, то для любых т, х и е > 0 найдется такое входное воздействие со, которое преобразует (т, х) в (т + 8, 0). (3.6) Следствие. Если ранг матрицы равен G = г, то критерий полной управляемости упрощается и принимает вид rank С = rank [G, FG, ..., Fn~rG] = n. Все эти результаты по самой своей сути алгебраические. Все они взаимосвязаны. Еще одно интересное следствие опирается на следующее определение. (3.7) Определение. Характеристическим многочленом квадрат- ной матрицы F называется многочлен det(z/ — F). Минимальным многочленом фк матрицы F называется нормированный (с рав- ным 1 коэффициентом при старшем члене) многочлен наименьшей степени, для которого фНГ) = 0. Напомним, что, согласно теореме Кэли — Гамильтона (Гант- махер [1953]), имеем %F(E)=0. Напомним еще, что ф является делителем любого многочлена, аннулирующего для матрицы F, так что фр|х₽ (т. е. „фр — делитель х₽“)- Тогда спаведливо еще одно следствие. (3.8) Следствие. Если для заданного F существует такое G еди- ничного ранга, что пара {F, G) полностью управляема, то. хг = фр- В прошлом веке такую матрицу F обычно называли неразру- шающей. На современном же языке мы скажем, что линейное ото- бражение F: X -* X циклично, т. е. существует такой вектор g, что множество {g, Fg, ...} порождает X. Это, очевидно, аналогично нашему критерию управляемости. Доказательство теоремы (3.4). Достаточность. В силу стационар- ности без потери общности можно предположить, что т = 0. Если 2 не является полностью управляемой, то в соответствии с дока- зательством теоремы (2.16) (см. формулу (2.23)) найдется такой вектор х =£ 0, что х'Ф (0, t) G == 0 при всех / > 0. Дифференцируя это соотношение один раз, два раза и т. д. по t и затем полагая t = 0, получаем, что x'G = 0, x'FG =0, .... Таким образом, вектор х =# 0 оказывается ортогональным любому элементу матрицы C = [G, ..., И МЫ имеем противоречие, если ранг матрицы С равен п.
2.3 Стационарные линейные системы 49 Необходимость. Предположим, что ранг матрицы С меньше п. То- гда найдется такой вектор q =h 0, принадлежащий X, что qG = 0, q'FG = 0......qF^G = 0. Но, согласно теореме Кэли — Гамильтона, имеем q'FnG — Q и по индукции находим q'F?G — 0 при всех р>0. Напомним, что если система S стационарна и линейна, то переходное отображение можно представить в виде ряда Ф(0, f) — e~tF = I — tF + ^~ —... Отсюда следует, что q'e~iFG = 0. Соотношение t 0 = <р(/; т, х, ©) = e(t~x)Fx + J e(f~<f>FGu(a)da % требует, чтобы 0 = х + J e<T-a)FG« (о) da, т но этого не может быть, если q'g 4= 0. Поэтому если ранг матри- цы С меньше п, то всегда найдется неуправляемое состояние х ¥= 0. Доказательство следствия (3.5). Здесь достаточно показать, что каждый раз, когда t > т и ранг матрицы С равен п, матрица W(т, 0 положительно определена. Действительно, если существует такое х ¥= 0, что t 0 = х'Г (т, 0 х = / II G'e^-^x ||2 da, т ТО x'eaFG = 0 на [/ — т, 0], что противоречит предположению rank С = п. Последнее доказьь вается так же, как и при доказательстве достаточности условий теоремы (3.4). Доказательство следствия (3.6) опирается на следующую лемму. (3.9) Лемма. Если q — такое целое, что rankfG, FG, .... F’-IG] = rank[G, FG, .... F’G] = r, то rankfG, FG......FpG] = r при всех p^q"1. Доказательство. Утверждение rank[G, ..., F7-,G] = rank[G, ..., F7G]
50 2 Теория регулирования линейных объектов согласно теореме Кэли — Гамильтона, рассматривать матрицу, большую чем (3.8). Поскольку полином xf нормиро- означает, что каждый столбец матрицы F«G линейным образом зависит от столбцов матриц G, ..., Fi~lG. Отсюда каждый стол- . бец Fv+'G линейно зависит от столбцов FG, ..., F^G. Продолжая по индукции, мы получаем утверждение леммы. Доказательство следствия (3.6). В силу леммы (3.9) ранг матрицы С должен увеличиваться по мере добавления каждого нового члена по крайней мере на 1 до тех пор, пока не будет достигнут макси- мальный ранг п. Если ранг матрицы С равен г, то будет достаточно добавить не более (п— г) членов FG, ..., Fn~rG с тем, чтобы убедиться, можно ли достичь максимального ранга и_матрицы б или нет (естественно, что, нам никогда не придется [G, ..., F«-»G]). Доказательство следствия ван и нам нужно лишь показать, что бхг = &ф.к, где 6 есть степень многочлена. Но так как фк(Е)О = 0, предположение бфр < п противоречит критерию управляемости (3.6) при г = 1. (3.10) Замечание. Следствие (3.5) может оказаться неожиданным для тех, кто стоит на позициях правоверного практицизма, по- скольку известно, что состояние реальных систем нельзя изменить за произвольно малое время, каким бы большим ни было входное воздействие. Но эта «трудность» относится не к теории, а к ее приложениям. Для того чтобы иметь возможность управлять си- стемой за произвольно малое время, необходимо уметь с произ- вольно малой ошибкой определять матрицы F и G. На самом деле доказательство соответствующей теоремы опирается на (неявное) предположение о том, что эти матрицы известны точно. В том же случае, когда мы переходим к применению теории, нам нужно, ко- нечно, побеспокоиться о том, в какой степени поведение динами- ческой системы, используемой в качестве модели, совпадает с по- ведением реального физического объекта. (3.11) Замечание. Необходимо иметь в виду, что теорема (3.4) дает лишь двузначный ответ на вопрос о полной управляемости системы. Но во многих практических ситуациях нужно также иметь количественную оценку относительной простоты или трудно- сти управления. В случае полной управляемости с этой целью мы можем использовать абсолютные значения определителей размера пХ п матрицы [G, ..., Fn-1G]. Менее искусственный подход к во- просу может заключаться в исследовании энергии управляющих воздействий ®, необходимых для перевода системы из заданного состояния в начало координат. Это приводит к понятиям теории оптимального управления, причем естественный критерий управ; дяемости, оказывается, совпадает с содержанием теоремы (2.16)
2.3 Стационарные линейные системы 5/ дта задача подробно рассматривается в работе Калмана, Хо и Нарендра [1963]. (3 12) Замечание. Более глубокое значение теоремы (3.4) заклю- чается в том, что она устанавливает связь между структурными свойствами системы S (отражающимися на алгебраических свой- ствах пары матриц {F, G}) и возможностями управления си- стемы S. Доказательство двух приведенных ниже следствий может быть получено по уже известной схеме и предлагается читателю в каче- стве упражнений. (3.13) Следствие. Для стационарной линейной системы dim range W (т, t) = rank[(?, FG, .... Frt-1G] при всех t x. ~ (3.14) Следствие. Управляемые состояния стационарной линейной системы образуют F-инвариантное подпространство, являющееся наименьшим таким подпространством, содержащим все вектор- столбцы матрицы G. Согласно следствию (3.13), для стационарной системы тео- рема (2.16) об управляемости и теорема (2.24) о достижимости совпадают. Это утверждение, а также возможности произвольного сдвига начального момента времени вместе с утверждением (3.5) позволяют прийти к следующему выводу. (3.15) Теорема. В стационарной линейной системе S каждое собы- тие управляемо тогда и только тогда, когда оно достижимо. Если t2> tx и система S полностью управляема, то за счет подходящего выбора входного воздействия ьз любое событие (ti,Xi) для S можно преобразовать в любое другое событие (t2, х2). До сих пор мы рассматривали состояние системы как некото- рую абстрактную величину, т. е. абстрактный вектор конечномер- ного векторного пространства. Другими словами, полученные выше результаты не зависят от конкретного выбора системы координат, позволяющего представлять абстрактные векторы, хотя и оказа- лось удобнее формулировать наши критерии на языке матриц, а не на языке абстрактных линейных преобразований. Однако известны ситуации, в которых подходящий выбор базиса приводит к инте- ресным результатам. При этом в определенном смысле мы жерт- вуем общностью (не зависящими от выбора системы координат Результатами) в обмен на вычислительные удобства (матрицы, с которыми мы будем иметь дело, имеют меньше элементов). Со- ветуем читателю познакомиться с книгой Халмоша [1958], в ко- торой дано прекрасное сопоставление «бескоординатной» и «ко- ординатной» точек зрения,
52 2 Теория регулирования линейных объектов Рассуждения и результаты § 2.2 и 2.3 остаются справедливыми с необходимыми изменениями и для линейных систем с дискрет-1 ным временем. Нестационарные системы с дискретным временем малоинтересны, поскольку единственным средством изучения таких систем оказываются различные предположения о гладкости за- висимости матриц F, G и Н от времени. Напротив, случай стацио- нарных систем с дискретным временем представляет значительную' ценность. Отметим поэтому здесь без доказательства два основ-' ных факта. (3.16) Теорема. Конечномерная линейная стационарная система 2. с дискретным временем эквивалентна системе уравнений (3.17) x(t + 1) = Fx(t) + Gu(t), y(t) = Hx(t), где матрицы F, G и H постоянны, a t целое. Этот результат можно получить подобно теореме (2.8). Ко- нечно, читатель, не интересующийся вопросами аксиоматики, волен принять уравнения (3.17) за определения линейной (конечномер- ной и стационарной) системы с дискретным временем; как и рань- ше, мы станем опускать прилагательные «конечномерная» и «ста- ционарная». (3.18) Теорема. Линейная п-мерная система 2 с дискретным вре- менем полностью достижима тогда и только тогда, когда rank С = rank [G, FG, ..., Fn~rG] = n, где г = rank G. (3.19) Замечание. Этот критерий соответствует следствию (3.6), но, так как теорема (3.15) не справедлива для систем с дискретным временем, если detF = O, нам пришлось сформулировать резуль- тат (3.18) в виде критерия достижимости, а не управляемости. Однако в самом общем случае по-прежнему справедливо, что Г множество 1 множество 1 [ управляемых состояний J ( достижимых состояний /• (3.20) Замечание. Весьма интересно, что алгебраическая форма теоремы (3.18) и следствия (3.6) одна и та же, хотя физический смысл матриц F и G в уравнениях (3.2) и (3.17) совершенно раз- личен. (В качестве упражнения предлагаем найти уравнения си- стемы с дискретным временем, соответствующей системе (3.2), полагая, что t из уравнения (2.11) принимает лишь целочисленные значения.) Поэтому заманчивым кажется забежать вперед и вы- сказать гипотезу, согласно которой основы теории линейных си- стем по самой своей сути являются алгебраическими, независимо от дискретности или непрерывности времени. Эта гипотеза рас-
2.4 Замена координат и канонические формы 53 сматривается в гл. 6 и приобретает завершенные очертания в гл. 10. В действительности именно теоремы (3.4) — (3.6) и (3.18) являются основной причиной привлечения понятия модуля в теорию линей- ных систем, что и составляет основное содержание гл. 10. 2.4 Замена координат и канонические формы Сейчас мы хотим получить явные формулы, описывающие влия- ние изменения базиса в пространстве Хх на значения параметров, определяющих систему 2. Станем рассматривать вектор состояний х как n-членную по- следовательность (n-ку) чисел, играющих роль координат (аб- страктного) вектора х относительно некоторого фиксированного базиса в пространстве состояний X. Соответственно нам нужно рассматривать F и G как матрицы, описывающие абстрактные линейные преобразования F и G относительно того же базиса в пространстве X. Нас не будут интересовать изменения базиса в пространстве U, так как он обычно задан явным образом физи- ческими соображениями. В то же время для пространства X та- кого «естественного» базиса не существует, поскольку практиче- ски всегда состояние системы придется рассматривать как некую абстрактную величину, лишенную конкретного физического содер- жания. (Возможно, что единственный случай, в котором состояния имеют естественное физическое содержание, это случай классиче- ской механики, где составляющими вектора состояния являются координаты и импульсы частиц.) Замена координат представляет собой некоторое невырожден- ное линейное преобразование A: xt—>£ = Ах. (числового) вектора состояний. В матричных обозначениях это можно записать так: (4.1) ' *1 ] Га11 . • . а1п ] Г Xt - - • • • апп -* - Хп - det А Ф 0. Преобразование А вызывает преобразование матриц F и G, описываемое формулами (4.2) G = AG, FA = AF. Рассмотрим следующую задачу. Даны две пары матриц {Л G) и {F, G}, соответствующих одной и той же полностью управ- ляемой системе S, но при различных базисах в пространстве X. выясним, как определить матрицу А в явном виде. Многократно Используя соотношение (4.2), мы получаем О = ЛО, FG = AFA~'AG = AFG, ....
54 2 Теория регулирования линейных объектов так что в силу соотношений (4.2) и (3.6) имеем (4.3) [G, FG, .... Fn~rG] — A[G, FG, .... F"-rG], где г = rank G. Если tn = 1 (матрица G состоит из одного столбца, т. е. у системы всего один вход), то = 1. В то же время г > 0, так как в случае г = 0 имеем G = 0, и система 2 безусловно не может быть полностью управляемой. Поэтому г = 1. В этом частном случае матрицы в (4.3) квадратные. Они невырождены (по (3.6)), так как известно, что 2 полностью управляема. Отсюда находим (4.4) А = fe, Fg, ..., [g, Fg, ..., Fre-1g]"‘, где мы обозначили через g матрицу G размера п X 1. В общем случае г > 1 эта формула становится бессмысленной, так как для неквадратных матриц не определены обратные. По- этому в данном случае построим С = [G, ..., Fn'rG] и D = СС'. Теперь матрица D квадратна порядка п и невырождена в силу условия (3.6) (это построение можно сравнить с определением W из теоремы (2.16)). Таким образом, поскольку из равенства АС = С следует ACC' — AD = СС', получаем А = СС'£Н. Отме- тим, что матрица С'(СС')~1 представляет собой одну из обобщен- ных матриц для С. Подводя итог, сформулируем следующую теорему. (4.5) Теорема. Если полностью управляемая п-мерная линейная система 2 описывается относительно различных базисов в про- странстве X парами матриц {F, G} и {F, G}, то невырожденная матрица А, определяющая преобразование координат х = Ах, по- рожденное переходом от одного базиса к другому, может быть вычислена по формуле Д = [О....Fn~rG][G, ..., Fn~rG]'x X {[G.....F^GjtG........F',-rG]T’» еде r = rank G = rank AG = rank G. (4.6) Следствие. Матрица А единственна. Доказательство. Если не привязываться к каким-либо системам координат, то этот результат сразу становится очевидным: два раз- личных базиса конечномерного векторного пространства всегда связаны друг с другом единственным линейным преобразованием. Не менее просто и непосредственное Доказательство. Пусть А и В —две матрицы, преобразующие (F, G) в {F, G}. Воспользовав-
2.4 Замена координат и канонические формы 55 шись уравнениями (4.2) дважды, мы получим B~}AG = G и = B~'AF. Hoj согласно теореме (4.5), имеем В~'А — I, или (4.7) Замечание. Изучение поведения квадратных матриц при пре- образованиях вида F » AFA~*— один из традиционных разделов линейной алгебры. Наши же результаты интересны и новы по- тому, что относятся к паре матриц {F, g}. При этом важную роль играет предположение о полной управляемости. Если, например, G = 0, то преобразование А уже не будет единственным. Уравне- ние FA = AF при фиксированной матрице F допускает в качестве решений все матрицы A = n(F), где л — любой многочлен одного переменного с вещественными коэффициентами. Можно показать (см. следствие в § 3.15 книги Джекобсона [1951]), что матрицы л(Е) являются единственными, коммутирующими с матрицей F, тогда и только тогда, когда матрица F принадлежит некоторой полностью управляемой паре {F, g}, т. е. тогда и только тогда, ко- гда матрица F принадлежит системе, полностью управляемой с по- мощью единственного входа, или, наконец (см. следствие (3.8)), тогда и только тогда, когда матрица F циклична. Воспользуемся теперь возможностью упростить критерий управ- ляемости (3.6) за счет специального выбора базиса. Предполо- жим, что G состоит из единственного столбца g. (4.8) Теорема. Запишем характеристический многочлен матрицы F в виде %Р (z) = zn + ajZ"-1 + ... +a„. Тогда множество векторов ei = Fn~'g + aiFn~2g+ ... en-i~Fg + aig> en = g образует базис в пространстве X тогда и только тогда, когда пара (Л £} полностью управляема. Относительно этого базиса матрицы {F, g] имеют следую- щий вид: " 0 1 0 ... 0 ’ 0 0 1 ... 0 - 0 - (4.9) F = /Т — i — • 0 0 0 ... 1 L 1 J _-an an-l —an-2 ••. ~ai - Доказательство. Множество векторов {еь ..., еп} представляет собой треугольную линейную комбинацию векторов {g, Fn-lg},
56 2 Теория регулирования линейных объектов Поэтому , еп} образует базис в пространстве X, так как в силу утверждения (3.6) для случая г = 1 базисом является {g, .... Fn~lg}. В том же, что F имеет приведенный выше вид, можно убедиться непосредственно, вычисляя Fen, Fez; в част- ности, Fe\ — —апвп следует из того, что %f(F) = 0 (теорема Кэ- ли—Гамильтона). (4.10) Определение. Матрицы (4.9) называются каноническим представлением матриц {F, g}. (4.11) Замечание. Поскольку многочлен х определяет матрицу F из уравнения (4.9), матрица F была известна раньше как сопро- вождающая матрица многочлена %. Однако это неудачный термин, так как сопровождающими для % можно с равным основанием считать и некоторые другие матрицы, например матрицу 0 0 ... 0 — ап 1 0 ... 0 — <*„-] 0 1 ... 0 — а„_2 » ..О 0 ... 1 -О| _ которая будет играть важную роль ниже. Пока же лишь отметим, что матрица F из (4.9) единственным образом определяется мно- гочленом xf и особым базисом {ej. (4.12) Упражнение. Убедитесь в том, что det (г/ — Г)=хИ2)» т. е. х₽ действительно является характеристическим многочленом матрицы F из (4.9). (4.13) Замечание. Появление канонических представлений тесно связано с известным приемом перехода от одного дифференциаль-’ ного уравнения n-го порядка ] (4.14) ... +any = u(t)t 1 (где г и у — скаляры, щ — постоянны) к системе из п уравнений^ первого порядка ’ dxi ' ~dF=X2’ (4.15) ^- = х3, ^ = -anXi- ... -щхп + uii). Матричное описание системы (4.15) как раз совпадает с па-: рой {Г, g}, приведенной в (4.9). Переход от уравнения (4.14) К
2.4 Замена координат и канонические формы 57 уравнениям (4.15) осуществляется в результате введения перемен- ных состояния по формулам &*~*у . . (4.16) Xi = -^T> .....п. Обычный переход к уравнениям (4.15), намеченный только что, вообще говоря, неудовлетворителен. Наш подход, приведенный выше, существенно точнее по крайней мере в трех отношениях (ими часто пренебрегают или неправильно их интерпретируют). 1. Это вопрос о том, является ли система (4.14) полностью управляемой (вопрос впервые глубоко обсуждали Калман, Хо и Нарендра [1963]). 2. Иногда считают, что преобразование (4.16) является един- ственным, позволяющим преобразовать уравнение (4.14) в урав- нение, описывающее поведение системы «в пространстве состоя- ний». Но это неверно. Система S, для которой минимальная реа- лизация преобразования вход — выход и (•) н-»«/(•) описывается дифференциальным уравнением п т (4.17) 2а^==2в'^Г’ т<п, (Хо=1, полностью управляема, и поэтому она также приводима к своей канонической форме (4.15). В этом случае разница между систе- мами (4.14) и (4.17) отражается на виде Н (см. теорему (3.16)). В первом случае у •= Xi, Н = [1 0 ... 0], а во втором (см., например, § 8 работы Калмана [1963с]) п-1 #= S РЛ+1> Н — 1Ро Pi • • • Рп-11- i=0 3. Соотношения (4.16), описывающие переменные состояния в зависимости от-производных выходной величины, хорошо подхо- дят для системы (4.14), но в общем случае не выполняются. Они не пригодны, например, для уравнения (4.17). Короче говоря, здесь важно каноническое представление системы управления, а не конкретные соотношения (4.16). (4.18) Замечание. Как мы увидим в следующем параграфе, тео- рема (4.8) перекидывает удобный мостик между современной теорией управления и классической задачей конструирования ре- гуляторов. Дело обстоит далеко не так просто, когда G имеет бо- лее одного столбца, т. е. когда у системы S более одного входа. В этом общем случае не существует простого канонического представления, аналогичного представлению (4.9). Интересно
58 2 Теория регулирования линейных объектов отметить, что соответствующая задача в классической теории управления (конструирование регуляторов с несколькими входами) никогда не была решена удовлетворительным образом. Действи- тельно, для синтеза таких систем не известно общего алгоритма. Однако с точки зрения современной теории управления канониче- ское представление (4.9) связано всего лишь с соображениями удобства. Основным же остается вопрос о полной управляемости, который для заданной системы решается положительно или отри- цательно независимо от существования каких-либо канонических представлений. 2.5 Понятие закона управления Теперь мы готовы к тому, чтобы использовать наши абстракт- ные соображения об управляемости для решения (математиче- ской) задачи конструирования системы управления. Решать эту задачу можно различными способами, так как имеется много систем управления, способных выполнить более или менее одина- ковое задание. Как уже подчеркивалось выше, мы сосредоточим внимание на регуляторах простейшего вида. Здесь мы покажем, что современная теория управления приводит к результатам, ко- торые согласуются с выводами классической теории управления, но при этом они проще получаются и легче интерпретируются. Центральную роль играет понятие «обратной связи», которое можно формально определить следующим образом. (5.1) Определение. Рассмотрим произвольную динамическую си- стему S. Законом управления называется отображение k: Т X X -* U, ставящее в соответствие каждому состоянию х (t) и каждому моменту времени t значение u(t) =k(t,x(t)) входного воздействия в этот момент времени. Другими словами, значение входного воздействия в каждый момент времени зависит лишь от состояния системы x(t) в этот момент времени, а также, возможно, от t. При этом другие параметры 2 могут влиять на конкретный характер функции k. Принцип, согласно которому входные воздействия должны вы- числяться через состояния системы, был четко сформулирован в середине 50-х годов Ричардом Веллманом, указавшим на его первостепенную важность. В этом принципе заключена наиболее важная идея теории управления. На самом деле это научная ин- терпретация великого открытия, известного под названием «об- ратной связи» и составляющего, основу всей автоматики. Утверждение, что описание объекта в пространстве состояний представляет собой естественную основу для постановки и реше- ния задач управления, убедительно подтверждается следующими результатами. Главное здесь, конечно, то, что в текущем состоянии
2.5 Понятие закона управления 59 системы содержится вся информация, необходимая для определе- ния требуемого управляющего воздействия, поскольку (по опре- делению динамической системы) будущее поведение объекта пол- ностью определяется его нынешним состоянием и будущими управ- ляющими воздействиями. (5.2) Замечание. Не очевидно, что заданный закон управления k определяет входное воздействие со: Т ->U, принадлежащее про- странству входных воздействий Qs системы S. Трудность заклю- чается в том, что k определяет со лишь неявным образом через соотношение со: t и (0 = k (t, ср (/; т, х, со)). Совсем не ясно, существует ли решение этого уравнения, так как не ясно, какие ограничения нужно наложить на k, чтобы гаран- тировать величине со достаточную гладкость и принадлежность классу Qs (а это необходимо для того, чтобы со можно было под- ставить в ф). Таким образом, мы не свободны в выборе k, а свя- заны неявными ограничениями, вытекающими из свойств П2. К счастью, это неприятное техническое препятствие устраняется в наиболее важном частном случае, когда система S линейная конечномерная и гладкая, пространство Qs образовано непрерывными вещественными функциями, а k линейно по х и непрерывно по t. Последнее допущение позволяет записать функцию k в виде k(t, x) = K(t)x, где К: Г{матрицы размера туп]. Подставляя это управление «(/) в уравнение (2.9), получаем уравнение свободной системы ^~[F(t)-G(t)K(t)]x, которое имеет вполне определенное единственное решение для каждого события (т, х), поскольку все матрицы F, G и К предпо- лагаются непрерывными по t. Более того, переходная матрица этого уравнения также непрерывна по t, т. е. Ф(% т)хе С°(Т~*-Х). А так как со: 11—> и (f) = К (/) Ф (t, т)х, где о g= С°, то, следовательно, со е Qs при любом выборе К. При сделанных выше предположениях решение задачи синтеза закона управления почти сразу получается из теоремы (2.16). На интуитивном уровне это выглядит следующим образом. Поскольку Уравнение (2.20) определяет правильное входное воздействие как
60 2 Теория регулирования линейных объектов функцию состояния лишь при ст — т, мы определим и (а) при каж-S дом о, пользуясь тем же правилом. Таким образом, мы попробуем! определить линейный закон управления с помощью соотношений (5.3) и (а) = — G' (ст) IT* (ст, t) х (ст) = — К (ст) х (ст), ст е [т, /], где IF* (псевдообратная матрица для IF) есть любое решение X матричного уравнения IFXIF — 1F, такое, что отображение ст t—й >—(ст, t) при каждом t является кусочно-непрерывным. | Вопрос о существовании IF* не относится к числу тривиальных! (в действительности на этот вопрос не обратили внимания в ра- боте Калмана, Хо и Нарендра [1963]). Мы определили теперь IF* с помощью следующей процедуры. .< 1. Зафиксируем ти / и разобьем интервал [т, /] на непересекакн щиеся подинтервалы, покрывающие интервал, таким образом,! чтобы ranklF(-, 7) = const. Поскольку при ст->т ранг матрицы^ 1F(ct, t) монотонно возрастает и может принимать лишь конечное! число значений, таких подинтервалов будет конечное число. Легко! видеть, что каждый такой подинтервал замкнут слева и открыв справа (за исключением того случая, когда ст = t). | 2. На первом из этих интервалов, скажем на [сть 0, определим! IF+( •, t) следующим образом. Если X = У ф Z (т. е. представленс! в виде ортогональной прямой суммы), причем 1F невырождена на! У и обращается в нуль на Z, то определим IF* так, чтобы! IF* Y = W~', a TF*|z = /')- I 3. Аналогичным образом определим IF* на всем множестве! [т, /]. Такое IF* будет кусочно-непрерывным. j Заметим, что II IF* (ст,/) II-> оо при ст->стг слева. Это математи| ческое препятствие «исчезает» после умножения К (ст) на х(ст) (см! уравнения (5.5) и (5.6) ниже). Однако игнорировать практическим трудности, связанные с существованием неограниченных элемент тов К, нельзя. | Попытаемся теперь доказать, что соотношение (5.3) оправды-| вает наши ожидания. I (5.4) Теорема. В конечномерной линейной гладкой системе S вход! ное воздействие, определенное законом управления (5.3), преобра4 зует каждое событие (т, х) в (t, 0) тогда и только тогда, когда] х е range 1F(t, t)., I Доказательство. Необходимость утверждения теоремы уже была^ доказана (теоремой (2.16)). Для доказательства достаточностй] нужно показать, что со*, определенное по правилу (5.3), совпадает] ’) Здесь через А1X обозначено сужение А на X.
2.5 Понятие закона управления 61 с Ох. определенным согласно соотношению (2.20), т. е. что (5.5) и. (<0 = - G' (а) 1F* (<г, 0 х (<т) И (5.6) «х (<Д = ~ G' (<0 Ф' (т> <Д zx должны совпадать при всех а е [т, fl. Подставив (5.6) в (2.11) (и воспользовавшись соотношением (2.21) несколько раз), получим явное выражение для переходной функции х (а) = ф (о; т, х, <ох) = Ф (<т, т) [IT (т, t) — IF (т, а)] гх = = W (о, t) Ф' (т, а) zx. Подставляя это выражение в уравнение (5.5), мы увидим, что и» (о) «х (сг), если (5.7) G'(a)w = C'(a)W*(<j, t)W(p, t)w при всех а и w (в действительности w = Ф'(т, о)гх). Для проверки справедливости соотношения (5.7) находим t (5.8) J II G' (р) Ф' (<т, р) [I - IF* (a, t) W (<т, fl] w |2 dp = 0. or Это равенство легко получить из определения W и соотношения IFIF*IF = IF. В силу непрерывности подинтегральная функция в (5.7) должна обращаться в нуль тождественно на всем интервале [a, t], и в частности также при р = а, что и доказывает справедлив вость соотношения (5.7). Таким образом, формула (5.6) дает решение задачи (2.4) в обоих случаях: и когда со задано явным образом с помощью урав- нения (2.20), и когда оно неявным образом определяется соотно- шением (5.3). Более того, каждый сделанный выше вывод справед- лив для любого события (т, х). Тождество (5.8) играет первостепенную роль. Это так называе- мая «лемма о псевдообратных» (см. приложение к работе Кал- мана [1963 b]). (5.9) Замечание. Законом управления (5.3) редко пользуются на практике, так как К(а)->оо при о->/. Это объясняется чрезмер- ной жесткостью граничных условий, требующих, чтобы x(t) = 0. Исчерпывающий анализ этой ситуации связан с привлечением аппарата вариационного исчисления и по праву принадлежит тео- рии оптимального управления. Для нас же наиболее важный вывод из теоремы (5.4) заклю- ается в следующем. Возможность синтеза произвольно хорошего ЛКона управления ограничена лишь свойствами управляемости ъекта. Если же объект конечномерный, линейный, гладкий и
62 2 Теория регулирования линейных объектов стационарный, то никаких ограничений на качество управления нет, если объект к тому же и полностью управляем. Это приводит нас к довольно удивительному результату. (5.10) Теорема. Пусть пара {F, g} полностью управляема и пусть 0(z) = zn + PiZn-1 + ... +рп есть произвольный многочлен, а п = dimF. Тогда найдется такой вектор k, что = Насколько известно автору, эта теорема впервые была дока- зана Дж. Э. Бертрамом, использовавшим метод «корневого годо- графа». В 1961 г. Р. У. Бэсс независимо сформулировал и доказал эту теорему в неопубликованных лекционных заметках. Его дока- зательство опиралось на линейную алгебру. С тех пор эта теорема переоткрывалась независимым образом много-много раз. То дока- зательство, которое мы приводим здесь (оно заимствовано из ра- боты Калмана [1963d], где играет роль основной леммы), суще- ственно проще многих других, опубликованных в литературе. Доказательство. Поскольку характеристический многочлен не за- висит от выбора координат, мы можем воспользоваться любым базисом для вычисления k. Воспользуемся поэтому каноническим представлением пары {F, g}, согласно уравнениям (4.9). Относи- тельно этого базиса положим k' = (ki, ..., kn), где = а{ + kn-i+t, i=l, .... n. Из-за специального вида вектора g матрица F — gk' является со- провождающей матрицей, последняя строка которой имеет вид (—рп, — Pi). Отсюда находим = что и требовалось доказать. (5.11) Обсуждение результата. Приведенная теорема утверждает, что для полностью управляемой стационарной системы S с одним входом характеристические корни можно устанавливать по своему усмотрению, если допустить использование обратной связи. Это свидетельствует о чрезвычайной важности обратной связи. При по- мощи обратной связи можно совершенно произвольным образом определять динамику объекта с единственной оговоркой: описание объекта линейной стационарной системой должно обеспечивать точное воспроизведение поведения физического объекта. Поэтому нет необходимости в построении объекта (например, самолета или ядерного реактора) так, чтобы он сразу же обладал хорошими динамическими свойствами, — желаемые свойства можно достичь искусственно с помощью обратной связи. А это обеспечивает боль- шую свободу конструирования и построения объекта управления. Поскольку в настоящее время не существует удовлетворитель- ной теории управляемости нелинейных систем, невозможно ска- зать, какие глобальные ограничения накладываются на управляе- мость нелинейными элементами объекта» Другими словами, без-
2.6 Определение состояний 63 граничные потенциальные возможности обратной связи, отмечен- ные выше, могут быть'реализованы в общем случае лишь в локаль- ном (линейном) смысле. (5.12) Замечание. Как уже отмечалось в § 2.1, более глубокая тео- рия управления требует, чтобы мы вычислили коэффициенты уси- ления Pi, ..., рп в цепи обратной связи так, чтобы обеспечить их оптимальность в соответствии с некоторым конкретным критерием оптимальности. Такая теория развивается в § 3.5. Ее конечный вы- вод (следствие (5.57) гл. 3) состоит в том, что при разумных пред- положениях оптимизация на интервале [0, со) приводит к строго устойчивому закону управления, т. е. что (5.13) ReXjF — gk']<0 при всех Л1) Для упрощения последующих рассуждений мы просто станем предполагать ниже, что наш закон управления удовлетворяет усло- виям (5.13). На самом деле это не такое уж неестественное пред- положение. Очень часто в классической теории управления выбирается из интуитивных физических соображений и, естест- венно, так, чтобы удовлетворялось требование устойчивости (5.13). И что удивительно, получавшаяся система часто оказывалась опти- мальной с точки зрения современной теории управления (см. Кал- ман [1964]). 2.6 Определение состояний В нашем определении закона управления неявно предпола- гается, что в каждый момент времени известно, в каком состоянии находится система; другими словами, все внутренние переменные объекта могут быть измерены и получены в качестве выходных ве- личин. Однако трудно предположить, что в большинстве практиче- ских ситуаций это в самом деле так. В действительности нам все- гда следует представлять себе состояние объекта как некоторую абстрактную величину, описывающую недостижимые переменные внутри объекта. Так возникает первая трудность, которую нужно преодолеть, если мы хотим воспользоваться предписанием Велл- мана: управление есть функция состояния. Естественное решение этой проблемы состоит в следующем. Кроме закона управления регулятор должен содержать и другой элемент, назначение которого состоит в определении состояния системы. Из определения динамической системы ясно, что для на- хождения состояния объекта необходима информация двух раз- личных видов. *) Здесь через ХД4] обозначены собственные числа матрицы А,
64 2 Теория регулирования линейных объектов 1. Необходимо знать структуру объекта, т. е. его переходное отображение, его выходное отображение и т. п. 2. Необходимо знать действительные входные воздействия и выходные величины объекта. В этом параграфе мы попытаемся найти вычислительную схему, преобразующую данные этих двух типов для получения хорошей оценки неизвестного текущего состояния объекта. (6.1) Замечание. В современной инженерной практике принято предполагать, что большинство данных первого типа известно априори (например, сообщается конструктором объекта), а данные второго типа получаются в результате измерений в реальном мас- штабе времени в процессе повседневной работы объекта. Если дан- ные первого типа отсутствуют и должны быть каким-то образом извлечены из информации о входных воздействиях и выходных ве- личинах (задача идентификации), то мы имеем дело с задачей адаптивного управления. О теории адаптивного управления много и долго говорят, но в ней очень мало сделано. В задаче неадаптив- ного управления (когда информация о структуре объекта имеется) предполагается, что динамические свойства объекта известны в точности, и остается «только» определить текущее состояние в каждый момент времени. А это относительно просто, так как струк- турные данные содержат очень большую информацию, отражаю- щую результаты многовековых исследований в естественных нау- ках. Машина, которая сможет обеспечить адаптивное управление произвольным объектом, сможет также заменить человека и в об- ласти научного экспериментирования и построения моделей. Мы считаем задачу адаптивного управления задачей будущего и не станем останавливаться на ней здесь. Возвращаясь к задаче измерения состояния системы, мы нео- жиданно обнаружим, что она является «дуальной» по отношению к задаче управления. В этом и состоит принцип дуальности упра- вления и оценки, сформулированный в работе Калмана [1960 Ь]. В случае конечномерных линейных систем определение понятия «дуальности» использует обычные понятия, такие, как простран- ство, сопряженное заданному векторному, сопряженное линейное отображение и т. п. Тем не менее достаточно строгое аксиоматиче- ское построение понятия дуальности потребовало бы, к сожалению, более высокого уровня абстракции, чем тот, который диктуется элементарным характером этой книги. Поэтому мы ограничимся тем, что как можно быстрее получим основные результаты. При этом нам не придется пожертвовать строгостью, но читателю не- которые определения не покажутся столь же естественными, что и раньше. Будем различать два типа задач на определение состояния системы.
2.6 Определение состояний 65 1. Задача наблюдения связана с определением настоящего со- стояния х(т) по данным о поведении выходных величин в будущем, {г/(о):о>т}. 2. Задача идентификации требует определения х(т) по данным о поведении выходных величин в прошлом {t/(o): о<Стп}. При этом всегда будет предполагаться, что <р, т] и со для иссле- дуемой системы известны. В первом случае мы наблюдаем буду- щие эффекты настоящего состояния и пытаемся установить перво- причину. Во втором случае мы пытаемся восстановить текущее состояние, не располагая полной информацией о действительных изменениях состояния. Введем теперь некоторые основные определения, дающие аб- страктные необходимые и достаточные условия разрешимости этих двух задач. Мы начнем с определений для общих систем. (6.2) Определение. Два события (т, Xi) и (т, х2) динамической системы S принадлежат одному классу наблюдения (или неразли- чимы в будущем) тогда и только тогда, когда т)(£, ф(*; т, хь ®)) = т](/, ф(/; т, х2, о)) при всех />т и любых со. Аналогичную роль для второй задачи играет понятие класса идентификации. (6.3) Определение. Два события (т, Xi) и (т, х2) динамической системы 2 принадлежат к одному и тому же классу идентифика- ции (или неразличимы в прошлом) тогда и только тогда, когда г> (<т, Ф (ст; т, X], ©)) = т] (ст, ф(о; т, х2, ©)) при всех и’<ти любых со. Заметим, что здесь мы говорим о множестве Ф (о; т, х, о) = {х; ф (т, о, х, ©) = х}. Приведенные определения излишне сложны для линейного слу- чая. В силу линейности ф(/;т, •, •) и т](/, •) получим, что т) (/, ср (/; т, х, ©)) = г| (t, ф (/; т, х; 0) + ф (/; т, 0, ©))s = г](/, ф(/; т, х, 0)) + т) (£, ф(<; т, 0, ©)), и, так как второй член справа зависит лишь от т], ф и ю, он взаимно уничтожится при вычислении следующей разности: т|(/, ф(/; т, хь ©))-»](/, ф(Л, т, х2, ©)) = = T](f, ф(/; т, X], 0)) —т](<, ф(/; т, х2, 0))=» — л (/, ф (/; т, Х[ — х2, 0)). В последнем равенстве мы вновь воспользовались линейностью ф на X X й. 3 Зак, 693
t>6 2 Теория регулирования линейных объектов Это позволяет перефразировать наши определения следующим образом. (6.4) Определение. Событие (т, х) линейной динамической Системы S ненаблюдаемо тогда и только тогда, когда оно принадлежит к классу наблюдений (т, 0), т. е. тогда и только тогда, когда . т] (/; т, х, 0) = О пи всех оХт. (6.5) Определение. Событие (т, х) линейной динамической си* стемы S неидентифицируемо тогда и только тогда, когда оно при- надлежит к классу идентификации (т, 0), т. е. тогда и только то* гда, когда т) (ст; т, х, 0) = 0 при всех ст-С т. Теперь мы приведем относительно явный критерий неидентифи- цируемой линейной системы (Калман [1960а,Ь]). (6.6) Теорема. В конечномерной гладкой линейной динамической системе S событие (т, х) неидентифицируемо тогда и только тогда, когда хекегЛЦа, т) при всех s'&x, где t M(s, т) = J Ф' (о, т) Н' (о) Н (а) Ф (ст, т) do. S Эта теорема является естественным дополнением теоремы (2.16). Однако ее доказательство существенно проще. Здесь нам не нужно описывать (конструктивную) процедуру отыскания х по известным у (а) — Н (о)Ф(о, х)х, о-<т, а достаточно охаракте- ризовать случай, в котором это невозможно. Позднее мы покажем, что событие, которое не является неидентифицируемым, действи- тельно можно идентифицировать. Другими словами, мы дадим в явном виде рецепт вычисления х по {г/ (ст): Доказательство. Необходимость. Формула т x'M(s, т)х= J ||Н(ст)Ф(о, x)xl?dff S показывает, что если (т, х) неидентифицируемо, то x'M(s, т)х = 0 при всех s. А так как М симметрична и неотрицательно опреде- лена, имеем М = N'N. Но отсюда х'Мх = ||JVx||2 = 0, откуда сле- дует, что Nx = 0 и, следовательно, Мх = N'Nx = 0. Достаточность. Если х е ker М, то х'Мх = 0, и та же формула по* называет, что Я(а)Ф(о, т)х == 0 при всех а-<т. Роль «дуального» результата играет следующая теорема.
2.6 Определение состояний 67 (6.7) Теорема. В конечномерной линейной гладкой динамической системе S событие (т, х) ненаблюдаемо тогда и только тогда, ко- гда х е ker М (т, t) при всех t^-x, где t М (т, t) = J Ф' (<г, т) Н' (о) Н (а) Ф (а, т) da. X Бросается в глаза аналогия между следующими определениями: W (теорема (2.16)) и М, с одной стороны, и W (теорема (2.24)) и М, с другой. Иначе говоря, в некотором смысле понятие иденти- фицируемости естественным образом дополняет понятие управ- ляемости, а понятие наблюдаемости — понятие достижимости. Вы- явить это проще всего с помощью преобразования подинтеграль- ной функции для W в подинтегральную функцию для М. При фиксированном х и произвольном вещественном а таким преобра- зованием может быть G (т + а) -> Н' (т — а), (6.8) Ф(т, т + а)-* Ф'(т — а, т), F (х + а) -*• F' (т — а). Другими словами, нам нужно воспользоваться зеркальным ото- бражением графиков каждой функции G(-), Ф(-) и £(•) относи- тельно точки t = т, а затем перейти к транспонированным матри- цам и заменить G на Н. В случае если нас интересуют управляе- мость и идентифицируемость, параметр а должен быть неотрица- тельным. Если же речь идет о достижимости и наблюдаемости, то а должно быть неположительным. Для стационарных систем эти преобразования упрощаются G-+H', (6.9) e-tF^e-tF’t F-+F'. Соотношения дуальности (6.8) и (6.9), очевидно, взаимно одно- значны. Действительно, обратные преобразования задаются соот- ношениями (6.10) и (6.11) Н (т — а) -> G' (т + а), F (т — а) -> F' (т + а) H^G', F~>F'. С помощью этих соотношений можно построить критерии наблюдаемости и идентифицируемости, основанные на критериях 3*
'68 2 Теория регулирования линейных объектов достижимости и управляемости, а затем воспользоваться результа- тами § 2.2 и 2.3 для получения явных условий. С учетом теоремы (6.7) удобно воспользоваться следующими определениями. Система S полностью наблюдаема в момент т тогда и только тогда, когда ни одно событие (т, х) системы S не является нена- блюдаемым, за исключением события (т, 0). Система S полностью идентифицируема в момент т тогда и -только тогда, когда ни одно событие (т, х) системы S не является неидентифицируемым, за исключением (т, 0). Тогда, воспользовавшись преобразованием (6.10), мы сразу по- лучим следующий результат. (6.12) Предложение. Пара матричных функций t^F(t), определяет систему S, которая в момент времени т полностью на- блюдаема, тогда и только тогда, когда пара матричных функций t^F'(2x-t) = F(t), t^H'(2x-t)~G*(t) определяет систему S*, которая в момент времени т полностью достижима. • Предоставляем читателю самому сформулировать другие ре- зультаты того же типа. В оставшейся части этой главы будем использовать термин «линейная система» как сокращенное обозначение для термина «конечномерная линейная гладкая и стационарная система». С учетом преобразования (6.9) следствие (3.13) можно пере- фразировать следующим образом.. (6.13) Предложение. Для п-мерной линейной системы S dim ker М (х, t) = n— dim range М (т, i) = » п - rank [Я', F'H'...............(Г)"-1Я'] при всех t > х. На этом предложении или на предложении (6.12) основывается следующее предложение. (6.14) Предложение. Пара постоянных матриц {F, Н} соответствует полностью идентифицируемой системе тогда и только тогда, когда пара {F', Н'} соответствует полностью управляемой системе. Приведем для полноты еще и теорему, дуальную теореме (3.4). (6.15) Теорема. Линейная п-мерная система S полностью иденти- фицируема тогда и только тогда, когда rankD = rank[#'» F'H', ...» (F')n~'H'\ = n.
2.6 Определение состояний 69 Здесь D — матрица размера п X рп, составленная из столбцов матриц H',F'H'.....(F')n~xH'. Теперь приведем схему идентификации текущего состояния пол* ностью идентифицируемой системы, основывающуюся на наблюде- ниях прошлых значений выходных величин. Если бы нам нужно было сделать это, сохраняя строгую дуальность с результатами из § 2.2, относящимися к управляемости, нам пришлось бы попы- таться описать сначала схему идентификации х(т), использующую данные о поведении в прошлом на конечном интервале [а, г]. Вме- сто этого мы предпочитаем прямо перейти к теореме, двойственной относительно теоремы (5.10) и замечания (5.12), воспользовав- шись одним понятием, введенным Бэссом (впервые сформулиро- вано в 1963 г. в неопубликованном отчете). (6.16) Определение. Линейная система 2 называется системой асимптотической оценки состояния линейной системы 2 тогда и только тогда, когда х (0 = х (/) — Л (/)-> 0 при /->оо. При этом система 2 описывается системой уравнений = Ех (0 * + L (0 [у (0 - Ях (0 Л] + Gs (0 и (0, 0(0 = Ш Здесь нижние индексы 2 у матриц указывают на то, что эти матрицы определяют систему 2. Мы не станем развивать теорию систем асимптотической оценки саму по себе, а перейдем сразу же к наиболее важному частному случаю. (6.17) Теорема. Для линейной системы 2 с одним (р = 1) выходом система асимптотической оценки существует тогда и только тогда, когда она полностью идентифицируема. Доказательство. Мы добьемся даже большего: мы построим си- стему 2 в явном виде. Для этого обозначим через h' матрицу Н размера 1 X п. Предполагая, что (F, h'} полностью идентифици- руема, и используя предложение (6.14), мы можем сделать вывод, что (F', ft) полностью управляема. Воспользуемся специальным базисом X, относительно которого матрицы (F', h) принимают ка- ноническую форму (4.9). Тогда имеем "0 0 0 ... 0 ап 1 0 0 ... 0 (6.18) F = 0 1 0 ... 0 ап-2 , Л--10...1] ,_0 0 0 ... 1 -«1
70 2 Теория регулирования лйнейных объектов Пусть 0 (z) = zn + PiZn-1 + .. - + рп есть произвольный норми- рованный многочлен, все нули которого имеют отрицательные дей- ствительные части. Если теперь построить вектор-столбец I с ком- понентами . t/l—i+l ~ Р/ ~аЬ •••» то (согласно теореме (5.10) или непосредственно) находим (6.19) = Но тогда, если тН+ЗД И = Ex +1 [у (0 - h'.i] + Gu (/) являются уравнениями систем 2 и 2, то легко видеть, что х = х—к удовлетворяет дифференциальному уравнению (6.20) -f-=(E-/A')x при начальных условиях (6.21) x(s) = x(s), где s — момент времени, с которого начинается наблюдение выход- ных величин системы 2. Действительно, условие (6.21) предпола- гает, что х (s) = 0, так как вначале мы ничего не знаем о состоя- нии системы 2. Но, так как в соответствии с условием (6.19) и пред- положением, сделанным относительно 0, у собственных чисел матрицы F — lh' из уравнения (6.20) могут быть лишь отрицатель- ные действительные части, имеем Ж(0 ->0 при любых значениях x(s). А это доказывает достаточность условий теоремы. Необходимость этих условий сразу следует из определения иден- тифицируемости. Если же вспомнить, что многочлен 0 выбирался совершенно произвольно при условии, что действительные части всех его нулей отрицательны, то получим важное следствие. (6.22) Следствие. Динамические свойства (6.20) ошибки асимпто- тической оценки состояния могут устанавливаться произвольным образом, за тем лишь исключением, что все ошибки этой оценки стремятся к нулю при t-+oo, т. е. Re [Г — lh'] <0, i = 1, ..., п, Форму матриц из уравнений (6.18) мы станем называть идеи* тификационным каноническим представлением.
2.6 Определение состояний 71 В качестве иллюстрации полученных результатов решим теперь одну типичную задачу теории линейных систем. (6.23) Определение. Пусть Q — пространство непрерывных функ- ций T->R. Линейная система S с одним входом (т = 1) назы- вается асимптотическим дифференциатором порядка п—1 тогда и только тогда, когда при всех и(‘)ей имеем »=о, 1,...»«-I, аг и каждое ^ (/)-*•() при (6.24) Теорема. Если Q — пространство всевозможных многочле- нов t степени не выше (п — 1) с коэффициентами из R, то асимпто- тический дифференциатор 2 порядка (п — 1) (являющийся п-мер- ной системой) существует. Доказательство. Входные воздействия dj можно рассматривать как выходные величины y(t) = 0,(t) системы 2, описываемой матри- цами О О _0 ... 1 О- О 0_ Н = h' = [0 ... 1], G = 0. Действительно, несложный расчет показывает, что Таким образом, функция л-1 й (6.25) 1/(0 = Л'№ = 2-{гх„_й_1 о является многочленом. Другими словами, любой многочлен сте- пени не выше п может быть получен в качестве выходной вели-* чины у(-) системы 2 за счет подходящего выбора начального со- стояния х е Хъ. Но, так как система 2 полностью измерима, можно построить, согласно теореме (6.17), систему оценки ее состояния. Соотношение (6.24) показывает, что оценка состояния системы 2 эквивалентна оценке производных у(-), или, что то же, производ- ных <й.
72 2 Теория регулирования линейных объектов (6.26) Замечание. Приведенный пример указывает на то, как ва- жен характер й. Действительно, использованный прием успешно работает только потому, что многочлены степени не выше п обра- зуют n-мерное векторное пространство. (6.27) Замечание. Так же как и в теореме (5.10) и замечании (5.12), для рационального выбора коэффициентов рь .... рп тре- буется задать некоторый критерий оптимальности. Если сигнал y(t) искажается помехами, то «наилучщий» выбор коэффициентов определяется теорией фильтрации Колмогорова — Винера в фор- мулировке Калмана — Бюси (Калман, Бюси [1961]). Результат этого выбора будет зависеть от спектральной плотности помех, а также от динамических свойств системы 2 (§ 3.6). В линейном случае эта теория в точности дуальна теории оптимального управ- ления. В нелинейном же случае до сих пор не удалось найти эффек- тивных методов решения. (6.28) Замечание. Отметим, что в приведенном выше примере dimXs=dimX^. Это — прямое следствие линейности. В нелиней- ном случае dimX^ = оо, если даже dimXs конечно. Для условий теоремы (6.17) известен другой интересный ре- зультат. Предположим, что переменные состояния системы 2 вы- браны таким образом, что ^n-p+i (О = У\ • • •» %п (О = ур (О' Если выходные величины y\(t), .... yP(t) совершенно не иска- жаются (т. е. известны в точности), то мы можем отождествить их с переменными состояниями xn_p+i(/), ..., xn.(t), так что остается лишь оценить переменные X\(t}, .... хп-р(0- (Заметим, что этот подход не годится, если y(t) смешивается даже со слабыми по- мехами. В этом случаё нужно воспользоваться полной теорией Кал- мана— Бюси. Однако если у (t) совсем не имеет помех, то мы при- ходим к вырожденному случаю этой теории, заслуживающему спе- циального рассмотрения.) Наивный, но содержательный подход к решению задачи син- теза системы оценки состояния 2 состоит в том, чтобы положить п-р Р ~ ~dt~~ lEj fil^l + n-p+tVlifii I» •••» n~P\ /=1 /-1 ^n—p+t(0 = yt(0> 1’ •••> P' Однако система оценки 2 может быть недопустимой, так как нет никакой гарантии в том, что подматрица размера (п — р) X (п— р) Fulfill *=Ь •••» п-р, j=l..........п-р,
1.8 Определение состояний 73 в левом верхнем углу матрицы F системы будет устойчивой (т. е. что действительные части ее собственных чисел будут только отри- цательными). Люенбергер [1964] первым заметил, что даже в этом случае существует система асимптотической оценки, собственные числа которой могут выбираться произвольным образом. Мы докажем этот важный результат совсем не так, как это еде» лано в оригинальном доказательстве Люенбергера. Наше доказа» тельство будет опираться на следующие основные идеи: 1. Заметим, что хотя собственные числа матрицы F не зависят от выбора системы координат (т. е. собственные числа матриц/7 и BFB~l одинаковы для любой невырожденной матрицы В), это не обязательно справедливо относительно подматриц матрицы F. 2. Воспользуемся условием полной идентифицируемости для выбора переменных состояния таким образом, чтобы подматри* ца F, определяющая динамику системы S, имела произвольный требуемый набор собственных чисел. Для простоты мы рассмотрим лишь случай р — 1. В этом слу- чае справедлива следующая лемма. (6.29) Лемма. Если пара {Т7, h'} полностью измерима, то суще- ствует такое линейное преобразование В, задаваемое матрицей которое преобразует идентификационное каноническое представле- ние пары {Г, h'} в модифицированное каноническое представление (6.30) где символ ? показывает, что соответствующие элементы матрицы F не представляют интереса для последующего использования леммы. Доказательство. Воспользуйтесь каноническим представлением (6.18) и проверьте справедливость утверждения (6.30). Поскольку F есть сопровождающая матрица, так же как и в § 2.4, имеем % (2)=Z'l-1 + M'l-2+ ••• + ₽«-!. Г и, следовательно, справедлива теорема Люенбергера.
74 2 Теория регулирования лйнейных объектов (6.31) Теорема. Собственные числа F можно выбирать произволь- но в соответствии с выбором преобразования В. В следующем параграфе мы приведем пример системы оценки Люенбергера. (6.32) Замечание. Очевидно, что можно еще раз воспользоваться принципом дуальности и получить двойственный результат для задачи управления. Рекомендуем читателю тщательно проверить справедливость следующего утверждения. Если (F, g) полностью управляема, то переменные состояния можно выбирать таким об- разом, чтобы подмножество переменных состояний {xi, ..., xn_i] описывало подсистему с произвольной заданной динамикой. 2.7 Конструкция регуляторов Подведем прежде всего итог тому, чего нам удалось уже до- биться. Если объект полностью управляем, то можно привести такие законы управления, которые переводят систему из произвольного начального состояния в начало координат за некоторый конечный промежуток времени (теорема (5.4)), или, если нас устраивают лишь стационарные законы управления, мы можем произвольным образом выбирать динамику системы (теорема (5.10)). Если объект полностью идентифицируем, то, по крайней мере в стационарном случае, можно привести такую схему идентифика- ции (теорема (6.15)), которая оказывается дуальной схеме управ- ления из теоремы (5.10). Остается решить две задачи. 1. При каких условиях можно быть уверенным, что объект дей- ствительно обладает критическими свойствами полной управляе- мости и полной идентифицируемости? 2. Как совместить в решении первоначально поставленной за- дачи регулирования решения задачи управления (в которой пере* менные состояния считаются известными) и задачи идентификации состояния системы? Исчерпывающее рассмотрение первого из этих вопросов слиш- ком отвлекло бы нас в сторону. Отметим, однако, два важных ре- зультата, показывающих, что условия полной управляемости и полной идентифицируемости совершенно естественны для решае- мой задачи. (7.1) Замечание. В соответствии с «теоремой о канонической де- композиции» для линейных динамических систем (см. Калман [1962а, 1963с], Вейсс, Калман [1965]) каждую такую систему мож- но рассматривать как прямую сумму (в определенном строгом
2.7 Конструкция регуляторов 75 смысле этого выражения) четырех подсистем, изкоторых первая полностью достижима и наблюдаема, вторая полностью достижи- ма, но не наблюдаема, и т. д. Более того, все причинные связи между входами и выходами проходят обязательно через первую подсистему и только через нее. Поэтому включить любую из остальных трех подсистем объекта в замкнутый контур невозмож- но. Это показывает, что с точки зрения возможностей управления нас интересует лишь первая подсистема. Такое положение вещей в очень сильной степени определяется линейностью объекта, как будет видно в дальнейшем из материала § 6.3. (7.2) Замечание. В классической теории управления всегда (хотя и без достаточных логических оснований) предполагалось, что объект задан своими внешними характеристиками (см. определе- ние (1.8) гл. 1). И хотя в классической теории результат, анало- гичный теореме (5.10), никогда не был доказан, его справедли- вость обычно считалась само собой разумеющейся. Но почему? Оказалось (и это один из фундаментальных новых результатов современной теории), что на некотором, промежутке времени лю- бое гладкое линейное преобразование вход—выход с нулевым со- стоянием можно представить в виде гладкой линейной динамиче- ской системы.^ (см. теорему (2.8)), обладающей свойствами пол- ной достижимости и полной наблюдаемости. Это утверждение строго сформулировано в § 10.13. Но если объект стационарен, то теорема (3.15) и ей дуальная показывают, что достижимость эквивалентна управляемости, а на- блюдаемость эквивалентна идентифицируемости. Другими слова- ми, если предположить, что объект стационарен и рассматривается как минимальная реализация отображения вход—выход с нулевым состоянием, то он всегда полностью управляем и полностью иден- тифицируем. Эта счастливая случайность объясняет успех класси- ческой теории, несмотря на всю наивность и шаткость ее логиче- ских оснований. Этим же самым объясняется и то, что классиче- ская теория оказалась не в состоянии справиться с задачей управления для нестационарного линейного объекта, поскольку в нестационарном случае из достижимости еще не следует обяза- тельно управляемость, а из наблюдаемости не следует идентифи- цируемость. За дальнейшими разъяснениями мы вновь отсылаем читателя к § 10.13. Вернемся теперь ко второму вопросу. Нам нужно объединить результаты, полученные ранее, в явное определение регулятора Для линейного стационарного объекта. В каждый момент времени т задача регулятора состоит в том, чтобы формировать сигнал управления ы(т), основываясь на имею- щейся информации, т. е. на предшествовавших значениях выход- ных величин {у(о)', о^т}. К тому же хотелось бы, чтобы выполня-
76 2 Теория регулирования линейных объектов лось соотношение (7.3) и (т) = — Кх (т), но, естественно, в общем случае оно не подходит, так как х(т) не известно, и его точные значения нельзя получить из {у (в): о^т}. Поэтому кажется целесообразным заменить (7.3) на (7.4) и (т) = — К& (т), где ^(т) —оценка состояния системы, построенная по {у (о): о^Ст} согласно теории, развитой в § 2.6. Переход от формулы (7.3) к формуле (7.4) можно строго оправдать лишь в рамках стохастической теории оптимального управления. (При этом потребуется доказать, что во время этого произвольного перехода не происходит «никакой потери информа- ции».) Следующие элементарные соображения могут служить ча- стичным оправданием использования формулы (7.4), а также дать некоторое интуитивное представление о смысле решения. (7.6) (7.5) Предложение. Рассмотрим уравнения объекта, уравнение системы оценки его состояния (6.16) и закон управления (7.4): ^ = Fx + Gu(t), y(t) = Hx(t), ^ = F* + L[y(t)- Ht] + Gu (0, U (0 = — Kx (t). Тогда характеристический многочлен Xoverau системы (7.6) в це- лом удовлетворяет уравнению , ^overall — ^control Estate %F—GK Доказательство. Многочлен Xoverau есть характеристический много- член матрицы ' F - GK ' LH F-LH-GKY Требуемый вывод не получается сразу из рассмотрения этой ма- трицы, но достигается без труда после соответствующей замены переменных. Заменим пару (х, х) на пару (х, х). Это преобразова- ние линейно и взаимно однозначно и, следовательно, не влияет на многочлен Xoverau. Но в новых координатах уравнения (7.6) пере- пишутся в виде F overall -^- = (F- GK) х — GKx, ^(F-LHU,
2.7 Конструкция регуляторов 77: а так как эта система треугольна (во второе уравнение не входят переменные, дифференцируемые в первом), то требуемое утвержде-. ние получается сразу. Теперь мы можем подвести следующий итог всему нашему ис- следованию. (7.7) Теорема. Рассмотрим линейный объект S, обладающий свой- ствами полной управляемости и полной идентифицируемости. Вы- берем матрицу К, определяющую устойчивый закон управления, т. е. выберем К так, чтобы многочлен %f-gk был устойчивым мно- гочленом. Точно так же выберем матрицу L, определяющую устой- чивую систему оценки состояния; в этом случае многочлен Xf-lh также устойчив. Определим регулятор как систему, состоящую из системы оценки состояния и закона управления (7.4). Тогда систе- ма в целом (объект плюс регулятор) описывается уравнением (7.6). Эта замкнутая система устойчива. Более того, динамическое поведение этой системы есть прямая сумма динамического поведения контура регулирования (опреде- ляемого матрицей F — GK) и контура оценки состояния (опреде- ляемого матрицей F — LH). Это показывает, что, пока «качество» системы оценивается исключительно в терминах теории устойчивости, возможность кон- струирования регулятора непосредственно получается из свойств управляемости и идентифицируемости системы. И если объект управления адекватно описывается конечномерной линейной ста- ционарной динамической системой, то на возможность решения этой задачи не влияют никакие другие математические, теоретиче- ские или физические соображения. Напомним при этом, что теория управления имеет дело не с реальным миром, а всего лишь с его математическими моделями. В точности такой же, как и в теореме (7.7), результат остается справедливым и при использовании системы оценки Люенбергера. Строгую формулировку соответствующей теоремы и ее доказатель- ство оставляем читателю. В заключение приведем пример подробного расчета одного ре- гулятора. (7.8) Пример. Рассмотрим простейший пример, представляющий определенный интерес для теории управления. Пусть передаточная функция объекта равна 1/s2 (этот объект представляет собой два последовательно соединенных интегратора). Из общей теории ли- нейных систем (гл, 10) известно, что у такой передаточной функ- ции есть минимальная «реализация» в виде стандартной линейной модели (3.2) из § 2.3 и что эта модель двумерна. Согласно заме- чанию (7.2), эта минимальная реализация полностью управляема и полностью идентифицируема.
78 2 Теория регулирования линейных объектов Для объекта с передаточной функцией 1/s2 минимальную реа- лизацию можно написать сразу же. Она задается матрицами F = О Г О О О’ Если положить, что ^control («) = s2 + “1s + «2> то ».[Ч L «1J Определим систему оценки типа Люенбергера. Для этого пре- жде всего мы должны преобразовать систему координат так, что- бы перейти к каноническому представлению. В нашем очень про- стом случае такое преобразование состоит в простой перестановке индексов переменных состояния: (хь х2) -* (хг, *i). В этом случае матрицы F, g, hvik принимают следующий вид: О 0] 1 Как и в доказательстве леммы (6.29), подвергнем эти матрицы линейному преобразованию с матрицей и получим Fnevr — Г01 &new Cti + а2 Теперь можно сразу составить «монтажную схему» регулятора. Она показана на рис. 2.1. Заметим, что она довольно сложна. Если бы эта задача решалась в рамках классической теории управления, то регулятор определялся бы через его передаточную функцию. Поэтому длй сравнения этих двух подходов нам придет- ся вычислить передаточную функцию системы, приведенной на рис. 2.1. В результате такого расчета получим, что Щ (s) _ т , v (aiP + a2) (s + atl + aaP __ yi(s) W s + aj + p = (aiP + 02) s + ctj + ct2p/(aifl + (*2) s + (Xi + p
2.7 Конструкция регуляторов 79 Известно, что искомым регулятором служит звено опережающего типа с передаточной функцией Y. б, 8>0, б<8. Но так как все оч, аг и р положительны, то выводы современной теории согласуются с заключением классической. Рис. 2.1. Связь между двумя этими подходами станет несколько яснее, если представить характеристический многочлен системы в виде Xcontroi(s)“s2 + 2i®s + ®2’ где 2g(o = ai, ®2 = а2. Полагая коэффициент затухания § равным поскольку именно эта величина £ считается оптимальной на практике, мы получим,, что (7.9) Y = © (/2 р + о), я чЛ? । ®Р /Зр + /2<о\ 6 = У 2 <й + --= ©I -77=---ь F /2₽ + <й \,/2₽ + ©/ е = р+ V2®,
80 2 Теория регулирования линейных объектов Классическая процедура синтеза состоит в том, чтобы, учитывая наличие на выходе системы высокочастотных помех, попробовать довести отношение е/d до возможно большей величины. После это- го у выбирается так, чтобы обеспечить системе в целом требуемую устойчивость. В нашем случае (7 1 Д _ (Р/<о)г + (3//2) (р/ю) + 1 Л ' б~ (з/К2-)(Р/ф) + 1 • Если р велико (т. е. на выходе нет помех), то отношение е/d мо- жет оказаться очень большим. Но, по мере того как требуемая ширина полосы пропускания и приближается к ширине полосы частот помехи, определяющейся параметром 0, отношение е/d стре- мится к значению 1,4. А это значение слишком мало для того, что- бы такой регулятор имел какой-либо практический смысл. Примечательно, что в рамках классической теории управления так и не удалось получить явных формул типа (7.9) и (7.10) даже в этом простейшем случае. Приведенные выше выводы обычно по- лучаются в результате длинных и нечетких рассуждений, якобы базирующихся на физической интуиции инженера. Причину труд- ностей классической теории нетрудно установить. Искомый регу- лятор сложным образом зависит от исходных параметров |, ш и ₽ задачи синтеза. Но даже после исключения £ приведенные выше формулы для у, б и е слишком сложны для того, чтобы их можно было получить лишь благодаря физической «интуиции». Поэтому на данном этапе классическая теория управления прибегала к гра- фическим расчетам и практическим рекомендациям, т. е. к при- кладной математике наиболее примитивного типа. (7.11) Замечание. Классическая теория управления была совер- шенно непригодна для изучения больших систем (большое п, бо- лее чем одно управляющее воздействие и т. д.), так как формулы, аналогичные формуле (7.10), оказываются весьма сложными. Даже в современной теории мы не стали бы пользоваться таким же методом, если бы передаточная функция объекта была намного сложнее, чем 1/s2. Но в этом и нет необходимости, так как един- ственная задача прикладной математики, оставшаяся у нас нере- шенной, состоит в численном определении К и L. Такая задача легко решается с помощью мощных алгоритмов теории оптималь- ности. По этому поводу см. в первую очередь § 5.3—5.5. (7.12) Замечание. Даже в рассмотренном простом случае «кано- ническая монтажная схема» регулятора, приведенная на рис. 2.1, слишком сложна для интуитивного понимания. Здесь преимуще- ства современной теории управления проявляются особенно ярким образом. Мы получаем эту схему шаг за шагом без каких-либо навязанных заранее представлений о том, как она должна выгля- деть в окончательном варианте.
2.7 Конструкция регуляторов 91 Привлекательным кажется поразмышлять о том, какие выводы можно сделать на основании этих результатов, например, для био- логических задач, и особенно для теории мыслительных процессов высших животных. Может оказаться, что попытки понять законы функционирования мозга, основываясь лишь на его анатомии (монтажной схеме), будут безнадежными. Возможно, что эта за- дача станет относительно прозрачной лишь после создания теории (в некотором смысле аналогичной представленной здесь), которая окажется достаточно сильной, чтобы из нее получались основные черты анатомии мозга.
ВТОРАЯ ЧАСТЬ ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ П. Фалб 3 Основы теории оптимального управления Основной предмет современной теории систем составляет про- блема синтеза, представляющая собой по сути дела формули- ровку задачи, которую должно решать либо существующее физи- ческое устройство, либо физическое устройство, которое нужно создать. Такая формулировка задачи предполагает указание раз- личных конечных целей и требований, а получающаяся в резуль- тате синтеза система должна удовлетворять, естественно, и целому ряду ограничений по времени и стоимости создания системы, а также различным физическим ограничениям. Обычная процедура решения проблемы синтеза системы связана в первую очередь с созданием адекватной математической модели соответствующего физического явления, а это в общем случае чрезвычайно сложная задача. Если же такая математическая модель имеется, то кон- структор в качестве следующего шага принимается за задачу син- теза модели системы в целом «на бумаге», а затем уже переводит полученную конструкцию на язык реального мира, строит систему из реальных устройств и начинает ее испытывать. Задачи управ- ления образуют специальный подкласс задач синтеза систем. В каждой задаче управления содержатся четыре основных эле- мента: 1. Система, которой нужно управлять. 2. Желаемый вид выходных величин или цель системы. 3. Множество допустимых управлений (или управляющих воз- действий) . 4. Мера стоимости или эффективности управляющих воздей- ствий. Перевод этих интуитивных понятий на язык некоторой жизне- способной и практически полезной математической теории приво- дит к созданию так называемой теории «оптимального управления» й формулировке задачи управления. Данная часть книги как раз
3.1 Абстрактная задача управления 83 и посвящена проблемам оптимального управления. При этом мы часто будем опускать прилагательное «оптимальное», так как тео- рия управления в устаревшем смысле этого слова нас вообще не интересует. Другими словами, нас будут интересовать собственно научные основы теории управления, а не инженерные методы авто- матики. Тем не менее научные методы, которыми мы будем здесь заниматься, часто имеют и большое практическое значение. В следующем параграфе мы начнем с формулировки абстракт- ной задачи управления. После этого мы определим понятие глад- кой динамической системы, а затем укажем на особый класс задач управления, для которых будут получены определенные теорети- ческие результаты. В § 3.4 мы займемся изучением теории Гамиль- тона — Якоби, что позволит в дальнейшем получить некоторые полезные достаточные условия оптимальности. После этого доста- точные условия будут использованы в задаче управления линей- ным объектом с квадратичным критерием качества; здесь будут получены некоторые известные результаты, связанные с решения- ми уравнений Риккати. Затем мы используем эти результаты для решения задачи фильтрации и синтеза фильтров Калмана. Далее, в гл. 4 мы перейдем к изучению необходимых условий оптималь- ности. Для этого в § 4.1 используется вариационный подход, а в § 4.2 излагается принцип максимума Понтрягина и приводится его краткое эвристическое доказательство. А так как использование необходимых условий требует доказательства существования опти- мальных управлений, этот вопрос вкратце рассматривается в § 4.3. Глава 5, посвященная процедурам синтеза систем управления, со- держит несколько параграфов, описывающих различные вычисли- тельные методы теории управления. На самом деле в дальнейшем мы будем пользоваться довольно общими пространствами (например, банаховыми). Но, если это внушает читателю беспокойство, он может предположить, что рас- сматриваются только конечномерные пространства, и это не вызо- вет необходимости изменения каких-либо доказательств. Однако, поскольку некоторые бесконечномерные системы (например, с рас- пределенными параметрами) представляют существенный интерес, нам показалось разумным расширить общность наших рассу- ждений. 3.1 Абстрактная задача управления Начнем с того, что переведем на строгий математический язык основные понятия задачи управления. Предположим, что объект управления адекватно описывается динамической системой S(T, U, Q, X, Y, ф, n)
84 3 Основы теории оптимального управления с переходной функцией <р(/; т, х, «()) и выходной функцией т| (t, х). Пусть So есть некоторое заданное подмножество множества ГХХХ У, So с Т X X X Y, а Г — некоторое заданное подмножество множества й, Гс Q. На- зовем тогда So целевым множеством (по выходу), а Г — множе- ством допустимых управлений. (1.1) Определение. Управляющее воздействие «(•) преобразует событие (t0, х0) в So, если множество {(Л Ф(^; to, Хо, «(•)), П(Л ф(*; to, х0, «(•))))= пересекается с So. Если «(•) преобразует событие (to, х0) в So и если ti есть время первого достижения, то ti называется моментом достижения, а разность (ti — to) — временем перехода. Пусть М (t, х, у, <р, и, г|)—некоторая заданная вещественная функция, определенная на множестве TXXX.YX (Хт) ХЙХ (Уг). Если и(-) —некоторое управляющее воздействие, преобразующее (to, Xq) в So с моментом достижения 4 (или ti(u)), то M(tv хр г/р ф((>><1](• 5 t0, х0, «(•)), и(-), ,<!]('> ф(’^0, х0, «(•)))) есть вполне определенное вещественное число, которое мы будем обозначать через J (to, х0, u('),ti,Xi); здесь Xi = <р (4; t0, х0, и (•)); f/i = Xi). Назовем J(to, Хо, w(-), ti, Xi) качеством управления «(•) относительно начального события (to,Xo), (1.2) Определение. Абстрактной задачей управления называется сложное понятие, образованное динамической системой S, целе- вым множеством So, множеством Г допустимых управлений, под- множеством / множества Т X X (множества начальных событий), функционалом качества управления J и требованием: «Для ка- ждого начального события (to, Хо) определить некоторое допусти- мое управление «(•), которое преобразует (to, хо) в So и которое при этом минимизирует функционал J(t0,х0, u(-), ti, Xi), где ti — мо- мент первого достижения, а х4 — точка первого достижения мно- жества So». Естественно, что из-за чрезвычайной общности этого определе- ния для абстрактной задачи управления не удается получить мно- го содержательных результатов. В связи с этим мы введем неко- торые дополнительные предположения, особенно относительно гладкости различных объектов, что позволит доказать некоторые полезные теоремы.
3.2 Гладкие динамические системы 85 3.2 Гладкие динамические системы В этой части книги мы рассматриваем лишь дифференциаль- ные динамические системы с непрерывным временем. Другими словами, мы потребуем, чтобы множество моментов времени Т на- шей динамической системы было бы некоторым открытым проме- жутком (Ti, Т2) (возможно, вида (—оо, Т2) и т. п.) вещественной оси R и чтобы переходная функция <р соответствовала (единствен- нрму) решению некоторого дифференциального уравнения. Будем также предполагать, что различные пространства X, У, U и й на- делены некоторой алгебраической и топологической структурой. Например, пространство X может быть банаховым. Более того, будем считать все функции, с которыми придется иметь дело, до- статочно гладкими, т. е. удовлетворяющими подходящим условиям непрерывности и дифференцируемости. Динамические системы, удовлетворяющие этим различным условиям (которые мы вскоре уточним), называют гладкими. (2.1) Определение. Динамическая система 2 = (Т, U, й, X, У, <р, т]) называется гладкой, если выполняются следующие условия: (а) Т = (Ti, Т2) есть некоторый открытый промежуток веще- ственной оси R; (b) U, X и У есть подмножества банаховых пространств ЗЗх и соответственно; (с) множество управляющих воздействий Q ') удовлетворяет следующим условиям: 1) каждый элемент «(•) ей измерим и ограничен; 2) если и (•) е Q, то и (t) е U при всех t е Г; 3) если «() ей, wet? и [t, с Т, то функция 40, опре- деляемая соотношением I w, s е [f, t'], d(s)==( u(s), также принадлежит множеству £2; 4) если [Л, ЭДcz Т, a t»(«) есть некоторая функция, отображающая [Л, ЭД в &и и удовлетворяющая условиям (1) и (2), то найдется такое «(•) ей, что «р,,tj (•) = = &(•), или «(/) = » (0 для t е [/1( ЭД; *) Типичными примерами множества Й могут служить функциональные про- странства Ll, L2 или L°°. Однако функциональное пространство С” бесконечно Дифференцируемых функций не удовлетворяет условию (3), а следовательно, не может быть множеством □.
86 3 Основы теории оптимального управления (d) переходная функция <р удовлетворяет следующим усло- виям: 1) ф непрерывно по всем своим аргументам; 2) для любого заданного tQ из Т, любого Хо из X и любого м(-) из й функция ф(/; to, хо, «(•)) является единствен- ным решением дифференциального уравнения -^- = f(x(t), «(t), /)*) с начальными условиями х (t0) = х0 и определена для всех t из [t0, Т2)\ более того, ф(/; to, Хо, ы(-))е X при всех t из [t0, Т3); функцию f(x,u,t) называют производящей функцией динамиче- ской системы; (е) выходная функция т] непрерывна по всем своим аргумен- там. В дальнейшем в этой части книги мы будем под «динамической системой» понимать «гладкую динамическую систему». 3.3 Стандартная задача управления Теперь мы приступим к обсуждению одного варианта задачи управления, для которого нам удастся получить некоторые теоре- тические результаты. Этот вариант задачи управления мы станем называть стандартной задачей управления. Пусть 2 — наша (гладкая) динамическая система, a f — про- изводящая функция системы 2. Пусть So— некоторое заданное подмножество множества (Л, 7г) X X X У (целевое множество выходного пространства). Будем говорить, что система 2 конструи- руема относительно So, если T](t, х) е ny(S0) гарантирует, что (t, х, т| (t, х)) е So, где л у представляет собой оператор проектиро- вания (7*1, Л) XX X У на У. (3.1) Замечание. Пусть S = т)"1 (лу(5о)) и пусть система 2 кон- струируема относительно So. Тогда управление «(•) преобразует событие (t0, Хо) в So тогда и только тогда, когда множество (3.2) {(t, ф (t; to, х0, и (•))): t > t0} пересекается с S. 9 dx(t)ldt является элементом пространства ^(R, $х), которое мы отож-’ дествляем с Таким образом, f есть отображение &х X &и X Т в &х (Дье- донне [I960]]).
3,3 Стандартная задача управления 37 В стандартной задаче управления мы будем предполагать, что целевое множество S является подмножеством пространства со- бытий (Л, Т2) X X, и станем говорить, что управление «(•) преоб- разует событие (t0, х0) в S, если множество (3-3) {(/, ф(/; Аъ х0, «(•))): t>t0} пересекается с S. Пусть Гей — заданное множество допустимых управлений, а /с (7\, Т2) X X — заданное множество начальных событий. Теперь для формулировки стандартной задачи управле- ния остается описать функционал качества /. С этой целью поло- жим, что К есть некоторая вещественная функция, определенная на S, a L есть некоторая непрерывная вещественная функция, опре- деленная на X X U X (Т\, Т2) и обладающая тем свойством, что если [^, t2] есть некоторый замкнутый подинтервал промежутка (Ti, Т2), а х(‘)—непрерывная функция, отображающая [^, /2] в X, и, кроме того, и(')ей, то функция £(х(•),«(•). •) интегрируема на [Л, /2]. В этом случае, если «(• )есть некоторое управление, пре- образующее событие (to, х0) в S, а Л — первый момент достиже- ния, то К (Л, Ф(Л'> to, Хо, «(•))) И j L(q(t-, to, Хо, «(•)), u(t), t)dt t, есть вполне определенные вещественные числа. Назовем сумму этих чисел качеством, управления «(•) и обозначим ее через J (to, Хо, «(•))• Другими словами, пусть t, (3.4) 1 (t0, xQ, и (•)) = К (tb Хх) + J L (qp (t; to, x0, «(•)), и (t), t) dt, h где Xi = ф(^; to, Хо, u(-)) есть точка достижения. Член K(ti, Xi) на- зывается качеством конечного состояния, а интегральный член в уравнении (3.4) называется качеством траектории перехода. Те- перь мы готовы к.тому, чтобы дать формальное определение. (3.5) Определение. Стандартная задача управления — это сложное понятие, образованное некоторой гладкой динамической систе- мой S, целевым множеством S, содержащимся в пространстве событий, множеством Г допустимых управлений, множеством I на- чальных событий, функционалом качества управления J(to,Xo, и (•)), определяющимся через функции К и L, согласно уравнению (3.4), и требованием: «Определить для каждого события (to, Xq) е I Управление «(•) еГ, преобразующее событие (to, х0) в S и одно- временно минимизирующее функционал «(•))>.
88 3 Основы теории оптимального управления В дальнейшем в нашей части книги мы всюду, вместо стандарт- ной задачи управления будем говорить просто о задаче управления, а решения этой задачи будем называть оптимальными управле- ниями. (3.6) Пример. Пусть Т = (—оо, оо) = R— ось вещественных чи- сел; X = Rn (евклидово n-мерное пространство); U — некоторое ограниченное подмножество пространства Rm, например, U = = {и: || и 11^1}, и пусть й— множество всевозможных измеримых функций «(•) из R в Rm, таких, что м(0 е U почти всюду. Обозна- чим через f такую функцию, отображающую Rn X Rm X R в Rn, что f, Vxf и Vtf <= C(Rn X U X R) Г1 $(Rn X U X R) *), где U есть за- мыкание U в Rm, а через <p(Z; to, хй, «(•))— (единственное) реше- ние дифференциального уравнения -^-=f(x(O, «(О, t), удовлетворяющего начальным условиям X (to) — Xq. Пусть У = Rn и r)(f, х) = х. Тогда динамическая система S = ₽= (R, U, Rn, Rm, ф> п) является гладкой и имеет производящую функцию f. Пусть 3 есть некоторое заданное подмножество про- странства R X Rn, например S = R X {0}, пусть Г — подмножество множества й, например Г = й, а I — заданное подмножество про- странства R X Rn, скажем, I — {0} X {х: ||х||> 1}. Положим также, что K(t,x) = 0, а £(х, и, t)—некоторая достаточно гладкая веще- ственная функция, например, L (х, и, t) — (х, Q (t) х) 4- у (и, /? (/) и), где Q(-) и /?(•)—матричные функции. Тогда, если ы(-)ей пре- образует событие (tQ, Хо) в S с моментом первого достижения ti, то качество этого управления «(•) определяется по формуле <1 J(to, Xq, «(•))=]* L(<p(t; to, Хо, «(•)), u(t), t)dt. t> Например, если (0, х) е {0} X {«: 11x11^1} и если «(•) преобразует (0, х) в R X {0) к моменту времени Л, то t, J(t0, Xq, и(*))=4 / «ф(*; k, х0, u(-)),Q(t)(p(t; t0, х0, «(•))) + + {u(t),R (t)u(t)}} dt. ') Если f = то Vxf есть градиент f no x, a Vtf = dfldi. Через #(Rn X U X R) здесь обозначено множество всех ограниченных функций, ото- бражающих Rn X U X R в Rn.
3.3 Стандартная задача управления 89 Постановка такой задачи управления в точности удовлетворяет определению (3.5). Заметим, что задачу управления можно считать эквивалентной задаче минимизации некоторого функционала, определенного на подмножестве нормированного линейного пространства. Отметим также, что для каждой данной задачи управления немедленно воз- никают два вопроса. 1. Существует ли решение этой задачи, т. е. существует ли оптимальное управление? 2. Если же оптимальное управление существует, то как его найти ’)? Получение ответов на эти вопросы и составляет самую суть теории управления. Для решения этих задач в теории управления используются различные подходы, которые можно грубо разбить на четыре направления. 1. Теория Гамильтона — Якоби, состоящая в получении и ис- пользовании основных достаточных условий, зависящих от решения определенного дифференциального уравнения (см. § 3.4). 2. Получение необходимых условий типа принципа максимума Понтрягина (см. § 4.1). 3. Методы функционального анализа (Фалб [1967], Кранц, Са- рачик [1963], Куликовский [1959], Нейштадт [1965]). 4. Численные методы (Коллатц [1964], Тодд [1962], Витценхаузен [1965] и гл. 5 настоящей книги). Вычислительный подход по своему характеру совершенно отли- чается от остальных трех подходов. Теорией Гамильтона — Якоби мы займемся в следующем параграфе, а необходимыми условия- ми— в гл. 4. Методы функционального анализа здесь не рассма- триваются, так как это потребовало бы от читателя несколько бо- лее глубоких математических познаний2). Что же касается вычис- лительных методов, то в силу их специального характера мы смо- жем здесь лишь вкратце охарактеризовать их. Различные подходы, используемые в теории управления, можно сравнивать между собой, основываясь на следующих критериях: 1) общность области применения; 2) четкий вид получаемых ре- зультатов; 3) простота применения этих результатов на прак- тике; 4) физическая обоснованность принятых предположений. Все эти критерии мы будем иметь в виду в последующем изло- жении. *) То, что это действительно совершенно разные вопросы, можно увидеть на Примере непрерывной вещественной функции, определенной на компактном под- множестве пространства Rn. Такая функция всегда имеет минимум, но опреде- лить, в какой или каких точках она достигает этого минимума, - далеко не просто. 2) Тем не менее обратите внимание на последний параграф гл. 4»
90 3 Основы теории оптимального управлений 3.4 Теория Гамильтона — Якоби Нам предстоит решить стандартную задачу управления. Попы- таемся вывести для этой задачи достаточные условия существо- вания, опираясь на лемму Каратеодори в формулировке Калмана [1963а]. Прежде всего введем следующие обозначения. (4.1) Обозначение. Если S& — некоторое банахово пространство, то через обозначим пространство, двойственное & (т. е. есть множество непрерывных линейных функционалов, определенных на далее, если Л, е $*, а Ъ е то через (Л, Ь} обозначим действие Л на b ’). (4.2) Обозначение. Если £i и ^2 есть банаховы пространства, а Л — некоторое линейное преобразование в (т. е. Ле ей’^,^)), то через Л* обозначим преобразование, сопряжен- ное по отношению к Л. Напомним, что Л* есть непрерывное линейное преобразование $2 в (т. е. Л ilp), которое удовлетворяет условию Л*Хг = ХгЛ для Лг $2, так что (4.3) <Л%, &,) = <Л2, Л&!> для и bi еВ конечномерном случае, когда Л можно рассматривать как некоторую матрицу, Л* оказывается просто транспонированной матрицей матрицы Л. (4.4) Определение. Пусть (Т\, Т2) X X. Если (/0, х0)е$ и Л(-) ЕЙ, то говорят, что й{‘) ^-преобразует (/0,х0) в S, если й(-) преобразует (t0, х0) в S по траектории, целиком принадлежащей 5?, т. е. если (^,<р(?; /о,Хо,#(•))) при to- Допустимое управ- > ление ы°(-) называется оптимальным относительно Я и некоторого заданного начального события (t0, х0) из если (a) и°(«) ^-преобразует (to, х0) в S и (Ь) для любого элемента и1 (•) е й, ^-преобразующего (t0, хо) в S, справедливо J(t0, х0, ы°(-)) х0, и1(-)). После завершения этих предварительных определений мы мо- жем сформулировать и доказать основополагающую лемму Кара- теодори. (4.5) Лемма. Предположим, что К (t, х) = 0 для (t, х) е S и что для каждого события (t,x) из области фа (1\, Г2) X X функция L(x, и, t) как функция и () достигает своего единственного абсолют- ’) Хотя такое обозначение и согласуется с употреблением символа (,) для обозначения скалярного произведения в Rn, читатель должен иметь в виду раз- личие соответствующих понятий.
3.4 Теория Гамильтона—Якоби 91 ного минимума по всевозможным u<=U в точке u°(t,x), где она обращается в нуль, т. е. (4.6) 0 = L (х, и0 (t, х), /) < L (х, и, О для всех u^U, и"¥ u°(t,x). Пусть $(•) eQ таково, что (а) й(>) ^.-преобразует (/о, х0) в Si с моментом первого дости- жения ti, (b) d(t\ = u°(t,X(t)) при (почти} всех t из [/0, М, где для удоб- ства мы обозначили через Л(/) функцию <р(/; Iq, Хо; #(•)). Тогда управление й(-) оптимально относительно 31 и (4, х0). Доказательство. Заметим, что поскольку K(t, х) = 0 на S, а подин- тегральная функция в выражении для критерия качества обра- щается для оптимального управления в нуль согласно условиям леммы (4.6), имеем J(tQ, х0, й(-)) = Оь *(/>))+ / L(*(/), «°(/, *(/)), /)Л-0. to Но если «'(•) есть некоторый элемент множества Q, ^-преобразую- щий событие (fo, х0) в S с моментом первого достижения t2, то Ж х0, «’(•))»№, x’(f2)) + > J L (x1 (/), «° (t, x’ (?)), 0 dt = 0, to согласно условию K(t, x) —0 на S и согласно условию (4.6), что и доказывает лемму; заметьте, что мы положили здесь х*(0 = <р(/; А>» х0, «’(•))• Отметим, что управление й(-) не должно быть оптимальным, по- скольку мргут существовать управления и(-) из й. преобразующие (to, Хо) в S по траекториям, не принадлежащим 5?, но качество ко- торых описывается числом, меньшим нуля, т. е. / (/q, Xq, u(‘)}<J ((q, Xq, й( • )) = 0. Для того чтобы иметь возможность пользоваться этой леммой, нам нужно ввести понятия гамильтониана и регулярности (или нор- мальности). Допуская большую общность, мы можем определить гамильтониан системы как некоторую меру сравнения качества раз- личных управлений и. следовательно, как своего рода дифферен- циал (или градиент) функционала качества. Это замечание станет j £(х’(/), и’(0, t}dt"^
92 3 Основы теории оптимального управления яснее впоследствии. Сформулируем теперь понятие гамильтониана более строго. (4.7) Определение. Вещественная функция Н, определенная на X X $х X U X (Ti. Тг) согласно соотношению (4.8) Н(х, %, и, t) = L(x, и, f(x, и, 0), где f — производящая функция динамической системы S — назы- вается гамильтонианом (или функционалом Гамильтона) задачи управления. (4.9) Определение. Пусть Фа: (Т\, Т2) X X. Если для каждого (/, х) 6= 5? и ле $Гх у функции Н(х, X, и, t) как функции и имеется единственный абсолютный минимум по всем и из U в точке, обо- значаемой через u°(t, х, %), т. е. если (4.10) Н(х, х, X), t)<H(x, X, и, /) при всех U&U, и^иЦ},х,%), то функция Н называется регуляр- ной (нормальной) относительно St. В этом случае отображение u°(t,x, X) пространства U называется Н-минимальным управлением относительно 5?1)- Напомним (см. Дьедонне [I960]), что если V(t,x} есть некото- рая вещественная функция, определенная на (Т,Т2)ХХ, то dV/dt — непрерывное линейное преобразование R в R, a dVldx — не- прерывное линейное преобразование Six в R, т. е. принадлежит ЗГХ. Этот факт используется в следующем определении. (4.11) Определение. Если функция Н регулярна относительно 5?, то уравнение в частных производных (4.12) dV(g’ х}- + Н(х, — , и°(/, х, — , i) = 0 называется уравнением Гамильтона — Якоби для соответствующей задачи управления (относительно 5?). Отметим теперь, что если V(t,x) и x(f) непрерывно дифферен- цируемы, то непрерывно дифференцируема и функция V(t, х(/)) и и dV(t,x(t)) _ dV(t,x(t)) . /dV(i,x(t)) dx(t)< di di l"\ dx ’ dt / (см. Дьедонне [I960]). Это замечание будет использовано при до- казательстве следующей теоремы о достаточных условиях. (4.14) Теорема. Пусть Sic. (Ti,T2) X X. Предположим, что Н ре- гулярна относительно 31 и что переходная функция ср непрерывно ’) Отображение X) не является, конечно, настоящим допустимым ' управлением.
3.4 Теория Гамильтона—Якоби S3 дифференцируема на 91 (точнее говоря, на некотором открытом множестве, содержащем проекцию 91 на (Ti,T2)). Пусть управле- ние й(•) ей таково, что (а) «(•) 91-преобразует (to,xo) в S с моментом первого дости- жения ?; (Ь) существует такое непрерывно дифференцируемое решение V(t, х) управления Гамильтона — Якоби на 91, удовлетворяющее граничным условиям (4.15) V(t, x) = K(t, х) при (t, х) е 91П S, что (4.16) А (0 - U° [t, а (О, при (почти) всех t из [/о, Л], еде Х(О = ф(/; f0. Хо, й(>)). Тогда й(-) является оптимальным относительно 91 и (to,xo). Доказательство. Доказательство этой теоремы состоит в непосред- ственном применении леммы Каратеодори. Прежде всего введем функцию L (х, и, t), такую, что --2^+l(х, и. Их. и, о). Легко видеть, что L удовлетворяет условиям этой леммы. Чтобы убедиться в этом, заметим прежде всего, что dV(t,x)/dt не зависит от и. Поскольку функция Н регулярна относительно 5?, функция H(x,dV(t,x)/dx,u,t) как функция и имеет единственный абсолют- ный минимум над U в точке u°(t, x,dV(t, х)/дх)-, отсюда следует, что L(x,u,t) как функция и имеет единственный абсолютный ми- нимум в точке tiQ(t,x) — u°(t,x,dV(t,x)/dx) для (t, х) ^91. Кроме того, функция V удовлетворяет на 91 уравнению (4.12). Положим К(/, х) = 0, и пусть функционал J(t0, х0, «(•)) равен стандартному критерию качества с К и L. Предположим, что и1 (•) ^-преобразует (to, х0) в S с моментом первого достижения /*. Тогда, согласно лемме, имеем г 0 = J(t0, х0, й(•))=/ L(X(t), U(t), t)dt^ (4.17) tl < J (tQ, x0, и1 (•)) = J L (xx (t), u' (t), t) dt. h
94 3 Основы теории оптимального управления Но с учетом уравнения (4.13) получаем 4 [V V, * (0)] + L (Я (0, й (0, t) = L (х (0, й (0, 0, (4.18) . £ [V (Л х1 (0)] + L (х1 (0, и1 (0, 0 = L (х‘ (0, и1 (0, 0. Однако соотношения (4.17) и (4.18) вместе с граничными усло- виями (4.15) показывают, что ? O = K(t, Х(0)= J £(Х(0, 4(0, t)dt — V(t0, х0) = fo = J(0, х0, 4 (•)) - V (t0, х0) < < К (0, х’ (0)) + / L (х1 (0, «' (0, 0 dt - V (to, х0) < < J(to, Xo, ur(•))- V(0, XO), что и требовалось доказать. (4.19) Следствие. При выполнении условий теоремы решение V(t,x) уравнения Гамильтона — Якоби описывает оптимальное качество управления относительно 91 в том смысле, что V (0, х0) = J (to, х0, 4 (•)). Более того, если fe[0, ?], то 4(-) оптимально относительно 91 и (t, £(0), т. е. V(t, t(t))~J(t, *(0, 4(-)). Сделаем теперь несколько замечаний относительно полученных достаточных условий. Обратим прежде всего внимание на суще- ственно локальный характер этого результата, т. е. на то, что все утверждения делаются лишь относительно некоторой области 91 пространства событий. Конечно, если 91 — (Tit Т2) X X, то теорема дает достаточные условия глобальной оптимальности. Однако для этого потребовалась бы глобальная регулярность гамильтониана, а это зачастую не так. Более того, даже если глобальная регуляр- ность гамильтониана имеет место, может оказаться, что получить глобальное решение Гамильтона — Якоби все равно не удастся. На практике эти трудности часто удается обойти, «расщепляя» про- странство событий на подходящие области, в которых выпол- няются требуемые гипотезы (Атанс, Фалб [1966], Болтянский [1964]). Такой процесс разбиения используется часто и для про- верки оптимальности управлений, построенных другими способами (например, с помощью необходимых условий).
3.4 Теория Гамильтона—Якоби 95 По сути дела мы требуем здесь, чтобы уравнения системы ока- зались интегрируемыми после того, как в них будет подставлено Н—минимальное управление, вычисленное относительно оптималь- ного качества. Другими словами, требуется, чтобы уравнение (4.20) = f (х (0, м° (#, х (/), —, t\ ) U₽ • \ у С/Л / / имело решение, удовлетворяющее начальному условию x(to) = Хо, которое лежало бы полностью в 91 и пересекалось с целевым мно- жеством S. Уравнение (4.20) часто кладут в основу того или иного вычислительного подхода к решению задачи управления. Из всего этого можно сформулировать еще одно следствие нашей основной теоремы. (4.21) Следствие. Пусть 91с (1\, Т2) х X. Предположим, что Н ре- гулярна относительно 91 и что существует непрерывно дифферен- цируемое решение V(t,x) уравнения Гамильтона — Якоби на 91, удовлетворяющее граничным условиям V{t,x) = K(t,x) при (i,x) &9tf}S. Если уравнение . (4.22) = f (х (0, u° (t, х (0, г f'j) для каждого начального события (t0,x0) из 91 имеет непрерывно дифференцируемое решение, лежащее целиком в 91 и пересекаю- щееся с S, то для каждого (t0,x0) из 91 существует оптимальное относительно 91 управление. Этим следствием часто пользуются на практике. Заметим теперь, что требование непрерывной дифференцируе- мости несколько сильнее, чем это нужно. На самом же деле доста- точно, чтобы уравнение (4.13) выполнялось почти всюду вдоль траекторий системы, целиком лежащих внутри 91, а это условие будет выполняться, например, и в том случае, когда частные про- изводные V(t,x) просты1) (а не непрерывны) на 91 и <р непре- рывно дифференцируема на 9L. Теорема о достаточных условиях и уравнение Гамильтона — Якоби допускают интуитивно привлекательную геометрическую ин- терпретацию. Можно считать, что функция V(t, х) определяет не-, которую «поверхность» в пространстве (Tt, Т2) X X х R (рис. 3.1), которую можно назвать поверхностью качества. Тогда уравнение Гамильтона — Якоби является уравнением траектории наибыст- ’) Функция называется простой, если у нее в каждой точке области опре- деления есть односторонние пределы. Другими словами, у такой функции все разрывы первого рода (см. Дьедонне [19^0]). —
96 3 Основы теории оптимального управления рейшего спуска, согласующегося с ограничениями на движение вдоль поверхности качества. Другими словами, уравнение Гамиль- тона— Якоби описывает эволюцию оптимального качества, а га- мильтониан можно рассматривать как скорость изменения опти- мального качества. Еще одна возможная интерпретация заклю- чается в том, что в каждой точке Р поверхности качества суще- ствует множество «направлений», «проекции» которых на простран- ство событий порождаются «конусом» направлений *) допустимых траекторий, выходящих из проекции точки Р на пространство со- бытий, а «направление», удовлетворяющее уравнению Гамильто- на— Якоби, «проектируется» на направление оптимальной траек- тории. Кривая, касательное направление которой удовлетворяет уравнению Гамильтона — Якоби, проектируется, таким образом, на отрезок оптимальной траектории. Содержательный смысл этих представлений станет яснее, после того как в гл. 4 будут рассмот- рены необходимые условия оптимальности. Используем теперь полученные здесь результаты для решения задачи управления линейной системой с квадратичным критерием качества. Этим мы займемся в следующем параграфе. ') То есть множество векторов вида (1,/(х,и, <)), uel/, привязанное к точке
3.5 Линейные системы с квадратичным критерием качества & 3.5 Линейные системы с квадратичным критерием качества Весьма важным и полезным примером применения теории Га- мильтона— Якоби может служить решение задачи, в которой ди- намическая система считается линейной, а критерий качества — квадратичным. Эта задача представляет особый интерес еще и потому, что ее решение тесно связано, с одной стороны, с тради- ционными методами управления (Калман [1963а, 1964], Уиллис, Брокетт [1965]), а с другой стороны, с задачей коррекции малых отклонений от заданной траектории. Как обычно, мы начнем с не- скольких определений. (5.1) Определение. Гладкая динамическая система Ъ = {(Ти Т2), и, Q, X, Y, ф, п> называется линейной, если выполняются следующие условия: (а) X, У и &и есть гильбертовы пространства со скалярными произведениями ( , )х, { , }y и ( , }и соответственно’J; (b) производящая функция f(x,u,t) системы S имеет следую- щий вид: f (х, и, t) = A(t)x + В (t)и, где 4(Z) е2’(Х, X), B(t) = S’X), причем отображения /->Д(0 и t-*-B(t) непрерывны (или просты) на промежутке (ТьГ2); (с) выходная функция г] (/, х) системы имеет вид т](/, х) — C(t)x, где C(t) еЗВХ, У), а отображение является простым на (Л,т2). Напомним, что если 3$ есть некоторое гильбертово пространство со скалярным произведением [,] то Ж можно отождествить с 5^2). В частности, это означает, что если %,^S(3@,3@), то сопря- женное преобразование В* можно считать также принадлежащим пространству Назовем самосопряженный (или симмет- ричный) элемент g пространства S(3@,3@) положительным, если для любых h е Ж справедливо, что [Л, gft] > 0, и положительно определенным, если для любых и таких, что h Ф 0, справед- ливо, что [h, g/i] > 0 (здесь преобразование g обратимо)3). Нако- нец, если g положительно, то часто вместо [•,£'] мы будем поль- ’) Мы будем обычно опускать эти нижние индексы, когда совершенно ясно, о каких скалярных произведениях идет р.ечь. 2) Мы будем пользоваться этим отождествлением для всех гильбертовых пространств, рассматриваемых в дальнейшем. ) Это второе условие на самом деле излишне. 4 Зак. 693
98 3 Основы теории оптимального управления зоваться обозначением || |||. Другими словами, для любого h из <3# имеем цл||=[ллл]. В конечномерном случае £ можно рассматривать как некоторую (симметрическую) матрицу, а свойства положительности и поло- жительной определенности — как аналоги известных свойств неот- рицательной и положительной определенности матриц. (5.2) Определение. Пусть z(t) есть некоторое простое отображение (Ti, Т2) в Y. Пусть ф— некоторый положительный элемент про- странства S’(Y, Y), пусть р(0—другой положительный элемент пространства S’(У, У), такой, что отображение t-+p(t) является простым на (Ть Т2), а о(0—такой положительный элемент 3?(£%v,$u), что отображение непрерывно на (Л, Т2). Если K(t,x) задается уравнением К (Л х) = |||г(0-С(0х||2 и если L (х, «, t) таково, что L(x, и, t) =4[||z(0-C(0x||2(<) +||И||]2(<), то функционал качества J(t0, х0, «(•)), выражающийся через эти К и L по формуле (3.4), называется квадратичным функционалом качества (для линейной системы из определения (5.1)). Предположим теперь, что S — наша линейная система, К и L — показатели качества конечного состояния и переходной траектории соответственно; t0— некоторый заданный элемент из (Л; 7^); х0 — некоторый заданный элемент из X; ti — заданный элемент из (t0, Т2) (т. е. ti> to), a S = {/1} X X — целевое множество. Предположим еще, что 1. U = ^и, так что в этой задаче допустимые управления не ограничены по величине; 2. й есть множество всех ограниченных простых функций *) из (Гь Т2) в U. Поскольку время t\ фиксировано, а конечное состояние сво- бодно, каждое и(-)ей преобразует (t0, х0) в S. Таким образом, если «(•) е й, то (5.3) J(t0, х0, «(•)) = y||z(^1)-Ca))xu(/1)||2 + ti +1 J [ II2 (О _ с (0 Ха (01|2 (0 +1| и (0 ||2 (/)] dt, См. примечание на стр. 95.
3.5 Линейные системы с квадратичным критерием качества 99 где xu(t)—решение уравнения системы при условии, что в на- чальный момент времени to состояние, системы есть хи(/о) = х0 и что в уравнение подставлено выбранное управление «(•), т. е. %и(/) = <р(/; to, х0, «(•)). Тогда наша задача управления состоит в нахождении такого «(•), которое минимизирует функционал J(to,Xo, «(•))• Мы вскоре решим эту задачу с помощью теории Гамильтона — Якоби (см. Калман [1963а]). Однако сначала рассмотрим физиче- ские основания этой конкретной задачи и наметим путь ее решения. Если рассматривать z(t) как желаемый выходной сигнал и по- ложить yu(t) = C(t)xu(t), то разность ea(t) = z(t)-ya(t) можно назвать ошибкой, соответствующей управлению «(/). Тре- буется выбрать управление таким образом, чтобы по возможности уменьшить эту ошибку, одновременно не расходуя чрезмерно энер- гию управляющего воздействия. Отметим, что функционал каче- ства / из уравнения (5.3), который можно переписать в виде «I (5.4) J(t0, Хо, u(-)) = |KOl| + | fllee(OI^)^ + tx +IJII “(0 to как раз и отражает эти требования. Значение J всегда неотрица- тельно, большим ошибкам приписываются большие веса, чем ма- леньким, ив/ есть член, учитывающий расход «энергии» на управ- ление (последний член в уравнении (5.4)). Более того, как мы уви- дим в дальнейшем, оптимальный закон управления для этой задачи реализуется линейным регулятором в контуре обратной связи, что также удобно с практической точки зрения. Вывод решения этой задачи управления начнем с того, что рас- смотрим один упрощенный вариант этой задачи, известный как задача регулирования в пространстве состояний. В этой последней задаче С(/)=/ (тождественное отображение), a z(t) = 0 при всех t. Ключевой момент решения состоит в получении уравнения Риккати с вытекающей отсюда необходимостью изучения свойств его решения. Затем мы рассмотрим задачу регулирования в про- странстве выходных величин, в которой z(t) = 0 при всех t. А после этого перейдем к самой общей задаче, сформулированной выше, и получим ее решение. В завершение этого параграфа мы исследуем задачи регулирования для стационарных систем на бесконечном промежутке времени. 4*
100 3 Основы теории оптимального управления Итак, сосредоточим внимание на задаче регулирования в про- странстве состояний. Другими словами, предположим, что X = Y и что C(t) = /, a z(t) =0 при всех возможных t. Тогда имеем K(/,x) = |||x|g, L (х, и, /) = -g-1| х |g + -у || и 1g и, вспоминая, что X* совпадает с X, мы видим, что гамильтониан И задачи определяется выражением (5.5) Н(х, Л, и, t) = L(x, и, ?) + <Л, f (х, и, /)) = = |их Ир(П + |п« На(0 + A(t)x + B (?) «). Теперь мы можем получить первый результат. (5.6) Предложение. Пусть 31 = и пусть (1,£)—лю бой элемент из 31, а X — любой элемент Х( = X*), Тогда функция Н (Jf, %, и, Т) как функция и имеет единственный абсолютный мини- мум в точке u°(t, Д %), где (5.7) м° (f, А X) = - о"’ (0 В* (?) А. Другими словами, функция Н регулярна относительно (7\, Т2)хХ, и соответствующее этой функции Н минимальное управление имеет следующий вид: u°(t, х, = Доказательство. Слагаемые функции Н(£, Л, и, ?), зависящие от и, имеют следующий вид: (5.8) |<ы, ди) + {В*Х, и), где б = о(?), а В* = B*(t). Но тогда^ у Н имеется единственный абсолютный минимум в точке и°(£, I, X) тогда и только тогда, ко- гда в этой точке достигает своего единственного абсолютного ми- нимума выражение (5.8). Но.так как д положительно определена, выражение (5.8) имеет единственный абсолютный минимум в точ- ке ы°(?,^Д) тогда и только тогда, когда это справедливо для вы- ражения (5.9) {и, ди) + 2 <М, и) + <В’£, д~ 'В*£). Но {и, ди) + 2 <В1, и) + (М, д~ 'В*%) = = {и + д-'ДХ д (и + д-’В’Л)) = || и + д-'ВК |g,.
3.5 Линейные системы с квадратичным критерием качества 101 и, таким образом, из факта положительной определенности д сле- дует, что выражение (5.9) достигает своего единственного абсо- лютного минимума в некоторой точке и =* uQ (f, х, X). Заметим теперь, что если отображение л(*) пространства (ТЬТ2) в 3?(Х,Х) непрерывно дифференцируемо, то функция Г(^,х),где (5.10) W(t, х) = у<х, л также непрерывно дифференцируема на (Л, Т2) X X. Отсюда сле- дует, что если и(-) есть произвольный элемент из й, а хи(-) —не- которая траектория нашей системы, то dW(t,xa(t)) dW(t,xa(t)) , /dW(t,xa(t)) dxa(t)\ dt dt ' \ dx ’ dt / почти всюду на (Л, Т2). Учитывая замечания, сделанные непосред- ственно за следствием (4.21), мы сразу видим, что если нам удаст- ся найти решение уравнения Гамильтона — Якоби (5.10), то с помощью теоремы (4.14) мы сразу найдем оптимальное управле- ние для поставленной задачи. Начнем со следующей леммы. (5.11) Лемма. Если n(t) есть некоторое решение дифференциаль- ного уравнения Риккати ') (5.12) л (0 = - л’ (0 А (0 - Л* (0 л (0 + л* (0 S (0 л (0 - р (0, где (5.13) = то функция W(t, х), построенная по формуле (5.10), удовлетворяет уравнению Гамильтона — Якоби. Доказательство. Согласно формуле (5.10), имеем (5.14) ---------dt~~~2 <х, л(0х), —^-л = л(0х, а, следовательно, в соответствии с уравнениями (5.14) и (5.5) ле- вая часть уравнения (4.12) приобретает следующий вид: у (х, л (0 х) + у <х, р (0 х) + у <В* (0 л (0 х, о'1 (0 В* (0 л (0 х) + + (л (0 X, A (t) X — S (0 Л (t) х) = у <Х, Л (0 х) + у <х, р (0 х) — - у <х, л* (0 S (0 л (0 х) + у <х, л’ (/) А (t) х) + у (х, Л* (0 л (0 х), отсюда сразу получается утверждение леммы. *) Здесь через л(/) обозначается dn(t)[dt.
102 3 Основы теории оптимального управления Теперь понятно, что изучение дифференциального уравнения (5.12) может оказаться небесполезным. Если положить, что (5.15) g (t, л) - - л* А (0 - Л* (0 л + л*5 (0 л - р (О, то g(f, л) оказывается локально липшицевым отображением (Л, Т2) ХЗ?(Х, X) в Z(X, X), простым по t и непрерывным по л. Это значит, что если Ц есть некоторый заданный элемент из (Л>Л), то существует некоторый открытый промежуток, содер- жащий tj, скажем (ri.Si), в котором уравнение (5.12) имеет един- ственное решение лД/), удовлетворяющее условию (5.16) (см. Дьедонне [I960]). Заметим, что, так как ф = ф* и g (t, л’) = - лЛ (/) - Л* (0 л* + nS (/) л* - р (О, функция nJ (0 также является решением уравнения (5.12), удовле- творяющим условию (5.16). Отсюда следует, что Л1 (/) самосопря- жено. Мы приходим к лемме. (5.17) Лемма. Пусть t — некоторый элемент из и пусть х — произвольный элемент из X. Тогда оптимальное относительно (1,х) управление и°(-) существует, и ему соответствует значение функционала качества (5.18) J(t, х, и° (•)) = -у (х, Я! (/) х). Доказательство. Эта лемма является прямым следствием предло- жения (5.6), леммы (5.11) и теоремы (4.14). (5.19) Следствие. Если (гь Л), то лД/) положительно. Доказательство. Пусть х — произвольный элемент из X. Тогда, со- гласно нашим предположениям относительно ф, р (•) и о( •), имеем {х, Л! (/) х) = 2 J (t, х, u° (•)) = = I|X°(*1)I|+ f [IIX»(s)|g(s> + 11 u4s)|g(s)]ds>0, t где x°(-) —траектория системы, соответствующая управлению м°(-). (5.20) Следствие. Отображение t-+g(t,ni(t)) ограничено на (гь fi] (если ri>Ti). Доказательство. Принимая во внимание сделанные допущения об отображениях t-*A(t), и нам будет достаточно показать, что отображение t в лД/) ограничено. Предположим вре-
3.S Линейные системы с квадратичным критерием качества 10J менно, что найдется такое положительное л, что п— ni(f) положи- тельно при всех t из (гь А]. Тогда можно утверждать, что ||л||> '>||Л1(ОП при любых t из (гь fj. Для того чтобы убедиться в этом, заметим, что для х е X имеем {х, {« — Л] (/)} х) = (х, пх) — {х, л1 (/) х) = = (]/лХ, ]/л — Л! (/) X, У Я] (/) х) О, где Ул и Ущ (0 — положительные квадратные корни') из я и Л1 (0 соответственно. Отсюда следует, что || VMsM (Oil и, сле- довательно, im4vViVMv4!>I/SW- -I/", w- /Sw II=1»,ю и. поскольку ||gg*|l = llgll2 при всех g из 3?(X, X). Таким образом, остается только найти подходящее л. Обозначим через Ф(г, s) переходное отображение (или резоль- венту, или фундаментальное линейное отображение) нашей систе- мы (§ 2.2 и Дьедонне [I960]). Тогда существует такое с>0, что || Ф (г, s) II21|р(г) ||<с для всех (г, s) из [гь f,] X [rb fj и IIФ (О, s) II2 • || £|| < с для всех s из [rb Положим теперь л= (с/2) (1 + Л — и)/. Тогда л есть некоторый положительно определенный элемент из 3?(Х, X}, и можно утвер- ждать, что при всех х s X и ie (гь fj справедливо (х, лх) (х, л1 (/) х). Чтобы убедиться в этом, заметим прежде всего, что если хеХ и t <= (и, fi], то траектория нашей системы, начинающаяся из со- стояния х в момент времени t и соответствующая управлению О(-) =0. задается как Ф(г, t)x. Но отсюда находим fi 2J(t, х, 0 (•)) = || Ф (f„ t) х || + / || Ф(г, 0 х dr < t и, следовательно, имеем / (/, х, 0 (•) X (х, (1 + tx — rj Ix^ = (х, лх). v !) Существование этих корней является известным следствием спектраль- ной теоремы (Данфорд, Шварц [1958]).
104 3 Основы теории оптимального управления Но для t из (Г1,/1) по лемме (5.17) получаем (х, Л1 (/)х) = J(t, х, ы°( •)) х, 0( •)) ^(х, лх), что и доказывает следствие (5.20). Объединяя следствие (5.20) с предложением 10.5.5 книги Дье- донне [1960], мы заключаем, что уравнение (5.12) имеет решение л(0, удовлетворяющее условию (5.16) и определенное и единствен- ное на (Ti, /]]. Этот вывод базируется на следующих соображениях. Пусть 3 = inf(s: se(Ti,fJ и такие, что существует положитель- ное решение ns(-) уравнения (5.12), удовлетворяющее условию (5.16) и определенное на [s, /1]}. Если оказалось бы, что s больше то существовало бы положительное решение лД-) уравнения (5.12), определенное на (£, 6], удовлетворяющее условию (5.16) и в соответствии с утверждением следствия (5.20) ограниченное на (£, Л]. Но тогда существовало бы и решение уравнения (5.12), удовлетворяющее условию (5.16), которое было бы определено на [£ — е, / J при некотором е > 0. Выбирая е достаточно малым, чтобы было $’-е>7'1, мы получаем противоречие, и, следовательно, s = 7’i (или если Л = —оо, то множество чисел s не ограничено снизу). Это позволяет нам установить следующий результат. (5.21) Теорема. Для любых 10 из (Ть и х0 из X задача регули- рования в пространстве состояний имеет решения. Оптимальное управление для этой задачи задается в виде некоторой функции состояния (5.22) и° (t, х) = - о"1 (О В* (0 л (0 х, где л(-)—единственное решение уравнения Риккати, удовлетво- ряющее условию — Оптимальная траектория системы определяется решением дифференциального уравнения (5.23) -^- = [4(0-5(0л(0]х(0 с начальным условием x(t0) = Xq, Наконец, оптимальное качество системы вычисляется по формуле (5.24) J (t0, х0, и° (•)) = у (х0, л (f0) х0>. Отметим, что предлагаемый оптимальный закон управления приводит к построению нестационарной системы с обратной связью, в которой решение уравнения Риккати играет роль коэф- фициента усиления (см. схему на рис. 3.2). Рассмотрим теперь задачу регулирования в пространстве вы- ходных величин. Другими словами, еще раз предположим, что
3.5 Линейные системы с квадратичным критерием качества z(t) =0 при всех t. Тогда имеем K(t, х) = 4||С(0х||2, L(x, и, 0 = |||С(0х||2(О +y||M|g(0. Зафиксируем ti и положим ^(/ОШ ра)=с*(орюс(о, К(Лх) = |||х|£, L(x, и, о = У||х|g(/) + УIIи||2(<). Теперь мы можем воспользоваться уже полученным результатом, теоремой (5.21), для решения задачи регулирования в простран- стве состояний для К и L; тем самым мы решим исходную задачу Рис. 3.2. регулирования в пространстве выходных величин, если только нам удастся показать, что у и р(/) положительны. Но так и получается в самом деле, как видно из следующей леммы. (5.25) Лемма. Пусть а — некоторый положительный элемент из S’(X, X), а р— произвольный элемент из 9?(Х, X). Тогда р*ар по- ложительно. Доказательство. Заметим, что (х, р*арх) = (рх, арх); это и дока- зывает лемму. Таким образом, мы приходим к следующей теореме. (5.26) Теорема. Для любого t0 из (Ti, и любого Хо из X задачи Регулирования в пространстве выходных величин всегда имеет
106 3 Основы теории оптимального управления решение. Соответствующее оптимальное управление имеет следую- щий вид: (5.27) «° (t, х) = - а1 (/) В* (0 А (0 х, где ft (t) представляет собой единственное решение уравнения Риккати - (5.28) = - ft* (О А (0 - Д* (0 ft (/) 4- ft*. (О S (О ft (0 - Р (0. удовлетворяющее условию (5.29) ft (/J = £ Оптимальная траектория системы описывается решением уравне- ния (5.30) ^£p. = M(O-S(Oft(/)]x(O с начальным условием x(tQ) — Xq. Наконец, оптимальное качество такой системы вычисляется по формуле (5.31) J(t0, Х0, «°( • ) ) = у <х0, ft (t0)х0). Заметим,-что единственное различие между теоремами (5.21) и (5.26) состоит в том, что во второй из них a(t), ф, p(t) заменены соответственно на A(t), ф, p(f). Отметим также, что оптимальное управление по-прежнему является функцией состояния, а не вы- ходной величины. Это объясняется тем, что (грубо говоря) в со- стоянии системы содержится вся информация, необходимая для того, чтобы предсказывать будущие значения выходных величин на основании информации об управлении. Перейдем, наконец, к исследованию функционалов качества общего вида, задающихся функциями К и L из определения (5.2). Заметим прежде всего, что (5.32) Н(х, К и, /) = у||г(0-С (Ox + 4 II «11^ + + <А, A(t)x + B(t)u}. Но. так как выражение (5.32) зависит от и точно таким же обра- зом, как и выражение (5.5), можно заключить, что гамильтониан (5.32) регулярен относительно (7\, Т2) X X и что Я-минимальное управление задается формулой (5.33) и° (t, х, Л) = - а"1 (0 В* (0 А. \ Однако в силу зависимости этого гамильтониана от z(t) ясно, что формула (5.10) уже не определяет решения уравнения Гамильто-
3.5 Линейные системы с квадратичным критерием качества 10. на — Якоби. Поэтому рассмотрим функцию определенную согласно следующему уравнению: (5.34) Z (t, х) = у <х>11 (0 ~ <х> $ (0) + Ф (0, где через «(•) обозначено некоторое непрерывно дифференцируе- мое отображение в 3?(Х, X), через £(•)—непрерывно дифферен- цируемое отображение в X, а через <р(-) —непрерывно дифферен- цируемое отображение в множество вещественных чисел R. (5.35) Лемма. Пусть n(t)—решение уравнения Риккати (5.36) л (/) = - л* (0 А (/) - А* (0 л (!) + л* (/) S (!) л (!) - С* (/) р (/) С (/), пусть §(/) —решение дифференциального уравнения (5.37) |(0 = -М(0-5(0л(0]Ч(0-с*(0р(0г(0, а <р(/) — решение дифференциального уравнения (5.38) ф (0 = | [ || г (01|2(#) - <g (0, S (01 (/)>], где S(!) = B(i)<rx(i)B*(i). Тогда Z(i,x) является решением урав- нения Гамильтона — Якоби. Эта теорема доказывается непосредственными выкладками, ко- торые мы оставляем читателю. С учетом полученных выше результатов заметим, что уравне- ние (5.36) имеет единственное решение л(0> определенное на (Л,/J и удовлетворяющее условию (5.39) Что же касается уравнения (5.37), то оно линейно и, следователь- но, имеет единственное решение ^(!), определенное на (Л, и удовлетворяющее условию (5.40) t(fi) = C‘ai)^(f1) (см. Дьедонне [I960]). Аналогично уравнение (5.38) имеет един- ственное решение ф(/), определенное на (7\, Л] и удовлетворяющее условию (5.41) $Vi) = (z(*i), «(*i)z(*i))- Таким образом, согласно замечаниям, сделанным непосредственно после следствия (5.21), мы можем воспользоваться теоремой (5.14) Для получения следующего результата, служащего решением по- ставленной задачи. (5.42) Теорема. Для любых /0 из (Т\, и х0 из X задача управле- ния линейной системой с квадратичным критерием качества всегда
108 3 Основы теории оптимального управлений имеет решение. Соответствующее оптимальное управление опреде- ляется по формуле (5.43) «° (/, х) = - а-1 (О В* (0 [ft (0 х -1 (0L Оптимальная траектория определяется решением следующего урав- нения: (5.44) ^-=[4(0-S(0ft(0]x(0 + S (0, с начальным условием x(t0) = Xq. Наконец, оптимальное качество системы вычисляется по формуле (5.45) / (t0, х0, «° (•)) = у <х0, a (t0) х0) - <х0, | (0> + Ф (*о)- Заметим, что уравнение Риккати относительно л (•) не зависит от г(‘), так что структура оптимальной системы с обратной связью совпадает со структурой оптимальной системы регулирования в пространстве выходных величин. Основное отличие этих двух оп- тимальных систем состоит в появлении в более общей из них «вы- нуждающего» воздействия £(/), осуществляющего «коррекцию» регулирующего характера более общей системы. Отметим еще, что для определения 1(f) необходимо знать значения z(s) на всем про- межутке i -С s -С ti. Другими словами, текущее значение оптималь- ного управления требует знания будущих значений желаемой вы- ходной величины. В связи с этим для реализации оптимальной системы потребуются устройства упреждения1). Перейдем в заключение к изучению задачи регулирования в пространстве состояний для стационарной системы на бесконечном промежутке времени. Иначе говоря, предположим, что A(t) — A, В (f) = В, р (0 = р, а (0 = ст, X = Y, С (0 = I, а также что z (0 — О, ф = О, Т1 — —оо, 72 = оо. Такая система описывается уравнением (5.46) х(0 = Дх(0 + Ви(0, а функционал качества принимает вид оо (5.47) J (t0, х0, и (•)) = | / [ || ха (01|2 +1| и (01|2] di. h Однако, учитывая стационарность этой системы, а также постоян- ство р и о, мы сразу видим (воспользовавшись сдвигом во времени), 1) Эти результаты в несколько менее общей форме появились впервые в ра- боте Калмана [1963а]. Много интересных примеров можно найти в книге Атанса и Фалба [1966], а некоторые результаты = в работе Фалба и Клейнмана [1966].
3.5 Линейные системы с квадратичным критерием качества t09 что можно положить /0 = 0 и, следовательно, рассматривать функ- ционал качества оо (5.48) /(хо, «(• )) = у / [l|xtt(/)|g + ||«(n.|g]^. О Начнем со следующей леммы. (5.49) Лемма. Пусть /г(%0, «(•)) —функционал качества вида т (5.50) JT (х0, и (•)) = | / [ || ха (0||* +1| и (0 |g] dt, о а —решение уравнения Риккати, соответствующее этому функционалу качества. Обозначим л(0;Г) через л(Т). Предполо- жим, что (а) существует lim л (Т) = ft и что Т-*°о (Ь) ft удовлетворяет уравнению (5.51) — ЛА — А*Л + ftSft — р = 0. Тогда наша задача регулирования в пространстве состояний на бесконечном интервале времени имеет решение для любых х0 из X. Соответствующее оптимальное управление имеет вид (5.52) и° (х) — — а ~1 В'Лх, а оптимальная траектория описывается решением дифференциаль- ного уравнения (5.53) = (Л-Зй)х(0 с начальным условием х(0) = Хо. Наконец, оптимальное качество такой системы вычисляется по формуле (5.54) / (х0, и° (•)) = у (х0, лх0). Доказательство. Прежде всего убедимся в следующем: (5.55) /(х0, «°(-))= lim JT (х0, и°( •)) =у ||х0|g. Т->оо Z С этой целью заметим, что задача управления с функционалом качества /Чхо, «(•)) = 4II х^Г) II* +/г (Хо, U (.)) имеет решение. Более того, согласно уравнению (5.51), ясно, что и°(-) является оптимальным управлением для этой задачи и что <5-56) -11| х01g = Jr(хо, и°(•)) = 41| х„» (Т) |g + Jr (*о, и°(•)).
ПО 3 Основы теории оптимального управления Отсюда находим у II Хо Ц2 > JT (х0, и (• )) > JII х01|£ (Г), и, следовательно, в силу условия (а) соотношение (5.55) справед- ливо. Пусть теперь и(-) есть некоторое заданное управление и пусть J(xo,u°(.))-Z(xo,«(-))>d>O. Однако если Т достаточно велико, то — / (х0, «0(-)) = 4llxollft(n + 4>/r(xo. «(-)) + б. Это приводит к противоречию, что и доказывает нашу лемму. (5.57) Следствие. При выполнении условий леммы (5.49) система (5.53) строго h-устойчива1), и, в частности, если п положительно определена, то система (5.53) строго устойчива. Доказательство. Воспользуйтесь уравнениями (5.55) и (5.56). Отметим, что если рассматриваемая динамическая система ко- нечномерна (т. е. если конечномерны X и U), то условия леммы (5.49) удовлетворяются для полностью управляемых систем. До- полнительные подробности можно найти в работе Калмана [1960а]. Вопрос об асимптотическом поведении решений уравнения Риккати в общем случае по-прежнему остается открытым2). 3.6 Фильтр Калмана — Бюси Рассмотрим вопрос об определении «наилучшего» (в смысле минимума математического ожидания квадратичной ошибки) ли- нейного фильтра для «сигнала», генерируемого некоторым линей- ным стохастическим дифференциальным уравнением в гильберто- вом пространстве. Приведенный здесь вывод, основывающийся на работах Калмана и Бюси [1961] и Фалба [1967], является суще- ственно эвристическим. Действительно, строгие доказательства по- требовали бы привлечения понятий, выходящих за рамки этой книги. Однако с точностью до использования дельта-функций при- веденный вывод является строгим для конечномерного случая, а все необходимые подробности для случая более общих гильберто- вых пространств можно найти в работе Фалба [1967]. Материал 1) Система называется строго л-устойчивой, если вдоль ее траекторий II • IIЛ асимптотически стремится к нулю. 2) Доказательство Калмана [1960а] в этом случае не годится, так как беско- нечномерная система может быть полностью управляемой, а множество момент тов времени попадания из заданных состояний в начало координат может быть неограниченным,
3.6 Фильтр Калмана—Бюси 111 этого параграфа требует несколько более глубоких и широких ма- тематических познаний, чем это нужно в других разделах книги, посвященных теории управления. В частности, читатель должен иметь представление о теории меры, теории интегрирования в ба- наховых пространствах (Данфорд, Шварц [1958]) и теории стоха- стических процессов (Дуб [1953]). Пусть (£2, ц.) — вероятностное пространство, где есть о-ал- гебра борелевых множеств, ар — мера. Если X — банахово про- странство, а х(-)—некоторая измеримая1) функция из Q в X, то х(-) называют случайной величиной. Если %(•) является интегри- руемой случайной величиной, то говорят, что у х(-) имеется мате- матическое ожидание (или среднее), обозначаемое через £{*(•)}, £{*(•)}= J * (®) dp. о Заметим, что £’{х(-)} также принадлежит банахову пространству X. Начиная с этого момента мы всегда будем рассматривать толь- ко такие случайные величины, у которых есть математические ожи- дания, и будем обычно опускать символ со, указывающий в явном виде на зависимость случайных величин от исхода случайного экс- перимента. Для того чтобы построить теорию фильтра Калмана — Бюси, нам понадобятся еще несколько новых понятий. В частности, нам нужно ввести определения таких понятий, как стохастический про- цесс, корреляционная матрица, ортогональные приращения и сто- хастический интеграл. Грубо говоря, стохастический процесс пред- ставляет собой некоторое параметризованное семейство случайных величин. Дадим более точное определение. (6.1) Определение. Пусть Т — некоторый промежуток вещественной оси, а X — банахово пространство. Тогда функция x(t, ю) из TXQ в X, измеримая относительно пары (/, ®) (для лебеговой меры на Т), называется стохастическим процессом2). Говоря о стохастических процессах, мы часто будем обозначать x(t, ®) через x(t). Предположим теперь, что Н есть гильбертово пространство и что /i] и h2 принадлежат Н. Определим тогда h\ о ft2- как элемент S? (Н, Н), потребовав, чтобы (6.2) (hi ° h2) h = hi {h2, ti), *) Напомним, что функция х(-), определенная на й и принимающая зна- чения из X, называется измеримой, если х( •) существенно сепарабельна и если х~1(О)<=д> для любых открытых множеств С из X (Данфорд, Шварц [1958]). у Это определение несколько уже обычного (Дуб [1953]), но для наших Целей этого достаточно.
112 3 Основы теории оптимального управления где (,)—скалярное произведение в Н. Заметим, что если Н = Rn (т. е. если Н конечномерно), то hi о Л2 соответствует матрица hih^. Более того, справедливо следующее предложение. (6.3) Предложение. Пусть Н — гильбертово пространство, a ф— отображение из НфД в Z (Н, Н), удовлетворяющее условию (6.4) ф (Ль /г2) = hx ° /г2. Тогда ф обладает следующими свойствами'. (а) отображение ф линейно как по так и по h2, (b) отображение ф непрерывно, так как (6.5) Ж/г,./^IIHM-IIM1); (с) ф(/и, /г2)* = ф(/1г, hx) = h2 ° hi, и, следовательно, ф(/и,/г2) симметрично; (d) если h принадлежит Н, то (6.6) (/г, ф (hi, /i2) h} = (h, hx} • (h, h^). Но, так как H* можно отождествлять с Н, последнее соотношение можно записать в виде h*(hioh2)h = (h*hi) (/г’Л2), где h* представляет собой h, рассматриваемый как элемент из Н*. Доказательство. Свойства (а), (с) и (d) очевидны. Что же касается свойства (Ь), то нужно просто заметить, что H(/jh/г2)|| = sup || (hi ° h2) h || = sup || hx (h2, h} || = li л ii< i iiftiKi -IIM sup |<Л2, A>I = ||ZhII• I! A2II 11Л1К1 (см., например, Канторович, Акилов [1959]). Предложение (6.3) приводит к следующему. (6.7) Предложение. Пусть х(-) и у(-) суть случайные величины, принимающие значения в Н. Тогда функция х(-) °у(-) принимает значения в Z (Н, Н) и измерима. Доказательство. Поскольку %(•) и у(-) почти всюду сепарабельны, ясно, что почти всюду сепарабельно и х(-) °у(-), а этого достаточно, чтобы доказать, что если О есть некоторое открытое подмножество в 3?(Н,Н), то [%(•) о «/(•)]”’(б?) принадлежит & (Данфорд, Шварц [1958]). Теперь имеем {©: ф (х (и), у (©)) е (?) = {©: (х (®), у (©)) е ф-1 (0)}, ’) Заметим, что отсюда же следует, что линейное преобразование h\ © h2 == ® ф(Л1,М действительно принадлежит пространству
3.6 Фильтр Калмана—Бюси ИЗ а так как -ф непрерывно, то ф-1 (<7) является открытым множеством в Н®Н. Таким образом, где (Уг и Oj — открытые множества в Н. Но отсюда находим {©: (х (со), г/(<в))е=ф“‘(бУ)} = (J[{®: х(ш) е <7,] f| [®: 1/(®)еб7<}] = =U*_,(^)nrW а утверждение (6.7) получается как следствие измеримости х(-) и £/(•)• Теперь можно перейти к следующим определениям. (6.8) Определение. Пусть хну — случайные величины, принимаю- щие значения из Н1). Тогда коэффициентом корреляции хну, cov [х, у], называется такой элемент (если он существует) из Z (Н, Н), что (6.9) cov [х, у] = Е {х ° у) - Е (х)°Е {у}. Если covfx, у] = 0, то случайные величины х и у называют некор- релированными. (6.10) Определение. Пусть x(t)—случайный процесс, принимаю- щий значения из Н. Тогда x(t) называют процессом с ортогональ- ными приращениями, если (а) £{|| [х(0 - x(s)] о [х (f) — x(s)] И} < оо для t, sg=T. (b) £{[x(f2) —x(s2)]°[x(/1) —x(st)]} = 0 для s1</1<s2</2. Если же £“{[x(0 —x(s)]o[x(/) —x(s)]} зависит только от f — s, то x(t) называют процессом co стационарными (в широком смысле) приращениями (Дуб [1953]). Докажем теперь один результат теории процессов с ортого- нальными приращениями. (6.11) Предложение. Пусть x(t) есть некоторый процесс с. ортого- нальными приращениями и пусть %(/) определяется по формуле ((. , _ ( Е {[х (0 - х (*0)] о [х (0 - х (t0)]}, i > /0) 1.12) -£{[х(0-х(/о)]»[х(0-хШ t<t0. ’) Обратите внимание на то, что, согласно сделанным ранее замечаниям, мы опускаем здесь указания на зависимость от со.
114 3 Основы теории оптимального управления Тогда (6.13) E{[x(0-x(s)]°[x(0-x(s)]} = X(0-X(s)( s<t, а %(#)—%(з) является положительным элементом из Z(H,H) (в этом смысле %(•) представляет собой монотонно неубывающую функцию). Доказательство. Простые выкладки, которые мы предоставляем читателю, подтверждают справедливость предложения (6.13). Со- гласно же утверждению (6.3с), 1(f) —1(з) симметрично. Поэтому если h е Н, то <[1 (0 - Л (з)] h, h} = <£ {[х (/) - х (з)] о [х (0 - х (з)]} h, h} = - <£ {[х it) - x (s)] <[x (t) - x (s)], h}}, h) = = E {<[x (0 - x (з)], h) • <[x (П - x (s)], h}} = 0, так что 1(f)— l(s) положительно. Итак, если x(t) есть некоторый процесс с ортогональными при- ращениями, то 1(f) можно использовать для построения меры, при- нимающей значения в £ (Н, И), а это позволит нам построить сто- хастический интеграл, основанный на такой мере (Дуб [1953]). Од- нако мы существенно пожертвуем общностью и ограничимся рассмотрением процессов, аналогичных винеровским. Точнее го- воря, мы будем базироваться на следующем определении. (6.14) Определение. Пусть w(t) есть некоторый принимающий зна- чения из Н случайный процесс с тождественно равным нулю мате- матическим ожиданием (т. е. £{a>(f)} = 0 при всех t). Пусть w(t) является процессом с ортогональными приращениями, пусть w(f) почти всюду (относительно со) непрерывно, пусть (6.15) Е {[ш (0 - w (з)] о (0 - w (з)]} = | f - з | IF, где IF— некоторый положительно определенный элемент из £(Н, Н), такой, что для ортонормированного базиса Н справед- ливо IFAO = la/ia (т. IF «диагонально»), и пусть (6.16) Е {<&у (t2) - w (s2), S [йу (ti) - w (Sj)]>} = 0 каждый раз, когда 3] '< Ц < з2 < t2, a S <=£(Н, Н) 1). Тогда w(t) называют винеровским процессом. Введем теперь понятие стохастического интеграла, опирающееся на определение (6.14). Это позволит нам говорить о стохастических !) Уравнение (6.16) описывает условие «независимости», излишнее в конечно- мерном случае,
3.6 Фильтр Калмана—Бюси 115 дифференциальных' уравнениях и поставить задачу фильтрации. Предположим, что S(Z) представляет собой ступенчатую функцию из Т в S’(Я, Я) и что w(t) есть некоторый винеровский процесс. Другими словами, найдутся такие t0 <ti <....< tn из Г и Sj, j = = 1, ...» п, из S’(Я, Я), что 5(0 = 0, 5/, 0, t<t0, j = 1, ..., п, Определим тогда (стохастический) интеграл S(t) по dw(t), потре- бовав, чтобы п / S (0 dw (0 = 2 S; [иг (0) - W (0-i)]. /“1 Заметим, что такой интеграл является случайной величиной, при- нимающей значения из Я и имеющей нулевое математическое ожи- дание1)- (6.17) Лемма. Пусть R(t) и S(t) являются двумя принимающими значения из 3?(Н,Н) ступенчатыми функциями. Тогда (6.18) Е [ [ / R (t) dw (О] ° [ j S (0 dw (/)] } = / R (0 №S* (t) dt, и, следовательно, (6.19) £{|//?(0<М0|-|/S(0<M0|}< f ИЖОИНIF||tr||S(OI|dt Доказательство этой леммы сводится к простым выкладкам, кото- рые мы оставляем читателю. Опираясь на лемму (6.17), мы можем определить стохастиче- ский интеграл таким же способом, как это сделано в книге Дуба [1953]. Другими словами, если Ф(0 принадлежит L2(T,2?(Н, Н)), так что / II Ф (ОГЛ <00, то (Данфорд, Шварц [1958]) Ф(0 является пределом последова- тельности ступенчатых функций Sm(t), т. е. (6.20) lim [ W0-Sw(0lM = 0, Ш->оо J !) Все эти утверждения относительно стохастического интеграла справед- ливы лишь почти всюду» но мы здесь не будем задерживаться на этом,
116 3 Основы теории оптимального управления и мы можем определить j <3>(t)dw(t), положив [ Ф (0 dw (t) = lim f Sm (t) dw (/), J m-*oo J т. e. потребовав, чтобы (6.21) ^im E {| J Ф (t) dw (0 - J Sm (0 dw (t) J2} = 0. Заметим, что соотношение (6.20) гарантирует справедливость соот- |' ношения (6.21) в силу неравенства (6.19). Более того, J <b(t)dw(f) ! также является принимающей значения из Н случайной величиной, j с нулевым математическим ожиданием (Данфорд, Шварц [1958]). | Заметим теперь, что если Т = [/0) Л] (или [/о, оо)), то j t ' (6.22) х (/) « | Ф (s) dw (s), t е [f0, /J f. to является случайным процессом, принимающим значения из Н. При подходящих определениях (Фалб [1967]) x(t) оказывается мартин- галом. И хотя мы не будем развивать эту тему здесь, покажем все ' же, что x(t) является мартингалом «в широком смысле». (6.23) Предложение. Пусть x(t) является стохастическим интегра- [ лом из уравнения (6.22). Тогда х(1) принадлежит L2(Q,H) и р х(/2) — x(s2) ортогонально x(t) при t-^s2<t2 (относительно струн- туры L2(Q,H)), т. е. & (6.24) Е «х (i2) - х (s2), х (/))} = 0. Другими словами, x(t) представляет собой мартингал в широком смысле (Дуб [1953]). Доказательство. Неравенство (6.19) ясно показывает, что x(t) е eL2(Q, Н). Заметим теперь, что соотношение (6.24) справедливо для ступенчатых функций в силу условия (6.16) и того факта, что ^2 х (f2) - X (s2) = j Ф (s) dw (s). «а
3.6 Фильтр Калмана—Бюси 117 Если теперь Sm(s) является последовательностью ступенчатых функций, сходящихся к Ф(«), то t [<D(s)-Sm(s)]<Ms), J ft) h t + (J Sm (s) dw (s), J [Ф (s) - Sm (s)] dw ($)} to ' ^2 II J [Ф (s) - Sm (s)] dw (s) I • IIX (01| + S2 II Sm(s)dw{s) ’HxCO-XmCOII < E {II x (t2) - xm (t2) || • || x (011} + E{|| x (s2) - xm (s2) || • || x (01|} + + E {|| xm (t2) - xm (s2) || • || x (0 - xm (01|}. С помощью неравенства Гёльдера (Данфорд, Шварц [1958]) можно показать, что отсюда следует lim Е {(х (/2) - х (s2), х (/)) - <xm (/2) - хт (s2), хт (t)}} = 0, и поэтому, так как £{(хт(^2)— xTO(s2),xm(/))} = 0 при всех т, со- отношение (6.24) выполняется. (6.25) Следствие. Если s -^t, то H{l|x(s)|f}<E{||x(t)lF}. Это следствие доказано в книге Дуба [1953]. Заметим теперь, что если S (/) — ступенчатая функция, то t х (0 = J S (s) dw (s) to непрерывно no t (почти для всех и). Поэтому в конечномерном случае относительно просто доказать, что стохастический интеграл (6,22) также непрерывен по t (почти для всех со) (Дуб [1953]). Для того чтобы избежать чрезмерных сложностей, предположим, что t *) Здесь хт (t) «= | Sm (s) dw (s). t»
118 3 Основы теории оптимального управления все функции* Ф(/), входящие в стохастические интегралы, таковы, что *(/) = | ®(s)dte»(s) непрерывна по t (для почти всех ®). и Такие функции называются s-интегрируемыми^). Предположим теперь, что х (/о) — некоторая принимающая зна- чения из Н случайная величина с £{||х(/о) II2} < оо, и пусть A(t) — простая функция из Т в S (Н, Н), a M(t)—некоторая s-интегри- руемая функция из Г в 3?(Н, Н). Тогда мы можем рассматривать следующее (стохастическое) интегральное уравнение: t t (6.26) х (0 = х (t0) + J A ($) х (s) ds + J M (s) dw (s), t. которое часто записывают в виде (6.27) dx — A(t)xdt + M(t)dw, или на более интуитивном уровне — в виде (6.28) x = A(t)x + M(t)l(t), где %(f) есть «белый шум». Если M(f) имеет вид B(t)o(t), то мы.' говорим о u(t) = ст(/)g(t) как о «белом шуме» с корреляционной матрицей (6.29) cov [и (t), и (т)] = ст (t) ст* (t) S (t — т), где б(-) есть дельта-функция Дирака. Естественно, что соотноше- ние (6.29) нужно понимать как чисто формальное. Возвращаясь к уравнению (6.26), мы сформулируем следующую теорему. (6.30) Теорема. Пусть x(t0) есть принимающая значения из И слу- чайная величина, у которой £{||х(/о)II2} < 00 Пусть A(t) —простая функция из Т в 2?(Н, Н), a M(t) есть s-интегрируемая функция из Т в 3?(Н,Н). Обозначим через Ф(/, t0) переходное отображение (нестохастического) дифференциального уравнения h = A(t)h (см. Дьедонне [1960] или § 2.2), и пусть Ф(/о,s)M(s) является s-ин-; тегрируемой. Тогда уравнение (6.26) имеет (существенно однознач- ное) решение x(t), определяемое по формуле (6.31) х (t) = Ф (t, t0) t х (t0) + j ф (to> s) м (s) dw (s) Более того, £{||x(/)||2}<oo. 9 Условия ^-интегрируемости приведены у Фалба (1968а].
3.6 Фильтр Калмана—Бюси 119 Доказательство. Без потери общности полагаем х(/о) = О, что воз- можно, поскольку t х (tQ) + J A (s) Ф (s, t0) x (t0) ds = (p (t, to) X (t0) h (см. Дьедонне [I960]). В этом случае нам нужно показать, что f г $ "I t J* A (s) Ф (s, t0) J Ф (t0, т) М (т) dw (т) ds + J М (s) dw (s) = h L^o J fo = Ф (t, to) j Ф (to, s) M (s) dw (s). t, Положим ф (s) = J Ф (t0, т) M (t) dw (t) и заметим, что ф(«) непрерывно1). Заметим также, что Д(з)Ф(з, t0) = dф(s,to)/ds и что существует такое разбиение t0 = = ао < «1 <.. .< ап = t промежутка [Zo, fl, что II t п (6.32) lim / ф (s) ds - [Ф (at, t0) - Ф (а^, /0)] ф (а,) ц~>0 / as , II Го 1 = 0, где и ji==sup| Л/ — |. Но, так как п 2 [ф <а*> ~ Ф *о)1 Ф (az) = 1 п-1 = ф (t, to) ф (t) - 2 ф tfli, to) [ф (az+]) - ф (а,)] = о П-1а/ + 1 = Ф (t, to) ф (t) - 2 / ф («ь to) ф (to, s) М (s) dw (s) 0 ai и так как ||Ф(а,-, /о)Ф(^о,$) —/||->0 при р->0 и каждом I, мы мо- жем заключить, что Л п-1 “l+l t J Ф (а{, to) Ф (to, s) М (s) dw (s) - j a{ it lim S U->0 “ M (s) dw (s) = 0. ’) В дальнейшем мы не будем каждый раз упоминать о том, что все утвер< жДения справедливы спочти всюду в пространстве Q».
120 3 Основы теории оптимального управления Воспользовавшись соотношением (6.32), находим t t (6.33) J A (s) Ф (s, i0) ф (s) ds 4- J tn (s) dw (s) = to t = Ф(0 t0) j Ф(/о, s)M(s)dw(s). to Справедливость последнего утверждения теоремы очевидна. (6.34) Следствие. Если M(s) непрерывно дифференцируема по s, то M(s) является s-интегрируемой и t t (6.35) | М (s) dw (s) = M (0 w (t) — M (f0) w (/0) — J M' (s) w (s) ds. t-i Доказательство этого следствия основано на рассуждениях, аналогичных использованным при переходе от соотношения (6.32) к соотношению (6.33). Подробности доказательства можно найти в работе Фалба [1968а]. Теперь мы готовы к тому, чтобы поставить задачу фильтрации. Предположим, что «полезный сигнал» x(f) генерируется уравнением (6.36) dx = А (0 х dt + В (0 q (t) dw и что «наблюдаемый сигнал» удовлетворяет уравнению (6.37) dz = C(t)xdt + r(t)dwh где R(t) = r(t)w\r*(t) положительно определено, cov [а» (0, W] = 0 и Е {(w (t), w} (т))} = 0. На более интуитивном уровне в таком случае часто говорят, что наблюдается сигнал z, удовлетворяющий уравнению z = С (/) х + v (/), где v(t) —так называемый «белый шум», корреляционная функция которого есть cov [о (0, v (т)] = R (0 б (/ — т). Сформулируем теперь задачу фильтрации в следующем виде. (6.38) Задача фильтрации. По заданному z(s) для to^-s'^t по- строить оценку *О) случайной функции x(t\) вида t t (6.39) St(tj If) = j A (0, s)dz(s) = J A (tlt s)C(s)x(s)ds + tfo to + J A (ti, s) r (s) dWi (s),
3.6 Фильтр Калмана—Бюси 121 где ограниченная и принимающая значения из пространства линей- ных преобразований функция А (•, •) интегрируема по обоим аргу- ментам, а оценка должна быть такой, что (6.40) Е {<х‘, х (Л) - W О)2}, х* е Я* = Н, оказывается минимальной относительно всевозможных х*, т. е. ми- нимизирует математическое ожидание квадратичной ошибки любого линейного функционала. Следующая теорема, в которой появляется уравнение Винера — Хопфа, предоставляет необходимые и достаточные условия того, что х (Л 10 является решением задачи фильтрации. (6.41) Теорема (уравнение Винера —Хопфа). Пусть x^ro^x^-^aiio. Тогда ft (t\| /) является решением задачи фильтрации тогда и толь- ко тогда, когда (6.42) £{х(Л10°[г(<т)-2(т)]} = 0 для всех о иг, to^-x < о или, что то же, тогда и только тогда, когда t ~^о (6.43) COV [х (/j), z (or) — Z (т)] — COV A(tb s)dz(s), z(or) — z(t) =0 при всех aux, to-^x < a Доказательство. Пусть x*—некоторый элемент пространства Я* — = Я, а Х(х*)—пространство всевозможных вещественных случай- ных величин вида (х*, х(-)), где х(-) e£2(Q, Я). Скалярное произ- ведение в Х(х*) имеет вид Е{{х*, х(-)) • (х*, у (•))}. Обозначим через t/(x*) подпространство пространства Х(х*), порождаемое элемен- тами вида а {х\ — J B(tb s)dz(s)), a^tt to где функция интегрируема1). Согласно известной лемме об ортогональных проекциях (см., например, Данфорд, Шварц [1958]), x(tx\t) является решением J) Заметим, что U(x*) есть подпространство пространства Х(х*), порождае- мое элементами вида ^х*, J С s)dz (s)^, где C(fbs) интегрируема, так как интегрируемость B(/i,.s), /0 s а, гарантирует, что C(/b s) = B(tb s){ о 5 а, и что C(/1,s)=0! a<s^tt так что также интегрируема.
122 3 Основы теории оптимального управление задачи фильтрации тогда и только тогда, когда ортогонально U(x*) относительно структуры Х(х*) при произвольном выборе х*. Другими словами, £ (ЛЮ является решением задачи фильтрации тогда и только тогда, когда при всех х* £{<х-,х(ЛЮ)<х-, z/(a))} = 0, где (6.44) у(а)= j B(tlt s)dz(s), a^t. <0 Предположим теперь, что соотношение (6.42) выполняется. За- метим, что, согласно уравнению (6.6), Е {<х‘, х (Л 10) « у (а))} = х*Е (х (Л Ю°у (а)} х. Однако у {а) из этого уравнения задается формулой (6.44). По- этому, если — ступенчатая функция, то Е (х (Л Ю о у (а)} = {х (Л Ю о Bj [z (а,) - z (т7)]} = Но отсюда (например, согласно неравенству Гёльдера) при любом у (а), удовлетворяющем соотношению (6.44), сразу находим, что £{£(Л|0 0 У (о)} = 0, и, следовательно, при всех х* имеем х*Е {х (01 00 У (я)} х = 0. Таким образом, х (Л 10 есть решение задачи фильтрации. Но, с другой стороны, предположим, что х(Л|0 является реше- нием задачи фильтрации. Предположим затем, что соотношение (6.42) не имеет места, так что (6.45) Е (х (Л Ю ° [z (а) — z (т)]} = cov [х (011), z (а) — z (т)] Ф 0 при некоторых а и т, /о<Ст<ст^А Если определить B(tits), по- ложив 0, s < т, cov [х (01 0, z (ст) — г (т)], т s ст, 0, «>ст, В(0, s) = то B(t\,s) интегрируема и t y(t) — J В (fa, s) dz (s) = cov [x (01t), z (ст) - z (r)] • [z (ст) - z (t)]. *0
3.6 Фильтр Калмаиа—Бюси 123 Отсюда получаем (6.46) Е{(х\ х (tМ{х\у (/)>} = •*x*E{x(t\\t)°y(t)}x~ = х*Е {х (ti 11) о cov [х (ti | f), z(p) — z (т)] [z (о) — z (т)]} х == = х*cov[х(t]1t), z(a) — z(т)]cov[x1t), z(a)—z(t)]*x. Однако, согласно соотношению (6.45), правая часть уравнения (6.46) при некотором х не обращается в нуль, что приводит к про- тиворечию. Таким образом, теорема (6.41) доказана. Теоремой (6.41) и некоторыми свойствами корреляционных ма- триц можно воспользоваться для того, чтобы найти сразу урав- нение, решающее задачу фильтрации. Этим мы и займемся, начав с нескольких лемм. (6.47) Тогда (6.48) и (6.49) Лемма. Пусть Ф($) и T(s) принадлежат 1?(Т,9?(Н,Н)). ' t t cov J Ф (s) dw (s), J (s) dwi (s) = 0 -ti fo “ t t cov J Ф (s) dw (s), J W (s) dw (s) = J Ф (s) 1FW* (s) ds. -ti ti t t. Эта лемма очень просто получается из леммы (6.17) и доказана в работе Фалба [1967]. (6.50) Лемма. Предположим, что cov[t2>(Z), х(/о)] = 0 при всех t и что K(t,s) интегрируемо по dw(s). Тогда (6.5.1) где (6.52) t cov J К. (t, s) dw (s), z(a) — z (t) = -fo a = J к a, s)W • q*(s) B* (s)fp*g(s) ds, ti cr Фо (s) = J C (a) Ф (a, s) da, s a Ф (•> •) является переходным отображением системы из тео- Рвмы (6.30).
124 3 Основы теории оптимального управления Доказательство. Прежде всего заметим, что о о z (а) — z (т) = J С (s) х (s) ds + J r (s) dwx (s) = T T ff Г 5 "Iff = J C (s) Ф (s, t0) x0 + J Ф (t0, a) В (a) q (a) dw (a) ds + J r (s) dwi (s). T L f0 J T Но так как cov[w(Z)> *o] = 0, необходимо, согласно уравнению (6.48), чтобы cov t J (t, s) dw (s), z (or) - z (t) = f t ff Г $ 1 == cov 11 К (/, s) dw (s), j C (s) | Ф (s, a) В (a) q (a) dw (a) I ds 40 t Lf0 J и, следовательно, задавая C(s) следующим образом: (6.53) мы получаем, что cov t J К (Л s) dw (s), z (a) — z (т) t г t t » cov 11 /С (f, s) dw (s), J J C (s) Ф (s, a) ds 4o h La В (a) q (a) dw (a) где замена порядка интегрирования оправдывается подходящей разновидностью теоремы Фубини (Данфорд, Шварц [1958], Дуб [1953], Фалб [1967]). Теперь из уравнения (6.49) и (6.53) следует, что cov K.(t, s)dw (s), z(<j) — z(x) ff = //<C(^ s)Wq4s)B^s)^a(s)ds, t> а это доказывает нашу лемму. Пусть теперь a(t) и b(t) —два случайных процесса, у которых cov[a— h(/) («неслучайная» функция). Тогда естествен-
3.6 Фильтр Калмана—Бюси 125 но предположить, что если h(t) существует, то 4cov[a(0, = Это позволило бы нам доказать следующий результат. (6.54) Следствие. Если K.(t,s) непрерывно дифференцируема по t, то для a <t имеем (6.55) d dF cov К. (t, s) dw (s), z (or) — z (r) = cov dK (t, s) dt dw (s), z (or) — z (r) (6.56) Следствие. Предположим, что cov[a»i (/), лг0] = О для всех t. Тогда при о <t имеем (6.57) cov [х (0, z (ст) — z (т)] = cov [Я (0 х (t), z (or) — z (т)]. Доказательство. Для доказательства нужно положить K(t,s) = = Ф(/, s)B(s)q(s) и воспользоваться следствием (6.54). Предположим далее, что cov [о>(/), х0] = 0 и что cov [o»i(0. *о] = 0. В этом случае справедливо следующее утверждение. (6.58) Лемма. Пусть L(t,s) интегрируема по dz(s). Тогда (6.59) где (6.60) . t cov j L(t, s)dz(s), z (or) — z(t) = -to a (s) q (s) Wq* (s) B* (s) <p'a (s) ds + to a + | Lit. s)r(s)Wxr'(s)ds + т t (T +1 L (t, s) C (s) Ф (s, tQ) ds cov [x0> *o] J Ф* (s, t0) C* (s) ds, t %!>(*, s)= J L(t, Ь)С(Ь)Ф(Ь, s)db, s ° <Pa(s) задается формулой (6.52).
126 3 Основы теории оптимального управления Доказательство. Отметим, что S t t i J L (/, s) dz (s) = j L (/, s) C (s) x (s) ds + J* L (t, s) r (s) dw{ (s) == to to = j L (/, s) C (s) Ф (s, tQ) Xq + j Ф (s, a) В (a) q (a) dw (a) ds + to L t + J L(t, s)r (s) dw} (s). to to Теперь с помощью соотношения (6.48) о «независимости» Хо от w и Wi и соответствующей теоремы Фубини (Фалб [1967]) мы можем доказать, что t cov J L (t, s) dz (s), z (a) — z (x) = -t, t J ф (t, s) В (s) q (s) dw (s), z (<r) — z (r) + -t^ = cov + JL(/, s) г (s) Wf* (s) ds + т t (У + J L (t, s') C (s) Ф (s, /0) ds cov [x0, x0] J Ф* (s, /0) C* (s) ds. tn т После этого остается только воспользоваться леммой (6.50). (6.61) Следствие. Если L(t,s) непрерывно дифференцируема по t, то для с <Zt имеем (6.62) 4 cov — COV t J L (t, s) dz (s), z (or) — z (t) = to ' t I it, s) dz (s), z (or) - z (t) + “to + cov[£(/, t)C(f)x(f), z(or) —z(t)]. Доказательство этого следствия выполняется простыми выклад- ками, и мы оставляем их читателю. Все эти леммы и следствия подводят нас к следующей теореме.
3.6 Фильтр Калмана—Бюси 127 (6.63) Теорема. Пусть для задачи фильтрации существует реше- ние вида t (6.64) £(t\t)=$L(t, s)dz(s), t о где L (t, s) непрерывно дифференцируема no t. Тогда1) для справедливо соотношение (6.65) (t, s) = A (t) L (t, s) — L (t, t) C (0 L (t, s). Доказательство. Поскольку £(t\t) представляет собой решение задачи фильтрации, согласно уравнению (6.43), имеем cov [х (0, z (о) - z (х)] яв cov t J L (t, s) dz (s), z (a) — z (x) . Li, В соответствии с уравнениями (6.57), (6.62) и (6.43) находим i cov A (t) J L (t, s) dz (s), z (<t) — z (t) = = cov - t J ~(t, s)dz(s), z(o)-z(x) + -fo t + cov L (t, t) C(f) J L (t, s) dz (s), z(o) — z (x) , или, что то же, covf/^(OZ.(f,s)-^a, s)- h - L (t, t) C (0 L (t, з)] dz (s), z (o) - z (x)} = 0. (6.66) Полагая Д(/, s) — A(t)L(t, s)-^(t, s) — L(t, t)C(t)L(t, s), мы заметим, ,что, согласно уравнению (6.66), функция / [L(t, s) + N(t, s)]dz(s) = Q(t\t) ’) Отметим, что одновременно предполагается положительная определен* кость Rtf) =rtf)Wtr*tf).
128 3 Основы теории оптимального управления также удовлетворяет уравнению (6.43) и, следовательно, также является оптимальной оценкой. В силу известной леммы об орто- гональных проекциях при любых х* имеем Е{(х\ /)•—х(/|/))2} = о. Другими словами, для всех х справедливо соотношение t t J A(f, s)dz(s), | А(/, s)dz(s) x = 0. *-£q to X COV Ho ' t t cov j Д (Л s) dz (s), J Д (/, s) dz (s) = t t J A (t, s) C (s) x (s) ds, J A (/, s) C (s) x (s) ds + -to to Lfo = cov t + J Д(/, s)R(s)k*(t, s)ds. to А так как R(s) является положительно определенным при всех х, мы сразу убеждаемся в том, что k(t,s) =0. (6.67) Следствие. В условиях теоремы х (/) *) удовлетворяет сто- хастическому дифференциальному уравнению (6.68) dt = [А(0 — K{t)C(01 хdt + К(0 С (t)х (t)dt + R(t)г (t)dwt, где K(t)~L (t, f). Доказательство. Известно, что t t t t (!) = J L (!, s) dz (s) = j L (i, s) C (s) x (s) ds + j L (t, s) r is) dwt (s). f, t, tn Однако ясно, что t j[A(s)-R(s)C(s)]xis)ds = t s = j [A (s) — К (s) C ($)] J L (s, a) C (a) x (a) da ds + to to t s + | [A (s) — K. (s) C (s)J J L (s, a) r (a) dwx (a) ds. to to J) Для простоты мы пишем здесь £(/) вместо
3.6 Фильтр Калмана— Бюси 129 Согласно различным вариантам теоремы Фубини (Данфорд, Шварц [1958], Дуб [1953], Фалб [1967]), имеем i s J [Л ($) — К. (s) С (s)] J L (s, а) С (а) х (а) da ds = to . to t ( t 3 = j I j [Л (s) — К (s) C (s)] L (s, a) ds 1 C (a) x (a) da, to 'a ' t s J [Л (s) — K. (s) C (s)] J L (s, a) r (a) dw{ (a) ds == *• t ( t ta to "a и, следовательно, с учетом уравнения (6.66) находим t t J [4(s)-tf(s)C(s)]je(s)ds = / tn to ^(S,d)ds -a dz (a) = t = J [L (t, a) — L (a, a)] dz (a) = ‘° = jf(0- f K(s)dz. to Отсюда сразу следует справедливость доказываемого следствия. (6.69) Следствие. В условиях теоремы (6.63) x(t) удовлетворяет стохастическому дифференциальному уравнению (6.70) dx = [Л (р -K(t)C (0] Xdt + B(t)q (0 dw - К (0 г (t) dwx. Следствия (6.67) и (6.69) составляют основное содержание ра- боты Калмана и Бюси [1961]. Продолжая наши рассуждения, мы могли бы получить и остальные результаты (подробности можно найти в работе Фалба [1967]). В качестве типичного примера приве- дем еще одну теорему. (6.71) Теорема. Предположим, что условия теоремы (6.63) выпол- нены. Тогда (6.72) К(0 = Р(0С’(0^-1(0, где P(t) является решением уравнения типа Риккати (6.73) Р - А (/) Р + РА* (0 - PC (t) Р-1 (t) C(t)P + B (/) Q (0 В* (t) с начальными условиями P(t0) = Ро = cov [x0, х0]. 5 Зак. 693
130 3 Основы теории оптимального управления Доказательство. Пусть S у ($) = | С (а) х (a) da. t„ Тогда путем простых выкладок, предоставляемых читателю, можно убедиться, что при о < t имеет место соотношение (6.74) '57cov ~ У = “ [ф (Л to) - ф (Л *о)] Р<№ (®> to) С* (о) + t + J [ф (Л S) - ф (t, $)] В (s) Q (s) В* (s) Ф* (t0, s) ds<D* (a, t0) C* (a) - = L(f, <т)Я(с), где ф (t, s) определяется согласно уравнению (6.60). В силу нашего основного предположения все члены правой части соотношения (6.74) представляют собой непрерывные функции <т. Поэтому, пе- реходя к пределу при мы увидим, что соотношение (6.72) действительно выполняется и что (6.75) ?(/) = { [Ф (/, /0) - Ф (Л /о)] Ро + + J [ф (Л S) - ф (/, $)] В (s) Q (з) В* (s) Ф‘ (f0) S) ds Ф* (t, t0). to ' Ясно, что P(to) = PQ. Читателю остается только продифференциро- вать уравнение (6.75) по t и получить искомое уравнение (6.73) (заметим, что уравнениями (6.65) и (6.72) часто пользуются при расчетах). При выполнении условий теоремы (6.63) оптимальный фильтр можно рассматривать и как оптимальный регулятор динамической системы, «дуальной» стохастической системе (6.36) и (6.37), в ко- торой время обращено, исходные преобразования заменены сопря- женными, а помехи — неслучайными функциями. Несколько при- меров подобного рода разобраны в работе Калмана и Бюси [1961], а детальное исследование предпринято Фалбом в работах [1967 и 1968а] (см. также § 2.6).
4 Необходимые условия оптимальности В этой главе мы рассмотрим необходимые условия оптимальности, аналогичные известным уравнениям Эйлера в вариационном исчислении (§4.1), изучим принцип максимума Понтрягина (§4.2). приведем одну простую теорему существования оптимальных управ- лений (§ 4.3) и сделаем несколько общих замечаний относительно необходимых условий для более широкого класса задач. В § 4.2 мы воспользуемся методами теории возмущений и убедимся, что га- мильтонианы опять играют центральную роль. Как мы увидим в -гл. 5, принцип максимума Понтрягина, существенно усиливающий необходимые условия оптимальности в случае конечномерной ди- намической системы, оказывается очень полезным и в задачах кон- кретного проектирования систем управления. Простая теорема су- ществования, приведенная в § 4.3, основывается на понятиях до- стижимости и нижней полунепрерывности. В § 4.4 дано сжатое представление о различных изящных и весьма мощных обобще- ниях принципа максимума, принадлежащих Халкину [1967], Ней- штадту [1966, 1967] и Кенону, Каллуму и Полаку [1967] (см. также приложение А). 4.1 Необходимые условия оптимальности Предположим, что S есть гладкая динамическая система и что f (х, и, I) представляет собой производящую функцию системы S. Станем предполагать, что само X является некоторым банаховым пространством и что й есть некоторое открытое подмножество в пространстве всевозможных простых функций из (Ti, Т2) в &и- За- фиксируем на время tQ из (Л, Т2), х0 из X и й(«) из й. Обозначим через .£(•) траекторию системы S, соответствующую управлению й(-) и начинающуюся в точке х0 в момент времени t0. Другими словами, x{t) = <р(/; to, Хо, #(•))• Пусть |е| >0 таково, что сфера £(#(•), |е|)сг й, и пусть ft0eS(O(.), 1), так что й(•) + e,h(•)е й. Обозначив через хй(«) траекторию системы S, соответствующую управлению й(-) + е/г(-), мы заметим, что (1.1) Пт||хй(0-Х(0Н = 0 5*
132 4 Необходимые условия оптимальности равномерно по t, поскольку переходная функция системы S пред- полагается непрерывней по всем своим аргументам. Итак, t xh (0 = *о + / f (*л (т), й (т) + еЛ (?), ?) dr, to i х (t) = Xo + j f U W> d (?), ?) dr, to так что t (1.2) xh (0 - £ (0 = J [f U* (?), й (?) + eh (?), t) - f (x (?), й (?), ?)] dr. to Если теперь предположить, что f непрерывно дифференцируема *) по х и и, то можно записать2), что f (хд (т), й (?) + eh (?), г) - f (X (т), й (?), ?) = = "S' L “ х + 1)й |л г1г + 0 т)’ где.о(е, ?) более высокого порядка по е, чем первый, т. е. lim ||°(е’ т)| -0 е-»о е равномерно по т. Однако, согласно уравнению (1.2), t (1.3) хЛ (0 - * (0 = f |Л [Xh (т) - X (т)] + |л eh (т)}dr + ^0 t + J о (е, т) dr, to и, следовательно, в силу соотношения (1.1) I J О (8, т) dx равномерно по t. Более того, опираясь на соотношение (1.1), мож- но утверждать, что (1.4) xh (t) - к (/) = е\|) (0 + о (в, 0, !) На самом деле достаточно простоты производных. 2) Чертой с нижним индексом Д помечены величины, вычисляемые вдоль траектории (^(/), й(/),Л. Напомним также, что df/dx & X)t а df/du^g^X),
4.1 Необходимые условия оптимальности 133 где о(е, t) имеет более высокий порядок, чем е, и равномерно по t. (Внимание} Обозначения о (б), о(е, i) и т. п. используются лишь для того, чтобы указать порядок соответствующих членов, и по- этому, например, нельзя предполагать, что о из уравнения (1.4) и о(е, т) из уравнения (1.3) одинаковы.) Из (1.4) имеем t t еф(0 + о(е, /) = 8 J [-^|ЛФ(*) + -^|ЛЛ(т)рт+ j о(8, x)dx. ^0 Отсюда после деления на 8 и перехода к пределу при е->0 мы получим, что (1.5) = + МО, ^(^о) = О. at дх д ди д Линейное уравнение (1.5) называется уравнением возмущенного движения относительно эталонной траектории •£(•)• Для удобства мы часто будем писать вместо уравнения (1.4), что *л(-) = *(-) + И>(-) + о(в), и обычно будем опускать подробные исследования возможности тех или иных манипуляций с о(е). Вернемся к задаче управления. Предположим на время, что це- левое множество для этой задачи имеет вид {Л} X X, где фикси- ровано. В связи с этим мы будем предполагать, что функционал качества конечного состояния зависит только от х. Кроме того, мы потребуем, чтобы К была непрерывно дифференцируемой, a L непрерывно .дифференцируемой’) по х и и. В этом случае непре- рывно дифференцируем по х и и и гамильтониан системы. В част- ности, поскольку Н (х, Z, и, t) = L (х, ы, t) + (Z, f (х, и, t)) (напомним, что согласно обозначениям, введенным в гл. 3, \X,f(x, и, t)} обозначает действие ХеХ* на f(x,u,t), а не скаляр- ное произведение), мы имеем дН __ dL , дх дх "Г \ дх) Л’ ди ~ ди '\ди) м Если же рассматривать X как часть X**, то получаем дН ,. ’) Здесь также достаточно считать производные простыми, так как все вьь кладки можно выполнить в интегральной форме.
134 4 Необходимые условия оптимальности Заметим, что так как норма сопряженного преобразования для ограниченного линейного преобразования совпадает с нормой са- мого преобразования (Данфорд, Шварц [1958]), отображения (х, «, 0 -> (х, и, t), (х, и, (х, и, О будут непрерывными (или простыми). (1.6) Лемма. Пусть й(«) принадлежит Й, а й(-) + e/i(-) описывает возмущение &(•). Тогда J (t0, х0, й + е/г) — J (t0, х0, й) = е J (4^- |д, h (х)) dx +о (е). ^0 Доказательство. Так как К дифференцируема, а дЩдх непрерывна, линейное дифференциальное уравнение (1-7) имеет единственное решение %(/), удовлетворяющее граничному условию (1.8) Х(О = ^-(^(О). Назовем Х(-) котраёкторией *), соответствующей .£(•) и й(*). Но так как и Хь(-), и £(•) являются траекториями нашей системы, имеем t\ f [<Ш, Ш(т), й(т), т)>-<Цт), -^> = 0, to j W, f (xh (т), й (г) + е/г (т), т)> - (х (т), dx^)] dx = О, to и, следовательно, ty ‘ J (to, х0, й + 8/1) = (xft (tj)) + J Н (xh (О, Л (0, й (/) + eh (/), t) dt + to + J<A(O, xh(t))dt, to ti J (to, x0, й) = К(* (ti)) + / H (jf (t), £ (t), й (t), t) dt + J (I (t), X (t)) dt. to to *) Доводы в пользу такой терминологии приводятся ниже.
4.1 Необходимые условия оптимальности 135 Воспользуемся теперь интегрированием по частям (Данфорд, Шварц [1958]): / (А (0> xh (/)) dt = (Л (Л), xh (Л)> - (Zo), хА (/0)) - J (к (0, xh (0) dt, to *0 J <X(O, k(t))dt = (k(tl), jeft))-#^), *(/o)>- f <M0, X(t))dt. to to Используя эти уравнения, а также уравнение возмущенного дви- жения и свойство непрерывной дифференцируемости К и Н, легко показать, что Z (f0, х0> й + ей) — J (f0, х0, й) == - ' (* и )• *('.)) +«/ « |Л •h«)dt - to t\ t\ -8 J Ia ’ dt-e,(k (*i)> Фi)> -8 / <£(0» t (0) dt + о (в). *. i, А так как %(•) удовлетворяет уравнениям (1.7) и (1.8), это и дока- зывает лемму. (1.9) Следствие. Если и°(-) является оптимальным управлением, то при всех /[(•) eS(0M, 1) (и тем более при всех ограниченных Доказательство. Если управление ы°(«) оптимально, то J(/0, х0, и0 + ей) - J(t0, х0, и°) = е. J |fl, h (t)) dt + o (e) >0. *9 Поскольку e может быть как положительным, так и отрицатель- ным, членом о(е) можно пренебречь, что и доказывает следствие. При доказательстве леммы (1.6) нам пришлось ввести новый термин — «котраекторию». По сути дела он описывает решение дифференциального уравнения в X*, являющегося «сопряженным» относительно уравнения возмущенного движения (1.5). Определим это новое понятие более строго.
136 4 Необходимые условия оптимальности (1.10) Определение. Если м(-) принадлежит й, а х (•) является траекторией системы S, соответствующей управлению #(•), то ре- шение дифференциального уравнения (в X*) называется котраекторией (или сопряженной траекторией), соот- ветствующей .£(•) и й(’). В согласии с этой терминологией мы будем часто называть эле- менты X* «косостояниями» системы, а аргумент Л. гамильтониана Н(х, X, и, I) — сопряженной переменной. Докажем теперь важную лемму. (1.11) Лемма. Пусть V — некоторое банахово пространство, а »(•) —некоторая простая функция из [£<>, Л] в V*, такая, что (а) и непрерывна справа (т. е. t»(/+)= v(t)), (b) J (v (t), k (t)) dt = 0 для всех простых отображений A) A(.):[/o,*i]-> V. Тогда v{-) — 0 на [/0,6]. Доказательство. Пусть т принадлежит [^о, Л], и пусть о(т)=#0. Тогда найдется такой элемент k множества v, что <о(т), k)>6>0 для некоторого д. Отображение <р(-): [^о> 6)->R, определенное со- гласно уравнению ф(0 = <о(0, k), является простым и непрерывным справа. Но отсюда заключаем, что найдется такое е > 0, что ф(0>б>0 при t из [т, т + е). Пусть теперь f 0, t ф. Гт, т + в), = /€=[?, т + е). Тогда k(-) простое и f, г+в j (у (t), k (0) dt = J (y (t), k) dt^&t>> 0. t. t Но это противоречит условию (b), и, следовательно, о(т) =0 при любых т из |7о>6), что и доказывает утверждение леммы. Эта лемма вместе со следствием (1.9) приводит к следующей теореме.
4.2 Принцип максимума Понтрягина 137 (1.12) Теорема. Предположим, что пространство &и рефлексивно (в частности, что пространство гильбертово) и что управление и°(-) является оптимальным. Тогда (а) существует косостояние №(•), соответствующее х°(-) и «”(•); (Ь) уравнение (х°( •), Л°( •), м°( •), •) = 0 выполняется почти всюду на [/о, М- Таким образом, необходимое условие оптимальности управле- ния состоит в том, чтобы у гамильтониана имелся экстремум, при- чем и в том случае, когда его вычисляют вдоль оптимальной траек- тории системы и соответствующим образом подобранной котраек- тории системы. Предположим теперь, что целевое множество задачи имеет вид {Л} X {-Vi}, где Л и Xi фиксированы, и что К — 0, т. е. функционал качества конечного состояния нулевой. Тогда можно попытаться найти непрерывно дифференцируемую функцию R (х), обладающую тем свойством, что задача с целевым множеством {Л} X X и функ- ционалом качества конечного состояния К была бы эквивалентной исходной в том смысле, что управление одной из них оказывается оптимальным тогда и только тогда, когда оно оптимально и для другой. Если такое К существует, то можно воспользоваться по- следней теоремой. Другой подход опирается на попытку показать, что в подходящей окрестности оптимального управления и°(-) най- дется «достаточно» возмущений для того, чтобы действительно обеспечить минимизацию гамильтониана как функции и. Именно этот последний подход и был использован Л. С. Понтрягиным, В. Г. Болтянским, Р. В. Гамкрелидзе и Е. Ф. Мищенко [1961] в их доказательстве принципа максимума. Некоторые из возникающих при этом вопросов станут яснее в следующем параграфе. Здесь же отметим, что если целевое множество S произвольно, а и°(-) есть оптимальное управление, преобразующее (t0, х0) в S с моментом первого достижения t\, то управление и°(-) является оптимальным и для задачи с целевым множеством (М X (x°(/i)} и нулевым функционалом качества конечного состояния, так что тре- буемые необходимые условия оптимальности для общего случая можно получить и при таком подходе. Интересные общие резуль- таты были недавно получены Гамкрелидзе [1965], Нейштадтом [1965, 1966, 1967], Халкином [1967] и Кеноном, Каллумом и Пола- ком [1967] (см. также приложение А). 4.2 Принцип максимума Понтрягина Сосредоточим теперь наше внимание на необходимых условиях оптимальности решения задачи управления конечномерных дина- мических систем. Относительно рассматриваемых в этом пара- графе систем S будем предполагать следующее.
138 4 Необходимые условия оптимальности 1. Область определения (Tb Tj) представляет собой всю веще- ственную ось R. 2. Пространство состояний X системы 2 совпадает с Rn. 3. Пространство значений входных воздействий U является не- которым подмножеством Rm, причем т^п. 4. Пространство управляющих .воздействий Й образовано мно- жеством всевозможных простых функций из R в U. 5. Уравнение системы S имеет следующий вид: x(t) = f(x(t), u(t)) (т. е. система автономна), где и)еС(КпХ U) ‘)> I, 1=1, •••» п, ил I если обозначить компоненты векторов /их через fi, ...» fn и X]...хп соответственно. Кроме того, станем предполагать, что показатель качества траектории L имеет вид L (х, и) (т. е. не зависит от t) и что Л(х, u), ^-(х, u)eC(R„X t7). Заметим, что при этом не делается никаких предположений о дифференцируемости fi и L по и. Будем рассматривать лишь две следующие задачи управления, которые в дальнейшем называются задачей 1 и задачей 2. Задача 1. Показатель качества конечного состояния не назна- чается (т. е. /С^О), а целевое множество S имеет вид R X {xij, где Xi фиксировано. Задача 2. Показатель качества конечного состояния не назна- чается (KsO), а целевое множество S имеет вид R X S, где S — либо некоторое гладкое ^-мерное многообразие2) из Rn, либо все Rn. Хотя все эти ограничения с первого взгляда и кажутся силь- ными, с помощью подходящей замены переменных многие интерес- ные задачи удается свести к рассматриваемым здесь случаям. На- пример, пусть нам нужно решить нестационарную задачу, т. е. производящая функция нашей системы имеет вид / (х, и, /), a L также зависит от t, L = L (х, и, I). Тогда можно ввести новую пере- менную состояния хп+ь изменение которой описывается уравне- ') Через C(Rn X U) обозначается множество всевозможных непрерывных вещественных функций, определенных в R„ X U, где U есть замыкание U. 2) Гладким ^-мерным многообразием Rn называется такое подмножество OcR„, что G = {х: gi(x) = 0, i = 1, ..., п — k}, где gt(y) и (dgt/dXj) (х) не- прерывны, а градиенты ^xgt{x) линейно независимы, если y^G при i = 1, ..., п — k и
4.2 Принцип максимума Понтрягина 139 нием яп+1(0 = 1, и рассматривать систему в Rn+i с производящей функцией g(x, хп+ь и) вида gt(x, хп+\, и) = fi(x, и, xn+i), i = 1, ... ..., п, a gn+i (х, xn+i, и) = 1, и показатель качества траектории М (х, xn+I, u) = L (х, и, хп+1). (Дополнительные сведения относительно такой замены перемен- ных можно найти в книгах Атанса и Фалба [1966] и Понтрягина, Болтянского, Гамкрелидзе и Мищенко [1961]. Отметим также, что Прежде чем предлагать строгую формулировку принципа Пон- трягина, попытаемся найти для задачи 1 интуитивно понятную гео- метрическую интерпретацию. Полагая Z = R X Rn = Rn+i и обо- значая координаты типичного z из Z через Zo, .... zn, мы сможем рассматривать систему (2 П zo(O = £(Zi(O, • ••, z„(0, «1(0, •••, ««(0), M0 = fr(Zi(0, •••, z„(0, «1(0, •••> ««(О)- Если теперь положить £ = (0, х0) (т. е. £0 = 0 и = Хо, < для i = 1....п), то задачу 1 можно сформулировать в следующем виде: определить управление и(-) из Q, преобразующее (ifo, 5) в 0 X I, где I — прямая Zi = Xi, j, i — 1, .... n, таким образом, что- бы координата Zo была минимальной (рис. 4.1). Аналогичная гео- метрическая интерпретация возможна и для задачи 2, но в этом
140 4 Необходимые условия оптимальности случае прямую I нужно заменить множеством {z: (zi, ..., zn) eS}. Таким образом, сформулированные выше задачи управления мож- но рассматривать как задачи для другой системы Si (описываю- щейся уравнениями (2.1)), для которой все траектории безраз- личны (1 = 0), а показатель качества конечного состояния имеет простой вид K(z) = Zq. Как мы увидим ниже, такая точка зрения оказывается очень плодотворной. Подведем теперь промежуточный итог. (2.2) Лемма. Пусть Si есть динамическая система с областью опре- деления R, пространством состояний Rn+i, пространством управ- ляющих воздействий Q и уравнениями динамики (2.1). Пусть (fo, z) принадлежит пространству событий системы Si, г — (0, х0), и пусть Si cz R X Rn+i имеет вид R х R X S, где S равно либо {xj, либо S. Пусть Ki(z) = г0 при любых z из Rn+i, и пусть L\ = 0. Обозначим через Рх соответствующую задачу управления для системы Si. То- гда управление и°(-) оптимально для Pi относительно (to,z) тогда и только тогда, когда м°(-) оптимально для Р относительно (to,xo) (где через Р обозначена соответствующая задача управления для S). Доказательство этой леммы предоставляем читателю. Гамильтониан задачи Pi имеет следующий вид1): п Hi (z, А, и) = (х, и) + 5 ^ifi (•*> «)> i = 1 где z = (zo, х). Функционал Hi (z, X, и) будем называть гамильто- нианом исходной задачи. Полагая р= (Xi, ..., Хп) и замечая, что Hi(z, X, и) не зависит от z0, мы будем часто заменять ЯДгД, и) на Н (х, р, и, %0) = hL (х, и) + (р, f (х, и)}, и, сознательно допуская определенную некорректность, называть Н гамильтонианом исходной задачи. (2.3) Определение. Система 2п-го порядка обыкновенных диффе- ренциальных уравнений (2.4) х = (х, р, и, %о) = f (х, и), (2.5) Р = - (*’ р> и’ ---------~ (S’) (х’ р называется канонической (или гамильтоновой) системой. Если и(-)ейи хи(-) есть соответствующее решение уравнения (2.5), то любое решение уравнения (2.5) называется соответствующим и(*) и Ао (можно сравнить с определением (1.10)). 9 Заметим, что, поскольку R* + 1« Rn+1, можно считать, что А = (Ао, Аь... ,. . , Ап) принадлежит Rn+i-
4.2 Принцип максимума Понтрягина 141 Отметим, что уравнение (2.4) как исходное уравнение системы не зависит от р и Хо и что уравнение (2.5) линейно относительно р. (2.6) Теорема (принцип Понтрягина для задачи 1). Если и°(-)^й есть оптимальное управление для задачи 1, то найдутся такие не- отрицательная постоянная Ло(х°^О) и функция р°(-), что (а) р°(-) соответствует м° (-) и Хо! (Ь) для H(x°(t), р° (0, и, Хо) существует абсолютный минимум по и из U, достигаемый в точке и = u°(t) для t из [/0, Л]1), где 6 есть момент первого достижения, соответствующий и°(-); (с) при Л] имеем H(x°(f), p°(t), u°(f), Х®) = 0. (2.7) Теорема (принцип Понтрягина для задачи 2). Если управле- ние и°(-) оптимально для задачи 2, то найдутся такие неотрица- тельная постоянная Хо^О и функция р°(-), что (а) р°(*) соответствует и°(-) и Х“; (Ь) для я(х°(0, р°(0, ы> A-о) существует абсолютный минимум по и из U, достигаемый в точке и — u°(t) для t из [/о, Л], еде Л есть момент первого достижения, соответствующий ы°(«); (с) при t е [/о, 6] имеем Н (х° (t), р° (t), и° (t), Хо) = 0; (d) p°(/i) = 0, если S = Rn и p°(ti) ортогонально2) S в точке x°(tx), если 3 есть некоторое гладкое k-мерное многообразие из Rn. Приведем теперь эвристическое доказательство теоремы (2.6). Исчерпывающее доказательство можно найти у Халкина [1963а] или Понтрягина, Болтянского, Гамкрелидзе и Мищенко [1961]. «Доказательство» теоремы (2.6). Для простоты изложения мы станем рассматривать задачу Р\ в Rn+i. Таким образом, станем рассматривать систему , z0 (0 = L (zI (t).....z„ (0, Щ (/), ..., um (0) - g0 (z (/), и (/)), z/(Z) = f/(z1(O, ..., zn(t), ux(t), um(t)) = gi(z(t), u(t)), которая часто записывается в виде z(t) = g(z(t), u(t)). Предположим, что управление м°(«) оптимально относительно (t0, &), где z = (0,Хо), и что tx есть момент первого достижения, соответствующий управлению и°(-). Кроме того, предположим, что «“(•) непрерывно слева (т. е. что u°(t—) = u°(t))3). !) Это нужно понимать как утверждение о почти всех точках этого про- межутка. 2) Вместо этого часто говорят, что р°(6) «трансверсально» 5. 3) Это не приведет к потере общности, поскольку каждое допустимое упра- вление почти всюду эквивалентно некоторому непрерывному слева.
142 4 Необходимые условия оптимальности Построим теперь подходящее множество л возмущений управ- ления «<>(•). Пусть 8 > 0, и пусть а и b принадлежат R, причем Если те (to, /i] hwsU, то управление «(•; а, Ъ, т, со), опре- деляемое соотношениями и (t; а, Ь, т, со) = <о, f е(т- &Ь, т], ы° (/), t ф (т — гЬ, т], t е [/, t\ + ва], а^О, «°(/), t&(r — гЬ, т], i^[t, fj, а>0, t е [/b + еа], а>0, называется фундаментальным возмущением управления и°(-).Если а = 0, то это возмущение называется пространственным, а если Ь = 0, то — временным (см. Атанс, Фалб [1966]). Заметим, что фун- даментальное возмущение обладает тем свойством, что соответ- ствующее решение z(-; а, Ь, т, и) уравнения (2.8), вычисленное в точке (6 + еа), удовлетворяет соотношению z(/]+8z; а, Ь, т, <a) = z°(Z1) + s|[a; b, т, со] + о(е), где £[а; Ь, т, <в] не зависит от 8. Теперь если Т представляет собой некоторое множество воз- мущений «(•;«) управления «°(0, зависящих от параметра а, то мы будем говорить, что Y полно, если z (t{ + еа; а) = зР (/0 + 8| [а] + о (е), и если в Ч*' найдется возмущение, соответствующее g [ci«i + с2аг] для сь с2 0, здесь g[a] не зависит от в. Обозначим через л полное множество возмущений (с параметром а), содержащих все фунда- ментальные возмущения. Множество векторов £, соответствующих элементам л, образует выпуклый конус С, который можно считать поставленным в соответствие z°(Zi). Более того, каждый элемент С порождается некоторым элементом л. (Эти два последних утвер- ждения, принимаемых здесь на веру, и составляют основу строгого доказательства.) Если £= (—1, 0, .... 0), то можно утверждать, что £ не при- надлежит внутренности конуса С. Действительно, если бы $ при- надлежало внутренности конуса С, то, полагая м(-) равным тому элементу л, который соответствует £, мы получили бы, что (2.9) z0 = zg(Zj) — в + о(в), zt = xu + o(s), i=l, ...,п, где через z обозначена точка из Rn+i, в которую и (•) преобразует %. «Уточняя» соотношения (2.9), мы сможем найти такое возмущение «*(•), что z*<z®(ZI), z* = Xj р i=l, ..., п, а это противоречит оптимальности управления а°(-) (процесс «уточнения» соотноше-
4.2 Принцип максимума Понтрягина 143 ний (2.9) составляет другое тонкое, но принципиально важное место строгого доказательства). Поскольку не принадлёжит внутренности конуса С, найдется некоторая гиперплоскость Л с нормалью Х°=(Ло, Л? (Л), ..., К°п (ti)), разделяющая £ и С. Другими словами, найдется такое Х°, что для всех | из С имеет место (Л°, £)<0, (Х°, g) >0. Ясно, что Обозначим через р°(-) решение уравнения (2.5), соответствующее «“(♦) и Ло и обладающее тем свойством, что р°(Л) = U?(Л), ... ..., (<i)). Атак как уравнение (2.5) линейно, то такое р°(-) вполне определено. Предположим затем, что «(•; О, Ь, т, со) является пространствен- ным возмущением управления и°(*). Тогда z (т; О, Ь, т, <о) = z° (т) + е [g (z° (т), <») — g (z° (т), м° (т))] + о (в). Если обозначить через g(/) решение уравнения возмущенного дви- жения (т. е. уравнения i = относительно оптимальной траектории, удовлетворяющего условиям 1 £(t) = £(z°(t), »)-^(z°(t), м°(т)), то z (^; О, Ь, т, ®) = z° (tj) + eg (/]) + о (в). А так как g(/i), равное g[0; &, т, <в], принадлежит С, имеем <4 g(/i))>0. Однако уравнение для g(f) является сопряженным1) относительно уравнения для (До, р°(0), и, следовательно, <(4 р°(т)), g (т)>> о, или п (z° W’ ®) + 2 P°i (т) gt (z° (т), со) > п > ^oSo (z° <т)> “° W) + 2 p°i (-г) gt (z° (т), и° (т)). Таким образом, нам удалось установить справедливость утвержде- ний (а) и (Ь) теоремы (2.6). !) Это означает, что, полагая %°(0s(^o> Р°(0), мы получаем уравнение Е.-аь. \ м2 10/ QZ |q
144 4 Необходимые условия оптимальности Что же касается утверждения (с), то в том случае, когда и(-; а, 0, т, со) является временным возмущением управления м°(-), имеем На; 0, т, ®] = ag(z°(f1), u°(tx))<=C, так что а<Л°, Я(г°(^), м° (*!)))>(). Но а может быть любым элементом из R, и, следовательно, утвер- ждение (с) выполняется в точке tx. Предположим теперь, что H°(t) определяется соотношением Я°(0 = <М, p°(f)), g(z°(t), «°(f))>. Если (t2, f3]c:[fo, fi] и u°(f) непрерывно на (t2, f3], то в силу усло- вия (Ь) мы имеем <(й Р° W), g (z° (т), и° (<т))> - Н° (а) > Я0 (т) - Я0 (а) > >Я°(т)-((Ло, р°(а)), г(г°(а), и° (?))), a, tg(/2, /3]. Однако функция <(Хо, р° (f)), g (z° (f), u° (а))> = <р (f) дифференцируема на (t2, /3] и ф(0 =0. Отсюда находим Я°(т) = Я°(ог), и, следовательно, Я°(-) постоянно на (t2, f3]. С другой стороны, если ti есть точка разрыва для а°(-) и если т = ti + б, где б достаточно мало, то из соотношения Я°(т)> Я°(/4) следовало бы, что <W>, Р°(/4), g(z\ti), и°(т))><Я°04) (что противоречит утверждению (Ь)), а из соотношения Я°(т) < < Я0 (ti) получилось бы, что <(4 р0(т)), g(Z°(T), и»)><Я°(т) (а это вновь противоречит (Ь)). Таким образом, Я°(/4) = Я°(/4+), и, следовательно, H°(t) = H°(tx) =0 при всех t из [fo.fi]. Тем са- мым мы доказали утверждение (с). На этом наше эвристическое доказательство теоремы (2.6) заканчивается (мы еще раз подчер- киваем, что его нельзя считать (строгим) доказательством). В завершение этого параграфа сделаем несколько замечаний относительно принципа Понтрягина. В следующем параграфе мы рассмотрим некоторые обобщения этого принципа, а в следующей
4.3 Теорема существования 145 главе обсудим, как его можно использовать для проектирования систем управления. (2.10) Замечание. Теорема (2.6) по сути дела формулирует необ- ходимые условия локальной оптимальности, аналогичные условиям обращения в нуль производных в обычных задачах на экстремум. (2.11) Замечание. У канонической системы решения существуют вдоль любой траектории, а не только вдоль оптимальных или экс- тремальных. (2.12) Замечание. Легко видеть, что минимизацию гамильтониана (теорема 2.6b)) можно рассматривать как сведение задачи мини- мизации функционала к обычной задаче минимизации. Практиче- ская важность этого шага очевидна. (2.13) Замечание. Выводы теоремы (2.6) не зависят от вида целе- вого множества S, и единственное различие между теоремами (2.6) и (2.7) проявляется в условиях трансверсальности (d) из теоремы (2.7). Это условие можно рассматривать как дополнительное, не- обходимое для того, чтобы обеспечить единственность решения ка- нонической системы. Этого вопроса мы еще раз коснемся в сле- дующей главе. (2.14) Замечание. Предположим, что наша задача не вырождена в том смысле, что для нее Хо ¥= 0. Тогда без какой-либо потери общности из-за линейности по р°(-) так называемого уравнения косостояния (2.5) можно сразу положить, что Х®=1. Все задачи синтеза, рассматриваемые ниже, не вырождены, и мы будем без дальнейших оговорок полагать в них, что Хо = 1. (2.15) Замечание. Если вместо функции Н рассматривать функ- цию Й(х, р, и, Хо), где Н(х, р, и, Хо) = Хо£(х, «) —(р, f(x, и)}, то единственное изменение в результатах состояло бы в замене слова «минимум» на «максимум» в утверждении (Ь) теоремы (2.6). Понтрягин рассматривал именно Й и пришел к своему принципу максимума, в то время как наш результат правильнее было бы на- зывать принципом минимума. 4.3 Теорема существования Рассмотрим теперь вопрос о существовании оптимального управ- ления. Начнем с обсуждения понятия достижимости, а затем по- кажем, как это понятие связано с вопросом о существовании опти- мального управления. Предположим вновь, что речь идет отладкой
146 4 Необходимые условия оптимальности динамической системе S и что £2 представляет собой множество управляющих воздействий для S. (3.1) Определение. Пусть (to,Xo) есть некоторый заданный элемент пространства событий (Ti,T2)xX. Тогда событие (/i,Xi), где <1 to, называется достижимым из (to, Хо) относительно £2, если найдется такое «(•) е £2, что xi = t(*i; tQ, Хо, «(•)). Множество A (to, х0, £2) = {(Л, Х]): (Л,Х1) достижимо из (to, х0) от- носительно £2} называется множеством достижимости относительно to, Хо и £2. Сечение *) множества A (to, х0, £2) в точке Л, обозначаемое через A (tr, to, х0, £2), называется множеством достижимости в точ- ке t\ относительно t0, х0 и £2. Легко видеть, что если рассматривать задачу управления с це- левым множеством S и множеством допустимых управлений Г, то условие S Л A (t0, х0, Г) 0 является необходимым для существо- вания оптимального управления относительно (to, х0) и Г. Без ка- кой-либо потери общности можно предположить, что критерий качества определяется лишь показателем качества конечного со- стояния K(t,x) 2). Тогда легко прийти к следующей теореме. (3.2) Теорема. Предположим, что S Л A (t0, х0, Г) =£ 0 и что суще- ствует такая топология (не обязательно индуцируемая тихоновской топологией (Т\,Т2) Х.Х), что SDA (/о, х0, Г) компактно, а функция K(t,x) полунепрерывна снизу3). Тогда оптимальное управление относительно (to, Хо) и Г существует. Эта теорема сразу получается из того факта, что у полунепре- рывных снизу вещественных функций, определенных на компакт- ном множестве, существует минимум (Роте [1948]). Но так как показатели качества для большинства задач управ- ления являются достаточно гладкими (т. е. по крайней мере полу- непрерывными снизу), естественно сосредоточить внимание на свойствах пересечения SCIA (t0, х0, £2) и множества А(/о, х0, £2). Раз- личные полезные результаты, особенно касающиеся замыкания А (/о, Хо, £2) и A (t\ to, Хо, £2), можно найти в работах Фалба [1964], Халкина [1963b] и Роксина [1962]. Два из этих результатов можно использовать для того, чтобы установить существование оптималь- ного управления для примера из § 5.1. >) Если Л Л Пи Т2) XX и Л есть проектор (Ti, Т2) X X на (Ть Т2), то л-1(<1) П А = {(/>,х): (6,х) называется сечением А в точке it. г) Если показатель качества траектории отличен от нуля, то нужно было бы добавить новую переменную, например х, для которой х = £(х(/),«(/),t). 3) Напомним, что функция К называется полунепрерывной снизу в точке (?, .£), если для е > 0 найдется такое б > 0, что || (/, х) — (?, X) ||<б К (t, х) < <К(?, Х) + в.
4.3 Теорема существования 147 Пусть наше пространство состояния имеет вид X = R X X, и предположим, что х = (ф, X). Пусть, далее, наше целевое множе- ство S имеет вид {^} X R X S (т. е. является «цилиндром» с обра- зующей, «параллельной» оси 1|э), и показатель качества имеет пре- дельно простой вид К(х) = ф. В этом случае мы придем к сле- дующей довольно очевидной лемме. (3.3) Лемма. Обозначим через А (ф; t0, х0, й) сечение множества А (6; t0, Хо, й), рассматриваемого как подмножество пространства X, в точке ф. Предположим, что если 3(ф) = ЗГ1Л (ф;/0, *о, &), то существует такое ф°, что S (ф) = 0 для -ф < ф° и S (ф0) =# 0- Тогда оптимальное управление ы°(-) существует, и качество управления и°(-) равно ф°. Доказтельство. Поскольку 3(ф°)¥=0, найдется ы°(-), преобра- зующее (t0, хо) в S и такое, что его качество равно ф°. Но с другой стороны, если и1 (•) преобразует (to, х0) в S и его качество равно ф1, то 3(ф1)У=0, и, следовательно, ф’^-ф0. Из этой леммы сразу получается следующая теорема. (3.4) Теорема. Предположим, что (a) S компактно-, (Ь) А (ф; t0, х0, £2) замкнуто при любых ф; (с) 4(ф1; to, Хо, й) = Р) А (ф;7о, х0, й) при любых ф1; - Ф>Ф1 (d) существует такое ф, что при любых ф < ф имеем 3(ф) =0 (т. е. качество ограничено снизу)-, (е) существует управление, преобразующее (to, х0) в S (и, сле- довательно, качество ограничено сверху). Тогда оптимальное управление существует. Доказтельство. Обозначим inf {ф: 5(ф) =#0} через ф°. Существо- вание ф° гарантируется условиями (d) и (е). Мы утверждаем те- перь, что 3(ф°).=#0. Для того чтобы убедиться в этом, выберем некоторую монотонно убывающую последовательность ф,, i = 1, 2, ..., сходящуюся к ф°. В этом случае 5(ф»)¥=0, i= 1,2, ..., и поэтому из каждого из таких множеств £(ф«) можно выбрать не- который элемент A, i = 1, 2.....Но так как^еЗ для любых i, последовательность {xj содержит некоторую подпоследователь- ности сходящуюся к х°, принадлежащему 3. Однако условие (с) гарантирует, что А (ф, t0, х0, й) с А (ф'; t0, х0, й) каждый раз, когда ф<ф', и, следовательно, io s А (ф; to, х0, й) при всех ф > ф°. Но отсюда находим соотношение х° е Л (ф°; t0, х0, й) = f) Л (ф, t0, х0, Q), Ф>Ф°
148 4 Необходимые условия оптимальности которое в силу предыдущей леммы и доказывает утверждение тео- ремы. Следующий типичный результат для конечномерных динами- ческих систем принадлежит Роксину [1962]. (3.5) Теорема. Рассмотрим конечномерную динамическую систему с производящей функцией f(x,u,t). Предположим, что (a) U компактно-, (b) f интегрируема по t при каждом (х, u) sX X U', (с) f липшицева по х, т. е. найдется такая постоянная С > О, что при любых (t,u) eUxU имеем Ilf (*1, и, t)-f(x2, и, t) IK C|| Xi~x2 II; (d) f(x, U, t) выпукла при любых (t, x) eRX X; (e) ||f(x, u, Z)|Km(Z)ft(||x||), где m(t) интегрируема, a h(-) ограничена и при ||x||-»-oo имеет такой же порядок, что и ||х||. Тогда A(t0,x0,ii) замкнуто. Доказательство этой теоремы основано на свойстве слабой то- пологии в L\ и может быть найдено в работе Роксина [1962]. Этой теоремой мы воспользуемся в § 5.1, чтобы показать суще- ствование оптимального управления для рассматриваемой там за- дачи. В общем случае важная задача существования оптимальных управлений оказывается весьма сложной, и наши теоремы дают лишь слабое представление о возникающих там трудностях. 4.4 Замечания о необходимых условиях оптимальности в задачах управления Мы уже отмечали (§ 3.3), что задачи управления можно пред- ставлять себе как частный случай проблемы минимизации веще- ственного функционала, определенного на некотором подмноже- стве нормированного линейного пространства. Если же с этой об- щей точки зрения рассматривать необходимые условия оптималь- ности, упомянутые выше, то все они оказываются аналогичными в том смысле, что для всех них центральным является вопрос о существовании некоторого линейного функционала, порождаю- щего соответствующее неравенство. Например, в принципе макси- мума приходится доказывать существование такого косостояния (Ло, р° (•)), что при всех u^.U имеет место Я(х°, р°, и°, А$<Я(х°, р°, и, Ло). Более того, как мы убедились в § 4.2, это доказательство основы- валось на возможности найти такой линейный функционал на Rn+i (т. е. такой (n + 1)-мерный вектор), который отделяет луч, идущий в направлении убывающего качества, от некоторого выпук-
4.4 Замечания о необходимых условиях оптимальности 149 лого конуса; этот конус порожден особыми возмущениями, аппро- ксимирующими множество изменений, вызванных любыми вариа- циями управляющих воздействий. Все эти идеи допускают значи- тельное обобщение (см. Кенон, Каллум и Полак [1967], Халкин [1967], Нейштадт [1966, 1967]. Здесь мы лишь вкратце затронем некоторые аспекты этих обобщений. Мы будем рассматривать следующую основную задачу оптими- зации1). (4.1) Задача. Пусть Р и Q — нормированные линейные простран- ства; £2 — некоторое подмножество пространства Р\ л — выпуклое подмножество пространства Q; f — отображение Р в R, a g — ото- бражение Р в Q. Требуется определить такое р по Р, что р е £2, g(p)(=a и f(PXf(p), если рей и g(p)<=a. Другими словами (если говорить не совсем строго), мы ищем на £2 минимум f при ограничении, требующем, чтобы g принадлежало л. Элемент р множества £2/на котором достигается этот минимум, ниже будет называться оптимальным. Необходимое условие опти- мальности, полученное Кеноном, Каллумом и Полаком [1967], Хал- кином [1967] и Нейштадтом [1966, 1967], грубо говоря, имеет сле- дующий вид. Если р оптимально, если существует подходящее при- ближение М к £2 в точке р и если существует подходящее прибли- жение h для отображения (/(•)>£0): P->RX Q, то найдется та- кое отличное от нуля Ze(R X У)*, которое разделяет h(M) и р = {(&, л): &<0, леП}. Естественно, что основная трудность состоит в определении по- нятия «подходящее приближение». В том случае, когда Р = Rn, Q = Rm, П = {0}, a f и g непрерывно дифференцируемы (Кенон, Каллум, Полак [1967]), в качестве h можно выбрать просто якобиан отображения (f, g): Rn -> Rm+ь так что (f(p + Sp), g(p + dp)) = (f(p), g(p)) + h(p)f>p + о(||брII), a M удовлетворяет следующему условию: если dp1, ..., t>ph суть линейно независимые элементы из М, то найдется такое в > 0 и та- кое непрерывное отображение £ выпуклой оболочки2) {р, р + + е6р', ..., р + е6рк} в £2, что 1(р + др) = р + бр + о(||6р||). Доказательство различных результатов, касающихся необходи- мых условий оптимальности, всегда зависит от свойств выпуклых !) Дальнейшие обобщения потребовали бы привлечения понятий, выходящих за рамки этой книги. 2) Выпуклой оболочкой {р, р + е др1, ..., р + 8 др*} называется множество k всех таких р, что p-rQp + r{ (^ + едр1)+ ... +rk (p + ebpk), где 2rzss!sl и i=0 Ъ 0, i = 0, 1, ..., k (Атанс, Фалб [1966] или Данфорд, Шварц [1958]).
150 4 Необходимые условия оптимальности множеств и теоремы Брауэра о неподвижной точке. Дополнитель- ные подробности читатель найдет в работах, ссылки на которые приведены выше (см. также приложение А). ПРИЛОЖЕНИЕ 4.А Необходимые условия оптимальности В этом параграфе мы познакомимся с общими результатами относительно необходимых условий оптимальности, полученными Кеноном, Каллумом и Полаком [1967, Халкином [1967] и Нейштад- том [1966, 1967]. Наше изложение основывается на работе Фалба и Полака [1968], для понимания нижеследующего материала от чи- тателя требуются довольно глубокие математические познания. Предположим, что X есть локально выпуклое вещественное то- пологическое векторное пространство. Рассмотрим задачу мини- мизации вещественной функции f на некотором подмножестве Q множества X при выполнении конечномерных ограничений вида g(x) = 0. Для того чтобы получить для этой задачи необходимые условия минимальности, потребуется ввести понятие приближения (аппроксимации). (А.1) Определение. Пусть f есть отображение из X в R, a g— из X в Rm- Выпуклый конус А (£, Q) cz X называется приближением множества Й в точке х относительно fug, если найдутся (i) неко- торый непрерывный линейный функционал /'(£), определенный на X, и (ii) некоторое непрерывное линейное преобразование g'(£) из X в Rm, которые удовлетворяют следующим условиям: Для любого конечного множества {6хь ..., 6x4 линейно неза- висимых элементов А (х, Q) найдутся (а) такое ei > 0; (b) такое непрерывное отображение ф множества, сопряжен- ного относительно {ei6xi, ..., 816x4, в — {£} (где ф может зави- сеть ОТ 81 и {dxi, ..., 6xft}) и (с) такие непрерывные отображения О/ и og пространства X в R и Rm соответственно, что (А.2) lim | or (е 6х) \/е = 0, lim || og (б 6х) ||/в = 0 е->0 е->0 равномерно по 6х (где 6х — элемент множества, сопряженного мно- жеству {6X1.....6x4, т. е. 6x<={6xb .... 6x4*), f (х + ф (б 6х) ) = f (х) + ef' (х) 6х + Of (е 6х), (А.З) £ (£ + ф (б 6х)) = g (X) + eg' (£) 6х + og (б 6х) при любых бх из указанного множества и 0<e <ei.
4.А Необходимые условия оптимальности 151 Необходимо отметить следующее. Пусть f и g дифференцируемы в точке х, и пусть С (jC, й) является «линеаризацией й в точке Я» (т. е. С (х, й) представляет собой выпуклый конус, содержащийся в X, для которого выполняются условия, аналогичные условиям (а) и (Ъ) из определения (А.1)). Тогда С(ДЙ) также является и приближением й в точке х относительно fug. Отметим также, что если записать g в виде g(x) = (gi(x), .... gm(x)), то некоторые компоненты g'i (х) можно заменить выпуклыми (а не линейными) функционалами, а определение по-прежнему будет содержатель- ным (Халкин [1967], Нейштадт [1966, 1967]). Это обобщение потре- бует заменить основную лемму из теории необходимых условий оптимальности более сильной. Другой путь обобщения состоит в замене пространства Rm произвольным нормированным линейным пространством. Однако в этом случае приходится также требовать, чтобы некоторые (относительные) внутренние точки конуса С(х) = {(Г(х)бх, g'ttybx): 6хеА(Д Й)}, лежащего в R®£ (прямой сумме R и Е), содержались в наимень- шем замкнутом подпространстве пространства R®£, содержащем конус С{£). Это обобщение не требует никаких принципиальных изменений. Располагая теперь подходящим понятием приближения, мы в состоянии приступить к выяснению необходимых условий оптималь- ности. В дальнейшем рассматривается следующая задача. Задача. Пусть X есть некоторое локально выпуклое топологи- ческое векторное пространство', f и g — отображения X в R и Rm соответственно, а й — некоторое подмножество пространства X. Обозначим через Xg такое подмножество пространства X, что Xg — {х: g(x) = 0}. Требуется определить такое х° из Xg П й, что f(x°) -Cf (х) при всех хе ХйЛй. Решение х° этой задачи будем называть оптимальным эле- ментом. (А.4) Лемма. Если х° есть оптимальный элемент и если А (х°, й) есть приближение й в точке х° относительно f и g, то существует такой не равный тождественно нулю линейный функционал р, опре- деленный на R ф Rw, что p[(f'(x°)6x, g'(*°)6x)] -<0 при любых бх из замыкания А (х°, й) множества А (х°, й), т. е. найдется такой ненулевой вектор р = (р0, Pi, • • • > Pm) из R ф Rm, что (А.5) {р, (Г (хо) 6х, g' (х°) Sx)> < 0 при всех 6х из А(х0, й). Доказательство. (Дакуна, Полак [1967]). Это доказательство, кото- рое мы только наметим здесь, опирается на теорему разделения
152 4 Необходимые условия оптимальности выпуклых множеств (Данфорд, Шварц [1958]) и теорему Брауэра о неподвижной точке (Дьедонне [I960]). Пусть х° есть требуемый оптимальный элемент, а С(х°) есть конус {(Л(х°)бх, g'(x°)6x): 6х^А(х°, Q)}czR®Rm. Но так как А(х°, й) представляет собой выпуклый конус, а отображения f'(x°) и g'(x°) линейны, конус С(х°) тоже должен быть выпуклым. Обо- значим через р открытый луч в R ф Rm вида (А.6) р = {(«/0, 0, .... 0): у0 < 0}. Заметим, что р можно рассматривать как выпуклый конус. Мы утверждаем, что С (х°) и р разделяются в пространстве R ф Rm- Если последнее утверждение верно, то найдется такой отлич- ный от нуля вектор Р = (ро, Pi, •••. Рт) из R ф Rm, что для всех бх из А (х°, й) будет* (А.7) {р, (f'Wx, /(х°)бх)><0 и для всех у из р будет (А.8) (р, р)>0. В силу непрерывности f'(x°) и g'(x°) из неравенств (А.7) и (А.8) будет следовать утверждение леммы. Поэтому предположим, что С(х°) и р неразделимы. Тогда С(х°)Пр не пусто, и найдется такое 6xi из А(х°, Й), что (А.9) Г(х°)бх1<0 и ^(х0) 5X1 = 0. Более того, g'(x°)A (х°, й) = Rm, т. е. содержит 0 как внутреннюю точку (в противном случае должен существовать вектор вида (0, q), q4= b, разделяющий С(х°) и р). Отсюда следует, что существует такой симплекс [zi, z2, .... zm+i]czRm, содержащий 0 в качестве внутренней точки, что [z„ .... zm+I] с: g'(х°) А (х°, Q), т. е. zt = g' (х°) 6хг, где ' Sxz е А (х°, й) для 1=1, 2, ..., т + 1; (А. 11) ф (бх) <= (Q — {х°}) при всех б х е {бхь ..., 6xm+ J*, где ф — отображение из определения А (х°, й); (А.12) f'(x°)f>Xi<0, /=1, 2, ...» т+1; (А. 13) {z2 — zb .... zm+i— zj является базисом для RTO. Существование симплекса [zi........zTO+i], удовлетворяющего условиям (А.10), (А.11) и (A.I2), нетрудно установить см. (Дакуна, Полак [1967]). Условие же (А.13) выполняется для любого симп- лекса, а так как zj — Zi, j = 2, ..., tn + 1, образует базис для R,n,
4.А Необходимые условия оптимальности 153 линейное отображение L: Rm->X можно определить, положив, что (А.14) L (Zj — Zj) = i>Xj — бхр / = 2, ..., tn + 1. Если z = 2rfzz +(1 — Sr/)Zi принадлежит симплексу [zb ..., zro+J, то положим, что (A.15) <p(z) = L(z — zj + t>Xj = Sr/6-*:i + (1 — 2}г/)бХ/. Легко видеть, что <р представляет собой непрерывное отображение симплекса в {6X1, ..., 6xm+i}*. Затем для 0 < а -С 1 определим непрерывное отображение из a[zi....zTO+i] в Rm следующим образом: (А. 16) ha (az) = — g (х° + ф (a [L (z — zj + 6xJ)) + az. Но в соответствии co свойствами приближения имеем (А. 17) ha (az) = — og (aL (z — zO + a 6x0 и (A. 18) og(aL (z — Zi) + adxj ea[zj,-,.zm+l] при всех a, 0 < a ao, и некотором ao. Более того, поскольку f'(x°)6x{ <0, i = 1, ..., tn + 1, и A(x°, Q) является приближением, справедливо также, что (А. 19) f(x° + ^(aL(z — z1) + a6xI))<f(x°) при всех а, 0 < а -^аь и некотором ai. Обозначая min{ao, aj через 0, мы с помощью теоремы Брауэра о неподвижной точке (Дьедонне [I960]) устанавливаем существо- вание такого элемента zp из 0[zi, ..., zm+l], что /tp(0zp) = 0zp. Но в таком случае из соотношения (А. 16) следует, что если х = х° + ф (L (zp — 0z,) — ₽ 6x0, то g(x) =0, хей (так как х —х°еф[{6Х1, .... 6xm+i}*) с <= Й— {х0}) и f(x) <f(x°), согласно соотношению (А.19). Но это противоречит оптимальности х°, и, следовательно, наша лемма до- казана. Мы воспользуемся этой леммой для того, чтобы получить прин- цип максимума. В связи с этим мы займемся теперь задачей опти- мального управления и покажем, как нужно изменить ее форму- лировку, чтобы можно было использовать лемму (А.4). Итак, рас- смотрим систему, описываемую дифференциальным уравнением (А .20) x = f(x,u), /<=[Z0, ZJ, где x(/)sR„ есть состояние системы, u(t) sRm есть векторное управляющее воздействие, а f отображает Rn X Rm в Rn.
154 4 Необходимые условия оптимальности Предположим, что (А.21) и (0 е Uc Rn при (почти) всех t, (А.22) и(-) измеримо и существенно ограничено, (А.23) f(x,u) непрерывна на (RmXt7), (А.24) f(x, и) непрерывно дифференцируема по х. Предположим, что начальное многообразие состоит из един- ственной точки %о (т. е. х(/о) = х0) и что конечное многообразие определяется некоторой функцией h из Rn в RP, принадлежащей классу С1 и такой, что (А.25) dh/dx имеет максимальный ранг. Другими словами, конечное многообразие Si определяется следую- щим образом: (А.26) Sr={x: Л(х) = 0}, и многообразие Si гладкое. Кроме того, потребуем, чтобы функ- ционал качества определял лишь качество траекторий L (х, и), где L отображает Rn X Rm в R и непрерывно по х и «, а также непре- рывно дифференцируемо по х. Таким образом, функционал каче- ства управления н(-) имеет следующий вид: t, (А.27) J (и (•)) = / L (х„ (0, и (/)) dt, <0 где хи (t) — решение уравнения (А.20) при начальных условиях (хо, to), соответствующее управлению «(•); здесь предполагается, что м(-) переводит систему из состояния х0 в состояние, принадле- жащее Si (т. е. хм(/1) eSi). В этих предположениях поставленная выше задача может быть сформулирована следующим образом: определить управление u(t) (где u(t)eU при всех t) и соответ- ствующее решение xu(t) уравнения (А.20), такие, что xu(to) = х°, xu(ti) eS], а функционал J(u(-)) минимален. Попытаемся теперь перефразировать эту задачу так, чтобы воз- никла возможность использования леммы (А.4). Прежде всего по- грузим эту задачу в расширенное пространство состояний Rn+i. Другими словами, станем обозначать через у типичный элемент из Rn+i, причем (А.28) у = (xq, х), х Ra, через F обозначим отображение Rn+i X Rm в Rn+i, задающееся условием (А.29) F (у, и) «= (L (х, и), f (х, и)),
4.А Необходимые условия оптимальности 155 и будем рассматривать дифференциальное уравнение (А.ЗО) y — F(y,u) с начальным условием (А.31) г/Ко) = Уо = (0, х0) и конечным многообразием R X Si. Теперь мы можем поставить задачу об определении такого управления u(t) (где u(t) <= U при любых /) и соответствующем решении yu(t) уравнения (А.ЗО), что уМ = Уо, i/u(6)^RXSi и yQ(t\) (=/(«(•))) минимально. Ясно, что эта задача эквивалентна исходной. Заметим затем, что решения уи(-) уравнения (А.ЗО) абсолютно непрерывны на промежутке Ко, Л]. Обозначим через £2 множество всевозможных абсолютно непрерывных функций уи(-), удовлетво- ряющих уравнению (А.30) и условию (А.31) для некоторого и(-), удовлетворяющего условию (А.22). Прежде чем определять ото- бражения f и g, введем некоторое локально выпуклое линейное топологическое пространство X, содержащее Q. Для этого обозна- чим через С[/о, М нормированное линейное пространство непрерыв- ных функций */(-), определенных на промежутке [/о, Л] и принимаю- щих значения в Rn+i, с нормой U(.)H= sup Ш(011). f,] Обозначим через ‘U множество всех принимающих значения из Rn+i и определенных на Ко, Л] функций z(-), для которых найдется такая последовательность хД-) из СКо, Л], что (А.32) xh гК)<Х/+1, /К) Для всех t, i — 0, .... n, j=l, .... где Xjti есть i-я компонента последовательности X;, а (А.ЗЗ) lim = /->ОО при всех? из Ко, ^1]. Заметим, что <2/ =П^, где есть множество полунепрерывных сверху вещественных функций t, определенных на промежутке Ко, Л]. Обозначая °U — <U через X, мы легко убе- димся в том, что пространство X линейно. Определим на X топо- логию, выбрав в качестве подбазы семейство множеств (А.34) {z(.):zK)e<^, где t есть некоторая точка из Ко, М а О есть некоторое открытое множество из R^+i1). Пространство X локально выпуклое тополо- гическое и линейное с нормой, согласующейся с этой топологией, и й с: X. Обозначим затем через f и g такие отображения, что (А.35) f(z(-)) = z0K1), (А.36) g(z(-)) = A(z1K1)....z„Kf)), Ч Такая топология называется поточечной,
156 4 Необходимые условия оптимальности где через гг(-), i = О, п, обозначена i-я компонента для z(*). Ясно, что оба эти отображения непрерывны. Обозначим через уа(-) некоторый элемент из Q и построим приближение А (уй, Q) пространства Q в точке уй относительно f и g. Пусть / с [/о, Л] есть множество регулярных точек й, т. е. /е/ тогда и только тогда, когда t0 < t < и условие (А.37) lim ILQr'W7) = i справедливо для каждой окрестности N точки й-1 (/) и каждого подинтервала J с. I, где t^J (здесь у. есть лебегова мера на У)1). Заметим, что ц(/) =6 — /о = Ц ([6ъ 6]) • Обозначим через Ф(/, т) переходную матрицу линейного дифференциального уравнения (А.38) = й^У- Другими словами, Ф (t, т) является решением матричного диффе- ренциального уравнения (А.39) = удовлетворяющим условию (АЛО) Ф (/,/) = !, где I — единичная матрица размера (п + 1) X (« + 1). Если se/ и we U, то обозначим через 6ys>u решение уравнения (А.38), удо- влетворяющее условию (А.41) 6^ a(S) = F(^(s), u)-F^s), Й($)), а через dzSiU обозначим такой элемент X, что (0 t0 < t < s; (А.42) 6Zs,“(0 = l^s,u(0. Наконец, пусть (A.43) А (уй, Q) — {dz: dz = Sat bz^ , si <^I, U, az > 0}. Определим линейные отображения f' (уй) и g'(ya), положив (АЛ4) r(^)Sz = 6z0(/1), (А.45) g' (уй) dz = -g- (dz, (/,),..., dz„ (t,)) (dz, (/,),..., dzn a,)), 9 Важность регулярных точек объясняется следующим. Если т есть регу- лярная точка управления «(•), а функция g(t,u) непрерывна, то интеграл т+Ье J g(t, и (0) dt = 8 (b - a) g (т, и (т)) + о (е),где a, b е R, а 8 достаточно мало, т+<?е
4.А Необходимые условия оптимальности 157 где через 6z0, 6zb ..., 6zn обозначены компоненты для Sz. Осново- полагающая работа Понтрягина [1961] содержит доказательство того, что выпуклый конус А (уа, й) действительно является при- ближением пространства й в точке уй относительно fug. Для того чтобы дать представления о характере этого доказательства, по- строим отображение ф для случая двух линейно независимых век- торов 6zi и 6z2 конуса А(уй,О). Можно предполагать (изменив порядок нумерации и вставляя нули, если необходимо), что k (А.46) бг< = у? при i=l, 2 и что Si s2. .-Сsft. Заметим тогда, что бге e{6zb6z2}* гарантирует, что (А.47) Лг = X] SZ] + Х26z2 = 2 (Xi, Хг)6г5 /=i >' ’ где Xi + Х2 = 1, Xi'^0, i = 1, 2, и (А.48) Ы} (Хр Х2) = Х,а} + Х2ау для / = 1, ..., k. Ясно, что множество {dZf,dz2}* гомеоморфно мно- жеству Л = {(Xb Х2): X] + Х2 = 1, Х/> 0}. Пусть е > 0 есть некото- рое малое положительное число, и пусть ,д Д(Л = (-(б/у+ ... +6/Д sf = sk, ' V/ I -(6//+ ...+dQ, s,= ... =sr<sr+1 Рассмотрим полуоткрытые промежутки Ij вида (А.50) Sy + evy < / + e(vy+ S/y)} и предположим, что e достаточно мало для того, чтобы /у не пере- секались. Определим возмущение u(t) управления 4(f), положив ,АСП /А (А.61) u(t) = ( tlI 11» Обозначим через t/(f;e, ХЬХ2) решение уравнения (АЛО), удовле- творяющее начальному условию (А.41) с управлением u(t). Легко видеть, что управление u(f) допустимо и что y(t;e, Xi,X2) зависит от X] и Х2, так как d/у зависит от Xi и Х2. Используя теперь извест- ное свойство зависимости решения дифференциального уравнения от параметров (см., например, Дьедонне [I960]), мы можем уста- новить, что y(t; в, Хь Х2) является непрерывной функцией е, Xi и Х2. Но тогда непрерывно и отображение ф множества {edzi, e6z2}* в Q — {уй}, удовлетворяющее условию (А.52) ф (е dz) = у (t; е, Хр Х2) - (/).
158 4 Необходимые условия оптимальности Доказательство тогр, что лр обладает и остальными нужными свой- ствами, опирается на свойства регулярных точек и некоторые из- вестные результаты теории дифференциальных уравнений. С под- робностями этого доказательства можно ознакомиться по книге Понтрягина, Болтянского, Гамкрелидзе и Мищенко [1961]. Воспользовавшись теперь леммой (А.4), мы получим следую- щую теорему Понтрягина. (А.53) Теорема (принцип максимума). Если ы°(-) есть оптималь- ное управление, а х°(-)—соответствующая оптимальная траекто- рия, то существует векторная функция р(-), вектор Х(Л) из Rp и число ро^-0, такие, что выполняются следующие условия-. (а) р0 и p(t) не равны тождественно нулю-, (Ь) х°(-), Ро и р(‘) удовлетворяют канонической системе диффе- ренциальных уравнений (А.54) x°(0 = f(x°(0, «°(0), (А.55) р (0 = —g- (х° (0, (0) ро - g- (х° (/), и° (/))' р (П; (с) u°(t) максимизирует гамильтониан (А.56) p0L (х° (0, «° (0) + <Р (0, f (*° (0. «° (0)) > ^paL(xQ(t), u) + {p(t), f(x°(t), м)> относительно всевозможных и, принадлежащих U при всех t\ (d) р(Л) трансверсально Si в точке x°(/i), т. е. (А.57) р(^) = ^-(х°(Л))Х(О. Как уже отмечалось ранее, более общий вариант этой теоремы, учитывающий (например) ограничения в пространстве состояний, был доказан Нейштадтом [1966, 1967] и Халкином [1967].
5 Конструирование систем управления Рассмотрим теперь, каким образом теоретические соображения из предыдущей главы можно использовать для конструирования систем управления. Начнем с изучения простой задачи оптималь- ного по быстродействию управления объектом, который описывается двумя интегралами. Затем, в § 5.2, мы воспользуемся принципом Понтрягина (или необходимыми условиями оптимальности), чтобы найти оптимальное управление для задачи общего вида. А так как «практическое» решение большинства задач управления требует использования вычислительных методов, остаток этой главы мы и посвятим этим методам, как прямым, так и косвенным. 5.1 Один простой пример Рассмотрим динамическую систему (1.1) *1(0 = *г(0. *2(0 = «(0> у которой на управление наложено следующее ограничение: | и (01 1 для всех t. Целевое множество S для этой задачи имеет вид R X {(0,0)}, так что это задача со свободным конечным моментом времени и фик- сированным конечным состоянием. Предположим, что качество конечного состояния не оценивается (К = 0) и что показатель ка- чества траектории имеет следующий вид: L(x, и)= 1. Таким образом, задача состоит в нахождении допустимого управ- ления, преобразующего произвольное заданное начальное состоя- ние (ti, |2) в начало координат (0,0) за минимальное время1). Убедимся прежде всего в том, что решение этой задачи суще- ствует. В справедливости этого утверждения нам поможет убе- диться теорема (3.5) гл. 4, позволяющая установить, что множе- ство А (0,(|1, ga). й) замкнуто; здесь Й— множество допустимых управлений. Заметим еще, что рассматриваемая система полностью управляема относительно й, и, следовательно, t X (0,0) принад- ’) Это так называемая задача оптимального быстродействия для объекта из двух интеграторов. А так как система линейна и автономна, можно считать, что начальный момент времени to равен нулю.
160 5 Конструирование систем управления лежит А (0, (^1, 52), Q) при некотором t > 0. Но если рассматривать задачу с целевым множеством 8 = [0, ?] X {(0,0)} и функционалом качества t, то такая задача имеет решение, поскольку множество 8 П А (0, (51, 5г) > й) компактно. Тем более имеет решение и исход- ная задача на оптимальное быстродействие. Установив существо- вание оптимального управления, сосредоточим внимание на после- довательной процедуре его построения. Шаг 1. Определение Я-минимального управления. Гамильто- ниан для этой задачи имеет вид Н (х, р, и) = 1 + Х2Р1 + ир2- Если х2, Pi и р2 заданы и р2 ¥= 0, то минимум Н как функции и для и е U = {v: | v 14^ 1} достигается при условии, что и — —sgn{p2). Поэтому Я-минимальное управление и°(х, р) имеет следующий вид: и°(х, р)=- sgnfpj (при условии, что pz ¥=0). Заметим, что Н не вполне регулярно. Шаг 2. Интегрирование канонических уравнений. Рассмотрим систему уравнений Х1 (0 = Х2 (0, Х2 (0 = - sgn {р2 (0), । Pi(O = o, p2(0 = -pi(0, с граничными условиями xi (0) — £1» х2(0) = 52, Х1(Г) = 0, х2(Г) = 0, где через t* обозначен неизвестный конечный момент времени. Можно ли найти решение этих уравнений? Обозначим неизвестные значения pi(0) и р2(0) через Л1 и л2 соответственно. Тогда Р\ (^) -” Л1, Pi (0 ~~ Я2 ——— Л}/. Заметим, что если только Pi(t) и p2(t) не равны нулю тождествен- но, то p2(t) имеет не более одного нуля. А так как оптимальное управление существует, ситуация, в которой pi(t) = p2(t) = 0, не- возможна. Поэтому, полагая Д(/) = —sgn[p2(/)], мы получаем . *i(0 = li + b^ + -y Д(0» (1-2) , 2 х2(/)=52 + ^Д(0. Кроме того, ясно, что функция Д(/) кусочно-постоянная и может быть либо тождественно равной +1 (или —1), либо менять значе- ние один раз с 1 на —1, или с —1 на 1. Эти последовательности зна-
5.1 Один простой пример 161 чений Атанс и Фалб [1966] называют кандидатами на оптималь- ность. Если теперь из уравнений (1.2) исключить время t, то полу- чатся фазовые траектории в виде парабол (рис. 5.1). На этом ри- сунке стрелками показано направление увеличения. времени t, сплошными линиями даны траектории для случая Asl, а пунк- тиром — для случая А = —I. Шаг 3. Вычисление закона управления. Из рис. 5.1 видно, что при Д == 1 через начало координат проходит всего одна траекто- рия. Это же справедливо и для случая, когда A ев —1. Обозначим теперь через а = а_ U а+ такую кривую на фазовой плоскости, что <х_ > (Хр х2): Xj g О а 1 2 Х| 2 а через и R+ — области выше и ниже а соответственно, как это показано на рис. 5.2. Докажем теперь, что зависимость оптималь- ного управления от состояния системы описывается следующим за- коном управления: (1.3) и°(хь х2) = 1, -1, (хь x2)<=a+Ufl+, (хь х2) еа_ U R— 6 Зак. 693
162 5 Конструирование систем управления Чтобы убедиться в этом, мы можем воспользоваться процессом последовательного исключения. Например, если (хь х2) е сс+, то только управление, тождественно равное {1} (при котором Д(/)= 1), обеспечит траекторию, проходящую через начало координат и удо- влетворяющую другим необходимым условиям. (Более подробно об этом написано у Атанса и Фалба [1966].) Но если (§ь g2) есть наше заданное состояние и, скажем, (£i, |2) s R-, то оптимальное упра- вление u°(t) должно быть равно —1 до тех пор, пока траектория системы не попадет на а (в действительности на а+), а после этого должно быть равно +1. Другими словами, оптимальное управление переключается с +1 на —1 на кривой а. В связи с этим кривую а и называют кривой «переключения». В системе с законом управле- ния (1.3) зависимость времени, необходимого для достижения на- чала координат, от начального состояния системы описывается следующей формулой: ^+/4^ + 211,. Г (Ь &) = -£2+/-4^ + 2||, ^1 > 2 ^2 I ^21» Отметим, что dt*ld^i претерпевает разрыв на кривой а и что, сле- довательно, глобального достаточного условия Гамильтона — Яко- би не существует. Подведем теперь некоторый итог сделанному. Мы исследовали гамильтониан задачи и определили Я-минимальное управление. За- тем мы проинтегрировали канонические управления, а по сути дела построили все экстремали (т. е. траектории, удовлетворяющие всем необходимым условиям) рассматриваемой задачи. Затем мы вое-
5.2. Конструирование систем с помощью принципа Понтрягина 163 пользовались процессом исключения для того, чтобы показать, что эти экстремали единственны; связав эту единственность с доказан- ным ранее фактом существования оптимального управления (ко- торое, естественно, должно быть экстремальным), мы вычислили искомый оптимальный закон управления. Таким образом, нам уда- лось выделить три основных этапа процесса вывода оптимального управления: (1) определение Я-минимальных управлений; (2) по- строение экстремалей с помощью решения двухточечных граничных задач для канонической системы; (3) вычисление оптимального за- кона управления. Весь этот процесс осуществляется после того, как существование оптимального управления доказано. 5.2 Конструирование систем управления с помощью принципа Понтрягина Построение оптимальных управлений с помощью принципа Понт- рягина, или необходимых условий оптимальности, для задач об- щего вида аналогично процедуре, описанной в § 5.1. Однако в этом простом примере невозможно увидеть многие трудности, встречаю- щиеся в более общей ситуации на разных этапах процесса. Рас- смотрим поэтому каждый из этих этапов в отдельности, отмечая те затруднения, которые могут встретиться по пути. Шаг 1. Определение Я-минимального управления. Начнем с по- строения гамильтониана, а затем попытаемся определить //-мини- мальное управление. Если гамильтониан Н регулярен, то определе- ние Я-минимального управления всегда возможно, по крайней мере теоретически. С другой стороны, если гамильтониан Я нерегулярен, то возникают трудности. Например, в некоторых диапазонах из- менения х и р гамильтониан Я (х, р, со) оказывается постоянным при всех со из U. На деле это означает, что необходимые условия минимума такого гамильтониана не несут в себе никакой инфор- мации. Такие задачи называются вырожденными '). В то же время для различных значений х и р могут найтись такие различные точ- ки U, что гамильтониан Я будет достигать в них своего абсолют- ного минимума. В этом случае через данное начальное состояние может проходить несколько экстремалей, качества каждой из ко- торых можно вычислить (такие примеры можно найти в книге Атанса и Фалба [1966]). Приведем один тривиальный пример. (2.1) Пример. Рассмотрим систему где 1«(/)|<1. Пусть S = R X {0}, К = 1, a Цх, и) = |ы|. Тогда Я = |и| + ри и р(0 = 0, так что p(t) постоянно. Если, например, р = 1, то любое и из промежутка [—1,0] минимизирует Я. Легко видеть, что если *) Вырожденные задачи подробно рассматриваются в работах Джонсона [1965] и Джонсона и Гибсона [1963]. 6*
164 5 Конструирование систем управления gi > 0 есть начальное состояние, то любое управление вида «(/) = = —k, fee [О,1], оптимально. Шаг 2. Интегрирование канонической системы. На втором этапе нужно попытаться найти экстремали, проходящие через начальное состояние, решая (интегрируя) двухточечную граничную задачу для канонической системы. В общем случае это можно сделать лишь численными методами. Различные итеративные методы, та- кие, как метод градиента (Келли [1962]), а также методы, исполь- зующие выпуклость (особенно в задачах на оптимальное быстро- действие (Итон [1962], Нейштадт [I960]), или общие алгоритмы Ньютона или Ньютона — Рафсона (Канторович, Акилов [1959] или Ван Дайн [1965])), позволили успешно решить целый ряд упомяну- тых задач. Часто пользуются и таким подходом: пытаются «уга- дать» начальное значение косостояния p(t0), решить для канони- ческой системы задачу Коши, проверить, выполняются ли конеч- ные условия для р и х, и если нет, изменить начальное значение р и повторить весь этот процесс сначала. При этом, естественно, сра- зу же возникают проблемы сходимости и точности. Этим пробле- мам в настоящее время уделяется значительное внимание ученых; в § 5.3—5.5 мы еще вернемся к различным численным методам. Шаг 3. Вычисление оптимального закона управления. После того как все экстремали определены, вычислим качество вдоль каждой экстремали, сравним полученные значения между собой и на основе этого сравнения выберем оптимальное. Если оптималь- ное управление и (или) экстремальные управления не единственны, то такая задача может оказаться достаточно сложной. Поэтому доказательство единственности экстремалей представляет несом- ненный интерес. Некоторые важные результаты в этом направлении были получены Атансом [1966] и Ли и Маркусом [1961]. Отметим еще раз, что использование необходимых условий предполагает существование оптимального управления. В общем случае вопрос существования является чрезвычайно сложным, и поэтому мы призываем к определенной осторожности при примене- нии необходимых условий «вслепую». Многочисленные примеры использования принципа Понтрягина для решения конкретных задач конструирования систем управле- ния приводятся Атансом и Фалбом [1966]. 5.3 Численные методы теории управления; общие замечания Мы уже отмечали, что для практического решения большинства задач управления требуется прибегать к вычислительным методам, особенно итеративным. Все эти итеративные методы можно, грубо
S.3 Численные методы теории управления; общие замечания 165 говоря, разделить на две категории, на прямые и косвенные мето- ды. Косвенные методы обычно опираются на сведение исходной за- дачи управления к задаче решения дифференциального уравнения (например, уравнения в частных производных Гамильтона — Яко- би) или системы дифференциальных уравнений (таких, как кано- ническая система из теории Понтрягина). Напротив, прямые мето- ды обычно развиваются на основе построения подходящих мини- мизирующих семейств. Но независимо от того, о каком методе или алгоритме идет речь, так или иначе приходится выяснять основ- ные проблемы сходимости, точности и влияния вычислительной машины. Другими словами, если у нас имеется итеративная (чис- ленная) процедура решения задачи управления, то нам требуется знать ответы на следующие вопросы. 1. Сходится ли эта процедура и существуют ли разумные усло- вия, гарантирующие сходимость? 2. Есть ли возможность определить подходящие оценки ошиб- ки на каждой итерации? 3. В какой степени ошибки округления, связанные с расчетами на цифровых вычислительных машинах, или неизбежные неточно- сти (помехи) вычисления на аналоговых машинах влияют на точ- ность полученных результатов? Как и следовало предполагать, на эти вопросы нет общих отве- тов. Поэтому мы изучим теперь в довольно общем виде некоторые из подходов, использующихся для нахождения экстремали задач управления (т. е. для решения двухточечной граничной задачи для канонической системы). В следующем параграфе мы сосредоточим наше внимание на некоторых более конкретных аспектах примене- ния этих главных итеративных методов для решения задач управ- ления. При рассмотрении итеративных методов, использующихся для получения экстремалей в задачах управления, мы будем интере- соваться тремя характеристиками этих методов:,. (1) конкретным методом коррекции, (2) характером корректируемой величины и (3) конкретным условием экстремальности, на выполнение которого направлен рассматриваемый итеративный процесс. Мы познако- мимся вкратце с тремя основными итеративными процедурами: градиентным методом, методом Ньютона (или Ньютона — Рафсо- на) и методом последовательных приближений. Мы также между делом отметим очень важный метод платежных функций, позво- ляющий учитывать ограничения. В действительности аппроксима- ционная теорема Мозера (Курант [1962]), которую мы приводим в § 5.5, часто может служить достаточной теоретической гарантией возможности применения платежных функций. Двумя типами ве- личин, корректируемых в соответствии с одним из итеративных ме- тодов, являются векторы, например начальные условия для р, и
166 5 Конструирование систем управления функции, например функция управления. Если положить в осно- ву принцип максимума Понтрягина, то экстремальные управления и траектории системы должны удовлетворять следующим условиям: 1) канонической системе дифференциальных уравнений; 2) условию минимизации гамильтониана; 3) граничным условиям, образованным начальными условиями, характером целевого множества и условиями трансверсальности *). Чаще всего используется подход, при котором строятся траекто- рии, удовлетворяющие двум каким-нибудь из перечисленных усло- вий, а затем эти траектории итеративно изменяются до тех пор, пока не будет выполнено и третье условие. В так называемом ме- тоде «окрестностей оптимума» (Брайсон, Денхем [1962], Денхем [1963], Брэкуэлл, Спейер, Брайсон [1963])’ рассматриваемые траек- тории должны удовлетворять условиям (1) и (2), и среди них нуж- но найти траекторию, удовлетворяющую условию (3). В широко распространенном «градиентном» методе (см., например, Блюм [1964], Бушау [1963], Денхем [1963], Канторович, Акилов [1959], Келли [1960, 1962]), напротив, исходные траектории удовлетворяют условиям (1) и (3), а нужно добиться выполнения условия (2). Оставшийся возможный вариант, когда итерируется решение зада- чи, требующей выполнения условий (2) и (3), до тех пор пока не получится решение канонической системы (т. е. до тех пор, пока не будет выполнено условие (1)), часто называют методом квази- линеаризации (Калаба [1959], Мак-Джилл, Кеннет [1963]). В каж- дом из этих методов итерации должны осуществляться в соответ- ствии с подходящим выбором методов преобразования основных параметров, будь это векторы или функции. Здесь нужно сослаться также на работу Калмана [1966а], Рассмотрим теперь с абстрактных позиций самые основные ите- ративные методы. Предположим, что П есть некоторое подмножест- во банахова пространства 5s, причем элементы П (или ^) будем называть параметрами. Обозначим через Е некоторое отображение П в банахово пространство <S и назовем его отображением ошибок. Задача всех итеративных процедур состоит в том, чтобы обратить в нуль «ошибку» Е(л) или по крайней мере сделать эту ошибку очень малой. Основная идея, положенная в основу всех трех упо- мянутых выше итеративных процедур, состоит в использовании ли- нейных приближений2). Другими словами, если л0 представляет собой предыдущую оценку значения параметра, то новая, скоррек- ') Дополнительное условие экстремальности И = 0 иногда используется в итеративных процедурах, применяемых непосредственно для оптимизации не- автономных систем. 2) Очейь часто оказывается весьма полезным переходить к приближениям более высокого порядка (Коллатц [1964]). Однако такие вопросы здесь не рас- сматриваются.
5.3 Численные методы теории управления; общие замечания 167 тированная оценка лп должна задаваться соотношением = л0 - Ф {£ (л0)}, где Ф является некоторым подходящим элементом из Я?(&, Ф) (т. е. Ф есть некоторое непрерывное линейное преобразование Jr в &). Таким образом, отличительной чертой всех этих методов является выбор линейного преобразования Ф. Градиентный метод. Предположим, что пространства и # гильбертовы. Тогда, если преобразование Е дифференцируемо на П, то £(л + Л) = £(л) + ^-|яЛ + о(||Л||), где дЕ/дл принадлежит 2?(Ф, S’). Но так как пространства ф и S гильбертовы, сопряженное относительно дЕ/дл преобразование (дЕ/дл)* должно принадлежать 3?(S,&), что позволяет восполь- зоваться следующей итеративной схемой: (3. 1) ftfc+l = ^к где Гк — некоторое вещественное число. Если S = R, то (дЕ/дл)* можно отождествить с градиентом VE (принадлежащим 3), и, положив Гк = Sk/E (ли), мы сможем переписать уравнение (3.1) в виде (3-2) n*+1 = nft-sftV£(n*). Это хорошо известная формула градиентного метода, или ме- тода наискорейшего спуска; параметр Sk называется размером й-го шага. Результаты, относящиеся к проблеме сходимости алгоритма (3.2), можно найти у Канторовича и Акилова [1959]. Несколько ниже мы познакомимся с одним из способов применения алгоритма (3.2) для решения задач управления. Метод Ньютона. Предположим, что преобразование Е диффе- ренцируемо в точке Л. Тогда (3.3) Е(Л + й) = £(«) + (-^-)й + о(||й||), где дЕ/дл принадлежит S? (&,&). Предположим временно, что Уравнение (3.3) справедливо без учета погрешности о(|| h ||). Отсю- да находим ' £(Л + й) = £(л)+^-й. Полагая й«(- дЕ(л)/дл)~х Е(Л), получаем Е (л + й) = 0.
168 5 Конструирование систем управлений Это соображение подводит нас к следующей итеративной проце- дуре: /дЕ (л.П-1 (3.4) пк+j = ак - ) Е (пк) , „ /дГ(лЛ\-’ (естественно, здесь предполагается, что такое обратное I— существует). Алгоритм (3.4) известен как алгоритм Ньютона. Часто уравнение (3.4) заменяют на (3-5) **+!“«*-(^Г-Г где По — начальная оценка. Этот алгоритм называют модифици- рованным алгоритмом Ньютона. Теоремы о сходимости алгорит- мов (3.4) и (3.5) содержатся в книге Канторовича и Акилова [1959]. Несколько позже мы используем этот метод в подходе к ре- шению задач управления с помощью «окрестностей оптимума». Метод последовательных приближений. Обычный метод после- довательных приближений, известный также как метод Пикара, оказывается чрезвычайно полезным. В этом случае Ф есть некото- рый элемент из 3?(<S,^), и мы просто полагаем, что (3.6) Яй+1 = л*-Ф{£(Яб)}. Естественно, что при этом стараются выбирать Ф разумным обра- зом. Например, модифицированный алгоритм Ньютона (3.5) можно считать итеративным алгоритмом Пикара, в котором Ф = = [дЕ(ло)Мл]“’. Часто Ф выбирают сжимающим (уменьшающим норму), хотя для сходимости алгоритма это и не обязательно. Раз- личные свойства метода последовательных приближений рассмат- риваются в книгах Коллатца [1964] и Канторовича и Акилова [1964]. К сожалению, этот метод мало использовался для решения задач управления, и ниже мы укажем на возможное его примене- ние в рамках метода квазилинеаризации, используемого для ре- шения задач управления (см. тем не менее работу Фалба и Дейон- га [1968]). 5.4 Вычислительные методы теории управления; косвенные методы Займемся теперь изучением возможности применения этих об- щих итеративных процедур для решения задач управления. Рас- смотрим динамическую систему, описываемую уравнением (4.1) x = f(x, и). Пусть начальное событие системы имеет вид (ta,x0), целевое мно- жество этой системы есть S = {/J X Sx, а критерий качества содер-
5.4 Вычислительные методы теории управления; косвенные методы 169 жит лишь показатель качества конечного состояния /((х). Напом- ним (§ 4.1), что если й(-) есть некоторое заданное управление, а ^(•)—соответствующая траектория системы (решение уравнения (4.1)), то уравнение (4-2) называют уравнением возмущенного движения. Перепишем урав- нение (4.2) в более привычном виде (4-3) = |д Поскольку начальное событие системы (t0, х0) фиксировано, на- чальные условия для системы (4.3) имеют следующий вид: Sx (t0) = 0. Рассмотрим теперь три варианта использования описанных итеративных процедур. Градиентный метод. В этом методе роль величины, которую мы собираемся итерировать, играет функция управления. Итак, пред- положим, что пространство Яи гильбертово и что Q е L2([/0, Л], &и) есть гильбертово пространство со скалярным произведением «1 («(•).. О( • )) = f <«(0, У (0)уdt. Другими словами, пусть пространство параметров есть ф =» = L2 ([/о, Л], &и), пространство S равно пространству веществен- ных чисел R, а отображение ошибок Е задается условием £(ц(.)) = Я(хвО-/<0, где К° — inf{K(xu(ti)): «(-)eQ). Заметим, что если й()ей, то ?£(£(•)) принадлежит L2 (Ro. Л], &и) и определяется по формуле где р(-) представляет собой решение сопряженного уравнения (4.4) 4 = (#|)‘р ' dt \ дх |д/ к (заметим, что p(t) есть элемент пространства X*, т. е. простран- ства, двойственного пространству состояний X). Сопряженную пе- ременную (косостояние) р(*) иногда называют функцией влияния. Предположим затем, что целевое множество Sx задачи имеет сле- дующий вид: Sx = {x: ^(х) = 0, /=1, .... k),
170 5 Конструирование систем управления где все gi имеют непрерывные производные, линейно независимые на Sx- Тогда в качестве граничного условия для р(-) воспользуем- ся условием k Р (*1) = -Jr (О) - 2 “i гг (* (*1)). где oti — подходящие постоянные. Теперь легко видеть, что h Е (й (•) + би (•)) = Е (й (♦)) Ч- J <V£ (й (•)) (0, би (0> dt + о (|| би ||). h Наибольшее изменение Е для заданного значения II би (ОН2 полу- чается в том случае, когда би(.) = г¥£(й(. ))(•), где s — некоторая постоянная. Отметим также, что, поскольку уравнение (4.4) линейно и однородно, мы можем ?Е(й(-)) пред- ставить в виде k VE(fi(. ))~ЧкЕ(й(-))+ 2 ?гЕ(Й( •)), 1=1 где а Рй(-) и Pt(') являются решениями уравнения (4.41, удовлетво- ряющими граничным условиям рк (Л)=-Jr (•* (fi)). pi (Л)=- <*< -Jr (* (Л) ) Эти соотношения позволяют оценить характер изменения Е из-за изменения К и положения конечного состояния. Перечислим теперь основные этапы решения задачи градиентным методом. 1. Выбор некоторого номинального управления и0(«), которому соответствует некоторая траектория системы (решение .уравнения (4.1)), удовлетворяющая необходимым граничным условиям (на практике лишь приближенно). 2. Интегрирование сопряженного уравнения для обратного на- правления времени с тем, чтобы определить функции рк(-) и (•), i = l, ..., k. 3. Корректировка управления по схеме градиентной процедуры. Для этого нужно положить Н1 (•)= Щ (-•)— s0^KE (u0 (•)) — 2 soiV(Е (u0 (•)),
5.4 Вычислительные методы теории управления; косвенные методы 171 где s0K, sOi есть подходящие постоянные, определяющие размер шага, и пересчитать траекторию системы для управления «Д-), чтобы получить новую номинальную траекторию хД.). 4. Повторение описанной процедуры до тех пор, пока значение Е не станет достаточно малым (или пока Vf не обратится в нуль). Чаще всего выбор размеров шага основывают на интуиции или других каких-нибудь правдоподобных соображениях. Более того, описанный метод часто не слишком полезен в малых окрестностях оптимальной траектории. Наконец, на практике трудности возни- кают и при попытке удовлетворить конечным условиям. Для пре- одоления этих последних трудностей нередко прибегают к методу платежных функций. Например, вместо того чтобы пытаться удо- влетворить условиям g{ (х) = 0, можно к показателю качества К (х) добавить член вида k ^а^(х), at>0, i=l, ..., k (этот член и будет описывать платежные функции). Более подроб- ное описание применения градиентных методов и многочисленные примеры можно найти в работах Блума [1964], Денхема [1963], Брайсона и Денхема [1962], Канторовича и Акилова [1959] и Келли [1960]. Метод Ньютона — Рафсона. В этом методе итерируется началь- ное условие для сопряженного уравнения. Чтобы построить проце- дуру вычислений по этому методу, предположим, что гамильтониан # = <P,f (*»«)) регулярен, поэтому //-минимальное управление и°(х, р) всегда су- ществует. Пусть У = ХХГ. Станем записывать типичный элемент у этого пространства У в виде у = (х, р). Если подставить //-минимальное управление и°(х,р)~ в канонические уравнения, то получится система (4-5) -^=^(0), определенная в пространстве У. Заметим, что задается выраже- нием <V(x, p) = (f(x, и°(х, р)), --^(х, и°(х, р))’р). Теперь граничные условия для оптимальной траектории «расщеп- ляются» на условия в начальный и конечный моменты времени. Например, если траектория y°(t) оптимальна, то известно, что y°(t0) должен иметь вид (хо, •), где х0 есть заданное начальное
172 5 Конструирование систем управления состояние, и что y°(t\) = (хьPi), где xt принадлежит целевому мно- жеству Sx, a pi трансверсально Sx- Заметим теперь, что-если бы j мы знали истинное значение косостояния в начальный момент, то I мы смогли бы проинтегрировать уравнение (4.5), последовательно ’ увеличивая время, и получили бы в результате оптимальное реше- ние (поскольку решения задачи Коши единственны). Если л при- надлежит X*, то уравнение (4.5)« имеет единственное решение y(t', л), удовлетворяющее начальному условию У (to', л) = (х0, л), а «ошибка» выполнения конечных условий описывается разностью y(ti', где индекс f указывает на то, что сравниваются лишь те состав- ляющие элемента, которые нужны. Например, если Sx = {xj, т. е. состоит из единственной фиксированной точки, то //°(Л)/ = хь а y(t\', л)/ = х(Ь; л). Итак, пусть X* играет роль пространства пара- метров, У (или точнее У/) есть пространство &, а преобразование Е задается соотношением ' E(n) = y(t}; Заметим, что дБ _ ду (h; n)f дл дл ’ и, следовательно, итеративная процедура Ньютона — Рафсона опи- сывается выражением л*+1 = лй - (~- (^Я)/) [у (ti', лк)| - у0 (tj)f]. Таким образом, центральным моментом подхода является опреде- ление dy(ti’, п)(/дя. Уравнение возмущенного движения (4-6) = часто используют с этой целью. Например, если исследуется конеч- номерная система, то, обозначая через ei, .... еп естественный базис пространства Rn (отождествляемого с X*), мы легко устано- вим, что решением уравнения (4.6), удовлетворяющим начальному условию бу(А») = (°, е/)> i=l, ..., п, является вектор В этом случае матрицу dy(ti; л)/дл (и тем более матрицу dy(ti', п)//дл) можно вычислить с помощью не более чем п инте-
5.4 Вычислительные методы теории управления; косвенные методы 173 грирований уравнения возмущенного движения (4.6). Теперь, как и раньше, мы перечислим основные этапы процедуры. 1. Выбор некоторого начального значения косостояния. 2. Решение задачи Коши для канонических уравнений с исполь- зованием заданных начальных значений состояния, нулевого при- ближения начального значения косостояния и Я-минимального уп- равления. 3. Корректировка нулевого приближения начального значения р с помощью метода Ньютона. В частности, это требует определе- ния dy(t[-, что обычно связано с интегрированием уравне- ния возмущенного движения. Алгоритм коррекции имеет следую- щий вид: ak+i = як- --------) [у (ff, nk)f - 4. Повторение описанной процедуры до тех пор, пока ошибка не окажется достаточно малой. В этой процедуре не нужно принимать никаких произвольных решений о размерах шага. Однако на каждом шаге здесь требует- ся вычисление обратного линейного преобразования (матрицы в конечномерном случае), что часто требует интегрирования линей- ных уравнений возмущенного движения. Поскольку сходимость этого метода имеет чаще всего квадратичный характер, он с успе- хом может применяться и в малой окрестности оптимума. Кроме того, во многих случаях модифицированный метод Ньютона позво- ляет обойти трудности, связанные с обращением линейного преоб- разования дЕ/дп. Дополнительную информацию и примеры можно найти в работах Балакришнана и Нейштадта [1964], Брайсона и Денхема [1962] и Канторовича и Акилова [1959]. Метод последовательных приближений. Здесь итерируются траектория и траектория сопряженной системы. По сути дела мы заменяем исходную краевую задачу некоторой последователь- ностью линейных краевых задач с фиксированной линеаризацией. И снова нам придется предположить, что гамильтониан Н регуля- рен, что обеспечит существование //-минимальных управлений и°(х, р). Полагая У = X X X* и подставляя ы°(х, р) в канониче- ские уравнения, получаем систему -d-^=W(0), определенную в пространстве У. Предположим, что граничные ус- ловия оптимальной траектории y°(t) имеют следующий вид: У°Уо) = (хо, •). */°(Л) = (-, Pi),
174 5 Конструирование систем управления т. е. начальное состояние и конечное коСосТ°яние известны1). Если обозначить через Д(<) некоторое непрерывное отображение [/0, Л] в 2?(У, Y), то можно рассматривать лцнеаризации, основанные на Л(/). Другими словами, если yi(t) есть некоторая дифференцируе- мая кривая в пространстве У, такая, что У1 (М = </° (to) = (х0, • )> У1 (Л) = у° (Л) = (•, pi), то можно рассматривать линейную двухточечную краевую задачу для уравнения (4.7) = А (0 by (t) + (/)) - с граничными условиями (4.8) бх(/о) = О, 6р(^) = 0- Обозначим через 6«/i(/) решение этой линейной двухточечной гра- ничной задачи. Тогда легко видеть, что y2(t) = yi(t) 4- 5yi(t) так- же удовлетворяет требуемым граничны^ условиям. Укажем теперь основные этапы вычисления оптимального управления по этому ме- тоду. 1. Определение некоторой дифференцируемой кривой, удовлет- воряющей граничным условиям. 2. Решение линейной двухточечной краерой задачи (4.7) и (4.8). 3. Корректировка траектории с использованием соотношения У k+l (!) = У к (t) + 6ук (/) (заметим, что из-за неоднородности уравнения (4.7) описываемая итерационная процедура не является линейной). 4. Повторение описанной процедуры, пока by не обратится в нуль или не станет достаточно малой2).’ Относительно описанной здесь процедуры известно очень мало такого, что было бы полезным на практике. Более подходящий ме- тод квазилинеаризации получается в результате замены уравне- ния (4.7) на уравнение Результаты, относящиеся к теории Квазилинеаризации, можно найти в работе Мак-Джилла и Кеннета [1963]. Весьма перспектив- ными кажутся и дополнительные исследования в этом направлении, о которых сообщается в работе Фалба ц дейонга [1968]. Различные подходы к определению оптимальных управлений, рассмотренные до сих пор, основывались на решении двухточечных ') Возможны, конечно, и другие комбинации, но их исследование мы предо- ставляем читателю. 2) Простой расчет показывает, что если, скажем. Фд = О, то Ук^^^Ун}-
5.5 Вычислительные методы теории управления; прямые методы 175 краевых задач для канонических систем. В связи с этим указанные подходы должны быть отнесены к числу косвенных; они позволяют определять лишь экстремальные управления. Если же мы хотим, чтобы эти методы давали нам действительное управление (или его разумное приближение), их необходимо дополнить независимыми доказательствами существования и единственности экстремалей. Однако часто такие доказательства в литературе отсутствуют. Бо- лее того, во многих случаях оценить ошибку (или значение) функ- ционала качества на каждом шаге итерации оказывается весьма затруднительным. В связи с этим мы обращаемся теперь к прямым методам. 5.5 Вычислительные методы теории управления; прямые методы Центральная идея так называемых прямых методов состоит в введении понятия минимизирующего семейства. По мере нашего из- ложения мы приведем несколько относящихся сюда результатов и в том числе аппроксимационную теорему Мозера (Курант [1962]). В третьей главе мы уже отмечали, что задачи управления мож- но рассматривать как частный случай задач минимизации функ- ционала, определенного на некотором подмножестве нормирован- ного линейного пространства. Встанем теперь на эту точку зрения. Рассмотрим нормированное линейное пространство S&, его непу- стое подмножество Ф, вещественный функционал J, определенный на и задачу минимизации I на Ф. Предположим, что эта задача имеет смысл, т. е. что (5.1) — оо <inf 7( ) = 7°< оо. ф (5.2) Определение. Пусть D = {б: бе[0, оо)} есть некоторое на- правленное вверх ’) подмножество неотрицательных вещественных чисел. Тогда семейство SS элементов ов называется минимизирую- щим. I над Ф, если lim J (t>e) = /° = inf J (•). б->оо Ф Если же, кроме того, lim ой = о0, 6->оо где v° е Ф, то {уд} называют сходящимся минимизирующим семей- ством. !) Направленное вверх множество D определяется следующим образом: если di и $2 принадлежат D, то найдется такой элемент d3 е D, что di < д3 и *2 < б3. Типичным примером направленного вверх множества может служить множество целых чисел.
176 5 Конструирование систем управления В силу справедливости соотношения (5.1) минимизирующие се- мейства всегда существуют. Однако существование сходящихся ми- нимизирующих -семейств не обязательно. Если бы мы знали, что сходящееся минимизирующее семейство существует и что J доста- точно «гладко» для того, чтобы ] (v°) = J (lim об) = lim J (w6) = 7°, 6->оо д->оо тогда можно было бы заключить, что о0 является искомым реше- нием задачи минимизации. Эти соображения и составляют основу прямых подходов, которые по сути дела состоят из (1) построения подходящего сходящегося минимизирующего семейства и (2) до- казательства гладкости 7. Следующее предложение является ха- рактерным для тех требований, которые предъявляются в прямых методах к гладкости функционала 7. (5.3) Предложение. Предположим, что семейство {и6} является ми- нимизирующим и сходящимся с пределом v° и что J полунепре- рывно снизу *) в точке v°. Тогда v° минимизирует J на Ф, т. е. тогда J(y°) = J° = inf /(•). ф Доказательство. Поскольку семейство {ов} минимизирующее, а о0 е Ф, имеем (5.4) 7(t>°)>7° = inf7(-)= lim 7(t>6). ф б->ОО Но с другой стороны, если е > 0, то всегда найдется такое 6(e), что неравенство 6 > 6(e) гарантирует справедливость неравен- ства /(у°Х/(уб) + 8, как следствие полунепрерывности / снизу в точке vQ. Но тогда / (и0) lim / (иб) + е = /° + е, б->оо и, следовательно, J(o°)<A а это вместе с неравенством (5.4) доказывает наше предположение. Обычно легко убедиться в том, что функционалы качества за- дач управления полунепрерывны снизу (или даже непрерывны). В связи с этим решающее значение в прямых методах приобретает построение сходящихся минимизирующих семейств. Для построе- ния таких минимизирующих семейств известно несколько стандарт- ных методов. Один класс таких методов опирается на приближение исходной задачи некоторой последовательностью (или семейством) 1) Напомним, что J полунепрерывно снизу в точке v°, если для любого $ > 0 найдется такое д > 0, что || v — v° || < 6 =Ф /(и0) J (и) + е.
5.5 Вычислительные методы теории управления; прямые методы 177 более простых задач. Здесь мы рассмотрим два таких метода. Пер- вый из них состоит в замене задачи с дополнительными условиями задачей без таких условий, а второй — в замене общей задачи под- ходящей последовательностью конечномерных задач минимизации. Для простоты мы будем называть эти методы методом 1 и мето- дом 2. Метод 1. Предположим пока, что подмножество Ф простран- ства & имеет следующий вид: Ф = (о: ф(о) = 0}, где <р — некоторая неотрицательная (т. е. ф(о)>0 для всех v из вещественная функция, полунепрерывная снизу относительно некоторой топологии SF на SS. Например, если ф есть некоторое слабонепрерывное отображение SS в другое нормированное линей- ное пространство то функция ф(и) = || ф(о) || обладает указан- ными свойствами относительно слабой топологии на & (Роте [1948]). (5.5) Теорема. Пусть функционал J полунепрерывен снизу относи- тельно топологии ЗГ. Пусть также найдется некоторое неограничен- ное направленное вверх подмножество D = {6} множества [0, оо), обладающее следующими свойствами: (а) для каждого найдется такое что при всех1) » е $ имеем J (»д) + 6<Р («б) < ? (°) + б(Р (у); (Ь) найдется такое v°^&, что lim о* = о0, б->оо где предельный переход нужно понимать в терминах -топологии. Тогда v° принадлежит Ф, и J (о0) = /° — inf {J (и)}; следователь- и еф но, и0 есть решение поставленной задачи. Доказательство этой теоремы можнд найти в книге Куранта [1962]. Важное значение этой теоремы в задачах управления объясняет- ся тем, что она позволяет заменять задачи с такими дополнитель- ными ограничениями, как краевые условия, задачами, свободными от этих ограничений. Например, как было видно из § 4.1 и 4.2, не составляет особого труда показать, что оптимальное управление приводит к экстремизации гамильтониана, если конечное состоя- ние системы свободно, и что, как только конечное состояние за- фиксировано, аналогичное доказательство становится трудным. ') На самом деле необходимо, чтобы это условие выполнялось лишь на некотором подмножестве ¥ множества 35, содержащем Ф (т. е.
178 5 Конструирование систем управления В подобной ситуации можно попытаться использовать теорему (5.5) следующим образом. Предположим, что для нашей задачи целе- вым множеством является {6} X {*i}, где 6 и Xi фиксированы. Пусть <р(«(•)) равно, например, 4II ха (6) — Xj |р. Найдем тогда не- обходимые условия оптимальности для задачи со свободным ко- нечным состоянием системы и функционалом качества /(«(•)) + + 6ф («(•))• Считая, что существует подходящее сходящееся семей- ство решений этих задач со свободным состоянием, мы сможем по- лучить необходимые условия оптимальности исходной задачи с фиксированным конечным состоянием. Для того чтобы перевести это утверждение на формальный язык, рассмотрим задачу управ- ления с целевым множеством {6} X {xi}, где Xi фиксировано, каче- ство конечных состояний не оценивается (т. е. К = 0) и все про- странства SSu, Q и X гильбертовы. (5.6) Следствие. Предположим, что функционал J полунепрерывен снизу и что существует некоторое неограниченное направленное вверх подмножество D = {6} множества [0, оо), обладающее сле- дующими свойствами-. (а) для каждого найдется такое -ыб(«)еП, что при всех и(')ей справедливо неравенство /(«8(-)) + 4|x„6(/1)-x1||2<J(«(-)) + 4||x„(/1)-x1||2; (b) существует такое m из [0, оо), что (5.7) Нгп 6|хИб(6)-Xi| = m: (с) существует такое «°(-)g£2, что (5.8) lim М-) = «”(•) 6->оо (относительно естественной топологии нормированного простран- ства £2). Тогда и°(-) есть оптимальное управление, и существует такое косостояние Х°(-), соответствующее управлению «°(«), что -^(х°(-), Х°(.), м°(-)) = 0 почти всюду на [/о, 61- Доказательство. Оптимальность управления ы°(*) следует из тео- ремы (5.5). А так как дЩди непрерывно, из соотношения (5.8) находим, что limxa (-) = х°(-).
5.5 Вычислительные методы теории управления; прямые методы 179 ♦ Остается лишь показать, что существует предел (5.9) lim Хв(-) = %°(.) б—>оо и что этот предел удовлетворяет дифференциальному уравнению *) • ldf I Г i dL I (5-1°) W |o) K dx |o’ где через Xfi(-) обозначено косостояние, соответствующее управле- нию м4(-) и такое, что М-), «.(•))-» почти всюду на [/0, М- Существование косостояние (•) гаранти- руется теоремой (4.4), поскольку управление «4(-) является опти- мальным для задачи со свободным конечным состоянием. Более того (см. § 3.5), Лв(Л) = 6(хав(<1)-Х1), и, следовательно, согласно соотношению (5.7), существует предел lim Лв (/О = Л. 6->оо Обозначим через А°(-) решение уравнения (5.10), удовлетворяю- щее следующему условию конечного состояния: %°(О = Л. Отсюда в силу непрерывности df/dx и dLjdx можно заключить, что соотношения дх |а дх |о И г dL I дх |б дх |о вместе гарантируют выполнение условий (5.9) и (5.10). А это дока- зывает наше следствие. Заметим, что и6(-) образует сходящееся минимизирующее се- мейство для I. Именно здесь и лежит основная трудность исполь- зования этого следствия, так как показать, что соотношения (5.7) и (5.8) действительно имеют место, часто оказывается весьма *) В этом уравнении через L(x,u) обозначено ядро функционала качества траектории. Другими словами, ti . /(«)= f Ь(хв(0, u(t))dt. ti
180 5 Конструирование систем управления сложным делом. Следующий пример иллюстрирует данный метод. Дальнейшая работа по развитию рассматриваемого метода ка- жется многообещающей и может привести к интересным и практи- чески полезным результатам. (5.11) Пример. Рассмотрим (скалярную) систему х = —х + и, для которой х(0) = £ #=0. Пусть целевое множество есть S — {7} X {0}, где Т фиксировано, а функционал качества J имеет вид т /(и) = -^ f (x2 + u2)dt. о Рассмотрим теперь задачу с целевым множеством {Т} х R и функ- ционалом качества т |х(Г2) + Н (х2 + «2)Л, о где 6s(0, оо). Тогда (как показано в книге Атанса и Фалба [1966]) эта последняя задача имеет решение (5.12) «в(/)=-Лв(0хв(0. где kb(t) удовлетворяет соответствующему уравнению Риккати и имеет следующий вид:, (уТ+ 1) + (/2 -1) в2 /2 (t-n ________(d + 1 + /2)______ (б +1 — 1^2 ) e2 V"2 (t-T) (6+1+/2) Соответствующая траектория x6(t) описывается выражением г t (5.13). хв (0 = |ехр j J [- 1 - k6 (т)] dx I о (см. Атанс, Фалб [1966]). Но так как Лв(т) положительно, свой- ство (с) следствия 5.6 получается из соотношений (5.12) и (5.13), если мы покажем, что выполняется свойство (Ь) (т. е. что предел lim х§(Г) существует и конечен). Для этого достаточно устано- б->оо вить существование следующего предела: (5.14) lira б exp 6->оо М0 =----- 1 т - J k(, (т) dx
5.5 Вычислительные методы теории управления; прямые методы 181 Но довольно сложные вычисления (которые мы оставляем чита- телю) показывают, что v eYn ( _ [{б 1)+(Г2+1) Х^+(/2-1)} {(/2+ 1)+б} XeXPl W2J П 2Г2{б + (Г2-+0е2/Тг} Но отсюда находим lim б exp д->оо т - j k6 (т) dr о 2/2~ ехр (2 V2 Т) - 1 ’ и наше утверждение доказано. Таким образом, оптимальное для нашей исходной задачи управление существует и может быть най- дено предельным переходом в выражении (5.12) при б -> оо. Заметим, наконец, что если Ф = {»: ФЛС) = О}, где (₽i непрерывны, то по-прежнему можно использовать теорему (5.5). Например, если найдутся такие положительные постоянные mt-, что |Ф/(о)|<т/||о||, 2 /7l|<0O, то Ф = {о: <р(о) = 0), где ф(о) = 2/п?ф|(у), и мы можем воспользоваться теоремой (5.5). Таким образом, опи- санный метод является существенно более общим, чем может пока- заться при беглом рассмотрении налагаемых им ограничений. Метод 2. Перейдем теперь к изложению метода Ритца, состоя- щего в замене исходной общей задачи некоторой вложенной после- довательностью конечномерных задач минимизации, решения кото- рых образуют искомую минимизирующую последовательность. Предположим, что w0, Wi,... есть некоторая последовательность элементов из Я, и обозначим линейную оболочку w0, wlt..., wh че- рез Ян. Другими словами, пусть {k 1
182 5 Конструирование систем управления Тогда будет конечномерным подпространством пространства а ОФ будет подмножеством множества Ф, которое мы обозна- чим через Фь. Ясно, что задача минимизации функционала J на Фь эквивалентна минимизации некоторой функции (k + 1) перемен- ных при наличии дополнительных ограничений. Поскольку Фо S Ф1 £ ..., ясно, что inf7(-)>inf/(•)> .... Фо Ф1 и если бы было известно, что lim inf J( •) = Jo &->oo Фй и что для каждого k существует такой элемент vh е Ф*, что J(»J = inf/(•), фл то Vn как раз и было бы искомым минимизирующим семейством. В этом и заключается главная идея метода Ритца. Приведем теперь условия, гарантирующие эффективность такого подхода. Нам при- дется ввести еще одно новое понятие. (5.15) Определение. Если есть некоторая топология на Д то последовательность {да0, • • •} называется полной в Ф (относи- тельно ST), если Ф является подмножеством ^-замыкания для Другими словами, если v принадлежит Ф, а через N(y) k обозначена некоторая З^-окрестность V, то для некоторого k (вполне возможно, зависящего от N(v)) найдется о^'еФл П N(v). (5.16) Теорема. Пусть выполняются следующие условия: (а) для каждого k = 0, 1, ... найдется такое о* из Ф*, что J(t»°) = inf/(•); фл (Ь) последовательность {и>0, • • •} является полной в Ф от- носительно некоторой топологии ЗГ-, (с) функционал J (•) непрерывен в топологии ST. Тогда {vh: k = 0, 1, ,.образует минимизирующую последова- тельность для J над Ф. Доказательство. Пусть задано некоторое 8 > 0, а б принадлежит Ф и такое, что /(6)<J° + y
5.5 Вычислительные методы теории управления; прямые методы 183 (напомним, что J° = inf /(•)). В силу непрерывности функционала J найдется такая ^“-окрестность N(D), что v е Ф П N(v) гаранти- рует выполнение неравенства |7(о)-7(ё)|<|. А так как {а>0, . . •} полно в Ф, найдется Ьк Е Фй П N (б). Но от- сюда следует 7(бй)<70+е. Однако, согласно условию (а), имеем следовательно, 7°<7(о<>)<704-8. Отсюда сразу получаем lim Л->оо что и доказывает теорему. Хотя метод Ритца довольно хорошо известен, в теории управ- ления его используют недостаточно и дополнительные исследова- ния в этом направлении будут безусловно плодотворными. Помня об этом замечании, мы дадим в заключение пример, показываю- щий, как можно приспособить метод Ритца к решению задач управления. (5.17) Пример. Рассмотрим линейную динамическую систему с про- странством состояния X = L2(Д, R), где Д есть некоторая облает!» из Rn, и пространством Й вида Й = {ц(-): ц(.)е£2([Л, /2]ХД, R), II«(•) L < 1}, где ||и (•) ||оо = ess sup | и (•) |. Предположим, что х0 есть некото- рый заданный элемент из X и что х^(-) является заданной кривой в X. Пусть функционал качества 7(ы(-)) этой задачи имеет сле- дующую форму: t, 7(«(•)) = у f ||хв(0-хДО II2 t, где через хи(*) обозначена траектория рассматриваемой системы, начинающаяся из Хо в момент ti и отвечающая управлению «(•). Заметим, что й слабо компактно и выпукло, и что, поскольку функ- ционал 7(-) является непрерывным и выпуклым, этот функционал полунепрерывен снизу в слабой топологии. Но отсюда следует, что У 7 (•) существует минимум на й. Поэтому, если построить на мно- жестве [6, /г] X Д некоторую (1/&)-сеть (см. рис. 5.3) и если обо- значить через X*, ... характеристические функции (непересекаю-
184 5 Конструирование систем управления щихся) подмножеств пространства [Л, У X Д, порожденных этой сетью, то легко видеть, что множество Qfe ={«(•): = является слабо компактным выпуклым подмножеством множе- ства й. Таким образом, у функционала / (•) существует на й& минимум «^(•). Но так как U&fe (слабо) плотно в й, мы можем воспользо- ваться доказанной теоремой и показать, что lim /(«?)== min /(•). k->«> 4 R' Q Приведенный здесь подход сводится к некоторой процедуре дискре- тизации, и некоторые конкретные численные результаты, относя- щиеся к ее применению, содержатся в книге Фалба [1968Ь]. Там же можно найти и дополнительный материал, связанный с использова- нием метода Ритца в задачах управления.
ТРЕТЬЯ ЧАСТЬ ТЕОРИЯ АВТОМАТОВ М Арбиб 6 Теория автоматов с точки зрения теории управления В главах 7—9 мы увидим, как с помощью алгебраических методов можно исследовать структуру конечных автоматов. Но прежде чем переходить к теории структур, мы в этой главе покажем, что теория автоматов и теория управления не так далеки друг от друга, как это может показаться при поверхностном изучении *)• Мы убе- димся, что понятия, введенные ранее в этой книге для описания систем управления, допускают содержательное с интуитивной точки зрения определение и в рамках теории конечных систем. 6.1 Полугруппы В третьей части этой книги рассматриваются лишь стационар- ные (т. е. с не зависящими от времени свойствами) системы с дис- кретным временем Т = {0, 1, ...}, по крайней мере если специально не отмечено, что Т = [0, оо) и вещественно. Такие системы описы- ваются следующей пятеркой (обратите внимание на изменение обозначений 2)): S = (Q, У, Q, Л, S), где Q — множество допустимых отрезков входных воздей- ствий; У — множество выходных величин; Q — множество состояний; X: Q X й -> Q — переходная функция, определяющая «следующее» состояние системы; 1966р ®сн0вные РезУльтаты эт°й главы получены в работах Арбиба [1965, 2) После написания этой части книги стала укрепляться несколько отличная система обозначений S ™ (X, У, Q, б, X).
186 6 Теория автоматов с точки зрения теории управления 6: Q X й -> У — выходная функция, определяющая «следующее» выходное значение. Эту формальную пятерку можно рассматривать как математи- ческое описание автомата, который, находясь в момент времени t в состоянии q и получая входное воздействие со *) на промежутке времени от t до to, в момент времени t0 оказывается в состоянии k (q, со) и генерирует выходной сигнал 8(q, а>). Сформулируем теперь несколько основных определений и про- ' стых предложений, несложные доказательства которых предостав- ; ляем читателю. (1.1) Определение. Два состояния q и q', соответствующие систе- мам S и S', где S и S' могут быть идентичными или нет, но имеют х! общие й и У, называются эквивалентными тогда и только тогда, ' когда для любого отрезка входного воздействия ©(<„, из Q отрезок ; выходной величины системы S, находившейся в начальный момент времени в состоянии q, совпадает с отрезком выходной величины системы S', находившейся в начальный момент времени в состоя- нии q', т. е. если q q' d (q; 0) = б' (q'-t <о1<а> 0) при любых t и t0, to t и любых входных последовательностях о, допустимых для систем S и S'. | (1.2) Определение. Система S называется приведенной, если в ее пространстве состояний не существует несовпадающих состояний, эквивалентных друг другу. (1.3) Предложение. Если состояния q и q' эквивалентны, то экви- валентны и состояния, в которые переводит системы S и S' любое входное воздействие. (1.4) Определение. Состояние q' системы S называется достижи- мым из состояния q системы S тогда и только тогда, когда суще- ствует такой отрезок входного воздействия <ор0, /> из Q, что I q' = K (q, <£>Ро. о). (1.5) Определение. Система S называется сильно связной, если каждое ее состояние достижимо из любого другого состояния. (1.6) Определение. Системы S и S' эквивалентны, S==S', тогда и только тогда, когда для каждого состояния пространства состояний системы S найдется эквивалентное состояние из пространства состояний системы S' и наоборот. *) Это воздействие удобно обозначать через w у ity
8.1 Полугруппы 187 Наши системы становятся автоматами в смысле теории автома- тов после того, как мы осуществим квантование времени и догово- римся изучать поведение систем в последовательные моменты вре- мени t = 0, 1, ... какой-либо подходящим образом выбранной шка- лы времени, а также потребуем, чтобы множества входных и выходных алфавитов были конечными. Для дискретного времени множество допустимых отрезков вход- ных воздействий становится множеством конечных последователь- ностей, составленных из элементов некоторого конечного множе- ства входных символов X. Это множество X, таким образом, опре- деляет множество й, и поэтому обычно конечный автомат обозначают пятеркой (X, У, Q, X, б), а не пятеркой (£2, У, Q, X, 6). Нет необходимости обязательно требовать, чтобы число состоя- ний автомата (множество Q) было тоже конечным. Если все же множество Q конечно, то соответствующая система М называется конечным автоматом, или машиной с конечным числом состояний. Интересным кажется вопрос о существовании конечного автомата, эквивалентного заданному. Попытаемся теперь распространить на системы общего типа некоторые понятия, обычно встречающиеся лишь в теории автома- тов, что может служить введением в полугрупповую ’) теорию ав- томатов. Обозначим через Т множество конечных и начинающихся с нуля промежутков времени из множества Т. Другими словами, .пусть {О, 1, ...}~ = {{0, 1, .... n}: n = 0, 1, [О, оо)" = {[0, а): а 0}. Вводя следующее обозначение: [а, Ь) = {/ s Т; а t < Ь}, имеем [0, и) = {0, 1, ..., п — 1}, если Т = {0, 1, ...}; при этом [0, Ь) есть обычный полуоткрытый промежуток, если Т — вещественная полу- ось. Тогда Т = {[0, /): /еТ}. При заданных Т и множестве А определим А? просто как множе- ство всевозможных функций, определенных на Г и принимающих значения из А. Если а: [0, а) А и р: [0, Ь) ->-Л, то определим а₽: [0, а + 6) -> А ) Или, если согласиться с М. П. Шютценберже, — введением в моноид- ную теорию, поскольку у всех рассматриваемых здесь полугрупп имеются еди- ницы, но нет топологических структур. Для нас полугруппа есть просто множе- ство с заданной на нем бинарной ассоциативной операцией (xy)z = x(yzf. Основные понятия теории полугрупп и дальнейшее развитие намеченных здесь идей содержатся в следующей главе.
188 6 Теория автоматов с точки зрения теории управления Я с помощью соотношения г i a(t), и (^) ~ t Р (f — а), а t < а + b. I Совершенно очевидно, что Ат является полугруппой относительно 1 этой операции с нулевой функцией Л: 0 -> А в качестве единицы •). I Если а определено на промежутке [а, Ь), то мы определим «длину» 1 а с помощью функции I (а) = b — а. | Дальше в этом параграфе мы будем предполагать, что наше | множество Q допустимых начальных отрезков входных воздействий | является подполугруппой X* множества Хт. | В том случае, когда Т = {0, 1, ..наша X* есть привычная I «свободная полугруппа на X», образованная конечными последова- | тельностями элементов множества X, составленными по правилам 1 сочленения2). g Стационарная система в действительности определяется двумя | функциями | (1.7) X:QXX‘->Q, 6:Qxr->7. ( Обычно автомат задается своими переходными и выходными функ- ; циями X: Q X X -> Q и б: Q X X -> У, но такие функции без вся- кого труда преобразуются к виду (1.7), и мы будем поэтому сво- бодно пользоваться этими последними функциями. Возвращаясь теперь к нашим стационарным системам общего I вида, запишем условие согласованности отрезков входных воздей- j ствий в следующем виде: | X (X (q, х), х') = X (q, хх') для всех q е Q; х,х' е X*. | Назовем отображением «вход — выход» стационарной системы | S, находящейся в начальный момент времени в состоянии q, функ- * цию S,: Г-У, I определенную условием Sq(x)=8(q, х) при хеХ*. Пусть LX'(x) = x'x для всех х', х е X*. Тогда, замечая, что 8(q, х'х)= , = б (X (q, х'), х), мы видим, что • i Sa, (q, хо (х) - 6 (X (q, х'), х) = б (q, х'х) = Sq (х'х) = SqLX’ (х). у Таким образом, имеем S>,(5, х') = SqLx'- 3k ’) Такое определение пригодно^ для стационарных систем. В общем случае нам пришлось бы рассматривать Т = {[a, b): а < b\ a,b е Т) и определять оф только в том случае, когда а определено на [а, с), ар — на [с, Ь) при некото- рых а и b и общем с. 2) Эквивалентные термины —- сшивание и конкатенация. — Прим, иерее.
6.1 Полугруппы 189 Если мы ограничимся лишь выяснением того, как входная последо- вательность преобразуется в выходную, то все, что нам нужно знать о состоянии q, содержится в функции Sq. Возвращаясь к понятию эквивалентности систем, мы сформируем следующее предложение. (1.8) Предложение. Две стационарные системы S и S' с множе- ствами состояний Q и Q' соответственно эквивалентны друг другу тогда и только тогда, когда {3,: q^Q} = {Sr< r'eQ'}. I Кроме того, очевидна справедливость и следующего предло- жения. (1.9) Предложение. Система S является приведенной тогда и толь- ко тогда, когда отображение q i—> Sq взаимно однозначно. Система S называется системой состояние — выход, если най- дется такая функция i: Q -> У, что 8(q,x)= i(k(q,x)), т. е. если выходная последовательность в каждый момент времени зависит лишь от состояния системы в этом момент времени. (1.10) Предложение. Пусть S= (X*, У, Q, X, б). Тогда существует приведенная система «состояние — выход», эквивалентная си- стеме S. Одна такая система 3° называется приведенной реализа- цией системы S, если S° = (X*, Y, Q°, Л°, z°X°), где Q° — {Sq: qt=Q}, А,°(<7°, x) = q°Lx для qQ eQ°, хеГ, i°(<70) = <70(A), например, P(SqLx) = t>(q, x). В случае конечных автоматов приведенная реализация также является конечной. Читатель, знакомый с теорией линейных систем, знает, что приведенная реализация линейной системы с простран- ством состояний Q = Еп будет также линейной с пространством состояний Ет (т п) (см. § 6.2). Однако для нелинейных систем с пространством состояний Еп приведенная реализация может оказаться неинтересной, поскольку приведение может уничтожить евклидову топологию пространства. Это пессимистическая сторона вопроса. Более оптимистический взгляд состоит в том, что топология приведенного пространства состояний может дать полезную информацию о свойствах устой- чивости нелинейной системы.
190 6 Теория автоматов с точки зрения теории управления В заключение этого параграфа определим полугруппы системы 3. Прежде всего напомним, что эквивалентность == на полу- группе А называется конгруэнтностью, если x=y^xz = yz, х = у =$zx*szy цля всех, х, у, z & А. В этом случае можно определить факторполугруппу A/=s, потре- бовав, чтобы ее элементами служили [х]т(классы эквивалентности относительно эквивалентности s), а умножение определялось со- гласно соотношению [x]s [у]а1 = [ху]э. Для системы 3 = = (X*, Y, Q, X, 5) определим отношение эквивалентности ss на по- лугруппе X*, потребовав, чтобы x=sx' тогда и только тогда, когда Sq (uxv) = Sq (их'о) при всех q е Q и и, v е X*. Это отношение, очевидно, является конгруэнтностью, и поэтому мы можем определить полугруппу си- стемы 3 как факторполугруппу X*/=s. В следующей главе мы подробно разовьем полугрупповую тео- рию конечных автоматов. На основе этой теории читатель может в качестве упражнения обобщить многие из соответствующих поло- жений на случай системы общего вида. 6.2 Аддитивность и дуальность В современной математике, начиная с простой теории матриц и кончая абстрактными банаховыми пространствами, изучению ли- нейных задач уделяется столь большое внимание, что совсем не удивительно, если и в теории управления наиболее изученными оказались именно линейные системы. В теории управления обычно считают, что пространства X, Y и Q евклидовы, и теория линейных систем воздвигнута именно на этом основании. В настоящем пара- графе мы получим некоторые из основных теоретических резуль- татов, используя только групповое свойство соответствующих про- странств. Таким,образом, за исключением материала, посвященного изу- чению вопроса дуальности автоматов, мы всюду будем предпола- гать, что X, Y и Q есть абелевы группы, и пользоваться символом «+» для обозначения групповой операции. А так как мы не хотим определять скалярное умножение, мы воспользуемся термином «ад- дитивность» для обозначения различных понятий, аналогичных понятию классической линейности. (2.1) Определение. Состояние 0 системы S называется нулевым, если при всех t имеем 5(0, О') = О,
6.2 Аддитивность и дуальность 191 где О' есть нулевое входное воздействие, 0':[0,/)->У, удовлетво- ряющее соотношению 0* (т) s 0. Следующее определение играет важнейшую роль. (2.2) Определение. Система S называется аддитивной тогда и толь- ко тогда, когда она обладает следующими свойствами: (а) свойством декомпозиции: 6£<?, и) = б(<у, 0'<и>) + 6(0, и); (Ь) аддитивностью в нулевом состоянии: 6(0, х — х')= б(0,х)— -б(0,х/),/(х)= /(xz); (с) аддитивностью при нулевом входном воздействии, т. е. 6 (q' - q", О') = 6 (/, 0') — 6 (q", О'). (2.3) Предложение. Если Х(0, О') =0 при всех t и все состояния системы достижимы из состояния 0, то из свойства (Ь) определе- ния (2.2) следует свойство (а). Доказательство. Предположим, что = Л(0,х). Тогда 6 (q, и) = 6 (Л. (0, х), и) = = б (0, х • и) = = 6 (0, х • 0 + 0 • и) — = 6 (0, х • 0) 4- б (0, 0 • и) = (согласно (2.2) Ь) = 6(Х(0, х), 0)4- 6(Л(0, 0), м) = = 6(7, 0) + 6 (0, и). (2.4) Утверждение. Если S обладает свойством декомпозиции, то состояние q' эквивалентно состоянию q" тогда и только тогда, когда при всех t 0 имеем Поскольку 6 (/ - q”, х) = 6 (/ - q”, 0) 4- 6 (0, х) = б (/, 0) - б {q”, 0) 4- б (0, х), мы видим, что два состояния эквивалентны друг другу тогда и только тогда, когда их разность эквивалентна нулевому состоянию. (2.5) Лемма. Состояния, эквивалентные нулевому, образуют нор- мальную подгруппу N группы Q всех состояний системы. Доказательство. Если г, s^N, то и г — s^N, так как при всех х е X* имеем б (г — s, х) = 6(0, х), т. е. N — некоторая подгруппа. Но поскольку группа Q абелева, подгруппа N нормальна. (2.6) Утверждение. Если состояние q эквивалентно состоянию q' и х е X*, то Л (q, х) - A, (q', х) е N.
192 в Теория автоматов с точки зрения теории управления Таким образом, мы можем построить факторгруппу Q/N. Эле- ментами факторгруппы Q/N являются классы эквивалентности со- стояний системы S. Отсюда следует, что приведенная система для системы S есть просто S° = (X’, Y,~QIN, Л°, б°), где А°( М, *) = [М<7, *)], б° ([<?], х) = б(</, х). (2.7) Следствие. Аддитивный автомат эквивалентен некоторому конечному автомату тогда и только тогда, когда факторгруппа Q/N конечна. (2.8) Определение. Аддитивная система называется вполне адди- тивной, если каждое из трех свойств из определения (2.2) сохра- няется и после того, как б заменено на А. (2.9) Теорема. Система М = (X*, У, Q, Л, б) с множеством моментов времени Т = {0, 1, 2, ...} и структурой абелевых групп на множествах X, Y и Q является вполне аддитивной тогда и только тогда, когда существуют такие гомоморфизмы A: Q->Q, В: X->Q, С: Q->K, D: X-*Y, что при всех q е Q и х е X имеет место k(q, х) = Aq + Вх, б (q, x) = Cq + Dx. п ... xn) = Anq+?rAm-lBxn_m+l, m=\ . /г-1 xn) = CAn~lq + S CAm~lBxn-m + Dxn. m-1 Легко видеть, что в этом случае определение (2.2) удовлетво- ряется как для Л, так и для б. Положим теперь Ф0(п) = СА"-1, (2.10) В этом случае k(q, Xj (2.И) б (о, Xi ... и пусть Ф(п) = Ап, hs(m) = AmB.
6.2 Аддитивность и дуальность 193 Тогда имеем п-1 д(<7, XqXj ... х„_1) = Ф0(п)д+ S h(m)xn-m, п—1 X (q, ХОХ! ... х„) = Ф (п) q + s hs (tn) хп-т. Теперь переход от аддитивных систем к обычным линейным системам состоит в том, чтобы (1) заменить групповые гомомор- физмы гомоморфизмами векторных пространств и (2) заменить дискретное время непрерывным. Таким способом мы получим ли- нейную систему S с пространством состояний Q = Еп и множе- ством моментов времени Т = [0, оо), описываемую уравнением t h где р-мерный вектор y(t) описывает значение выходных величин в момент времени «-мерный вектор x(t) описывает состояние системы в этот же момент времени; r-мерный вектор u(t) есть зна- чение входного воздействия в тот же момент времени. Кроме того, здесь Фо (/) есть выходная матрица перехода системы, i-й столбец которой описывает реакцию системы S в момент времени t на нуле- вое внешнее воздействие при условии, что начальное состояние си- стемы было (0, ..., 1, ..., 0) (где 1 стоит нат'-м месте); и наконец, h(t) есть импульсная характеристика системы S, т. е. реакция системы S, находившейся в начальный момент времени в нулевом состоянии, на импульсное входное воздействие J дельта-функция Дирака, если Т = [0, оо), 1 символ Кронекера i>Qt, если Т = {0, 1, ...}. Если матрица Фо(О дифференцируема, a h не содержит дельта- функций или их производных, то систему S можно назвать линей- ной дифференциальной системой. В этом случае уравнения систе- мы S в пространстве состояний можно записать в следующей диф- ференциальной форме: х (0 = Ф (0) х (0 + hs (0+) и (/), y(t) = Cx(t), а состояние системы в момент времени t определить уравнением t . х (0 = Ф (t -10) х (/0) + | М*~£)«(М> />/0, *0 7 Зак. 693
194 6 Теория автоматов с точки зрения теории управления где h(t) —импульсная характеристика состояния; Ф(0 — переход- ная матрица системы, удовлетворяющая уравнению Ф(0 = Ф(О)Ф(0, Ф(0) = /. Уравнения динамики системы в пространстве состояний, t х(о=Ф(/-/о)хао)+J (2Л2) 1/(0 = Сх(0, справедливы для любых t и to при условии, что переходная матрица Ф(0 и импульсная характеристика состояния hs(t) продолжены на область отрицательных значений времени t. Сформулируем теперь следствие, отражающее один хорошо из- вестный факт. (2.13) Следствие. Если система S описывается некоторым соотно- шением «вход-выход-состояние» типа (2.12) и если система приве- дена, то начальное состояние системы S определимо в том смысле, что при заданных и^^ и y{tt f] начальное состояние x(t0) опреде- ляется единственным образом. Доказательство этого утверждения приведено в § 3.7 работы Задэ и Дезоера [1963]. Таким образом, грубо говоря, линейные дифференциальные си- стемы обратимы. (2.14) Определение. Две системы уравнений х = А (0 х, y= — A*(f)y, в которых А* (0 есть матрица комплексно-сопряженная й транс- понированная относительно матрицы Д(0, называются взаимно сопряженными. (2.15) Теорема. Пусть Ф(0/о)—переходная матрица системы х — A (t)x, и пусть W(t,t0)—переходная матрица сопряженной системы, т. е. 4^(л#о)=-д‘(о^а./о), /«)=/. Тогда Ч* (0 4)Ф(0 t0) — I при всех t и t0. Поэтому (2.16) V (t, t0) - Ф (0 0)'1 - Ф (t0, t).
6.2 Аддитивность и дуальность 195 Справедливо и обратное утверждение. Если переходные мат- рицы двух систем связаны между собой соотношением (2.16), то соответствующие системы являются взаимно сопряженными. Доказательство этой теоремы дано в § 6.2 работы Задэ и Де- зоера [1963]. (2.17) Определение. Пусть импульсная характеристика h(t,l) ли- нейной системы S принимает вещественные значения. Линейная система S<e) называется сопряженной по отношению к системе S, если ее импульсная характеристика h<a)(t,£) удовлетворяет соотно- шению (2.18) h{a\t, |) = й(£, О при всех t и В> где й(а)(М) описывает реакцию системы <S<“> в мо- мент времени t на единичный импульс, поданный на вход этой си- стемы в момент времени £. Таким образом, соотношение (2.18) утверждает, что реакция системы в момент времени t на единичный импульс, поданный в момент времени совпадает с реакцией системы S в момент вре- мени 5 на единичный импульс, поданный в момент времени t. Заметим, что в общем случае, если система S неупреждающая, то система должна быть упреждающей, т. е. текущее значение ее выходной величины должно зависеть от поведения входных воз- действий в будущем. Рассмотрим теперь уравнения (2.19) х = Ах + Ви, у = Сх + Du. Их решение имеет следующий вид: t х (0 = Ф (/ —t0) х (£0) + J Ф (t — т) В (?) и (т) dr, и, следовательно, матричная импульсная характеристика (реакция) на входное воздействие 6(t— to) определяется следующим об- разом: . Й(/, #0) = С(/)Ф(/-/0)В(/0). Точно так же для системы (2.20) | = Л*В + С’о» 1- = B^-D*v с входным воздействием 6(/— /о) матричная импульсная характе- ристика дается формулой hM(t, to) = B*(t)^(t-to)C(to). 7*
196 6 Теория автоматов с точки зрения теории управления Но тогда (2.21) hM(t, t0) = h(t0, ty. Примем соотношение (2.21) в качестве подходящего обобщения соотношения (2.18) на случай систем с многомерными выходными величинами и будем говорить, что система (2.20) сопряжена отно- сительно системы (2.19) (в другом варианте нужно поменять зна- ки перед матрицами В* и С*). В теории автоматов изучением свойств дуальности занимались мало. Единственный интересный результат можно найти в работе Рабина и Скотта [1959]. В нашем изложении мы несколько изменим их определение дуальности. Другую модификацию можно найти в работе Арбиба и Зейгера [1968]. (2.22) Определение. Для заданного _автомата М = (X, У, Q, X, 6), где Q — {<71, ..., qn}, пусть М = (X, У, Q, б‘), где Q — множе- ство подмножеств множества Q, а У — множество подмножеств множества У. Пусть, далее, X’ (9*. х) = (J {/ е= Q: X (t, х) = q}, S’ (q*, x) = (J {S (/, x): X (t, x) = q}. Тогда система M*, дуальная системе М, определяется как систе- ма М, суженная на состояния, достижимые хотя бы из одного из состояний {91}, .... {9П}. В общем случае, если число состояний системы М равно п, то число состояний системы М* порядка 2п, так что при переходе к дуальной системе пространство состояний «расширяется». Опре- деленный интерес представляет выяснение вопроса о том, в каком случае удается сохранить неизменным пространство состояний, как это имеет место для линейных систем. Но состояния системы М* есть состояния {<71), •••, {<7«Ю ОХ (9, x) = X(q', x)=$>q = q' (при всех q, q' gQ, хеХ*)О OX (9, x) = },(q', x)=^q = q' (при всех q, q' eQ, xeX)O О каждое X(-, x): Q->Q является перестановочным. В этом случае систему М* можно отождествить с автоматом MR = (X, У, Q, Х\ S*), где Xй (9, х) определяет единственное q', для которого Х(9', х) = q, а значит, и бЛ(9, х) = 6(9', х).
6.2 Аддитивность и дуальность' 197 Будем говорить тогда, что автомат М является обратимым, а авто- мат MR является обратным по отношению к М. Ясно, что (MR)R = = М. (2.23) Утверждение. Число состояний автомата М* равно числу состояний автомата М тогда и только тогда, когда автомат М об- ратим. В этом случае М* — MR. (2.24) Утверждение. Если автомат М обратим и если найдется такое состояние q, что из него достигаются все состояния автомата М, то автомат М сильно связан. Противопоставим понятию обратимости автоматов общую идею восстанавливающей системы. (2.25) Определение. Системы аир называются восстанавливаю- щими относительно друг друга, если каждая пара вход — выход (и, у) системы а1) такова, что пара (у, и) (у — входное воздей- ствие, а и — выходная величина) является парой вход — выход для системы р, и наоборот. (2.26) Теорема. Автомат, являющийся восстанавливающим для не- которого конечного автомата, не обязательно конечен. Доказательство. Пусть М есть конечный автомат с пг входами и п выходами, и пусть га < ш. Тогда у автомата М возможны /га* входных последовательностей длины k и не более чем пк выходных последовательностей той же длины. Пара (xi ... xk, у\ ... ук) является парой вход — выход авто- мата М, если найдется такое состояние q автомата М, что (2.27) yn = 6(q, хг ... хп) для 1<га<^. Пусть теперь автомат Мс является восстанавливающим для М (он может быть описан не полностью). Если число состояний авто- мата Мс конечно и равно, скажем, г, то, согласно уравнению (2.27), необходимо, чтобы mh^.rnk, или чтобы r>- (m/n)h. Увеличивая k, мы придем к противоречию, что и доказывает теорему. Если М** представляет собой систему, двойственную некоторой системе, двойственной системе М, то, как известно, система М изо- морфна либо системе М**, либо некоторой подсистеме системы Л4**. В связи с этим возникает искушение в рамках теории автома- тов принять, что автомат М эквивалентен наименьшему подавто- мату автомата М**, состояния которого содержат {{</1}}, .... Обозначим этот подавтомат через Л?. Однако состояние {<71} в об- щем случае не достижимо из других состояний автомата М*. ’) То есть найдется такое q е Qa, что y(t) = d ty, «р,
198 6 Теория автоматов с точки зрения теории управления Операция обращения необращающихся автоматов в общем случае каждый раз вызывает увеличение мощности пространства состоя- ний. А это значит, что в общем случае k** ({{<?i}}, х) = 0, что не представляет для нас никакого интереса. Для того чтобы убедиться в этом, приведем следующий расчет: Г (Я, v) (J (Q' = Q: к* (О', х) = Т}, T&R где (J {qe=Q: k(q, х) = /}. Если R = то Г (/?, х) = {Q' S Q: А,’ (О', х) = {qt}}. Но чтобы выполнялось соотношение {<?<} = U {q^Q- ^(q, x) = q'}, необходимо и достаточно иметь Q' = {k(qt, xf)} и k(q, х) = = k(qi,x) => q = qi. Это приводит нас к следующему результату. (2.28) Теорема. Автомат М изоморфен подавтомату М автомата М** тогда и только тогда, когда автомат М обратим. 6.3 Управляемость и наблюдаемость В гл. 2 мы видели, как вводятся понятия управляемости и на- блюдаемости для линейных дифференциальных систем S, описы- ваемых уравнениями типа х = Ах 4- Ви, 3’1 y = Cx + Du, где А, В, С и D — соответственно матрицы размера п X п, п X г, р X п и р X г; кроме того, здесь га-мерный вектор х описывает со- стояние системы; r-мерный вектор и описывает входное воздей- ствие, а р-мерный вектор у дает выходную величину системы 5. Попытаемся перенести как можно больше из этой теории на случай общих систем (и, в частности, автоматов). При этом оказы- вается, что для получения многих результатов требуются лишь наши условия аддитивности, а не условия линейности, используе- мые обычно. Будем говорить, что состояние q управляемо, если можно найти такое входное воздействие, которое переведет систему из состояния q в нулевое состояние. Другими словами, для любой системы Scot-
6.3 Управляемость и наблюдаемость 199 меченным состоянием 0 введем следующее формальное определе- ние. (3.2) Определение. Состояние q системы S управляемо тогда и только тогда, когда существует такое и е X*, что А,(<у; «) = 0. Система S называется управляемой тогда и только тогда, когда управляемо каждое ее состояние. (3.3) Утверждение. Если S есть система, каждое состояние кото- рой достижимо из 0, то из управляемости системы S следует, что эта система сильно связна; справедливо и обратное. Вернемся теперь к уравнениям (2.10) аддитивной системы М. Эта система обратима (см. (2.21)), если при каждом х обратимо отображение А(-, х), иначе говоря, если для каждого г е Q суще- ствует единственное решение уравнения Aq — г — Вх, т. е. тогда и только тогда, когда А есть некоторый автоморфизм множества Q с обратным, обозначенным, скажем, через Л-1. Вве- дем следующие обозначения: А* (г, х) = Л-1г — А~1Вх, д* (г, х) = S (АЛ (г, х), х) = = С[Л“'(г-Вх)] + Ох = = СА~'г + [£) - СЛ-1В] х. Тогда система MR = (X, Y, Q, AR, 6Н) является также вполне ли- нейной. Заметим, что действительно MRR — М, поскольку (Л-1)~1 = Л СА~1АА~'В-СА~'В + О = О и т. д. Но наше утверждение (3.3) гласит, что обратимый автомат М уп- равляем тогда и только тогда, когда все его состояния можно до- стичь из нулевого состояния. Воспользовавшись уравнениями (2.11), мы сразу получим следующий результат. (3.4) Теорема. Обратимая вполне аддитивная система управляема тогда и только тогда, когда каждое состояние q можно предста- вить в виде некоторой линейной комбинации вида Am~'Bx, xel. Возвращаясь теперь к системе (3.1) и вспоминая, что n-ю сте- пень Ап произвольной матрицы размера п х п можно представить
200 6 Теория автоматов с точки зрения теории управления как линейную комбинацию I, А, Л2, ..., Ап~\ мы увидим, что нами доказана «в основных чертах» теорема (3.4) из гл. 2. (3.5) Теорема. Система (3.1) управляема тогда и только тогда, когда на вектор-столбцы матрицы [В, АВ, .... Л"-1В] натягивается пространство состояний этой системы S. Другим центральным понятием является понятие наблюдаемо- сти. В случае линейных систем мы увидим, что это понятие дуально понятию управляемости. На самом же деле простота этого понятия в рамках теории линейных систем привела к тому, что большинство специалистов по теории систем не заметили тех сложностей, кото- рые связаны с этим понятием в применении к нелинейным систе- мам и которые были изучены специалистами по теории автоматов. Будем говорить, что некоторое состояние системы наблюдаемо, если его можно определить, наблюдая поведение входного воздей- ствия и выходной величины системы. Однако слова «наблюдение входного воздействия и выходных величин» можно понимать совер- шенно по-разному. Обратимся к следующему определению. (3.6) Определение. (а) (Обычным) простым экспериментом называется некоторая пара вход — выход (х$ f), y{t^ 0). Другими словами, мы подаем на вход системы, находящейся в неизвестном состоянии, входное воз- действие и наблюдаем выходную величину системы у9а t). (b) Ветвящимся простым экспериментом называется пара вход — выход (хР() f), у^ /))» для которой при t0 < t' < t справед- ливо х (и=f(X[t о’и, ^/4 В определениях (с) и (d) каждая из N реализаций начинается с одного и того же состояния, хотя это состояние может быть и не- известным. . (с) (Обычный) множественный эксперимент кратности N со- стоит из W пар вход — выход (xz (<о 0, yt [Zo z)), 1 < i < N. Другими словами, мы подаем xt [Zo на вход i-й реализации среди N реали- заций системы и наблюдаем ее выходную величину yi[h tr (d) Ветвящимся множественным экспериментом кратности N называется совокупность из N пар вход — выход (xt f), у( [/(| 0), 1 i N, где для t0 < t' < t справедливо ХН*') . х1(4, «О #!(/<>, Г) • • • = f ................ - J /') yNltt, t').
6.3 Управляемость и наблюдаемость 201 Аналогичным образом можно определить бесконечные эксперимен- ты. Во всех случаях разность t — t0 называется длиной экспери- мента. (3.7) Определение. Две системы Si и Sa называются примитивно эквивалентными, если не существует простого эксперимента, разде- ляющего их, т. е. если для любых qi и любых Z) найдется та- кое ?2. что ^1 (^р хр0, о) = xv„ о) и наоборот. - (3.8) Определение. Системы Si и 5г называются сложно эквива- лентными, если их невозможно разделить с помощью любого мно- жественного эксперимента, т. е. тогда и только тогда, когда каждое состояние системы Si эквивалентно некоторому состоянию системы S2, и наоборот. (3.9) Теорема. Если системы St и S2 примитивно эквивалентны и сильно связны, то они сложно эквивалентны. Доказательство этой теоремы можно найти на стр. 28—30 книги Гинзбурга [1962], содержащей исчерпывающее исследование этого понятия эксперимента в рамках теории автоматов. (3.10) Определение. Система S называется определимой в узком (широком) смысле, если независимо от характера начального со- стояния q0 экспериментатор может установить вид q0 по любому (некоторому) эксперименту на системе S, находившейся в состоя- нии qo. Читатель может проверить свое понимание этого понятия, попы- тавшись (непосредственно) доказать следующую теорему. (3.11) Теорема. Система является приведенной тогда и только то- гда, когда она определима с помощью некоторого бесконечного множественного эксперимента. Ясно, что система может быть определимой с помощью экспе- римента любого типа только в том случае, когда она является при- веденной. Однако приведенная нелинейная система может быть не- определимой с помощью обычного простого эксперимента. Соглас- но Гинзбургу [1962], для системы (n, т, р), т. е. для системы с п состояниями, т входами и р выходами, справедлива следующая теорема. (3.12) Теорема. Начальное состояние приведенной системы (п, tn, р) можно определить с помощью некоторого множествен- ного эксперимента длины, не большей (п — 1), и кратности, не большей (га — I).
202 6 Теория автоматов с точки зрения теории управления Дадим еще две новые теоремы и одно следствие, доказанные Форром [1965]. (3.13) Теорема. Каждый вывод относительно обратимой системы, который может быть сделан на основании некоторого множествен- ного эксперимента, можно получить из некоторого простого экспе- римента. Доказательство. Пусть наши эксперименты проводятся последова- тельно. После /-го эксперимента на вход автомата подается «обра- щение» /-й входной последовательности, возвращая таким образом систему 3 в начальное состояние, после чего можно начинать (/ + 1)-й эксперимент. Теорема доказана. На основании теоремы (3.12) и доказательства теоремы (3.13) приходим к следствию. (3.14) Следствие. Каждая обратимая система (п,т,р) определима с помощью простого эксперимента, имеющего длину меньше (п— 1)(2п — 3). (3.15) Теорема. Аддитивная система с дискретным временем опре- делима тогда и только тогда, когда она является приведенной. Если пространство состояний Q этой системы является п-мерным векторным пространством, то начальное состояние системы мож- но определить с помощью любого простого эксперимента длины п. Доказательство. Теорема доказывается непосредственной провер- кой с использованием уравнений (2.10) и (2.11). Доказательство второго утверждения теоремы опирается на то, что произвольная степень любого линейного преобразования А пространства размер- ности п является некоторой линейной комбинацией преобразований А°, А>,..., Лп-*. Введем теперь следующее определение. (3.16) Определение. Система 3 называется наблюдаемой тогда и только тогда, когда она является приведенной. Смысл этого определения заключается в том, что для наших аддитивных (линейных) систем оно эквивалентно определимости начального состояния любого вида. Однако для нелинейных си- стем существует много неэквивалентных понятий определимости начального состояния, так что специалист по теории нелинейных систем должен быть готов к тому, чтобы исследовать разные виды наблюдаемости. Вербеек в устном сообщении привел следующий пример (рис. 6.1) конечного автомата, который является приведен- ным, но начальное состояние которого не может быть определено е помощью простого эксперимента,
6.3 Управляемость и наблюдаемость 203 Этот автомат имеет входной алфавит X = {а, Ь}, выходной алфавит Y = {0, 1), множество состояний Q = {qi, q* <7з1- Входная последовательность, начинающаяся с а, не позволит раз- делить состояния qi и <?з, а последовательность, начинающаяся с Ь, не позволит разделить состояния qi и q%. Поэтому никакой про- стой эксперимент не гарантирует нам, что система находилась в состоянии qi (если так и было на самом деле!), в то время как мно-. жественный эксперимент кратности 2 позволит выяснить это. Теперь мы знаем, что наша вполне аддитивная система (2.10) является приведенной только тогда, когда N = {0}, т. е. когда ну- левое состояние эквивалентно лишь самому себе. Но тогда непо- средственно из уравнений (2.11) получается следующий резуль- тат. (3.17) Теорема. Вполне аддитивная система S наблюдаема тогда и только тогда, когда CAk~'q = Q для всех k^q — Q. А отсюда мы сразу получим знакомое утверждение из гл. 2. (3.18) Следствие. Система S, описываемая уравнениями (3.1), на- блюдаема тогда и только тогда, когда пространство состояний си- стемы S натягивается на вектор-столбцы матрицы [С‘, А*С’> .... ААп~1}С]. Объединяя теорему (3.5) и следствие (3.18), мы получаем сле- дующую теорему Калмана [1962] о дуальности. (3.19) Теорема. Пусть S есть система, дуальная системе S, описы- ваемой уравнениями (3.1). Она описывается уравнениями |=-A^ + C’v,
204 в Теория автоматов с точки зрения теории управления где g есть п-мерный вектор состояния, v есты р-мерное выходное воздействие, а т] есть r-мерная выходная величина. Тогда система S управляема в том и только том случае, когда система S наблю- даема, и наоборот. Вспоминая наши замечания о приведенных аддитивных систе- мах, мы получим еще одну теорему. (3.20) Теорема. Аддитивную систему с группой состояний Q и под- группой N состояний, эквивалентных нулевому состоянию, можно разбить на две подсистемы Si и Sz, из которых Si наблюдаема, a S2 ненаблюдаема, тогда и только тогда, когда Q^NXQ/N, т. е. когда декомпозиция Q через N расщепляет Q. Отметим, что мы использовали здесь лишь условия (а) и (Ь) из определения аддитивной системы (2.2). В случае же линейной системы множество Q становится линейным векторным простран- ством, /V — его подпространством, а в этом случае приведенная де- композиция всегда расщепляется. 6.4 Толерантные автоматы Каждый раз, когда речь заходит об использовании понятия не- прерывности, специалист по теории автоматов начинает испыты- вать острую зависть к специалисту по теории управления. В связи е этим возникает следующая задача: «Как определить содержатель- ную топологию на дискретном множестве, отличную от дискретной топологии?» Для тех ученых, которые используют конечные авто- маты в виде нервных сетей с целью построения грубых моделей мозга, может оказаться интересным такой вопрос: «Каково долж- но быть определение непрерывности, чтобы она естественно при- сутствовала в поведении конечных автоматов?» В ответ на эти во- просы автор [1966] предложил идею толерантных автоматов. В ее основу кладется попытка своеобразного определения понятия «не- прерывности» в пространстве состояний. Теория толерантных ав- томатов получила дальнейшее развитие в другой работе автора [1967]. Толерантность и непрерывность. Основным понятием является понятие толерантности, введенное Зееманом [1962]. (4.1) Определение. Толерантностью g на множестве X называется всякое отношение, определенное на X и являющееся рефлексивным и симметричным. Толерантным пространством (X, g) называется множество вместе С определенной на нем некоторой толерант- ностью.
6.4 Толерантные автоматы 20,5 (4.2) Пример. Пусть X есть евклидова плоскость. Тогда толерант- ностью j могут быть любые пары точек, находящиеся друг от друга на расстоянии, не большем е. (4.3) Пример. Пусть X есть зритёльное поле глаза. Тогда толерант- ностью g может быть острота зрения, т. е. условия того, что любые пары точек неразличимы для глаза. Разовьем теперь эти понятия. В духе теории автоматов предпо- ложим, что время дискретно, Т = {0,1,...}. Пусть (X, |) есть некое толерантное пространство. (4.4) Определение. Назовем движением (траекторией) в X некото- рую функцию tn: Т-+Х, а положением точки (выполняющей дви- жение tn) в момент времени t — значение этой функции m(t). То- гда рассматриваемое движение tn называется ^-непрерывным, если [m(/)> m(t + l)]eg при любых t. Другими словами, £-непрерыв- ность требует отсутствия «различных скачков траектории движе- ния». Очевидно, что это определение ведет к интуитивно оправдан- ному понятию непрерывности для дискретного автомата М при ус- ловии, что множество входных воздействий автомата М представ- ляет собой совокупность Lx подмножеств некоторого толерантного пространства (X, |). В этом случае мы можем представлять себе автомат М, например, в виде сетчатой оболочки глаза, на которой каждой точке множества X соответствует один рецептор. Для та- кого автомата входное воздействие состоит в стимуляции некото- рых рецепторов: Толерантность удобно определить и на Т, восполь- зовавшись понятием «соседства», т. е. потребовав, чтобы (х, у) е g тогда и только тогда, когда |х — 1. Пусть теперь М — (X, Y, Q, X, б) есть некоторый автомат. По- ставим в соответствие каждой входной последовательности и — = («ь «2, ...) X® некоторое движение mu: T-+Q, где та(О) = <7о (начальное состояние из Q), ma(t + l).= L(ma(t), ut). Определим на Q некоторую толерантность Будем называть ав- томат М толерантным, если каждое движение ши является |-не- прерывным при любых и е Xю. Если выбрать в качестве | тривиальную толерантность е = = Q X Q, то любой автомат окажется е-толерантным. Таким обра-< зом, следующие ниже’ теоремы справедливы для всех автоматов, но часто оказываются бессодержательными, если единственная возможная толерантность является тривиальной. В дальнейшем символом g, снабженным в случае необходимости отличительным индексом, всегда обозначается некоторая толерант’ ность.
206 в Теория^автоматов с точки зрения теории управления (4.5) Определение. Пусть М = (X, У, Q, X, б) есть автомат, для ко- торого Q есть некоторое толерантное пространство. Автомат М на- зывается толерантным, если для каждого хеX и q е Q справед- ливо соотношение (q, X (q, х)) Е |q. Таким образом, толерантные автоматы обладают инерцией. Не- ожиданное изменение входного воздействия не может вызвать рез- кого изменения состояния автомата. (4.6) Пример. Рассмотрим обычную вычислительную машину М, для которой состояние машины определяется содержанием ее реги- стров. Если два состояния связаны отношением толерантности, когда они различаются содержанием некоторого ограниченного чис- ла регистров, то М. представляет собой толерантный автомат. (От- метим, что в отсутствие входных воздействий, поступающих от «внешней фазы», в качестве входных воздействий приходится рас- сматривать синхронизирующий импульсы датчик времени.) (4.7) Определение. Пусть X и У есть некоторые толерантные про- странства. Функция f : X —>• У называется ^-непрерывной, если (xi, х2) е (f (Х[), f (х2)) €= Напомним, что (Xi, х2) Е |2, если существует такое х, что (xi, х) е £ и (х, х2) е £. Аналогичное соотношения справедливы и ДЛЯ 1п. (4.8) Определение. Функция f: X-*-Y называется п-непрерывной, . если (Хр х2) Е => (f (X]), f (х2)) Е (4.9) Определение. Пусть М = (X, У, Q, X, б) есть некоторый толе- рантный автомат. Тогда автомат М называется п-толерантным, если функция X(*,x):Q—является n-непрерывной при каждом хеХ. . (4.10) Теорема. Каждый толерантный автомат является 3-толе- рантным автоматом. Доказательство. Имеем (q, Х(<?,х)) e|q, (q',\(q',x')) Egg, а по- этому, если (q, q') Е £<?, то (Х(<?, х), X (/, х')) Е (4.11) Теорема. Пусть М есть некоторый {-толерантный автомат. Тогда функция Х( •, х): Q->Q является ^-непрерывной при каждом х е X*. Доказательство. По определению 1-толерантного автомата функция X(-,x):Q—» Q является 1-непрерывной при любых х е X. Но Х(-, xt/) = Х(Х(-,х),у). Отсюда требуемые результаты получаются сразу по индукции, так как если f и g являются ^-непрерывными, то этим свойством обладает и их композиция.
6.4 Толерантные автоматы 207 Таким образом, 1-толерантные автоматы обладают свойством устойчивости, чего нельзя сказать о толерантных автоматах общего вида. Другими словами, у 1-толерантных автоматов небольшие раз- личия в начальных состояниях не могут привести к значительным различиям в состоянии в будущем. Поэтому каждое отображение Х(-,х) : Q —► Q в определенном смысле является сжимающим, что сразу становится понятным, если определить метрику на Q следую- щим образом: d (х, х') = min {и: (х, х') е £"}. Выходная толерантность. Если подходить к автоматам с точки зрения теории «черного ящика», т. е. уделять основное внимание поведению входных воздействий и выходных величин, а не измене- нию состояний, то имеет смысл ввести новые понятия, связанные с толерантностью и устанавливающие соответствие между «незна- чительными изменениями» входных воздействий с «незначитель- ными изменениями» выходных величин. Поэтому приведем еще несколько определений. (4.12) Определение. Пусть М = (X, У, Q, К, б) есть автомат, для которого множество входных последовательностей является толе- рантным пространством (X*, £х.), а множество выходных последо- вательностей есть толерантное пространство [У*, £у,). Тогда авто- мат М называется внешне толерантным, если при любых состоя- ниях q s Q и х, х' е X* имеет место соотношение (х, х') <= => (б (q, х), 6 (q, х')) е= |у.. Часто особенно интересным оказывается случай, в котором толе- рантность индуцируется непосредственно толерантностью gjr, определенной на X. (4.13) Определение. Пусть (A, g) есть некоторое толерантное про- странство. Тогда толерантное пространство (А*, £*) называется ин- дуцированным толерантностью |, если а, а' е А* связаны между со- бой отношением тогда и только тогда, когда а = (ар .... а„), а' = (<....<) удовлетворяют условиям п = п' и (ар а[) <= I, ..., (ая, а') е g. Обозначим через LP(X, У) множество функций из X* в У*, со- храняющих длину последовательности. Тогда и индуцируют естественное подмножество множества LP(X, У), образованное функциями, непрерывными относительно и |у: f е= LP5 (X, У) О (х, х') е => (f (х), f (х')) е .
208 6 Теория автоматов с точки зрения теории управления Таким образом, ясно, что автомат М оказывается внешне толерант- ным тогда и только тогда, когда Mq е LP^(X, Y). На множестве LP(X, Y) можно определить естественную толе- рантность (f, f') <= lLp О (f (х), f (х)) е g* для всех х е X*. Будем говорить, что автомат М является естественно толерант- ным (по отношению к входной толерантности и выходной толе- рантности £у), если для каждого ?eQ и каждого хеХ имеет место (Mq, MqLx)<=lLP. Толерантность g на X можно определить также, основываясь на толерантности £у, определенной на Y. В этом случае (х, х)6(<7, х'))е£у для всех q^Q. Заметим, что обычно от толерантности на X* (или У*) требуется правая инвариантность, т. е. чтобы имело место соотношение (х, х')^£х. и х" е X* => (хх", х'х") е Любые толерантности, введенные в явном виде выше, обладают этим свойством. В действительности же они обладают даже более сильным свойством: (х, х')^^. и (х", х"')<=£х,=^(хх", х'х"')<=1х,. Границы и оптимальность (4.14) Определение. Пространство С называется платежным, если (а) С есть толерантное пространство с толерантностью В; (b) С есть абелева группа с групповой операцией, обозначае- мой символом +, частично упорядоченная отношением <; (с) для каждого се С найдутся такие a, b е С, что отношения а<с<Ьиа<.с' <_ b гарантируют, что (с, с') е На самом же деле мы обычно представляем себе платежное пространство как множество вещественных чисел с определенной на нем толерантностью (с, с') <= |4Ф| с — с'1 < е при некотором фик- сированном е > 0. Для заданного автомата М = (X, Y, Q, X, б) и заданного пла- тежного пространства С платежной фунцией М называют некото- рую функцию р : Q X X С. Продолжим р на множество Q X X*, потребовав, чтобы Р <4, ху) = p(q, х) + р (A (q, х), у). Тогда задачу оптимального управления автоматом можно сформу- лировать следующим образом.
6.4 Толерантные автоматы 209 (4.15) Задача оптимального управления. Пусть q0 и q\ есть два состояния из Q, называемые соответственно начальным и конечным. Будем говорить, что и = (Uj, ..., ип) е X* переводит М из состоя- ния qo в состояние q\, если X (q0, и) = и в то же время Х(<?0. “1..«&)=?*= <71 при всех k < п. Требуется среди всех последовательностей и из X*, переводящих М из qo в q\, найти такую, для которой p(qo, ы) мини- мально1). Пусть М — (X, Y, Q, %, 6) есть некоторый автомат с платежной функцией р и платежным пространством С. Определим тогда (обычно бесконечный) автомат (М, р) = (Х, Y,QXC, Хр, бр) следующим образом: Хр (q, с, х) = (Л (q, х), с + р (q, х)), бр (q, с, х) = б (q, х). Пусть достижимым в Q X С X Т множеством Rq> называется {(М<7о. О, и), 1(и)): и^Х'}, где ХР(<7о, О, Л) = (<7о, 0), а Л есть пустая последовательность. (4.16) Определение. Пусть X и Y есть некоторые толерантные про- странства. Тогда толерантным произведением этих пространств на- зывается декартово произведение X X Y, наделенное толерант- ностью (U, у). « /))еЦФ>(х, х^&м, (у, tf)^lr. Пусть теперь М есть 1-толерантный автомат, и пусть Q X С рас- сматривается как толерантное произведение пространств Q и С. Для каждого п рассмотрим сечение .множества Rq„ в момент вре- мени п: Rl = Up (ft, 0, в): « е Хп] s Q X С. Если последовательность и оптимальна, то ей соответствует мини- мальная проекция на С по сравнению с любыми другими точками сечения Rq„, и, следовательно, необходимое условие оптимальности управления и состоит в том, чтобы (qo, 0, и) определяло точку на границе множества Rq,. ’) Более точная формулировка требует попадания из состояния qo в со- стояние, толерантное состоянию qu Приведенная формулировка может рассма- триваться лишь в качестве пробной.
210 в Теория автоматов с точки зрения теории управления (4.17) Теорема. Для каждого состояния q i-толерантного автомата М и каждого п^Т множество Rn„ связно относительно £1'). Доказательство. Пусть qv q2 е /?". Тогда найдутся такие х = = (*1, ..., хп) - и х' — (%,, ..., х') из Хп, что Л (?, х) = q\ и X (q, х') = ^2- Пусть р(/п) = Х(?, хр .... xm, x'm+l, ..., х'); тогда р (0) = ^р р (n) = q2 и (р (tri), р (tn + 1)) е Доказательство окончено. Теперь нам придется сделать маленькое отступление и сформу- лировать понятие «границы» в терминах толерантных, а не тополо- гических пространств. По аналогии с обычными топологическими определениями введем следующие определения. (4.18) Определение. Пусть 3 есть некоторое подмножество толе- рантного пространства X. Тогда назовем ^-замыканием подмножества S множество S = {х: (х, у) е £ для некоторого s е S); ^-внутренностью подмножества S множество int S = {х: (х, у) е ^-границей подмножества 3 множество 6S = S —int S = = {х: (х, у) е £ для некоторого у е S, но (х, г) е для некоторого (4.19) Лемма. X — В = int(X — 3). Доказательство; Имеем xeX-SO(x, y)<=l^y<£S& Ох <= int (X — 3). Таким образом, в действительности из определения (4.14с) сле- дует, что если и оптимально, то Хр(д0, 0, и) еб/?",. (4.20) Яеорема. Пусть М есть 1-толе рентный автомат, и пусть и = («1....ип) <= Хп. Если Кр (q, и) е f>Rq, то (Чь» ск) = ^р(,Яг 0» «р • • •» 1 Доказательство. Предположим, что существует некоторое fe<n, такое, что (qk, cft)sint/?*, и в то же время (qk+i, cft+1) ed/?*+1. Но тогда (qk, при некотором с' <ck. Пусть (qk, c')=Kp(q, о), osXk. Но тогда \p(q, vuk+i) = (K(qk, ufe+1), c' + c(qk, «fc+1)), что противоречит предложению об оптимальности и. Теорема доказана. Специалист по теории управления легко узнает в этой теореме аналог теоремы, на которой базируется принцип максимума Пон- трягина теории оптимальных систем. *) Это улучшение результата Арбиба [1966], доказавшего связность относи- тельно |q, принадлежит Вербееку (личное сообщение автору).
7 Основные понятия теории автоматов и теории полугрупп Следующие три главы посвящены проблеме структуры дискрет- ных систем, которые принято называть автоматами. А так как в связи с этим мы отходим от понятий математического анализа, с которыми многие наши читатели достаточно хорошо знакомы, и начинаем использовать понятия современной алгебры, не столь знакомые рядовому читателю, в следующем параграфе мы с ра- зумной степенью детализации заложим алгебраические основы, необходимые для понимания последующего материала. Нам хочется разобраться, каким образом можно осуществлять декомпозицию автоматов на более простые автоматы, соединенные друг с другом последовательно или параллельно. Для этого ка- ждому автомату ставится в соответствие некоторая полугруппа. Затем выясняется, что каждый автомат можно разбить на более простые автоматы, если только исходный автомат не представляет собой триггер или простую группу его полугруппы. Верно и обрат- ное: любую разложимую машину М можно построить в виде соеди- ненных друг с другом триггеров или автоматов простых групп, где искомые простые группы связаны с полугруппой машины М таким известным алгебраическим свойством, как делимость. 7.1 Полугруппы и конгруэнтность В этом параграфе дается математический язык, на котором бу- дет излагаться структурная теория автоматов. Читатель, не знако- мый с затрагиваемыми вопросами, должен тщательно изучить ма- териал данного параграфа, чтобы прочно усвоить вводимые здесь понятия, и лишь после этого он может переходить к дальнейшему изучению ’). Прежде всего напомнцм сравнительно знакомое понятие группы. (1.1) Определение. Группой называется множество G с заданной на нем бинарной операцией m: G X G ->G (вместо т (а, Ь) обычно пишут ab) при условии, что (а) операция т ассоциативна, т. е. для любых a, b, с е G спра- ведливо (ab)c = а(Ьс); ’) Приводимый ниже материал имеется, например, в монографиях Клиффор- да и Престона [1961] и Ху Сы-цзяна [1965].
212 7 Основные понятия теории автоматов и теории полугрупп (Ь) на множестве G определена единица е, т. е. существует та- кое ее G, что ае = еа = а для любых asG; (с) для каждого элемента а е G существует обратный ему а-1 е G, т. е. для любых а е G найдется такое a~l е G, что аа"1 = а~1а~е. Рассмотрим, например, множество целых чисел {..., —2, —1, О, 1, 2, ...} с определенной на нем операцией сложения. Это есть группа, так как (а + Ь) + с = а + (Ь + с), а + 0 = 0 + а = а, а + (—а) = (—а) + а = 0. Однако целые числа не образуют группы относительно умножения, так как, хотя (ab) с = а (be), а\ = \а — а, обратные элементы не являются целыми, за исключением случая а = ± 1. (1.2) Замечание. Бинарная операция m(a,b) называется комму- тативной, если m(a,b) = m(b,a) при любых а и Ь. Группа назы- вается абелевой или коммутативной, если коммутативна ее группо- вая операция. Возможно, простейшим примером неассоциативной операции мо- жет служить вычитание а — (Ь — с) =£ (а — Ь) — с. Мы не станем заниматься здесь неассоциативными операциями, но нас будут интересовать операции, для которых не обязательно су- ществование обратных. Это подводит нас к понятию полугруппы, которая может и не обладать всеми свойствами группы. (1.3) Определение. Полугруппой называется множество S с опре- деленной на нем бинарной операцией m: SX<S->S (обычно вме- сто т(а, Ь) пишут а-Ь) при условии, что (а) операция т ассоциативна, т. е. для всех a, b, с eS спра- ведливо (а-b)-с = а-(Ь-с). Если в S имеется единица, т. е. такой элемент е, что е • s = s • е = $, то полугруппу 5 иногда называют моноидом.
7.1 Полугруппы и конгруэнтность 213 Таким образом, каждая группа является и полугруппой, но об- ратное не верно, так как множество целых чисел образует моноид относительно умножения (с единицей 1), но не является группой. Целые числа, большие 1, образуют полугруппу и уже не являются моноидом. (1.4) Определение. Подполугруппой полугруппы S называется не- которое подмножество S' s S, замкнутое относительно умноже- ния (полугрупповой операции): Sj, S% S —т’ $[ • $2 S • Рассмотрим некоторое конечное множество 2 символов. Обозна- чим через 2* множество всевозможных конечных последовательно- стей (Jj ... оп, TPfi. каждое ст» е 2. Пусть Л означает пустую последовательность, для которой п = 0, и пусть АеУ. Определим бинарную операцию m на 2* как операцию сшивания, сочленения или приписывания: tn (<Tj .,. . <Зп, Т; . . . Тт) = <Т| .... ... тт. Обозначим ш(х, у) через ху. Совершенно ясно, что (xy)z — x(yz). Ясно также, что Л может служить единицей, так как Лх — хЛ. = х, так что 2* является моноидом. Если х = си ... оп, то п называется длиной последовательности о и обозначается через /(or). Тогда /(Л) =0 и 1(х,у) = /(х) + 1(у) так же, как у логарифмической функции. Будем называть множество 2* вместе с операцией сшивания свободным') моноидом, индуцируемым множеством 2. Пусть X есть произвольное множество, и пусть f есть некоторое отображение множества X в себя. Мы будем называть его преоб- разованием множества X. Если приписывать символ функции сле- ва от аргумента, то совокупность таких преобразований становится полугруппой FL(X) относительно закона композиции (f ° g)(x) = = f(g(x)). Если же приписывать символ функции справа от аргу- мента, то это множество становится полугруппой FR (X) относитель- но закона композиции (х) (f°g) =[(x)f]g. Таким образом, при пере- ходе от Fl(X) к Fr(X) приходится изменять порядок композиции. (1.5) Определение. Гомоморфизмом некоторой полугруппы Si в другую полугруппу S2 называется любое преобразование р: Si -> !) Прилагательное «свободный» в данном контексте означает по сути дела, что элементы моноида свободны от каких-либо ограничений, кроме тех, которые накладываются ассоциативностью. Ни одна конечная полугруппа, содержащая более одного элемента, не является свободной. Для наших целей достаточно рассматривать это прилагательное лишь как указание на S*. Подробности мож- но найти в книге Ху Сы-цзяна [1965].
214 7 Основные понятия теории автоматов и теории полугрупп ->S2, для которого p(S‘S') = p(s) -p(s') для любых s, s' е Sb Если же Si и S2 есть моноиды, а р отображает единицу полугруппы Si в единицу полугруппы S2, то р называют гомоморфизмом моноидов. Таким образом, умножение на 2 представляет собой гомомор- физм множества целых чисел относительно сложения, но не может рассматриваться как гомоморфизм целых чисел относительно умно- жения. Действительно, 2 (а + Ь) = 2а + 2Ь, но 2 (а • Ь) =И= 2а • 2& (если только а • Ь ф 0). Отображение р называется сюръективным (накрытием или ото- бражением на), если для каждого s2gS2 найдется такое $i что p(si)=s2. Короче говоря, для сюръективного отображения p(Si) =S2. (1.6) Определение. Представлением полугруппы S называется го- моморфизм Т: S->FN(X), где X — некоторое пространство, a N = L (или R). Например, если N = L, то любой элемент s полугруппы S можно представить пре- образованием T(s) пространства X таким образом, чтобы T(s • s') = T(s)T(s'). Каждая полугруппа S имеет два очень простых представления, каждое из которых представляет s с помощью некоторого преобра- зования S в себя. Правое регулярное представление R: S->FR(S) описывает s с помощью преобразования в виде правого умножения на $. Другими словами, /?(з) = ^еГл(5), где (a) Rs = а • $ для всех а е S, (a) Rst = ast = (as) Rt = (a) RsRt. Левое регулярное представление L: S-+FL(S) представляет s с помощью преобразования Ls в виде левого умножения на s; L(s) = Ls<=Fl(S), где Ls (а) = s • а для всех а е S, Lst (а) = sta = Ls (ta) = LsLta. (1.7) Определение. Бинарным отношением R на множестве S на- зывается некоторое подмножество пространства S X S. Мы гово- рим, что х связано с у отношением R (что записывается, как xRy) тогда и только тогда, когда (х, у) е R.
7.1 Полугруппы и конгруэнтность 215 (1.8) Определение. Частично упорядоченным множеством назы- вается множество Р с определенным на нем бинарным отноше- нием удовлетворяющим следующим условиям: (а) х^х для любых хеР (рефлексивность); (Ь) для любых х и у из Р,-причем х^-у и у4х, следует, что х = у (антисимметричность); (с) для любых х, у и z из Р отношения х^Су и у^-z гаранти- руют, что x-Cz (транзитивность). Простейшим примером может служить множество целых чисел, на котором х^.у тогда и только тогда, когда у больше или равно х. Более ценным примером, подчеркивающим необходимость лишь частичной упорядоченности, может служить множество всех под- множеств некоторого множества S относительно операции включе- ния: если X, Y Е S, то X < У тогда и только тогда, когда X s У. Легко видеть, что при заданных X и У может случиться, что ни одно из соотношений Х-СУ и У-СХ не выполняется, а это невоз- можно для множества целых чисел. В такой ситуации говорят, что X и У несравнимы. Одним из основных понятий математики является понятие экви- валентности. (1.9) Определение. Отношение == на множестве S называется от- ношением эквивалентности тогда и только тогда, когда (а) х ss х для любых х е S (рефлексивность); (Ь) х = у => у х для любых х, у е S (симметричность); (с) х = у и y^sz=^x=z для любых х, у, z^S (транзитив- ность) . Наиболее знакомыми примерами могут служить понятия равен- ства в арифметике, конгруэнтности в евклидовой геометрии и по- добия для невырожденных матриц. Если $ есть некоторый типичный элемент множества S, то клас- сом эквивалентности элемента s называется множество [s]={/: ts=s}. Для заданных множеств S и определенного на нем отношения эквивалентности = можно определить некоторое новое множество S/==, множество классов эквивалентности S по модулю =. (1.10) Определение. Разбиением Р множества S называется раз- ложение S на непересекающиеся подмножества SbS2 .... т. е. SznSz=0 для и 5=(JSZ. i Каждое упомянутое выше S, называется блоком разбиения Р.
216 7 Основные понятия теории автоматов и теории полугрупп Ясно, что [$] = И как элементы множества S/s тогда и только тогда, когда t == s. Мы будем называть множество S/ss разбие- нием. множества S, индуцированным отношением эквивалент- ности =. Отношение эквивалентности /? на полугруппе S называется пра- воинвариантным, если каждый раз, когда xRy, при любых z из 8 справедливо xzRyz. Очевидно, что аналогичным образом можно определить левоинвариантное отношение эквивалентности. (1.11) Определение. Отношение эквивалентности на полугруппе S называется отношением конгруэнтности, если оно одновременно и правоинвариантно и левоинвариантно. Определим отображение NR: S-+S/R с помощью уравнения Nr (/) = [/]₽, где [£]в есть класс эквивалентности t относительно R. Важность понятия конгруэнтности базируется на следующей лемме. (1.12) Лемма. Если R есть некоторое отношение эквивалентности, то на множестве S/R можно определить структуру полугруппы с умножением тогда и только тогда, когда R является конгруэнтностью. В этом случае NR является гомоморфизмом, а множество S/R называют факторполугруппой. Простую проверку этого утверждения оставляем читателю. (1.13) Определение. Отношение эквивалентности на множестве S называется отношением с конечным индексом, если количество классов эквивалентности, порожденных этим отношением, конечно. Если определить для разбиения Р отношение =Р на множестве S, потребовав, чтобы х == Ру тогда и только тогда, когда х и у при- надлежат одному и тому же блоку разбиения Р, то s=P есть отно- шение эквивалентности, а Р есть по сути дела разбиение множе- ства S, индуцированное отношением эквивалентности =Р. Наконец, скажем еще несколько слов о кардинальных числах. Множество называется конечным, если оно содержит конечное число элементов; счетным, если его можно поставить во взаимно однозначное соответствие с множеством N целых чисел (в этом случае мы говорим, что это множество, имеет мощность алеф-нуль и обозначается ^0), и несчетным, если оно не подходит ни к пер- вому, ни ко второму случаю. Если заданное множество S конечно и содержит ровно и эле* ментов, то число подмножеств S равно 2П, поскольку для каждого
7.2 Автоматы, приведенные' формы и отношения эквивалентности 217 из п элементов имеется два выбора — быть или не быть включен- ным в каждое подмножество. Обозначим по аналогии через 2*° число подмножеств счетного множества S. Взаимно однозначное соответствие между S и N ин- дуцирует и взаимно однозначное соответствие между множе- ствами их подмножеств, которые, таким образом, имеют одинако- вую мощность. Каждому подмножеству Т множества S можно по- ставить в соответствие вещественное двоичное число О, 11^2^3 • • • • • • > где fl, п<=Т, /п = 1о, пфТ. Таким образом, существует взаимно однозначное соответствие ме- жду множеством вещественных чисел, содержащихся в замкнутом промежутке [0, 1], и множеством подмножеств Т1). Но с помощью известного алгоритма диагонализации Кантора легко показать, что множество вещественных чисел нельзя поставить в взаимно одно- значное соответствие с множеством целых чисел, так что 2*>Ко. Этот факт нам пригодится в следующем параграфе. 7.2 Автоматы, приведенные формы и отношения эквивалентности Вместо того чтобы исследовать непрерывные системы, сосредо- точим внимание на стационарных системах с конечными множе- ствами входных и выходных символов и множеством моментов времени вида. T = {0, 1, Тогда, вспоминая материал § 6.1, сформулируем следующее фор- мальное определение. (2.1) Определение. Автоматом (или машиной) называется пятерка М = (X, Y, Q, Л, д), где X — некоторое конечное множество, входной алфавит-, У — некоторое конечное множество, выходной алфавит-, Q — множество состояний (не обязательно конечное); Л: Q X X -> Q — одношаговая переходная функция; 6: Q х X -+ У — одношаговая выходная функция. *) Это не совсем верно. Предоставляем читателю сделать необходимые по* правки.
218 7 Основные понятия Теории автоматов и теории Полугрупп Мы не будем предпринимать каких-либо специальных усилий, направленных на то, чтобы избежать смешения этой абстрактной модели с самой машиной, ею описываемой. Приведенное опреде- ление автомата позволяет интерпретировать его как систему, кото- рая будучи в момент времени t в состоянии q и получив входное воздействие х, оказывается в момент времени t + 1 в состоянии k(q,x) и генерирует на выходе сигнал 6(q, х). (2.2) Определение. Автомат М называется конечным, если конечно множество Q. Мы можем непосредственно продолжить отображения К и б на X* (свободный моноид X): Л: QxX’->Q, б: Qxr->K, определив эти отображения с помощью соответствий Л(</, x'x") = X(K(q, х'), х"), i>(q, x'x") = b(k(q, х'), х"), где последовательности х' и х” принадлежат X*. Не будем опре- делять, чему равно д(</, Л), но условимся, что X(q, Л) = q. Внешнее поведение автомата М, находящегося в состоянии q в начальный момент времени, Mq: X* -> У, определяется соотно- шением Mq (х) = 6 (q, х). Это позволяет упростить некоторые опре- деления, введенные для систем общего вида. (2.3) Определение. Состояние q эквивалентно состоянию q' тогда и только тогда, когда Mq = Мч как функции из X* в У. (2.4) Определение. Автомат М называется приведенным тогда и только тогда, когда отображение q > Mq взаимно однозначно ,(т. е. у приведенного автомата одна и та же функция вход — вы- ход не может соответствовать более чем одному состоянию). (2.5) Определение. Два заданных автомата М = (X, У, Q, X, б) и М' = (X, У, Q', V, б') называются строго эквивалентными тогда и только тогда, когда каждому q е Q соответствует такое q' е Q', ЧТО Mq = Mq', И НЭОборОТ. (2.6) Теорема. Каждый автомат М строго эквивалентен некото- рому приведенному автомату Л4° = (Х°, У0, Q0, Х°, б°). Доказательство. Основная идея доказательства состоит в том, что- бы объединить между собой состояния с одинаковым внешним по- ведением. Пусть Q° = {/: существует такое q е Q, что f = ЛЦ. Но так как некоторые различные q могут давать одно и то же Mq, ясно, что # (Q°) < # (Q) (где # — символ мощности множества),
1-2 Автоматы, приведенные формы и отношения эквивалентности 219 если только автомат М сам не является приведённым. Пусть Х°=*Х и У0 — У. Теперь нам нужно определить X°(f, х) и d°(f, х). Введем для каждого хеГ отображение Lx: Х*->Х*, где Lx(x') = хх' (ле- вое умножение на х). Тогда б(Х(<?, х)х') = 6(7, хх') = b(q, £ж(х')) = = MqLx (X ) . Далее, Ж) = MqLx есть отображение, а значит, можно опре- делить Х° и . 6°, потребовав, чтобы X°(f, х) = fLx, a S°(f, х) = f (х). В этом случае A°(Afg, х) =AfWg,X) и d°(Mg, х) = 6(<7, х), и легко убедиться в том, что автомат М° является приведенным и эквива- лентен автомату Af. (2.7) Упражнение. Покажите, что М° является единственным при- веденным автоматом для М, т. е. что всякий приведенный автомат Л7, строго эквивалентный М, получается из Af° заменой обозначе- ний состояний. Рассмотрим некоторый автомат М, в начальный момент вре- мени находящийся в состоянии <7о- Тогда каждое из состояний, в которых он впоследствии окажется, можно представить в виде Х(<7о,х), где хеР. Другими словами, Х(<7о»х) исчерпывает состоя- ния, в которые можно попасть из заданного начального состоя- ния qo. Рассмотрим приведенный автомат, у которого все состояния достижимы из состояния qo- Обозначим его через M(f) = = (X, У, Q},Xf, бу), где f — Mq0. Мы можем описать его работу с выход f(x) = fLAx) Вход х х' , > «-----------------------» Состояние qo М<7о,гх') Рис. 7.1. помощью графа, показанного на рис. 7.1. Согласно этому графу, имеем Qf = {g: g = fLx для некоторого хеХ*}, x) = gLx, bf(g, x) = g(x). Впоследствии мы будем иметь дело в основном лишь с приведен- ными автоматами, все состояния которых достижимы из некоторого заданного, т. е. с автоматами вида M(f). (2.8) Определение. Заданная функция f: X* -► У реализуема конеч- ным автоматом тогда и только тогда, когда множество Q/ конечно.
220 7 Основные понятия теории автоматов и теории полугрупп (2.9) Определение. Характеристической функцией множества R называется функция [1, x^R, = | о, X(£R. (2.10) Определение. Подмножество R^X* называется реализуе- мым тогда и только тогда, когда реализуема его характеристиче- ская функция Х*->-{0, 1}. Конечный автомат задается конечной таблицей. Мы можем вы- писывать эти таблицы одну за другой. Поэтому множество конеч- ных автоматов (и тем более множество реализуемых множеств) счетно, т. е. его мощность равна Ко. Но так как мощность множе- ства X* равна Ко, у него должно быть 2я» подмножеств, т. е. их множество несчетно. Поэтому большинство подмножеств множе- ства X* нереализуемы. (2.11) Определение (эквивалентности Нерода). Для заданной функ- ции f: Х*->У определим отношение эквивалентности Ef на X*, если xEfх' ФФ f (xz) = f (x'z) для всех z е X*. Заметим, что xEfx' fLx — fLX' и что, следовательно, классы эквивалентности Нерода [х]к можно рассматривать как элементы пространства состояний Qf автомата M(f), являющегося минималь- ным автоматом, реализующим f. Легко убедиться в справедливости следующего предложения. (2.12) Предложение, (a) Ef есть правоинвариантное отношение эк- вивалентности-, (Ь) если f реализуемо, то индекс отношения Ef ко- нечен, и наоборот. (2.13) Пример. Множество R = {0,01, 012, ...} реализуемо. Доказательство 1 (с помощью эквивалентности Нерода). Пусть X — {0,1}. Тогда утверждение хЕу требует, чтобы xz R О yz е R при любых z е X*. Заметим, что мы имеем здесь три класса эквивалентности: {A}, R и X*— (7?U{A}), а значит, индекс отношения Е конечен. Доказательство 2. Можно построить автомат, реализующий R либо непосредственно либо в виде М (хя) (отметим, что у него будут три состояния, так как состояния минимального автомата должны со- ответствовать классам эквивалентности Нерода). В любом случае окажется, что Х = {0, 1), г={0, 1}, Q = {<7o, <71, ?2}>
7.2 Автоматы, приведенные формы и отношения эквивалентности 221 где qQ есть начальное состояние, а X и 6 задаются таблицами Л 0 1 6 0 1 <7о <71 42 4о 1 0 <71 42 4l 4i 0 1 <72 <72 42 42 0 0 Реакция системы в состоянии q\ равна 1, в противном случае она равна нулю. Другими словами, последовательность воспринимается только в том случае, если она переводит автомат из состояния q0 в состояние qi. Доказательство закончено. Читателю следует самому убедиться в том, что если некоторое множество реализуемо, то реализуемо и любое множество, отли- чающееся от первого лишь конечным числом элементов. (2.14) Пример. Множество 7? = {о?’-11: п>0) нереализуемо. Доказательство 1 (с помощью эквивалентности Нерода). Имеем i ¥= /=у> не (0{EQi) и, следовательно, индекс отображения Е не мо- жет быть конечным. Доказательство 2. Пусть автомат М(%д) имеет конечное число со- стояний. Но так как число различных последовательностей О* бес- конечно, должна найтись такая пара что (2.15) = Выберем любое п2 — 1 > k > 1. Тогда для любого положительного целого t многократное применение соотношения (2.15) показывает, что а значит, множество R не такое, как мы предполагали. (2.16) Определение (эквивалентности Майхилла). Назовем э/ для заданной функции f: X* -► У отношением эквивалентности Майхил- ла на X*, если (2.17) xssfx'€$f(yxz) = f(yx'z) для всех у, z&X* <4 ^fLyLx = fLyLX' для всех у<=Х* & 4Фвходные последовательности х и х' индуцируют на Qf одну и ту же функцию, т. е. (2.18) = Qf-*Qh где
222 7 Основные понятия теории автоматов и теории полугрупп .& Отметим, в частности, что xs fx'=? xEfx', но обратное не обяза- I тельно верно. _ 1 (2.19) Упражнение. Пусть автомат M(f) имеет п состояний, а i \X*/==f\ = п'. Покажите, что п^.п'^.пп. Для произвольного п| укажите примеры функций, при которых достигается каждый из I этих пределов. | Решение. Здесь п' есть индекс (число классов эквивалентности) | отношения s/, и, следовательно, он не меньше, чем индекс отно- | шения Ef, который равен п. В то же время индекс п' должен быть не больше числа различных функций, отображающих Qf в Qf, а их I число равно пп. Таким образом, -^пп. | Приведем теперь несколько примеров, простая проверка кото- рых предоставляется читателю. (2.20) Пример, п' = п. Пусть автомат М (f) имеет п — 1 возврат- ? ных входов X = {xi, • •«, хп—j), для которых f(zxn) — Xk, каково бы ни было zeX* (а /(Л), на- пример, р-авно Xi). (2.21) Пример, п' — пп. Пусть У имеет п элементов {у\, ..., t/n}> а X содержит пп элементов {хр .... х„«]. Перенумеруем пп функ- ций, отображающих У в У элементами множества X, обозначив их ... через gXl, .... gxnn. Определим f(A) = yt<=Y, a f(zx.) = gX/ (f(z)) при всех z<=X*. (На самом деле множество X можно выбрать ' много меньшим; достаточно, чтобы gx были элементами множества • образующих полугруппы отображений У в У.) В частности, справедливо следующее предложение. (2.22) Предложение. (а) Из того что индекс отношения эквивалентности =f конечен, i следует конечность индекса отношения Ef, а отсюда заключаем, что автомат M(f) конечен. (Ь) Из того что автомат М (f) конечен, следует, что конечно мно- жество Qf, а отсюда заключаем, что число различных функций, отображающих Qf в Qf, конечно, и, следовательно, конечен индекс отношения эквивалентности szf. Заметим, что из х ~ х' и у = у' следует, что для всех ze X* f LJ-., " I = I - fL.L ,-L.' - ; а поэтому отношение эквивалентности Майхилла является кон- груэнтностью, и мы можем образовать фактормоноид. |
7.2 Автоматы, приведенные формы и отношения эквивалентности 223 (2.23) Определение. Для заданной функции f: X* -> Y моноидом (полугруппой) функции f называется Sf = X'/^f. Элементы моноида Sf соответствуют входным последователь- ностям, рассматриваемым как переходные функции автомата M(f). Закон композиции определяется последовательными преобразо- ваниями состояния. (2.24) (Важнейшее) замечание. ЕслиМ(^) конечен, то полугруппа Sf также конечна, и наоборот. (2.25) Пример. Вычислите 5Х для Я = {0, 01, 012, ...}. Построение. Для вычисления Sf(f — %в) в виде множества функ- ций, определенных на Q/, воспользуемся тем, что мы уже знаем относительно Q/. Мы выяснили, что состояния автомата М(хв) имеют вид у0 = [Л]е, yi = [0]е и у2 = [Це- Теперь же нам нужно дополнительно разбить эти классы на новые множества так, чтобы на всех последовательностях из данного подмножества отображе- ние Qf оказалось тождеством. Методом проб и ошибок быстро убеждаемся, что s0 = Уо, «1 = У1, s2 = {lm}, a s3 = Функции, определенные на Qf, задаются следующей таблицей: So S1 s2 s3 4о 4о 4i 42 42 4i 4t 42 4i 42 42 42 42 42 42 Отсюда можно заключить, что Sx^ = {s0, sb s2, [10]} имеет следующую таблицу умножения: 5з} = {[Л], 10], [1], So Si s2 S3 So So Si S2 S3 Si Si «3 Si S3 s2 S2 «3 s2 S3 S3 S3 S3 S3 S3
224 7 Основные понятия теории автоматов и теории полугрупп 7.3 Автоматы и полугруппы Мы выяснили, как переходить от автоматов к полугруппам. Те- перь мы сосредоточим внимание на том, как полугруппа характе- ризует автомат. Последующие две главы будут посвящены изуче- нию структуры автоматов посредством выяснения структуры соот- ветствующих полугрупп. В теории полугрупп гомоморфизмом называется такое отобра- жение h: S—►S', что h(ssi) = h(s)h(si). Соответствующее понятие для автоматов вида M(f) принимает, таким образом, форму гомо- морфизма входных полугрупп Л: X* -> (X') *, который на самом деле полностью определяется значениями, принимаемыми на X. Если автомат M(f') начинает работать в состоянии f'Lt, когда автомат M(f) находится в начальном состоянии f, то можно индуцировать отображение, потребовав, чтобы действие х на f соответствовало действию h(x) на f'Lt. Если отображение определяется условием hq(fLx) = f'LtLh(x} и если q = fLx>, то, так как h есть гомоморфизм, имеем ^<2 (^7 х))= ^<2 (х’х}= ~f ^t^h(x’)^h(x) = й(х)). А это подсказывает следующее определение для автоматов общего вида. (3.1) Определение. Гомоморфизмом h‘. М-+М' автоматов назы- вается отображение Л: Q U X -> Q' 1) X', для которого h (Q) = Q', h (X) = X', и при всех q е Q и х е X спра- ведливо X (h(q), h (х)) = h (Л (q, х)). Однако в рамках теории автоматов более естественным кажется понятие модели. Мы говорим, что автомат М моделирует автомат М', если при условии соответствующего кодирования и декодирова- ния входных и выходных символов автомат М может, находясь в подходящем состоянии, преобразовывать входные последователь- ности точно так же, как и автомат М'. Потребуем, чтобы кодирую- щее и декодирующее устройства не имели памяти (т. е. преобра- зовывали символы поодиночке) с тем, чтобы автомат М проделы- вал всю работу, связанную с запоминанием (см. рис. 7.2).
7.3 Автоматы и Полугруппы 225 (3.2) Определение. Автомат М моделирует автомат М', если суще- ствует тройка (hi,h2,h3), где (a) hi: (Х')*-+Х* есть некоторый гомоморфизм моноидов, (b) h2: Q'-^Q, (с) Л8: У->У', такая, что следующая диаграмма коммутативна: (Г)* > У' А (3.3) Л. Лз X*-------> г Другими словами, отображение (X')* в Y' должно не зависеть от выбранного пути: V]- lh (8 (М/). MV))). Автоматы М й М' называются слабо эквивалентными, если М моделирует М', а М' моделирует М. Станем писать, что М'[М, Рис. 7.2. Автомат М моделирует М', если hi, hi и ha можно вы« брать таким образом, чтобы приведенные выше системы имели идентичное внешнее поведение. если М моделирует М', и читать это так: ,,М' делит Ми- (здесь нельзя изменять порядок). (3.4) Лемма. Пусть автомат М' приведен. Тогда М моделирует М' тогда и только тогда, когда существует тройка (hi, li2, hs)> где (a) h: (Х')*->Х* есть некоторый гомоморфизм моноидов-, (Ь) Аг отображает подмножество Q" множества Q на О': Q Э 3Q"S+Q'; (с) h3: У->У', 8 Зак, 693
226 7 Основные понятия теории автоматов и теории полугрупп такая, что следующая диаграмма коммутативна: (Г)* (3.5) л. Лз X Mq Доказательство. Зафиксируем hi и h3 и покажем, как заменить Л2 из диаграммы (3.3) на /г2 из диаграммы (3.5). (а) Начнем с диаграммы (3.3). Поскольку автомат М' приве- ден, ни одно состояние автомата М не может моделировать двух со- стояний автомата М', так что отображение й2 должно быть взаим- но однозначным. Поэтому можно выбрать Q" = /i2(Q') и обеспе- чить коммутативность диаграммы (3.5), положив на Q", что hi — hi'. (b) Перейдем теперь к диаграмме (3.5). Для любого q' е Q' выберем hi(q') так, чтобы это было любое q (а число возможных выборов может быть велико) такое, чтобы Л2 (q) = q . Это гаранти- рует коммутативность диаграммы (3.3). (3.6) Замечание. Критерий (3.5) моделируемости приведенных автоматов легко поддается алгебраическим обобщениям, чего нельзя сказать о критерии (3.3). / (3.7) Замечание. Если условие (3.5) выполнено, то М моделирует М' независимо от того, приведен ли автомат М' или нет. Для заданного автомата M(f) мы научились строить моноид Sf с классом эквивалентности пустой последовательности в каче- стве единицы. Обратно, по заданному моноиду S можно построить автомат, называемый автоматом полугруппы: S, т. е. автомат Af(S) = (S, S, S, -,-), в котором • обозначает полугрупповое умножение. Если автомат М (S) в момент времени t находится в состоянии s и получает вход- ной символ s', то в момент времени (t + 1) его состояние и выход- ной символ одновременно равны S'S'eS. Если же вернуться теперь от полугруппы Sf к автомату M(Sf), то возникает вопрос, в каком смысле этот автомат и исходный автомат М (f) одинаковы. Ясно, что эти автоматы не эквивалентны, так как мы помним, что если число состояний автомата М (f) рав- но п, то число состояний автомата M(Sf) равно п', где п^.п' ^пп, и достижимы оба указанных предела.
7.3 Автоматы и полугруппы 227 Но нам все же хочется обнаружить, в каком смысле автомат и его полугруппу можно считать эквивалентными. Рассматривая полугруппы как средство представления автома- тов, мы интересовались не только переходом от одного состояния к другому, но и изменением выходных величин. Поэтому для за- данной полугруппы Sf можно определить также и функцию if. Sf-*Y так, что если х переводит автомат из начального состояния в состояние, описываемое s е S/ (т. е. если s = [х]), то необходимо, чтобы if(s) = f(x). Заметим, что функция if вполне определена и зависит только от $, а не от выбора представления х. Теперь M(Sf, if) представляет собой автомат (Sf, Y,Sf, -,6/), где 6/(s,s') = = if (S'S'), т. e. это автомат типа состояние — выход. В таком автомате следующий выходной символ полностью определяется бу- дущим состоянием автомата. (3.8) Предложение. Автомат М (Sf, if) слабо эквивалентен авто- мату M(f). Доказательство. То, что автомат M(Sf, if) моделирует автомат M(f), сразу следует из рис. 7.3, где if X->Sf определяется соотно- шением jf(x) = [х]у (здесь [х]у есть класс эквивалентности Май- хилла). ।------------------------------------------------------------------1 Рис. 7.3. Чтобы убедиться в том, что М (/) моделирует М (Sf, if), необ- ходимо найти такие отображения hf. S/-*-X*, h2: Sf-*-Qf и A3: У-*-У, чтобы диаграмма М (f) h, (s) у ' Sf M(Sf- Y была коммутативной 9- l) В этом случае автомат М', вообще говоря, не является приведенным, и мы не можем найти удовлетворяющее критерию (3.5), 3*
228 7 Основные понятия теории автоматов и теории полугрупп Для каждого s eS выберем hi (s) в виде такого х е X*, что s = [х]и.Если s =[х]и, то положим /i2(s) = ftx. Такое определение не зависит от выбора х, так как [x]BS==[x']at=$fLx==fLX'. Нако- нец, положим h$(y) — у. Описанное отображение hi можно выбирать многими способами, и любой из них обеспечит коммутативность приведенной диаграм- мы, так как M(Sh if)s(s') = if(ss') = = f(fh(ss')) = -f (Ms) Л, (*')) = = M(fl[ftl(S)] (МИ) = E =M(f)lh(s)(hl(s')), что и завершает доказательство предложения. Если мы хотим исследовать автоматы на алгебраическом языке, то нам следует построить Sf и if. Воспользуемся теперь полугруп- пами и восстановим понятия теории автоматов. До сих' пор основ- ную роль играло понятие модели. Попробуем ввести соответствую-1 щее понятие в теорию полугрупп и убедимся в его содержатель- ности. Имея в виду лемму (3.4b) в качестве отправной точки, сфор* мулируем следующее определение. (3.9) Определение. Полугруппа S делит полугруппу S', если суще- ствуют подполугруппа S"czS' и гомоморфизм Z полугруппы S" на S или SIS'^S'B Таким образом, S' может моделировать S в том смысле, что умножение в S' индуцирует умножение в S с помощью Z, и нам может потребоваться для этого только часть S', а именно подполу-, группа S". Пусть S и S' есть две полугруппы с определенными на них ото- бражениями i: S->Y и i': S'-*~Y'. Тогда можно говорить, что (S,i) делит (S',i'), если найдутся такая подполугруппа S" полу- группы S', отображение Z подполугруппы S" на S, а также ото- бражение Н: Y'-+Y, что i(Z(s)) = H(i'(s)) для всех s <= S', а это означает коммутативность следующей диаграммы} S = S"— i' | S"l i 4“ v Y'-^Y
7.3 Автоматы и полугруппы 229 Станем писать, что g|f, если M(f) моделирует M(g) при усло- вии, что оба автомата начинают работать из своих начальных со- стояний, т. е. если диаграмма Х'-&+ Y ОТ-7* Г является коммутативной, или g = Hfh. Докажем теперь, что если одна полугруппа делит другую, то делятся и соответствующие автоматы (и наоборот), начинающие работать из начальных состояний. (3.10) Теорема. g|f О (Sg, ig) | (Sf, if). Доказательство. Пусть g = Hfh. Тогда имеем Sg=(X)*/ssg, а Sf — (%')*/=/, так что положим S" = {[Л(х)]>: хеР}. Заметим, что S" является подполугруппой группы Sf. Определим Z как ото- бражение, «обратное» отображению h и суженное на классы экви- валентности. Другими словами, пусть Z([h(x)]f) = [x]g. Очевидно, что Z сюръективно и, если вполне определено, является гомомор- физмом, т. е. [Л(х)]/ — [й(Х1)]/=^ [x]g = [xi]g. Но справедливость приведенной импликации вытекает из того, что для всех у и г имеем g(tyxz) — Hfh(yxz) = = Hf(h(y)h(x)h(z)) = = Hf(h(y)h(xt)h(z)) = [поскольку A(x)sfft(x,)] = Hfh(yx{z). Легко проверить, что нас удовлетворяет и Н; на этом первая поло- вина доказательства заканчивается. Обратное утверждение. Если (Sg,ig)\(Sf,if), то диаграмма Sf2S"-^Y' коммутативна. С целью доказательства для каждого заданного х е X выберем h (х). в виде некоторого t е (X') "эЕ ([/]/) = [x]g. А так как Z сюръективно, всегда найдется по крайней мере одно такое t. Но тогда имеем Hfh (х) = Н (if ([h (x)]f)) = ig (Z (\h (x)]f)) = ig ([х]г) = g (x), что и завершает доказательство,
23'0 "7 Основные понятия теорий автоматов и теории полугрупп (3.11) Важное замечание. В следующих двух главах мы будем предполагать, что наши автоматы есть автоматы типа состояние — выход. Таким образом, запись (3.12) Л/ = (Х, Y, Q, Л, р) означает, что текущее состояние автомата М определяет текущее значение выходного символа заданием функции (3: Q -> У (мы мо- жем вернуться и к одношагрвой выходной функции б: Q X X -► У, заметив, что теперь это всегда лишь р ° Z). Упоминая об автомате, обозначенном некоторым символом, на- пример символом N, мы будем предполагать, что ему соответствует пятерка типа (3.12), различные символы которой помечены соот- ветствующим нижним индексом [например, (XN, YN, QN, KN, [Ml- Если же автомат обозначается символом М с каким-нибудь ин- дексом, например символом М', то иногда для простоты мы будем помечать элементы его пятерки (3.12) аналогичным индексом [на- пример, (X', У', Q', V, р')]. Такая двойная система обозначений не должна вызвать путаницы.
8 Декомпозиция конечных автоматов без петель Как известно (см., например, гл. 1 книги Арбиба [1964]), для про- извольного конечного автомата можно построить модель в виде некоторой сети модулей с запаздываниями (конечных автоматов с одним состоянием) при условии, что в сети допускаются петли любой сложности. На самом же деле для построения такой сети можно даже использовать модули только одного типа (модули, реализующие штрих Шеффера). Другими словами, если допустить возможность петель, то произвольный конечный автомат удается построить с помощью весьма простого набора компонент. В сле- дующих двух главах мы выясним, что если допустимыми счи- таются лишь структуры без петель, то реализовать произвольный конечный автомат с помощью конечного набора компонент не удается. В первом параграфе мы дадим главные определения, сформулируем важнейшие результаты алгебраической теории де- композиции конечных автоматов в структуры без петель и наметим стратегию доказательств. 8.1 Общий взгляд на теоремы декомпозиции Рассмотрим прежде всего один комбинированный способ соеди- нения двух автоматов, частным случаем которого являются и по- следовательное, и параллельное соединения. (1.1) Определение. Два заданных автомата типа состояние — вы- ход М' и М, отображение Z; XX Y-+X' и отображение г\: Х->Х определяют автомат М X zM, называемый каскадным соединением М' и М с отображением связи Z, если М' X 1М = (X, Y' XY,Q'x Q, pz), .a Xz и Pz определяются, согласно схеме на рис. 8.1, уравнениями М(/. Я)> х) = (*-'(<?', Z(x, р (</))), K{q, ri(O, М/. <7)4₽(<?))• Обычно отображение я в явном виде не упоминается. Чтобы получить теперь последовательное соединение (одновре- менно сохраняя выходные величины автомата М), нужно обеспе- чить независимость отображения Z от X'. Параллельное соединение получается, если Z (х', у) = х', как показано на рис. 8.2.
232 8 Декомпозиция конечных автоматов без петель Теперь мы можем строго сформулировать понятие композиции автоматов без петель, потребовав, чтобы эта композиция получа- лась в результате многократного образования каскадных соедине- ний, а также кодирующих и декодирующих автоматов без памяти. (1.2) Определение. Для некоторого заданного семейства ЭД автома- тов через С (ЭД) !) обозначается наименьшее семейство автоматов, Рис. 8.1. а ъ Рис. 8.2. а —автоматы М и М' соединены последовательно через безинерционное кодирующее устройство Z; Ь — автоматы М и М' «соединены» параллельно. содержащих ЭД и замкнутых относительно операций каскадной ком- позиции и моделирования. Автомат, построенный таким образом из более чем двух авто- матов, мы будем также называть каскадной композицией этих автоматов. 9 Крон и Роудз [1965] предпочитают использовать мноэцестбо по* строенное с помощью последовательно-параллельных соединений, а не C(SX)f основанное на каскадном соединении. Взаимосвязь между этими двумя поня« тиями рассматривается у Арбиба [1968Ь].
8.1 Общий взгляд иа теоремы декомпозиции 233 Прежде чем сформулировать наши основные теоремы, нужно еще ввести понятие автомата, для которого входное воздействие либо переводит автомат в состояние, определяемое этим воздей’ ствием, либо оставляет все состояния неизменными. (1.3) Определение. Автомат М называется тождественно-возврат- ным, если длй каждого х е X отображение Х( •, х): Q -> Q является либо тождественным отображением на Q, либо постоянно (не за- висит от q, возвратное), а выходная величина автомата совпадает с состоянием автомата. Рассмотрим теперь тождественно-возвратный автомат с двумя состояниями, который мы будем называть триггером F. У триг- гера F множество возможных состояний равно {qo, q\}, а множество входных воздействий есть {е, х0, xj, причем h(q,e) = q, так что е представляет собой нейтральное входное воздействие, a k(q,Xt) = = qt, где х{ «возвращает автомат в состояние q^. (1.4) Предложение. Каждый тождественно-возвратный автомат можно построить в виде каскадного соединения триггеров F. План построения. На самом деле мы воспользуемся лишь опе- рациями кодирования, декодирования и параллельного соединения. Пусть М есть некоторый тождественно-возвратный автомат с п со- стояниями. Выберем пг так, чтобы n4^2m, и построим автомат Fm, представляющий собой пг экземпляров автомата F, соединенных друг с другом параллельно. Выберем наугад любые п из 2т со- стояний автомата Fm и декодируем их в выходные величины (состояния) {qi, qn} автомата М. Если теперь входное воздей- ствие х автомата М является нейтральным, то кодирующий автомат должен преобразовывать его в нейтральные входные воздействия всех т экземпляров F. Если же х возвращает М в состояние qt, то оно кодируется такой конфигурацией возвращающих входных воз- действий каждого из триггеров, чтобы она вызывала переход ав- томата Fm в состояние, поставленное в соответствие qt- Описанная структура показана на рис. 8.3, причем ограниченная пунктиром система преобразует входные воздействия и выходные величины точно так же, как автомат М. На этом описание построения автома- та М заканчивается. . Автомату F соответствует полугруппа' t/з = {1, П), П}, элемен- тами которой служат классы эквивалентности Майхилла 1 = [е], го = [х0] и и =[xi]1), а умножение определяется соотношениями «• 1 = и и и • г{ = Ti (так что 1 есть единичный элемент группы, а го и и — ее так называемые «правые нули»). ’) Читатель может легко убедиться в этом самостоятельно.
234 8 Декомпозиция конечных автоматов без петель (1.5) Определение. Элементами называется множество полугрупп, делящих U3. Но у U3 имеются подполугруппы U3, U2 = fro, п}> Ui = {1, г0} и ей изоморфная {1, rj, а также Uo = {1}. Если S]U3, то должна иметь место диаграмма U3^S'—*>S, а отсюда следует, что с точностью до изомофизмов элементы равны {Uo, Ui, U2, U3}. Рис. 8.3. Теперь нам нужно определить, что мы имеем в виду, когда го- ворим: «Не допуская циклов, мы не сможем разложить автомат на ,,меныиие“». (1.6) Определение. Автомат /V называется s-неприводимым, если каждый раз, когда он моделируется каскадным соединением двух автоматов Mi и М2 с полугруппами Si и S2, имеет место либо N\M(St), либо N\M(S2). Таким образом, если вы утверждаете, что автомат N можно представить с помощью нескольких более простых автоматов, то это просто самообман, так как для моделирования автомата N оказывается достаточным одного полугруппового автомата либо Mi, либо М2. Выясним, какие же автоматы принадлежат к классу s-неприводимых. Ответ на этот вопрос дает следующее утвержде- ние, доказательством которого мы займемся в гл. 9. (1.7) Предложение. Автомат М является s-неприводимым, если М есть либо элемент, либо простая группа своей полу группы'). *) Читатель, не знакомый с теорией групп, найдет основные определения (например, простой группы) в следующем параграфе. Центральную роль для понимания важности понятия простой группы в теории автоматов играет тео- рема Жордана — Гёльдера, также приведенная там.
8.1 Общий взгляд на теоремы декомпозиции 235 Здесь возникает вопрос о том, из каких неприводимых автома- тов следует строить заданный. Ответ на этот вопрос заключен в следующем предложении, доказательством которого мы также зай- мемся в гл. 9. (1.8) Предложение. Заданный автомат M(f) моделируется каскад- ной композицией триггеров и автоматов, простые группы которых (не обязательно все) делят полугруппу Sf. Предложения (1.7) и (1.8) вместе образуют теорему Крона — Роудза, впервые доказанную Кроном и Роудзом [1965]. Развитие этой теоремы дано в работе Крона, Роудза и Тилсона [1968], опуб- ликованной в сборнике под редакцией Арбиба [1968а]; в упомяну- том сборнике содержится также богатый материал по алгебраиче- ской теории автоматов, языков и полугрупп. В заключение пара- графа наметим наш подход к доказательству этих результатов. Следуя Зейгеру [1965], введем прежде всего такое определе- ние. (1.9) Определение. Назовем PR-автоматом автомат, каждое вход- ное воздействие которого вызывает либо перестановку, либо воз- вращает его в некоторое состояние. Другими словами, для каждого х е X либо отображение %(-,х): Q-+Q является взаимно однозначным (перестановочным), либо отображение %(•,*): Q-+Q постоянно (возвращает автомат в зависящее от х состояние). Перестановочные отображения поро- ждают группу, называемую группой PR-автоматов, которая не со- впадает в точности с полугруппой этого автомата, но может быть получена из нее, если отбросить возвратные реакции. Доказательство теоремы Крона — Роудза можно разбить теперь на четыре части. (1.10) Любой автомат можно представить в виде структуры без петель из PR-автоматов, группы которых делят полугруппу исход- ного автомата. Этот результат принадлежит Зейгеру [1965], который особо под- черкивает, что можно удовлетвориться этим утверждением и син- тезировать произвольные конечные автоматы из Р$-автоматов. Нас, однако, интересует математическая теория и потому мы хотим до- казать и остальные три части. (1.11) Произвольный PR-автомат можно представить в виде кас- кадного соединения некоторого полугруппового автомата M(G), где G есть некоторая группа, и некоторого тождественно-возврат- ного автомата, причем группа G есть группа перестановок для PR-автомата.
236 8 Декомпозиция конечных автоматов без петель (1.12) Любой групповой автомат M(G) можно моделировать кас- кадным соединением (не обязательно всех) автоматов простых групп, делящих G. Свойство делимости транзитивно, и поэтому ясно, что любой автомат можно построить из триггеров и из автоматов простых групп, делящих его полугруппу. Действительно, все эти автоматы являются s-неприводимыми. (1.13) Триггеры и .автоматы простых групп s-неприводимы. -Утверждения (1.10)—(1.13) эквивалентны результату Крона — Роудза. . 8.2 Некоторые сведения из теории групп и полугрупп Подойдем к традиционному изучению нормальных подгрупп относительно новым путем, задав себе вопрос: чем становится от- ношение конгруэнтности, если наша полугруппа является группой? (2.1). Предложение. Пусть G есть некоторая группа, и пусть е есть отношение конгруэнтности в группе G. Обозначим через [g] класс эквивалентности элемента g eG. Тогда N = [1g], где 10, еди- ница в группе G, есть некоторая подгруппа группы G. Доказательство. Стандартная проверка групповых свойств N со- стоит в том, чтобы убедиться, что при всех a, b N справедливо ab~l е N. Докажем, что это так: а&-1 = аЬ-1 • Isafr'1 • b = a=l. (2.2) Предложение. Пусть aN = {an: п eAf} и Na = {па: neN}. Тогда [а] — aN — Na, каково бы ни было a^G. Доказательство. Имеем b е [а] ФФ а-1 • b === а-1 • а = 1 фф ФФа-'йеМФФ ФФ b — а • а~1 • b s aN. Отсюда [а] = aN. Аналогично находим [а] — Na. (2.3) Определение. Подгруппа N группы G называется нормальной, если для любых g^G справедливо gN = Ng. Мы записываем это в символической форме, как N <] G. Заме- тим, что произвольная подгруппа некоторой группы не обязательно
8.2 Некоторые сведения из теории групп и полугрупп 237 нормальна. Например, обозначим через Ап знакопеременную груп- пу п символов (т. е. множество перестановок элементов множества {О, 1, п—1}, которое может быть получено в результате чет- ного числа перестановок пар символов). Как известно (см., на- пример, § 48 монографии Ван дер Вардена [1931]), группа Ап (п > 4) не имеет нормальных подгрупп. Тем не менее, если пг < п, то Ат можно рассматривать как некоторое подмножество групп Ап, для чего элементы из Ат нужно рассматривать как те пере- становки {0, 1, ..., п—1), которые оставляют множество {т, пг+1, ..., п — 1} нетронутым. Группа называется абелевой, если ее умножение коммутативно, т. е. ab всегда равно Ьа. Непосредственно из определения следует, что любая подгруппа абелевой группы нормальна. (2.4) Предложениег Для заданной H^.G (что читается так: «для заданной подгруппы-Н группы G») множества gH образуют раз- биение G (разбиение на классы смежности), называемое левой ко- декомпозицией, т. е. gH П g'H =£ 0 =>gH = g'H для любых g и g' е G. Доказательство. Если g" е gHftg'H, то g" — gh = g'h' при соот- ветствующих h, h' е Н. Но тогда gH--=g'h'h-}H = g'H. Аналогичный результат справедлив и относительно правых ко- декомпозиций. Отсюда приходим к следующему важному резуль- тату. (2.5) Лемма. Для заданной Н ^.G левая (правая) кодекомпозиция группы G является конгруэнтностью тогда и только тогда, когда Н О G. Каждое отношение конгруэнтности в группе G определяет некоторую кодекомпозицию некоторой N <] G. Если N <] G, то G/N обозначает факторполугруппу, индуцированную левым (пра- вым) отношением конгруэнтности классов смежности. (2.6) Лемма. G/N есть группа (она называется факторгруппой G относительно N). Доказательство. Согласно приведенным ранее результатам теории полугрупп, легко видеть, что в этой полугруппе N определено ассо- циативное умножение, такое, что aN -bN = [a]-[b]~(ab)N. Остается заметить лишь, что N » [1] является единицей, а для aN имеется обратное a~lN. Доказательство окончено. Отображение h: G->G)N, определяемое условием h(g) = gN, называется каноническим эпиморфизмом (где «эпи» указывает на сюръективность отображения, а «морфизм» — результат сокраще-
238 8 Декомпозиция конечных автоматов без петель ния слова «гомоморфизм»). Легко видеть, что диаграмма G X G G/N X G/N та таш G "Г”* коммутативна, если отображение tna: GxG-^G описывает груп- повую операцию в группе G и т. д. Эта диаграмма — всего лишь экстравагантный способ утверждения, что aN-bN=(ab)N. Пусть f: Gj ->• G2 есть некоторый гомоморфизм G] на С2. Рас- смотрим ядро f, т. е. множество таких элементов группы Gb кото- рые отображаются в 1q2. Другими словами, пусть kerf = /-1(1о2). Определим отношение на Gi, потребовав, чтобы g~fg'^f (g) = = f(g'). Тогда есть отношение конгруэнтности; соответствую- щие классы эквивалентности имеют вид множеств g-kerf, и, сле- довательно, ker f является нормальной подгруппой N группы G\. Отсюда GJN = G2. (Подробности этого простого доказательства мы не приводим.) Этот последний результат известен как теорема о гомоморфизмах. (2.7) Теорема о гомоморфизмах. Если f есть некоторый гомомор- физм G| на G2, то Gi/ker f = G2. У каждой группы G имеется по крайней мере две нормальные подгруппы [1G] и G, причем G/(1g} = G и G/G^{1g}. (2.8) Определение. Группа называется простой, если она имеет в точности две нормальные подгруппы. Таким образом, выше мы установили, что при п>4 каждая группа Ап является простой. Для заданной группы G назовем ряд (2.9) G = Go > G, > G2 > ... > Gk = (10) нормальным рядом для G (заметьте, что G > Н > К. =?—> G > К). Любая нормальная подгруппа Н группы G содержится в нор- мальном ряду G>#>{1g}. Назовем нормальный ряд G = HO>HX >Я2> ... >Я„ = {10] уплотнением ряда (2.9), если каждое G, является некоторым Н}. Факторами ряда (2.9) называются факторгруппы GtlGi+\. Рассмотрим ZK = {О, ..., К — 1} с определенным в нем сло- жением по модулю К.. Тогда Z6>Z3>{0}, Z6 >Z2 >{0}, z6/z3=z2/{0), Z6/Z2^Z3/{0}.
8.2 Некоторые сведения из теории групп и полугрупп 239 Это пример двух нормальных рядов одной и той же группы с оди- наковыми факторами, но встречающимися в обратном порядке. Будем говорить, что два нормальных ряда изоморфны, если их факторы можно поставить в такое взаимно однозначное соответ- ствие, что соответствующие факторы окажутся изоморфными. Композиционным рядом называется нормальный ряд, для ко- торого не существует строгого уплотнения, т. е. который является собственным уплотнением без повторов. Центральный результат, необходимый нам для дальнейшего и доказываемый в § 8.4, содер- жится в теореме Жордана — Гёльдера. (2.10) Теорема Жордана—Гёльдера. Любые два композиционных ряда некоторой группы изоморфны. Ясно, что любая конечная группа должна иметь композицион- ный ряд. Если рассматривать группу как объект, в некотором смысле построенный из факторов ее композиционного ряда, то теорема Жордана — Гёльдера утверждает, что группа G однозначно опре- деляет элементы, из которых ее можно построить. Однако исполь- зовать эти блоки для построения группы G можно несколькими раз- личными способами. Сформулируем теперь несколько основных результатов теории полугрупп и свяжем их с нашей теорией групп и введенным выше понятием делимости. Основная трудность, которая возникает каж- дый раз, когда мы имеем дело с полугруппами, состоит в том, что- бы удержаться от искушения приписать им свойства, которыми обладают лишь группы. (2.11) Определение. Элемент г полугруппы S называется левой (правой) единицей, если при всех seS справедливо rs — s(sr = s), левым (правым) нулем, если при всех seS справедливо rs = = г (sr — г), и идемпотентом, если г2 = г. Ясно, что и единицы, и нули всегда являются идемпотентами. Заметим, что в любой группе G нет нулей (если только G не со- стоит из одного элемента) и есть один идемпотент и правая или левая единицы, совпадающие между собой и равные 1g. (2.12) Пример. Рассмотрим две группы Gt и G2. Пусть S есть Gi U G2 U {0} с умножением sos' = ss' (групповое умножение), если s и s' принадлежат одной и той же группе Gk и равны 0 в про- тивном случае. Тогда 0 есть левый и правый нуль подгруппы S, а 1о, и 1g2 — идемпотенты полугруппы S, но S не . имеет единиц. (2.13) Определение. Подмножество А полугруппы S называется левым (правым) идеалом полугруппы S, если 5Л = Л(Л5 = Л), Идеал Л называется собственным, если Л ¥= 5.
240 8 Декомпозиция конечных автоматов без петель Ясно, что А есть подполугруппа полугруппы 3: А А с: А (ЗА = = {sa: s е S, а е А} и т. д.). Если г является одновременно левой и правой единицей (ну- лем) полугруппы 3, то это есть единственная левая или правая единица (нуль) S, и тогда этот элемент можно смело обозначать через Is (0s). Например, если г есть некоторая правая единица, а г' — некоторая левая единица, то г' = г'г — г. (2.14) Предложение. Полугруппа является группой тогда и только тогда, когда у нее нет собственных левых и правых идеалов. Доказательство. Если 3 не является группой, то существуют такие а, х и у из S, что х+у, но ах=-аух}. Но это означает, что {as: s е $} есть собственный правый идеал. Если же 3 есть некоторый собственный правый идеал полу- группы 3, то a е aS = 3, и, следовательно, ах = ау для не- которых х и у из 3, х Ф у, а значит, 3 не может быть группой. (2.15) Предложение. Любая конечная полугруппа S имеет идем- потент. Более того, для каждого aeS найдется идемпотент ви- да ak. Эта ситуация заслуживает более тщательного исследования. (2.16) Теорема. Пусть а есть некоторый элемент полугруппы 3. Обозначим через (а) циклическую подполугруппу полугруппы 3, порожденную а, т. е. (а) = {а, а2, а3, ...}. Если (а) бесконечна, то все степени а различны. Если же (а) конечна, то существуют два положительных целых числа, называемых индексом г и периодом m элемента а, таких, что ar = аг+т и {а} —{а, а2, ..., am+r~1}, где m + г— 1 есть порядок (а). Множество Ка — {аг, аг+1» •••> ат+т~’} образует циклическую подгруппу полугруппы S порядка пг. Если п кратно tn и удовлетворяет условию г^.п ^.т + г— 1, то ап есть идемпотент и единица множества Ка- Доказательство. Если ar = а« для некоторого целого г < s, то обо- значим через s наименьшее такое s, соответствующее г, а через пг разность s — г. Требуемый результат легко получается, что видно из рис. 8.4. *) Или ха •» ху, и в этом случае можно воспользоваться точно такими же рассуждениями.
8.3 Результаты о неприводимости 241 (2.17) Лемма. Если G' есть некоторая группа, делящая конечную полугруппу S 5 = 5"—** G', то существует такая группа G^S, что Z(G)=* G' (т. е. G' изо- морфна группе G). Доказательство. Поскольку 5 конечна, всегда можно найти такую подполугруппу Si полугруппы 5", что Z(Si)= G' и что для каж- дой собственной подполугруппы 52 подполугруппы 51 имеет место Z(52)=£G'. Р н с. 8.4. Покажем, что 51 не имеет собственных правых или левых идеа- лов, и поэтому 51 является искомой группой G. Предположим, что правый идеал S2 S 5] существует. Но тогда в 52 найдется некото- рый идемпотент е. А так как Z (е2) = Z (е), то необходимо, чтобы Z(e)=lOz. Выберем произвольное g s G' и некоторое s е 5Ь такое, что Z (s) = g. Тогда es е 52) поскольку е принадлежит правому идеалу 52. Теперь имеем Z (es) = Z(e) Z (s) = la'g = g, и, следовательно, Z(52) = G'\ отсюда 5] = S2. Аналогично доказывается и то, что St не содержит никаких собственных левых идеалов. 8.3 Результаты о неприводимости Предположим, что в определении каскадного соединения двух автоматов мы потребовали, чтобы было X = 52 X 5i, q (s2, $i) = sb a Z не зависело от Si и x, так что вместо Z((s,, s'), sj можно пи- сать ZSt (s') (рис. 8.5). Более того, заменим автомат М полугрупповым автоматом М (51), а автомат М'— автоматом M(S2). Тогда имеем ^z[(S2> Sl)> (S2« Sl)] ~ [S2^S| (s9» si> si]»
242 8 Декомпозиция конечных автоматов без петель и если потребовать, чтобы отображение Z обладало свойствами и (sp s' <= Sp s2, s'sS2) (s2s9 ~ ?Sl ($2) (5г)’ то операция 6z становится ассоциативной. Таким путем мы, есте- ственно, приходим к определению полупрямого произведения полу- групп Si И $2- (3.1) Определение. Пусть Si и S2 есть некоторые полугруппы, а Z — гомоморфизм Si в End S2 (моноид эндоморфизмов полугруппы S2 относительно закона композиции), т. е. s( i—> Zs (•). Тогда полу- прямым произведением полугрупп Sx и S2 с гомоморфизмом связи Z называется полугруппа S2 X z$i, элементами которой служат эле- менты декартового произведения множеств S2 х Si, а умножение определяется условием (s2, S])(s2, sQ = (s2ZSi (s0, SjS0. (3.2) Определение. Полугруппа S называется неприводимой, если для всех полупрямых произведений S2 X z$i, таких, что S|S2 X z$i, необходимо, чтобы S|S2 или S|Sj. Последнее определение составлено в таких выражениях, что ка- жется весьма правдоподобным, что автомат будет s-неприводимым тогда и только тогда, когда неприводима его полугруппа. Однако, как выяснится, доказательство этого утверждения требует все же некоторых усилий. Если нам задан каскадный автомат М' X г№ с полугруппой 8, то заманчивым кажется считать, что всегда можно найти подходя- щий гомоморфизм 2, такой, что
8.3 Результаты о неприводимости 243 где S' есть полугруппа автомата М', aS — полугруппа автомата М. Однако на самом деле это не всегда так, поскольку исходное ото- бражение Z может разрушать мультипликативную структуру полу- группы, и поэтому ни одно Z не может обладать требуемым свой- ством гомоморфизмов. Моделируя М с помощью Af(S), а М' — с помощью M(S'), мы сможем представить М' X z-M схемой, показанной на рис. 8.6. Пространство состояний (не обязательно приведенное) этого каскадного автомата есть S' X S. Рассмотрим теперь S, полугруп- пу преобразований пространства S' X S, индуцированных вход- ными последовательностями. Пусть t есть некоторая входная по- следовательность, т. е. элемент множества (X)*. Действие после- довательности t на автомат М (S) состоит в простом умножении на соответствующий элемент Is(t) пространства S. Однако действие t на второй автомат Al(S') будет зависеть от состояния автомата M(S) в начале операции. Предположим, что это состояние было $, и обозначим искомое действие через Isr(t)(s). Таким образом, 1$' (/) является элементом полугруппы F(S,S') отображений (а не только гомоморфизмов) S в S' с законом композиции вида Итак, S образуется в результате замены элемента t входной сво- бодной полугруппы на элемент (/s'(0, Л(0) множества F(S,S') х X S. Каково же полугрупповое умножение, индуцируемое в этом множестве действием входных последовательностей? Действие по- следовательности t\, за которой идет последовательность t2, дает (3.3) (IS' (Л), Is (ti)) • (Is' (/2), Is (/2)) = (Is' Is Ш). Но действие tit2 на Af(S) определяется просто действием tif умно- женным на действие t2, т. е. (3-4) IsM-IsttJIsM, в то время как действие Л t2 на М (S') при условии, что в начальный момент автомат M(S) находился в состоянии $, определяется
244 8 Декомпозиция конечных автоматов без петель действием /1 на Л! (S') для начального состояния « автомата M(S), умноженным на действие t2 на Af(S') для начального состояния автомата Af(S). Другими словами, (3.5) Is’ Ш (s) = [ZS,(fi) («)] • [ZS' (/2) (s • Is (fi) )]• Вернемся снова к определению полупрямого произведения и рас- смотрим отображение W: S-> End F(S, S'), удовлетворяющее условию ITS1(/)(«) = /(ss1). Умножение, определенное на F(S, S') X S, оказывается полу- прямым произведением F(S, S') X wS. Это наводит на мысль, что последняя полугруппа заслуживает специального внимания. Будем называть ее узловым произведением S и S' и обозначим через S'wS. Заметим, что для заданных S и S' отображение W однозначно определено и его не обязательно указывать в явном виде. Мы построили таким образом S как полугруппу относительно операции узлового произведения S и S'. Но, поскольку полугруппа автомата М' X zM описывает всего лишь действие множества X* на приведенное пространство состояний, эта полугруппа является гомоморфным образом полугруппы S. Поэтому имеет место сле- дующий важнейший результат. (3.6) Теорема., Пусть автомату М соответствует полугруппа S, а автомату М' соответствует полугруппа S'. Тогда для любого ото- бражения связи Z полугруппа 3 автомата М' х zM делит узловое произведение S'wS. Таким образом, хотя в общем случае не существует полупря- мого произведения S' и S, которое делилось бы на 3, всегда спра- ведливо, что 3 делит одно полупрямое произведение F(S, S') на 5, называемое узловым. Теперь мы готовы к доказательству основной теоремы пара- графа. (3.7) Теорема. Если автомат М является s-неприводимым, то не- приводима и его полугруппа S. Доказательство. Предположим, что автомат М есть «-неприводи- мый. Утверждать, что S делит полупрямое произведение S2 X z(Si), это то же, что утверждать, что автомат М (S) можно мо- делировать каскадным соединением автоматов TH(S2) X zM(Si). Поскольку М (S), сразу видим, что М |M(S2) X zM(Si), а в силу «-неприводимости автомата М это означает, что M|Af(Si) или М |Af(S2). Но делимость автоматов гарантирует делимость их по-
8.3 Результаты о неприводимости 245 лугрупп, следовательно, имеем S|Si или S|S2. Таким образом, полугруппа S неприводима. (3.8) Теорема. Если полугруппа S автомата М неприводима, то автомат М является s-неприводимым. Доказательство. Пусть полугруппа S неприводима. Теперь если М |Л<2 X zAfi, то полугруппа S должна делить S2wS] и, следова- тельно, делить S] или F(S2, Sj). Если S делит Si, то Af(S) делит М (Sj). Но f(S2, S,) = S2 X ... X S2, где число сомножителей рав- но |Si|. Поэтому если S делит F(S2, Si), то S в силу неприводимо- сти должно делить S2, а значит, Af(S) делит M(S2). Таким обра- зом, имеем Af|M(Si) или М|Af (S2). Доказательство закончено. Итак, автомат s-неприводим тогда и только тогда, когда непри- водима его полугруппа1). Опираясь на эту теорему, мы сможем доказать утверждение (1.13) в нашей схеме доказательства тео- ремы Крона — Роудза с помощью двух других теорем, которыми мы и займемся в оставшейся части параграфа. . (3.9) Теорема. Простые группы неприводимы. Доказательство. Пусть G' есть некоторая простая группа. Пусть нам задано, что G'|S2 X z^i. Тогда требуется доказать, что G'|S2 или G'lSp Мы уже видели, что можно выбрать такую подгруппу G автомата S2 X zSi, что S2XzSi>G-^*G'. Элементами подгруппы G являются пары (s2,Si), где е Sit По- ложим л($2, Si) = $i. Тогда л есть некоторый гомоморфизм G в Si, и Gi = n(G) есть подгруппа полугруппы Si как гомоморфный об- раз подгруппы G. Пусть 1=(12, li) есть единица подгруппы G. Положим G2 = = {($2, li) в G}. Ясно, что G2 является подгруппой*группы G. На самом же деле, поскольку G2 является ядром гомоморфизма л, подгруппа G2 есть даже нормальная подгруппа подгруппы G. Определим отображение ф: G2->S2 с помощью условия ф($2, li) = Zi,(s2). Покажем прежде всего, что ф есть гомоморфизм. Поскольку ($2> h)(s2* 11) = (S2^1, ($2)» Ь)» ’) До сих пор в § 8.3 мы придерживались, схемы, использованной в книге Арбиба [1968b], где рассматривается еще и вопрос, почему предложенное опре- деление неприводимости автоматов оказывается связанным с теорией полугрупп. В оставшейся части параграфа мы будем следовать работе Крона и Роудза
246 8 Декомпозиция конечных автоматов без петель воспользовавшись Zi„ мы получим, что (* А ($2)» 11)= (5г) ^ii (^h (5г)) = ^11(5г) ’ Zh(.s2)> что и требовалось доказать. Докажем затем, что отображение гр взаимно однозначно. Если ф(52> 11) = Ф (4 *1)» то (s2> 11) = (1г> 11) (s2, 11) = = (12^,(з2), h) = = (12‘Ф(^2, 11), 11) = = (S2’ 11)’ что и требовалось доказать. Пусть G2 = if (бг).. Тогда G2 < S2. Теперь G' в точности совпадает с гомоморфным образом под- группы G относительно <р, и группа G' простая, согласно следую- щему предположению: G' G/ker <р, так что К = кег <р есть максимальная нормальная подгруппа под- группы G. Согласно лемме (4.2), если А, В и С есть группы, и А <| В и С В, то А-С <\ В. Отсюда следует, что К< К • G2<1 G, где К максимальна относительно G. Но тогда либо К. = К • G2, либо К- G2=G. В том случае, когда К = К'Оъ покажем, что G'|S]. Пусть Ci ={(12, si) е G} и 0 = 02’01. Совершенно очевидно, что здесь G2 • GiSG. Пусть (32, Si) есть некоторый элемент G, тогда он при» надлежит и Ог • Gi, так как (S2, 11) (Ig, Sl) = (S2^h (12), $1) = = («2, $1) и так как Z есть гомоморфизм. Если определить Р: Gi —> Gi усло- вием P(si) = (12,«О, то отображение Р сюръективно и является гомоморфизмом, Отсюда имеем ф(02 - о9=<р(о) = оЛ, <р(Ог • 01) = ф(02)ф(01)* Согласно предположению, К* Gi = Ki, и, следовательно, G^^K, так что ф(О2) = {1о}. Поэтому ф есть сюръективное отображение
8.3 Результаты о неприводимости 247 Gi на в', а <р о Р — сюръективное отображение G^-CSj на G', от- куда следует, что G'|Si. Если же K-G2=G, то Действительно, О' = ф(К- О2) = ф(Юф(О2) = = ф(б2). Но ф-1 есть гомоморфизм G2 на G2, а композиция ф-ф-1 есть гомо- морфизм G2 на G'. Доказательство закончено. (3.10) Теорема. Элементы неприводимы. Доказательство. Докажем неприводимость U3. Доказательство не- приводимости остальных элементов аналогично, но проще. Прежде всего докажем, что если £7з|5, то U3 = S. Предполо- жим, что S э S' U3. Пусть х = ф“’(1). Тогда найдется такой идемпотент е, который является степенью х, и, следовательно, ф(е) = 1 и у (eS'e) = U3, а значит, е есть единица для eS'e. Обозначим через Si подполугруппу для eS'e наименьшего по- рядка, для которой ф (Si) = t/i. Но тогда с учетом правой простоты И\ для каждого «isSj справедливо, что ф(«1 -Si) = ф(«1)U = Ux. Поэтому -Si = Si и, следовательно, Si есть правая простая полу- группа. Согласно теореме 1.27 из монографии Клиффорда и Престона [1961], имеем Si G X Rb, где G есть некоторая группа, а /?весть множество В с определенным в нем умножением справа на нуль. Поскольку U\ не есть группа, В должно содержать по крайней мере два элемента bi и Ь2. Но тогда t73~{e((l, М, (1. Покажем теперь, что если (7з |S2 X z$i, то U3 делит либо S2, либо Si. Согласно выписанному выше, имеем — {(^> а)> (^о> ®о)> (^i> ai)} — S2 X z$i' Как и раньше, положим, что (s2, Si) = $i, тогда л(С/3) = {а, do, Если а0 ¥=ai, то a(U3) = Si изоморфно U3, откуда имеем C/3|Si, или а в at (t= 0, 1) Za == Za^ ^Z — a для всех Z е (a, Oq, aj, и, следовательно, U3 {&, b0, bi}. Если же а0 = Oi, то Ьо ¥= Ьь Пусть р2: где p2(bf, а') = ‘‘‘Z (Ь'). Заметим, что ZaZ0 = Z((Za = Za, и убедимся, что р2 есть
248 8 Декомпозиция конечных автоматов без петель гомоморфизм. Простым перебором возможностей выясним, что р2 к тому же и взаимно однозначно. Тогда в этом случае имеем p2(Us) = U2 и p2(Uz) = так что t/a|S2. 8.4 Доказательство теоремы Жордана — Гёльдера Докажем теперь теорему Жордана — Гёльдера, утверждающую, что композиционные ряды групп единственны с точностью до изоморфизмов. Мы будем следовать при этом доказательству Куроша [1953]. (4.1) Лемма. Если В4С и А <] С, то АВ -С С. Доказательство. Пусть А нормальна, и для всех с е С справедливо, что с~1Ас = А. Пусть а, р е АВ. Требуется доказать, что ар-1 <= АВ. Но если а = atbi, р = a2b2, е А и b\ s В, то ар-1 = а! (МГ’УаГ1. Выберем аз е А, так чтобы аз(МГ1) = (bib^a?1. Тогда ар-1 = (aiai)(bib2l) е АВ. Аналогичным образом можно доказать еще одну лемму. (4.2) Лемма. Если В <] С и А <] С, то АВ <] С. (4.3) Лемма Цассенхауза. Если А, А', В и В' есть подгруппы группы G, причем А' А иВ%В, то А’(АПВ') <1 А'(АПВ), В' (В П А') < В' (В ПА), и соответствующие факторгруппы изоморфны: А! (А П В)/А' (А П В') В' (В Л А)!В' (В П А'). Доказательство. Если С — АПВ, a D = (АПВ') (ВПА'), то ясно, что D s С. Более того, поскольку подгруппа В' нормальна относи- тельно В, а С есть подгруппа подгруппы В, легко видеть, что СПВ' = АПВЛВ' = АПВ' есть нормальная подгруппа под- группы С. Из-за симметрии условий леммы относительно А и В аналогич- ное утверждение справедливо и для пересечения В П А'. А так как произведение нормальных подгрупп само есть нормальная под- группа, то это справедливо и относительно D. Поэтому можно го- ворить о факторгруппе С по D. Обозначим ее через H=qD.
8.4 Доказательство теоремы Жордана—Гёльдера 249 Но с другой стороны, А' есть нормальная подгруппа подгруп- пы А, так что А'(А П В) = А'С есть подгруппа. Каждый элемент группы А'С имеет вид а'с, где а' е А', а с е С. Если сопоставить ему класс смежности De еН и если а'с допу- скает другое представление того же вида а'с = а[ср то (й])"1 ~ С\С~Х е И' Л О £= A' f| В s D и, следовательно, ct = = ((aQ"1 а') с е De. Таким образом, мы построили однозначное ото- бражение f группы А'С на группу Н, поскольку каждый элемент се С отображается на свой класс смежности Ьс. Отображение f гомоморфно. Действительно, поскольку А' есть нормальная под- группа группы А'С, справедливо, что а/1с1а'2с2<= а'^с^, где а'3^ А' (фактически а^а^, где а\ выбирается так, чтобы c^'afa^a^). Очевидно, что kerf должно содержать подгруппу A'(A f) В'). Мы знаем, кроме того, что 4 П В'= С() В's В. Но с другой стороны, если элемент а'с переводится отображением f в D, то сеD, т. е. с = uv, где «е(В П А'), а и = (4 Л В'). Тогда имеем а'с « a'uv = е А' (4 f] В'), и, следовательно, ядро f совпадает с подгруппой 4'(4(]BZ). Но отсюда, согласно теореме о гомоморфизмах, находим 4'(4f]B)/4'(4f]B')~ Н. По симметрии-получаем также и изоморфизм В'(ВП4)/В'(ВЛ4')~Я. (4.4) Теорема Шрейера. Любые два нормальных ряда произвола ной группы обладают изоморфными уплотнениями. Доказательство. Пусть (4.5) G = G0>G1 >G2> ... >Gfe = {l0), (4.6) G = B0>tf1 >772> ... >BZ = {1O} есть два нормальных ряда группы G. Положим Здесь Gij и Hij есть группы, поскольку, например, Gt является нор- мальной подгруппой, a Gt-i П есть подгруппа подгруппы Gi-j.
250 8 Декомпозиция конечных автоматов без петель Теперь для I = 1,2...k и / = 1, 2,...., I имеем Gt-i = Gi0^ Qi, Оц = Gt, H j-i = #o/> Hi-it Gki = Hj. Но в силу леммы Цассенхауза <] G^ 3_i и Нц <] 27»_i, j, а также G/, y-i/G// — H{-i' ilНц. (Для того чтобы убедиться в этом, нужно положить А — Gj-i, Д' =Git В = Нj-х и В’ = Hj.) Если теперь подставить в ряд (4.5) все подгруппы Gi}, j = = 1,2,...,/ — 1, между Gi-i и Git i = 1, 2.k, то мы получим уплотнение этого ряда, которое в общем случае представляет собой нормальный ряд с повторениями, так как некоторые подгруппы G,-; j-i и Qu могут совпадать. Аналогичным образом строится и уплотнение ряда (4.6). Предоставим читателю в качестве упражне- ния доказать, что два новых нормальных ряда изоморфны, даже если убрать повторы. Отсюда сразу следует справедливость теоремы Жордана — Гёльдера. (4.7) Теорема Жордана — Гёльдера. Любые два композиционных ряда некоторой группы изоморфны. Ясно, что у каждой конечной группы обязательно имеется ком- позиционный ряд. (4.8) Упражнение. Покажите, что если нормальный ряд является и композиционным, то каждый его фактор является простым, и на- оборот. Решение. Самое основное здесь — это вспомнить следующую лемму: А>В>С и А >С=ФА/С >В/С. Поэтому если G^ > Gft+i можно нетривиальным образом уплот- > о нить, вставив некоторое Н, такое, что G* =# И ф Gft+I, то мы не- > t> медленно получим, что G^G^-i ¥= H/Gk+i ¥= 1. Отсюда следует, что > > Gk/Gk+i не может быть простой. Обратно, если GkIGb+x ф К. ф 1, и Gk-^^^^Gk/Gk+i, то легко видеть, что Ой^Л-1(Ю^ > Gfe+i* (4.9) Упражнение. Покажите, что *если Р есть некоторый фактор композиционного ряда группы G, то Р является простым й, кроме •того, Р | Q,
8.4 Доказательство теоремы Жордана—Гёльдера 251 Доказательство. Имеем Р = Gk/Gk+i, и он является простым, со- гласно результату упражнения (4.8). Кроме того, P|G, поскольку G>Gfe^Gfc/Gfe+1 = P, где г) есть каноническое отображение т] (g) = gGk+1. Однако обратное утверждение неверно, гак как у простой груп- пы могут быть нетривиальные (хотя и ненормальные) подгруппы. Другими словами, если Ап есть знакопеременная группа подстано- вок из п символов, а А3 и As являются простыми, то Л3|Л5.
9 Доказательство теорем о декомпозиции конечных автоматов В этой главе мы на практике осуществим шаги, намеченные ранее, и покажем, что любой автомат может быть построен с помощью каскадных соединений триггеров и автоматов, полугруппы которых являются простыми группами, делящими полугруппу исходного автомата. 9.1 Декомпозиция Р#-автоматов (1.1) Лемма. Для заданных группы G и нормальной подгруппы Н можно построить автомат M(G) в виде каскадного соединения ав- томатов М(Н) и М(G/Н). Доказательство. Рассмотрим каскадный автомат, показанный на рис. 9.1. Для каждого g из G выберем g' <= G так, что Hg{ = Hg2=$> =^g{ — g2 и Hg[ = Hgt, т. e. так, чтобы g' было некоторым предста- вителем смежного класса. Пусть Рр G-+GIH, так что р2: G X G/H -* Н, так что рз: G/H X H-+G, так что g^Hg, [g2. Hg^g[g2[(g{gtf]-1, [Hg', h\ *—^hg'. Тогда если в момент времени t входное воздействие равно g2, а вы- ходная величина есть gi, то в момент времени t + 1 выходная вели- чина окажется равной grg2. (1.2) Следствие. Если G есть некоторая группа, то автомат M{G) можно получить в виде каскадного соединения композиционных
9.1. Декомпозиция Pl?-автоматов 253 факторов группы G, а значит, тем более и из простых делителей (G) = {Р: P\G, Р есть простая группа}. Доказательство. Утверждение следует по индукции из леммы (1.1). Действительно, предположим, что G = G0>G1>... >Gfe-i>Gfe = {l} представляет собой некоторый композиционный ряд для группы G. Тогда приведенная лемма позволяет построить автомат Af(Gft_t) из M(Gft-i/Gft) и M(Gk), автомат M(Gft_2) из М (Gfe_2/Gft_i) и M(Gk^) и т. д. до тех пор, пока мы не-построим автомат M(G) из автома- тов, соответствующих его факторам. Рис. 9.3. Следующая задача состоит в том, чтобы осуществить декомпо- зицию Р/?-автоматов (т. е. перестановочно-возвратных автоматов). Напомним, что входное воздействие х для Р/?-автомата либо осу- ществляет перестановку его состояний, либо отображает каждое состояние в единственное состояние qx, зависящее лишь от входного воздействия («возврат» в состояние qx). Перестановочные отобра- жения порождают группу PR-автоматов. (1.3) Лемма. Если М есть некоторый PR-автомат с группой пере- становок G, то автомат М можно построить без петель из автомата M(G) и тождественно-возвратного автомата с тем же простран- ством состояний, что и у автомата М. Доказательство. Конструкция, реализующая автомат М, показана в ее двух типичных режимах работы; при доказательстве мы снова, как и раньше, воспользуемся схемами (см. рис. 9.2, 9.3),
254 9 Доказательство теорем о декомпозиции конечных автоматов Квадратик с буквами IR соответствует тождествен но-возврат- ному автомату с пространством состояний Q, таким же, как и у ав- томата М. Его нейтральное входное воздействие обозначается че- рез 1, а входное воздействие q ф 1 возвращает его в состояние q. Через Af(G) обозначен автомат для группы G. Действие g s G на q^Q обозначается через (g)q. Далее: hx KQRwpyet воздействие «возвратиться в состояние ?» как (?, 1), а воздействие «воспользоваться перестановочным отображением g» как (1, g); h2 кодирует (l,gj как (l,g); но для q =# 1 кодирует (q, g) как ((<7)g-1> g); h3 кодирует (q, g) как (q)g, и именно выходная величина h3 слу- жит моделью состояния автомата М. Для того чтобы возвратиться в состояние q' при условии, что вначале автомат M(G) находился в состоянии g, a IR находился в состоянии q (что соответствует, таким образом, состоянию (q)g автомата М), мы имеем действие, показанное на рис. 9.2. Такое до- вольно сложное действие требуется потому, что мы не можем воз- вратить автомат A4(G) в состояние 1,не воспользовавшись петлями. Для того чтобы осуществить перестановочное воздействие g', у нас имеется действие, показанное на рис. 9.3. 9.2 Доказательство теоремы о декомпозиции с помощью теории полугрупп (2.1) Теорема. Любой автомат с полугруппой S может быть пред- ставлен каскадным соединением триггеров и автоматов простых групп, делящих S. Оригинальное доказательство этого утверждения, принадлежа- щее Крону и Роудзу [1965], базировалось на важнейшей лемме, которую мы докажем здесь новым элементарным способом. (2.2) Лемма. Пусть S есть некоторая конечная полугруппа. Тогда выполняется одно из следующих условий: (а) полугруппа S циклическая; (Ь) полугруппа S левопростая (т. е. у S нет собственных левых идеалов); (с) существуют такой собственный левый идеал Т и собствен- ная подполугруппа V полугруппы S, что S — Т U V, Доказательство. Если условие (Ь) не выполняется, то мы можем найти максимальный собственный левый идеал Т полугруппы S. Предположим, что существует такое sgS, что Ts <=Т. Тогда Ts U Т является левым идеалом, собственной частью которого слу- жит Т, так что Ts U Т должно совпадать с S. Но V = Ts является подполугруппой.
9.2 Доказательство теоремы о декомпозиции с помощью теории полугрупп 255 Если же условие (Ь) выполняется, то Ts s Т при всех ssS и, следовательно, Т является двусторонним идеалом полугруппы S. Но тогда либо S — Т является подполугруппой и мы получили то, что нам требуется, либо можно найти такие a, b eS — Т, что ab е Т. Но тогда Т = Sb U Т есть левый идеал. Это собственный идеал, поскольку # (Т') < # [(5 — Т — а) Ь] + # Т < # S — 1 и это должно быть равно Т. Тогда sb s Т, а так как b U Т есть левый идеал, то {b} = S — Т. Но тогда либо (b) = S, и это соответствует выполнению условия (а), либо можно положить V = (Ь) и дока- зать тем самым выполнение условия (с). Приведенная лемма кладется в основу доказательства теоремы (2.1) методом индукции по числу элементов S. Для того чтобы воспользоваться индукцией, Крон и Роудз за- метили, что теорема (2.1) тривиальна, если =ft=S = 1- Затем они до- казали следующие леммы. (2.3) Лемма. Если полугруппа S циклическая, то утверждение (2.1) для S справедливо. (2.4) Лемма. Если полугруппа S левопростая, то утверждение (2.1) для S справедливо. Затем они внесли два изменения в определение автомата Af(f). (2.5) Определение. Пусть f: Х*->У, a c^X{jY. Тогда частичным произведением f, PPf, называется автомат M(f), пополненный та- ким образом, чтобы входное воздействие с «возвращало автомат в исходное состояние». Точнее говоря, PPf: (XUc)*->KUch удо- влетворяет условию х = Xicx2, х2 е X* =$ PPf(x) = f(X2) и PPf(x) = f (х) для х е X*. (2.6) Определение. Пусть f: Х*-»-У, а ефХ{]У. Тогда ef совпа- дает с автоматом М (f), измененным таким образом, чтобы входное воздействие е служило для «сохранения» действия. Точнее говоря, ef: (X U е)* _> У и е и удовлетворяет условиям х — ххех2е ...ехк для каждого Xj^X*=^ef(x) = f (х1х2 ...хк) и ef М = f (х) при х е X*. Затем они доказали следующие леммы. (2.7) Лемма. Если S есть некоторая конечная полугруппа с соб- ственным левым идеалом Т и собственной подполугруппой V, та- кими, что S = TUV, то автомат S можно построить в виде каскад- ного соединения триггеров и автоматов efT и PPfv> где fr есть функ- ция автомата М(Т) и т. д
256 9 Доказательство теорем о декомпозиции конечных автоматов (2.8) Лемма. Если для S справедливо утверждение (2.1), то ав- томаты PPfs и efa можно построить в виде каскадных соединений триггеров и автоматов простых групп, делящих S. Предположим теперь, что утверждение (2.1) справедливо для любых полугрупп с числом элементов -С га. Пусть фЗ = п 4- 1. Если полугруппа 3 левопростая или циклическая, то мы уже знаем, что утверждение (2.1) верно для 3. В оставшемся же случае нужно воспользоваться двумя последними леммами и показать, что утвер- ждение (2.1) справедливо для 3, заметив, что ^Т ^.п, фУ^п и {простые делители (Г)} U (простые делители (У)} = s {простые делители (3)}. Последние четыре леммы, формулировки которых имеются в несколько измененном виде в работе Крона и Роудза [1965], предо- ставляем доказать читателю в качестве упражнений! Если задана некоторая полугруппа 3, то, обратив бе операцию произведения, мы получим новую полугруппу S. Это позволит нам доказать на базе леммы (2.2) ей двойственную. (2.9) Следствие. Пусть S есть некоторая конечная полугруппа. Тогда выполняется одно из следующих условий: (а) полугруппа S циклическая} (Ь) полугруппа S правопростая', (с) существуют такие собственный правый идеал Т и правиль- ная подполугруппа V полугруппы S, что S — Т U V. Зейгер [1967] недавно получил другое доказательство теоремы о декомпозиции, основное отличие которого состоит в замене лемм (2.7) и (2.8) следующей теоремой. (2.10) Теорема. Пусть М — автомат с полугруппой S = Т U V, где Т есть собственный правый идеал, а V есть собственная подполу- группа полугруппы S. Тогда при условии, что Q-T = Q, автомат М можно моделировать каскадным соединением автомата с полу- группой S\ и автомата М2 с полугруппой S2, где 3, | V U {возвратные воздействий, S21Т (J {нейтральные воздействия}. Доказательство. Рассмотрим схему, приведенную на рис. 9.4. Про- странство состояний автомата Mi есть Т, а автомата М2 есть Q и совпадает с пространством состояний автомата М. Если рассматри- ваемый каскадный автомат находится в состоянии (р, г)е Г X Q, то его выходная величина есть у{р,г)= r-р. Входной алфавит сов- падает с 3, Если входное воздействие и принадлежит Т, то »1 (и) равно возвращению в и, Zp {и) = р.
9.3 Декомпозиции с помощью «покрытий» 257 Если же и Т, то q (u) = «, Zp(w) = l. И в том, и в другом случае следующее состояние моделирует (г-р)-и: если ифТ, то у(р • и, г) = г • (р • и), если и е Т, то у (и, г • р) — (г • р) • и. Таким образом, Si | V.U (возвратные воздействия}, a S2|Z’ U {1}, что и завершает доказательство. Для того чтобы воспользоваться этим и аналогичными резуль- татами в случае, когда Q • Т Q, и доказать требуемую теорему о декомпозиции, придется прибегать к двойной индукции точно так же, как нельзя основывать доказательства по индукции лишь на одной лемме (2.7), не прибегая к лемме (2.8). Внимательный читатель легко заметит, что лемма (2.7) и теорема (2.10) практи- чески эквивалентны. г Полное доказательство теоремы о декомпозиции, построенное по этой схеме, можно найти в работе Арбиба [1969]. Здесь же мы воспользуемся другим методом, который принадлежит Зейгеру и основан на аппарате «теории покрытий»» 9.3 Декомпозиции с помощью «покрытий» Прежде чем переходить к декомпозициям Зейгера на PR-авто- маты, обсудим метод декомпозиции с помощью «покрытий» — про- цесс, чаще всего связываемый с работами Хартманиса и Стирнза [1966]. Если С есть некоторое семейство подмножеств множества Q, то через max С обозначается множество всех элементов семей- ства С, максимальных относительно операций включения множеств х, х' е С, хсх'=фх^ max С. 9 Зак. 693
258 9 Доказательство теорем о декомпозиции конечных автоматов Обозначим через ЕА тождественное отображение множества А в себя. Пусть S есть полугруппа преобразований множества Q. Тогда называют расширенной полугруппой преобразований множества Q, если к S добавлено Eq и такие возвратные отображения w${q^Q), что wg(Q)= {?}. Для автомата N и х е введем обозначения XN ( ’ ) = ^N ( ’ > *): Qn Qn- Преобразование состояние — выход по-прежнему обозначаем через ₽№ Qn Пусть теперь для автомата М через §м обозначена полугруппа функций хм: QM~*QM, где х<=Х*м. (3.1) Определение. Покрытием С автомата М называется некото- рое непустое семейство таких непустых подмножеств множества Qm, что для каждого w е SM и R е С имеет место w(/?) = R' е С (т. е. существует такое R', что w(R) sR'&C). (Заметим, что С действительно покрывает все множество, поскольку SM содержит все возвратные отображения.) Приведенное определение утверждает, что для заданных R е С и х <= X* удастся найти такое R' е С (зависящее от х и R), что q е R xM(q) е R', независимо от выбора q из R. Если С есть некоторое покрытие автомата М, a N есть некото- рый автомат, то выражение «/V указывает на положение М в С» означает, что XN = Хм и отображает QN на С. Для каждого х е Хм и каждого q е QN имеет место Хм(₽лг(#))^ ?n(xm(Q)), так что N следит за тем, как входные воздействия автомата М перемещаются по клеткам покрытия С, рассматриваемым как подмножества множества Qm, но автомат N не обязательно говорит нам что-нибудь о том, как отдельные со- стояния передвигаются внутри клеток покрытия С. Для заданных автомата М и его покрытия С можно определить автомат N, сообщающий положение автомата М в покрытии С, потребовав просто, чтобы имело место Хм — %n, С — Qn ~Yn> Vn(R)~R, а для каждых R <= С и x^XN — XM, потребовав, чтобы xN(R) было некоторым элементом покрытия С, содержащим хм (R) = = {xM(q): q R}. Согласно определению покрытия, такой выбор всегда возможен. •
9.3 Декомпозиции с помощью «покрытий» 259 Пусть теперь С' есть некоторое измельчение покрытия С, т. е. из того, что R' е С', следует, что найдется такое R е С, что R ^ R'. Мы будем называть С' собственным измельчением покрытия С', если число его элементов меньше, чем у С, или если по крайней мере один элемент из С' является собственным подмножеством не- которого элемента из С. Как и раньше, мы сможем найти автомат /V', который будет сообщать нам положение автомата М в С'. Важно отметить, что автомат N' можно построить в виде соедине- ния без петель автомата N и некоторого нового автомата L, М' где Мпринадлежит С' Рис. 9.5. Задача автомата L состоит в том, чтобы поставлять дополни* тельную информацию, уточняющую, в каком принадлежащем С' подмножестве множества R, принадлежащего покрытию С, нахо- дится автомат М (см. рис. 9.5). Для заданного элемента R покрытия С перенумеруем его при- надлежащие измельчению С' подмножества каким-либо произволь- ным способом, например, как Rh R2, ..., где каждое Ri С'. Пусть p = max{j(R): ReC}>l, и пусть %l = Xm X Yк, = = Р), ₽г(0 = ь Композиция автоматов N и L должна указать нам положение авто- мата М в С', так что, если выходная величина автомата N равна R, то выходная величина L должна быть i, и это должно означать, что текущее состояние автомата М принадлежит элементу Ri из С'. Теперь уже ясно, что всегда можно определить xL(-)= так, чтобы удовлетворить этому требованию. В частности, если С' покрывает множество Qm множествами, со- держащими каждое ровно один элемент, можно заключить, что для 9
260 9 Доказательство теорем о декомпозиции конечных автоматов заданного произвольного покрытия С автомата М и заданного ав- томата К, сообщающего положение автомата М в С, автомат К можно дополнить без петель таким автоматом Af?, что получится новый автомат, моделирующий автомат М (см. рис. 9.6). Если Рис. 9.6. где Мпринадлежит С PR М>> I I I I ------1 м? еде М принадлежит С Рис. 9.7, теперь измельчить покрытие С и получить С', то мы сможем разбить автомат ЛТ? на два блока L и М??, таких, что автомат К вместе с блоком L будут сообщать нам положение автомата М в С', а ав- томат ЛЬ? будет поставлять оставшуюся информацию, необходи- мую для того, чтобы полностью моделировать автомат М (см. рис. 9.7). 9.4 Декомпозиция на Р/?-автоматы Следующая теорема, принадлежащая Зейгеру [1965], показы- вает, что измельчение С' всегда можно выбрать так, чтобы в дей- ствительности автомат L оказался Р/?-автоматом, группа которого делит полугруппу автомата М. (4.1) Теорема. Пусть М есть некоторый автомат, С — покрытие ав- томата М, некоторые множества которого содержат более одного
9.4 Декомпозиция на РЯ-автоматы 261 элемента, а К ~~ автомат, сообщающий положение автомата М в С. Тогда существуют такие автоматы N и L и такое покрытие С' авто- мата М, что (а) покрытие С' является собственным измельчением покры- тия С; (Ь) автомат N сообщает положение автомата М в С'\ (с) автомат N представляет собой каскадное соединение авто- матов К и L\ (d) автомат L является PR-автоматом-, (е) существует такое R s Qm, что группа перестановок в SL яв- ляется гомоморфным образом множества {wER. w е и wER есть перестановка в R}. Прежде чем доказывать эту теорему, отметим некоторые ее следствия. Рассмотрим случай, когда С состоит из единственного множества Qm- Тогда автомат К из теоремы (4.1) может быть авто- матом с одним состоянием. Но это означает, что можно не обра- щать внимания на автомат Л и рассматривать автоматы N и L как тождественные. Отсюда сразу получается следующий результат. (4.2) Следствие. Существуют такое нетривиальное покрытие С автомата М и такой PR-автомат L, сообщающий положение авто- мата М в С', что найдется R = для которого группа переста- новок в St, является гомоморфным образом множества {wER: w е е SM и wER есть некоторая перестановка}. Воспользовавшись один раз этим следствием, а затем последо- вательно меняя теорему (4.1), мы построим последовательность покрытий С', С", ..., ... и соответствующую последователь- ность РР-автоматов Uh\ таких, что групповая часть полугруппы L&) всегда делит полугруппу автомата М, и таких, что мы сможем по- строить автомат M<k\ который сообщает положение автомата М в CW и построен без циклов из автоматов L', L", ..., LW. Такой процесс измельчения покрытий заканчивается только тогда, когда мы дойдем до такого п, что С<п> будет состоять лишь из одноэле- ментных множеств; при этом всегда найдется такое п, что послед- нее условие будет выполнено. Соответствующий автомат Af<n) со- общает положение автомата М в С<п>, но так как все множества покрытия С<п) состоят из единственного элемента, в действитель- ности автомат МЮ моделирует автомат М. Приведенное рассужде- ние доказывает следующий результат. (4.3) Предложение. Любой автомат М можно построить в виде каскадного соединения PR-автоматов, группы которых делят полу- группу автомата М. Будем называть элементы Ri и R2 покрытия С автомата М подобными, Ri ~ R2, если существуют такие a>i, w2 е SM, что
262 9 Доказательство теорем о декомпозиции конечных автоматов Rt — wt(R2) и R2 = w2(Ri). Ясно, что это отношение подобия пред- ставляет собой отношение эквивалентности и что покрытие С можно, таким образом, разложить на классы подобия. Будем называть элемент R е С начальным, если каждый раз, когда R = w (R') для некоторого Р'е С и w s справедливо R ~ R' и если, кроме того, ни в одном множестве покрытия С не содержится большего числа элементов. Легко показать, что если R ~ R' и R есть начальное множество, то начальным будет и мно- жество R'. Будем называть начальным классом любой класс подо- бия, состоящий из начальных множеств. Поскольку покрытие С конечно, то в нем имеется по крайней мере один начальный класс (если предположить противное, то это приведет к построению бес- конечной регрессии «предков» и противоречию). Заметим, что если некоторое начальное множество R из С со- держит лишь один элемент, то все множества С содержат не более одного элемента, так как некоторое возвратное воздействие отобра- жает любой элемент покрытия С на R, но R начально и, следова- тельно, должно быть подобно всем остальным множествам R. Но w е Sm может отобразить R на некоторое множество только тогда, когда это последнее состоит лишь из одного элемента. Поэтому, если имеется некоторое покрытие С и некоторые мно- жества из этого покрытия содержат более одного элемента, всегда можно выбрать некоторый начальный класс D из С, все члены ко- торого содержат по крайней ‘мере два элемента. Образуем тогда С' = Сг[)С2, где Cj — С — D, и С2 = (J max [{Яда: Н g= С, we S^, Hw <= R} — {R}]. RsD Семейство С является покрытием автомата M, так как для каждого блока Н из С' и каждого w е §м множество w (Н) вклю- чается либо в некоторый блок С — D, либо в некоторое подмноже- ство такого блока D, которое окажется включенным в некоторый блок С2‘)- Заметим, что R^D может быть образом (сюръектив- ного отображения) лишь некоторого блока R'eD,.HO все такие блоки отбрасываются. Покрытие С' является собственным измель- чением покрытия С, поскольку блоки из D покрытия С «заменены» в С' более мелкими. Приведенные рассуждения показывают, по- чему, определяя С, мы не взяли в качестве D некоторое произволь- ное подмножество покрытия С', а потребовали, чтобы оно состояло из начал'ьных элементов. Итак, мы построили измельчение С' по- *) Это определение покрытия С взято из работы Зейгера [1968], где испра- вляется ошибка, допущенная в работе Зейгера [1965]; см. также монографию Д. Гинзбурга [1966].
1 9.4 Декомпозиция на Р/?-автоМаты 263 крытия С. Остается убедиться в том, что мы можем выбрать «кор- ректирующий» автомат L так, чтобы он удовлетворял условиям (d) и (е) теоремы (4.1). Но прежде всего нам потребуется один проме- жуточный результат. (4.4) Лемма. Если P,R ^D, то существуют такие отображения и что отображения р£ Ер и vRER являются взаимно об- ратными. Доказательство. Поскольку Р и R подобны, всегда найдутся такие w и у е S^, что w (Р) — R и у (R) = Р. Отсюда yw (Р) = Р и оч/(Р) = Р. Таким образом, отображения yw и wy являются пере- становочными, но нет никаких причин ожидать, что эти отображе- ния взаимно обратны. Однако всегда можно найти такие целые п и ш, что (yw) пЕР = ЕР и (wy) nmER — Er, так как некоторая сте- пень перестановочного отображения всегда оказывается тожде- ственным преобразованием. Пусть теперь v^ — w, а = (yw)nm~l у. Легко видеть, что они взаимно обратны. Лемма доказана. Наконец, мы вплотную приблизились к цели и можем заняться построением автоматов N и L. Пусть D = {Ро, Рь ..., Для каждого Rj е D выберем отображения vRi и п^®, удовлетворяю- щие условиям леммы, и будем придерживаться этого выбора и в будущем. Пусть Выберем теперь в качестве пространства состояний Ql автомата L множество Во, т. е. сконструируем его из таких «кусочков» класса D, которые содержат Ro. Покажем теперь, что сделанный выбор отображений и о*® позволяет приписывать эти кусочки также и другим элементам Rj класса D. Иначе говоря, сделанный выбор и °*; позволяет ввести внутри каждого элемента класса D еди- ную систему координат, в качестве которой служит пространство состояний L. Следующая лемма заимствована из книги А. Гинз- бурга [1966]. (4.5) Лемма. Мощность всех блоков Bj одинакова (обозначим ее через а). Кроме того, блоки Bj можно обозначить через Н}1,..., Hia так, чтобы при 1<Ср4^а и 0^/^СА—1. Доказательство. Пусть Нйр принадлежит блоку Во. Тогда о^/(Д0р) принадлежит Rj и, следовательно, должно содержаться в каком-
264 9 Доказательство теорем о декомпозиции конечных автоматов нибудь блоке из Bj, например в Hjg. Но А так как отображает Rt на /?0, найдется такой блок изВ0, например НОг, что (Hjg) s НОг. Но из максимальности бло- ков из Во следует, что Заметим теперь, что отображение взаимно однозначно, и, сле- довательно, |ЯОр| = |Я/г|, а так как взаимно однозначно и ото- бражение о*/, справедливо также, что Од/ (ЯОр) = Hjg. Для ЯОр, =5^ ЯОр аналогичные рассуждения показывают, что ир/ (ЯОр) = = Hjg, где Hjg ф Hfg, так как в противном случае Од/ преобра- зовывало бы Яор11Яор, на Hjg, в то время как |ЯоРиЯор1|> >|ЯОр| = |Я/г|. Таким образом, v*i отображает различные блоки из Во на раз- личные блоки из Bj. Роли блоков из Во и из Bj можно поменять, а это свидетельствует о том, что мощность всех блоков из Bj оди- накова. Остается только произвольным образом пронумеровать блоки из Во, как Яп, .., Яоа, а затем положить Од/ (ЯОр) = Я/р, что и завер- шает доказательство теоремы. Условимся теперь, что — % к X Qk> Qw = Qk X Qt, при этом во втором равенстве мы отождествляем состояние и вы- ходную величину К. Нам нужно определить pw: QN—+C' так, чтобы автомат N со- общал положение автомата М в С'. Пусть (р, r)eQN. Теперь от- метим следующее: (i) Если р ф D, то р принадлежит одному из элементов покры- тия С, входящему в С', и, следовательно, автомат К уже сообщает положение автомата М в С' и не требуется никакой дополнительной помощи от L. Поэтому можно положить, что Pw (р, г) = р. (ii) Если же р е D, то для того, чтобы перейти от элемента р из С к некоторому его куску из С', необходима новая информация, поставляемая автоматом L. В соответствии с нашим выбором «си-
9.4 Декомпозиция на PR-автоматы 265 стемы координат» выберем Рх(р, г) равным некоторому элементу из С', содержащему (г). Теперь нам остается только определить переходы в простран- стве состояний, согласующиеся с уже сделанным выбором выход- ного отображения. Для хе XN имеем xN(p, г) = (хк(р), xL(p, г)), где хк задано, a xL требуется определить. Поэтому если (р, r)<= QN, то приходим к следующему: 1. Если xK(p)^D, то, согласно определению pw, отображение Xl(P, г) несущественно, и, следовательно, можно удовлетворить условию (d) любым образом, положив, что xL(p, •) есть некоторое возвратное или тождественное отображение. 2. Если же хк (р) е D, то р е D, так как класс D начальный. Определим xN(p,r) как (s, t), где, естественно, s = хк(р), a t есть некоторый элемент из QL, содержащий (г). Для того чтобы завершить наше доказательство, остается убедиться в том, что у = v^xMvPa является возвратным или перестановочным преобразо- ванием на Ql = max {R: R = /?0> R e C'}. Ясно, что p(/?o) S Ro, так как &P X Ro —P —хм (p) — xk (p) ~ 5 По- боли у (Ro) есть некоторое собственное подмножество из Ro, то на самом деле это всего один элемент покрытия С', так что все состоя- ния Ql отображаются на этот элемент, и, следовательно, отображе- ние xL возвратное. Если же y(Ro) = Ro, то.у есть перестановочное отображение на а следовательно, перестановочным является и отображение xL на Ro. На этом доказательство теоремы Зейгера можно считать законченным, что гарантирует нам справедливость центральной теоремы: любой автомат М можно представить в виде каскадного соединения PR-автоматов, группы которых делят полу- группу автомата М. На этом мы заканчиваем изучение теории автоматов. Мы пока- зали, что в структуре автоматов легче всего разобраться, исследуя их представления алгебраическими системами, в нашем случае полугруппами. Можно ожидать, что по мере введения дополнитель- ных математических ограничений на класс рассматриваемых авто- матов для их исследования потребуются и новые алгебраические системы. В четвертой части этой книги мы увидим, что если огра- ничиться рассмотрением лишь линейных автоматов, то можно пе- рейти от полугрупп к модулям с тем, чтобы воспользоваться той дополнительной информацией, которую несет в себе линейность.
ЧЕТВЕРТАЯ ЧАСТЬ СОВРЕМЕННАЯ ТЕОРИЯ ЛИНЕЙНЫХ СИСТЕМ Р. Калман «DFes ist der Jugend edelster Beruf: die Welt, sie war nicht, eh ich sie erschuf». Goethe, Faust, 6793-4 (Part II) 10 Алгебраическая теория линейных систем По своей структуре эта глава построена как маленький учебник. В ней речь идет о линейных системах, причем наряду с основа- ми теории дается и соответствующий вычислительный аппарат. Мы начинаем здесь с основных принципов и постепенно построим все здание линейной теории, строго следуя алгебраическим идеям. Та- кой подход является новым. Он возник прежде всего под воздей- ствием современных результатов теории автоматов (гл. 6 и 7), а также под влиянием классической теории модулей над полями главных идеалов в том виде, в каком она применяется для опреде- ления канонических форм матриц. В этой главе мы будем пользоваться строго алгебраическим сти- лем изложения. Он может показаться излишне абстрактным и да- же экстравагантным для тех, кто воспитан на преобразованиях Ла- пласа или линейной теории в пространстве состояний. Однако и в нашей теории по мере необходимости появятся все привычные по- нятия (такие, как импульсные характеристики, передаточные функ- ции, переходные отображения и т. п.), причем, как правило, их роль и место в теории станут более понятными, а их определе- ния — более общими. У новой теории много и практических пре- имуществ: частотные и временные методы удается рассматривать в ней с единых позиций, линейные системы над конечными полями оказываются частным случаем линейных систем общего вида, тео- рия позволяет найти новые методы эффективных расчетов реализа- ций и т. д. Эту главу можно также рассматривать как естественное обоб- щение элементарной теории, развитой в гл. 2. Как было выяснено там, для решения задачи регулирования необходимо, чтобы си- стема удовлетворяла двум условиям: она должна быть полностью
10 Алгебраическая теория линейных систем 267 управляемой и полностью идентифицируемой. Для стационарной системы 2 с непрерывным временем (уравнения (3.2) из гл. 2) эти условия принимают «дуальную» форму: (*) rank[G, FG, Fre-1G] = dimXs, (** ) гапк[Я', F'H'.(Г)"-1 Я'] = dim Xs (теоремы (3.4) и (6.15) из гл. 2). Мы уже отмечали (замечание (3.19) гл. 2), что первое из этих условий практически остается тем же, если от изучения систем с непрерывным временем перейти к си- стемам с дискретным временем. Аналогичная ситуация имеет ме- сто и для второго условия. Подчеркнем все же еще раз, что вся задача регулирования в смысле гл. 2 целиком зависит от алгебраи- ческих свойств матриц F, G и Н, удовлетворяющих двум упомяну- тым условиям. Поэтому возникает желание выяснить, а нельзя ли построить всю алгебраическую теорию систем на основании только этих двух условий. И оказывается, что это вполне возможно. Условие (*) можно интерпретировать а'лгебраически, как порождающее модуль над многочленами матрицы F. В этом случае теория модулей вхо- дит в теорию систем совершенно естественным образом. Основное теоретическое достоинство подхода с использованием теории модулей состоит в том, что он вносит полную и (мы на- деемся) окончательную ясность в задачу о реализации, и особенно в вопрос о теореме единственности, которая впервые была полу- чена Калманом (теорема 7 (ii) [1963с]). Эта теорема, вызвавшая в свое время многочисленные сомнения, оказывается тривиальным следствием того факта, что линейную систему можно рассматри- вать как модуль. Поскольку в теории систем задача реализации играет центральную роль, весь материал этой главы скомпонован вокруг этой темы. Мы несколько раз возвращаемся к этой задаче в § 10.6, 10.10, 10.11 и 10.13. На первых этапах создания теории реализации, последовавших после 1963 г., слишком много внимания уделялось понятию мини- мальной реализации, для которой пространство состояний имеет минимальную размерность. Однако такой подход в действительно- сти был не совсем удовлетворительным, поскольку «размерность» определялась только для линейной задачи. Более плодотворным оказалось вернуться к исходной формулировке Калмана (теорема 7 (ii) [1963с]) и потребовать для минимальной реализации, чтобы онй была полностью достижимой и полностью наблюдаемой. Эту реа- лизацию мы будем называть канонической. Такая постановка за- дачи является совершенно общей (не связанной с допущением о ли- нейности) , так как соответствует канонической факторизации ото- бражения вход — выход на сюръективное и взаимно однозначное отображения. Многие из обычных трудностей теории реализации
268 10 Алгебраическая теория линейных систем удается обойти, если строго следовать этим идеям. В частности, в § 10.13 мы дадим новое и (надеемся) исчерпывающее изложение теории реализации линейных систем с непрерывным временем. Математический уровень этой главы довольно элементарен, но он требует некоторого знакомства с понятиями современной алгеб- ры (такими, Как абелевы группы, кольца, модуля и абстрактные структуры). Для удобства читателей все существенные результаты, используемые в главе, собраны в приложении А. Исторические и библиографические замечания. Эволюцию рас- сматриваемой теории можно непосредственно проследить по сле- дующей последовательности статей Калмана [1963с, 1965а, b, 1966b, 1967]. Что же касается чистой математики, то уже с начала 30-х годов теорию модулей систематически использовали для определе- ния канонических форм и для решения различных современных за- дач линейной алгебры (Ван дер Варден [1931], т. 2, глава о линей- ной алгебре). С тех пор такая точка зрения завоевала право на энциклопедичность (Бурбаки [1962, 1964]). Однако она еще не до конца принята в университетской системё образования, что, по-види- мому, объясняется чисто педагогическими соображениями. Напри- мер, в книге Греба ([1967], гл. XIII) можно увидеть изложение, ос- нованное непосредственно на условии (*), в котором развиваются все результаты и методы теории R[z]-модулей, но само понятие мо- дуля даже не вводится. В настоящей главе имеется много нововве- дений и неизвестных ранее результатов, идущих дальше, чем ра- боты Калмана за 1963—1966 гг. Например, первое доказательство сходимости фундаментального алгоритма реализации Б. Л. Хо (§ 10.11) было получено практически без упоминания теории моду- лей (хотя она безусловно помогает понять существо вопроса), в то время как во втором доказательстве можно найти намеки даже на более общий аппарат, выходящий за обычные рамки линейной ал- гебры. 10.1 Основные определения Программа данной главы состоит в следующем: мы хотим дать точные и выразительные определения различным свойствам линей- ных систем, а затем применить чисто алгебраические методы к след- ствиям, вытекающим из этих определений. Другими словами, нам хотелось бы выяснить в точности, какую же алгебраическую струк- туру представляет собой линейная динамическая система. Приня- тая система изложения является автономной, и начиная с этого па- раграфа настоящую главу можно читать независимо от остальной книги. В данном параграфе займемся тем, что найдем связь с ос- новными определениями из гл. 1, и, таким образом, увяжем пред- шествующие разделы книги с последующим материалом.
10.1 Основные определения 269 Общие предположения. Вплоть до § 10.13 рассматриваются лишь такие системы S, про которые можно утверждать, что они: 1) с дискретным временем, 2) стационарны, 3) линейны, 4) с конечным числом входов и выходов, 5) построены с помощью чисел из произвольного, но фиксиро- ванного поля К. В § 10.13 мы ослабим первые три предположения и используем основные алгебраические идеи для построения гораздо более об- щей теории. Такие системы полезно (а с интуитивной точки зрения и удоб- но) представлять в виде схемы, показанной на рис. 10.1. Система S О' Входы • О- Система Выходы Время Рис. 10.1. Схематическое изображение системы. имеет т входов, на каждый из которых в каждый момент времени t е Z, где Z — множество целых чисел, поступает некоторое число, принадлежащее полю К. У системы имеется также р выходов, на каждом из которых в каждый момент времени формируется неко- торое число, принадлежащее полю К. Состояния системы и пере- ходы в пространстве состояний также описываются с использова- нием элементов поля К.. Для того чтобы добиться полной строгости, переведем предпо- ложения, сделанные выше, на язык определения (1.1) из гл. 1. Мы имеем: Т —множество моментов времени; оно равно Z (упорядоченной абелевой группе целых чисел); U — множество значений входных воздействий (входной алфа- вит); оно равно Кт, векторному пространству т-ок над по- лем Y — множество значений выходных величин (выходной алфа- вит); оно равно №; X — пространство состояний, оно равно Кп; Q — пространство входных воздействий, т. е. пространство про- извольных функций T-+U или произвольных последова- тельностей ..., ©(—1), <о(О), ©(1),где ©(0 е Gj/ Г — пространство выходных величин, т. е. произвольных’функ- ций Т—>У; ф — отображение перехода Т X Т X X XQ-+X вида (!•!) (/ + 1; t, х, ©)i—>ф(/ + 1; t, х, ю) = Fx(tj + G©(0.
270 10 Алгебраическая теория линейных систем где F и G — матрицы размера (лХ«) и (и X т) над полем К; т) — выходное отображение Т X X -> У вида (1.2) (/, х) = Нх, где Н — матрица размера (р X «) над полем К. (1.3) Примечание. Выбор U и У в виде определенных векторных пространств m-ок и р-ок над полем К. выражает всего лишь тот факт, что имеется определенный фиксированный характер взаимо- действия системы с окружающей средой. Поэтому такое предполо- жение вполне реалистично. С другой стороны, представление про- странства состояний X в виде Кп есть всего лишь условность, по- зволяющая описывать внутреннее поведение системы численным образом с помощью матриц F, G и Н. Как уже отмечалось в этой книге раньше, в общем случае состояние системы нужно рассма- тривать как абстрактное понятие. При этом свойства системы, свя- занные с понятием состояния, должны не зависеть от конкретного выбора системы координат в X. Поэтому лучше рассматривать X как абстрактное n-мерное векторное пространство над полем К- Основываясь на этих соображениях, мы сделаем следующие до- пущения. (1.4) Определение. Стационарная линейная динамическая система 2 с дискретным временем, с пг входами и р выходами над полем К представляет собой сложный объект (F,G,H), где отображения F: Х-+Х, G: Кт-+Х, Н: Х->КР суть абстрактные K-гомоморфизмы, а X — некоторое абстрактное векторное пространство над К. Размерность пространства X, dim X, определяет размерность системы 2, dim 2. Динамическое поведение системы 2 определяется тем, что было сказано выше. Точнее говоря, мы считаем, что тройка (F, G, Н) определяет уравнения (a) x(t+l)~Fx(t) + Gu(t), U } (b) y(t) = Hx(t), где t gZ, хе X, u(t) еКт »£/(0 <= Кр. Обозначение u(t) для элемента (точки) пространства U = Кт будет использоваться наравне с обозначением a(t) для значений функции © : Т —» U. Обычно мы не будем делать различия между тройкой (F, G, Н) как тройкой К-гомоморфизмов и тройкой
10.1 Основные определения 271 (F, G,H) как тройкой матриц, представляющих эти гомоморфизмы относительно некоторого фиксированного базиса в X. На протяже- нии § Ю.2—10.12 мы всегда будем считать, что рассматриваемая система стационарна с дискретным временем, т входами и р выхо- дами (хотя мы и не будем напоминать об этом постоянно). Кроме того, мы почти всегда будем предполагать, что dim Е < оо. Обратим внимание на то, что определение (1.4) является аксио- матическим и будет служить отправной точкой для последующих математических исследований. И каждый раз, когда в последую- щем мы будем упоминать понятие «система», мы всегда будем иметь в виду его точное определение (1.4). Поскольку мы приняли в качестве X абстрактное векторное про- странство, вполне естественно договориться о том, что две системы эквивалентны, если свойства преобразований входных воздействий в выходные величины и свойства переходных преобразований этих систем оказываются идентичными. Другими словами, мы будем считать, что две такие системы совпадают с точностью до некото- рого изоморфизма соответствующих пространств состояний. Эти соображения можно сформулировать строго следующим образом. (1.6) Определение. Две линейные динамические системы S = = (F, G, Н) и S = (F, G, Н) называются изоморфными тогда и только тогда, когда существует некоторый K-изоморфизм а : X 2+Х, такой, что следующая диаграмма К-гомоморфизмов: является коммутативной. Если А есть матрица над полем К, пред- ставляющая отображение а:Х^,Х, то изоморфизм систем выра- жается следующими матричными соединениями: (1.7) (a) F = AFA~\ (b) G = AG, (с) Н = НА~\
272 10 Алгебраическая теория линейных систем 10.2 Отображение вход — выход для линейной системы В этой главе мы примем непривычное определение отображения вход — выход системы. Оно связано с желанием иметь предельно простую связь между внешними и внутренними свойствами систе- мы. И, конечно, для этого требуется в определенной степени пре- дупреждать ход событий. Однако впоследствии принятое определе- ние будет вполне оправдано теми математическими результатами, которые получаются с его помощью. Наши отображения вход — выход предназначены для описания исходов «экспериментов» следующего типа: 1. Подаем на вход системы последовательность входных воздей- ствий конечной длительности. Подачу входных воздействий закан- чиваем в момент времени t = t0, т. е. при любых t > t0 считаем, что входные воздействия тождественно равны нулю. 2. Наблюдаем выходные величины системы лишь после того, как подача входных воздействий закончилась, т. е. при t > t0. При этом будем предполагать, что значения выходных величин известны при любых t> t0, независимо от того, насколько они велики. 3. Так как мы договорились рассматривать (за исключением § 10.13) лишь стационарные системы, для обозначения момента времени в качестве «настоящего» t = t0 можно выбрать любое це- лое. Очевидный выбор состоит в том, чтобы положить t0 = 0. 4. Заметим, что в силу линейности системы предположения 1—3 не накладывают никаких ограничений на общность выводов. Описанную только что конструкцию оформим в виде строгого определения. (2.1) Определение. Линейным отображением вход — выход для ну- левого состояния над К называется отображение f: Q—* Г, удов- летворяющее следующим условиям: (a) Q есть множество всевозможных последовательностей /(-векторов со: Z—*Лт, таких, что w(/) = 0 при всех t>Q и всех t < t-\ -С 0, где t-i — некоторое целое, возможно зависящее от со; (Ь) Г есть множество всевозможных последовательностей /(-векторов у: Z—>/(p, таких, что у(/) = 0 при всех (с) отображение / инвариантно относительно сдвигов во вре- мени в том смысле, что диаграмма Q---*—>Г °а °г Р —+Г
10.2 Отображение вход—выход для линейной системы 273 является коммутативной по отношению к следующим операторам сдвига oq и сгг* <т2: (0...©(-1), ®(0); 0, . ..)н->(0.....®(0), 0; 0, ...) («приписывание нуля»), <тг: (0....0; у(1), у(2), ...)->(0, .... 0; у(2), у(3), ...) («отбрасывание у(1)»); (d) Й и Г суть К-векторные пространства (в обычном смысле, поясняемом ниже), a f есть некоторый Л-гомоморфизм относитель- но описанной выше структуры вйиГ. (2.2) Замечание. Тот факт, что Й и Г можно наделить структурой Л’-векторного пространства, должен быть совершенно ясным. Рас- смотрим, например, й. Сложение здесь определяется отношением (© + 6) (/) — о (/) + © (t), со, й бй (где сложение в правой части понимается как в К-векторном про- странстве Кт). Аналогичным образом определяется и скалярное умножение (а • ®) (0 = а • со (/), а е К, © е й (скалярное умножение в правой части понимается как в Кт). (2.3) Замечание. Последовательности [f(ei)b (равные /-м компо- нентам векторной последовательности /(е<), где е й есть по- следовательность cofe(0) = Sffe, = если ^=£0) несут ту же информацию, что и импульсная характеристика стационарной ли- нейной системы с непрерывным временем. Последовательность lf(ei)b иногда называют импульсной реакцией j-го выхода на воз- мущение i-го входа. Как известно, знания всех таких реакций до- статочно для определения отображения вход—выход для нулевого состояния стационарной линейной системы. Таким образом, мы вновь убеждаемся в том, что принятое определение не влечет за собой потери общности. (2.4) Замечание. Определение (2.1) сформулировано таким обра- зом, что автоматически гарантируется причинность системы в силу того, что оно не дает возможности установить зависимость теку- щего значения выходной величины (а именно у(1)) от будущих значений входных воздействий (а именно от ©(1), ©(2), ...). Сам факт определения й и Г на непересекающихся подмножествах (—оо, 0) и [1, оо) множества Z показывает, что прошлое опреде- ляет будущее. Все это вытекает непосредственно из условий (2.1а-с) и не требует привлечения линейности. Эти условия га- рантируют и существование «состояния», естественным образом
274 10 Алгебраическая теория линейных систем связанного с каждым отображением вход — выход. Короче говоря, причинность предполагает существование состояния. (2.5) Замечание. Имеет смысл напомнить следующее «программи- рующее» определение операторов сдвига: Oq — сдвинуть в обратном направлении и приписать на конце нуль; ог — сдвинуть в обратном направлении и отбросить первый символ. (2.6) Вычислительный метод. Покажем, как с помощью f можно вычислить реакцию линейной системы в нулевом состоянии на произвольную входную последовательность (со(0), <о(1), ю(2), ...), ® (0 <= Кт. Легко видеть, что выходная последовательность (у(1), у (2), у(3), ...) в этом случае должна иметь следующий вид: Y(l) = f(0....0, ®(0); 0, ...)(1), у(2) —/(0, ..., о(0), ®(1); 0, ...)(1), Y(3)=f(0, .... <а(0), <о(1), ®(2); 0, ...)(1), где /()(!) есть первый член последовательности /(). (2.7) Обозначение. Напомним, что выходной символ формируется с задержкой на одну единицу времени по отношению к моменту получения входного символа. Для того чтобы связать понятие отображения вход — выход, определенное выше, с понятием динамической системы, введенным в § 10.1, нам потребуется следующее определение, которое будет использоваться на протяжении всей этой главы. (2.8) Определение. Линейная динамическая система 2 в смысле определения (1.4) является реализацией отображения вход — вы- ход f в смысле определения (2.1) тогда и только тогда, когда ото- бражение вход —выход f2 системы S совпадает с f, т. е. когда fs=f. Сравнивая уравнения (1.5) с тем, что говорилось непосредствен- но перед определением (2.1), мы сразу получим следующее пред- ложение. (2.9) Предложение. Система S реализует отображение f тогда и только тогда, когда (2.10) [f(e,)]/ = ([#<?]//. [HFG]}i, [HF2G]H, ...). (Здесь квадратные скобки выделяют элементы векторов или мат- риц.)
10.3 Структура К[г]-модулей в Q и Г 275 Чтобы избежать любых возможных неясностей в определении отображения fs, выпишем явную формулу (2.11) fr 2 HF-t+lG<i>(t), ...j. 10.3 Структура К[г]-модулей в 1) и Г Предположим на время, что К — R. В теории линейных систем с дискретным временем уже стало принятым заменять последова- тельности из Q и Г их дискретными преобразованиями Лапласа, иначе называемыми z-преобразованиями (Фримэн [1965]), которые определяются следующим образом: (3.1) 6 (z) == 2 ® (0 z~f, t^z (3.2) y(z)=2y(0z-^ t^Z «Преобразования» ©f—>© и Y1-*Y можно, конечно, рассматривать как отображения Q-* {отображения С->Ст}, Г-»{отображения С->СР}, так как zeС; С — поле комплексных чисел. Поскольку преобразо- вание рассматривается как некоторая функция комплексного аргу- мента z, приведенное определение имеет смысл только в том слу- чае, когда суммы (3.1) и (3.2) сходятся (при некотором z). В принятых нами предположениях относительно й в качестве (о (z) мы имеем многочлен, и, следовательно, он определен при любых, z. Напротив, сумма (3.2) сходится только при выполнении особых условий, например если (3.3) |z|>l и | Y (01 < С< о° для всех t. Но хотя выполнение условий сходимости совершенно необходимо для того, чтобы придать методам, основанным на преобразованиях, математическую строгость, в технической литературе с этими ус- ловиями обходятся крайне вольно и тем не менее без очевидных неприятных последствий. В чем же здесь дело? Причина состоит в том, что в огромном большинстве случаев применения линейной теории мы имеем возможность ограничиться изучением конечномерных систем, а тогда вопросы сходимости вообще не играют никакой роли, так как все можно представить алгебраическими выражениями. Мы займемся теперь построением строгого и в то же время очень простого аппарата, использующего эти соображения. Нет сомнения, что с течением времени это вызовет необходимые
276 10 Алгебраическая теория линейных систем изменения в преподавании автоматики. Здесь же мы сосредоточим внимание лишь на математических аспектах. До конца этой главы мы будем пользоваться приводимой ниже моделью. Мы снова предположим, что К — произвольное поле. Вместо того чтобы считать, что уравнение (3.1) определяет не- которую функцию г, мы будем рассматривать его как определе- ние некоторого изоморфизма между (2 и /(-векторным простран- ством Km[z] многочленов от переменной z с коэффициентами из Кт. Таким образом, (3.1*) со ~ 2 ® (конечная сумма!) = • , t <о <вА е/((г), k = 1...пг, где символ (k-я компонента вектора со) обозначает многочлен ® ®ft(z) = oft(0) + ®A(-l)z+ ... +®ft(-f1)z/'. (3.4) Замечание. Еще раз подчеркнем, что для нас многочлен— Ь: это некоторый алгебраический объект, а не функция комплексной переменной. Такой многочлен есть просто еще один способ пред- ставления. последовательности из й. Переменную z мощно рас- ?? сматривать как задающую время, причем zk соответствует моменту 1 t = —k. Конечно, в такой условности нет ничего сколько-нибудь ,1. нового. По сути дела речь не идет о каком-либо «преобразовании». 11 Основное достоинство нового представления связано с удобствами а обозначений: ведь правила обращения с многочленами известны Я всем. (Совет: сейчас самое время ознакомиться с приложением А.) < Мы не станем делать какого-либо различия между ® как ко- Ж нечной векторной последовательностью и и как векторным мно- < гочленом. » Существенная же алгебраическая идея, являющаяся новой 1 (для теории систем), состоит в следующем. I (3.5) Предложение.. Множество Q, рассматриваемое как К-вектор- ное пространство J(m[z], наделяется структурой конечного свобод- | ного модуля следующим образом: I (а)Абелева группа на Q задается коммутативной операцией f сложения в Q как в К-векторном пространстве (см. § 2 и, в част- 1 ности, замечание (2.2)). $ (b) Кольцо, действующее на множестве Q, задается посред- | ством K[z], рассматриваемого как кольцо относительно обычного i умножения многочленов.
10.3 Структура К[г]-модулей в fi и Г 277 (с) Скалярное умножение в й: я • и (для л е K[z], ы е й) определяется обычным покомпонентным произведением векторного многочлена на скалярный. (d) Базисом множества й служат векторы 0 .0 из пространства Кт. Доказательство. Теорема доказывается тривиальной (и хорошо из- вестной) проверкой аксиом модуля (А.5) — (А.8). (3.6) Интерпретация. Важно отметить, что умножение в K[z] (хо- рошо знакомое и известное обычное перемножение многочленов) эквивалентно операции свертки скалярных последовательностей. Чтобы убедиться в этом, запишем n(z) в виде л (z) = S п^г(. t Отсюда имеем (ля') (z) = 2 лгл'гг = 2 nsn't_s^ = 2 nt_sn'zl. r+s^t tt s t, S ’ (3.7) Замечание. Важно также отметить, что мы не определили в Й структуры кольца (относительно умножения), даже для случая т = 1. Вместо этого в предложении (3.5) мы определяем на й структуру с операторами, где операторы, принадлежащие кольцу /C[z], действуют на й посредством операции скалярного умножения. Отметим также, что скалярное умножение на z соответствует опе- ратору сю, поскольку Z • © = 02 (©), в чем можно непосредственно убедиться с помощью формулы (3.1*). Таким образом, умножение на г является представлением оператора сдвига 02. Допуская определенную нестрогость, можно сказать, что структура модуля, которой мы наделили й, согласно (3.5), позволяет представить оператор сдвига (играющий в иссле- дованиях динамики центральную роль) чисто алгебраическим способом. Возвращаясь затем к формуле (3.2), определим некоторый изо- морфизм между Г и К-векторным пространством Л^Пг-1]] всевоз- можных формальных степенных последовательностей от перемен- ного г-1 с коэффициентом из Кр Другими словами, заменим фор- мулу (3.2) соотношением (3.2*) у 2 оо
278 10 Алгебраическая теория линейных систем «Формальные степенные ряды» в нашем изложении — это всего лишь другое название для «бесконечных последовательностей». По- этому вопроса об их сходимости просто не возникает. Нам не нуж- но вычислять число y(z), zg С, даже для тех z, для которых ряд (3.2) может оказаться сходящимся. Переменное z вновь служит своеобразным масштабом времени, где z~h соответствует моменту t = k в строгом согласии с условным обозначением, принятым для изоморфизма (3.1*). Отметим еще, что нулевой член степенного ряда( 3.2*) всегда равен нулю. Это есть следствие системы обозна- чений (2.7). Мы вновь не будем делать особого различия между у как бес- конечной последовательностью и у как формальным степенным рядом с векторными коэффициентами. Рассмотрим теперь диаграмму Q---f—>Г (3.8) Q—р->Г Согласно определению (2.1с),эта диаграмма должна быть комму- тативна для Q и Г, рассматриваемых как множества, и для f, аа и аг, рассматриваемых как отображения множеств. В линейном случае Q и Г суть /(-векторные пространства, а следовательно, операторы сдвига ад и аг автоматически становятся /(-гомомор- физмами. Что касается отображения f, оно должно быть /(-гомо- морфизмом, согласно определению (2.Id). Таким образом, в линей- ном случае диаграмма (3.8) является коммутативной диаграммой /(-гомоморфизмов. Мы знаем уже, что оа можно представить в виде © >—> z • © в силу того, что Q можно наделить структурой К[г]-модуля. А нельзя ли аналогичным образом представить ог? Если мы хотим наделить Г структурой /([zj-модуля так, чтобы <тг: yt-^-z-y, то тем самым отображение f должно стать /([г]-гомомор- физмом (поскольку коммутативность диаграммы Q---f— > (3.9) Q---?—> является определением /С[г]-гомоморфизма й—>Г). Поэтому для того, чтобы наделить Г подходящей структурой /ффмодуля, мы просто исследуем различные необходимые усло- вия, связанные с тем, что f должно быть /С[г]-гомоморфизмом. Имеем тогда f(z • ©) = z □ /(©) = (Тг (/(©)),
10.4 Модули и эквивалентность Нерода 27? где □ есть (пока неизвестное) скалярное умножение в Г. Опре- деление ог (см. также замечание (2.5)) показывает, что нужно определить произведение л-у как обычное произведение формального степенного ряда у е AXf2”1]] на многочлен л е /<[z] с по- (З.Ю) следующим отбрасыванием всех членов с неотрицатель- ными показателями степени у г. После того как мы покончили с этим важным вопросом, обыч- ная проверка аксиом модуля позволяет получить следующий важ- ный результат. (З.П) Предложение. Множество Г, рассматриваемое как К-вектор- ное пространство всевозможных формальных степенных рядов относительно z~l с коэффициентами из Кр и у0 = 0, может быть наделено структурой К[г]-модуля со скалярным произведением, определенным согласно (3.10). По отношению к этой структуре модуля оператор сдвига <тг может быть представлен как у i—> z • у. Отметим, что /<[г]-модуль Г ни свободен, ни конечен. 10.4 Модули и эквивалентность Нерода Итак, мы установили, что отображение f, определенное со- гласно (2.1), есть /([zj-гомоморфизм. Именно это математическое следствие системного определения (2.1) делает линейную теорию систем интересной (и богатой результатами). В качестве первого применения подхода с использованием теории модулей отметим, что существует некоторый модуль, есте- ственным образом связанный с отображением вход — выход f или естественным образом индуцированный этим отображением; мы говорим о фактормодуле /С[з]-модуля множества Й по подмодулю kerf. И хотя мы считаем, что читатель знаком с понятием фактор- модуля, мы введем это понятие здесь в связи с его важной интер- претацией в теории систем. Для заданного /С[г]-гомоморфизма f можно установить отноше- ние эквивалентности ~, определяемое условием (4.1) 6тогда и только тогда, когда f(w) = f(©), или, что тоже, (4.2) А тогда и только тогда, когдд о— йе ker f. Чтобы установить связь с материалом гл. 7, отметим следую- щее свойство отношения эквивалентности. (4.3) Предложение. Отношение является отношением конгру- энтности на й, рассматриваемым как К[г]-модуль.
280 10 Алгебраическая теория линейных систем Доказательство. Обозначим через [®/] класс эквивалентности для ©, порождаемый отношением «. Нам нужно доказать, что класс эквивалентности для суммы (о + ©' содержит все суммы © + где © и &' — произвольные представители классов [©]/ и [©]/. Тогда со — ® и ©' — ©' принад- лежат ker f, согласно (4.2). Поэтому © + со' — (© + 6') s ker f, по- скольку ker f есть подпространство из Q. Но отсюда вновь в силу (4.2) имеем со + &' е [со + ©']/. Аналогичным образом можно доказать, что если со' е [со]/, то асо' е [а®]/ (где, конечно, а е ЛВД) • Доказательство закончено. Предположим, что [®]/ рассматриваются как абстрактные объ- екты, а не как подмножества из Й. Тогда доказательство предло- жения (4.3) показывает, что абстрактное множество {[©]/: я= Xf может быть наделено структурой /С[з]-модуля и что в этом модуле операции + и • определяются соотношениями [©]f + [®']f = [® + ©']/, (4) z •[©]/== [z-©]f. По определению имеем й/ker f = Х}. Поэтому предложение (4.3) эквивалентно следующему. (4.5) Предложение. Классы эквивалентности Xf, порожденные (для модуля) отношением эквивалентности «*, могут быть наде- лены структурой К[г]-модуля, который называется фактормодулём й/ker f (по подмодулю ker f). Вспомним теперь, как в § 7.2 мы обсуждали отношение экви- валентности Нерода Ef, индуцируемое отображением f. Здесь важ- но отметить следующее. Два входных воздействия ши® эквива- лентны по Нероду тогда и только тогда, когда выходные последо- вательности f(a>) и f(&) одинаковы и остаются таковыми, какое бы произвольное входное воздействие veQ ни следовало за © и 6. Понятие «следования за» определяет умножение сшиванием, ко- торое в настоящем контексте определяется соотношением ©°v = (0, ..., 0, ©?, ©,-!, .... ®э, v,', vq'-i, ..., vj; 0, ...). В системе обозначений с помощью многочленов это означает, что (4.6) © ° v = z1+’'© + V, где q'— degv = max{degvft: k=l.......m), k a символ deg определяет обычную степень "многочлена. Таким об- разом, строгое определение отношения эквивалентности Нерода,
10.4 Модули и эквивалентность Нерода 281 индуцированного отображением f, состоит в следующем: тогда и только тогда, когда f(©ov) = f(©°v) (4.7) для всех ve Q, где v может быть и пустой последовательностью 0, для которой (0 00=0). Обозначим классы эквивалентности Нерода через (©)/. Теперь мы в состоянии сформулировать чрезвычайно важный, хотя и простой, результат. (4.8) Предложение, [со]/ = (©)/ для всех аЕЙ. Доказательство. То, что для выполнения (4.1) необходимо (4.7), следует сразу из определений. В силу линейности отображения f и определений (4.4) имеем / (® ° v) = f (z1+deg v©) + f (v) = 2I+deg vf (®) + f (v). Поэтому и (4.7) гарантирует выполнение (4.1). Доказательство окончено. Как мы убедились в § 7.2, классы эквивалентности Нерода естественным образом определяют множество состояний, соответ- ствующее отображению вход — выход. Поэтому с помощью (4.8) мы получаем следующий результат, который по многим причинам (а они станут яснее в дальнейшем) мы считаем фундаментальным. (4.9) Фундаментальная теорема линейной теории систем. Есте- ственное множество состояний Xf отображения вход — выход f над полем К для линейной стационарной системы с нулевым состоя- нием и дискретным временем можно наделить структурой K[z]- модуля. Мы уже пользовались и будем продолжать пользоваться спе- циальным соглашением об обозначениях. (4.10) Обозначения. Множество всегда обозначается одной и той же буквой, какая бы структура ему ни была придана. Аналогично этому элементы множества также обозначаются теми же буквами, независимо от структуры. Поэтому Q может быть абстрактным множеством, К-векторным пространством, К[г]-модулем или еще чем-нибудь. Элементы £2 обозначаются через ®, и, следовательно, © может быть как последовательностью, так и многочленом. Каж- дый раз, когда в этом возникнет необходимость, мы станем спе- циально указывать, о какой структуре идет речь. Читателю при- дется постараться привыкнуть к такому абстрактному подходу, чтобы «наделять» множество какой-либо структурой или «осво- бождать» это множество от нее без особых мыслительных усилий. Предупреждение: как только новая структура вводится первый раз, необходимо тщательно проверить выполнение условий суще- ствования, как это было в случае предложения (3.11).
282 10 Алгебраическая теория линейных систем 10.5 Пространство состояний как модуль Обратимся теперь к линейной динамической системе S, описы- ваемой ее уравнениями перехода (1.5а). Точнее говоря, будем рас- сматривать 2 как пару (F, G,—), где F: К,п-*Кп и G: Кт-+Кп суть /(-гомоморфизмы (а отображение И несущественно, как и сле- дует из обозначений). Нам хочется сопоставить системе 2 некото- рый /С[з]-модуль Xs- Стандартный прием построения /С[х]-модулей содержится в сле- дующем предложении. (5.1) Предложение. Пусть A: V-*-V— произвольный К-эндомор- физм К-векторного пространства V. Тогда V можно наделить структурой К[?]-модуля с скалярным умножением (л, о) ь-> л • v = л (Л) v, л е К [г], v е V, где л (Л)—операция «подстановки А в л», т. е. л (Л) является эндоморфизмом ло/ + ...+лпЛп, а л(Л)о — обычное действие эндо- морфизма л (Л) на V. И обратно, если задан любой К[г]-модуль V, то К[г]-эндомор- физм v t-^-z-v индуцирует К-эндоморфизм он->Ли = z-v. Пусть модуль Xs, построенный для системы 2 с помощью этого процесса (при условии, что V = Xs есть пространство состояний си- стемы 2, а Л = Fs), называется в дальнейшем К[г]-модулем, ин- дуцируемым системой 2. У этого модуля есть особое множество элементов, определяемых равенством {Gej, ..., Gem} = {gi, ..., Sm}> где ek определяются согласно (3.5d). По причинам, которые скоро станут понятными, мы назовем элементы этого множества дости- жимыми образующими модуля Xs- Определение системы 2 в явном виде говорит нам о том, как входные воздействия изменяют (в динамическом смысле) состоя- ние системы. Это изменение можно рассматривать как своеобраз- ное умножение. (Мы обозначим его с помощью правого умноже- ния, чтобы не спутать с скалярным умножением, а в качестве сим- вола умножения используем о, так как динамическое изменение состояния тесно связано с операцией сшивания.) Таким образом, отображение <рш начального состояния в состояние через единицу времени после окончания входной последовательности обозна- чается через
10.5 Пространство состояний как модуль 283 и определяется в явной форме как о (5.2) xo© = F1+deBfi>A:+ х f = —deg(O В качестве одного из первых фактов, оправдывающих название теоремы (4.9), докажем простое предложение. (5.3) Предложение. Динамическое действие можно представить в виде действия модуля. Доказательство. По определению отображениях!—>Fx (в обозначе- ниях векторного пространства) оно эквивалентно отображению х»—*z-x (в обозначениях теории модулей). Более того, поскольку, согласно нашим обозначениям, ® (0 = 5 (0 ekt k=\ = S t и Gek = Sk, ясно, что (5.4) x°o) = z1+dege> • x+S • St* (5.5) Интерпретация. В частности, имеем, что (5.6) 0 о ® • gk- k-6 Левая часть этой формулы обозначает состояние х, достижи- мое из состояния. 0 в результате использования входного воздей- ствия <о. (Посмотрите определение (2.13) гл. 2.) Правая же часть представляет этот элемент (рассматриваемый как элемент модуля) в виде линейной комбинации достижимых образующих gk — Geh. В частности, есть «сигнал», который нужно подать на k-и вход системы 2 для того, чтобы перевести ее в состояние х = 0 ° ®. Другими словами, линейная комбинация элементов модуля соот- ветствует изменению состояния с помощью подходящих вход- ных воздействий. Таким образом, скалярное умножение модуля Хотя это выражение и вполне определено, оно не подходит для описания реакции на «входное воздействие», состоящее из одних нулей, поскольку <а = 0 есть многочлен нулевой степени, т. е. это последовательность, состоящая ровно из одного нуля. Необходимые изменения, позволяющие включить и этот случай, можно найти в § 10.1?. . •
284 10 Алгебраическая теория линейных систем обеспечивает нас исключительно компактной формой записи реак- ции системы на входное воздействие, приложенное к конкретному входу системы. Образующая gk^Xs соответствует k-му входу, а термин «достижимая» показывает, что этот вход действительно мо- жет использоваться внешним потребителем системы Е, т. е. что переход 0->©л-§л в пространстве состояний можно совершить, не прибегая к «вскрыванию» системы и использованию специальных сигналов, вводимых прямо внутрь системы. Основываясь на этих соображениях, мы можем сразу получить следующее предложение. (5.7) Предложение. Достижимые состояния системы S образуют подмодуль модуля Xs, порождаемый достижимыми образующими модуля Xs. , (5.8) Предупреждение. Поскольку в общем случае необязательно, чтобы все состояния системы были достижимыми, достижимые образующие не обязательно порождают все подмодули модуля Xs. Но Xs порождается конечной системой образующих каждый раз, когда Xs (как К-векторное пространство состояний системы S) конечномерно, так как в этом случае элементы базиса Xs (как векторного пространства) могут служить образующими Xs (как модуля). Подводя итог, отметим еще раз большое преимущество под- хода с использованием теории модулей. Такой подход позволяет описать результат воздействия на систему входной последователь- ности (произвольной, но конечной длины) при условии, что в на- чальный момент времени система находилась в нулевом состоянии, с помощью одного алгебраического действия. Представим эту опе- рацию в новых обозначениях: (5.9) Gs' Q -* Xs' ®i-*0 о © = S • gk- k=*\ Сужение (7 s на Km (которое считается изоморфным простран- ству многочленов нулевой степени и, следовательно, является под- модулем модуля Хт[г]) — это и есть отображение Gs = G: Km-+Kn, встречающееся в определении системы S. Отметим, что Cs яв- ляется гомоморфизмом X[z]-модуля (что следует непосредственно из определения). Отображение 5 можно также определить для фактормодуля Xf = Q/ker f, индуцированного отображением f, согласно соотно- шению (5.10) Gf. Q —> Xs'. ©1—* [©]f.
10.5 Пространство состояний как модуль 285 Как и раньше, остается К[г]-гомоморфизмом, так как Gf (z • ©) = [z • ©]f — z • [©]f = z • Gf (©) в соответствии с определением скалярного умножения в Xf (см. (4.5)).' Этот факт можно было бы использовать для того, чтобы попытаться угадать «истинную» структуру модуля в Xf, которую раньше мы взяли чисто произвольно. Другими словами, тот факт, что динамические соображения хорошо согласуются с алгебраиче- скими потребностями, приводящими к построению фактормодуля, является счастливой случайностью. Это еще одна причина, объяс- няющая название теоремы (4.9). Рассмотрим теперь выходное отображение Hz динамической системы 2. Ясно, что Н индуцирует отображение состояние >—> выходная последовательность, соответствующая этому состоянию. Запишем (5.11) Я2: X ->Г: х (Нх, HFx, HFx, ...)== = (Ях, H(z-x), Н^-х), ...), и назовем_Я2 расширением отображения Hz = Н. Совершенно ясно, что Hz есть К[з]-гомоморфизм. Точно так же функция f индуцирует отображение (5.12) Hf. Xf->r: [©]f(©). Нам нужно проверить, насколько хорошо определено Sf, но это оказывается тривиальным: если [©]/ = [©V, то f(©) = f(©) в силу определения (4.1). Теперь мы видим, как переводить наиболее важные понятия, связанные с f и 2, на язык ЛИ-модулей и К[х]-гомоморфизмов. (5.13) Обозначения. Приведем в систему терминологию, введен- ную до сих пор. Динамическая система 2 — (F, G, Н) индуцирует тройку (Xs,{gi, .... gm},Hz), где Xs есть К[г]-модуль, индуцированный гомоморфизмом F (пред- ложение (5.1)); gk = Geft, k = I, tn, есть достижимые образующие мо- дулу Xs; Hz есть отображение (5.11), индуцированное отображением Н. В свете этого ясно, что при заданных (X, tei, • • •, gm}, Н мож- но индуцировать систему 2, просто-напросто обратив каждый из этапов процедуры, определенной выше. Для удобства" мы станем называть тройку (Xs, tei....gm}, Hz) модулем системы 2 и ча- сто будем говорить об этом модуле как о модуле Х2. Короче го- воря, будем считать систему 2 эквивалентной модулю Xz. (Для простоты индекс у Xs можно и отбросить.)
286 10 Алгебраическая теория линейных систем Аналогично этому отображение вход —выход f индуцирует тройку .... где Xf — Q/kerf (как для А[г]-модуля); gk = М/; Н/ есть отображение (5.12), индуцированное отображением f. Обращая этот процесс, мы немедленно увидим, что f = Hf° Gf, где Gf: =*= -gfe- Мы будем называть тройку (Xf, {gh ... gm}, Hf) просто модулем отображения f и сокращенно обозначать через Xf. И снова имеем, что f эквивалентно Xf. _ _ Иногда полезно рассматривать тройку (X, G, Н) вместо тройки (X, {gi, ..., gm},H). Совершенно ясно, что и эти две тройки экви- валентны. 10.6 Теория абстрактной реализации Напомним фундаментальное определение (2.8). Система 2 реа- лизует f тогда и только тогда, когда fs = f. Для любого f реали- зации бесспорно существуют. Действительно, достаточно взять ди- намическую систему 2, у которой As = й (векторное простран- ство), F = oq, G есть тождественное преобразование, а Н = f. Но такая реализация, естественно, тривиальна и бесполезна. Аппарат теории модулей, основание для применения которого заложено в предыдущих параграфах, позволяет построить другую реализацию, являющуюся естественной, полезной, нетривиальной и потому за- служивающей пристального внимания. Для этого_нужно сопоста- вить отображению f его модуль (Xf, {gb ..., gn^,Hf), а затем рас- сматривать эту тройку как динамическую систему 2. Легко прове- рить, что такая система реализует f. Теперь нам нужно показать, что эта (абстрактно) построенная реализация является в некотором смысле единственной заслужи- вающей изучения. Мы рассматриваем сейчас задачу реализации как «попытку угадать уравнения движения динамической системы по поведению ее входных и выходных сигналов», или как «задачу построения физической модели, объясняющей экспериментальные данные», или как «задачу построения принципиальной схемы, ко- торая может соответствовать внутреннему устройству черного ящика, чье отображение вход — выход совпадает с /». В 1962 г., задолго до создания излагаемого формализма, Кал-j ману удалось получить, по-видимому, первый полноценный резулм тат в этом направлении. Перефразируя несколько теорему 7 из pal
10.6 Теория абстрактной реализации 257 боты Калмана [1963с] с тем, чтобы обеспечить единство стиля, мы можем сформулировать этот результат в следующем виде. 1. Если динамическая система 2 исследуется с помощью экспе- риментального изучения причинных связей и если f есть ее (при- чинное) отображение вход — выход, построенное по уравнению дви- жения, то f зависит лишь от некоторой подсистемы 2о системы 2, которая является одновременно полностью достижимой и полностью наблюдаемой. Остальная часть системы 2 не оказывает на f ника- кого влияния и может выбираться произвольным образом, не на- рушая при этом f. 2. Если любые две системы 2 и 2 одновременно полностью до- стижимы и полностью наблюдаемы и имеют одинаковые отобра- жения вход — выход f, то они различаются лишь используемыми системами координат в соответствующих пространствах состояний. Из этих фундаментальных результатов сразу вытекает важное следствие (также подробно рассмотренное в работе Калмана [1963с]). 3. Если некоторая система 2, реализующая отображение1) f, не является полностью достижимой или полностью наблюдаемой, то система 2 содержит какие-то части, которые не имеют никакого отношения к экспериментальным данным, обобщенным в f, а полу- чены совершенно произвольным образом, зависящим лишь от вида конкретного алгоритма, использованного для построения системы 2. (Отметим, что в литературе, опубликованной до 1965 г., есть очень много таких примеров.) 4. Если некоторая система 2, реализующая отображение f, пол- ностью достижима и полностью наблюдаема, то она существенно единственным образом определяется отображением f, поскольку выбор подходящей системы координат пространства состояний принципиально нельзя сделать на основании экспериментального наблюдения входных воздействий и реакции на них исследуемой системы. Так или иначе задача выбора системы координат в про- странстве состояний несущественна, так как то, каким образом обозначать внутренние состояния системы 2, не имеет никакого со- держательного физического значения. Ниже мы убедимся, что утверждение о том, что f «существенно единственным образом определяет систему 2», есть прямое след- ствие теоремы (4.9). Приведем теперь одно важное определение. (6.1) Определение. Реализация 2 отображения f называется кано- нической (или естественной) тогда и только тогда, когда она *) Вместо выражения «система 2, реализующая отображение иногда для краткости используется «реализация S отображения или просто «реализация Г»-—Прим. ред.
288 10 Алгебраическая теория линейных систем полностью достижима и полностью наблюдаема. (Определения двух последних понятий даны в гл. 2, (2.12) и (6.4).) Нам хочется построить теорию реализуемости предельно про- стым и элементарным способом. Для этого забудем на время о ли- нейности и сформулируем тривиальную, но полезную лемму из теории множеств, базирующуюся на работе Зейгера [1967Ь]. (6.2) Лемма Зейгера о пополнении. Пусть А, В, С и D — произ- вольные множества. Рассмотрим диаграмму и предположим, что отображение а сюръективно, а отображение 5 биективно. Тогда существует единственное отображение <р (показанное на диаграмме пунктиром), такое, что пополненная диаграмма остается коммутативной. Доказательство (методом «обхода»). Возьмем произвольный эле- мент & s В. Поскольку отображение а сюръективно, множество а-1 (Ь) не пусто. Тогда для любого аеа-1(6) коммутативность тре- бует, чтобы (б о ₽) (а) = d «(у о d) (а) = у (Ь). Но так как отображение б биективно, найдется единственное £, такое, что с = б-1 (d). Определим | ф: bt—>с = (б~* ° у)(б). I Тогда верхний треугольник является коммутативным, поскольку 0 (а) = (б“‘) о (у ° а) (а) = ((б-1 ° у) о а) (а) = (ф ° а) (а) j в силу коммутативности (и ассоциативности) отображений, вхо-| дящих в композицию. Аналогичным образом нижний треугольним также коммутативен, так как 1 (б о ф) (б) = (б ° (б-1 о у) )(&)=?= у (б). I Никакое другое построение невозможно, так что ф единственно I (6.4) Следствие. Если коммутативная диаграмма (6.3) образована /(-векторными пространствами и /{-гомоморфизмами, то отображен ние ф является /{-гомоморфным, 1
10.6 Теория абстрактной реализации 289 Доказательство. Действительно, отображение <р есть композиция /(-гомоморфизмов у и 6’1: образ уоа->С. Аналогичным образом доказывается и другое следствие. (6.5) Следствие. Если коммутативная диаграмма образована К[г]-модулями и К[г]-гомоморфизмами, то ф также является K[z]- гомоморфизмом. Мы остановились на этих тривиальных результатах по важной причине. Основные свойства реализации зависят лишь от фактов, содержащихся в лемме Зейгера, т. е. от очень простых свойств ото- бражений. Но причина, по которой лемму Зейгера удается исполь- зовать в теории динамических систем, заключается в том, что струк- турные свойства линейности, как оказалось, согласуются с диа- граммой (6.3) не только в смысле /С-векторных пространств, но и в смысле /ффмодулей. Грубо говоря, эффективность алгебраиче- ских методов в применении к теории динамических систем опреде- ляется возможностью наделять дополнительной структурой диа- граммы, подобные (6.3), таким образом, что эта структура отра- жает некоторые важные динамические свойства. Оставаясь на том же элементарном теоретико-множественном уровне, что и в теореме Зейгера, мы можем сформулировать опре- деление, аналогичное (6.1). (6.6) Определение. Пусть А и В — произвольные множества, а f: А-+В — произвольное отображение. Мы будем говорить, что f факторизуется по множеству С тогда и только тогда, когда суще- ствует коммутативная диаграмма С Факторизация называется канонической (или естественной) тогда и только тогда, когда g сюръективно, a h биективно. Первым приложением леммы Зейгера является следующее пред- ложение. (6.7) Предложение. Любые две канонические факторизации f = = Ло§’ = /2о^ отображения f по множествам С и С эквивалентны в следующем смысле: существует единственный изоморфизм мно- жеств а: С С, такой, что uh^h^a. Отсюда следует, что число элементов множества С равно числ^ элементов множества С. 10 Зак. 693
290 10 Алгебраическая теория линейных систем Доказательство. Рассмотрим коммутативную диаграмму Поскольку g сюръективно, а й биективно, согласно лемме Зей-; гера отображение а существует и единственно. А так как g сюръек- тивно, a h биективно, то существует и единственное р, отображаю- щее С в С. В силу коммутативности р°а представляет собой тож- дественное отображение на С, а а°р есть тождественное отобра- жение на С. Таким образом, р = а-1, а а есть изоморфизм мно- жеств. Воспользуемся затем следствиями леммы Зейгера. (6.8) Следствие. Если f есть некоторый К-гомоморфизм (или К[г]-гомоморфизм) ,.то любые две канонические факторизации экви- валентны в смысле существования некоторого К-гомоморфизма (/([z]-гомоморфизма) а. В частности, в этом случае множества С и С являются изоморфными К-векторными пространствами (К[г]- модулями). Теперь мы в состоянии доказать следующую важную теорему. (6.9) Фундаментальная теорема линейной теории реализации. Лю- бые две канонические реализации отображения вход — выход f яв- ляются изоморфными как К[г]-модули и, следовательно, как дина- мические системы. Это означает, что все канонические реализации любого фикси- рованного отображения f существенно одинаковы. Классы экви- валентности канонических реализаций находятся во взаимно одно- значном соответствии с классами эквивалентности отображений вход — выход. Доказательство. Нам, по сути дела, остается лишь перевести опре- деления «канонической реализации» на более абстрактный язык факторизации отображений^ _ Пусть система X = (X, G, Н) есть некоторая каноническая реа- лизация отображения f. Тогда система X полностью достижима, что означает сюръективность отображения G: Q->X. Система X должна быть неполностью наблюдаемой, что означает биективность отображения Н: Х->Г. (Читатель должен убедиться в этом,—Изу- чив определения из § 2.6.) По определению реализации f = Н °G<
10.6 Теория абстрактной реализации 29/ Поэтому любая каноническая реализация отображения f индуци- рует каноническую^ факторизацию отображения f. Пусть X = (X,6,ff) есть другая каноническая реализация. То- гда f = Я ° 5. Но согласно следствию (6.8), X как /CfzJ-модуль яв- ляется изоморфным X. Более того, <7 = и Я = Я<>а. Но с учетом фактов, изложенных в конце § 10.5, отсюда сразу получается, что динамические системы S и S, соответствующие реализациям X и X, также изоморфны в смысле определения (1.6). Приведем и более прозрачные соображения. Заметим, что при матричном представлении отображения а используются элементы из К (но не из /СИ). Это сразу следует из того, что существует изоморфизм Х—>Х относительно структуры /(-модуля (векторного пространства) этих множеств, поскольку К можно рассматривать как подкольцо ЛИ- Но тогда соотношение Q = а ° G гарантирует выполнение условия (1.7b), соотношение Н = Н<>а. гарантирует выполнение условия (1.7с), и, наконец, соотношение а(Гх) = а(z • х) = z • а(х) = z • х = F& = Fa, (х) обеспечивает выполнение условия (1.7а). (6.10) Предложение. Размерность системы S, dim S, является ми- нимальной в классе всех реализаций отображения f тогда и только тогда, когда S есть каноническая реализация f. Доказательство. Пусть S — любая реализация, а 2 — каноническая реализация. Тогда / = Йо£и, следовательно, Й(Л)оR[f],'). Но со- гласно утверждению (6.8), X « R[f], поскольку f может быть кано- нически факторизовано так, чтобы Q R[f] ->• Г (где второе отобра- жение является естественной инъекцией). Поэтому имеем dim dim X Sg dim R [f] = dim X = dim S. Если в средней части этой цепочки отношений справедлив знак равенства, то Й(Х) « R[f], т. е. отображение й биективно. Более того, R[g] X (поскольку в противном случае f ¥= й°g), откуда следует, что g сюръективно. Поэтому минимальность размерности dim X га- рантирует, что соответствующая факторизация является канони- ческой. (6.11) Терминология. Начиная с этого момента мы будем на рав- ных правах называть каноническую реализацию минимальной. (Лишь в конце § 10.11 мы встретимся с ситуацией, где минималь- ная реализация не обязательно совпадает с канонической). Учи- ’) Здесь R [f] есть область значений f. — Прим. ред. 10*
292 10 Алгебраическая теория линейных систем тывая утверждение (6.10), мы определим dim/ как размерность канонической реализации отображения f. Такая терминология полностью оправдывается фундаментальной теоремой (6.9). Будем говорить, что линейное отображение f конечномерно тогда и только тогда, когда f можно факторизовать по некоторому конечномер- ному пространству. (Стандартная терминология для этого случая утверждает, что отображение f имеет конечный ранг. Однако для нас в этой книге термин «конечномерный» кажется более осмыс- ленным.) Другой возможный подход (подход Зейгера). Можно, конечно, доказать теорему (6.9), не обращаясь явно к теореме (4.9) и даже не упоминая о модулях, пользоваться для доказательства аппа- ратом, рассчитанным на обычные структуры /(-векторных про- странств. Такой подход имеет и существенные преимущества, как станет ясным в § 10.11. Определим реализацию как произвольную факторизацию f = = Н °G отображения f, удовлетворяющую следующему условию: из G (<о) = G (©) следует, что G (оасо) = G (стай). Поскольку отображение f стационарно, определение (2.1с) га- рантирует коммутативность следующей диаграммы /(-гомоморфиз- мов (существование F будет доказано позже): Такое определение реализации согласуется со стандартным и имеет то дополнительное преимущество, что оказывается очень близким к интуитивному представлению о состояний системы. Это определение утверждает, что входную последовательность ш мож- но заменить состоянием х = (?(©), обладающим тем свойством, что выходная последовательность у = /(ю) может быть вычислена с его помощью как у = Н (х). Другими словами, пространство со- стояний X впитывает в себя всю информацию о прошлом, которая может оказаться необходимой, и является достаточной для вычис- ления поведения системы в будущем. Кроме того, состояния долж-
10.6. Теория абстрактной реализации 293 (6.13) F: х>->х' = ны определяться «постоянным» образом: если мы договорились, что ш и и определяют одно и то же состояние (т. е. если G((o) = £?(&)), то одинаковые состояния должны определять как сг^со, так и а2ю. Проверим, гарантирует ли это определение реализации суще- ствование тройки (F, G, Н), задающей некоторую динамическую систему 2. Существование Н и G сразу следует из определения факторизации (и из сохранивших свою силу определений Q и Г). Для того же, чтобы определить F, достаточно достроить коммута- тивную диаграмму (16.12) пунктирной стрелкой, так как в этом случае диаграмма становится эквивалентной уравнениям (1.5). До- казать существование F просто. Действительно, G (<та<о), если х = G (со), е Я-1 (<тг (Н (х))), если хф. R[G]. Заметим, что F не единственно, если только & не сюръективно. От- метим еще, что F вполне определено в соответствии с гипотезами относительно <7. Реализация считается канонической тогда и только тогда, когда канонической является факторизация отображения f по X. Отсюда сразу следует, что соотношение (6.13) определяет единственное F. Очевидно и существование канонической реализации: чтобы убе- диться в этом, достаточно положить X = fl/kerf (в смысле струк- туры векторного пространства). Пусть теперь f = H ° G есть другая каноническая реализация f. Согласно утверждению (6.4), диаграмма коммутативна, а отображение а: Х^+Х является единственным изо- морфизмом векторных пространств, согласующимся с коммутатив- ностью этой диаграммы. А это позволяет доказать два последних отношения эквивалентности (1.7). Для доказательства первого из них объединим каждую из коммутативных диаграмм X н
294 10 Алгебраическая теория линейных систем и дважды использованную коммутативную диаграмму в диаграмму Требуется показать, что внешний прямоугольник является ком- мутативным. Используя факт коммутативности исходных диаграмм, мы видим, что Н OQO р = Ц О F = = ог0 Н = = ог° Н °а = = Н о F о а. Но так как П взаимно однозначно, а©/ — Гоа и прямоугольная диаграмма коммутативна. А поскольку а есть некоторый изомор- физм, отсюда следует справедливость условия (1.7а). (6.15) Замечание. Описанная процедура отличается от «стандарт- ного» доказательства, приведенного раньше, только использован- ным математическим аппаратом. Например, здесь существование F доказывается с помощью огг. В доказательстве же с помощью теории модулей отображение ог использовалось для того, чтобы наделить Г «подходящей» структурой модуля, после чего F можно было представить как отображение, индуцированное скалярным умножением в Г (см. ниже). Более того,.существование различных диаграмм, которыми мы пользовались для доказательства нуж- ных соотношений, определяется, по сути дела, существованием
10.6 Теория абстрактной реализации 295 структуры модуля, гарантированного теоремой (4.9). Вопрос о том, какой из двух методов является более плодотворным, следует от- нести к психологии индивидуальной научной работы. В определен- ных ситуациях метод диаграмм может быть весьма эффективным. (См., например, второе доказательство теоремы (11.14.).) (6.16) Замечание. Не существует какой-нибудь важной причины, по которой нужно полагать, что Xf = Q/kerf в качестве фундаментального определения пространства состояний. С тем же успехом можно положить, что S/ = f(Q). Эти два про- странства естественно изоморфны, поскольку [со]/ (подпространство пространства Q) f (со) (элемент пространства Г). Точно так же вместо того, чтобы определять переходы в простран- стве состояний как F: [со]/1—> [z • со]/ = г • [со]/ (операция • в Q), мы можем определять их как F: f (со) I—* f (z • <о) = z • f (о) (операция • в Г). А так как достаточно подробное изложение этой ситуации не было опубликовано ранее, нет ничего удивительного в том, что в лите- ратуре и тот и другой формализм встречается почти с одинаковой частотой. Может показаться, что абстрактный подход, свойственный этому параграфу, имеет мало общего с обычной математикой или кон- кретными численными расчетами. Но такое впечатление безуслов- но ошибочно. В § 10.10 мы найдем важные применения матричных многочленов и структурной теории линейных систем. Затем в § 10.11 мы покажем, что определение (6.1) непосредственно при- водит к построению весьма хитроумного алгоритма численного синтеза реализации. (6.17) Исторические замечания. Первоначальное доказательство приведенных результатов, полученное в 1962 г., было нескладным, и в работе Калмана [1963с] были опубликованы лишь одни резуль- таты. Их доказательство основывалось на непосредственных преоб- разованиях интегралов из теорем (2.24) и (6.6) гл. 2; оно воспроиз- водится в приложении С к настоящей главе. В связи с этим инте- ресны также замечания к теореме (13.19). Вскоре после опубликования работы Калмана [1963с] стало ясно, что использованный аппарат можно было бы уточнить путем при- влечения некоторых понятий теории автоматов, и в особенности
296 10 Алгебраическая теория линейных систем понятия отношения эквивалентности Нерода. Это понятие было подробно рассмотрено в гл. 6 на основе работы Арбиба [1965], за- вершенной примерно в середине 1964 г. Полезное замечание можно найти также в работе Калмана [1963с] сразу же после теоремы 7. Подход в рамках теории модулей разрабатывался весной и летом 1965 г., и первые результаты были опубликованы в статье Кал- мана [1965Ь]. После 1963 г. под давлением общественного научного мнения стало принятым называть «естественные» реализации «минималь- ными». Дело в том, что пространство состояний естественной реали- зации имеет минимальную размерность, и это полностью характе- ризует естественную реализацию (Юла [1966], стр. 534, сразу после уравнения (45)). Использовалось также и название «неприводи- мая», поскольку другие реализации, кроме естественных, всегда можно было «привести», отбросив излишние состояния (Калман [1965а]). В настоящее время стало ясным, что ни одно из этих на- званий не может служить полноценной заменой прилагательным «естественная» или «каноническая». Понятие «минимальной» раз- мерности имеет смысл лишь в рамках теории векторных про- странств, но в действительности круг приложений нашей теории существенно шире. «Приведение» реализаций — это интересная за- дача, но ее теория глубже, чем совокупность вопросов узкоцелевого характера, связанных со свойствами или построением естествен- ных реализаций. Принятый здесь метод изложения теории реализации (он бу- дет использован также в § 10.10, 10.11 и 10.13) представляет со- бой один из основных результатов (и возможно, что это только на- чало) попытки найти взаимосвязь между теорией линейных систем и теорией автоматов средствами аппарата современной алгебры. Из общих соображений ясно, что картину, представленную здесь, вряд ли можно существенно улучшить или упростить. Если же читатель заинтересуется дополнительными мотивиров- ками, ходом эволюции основных идей или заметками для после- дующих исследований и т. п., для этого ему нужно обратиться к оригинальным статьям. 10.7 Циклические модули Выше мы в основном старались выявить взаимосвязь между структурой модуля и динамическими свойствами системы. При этом нашей первой целью было установление эквивалентности исход- ных определений. Теперь же мы воспользуемся математическими свойствами модулей. Предположим на время, что R есть произвольное (необяза- тельно коммутативное) кольцо, а X — произвольный /?-модуль. Пусть У — произвольное подмножество (необязательно подмодуль)
10.7 Циклические модули 297 модуля А. Напомним, что аннулятором AY множества У называется подмножество (7.1)- Лг = {г: г е /? и г у = 0 при всех у & У) кольца /?. Из определения следует, что AY— (левый) идеал. (7.2) Определение. Если для каждого х из X найдется такое гх=£0, что гх-х = 0, то X называют модулем с кручением. (Это название возникло в алгебраической топологии и в нынешнем контексте не имеет интуитивной интерпретации.) Нас интересует в первую очередь кольцо = K[z], и в этом случае R есть область главных идеалов; можно ввести следующее важное определение. (7.3) Определение. Пусть X — произвольный модуль с кручением над ХМ, и пусть Ах = К[г]фх. Тогда, если фЛ ¥= 0, то назы- вается минимальным (или аннулирующим) многочленом мо- дуля X ’). В § 10.8 мы увидим, что это определение в точности согласует- ся с определением минимального матричного многочлена. (Это понятие мы впервые использовали в рамках теории систем в §2.3.) (7.4) Предложение. Пусть X есть конечный К[г]-модулъ, порожден- ный пг образующими, и пусть фх =£ 0. Тогда dimX (как размер- ность векторного пространства) меньше или равна /ra-degtfx. Доказательство. Каждый элемент х из X представляет собой сумму членов irtvgfe (& = 1, m)- Каждое можно привести по мо- дулю фА-, не нарушая при этом суммы. Поэтому х е X определяется m многочленами степени, меньшей degi|>x, что и требовалось до- казать. Позже мы выведем точную формулу для dimX. Однако пока нас интересуют только те модули, свойства которых полностью определяются их минимальными многочленами. Напомним, что 7?-модуль X называется циклическим2) тогда и только тогда, когда он порождается одним элементом g. Структура циклических модулей очень проста. (7.5) Предложение. Пусть X есть циклический R-модуль с обра- зующей g над произвольным кольцом R. Тогда модуль X изомор- фен факторкольцу R/Ag. ’) Пусть Г{ — минимальный многочлен, обращающийся в нуль на i-й обра- зующей X. Тогда если X не только модуль с кручением, но еще и конечен, то произведение всех rt конечно, аннулирует X и, следовательно, 2) Это название и устарело, и неудачно, но установилось в литературе. Было бы лучше пользоваться буквальным переводом термина Бурбаки, согласно которому циклические модули называются «моногенными».
298 10 Алгебраическая теория линейных систем Доказательство. Рассмотрим /^-гомоморфизм р: /?-> X: г >—» г -g (здесь R рассматривается как /^-модуль над собой). Свойство цик- личности означает, что отображение р сюръективно. Более того, ker р = Ag. Отсюда с помощью теоремы о гомоморфизмах сразу получаем нужное утверждение. Этот простой результат имеет очень интересные и принципиаль- но важные следствия для теории динамических систем. Пусть tn = 1. Тогда Q = есть свободный циклический мо- дуль, порождаемый 1 (многочленом, тождественно равным 1). То- гда для любого отображения вход — выход f имеем, что K[z]-mo- дуль Xf = й/ker f также является циклическим и порождается многочленом g = [1]/. Но согласно утверждению (7.5), аннулятор Ag = ker f = К[г]ф/ состоит из всех таких многочленов ©, что f (со) = 0. При этом ф/ ¥= 0 есть многочлен наименьшей степени из этого множества. В результате получаем следующую последова- тельность все более явных эквивалентных описаний для Xf. XrK[z]№h = { {со + j«|)f: я е /([г]}: со е Кт [г]}. Каждый класс эквивалентности {со 4- лф/} располагает единствен- ным элементом со наименьшей степени, равным остатку от деления со на ф/. Совершенно ясно, что deg б < deg ф/. Подведем итог этим соображениям. (7.6) Теорема о представлении. Если X есть некоторый цикличе- ский К[г]-модуль с аннулирующим многочленом ф, то X ~ ~ ^degi|>= {все многочлены n^K[Z], для которых deg л < deg ф}. В частности, это всегда справедливо, если tn = 1 и X = Xf. (7.7) Обозначение. С целью упрощения в некоторых формулах мы вынуждены будем иногда писать со mod ф вместо б, хотя такое обозначение, строго говоря, можно использовать лишь для класса по модулю ф, а не для особого элемента этого класса. (7.8) Замечание. Динамическое поведение циклического модуля Xf описывается, по сути дела, преобразованием: «входные воздей- ствия -» состояния», которое можно представить в виде со I—> [co]f = со mod ф^ = б. С интуитивной точки зрения Xf можно рассматривать как устрой- ство для «распознавания образов». Действительно, входное воз- действие со, поданное на Xf, запоминается в виде остатка б от деления на ф/. А так как ф/ может быть весьма сложным, запо- минаемый образ© может не иметь никакого очевидного сходства
10.7 Циклические модули 299 с входным образом и, но с алгебраической точки зрения операция, осуществляемая системой, предельно проста. Некоторые интересные частные случаи минимальных многочле- нов приведены в следующих пяти примерах. (7.9) Пример. tyf(z)=z. Тогда [со]/ = & = ©о, т. е. равно послед- нему из принятых значений входного воздействия. У такой си- стемы «память» распространяется только на одну единицу вре- мени. (7.10) Пример. фДг)=гй. Теперь [со]/ = © = ©0 + ... + ©ft-izft-1. Эта система «помнит» k последних значений входного воздействия. (7.11) Пример. ф/(г)=г— 1. Это означает, что z = 1 modф/ и, следовательно, [©]f = © = ©0 + ... + ©r (г = deg ©). Такая система является интегратором «или системой усреднения». (7.12) Пример. 4>/(z) = zft—1. Теперь zft/© = ©modify при любом />0. Это означает, что система чувствительна к периодическим воздействиям с периодом k. Такие воздействия подчеркиваются системой, в то время как непериодические выравниваются (усред- няются). (Упражнение: напишите явную формулу для [©]/.) (7.13) Пример. ф/(г) = гЛ— а. Теперь zw© = аг© mod ф/. Это озна- чает, что система по-прежнему чувствительна к периодическим воздействиям с периодом k, но прошлые значения входных воздей- ствий могут усиливаться или ослабляться системой в зависимости от того, больше единицы величина а или меньше. Рассмотрим теперь несколько типичных задач, которые можно сформулировать и красиво решить с помощью развитого аппа- рата. В каждом случае мы будем предполагать, что X есть цикли- ческий /([^-модуль с образующей g и аннулирующим многочле- ном ф. В силу теоремы (7.6) мы можем тогда написать, что х = £ • g = t • g, если | = | mod ф. (7.14) Задача. Вычислить последовательность ©, преобразующую х в 0. Другими словами, требуется найти решение © уравнения х о © = о. В обозначениях теории модулей (5.4) это означает, что х о © = (z1+dg + <в) • g = 0, где x = ^‘g, a d есть произвольное целое, не меньшее deg©1)- ’) Возможность, что d>deg©, соответствует ситуации, в которой первые «— deg© значений входного воздействия полагаются равными нулю. Нам при- дется рассматривать этот случай, и у нас нет другой возможности описать его в рамках теории модулей.
300 10 Алгебраическая теория линейных систем Поскольку 1 • g ф 0 (в противном случае все тривиально), ясно, что и должно удовлетворять соотношению (7.15) z1+dg + (o = 0modi|), deg со. Может показаться, что это уравнение трудно решить, поскольку deg со входит в него нелинейным образом (в показатель степени). Но так как уравнение должно выполняться только по модулю ф, мы можем выбрать deg со равным г = d произвольным образом при условии, что г> п—1. Тогда решение имеет следующий вид- ео = — zI+rg + VTff > где v е К[г] и выбрано так, чтобы deg со действительно совпало бы с г. При этом выясняется, что неравенство d deg со вообще несущественно. Но если нам нужно найти решение уравнения (7.15), такое, чтобы deg со было минимальным, то ситуация оказывается много сложнее. (Она аналогична простейшей задаче на оптимальное быстродействие системы с дискретным временем.) Нам придется полагать, что deg со = 1 тогда и только тогда, когда deg z2g = 1, deg со = 2 тогда и только тогда, когда degz3£ = 2 и т. д. (Упражнение: доведите задачу до конца для различных ин- тересных значений ф.) (7.16) Задача. Найти все периодические движения, проходящие через х и обладающие периодом q. Мы будем отыскивать все а» степени не большей q — 1 и такие, что х о с» = х. В обозначениях теории модулей, где х = это условие эквива- лентно уравнению 4-со = g mod ф, откуда следует, что (7.17) со = (1 —z^l mod-ф. Если с/deg-ф, то получить решение, как и раньше, несложно. Если же q < п и g фиксировано, то решение может не существо- вать, если только не выполняется соотношение z« = 1 mod ф. В по- следнем случае все состояния системы в свободном движении яв- ляются периодическими с периодом q. Интересна также и обратная задача. (7.18) Задача. Найти все состояния системы, становящиеся перио- дическими под воздействием входной последовательности со. Эта
10.7 Циклические модули 301 задача эквивалентна решению уравнения (7.17) при g, определен- ном заданным входным воздействием со. Для этого потребуем, что- бы (z?—1) =# 0 был единицей (обратимым элементом) в кольце X[z]/K[zbl>. Напомним, что в этом кольце элемент у является еди- ницей тогда и только тогда, когда он не является делителем нуля, a v есть делитель нуля, если у|ф (см. пример (А. 13)). Если w есть единица, a — 1 не есть единица, то искомое £ не существует. В противном случае ситуация несколько сложнее. Окончательное решение задачи оставляем читателю в качестве упражнения. (7.19) Задача. Построить автомат, распознающий входное воз- действие ф и не реагирующий на входное воздействие 0. Это задача распознавания (точнее классификации) образов. На языке теории модулей это означает, что мы ищем такое ф, что ф ф ф, но ф|0. Решение задачи возможно тогда и толькЬ тогда, когда 0ф ф. (7.20) Задача. Найти автомат, распознающий ф как состояние Ф • g. Здесь ф должно удовлетворять уравнению ф = ф mod ф, что эквивалентно уравнению Ф1(ф~ф). бе§ф>деёф. Его решение безусловно существует, но в общем случае не будет единственным. (7.21) Замечание. Имеется тесная связь между свойством циклич- ности и «каноническими представлениями» (5.8) из гл. 2. Рассмот- рим линейную динамическую систему 2 и предположим, что Хх есть циклический /([г]-модуль с образующим gs и аннулятором фх. Тогда X = ^°deg*2. Поэтому для Х%, как векторного про- странства, множество te, 2 • g..zn~l • g}, где п = deg ф2, служит базисом. А относительно этого базиса оператор xt—>z*x может быть представлен матрицей “0 0 ... 0 — ая ~ (7.22) F = 1 0 ... 0 — ап_] • • • ♦ _0 0 ... 1 — в которой элементами последнего столбца служат коэффициенты многочлена ф, взятые с обратным знаком. Это получается сразу, если записать ф в виде z" =^—cqz'1-1 — ... — а„тобф.
302 10 Алгебраическая теория линейных систем - Заметим, что операция сравнения по модулю заменяет собой в тео- рии модулей теорему Кэли — Гамильтона. (Каноническое представ- ление (5.8) из гл. 2 выводится аналогичным образом.) Тесно связан со всем вышеизложенным следующий классиче- ский критерий. (7.23) Критерий. Характеристический многочлен %F квадратной матрицы F над К равен ее минимальному многочлену тогда и только тогда, когда в Кп найдется такой базис, что F имеет вид (7.22), т. е. тогда и только тогда, когда F подобна матрице (7.22). Доказательство. Достаточность. Пусть F есть матрица, равная или подобная матрице (7.22). Многочлен г|), построенный по последнему столбцу матрицы (7.22), бесспорно есть многочлен наименьшей степени, такой, что гр • х == 0 при всех х (т. е., что эквивалентно, такой, что xp(F) = O). Поэтому гр = гр^, т. е. равно минимальному многочлену матрицы F. (См. также следствие (3.6) из гл. 2.) Пря- мое же вычисление ywF, основанное на (7.22), показывает, что ф (z) = det (г/— F) == (з), т. е. равно характеристическому многочлену F (напомним, что не зависит от выбора базиса, по которому строится матрица F). Необходимость. Вместо фиксированной матрицы F можно с тем же успехом рассматривать /ффмодуль, индуцированный матри- цей F (см. предложение 5.1). Предположим, что базиса требуемого типа не существует. Тогда каждое множество {х, z-x, .. ., zn-1-x} является линейно зависимым, т. е. каждое х аннулируется мно- гочленами из Ах = K[z]nx, где degnx<«. Ясно, что XF порождает- ся некоторым .конечным множеством {gi, ..., gi}, где 1-^.п. Мы утверждаем, что аннулятор XfAXp = К [z] фр множества XF поро- ждается многочленом фр, который является наименьшим общим кратным многочленов {ngl, ..., ngz). Это непосредственно следует из того, что в рассматриваемой ситуации все аннуляторы являются главными идеалами. Действительно, поскольку фР аннулирует git имеем фр е Agi и, следовательно, л^ | ф? при любых i — 1..I. С другой стороны, каждое общее кратное многочленов[лг1, .... ngJ аннулирует все элементы множества XF. Рассмотрим теперь вектор g\ = g\, Я2 = §1 + а2§2. •• •> & = gi+a2g2+ ••• +a-igi, где а* е К выбираются так, чтобы каждый вектор был ненуле- вым. (Очевидно, что это всегда возможно.) По индукции легко доказать, что л^ есть наименьший общий делитель многочленов [ng,..., Поэтому = и по предположению degx|)F>
10.8 Структура конечных /<[г]-модулей 303 л = degXF. Полученное противоречие доказывает необходимость условия теоремы. (7 24) Упражнение. Найти матрицу, не удовлетворяющую Крите- ри'ю (7.23). (7.25) Замечание. В дальнейшем мы станем называть матрицу F циклической тогда и только тогда, когда F удовлетворяет крите- рию (7.23). Таким образом, матрица F циклическая тогда и толь- ко тогда, когда К[з]-модуль XF, индуцированный матрицей F с по- мощью соотношения z-x = Fx (см. предложение (5.1)), является циклическим относительно некоторого g е Кп. (7.26) Замечание. Согласно теореме о представлении (7.6) состоя- ние динамической системы можно описывать на том же языке, что и входные воздействия, т. е. на языке многочленов. В этом смысле настоящий подход к линейной теории систем устраняет кажу- щуюся несогласованность между частотными и временными мето- дами анализа систем. (7.27) Замечание. Как это ни обременительно, но приходится при- знать, что пространство состояний Xf имеет более сложную струк- туру, чем утверждается в теореме (7.6). Пространство Xf является не только абелевой группой, но по крайней мере при m — 1 оно есть к тому же и кольцо с умножением (7.28) [<o]f • [©']f = > где coco' — обычное произведение в /<[z]. Произведение (7.28) вполне определено, так как со •[«']/ == [сосо,1/ есть вполне определенное ска- лярное произведение на Xf. В настоящее время неизвестно содер- жательной интерпретации операции (7.28) для теории систем, хотя аналогичное явление отмечалось и в теории автоматов (Дэй, Уоллес [1967]). В следующем параграфе мы убедимся, что полученные резуль- таты можно обобщить на случай произвольных конечных модулей с кручением. 10.8 Структура конечных К[г]-модулей Центральный результат теории модулей над областью главных идеалов состоит в том, что каждый такой модуль представляет собой простую комбинацию, а именно сумму циклических модулей. Пользуясь интуитивно более ясным языком, мы можем сказать, что линейные системы строятся, в виде суммы простейших строи- тельных блоков, каждый из которых представляет собой цикличе- скую систему. При обычном подходе к теории линейных систем всегда под- черкивается важность скалярных линейных систем (имеющих
304 10 Алгебраическая теория линейных систем пг = 1 и р=1), которые являются неизбежно циклическими. Но в этой теории отсутствовал систематический подход к изучению наиболее общего случая. Некоторые попытки в этом направлении были сделаны в начале 40-х годов, но до того, как появилась из- лагаемая здесь теория, основанная на теории модулей, никакой исчерпывающей теории линейных систем не было. Другими сло- вами, линейные системы во всей их сложности яснее всего описы- ваются в рамках теории модулей, И обратно, понимание этой сложности эквивалентно неявному пониманию аппарата теории модулей. Приведем теперь строгую формулировку одной основной тео- ремы. (8.1) Основная структурная теорема для конечных модулей над областью главных идеалов /?. Пусть X — такой R-модуль. Тогда X изоморфен прямой сумме циклических модулей: М/Ш ... ф/?Ж®/?® ... ©/?, где число слагаемых прямой суммы не превышает числа образую- щих модуля Х\ здесь tyt^R являются единственными циклически- ми модулями (с точностью до сравнения по модулю единицы мо- дуля R) и удовлетворяют условию q— 1. - (8.2) Определение. Модули фг- s R называются инвариантами мо- дуля X. Очень важные с методической точки зрения доказательства этого основного результата читатель найдет в работах Кэртиса и Рейнера [1962, § 16], Бурбаки [Алгебра, гл. 7], Ленга [1965, гл. XV, § 2], Джекобсона [1953, гл. 3]. Все эти доказательства со- вершенно различны по стилю, и безусловно полезно познакомиться с каждым из них. Сама же теорема представляет собой дословный перевод на язык теории модулей классической теоремы об инва- риантных многочленах (см. (А. 17)). В § 10.10 мы применим алго- ритм, используемый для доказательства этой теоремы, с целью вычислить инварианты модуля X и изоморфизм из теоремы (8.1). Эти вычисления можно рассматривать как косвенное доказатель- ство теоремы (8.1). С чисто математической точки зрения теорема (8.1) может по- казаться скучным упражнением в абстракции, поскольку все до- казательство (особенно в изложении Кэртиса и Рейнера [1962]) критическим образом зависит от алгоритма определения инвариан- тов модуля X. Однако для нас эта формулировка теоремы с при- влечением теории модулей чрезвычайно важна, а алгоритм пред- ставляет интерес лишь как одно из вычислительных средств. По- этому математическая тенденция добиваться большей общности
10.8 Структура конечных К[г]-модулей 305 (переход от векторных пространств к модулям) может черпать вдохновение и в приложениях к решению конкретных задач теории динамических систем. (8.3) Интерпретация. Структурная теорема в том общем виде, как она сформулирована выше, охватывает и случай, когда X пред- ставляет собой «смесь» циклических модулей с кручением (R/Rtyi) и свободных циклических модулей (R). Если X—модуль с кручением, то слагаемые последнего типа отсутствуют и, согласно условию делимости, аннулирующий многочлен ф модуля X совпа- дает с фь Ясно, что X циклический тогда и только тогда, когда Я'= 1. (8.4) Замечание. Прилагательное «конечный» в формулировке теоремы соответствует ситуации, в которой у системы «конечное число входов». Это ограничение не сужает существенным образом область применимости теоремы ( 8.1). Но предположение, согласно которому R представляет собой область главных идеалов, не слиш- ком желательно, поскольку оно исключает, например, возможность R = Z[z] (см. упражнение (А.16)). Хотя более общие структурные теоремы пока еще не известны в математической литературе, имеются явные указания на то, что такие теоремы можно будет вывести с помощью соображений теории систем. Отметим одно непосредственное и исключительно полезное следствие теоремы (8.1), представляющее собой усиление резуль- тата (7.4). (8.5) Следствие. Пусть X — модуль с кручением над K[z] с анну- лирующим многочленом ф. Тогда dim X (как размерность векторного пространства) = я = 2 deg фг • бе§ф. / = 1 Доказательство получается сразу из теоремы (7.6). Имеется еще и вторая структурная теорема, обобщающая ме- тод разложения на элементарные дроби в теории преобразований Лапласа. Введем для каждого модуля X над коммутативным кольцом R обозначение Хг = {х: х^Х, гЧ'Х — 0 для фиксированного reR и некоторого ё > 0}. Легко убедиться (с помощью коммутативности), что Хт есть Я-модуль. Например, если X ~ R/Rrs, то X = Хг- (8.6) Структурная теорема для конечных модулей с кручением над областью главных идеалов R. Предположим, что X — такой
306 10 Алгебраическая теория линейных систем R-модуль с аннулирующим многочленом ф. Пусть, далее, ф = ер"1 ... p"s (в = единица е /?) есть представление ф простыми делителями р,. Тогда X — прямая сумма модулей с кручением ХР(. Если R = К[г], то простыми элементами модуля R являются неприводимые многочлены в K[z]. В частности, если К = R, то рг- являются многочленами первой или второй степени в зависимости от того, являются ли корни р{ вещественными или комплексными. Если же К. = С, то каждый многочлен р, есть многочлен первой степени. Доказательство теоремы (8.6) очевидно. Отсылаем читателя к книгам Бурбаки [Алгебра, гл. 7, § 2, п. 1] и Ленга [1965, гл. XV, §2]. Теоремы (8.1) и (8.6)—это по существу все, что нужно знать для того, чтобы свести изучение линейных систем общего вида к изучению простых линейных систем. Например, применяя сна- чала теорему (8.6), а затем теорему (8.1), мы получим абстракт- ный эквивалент процедуры разложения на простейшие дроби с кратными полюсами; см. также § 88 монографии Ван дер Вардена [1931]. Инварианты К[з]-модуля можно использовать для определения соответствующих инвариантов матриц над К. (Интересно отметить, что сначала была решена обратная задача!) Дадим еще одно обобщение замечания (7.25). (8.7) Определение. Пусть А: V—* V есть произвольный эндомор- физм Л-векторного пространства V (или его матричного представ- ления), и путь VA есть /С[г]-модуль, индуцируемый в V эндомор- физмом А (см. предложение (5.1)). Инвариантами эндоморфизма А называются инварианты модуля VA- Как известно (Ван дер Варден [1931], т. 2), инварианты эндо- морфизма А определяют жорданову каноническую форму эндо- морфизма А. Основная масса результатов теории линейных систем может быть получена с помощью приведения матриц к их жор- дановым каноническим формам. Теория модулей позволяет вос- пользоваться инвариантами непосредственно, а не через жор- дановы канонические формы. Само название «инварианты» (не зависящие от базиса) становится яснее, если фг определять в рам- ках теории модулей. 10.9 Передаточные функции Один из основных результатов традиционной теории линейных систем состоит в введении понятия передаточной функции, связан- ной с отображением вход — выход f (по сути дела, это «пре-
10.9 Передаточные функции 307 образование» /(1)). Обычный подход к определению передаточ- 1 них функций требует выяснения факта сходимости. В результате I этого иногда создается ложное представление о том, что частот- 1 ними методами (с помощью передаточных функций) можно изу- I чать лишь устойчивые системы. 1 Однако мы увидим, что существование передаточных функций I в конечномерном случае — это чисто алгебраический факт, не 'I имеющий ничего общего с вопросами сходимости. Основным здесь 1 является существование такой структуры /ффмодуля в Г, для ко- I торой отображение вход — выход f служит гомоморфизмом моду- лей (см. § 10.3). Точнее говоря, поскольку f есть некоторый /<[2]- J гомоморфизм, справедливо, что | т |''| f(®)= 2 coj(eft). Ji; *=1 и Последнее соотношение показывает, что / полностью определяется |) заданием элементов Si = f(ei) из Г. Каждое е, представляет собой "I некоторый формальный степенной ряд. Идея «передаточной функ- ' ции» эквивалентна предложению рассматривать каждый такой сте- пенной ряд как формальное разложение отношения векторного и скалярного многочленов. |1( Основное допущение, которым мы воспользуемся, состоит в том, ЧТО (9.1) Xf есть модуль с кручением, с аннулирующим многочленом j Из сказанного выше следует, что для f существует факториза- J ция, описываемая коммутативной диаграммой К[г]-гомоморфиз- ' мов: I i) ’I II Рассмотрим образующие eh (k = I, свободного K[z]-mo- дуля Q. Согласно диаграмме, имеем НФг efe) = (Hf ° GfH^f • ek) = /ff(i|jf • Gf (eA)) = 0 (факторизация отображения /) = (G есть-К[г]-гомоморфизм) = (ф^ аннулирует Xf). Но с другой стороны, f (Фг • ek) = % • f (ek) (f есть X [zj-гомоморфизм).
308 10 Алгебраическая теория линейных систем Поэтому = 0 в качестве элемента K[z]-модуля Г. С учетом определения скалярного умножения в Г можно заключить тогда, что фу/(ей) (обычное произведение формального степенного ряда и многочлена) принадлежит пространству №[з]. Мы запишем это в виде (фЖ))(г) = 0*(г), б.еГМ. Требуемый результат получается сразу из следующей простой леммы. (9.2) Лемма. Пусть у е Гс К^Цг-1]], л е K[z), d е №[z], а degd<degn. Тогда тождество лу = 6 эквивалентно соотношению у = 6/л, где / означает формальное деление на многочлен, в результате которого получается степенной ряд по Доказательство. Выпишите подробно оба тождества и проверьте их эквивалентность почленно. Согласно приведенной лемме, вместо f(ek) = es можно рассмат- ривать отношение wk = 0л/ф/. Заметим, что, поскольку az»k е Г, не- обходимо иметь deg 0* < deg ф/, т. е. вектор wk будет описывать правильную рациональную дробь (обращающуюся в нуль при z->oo). Кроме того-, если ф — наименьший общий знаменатель всех Wk, то ф/ = ф. Справедливо и обратное утверждение: любое конечное семей- ство правильных рациональных дробей k = 1, .... tn, ин- дуцирует /<[г]-гомоморфизм (9.3) f: Q—>Г: ek^wk. Подводя итог, мы получим следующую важную теорему. (9.4) Теорема о представлении. Пусть f: есть некоторый К[г]-гомоморфизм с аннулирующим многочленом ф/. Тогда f одно- значно определяется своей передаточной матрицей1) W/ размера рХ tn, столбцами которой служат р-мерные векторы правильных рациональных дробей wk = f(ek), k— 1, ..., tn, независимой пе- ременной z. Обратно, любая матрица W правильных дробно-ра- циональных элементов индуцирует по правилу (9.3) единственный К[г]-гомоморфизм fw, а наименьший общий знаменатель фтг эле- Принятый в классической теории термин «передаточная функция» (иногда заменяемый на «системную функцию») неудачен, но слишком укоренился в ли- тературе.
10.9 Передаточные функции 309 ментов матрицы W является аннулирующим многочленом ф/ для К[г]-модуля Xf, индуцированного гомоморфизмом fw. Короче говоря, объекты f и W эквивалентны'). Теперь мы имеем возможность вычислять f(a>) по следующим правилам: 1. Умножим Wf на со (обычное умножение дробно-рациональной матрицы на вектор многочленов). 2. Последовательным делением разложим каждый элемент в ряд по возрастающим степеням z-1. 3. Отбросим все члены с неположительными степенями Z"1. В результате получается f(co). Члены, отбрасываемые на 3-м этапе, соответствуют реакции системы в моменты времени, предшествующие t = 0, и в момент t = 0. Точнее говоря, эти члены описываются слагаемым Д из урав- нения (9.5) Wf® = 0усо/фу = А + ©^со/ф/, где 0/= (/(^1)ф/, f(em)tyf) есть многочленная матрица (раз- мера рХп), а ~ есть операция выбора элемента наименьшей степени в классе эквивалентности многочленов по модулю ф/. (Вспомните теорему (7.6).) Приведенное уравнение показывает, что f (со) зависит лишь от 0у(о mod фу. В связи с этим первое из при- веденных выше правил мы можем упростить, заменив его сле- дующим. Г. Умножим Wf = 0//ф/ на со, вычисляя произведение в кольце ЛЙ/ЛИфу и всегда используя лишь элементы наименьшей степени из каждого класса эквивалентности. После этой замены правило 2 остается таким же, как и раньше, а в правиле 3 уже нет никакой необходимости. (9.6) Вывод. Понятия «передаточная функция» и «сравнение по модулю ^»-тесно связаны между собой. (9.7) Обозначение. По аналогии с обозначениями, принятыми для Г, договоримся, что Wen — обычное умножение степенных рядов на многочлены, а 'W • © — умножение, описанное выше, результат которого рас- сматривается как степенной ряд, у которого отброшены все члены с неположительными степенями z-1. Правила вычисления, описанные выше, эквивалентны возни- кающим в обычной теории z-преобразований. Поэтому все обычные !) Каждый раз, когда мы говорим о матрицах передаточных функций, мы всегда будем предполагать (если этот вопрос вообще возникает), что элемен- тами матрицы W являются отношения взаимно простых многочленов.
310 10 Алгебраическая теория линейных систем результаты (например, из книги Фримэна [1961]) остаются справед- ливыми и для нашей теории. Приведем теперь одну интересную задачу, решение которой послужит иллюстрацией описанных вы- числений. (9.8) Задача. Для заданной входной последовательности (o(degto = = —/-1) из Q найти начальное состояние х из Xf (где Xf — модуль с кручением с аннулятором фу) в момент t = t-i, такое, что реак- ция системы окажется тождественно равной нулю при всех Поскольку Xf является полностью достижимой, любое хе Ху мож- но представить в виде х — [g]y, где g е Q. Поэтому условия задачи можно записать в виде уравнения 2-deg . g = о или словами: выражение z-^e^IFy® должно быть выходной после- довательностью системы, т. е. это выражение должно принад- лежать f(Q). Более ясное эквивалентное условие выглядит следую- щим образом: (9.9) 0fco = -zdege0fg. Для упрощения задачи- рассмотрим только скалярный вариант этого уравнения, т. е. предположим, что пг = р = I и что, следо- вательно, можно записать соотношение 0у = 0у е Х[з]. (Решение общей задачи потребует привлечения теории, развитой в послед- нем параграфе, и мы оставляем его читателю в качестве нетри- виального упражнения.) Очевидное необходимое условие суще- ствования g состоит в том, что zdeg“|0yco. В этом случае о = = 0/(o/zdegM е K[z] и, естественно, deg о < deg фу. Требуется ре- шить уравнение а = — 0fg mod фу. Но 0у и фу взаимно просты, так как в противном случае фу не мо- жет быть минимальным многочленом модуля Ху. Поэтому (см. (А. 13)) 0у является единицей кольца Х[г]/Л'[г]фу. Отсюда следует, что 0f1 существует в этом кольце, и его представлением является многочлен степени, меньшей чем deg фу. Итак, имеем g = 0^‘а mod ф? = 0^'а + афр aeX[z], и, следовательно, 0f| = 0f (0f~‘a + аф?) = а + Рфг откуда находим, что 0Д = а. Таким образом, мы доказали, что поставленная задача имеет решение тогда и только тогда, когда 0/со содержит zdesto в качестве множителя. Это справедливо, в ча- стности, каждый раз, когда со (z) = xz«, х е > 0.
10.10 Применения алгоритма вычисления матричных инвариантов 311 10.10 Применения алгоритма вычисления матричных инвариантов Структурная теорема (8.1) для конечных модулей над обла- стью главных идеалов впервые появилась в математике в форме так называмой «теоремы об инвариантах матричных многочленов» (см. (А. 17)). Для нас важность этого результата заключается в том, что его доказательство дает алгоритм вычисления инвариан- тов, а знание инвариантов позволит решить задачу определения структуры линейной системы. Теперь мы попробуем связать воедино абстрактную теорию из § 10.8 и алгоритм вычисления матричных инвариантов. При этом нас будут больше всего интересовать вопросы, связанные с теорией реализации. Читателю следует сравнить материал этого параграфа с абстрактными доказательствами из § 10.6, а также с алгоритмом линейной алгебры, описанным в следующем параграфе и не тре- бующим определения инвариантов. Начнем с одного элементарного соображения. (10.1) Замечание. Напомним, что ф = флг есть наименьший общий знаменатель правильных дробно-рациональных элементов матри- цы W (теорема (9.4)). Это означает, что все элементы матрицы yW — многочлены. Но в соответствии с теоремой об инвариантах (теорема (А. 17)) имеем (10.2) фТГ = АЛВ, где det А и det В являются единицами в K[z], а матрица Л диаго- нальна и единственна с точностью до единиц в А[х]. Тем более справедливо и следующее представление: (10.3) i|>F = PLQmodi|5, в котором detP и det Q являются единицами в A[z]/A[z№ а мат- рица L диагональна и единственна с точностью до единиц в /<[г]/^з]ф. Действительно, представление (10.3) тривиальным об- разом получается из (10.2). Для этого достаточно заменить каж- дый многочлен л в уравнении (10.2) его каноническим представи- телем наименьшей степени л из класса эквивалентности л по мо- дулю фту- Итак, запишем (10.4) фЦ7 = ф^ = АЛВ + фУ = РВР + фУ, где V — подходящая матрица многочленов. В последующем нам пригодится более слабое из представлений, а именно (10.3). С его помощью мы получим определенную свободу вычислений. Напри- мер, алгоритм вычисления инвариантов можно будет использовать
312 10 Алгебраическая теория линейных систем над кольцом А[г]/А[г]ф, а не над кольцом А'[г]. (Упражнение. Вы- ясните, какие изменения в программе расчетов для этого потре- буются и какую экономию машинного времени это даст.) С помощью представления (10.3) можно быстро найти все ин- варианты модуля Xfw, соответствующего матрице W. Различные этапы этой процедуры представляют, по сути дела, перегруппи- ровку членов в правой части уравнения (10.3). При этом основная идея состоит в том, чтобы вычислить класс эквивалентности [01, 4F отображения вход —выход fw- ©►—> W • со, соответствующего мат- рице W. (10.5) Вычислительный алгоритм. 1. Для того чтобы входное воздействие со е Km[z] на систему Xfw переводило ее в состояние 0, необходимо и достаточно, чтобы либо <7(со) = 0, либо W • со = 0, либо Kp[z], либо (ф№)и = = 0 mod ф. 2. Согласно представлению (10.2), (фК?)® = 0 mod ф тогда и только тогда, когда AQco = 0 mod ф, поскольку det Р является единицей в K[z] и, следовательно, единицей в К[2]/К[г]ф. 3. Заменим переменные, положив со >—* & = Qco. Это отображе- ние взаимно однозначно из-за того, что det Q есть единица в K[z]/K[z]t|>. Точнее говоря, со ь-* Qco есть изоморфизм К[х]-модуля. 4. Условие £(«0 = 0 эквивалентно теперь условию А6 = = 0гпобф. Представим А в виде diag{Xb ..., Хд, 0, ..., 0}. Со- гласно теореме об инвариантах, Х4 однозначно определяются видом W с точностью до единиц в K[z], и X, |Xi+i, i = 1, ..., q— 1. Кроме того, пусть = (Хь ф) (наибольшее общее кратное), а ф,-= ф/р,. Тогда Хг/рг является единицей в Л'[г]/А[г]ф для всех i = 1,..., q—1. Поэтому приходится рассматривать три случая: (i) Xi ¥= 0, i = 1 q\ (ii) Хг = 0, i == <7 + 1....r = гапкф№; (iii) Xf=Xi = = 0, i = r + 1, ..., min(m,p). В результате получим, что Лео = = 0 mod ф тогда и только тогда, когда f Отобф/ i— 1, ..., q\ произвольно, i — q+l, ..., min(m, р). 5. Каждое ф4 удовлетворяет условию делимости противополож- ного относительно условия для Xi вида. Поэтому ф{+>|ф{, i=l, ... ..., q—1. Более того, фч = ф, поскольку ф — наименьший общий знаменатель W. Подведем итог этим вычислениям. Учитывая, что Xf ж £2/[0];, и принимая во внимание соображения (10.5.4), мы сможем дока- зать следующее предложение,
10.10 Применения алгоритма вычисления матричных инвариантов 31$ (10.6) Предложение. Элементы из X/w изоморфны q-мерным век- тором Г то<1ф1 mod ф? Из материала § 10.7 мы знаем, что для каждого ф е 7<[z] мно- жество классов вычетов {лтобф: п е /<[г]} образует циклический Л£г]-модуль ЛМ/К[г]ф. Отсюда следует, что Xf ~ К [г\1К [г] ih© ... ©Л [z]/K [г] ф,. Но с учетом свойств делимости ф, (10.5.5) это в точности сов- падает с утверждением структурной теоремы (8.1) для модуля с кручением Xf. * Полученный результат можно сразу обобщить на произвольные конечные Л[г]-модули с кручением. (Если кручения нет, то эле- менты матрицы W не являются рациональными дробями и заме- чание (10.1) бессодержательно.) Пусть X — такой модуль, порож- дающийся (как К-векторное пространство) многочленом git ... Сопоставим обычным образом модулю X некоторую динамическую систему = (F, G, Н), где F: Х->Х: х^г-х, m (10.7) G: Km~+X: (ab ..., % akgk, ak^K, k=l H-. X^Km: gk^ek. Тогда система Sx полностью достижима и полностью наблюдаема. Поэтому является канонической, а следовательно, согласно теореме (6.9), система существенно эквивалентна отображению вход — выход со I—> W • (о, которое по теореме (9.4) эквивалентно матрице передаточных функций Wx системы Отметим еще раз, что теорема единственности канонических реализаций необходима для того, . чтобы гарантировать независимость инвариантных свойств матрицы Wx от выбора конкретной системы представ- ляющей модуль X, при условии, что — каноническая система. С нашей точки зрения, основной вывод можно сформулировать следующим образом. (10.8) Предложение. Инварианты (определение (8.2)) конечного К\г\-модуля с кручением X с аннулирующим многочленом ф и 9 Напомним, что утверждение: «X есть конечный 7?-модуль или R — /\[г]» означает, что dim X (как размерность /(-векторного пространства) конечна. См. следствие (8.5).
314 to Алгебраическая теория линейных систем инварианты матрицы многочленов фЦ7у, где Wx — передаточная матрица, соответствующая модулю X в смысле соотношений (10.7), одинаковы. Короче говоря, зная ф и W, для модуля X мы располагаем ал- горитмом вычисления инвариантов модуля X. В этом и заложена одна из основных причин нашего интереса к передаточным функ- циям. Определение (10.7) показывает, что мы всегда можем поста- вить в соответствие модулю X матрицу W. Другой метод вычисле- ния инвариантов с помощью полилинейных функций приводится у Бурбаки [Алгебра, гл. 7, § 4, п. 4]. Принимая во внимание утверждение (10.8), мы имеем теперь право (а на самом деле просто вынуждены) ввести еще одно определение инвариантов. (10.9) Определение. Инварианты матрицы W правильных рацио- нальных дробей над K[z] задаются посредством фг-, построенных в (10.5.4). (10.10) Упражнение. Пусть W = diag(9i/oi, ..., 0m/om). Тщатель- ный расчет показывает, что при (0/, аг) = 1, i — 1, ..., m имеет ме- сто соотношение dim IF A dim = S deg Фг = 5 deg at, w i-1 i=l даже несмотря на то, что в общем случае естественно ф, 4= Ог- Применим теперь этот аппарат к решению нескольких различ- ных, но близких по духу задач. а. Инварианты квадратных матриц. Нам нужно вычислить инварианты (в смысле определения (8.7)) матрицы размера (и X п) (или К-эндоморфизма) F: Х-*Х. Прежде всего поставим в соответствие матрице F динамическую систему = (F, /, /). Система S, очевидно, является канонической. В связи с этим соот- ветствие S взаимно однозначно, и передаточная матрица этой си- стемы имеет вид 1Ff = (zi — К)-1. Но согласно теореме об инва- риантах и представлению (10.2), мы имеем (10а. 1) zI-F = A(z)A(z)B(z), где А = diag(Xi, ..., Хп). Ни одно из Х< не равно нулю, так как det(z/-F) = X(z), и не равно нулю (как многочлен), так что rank(zi — F) = n. Переходя к обратным матрицам, получаем, что (10а. 2) (zl - F)-1 = В~' (z) A-1 (z) А-1 (г).
10.10 Применения алгоритма вычисления матричных инвариантов 315 0о так как то должно быть общим знаменателем для (z/~-Л"1* Поскольку же det А-1 = (det Л)-1 е К, на самом деле Кп должно быть наименьшим общим знаменателем. Поэтому в силу (10а.2) имеем (10а. 3) Х„ (г) (г/ - F)~l = A{z)A (z) В (г). Где А — В , В = А и А = diag (X^/Xj, Хп/Хз.. !)• Если не считать обратного порядка элементов в выражении для Л, то приведенное выражение может служить представлением матрицы многочленов Xn(z) {zl— F)~l как раз в смысле теоремы об инвариантных множителях. А так как Хп— наименьший общий знаменатель для (z/— F)~l, мы видим, что в соответствии с изло- женной выше теорией Xn = фр. На самом деле справедливо даже большее. Воспользовавшись утверждением (10.8) и обозначениями из (10.5.4), инварианты WF можно вычислять как знаменатели Хп-*+1/Фту» остающиеся после сокращения общих множителей. Отсюда получаем 1/Ф/ = Х„_г + = Кп-1+1/кп = 1/Хп-/+|, что доказывает следующее предложение. (10а.4) Предложение. Инварианты матрицы {zl— F)~x в смысле определения (10.9) равны инвариантам матрицы {zl — F) в смыс- ле теоремы (А. 17). Следовательно, инварианты квадратной мат- рицы F в смысле определения (8.7) можно вычислять как инва- рианты матрицы {zl — F). Утверждение (10а.4) представляет собой классическое опреде- ление инвариантов матрицы (см. § 6 гл. 7 монографии Гантмахера [1953]). Эта ситуация, по-видимому, впервые была отмечена и рассмот- рена Калманом [1965а]. Аппарат этой статьи Калмана основан на элементарной алгебре многочленов и (в связи с этим) требует запутанных и тонких рассуждений. Мы же имели возможность убедиться в том, что аппарат теории модулей позволяет обойти все эти трудности. В будущем нам понадобится еще и такое элементарное след- ствие. (Юа.5) Следствие. Квадратная матрица F является циклической тогда и только тогда, когда X) = ... — ^п—1 = где — инварианты матрицы {zl — F).
316 10 Алгебраическая теория линейных систем % Л' Заметим, что отсюда следует соотношение = Xn = xf, совпав : дающее с критерием (7.23). Ь. Вычисление канонических реализаций. Представление (10.3) дает нам всю необходимую информацию относительно системы и позволяет едва ли не непосредственно получать каноническую реализацию этой системы. Впервые это было сделано в работах Калмана [1965b, 1966b]. Основную роль здесь играет следующая лемма. (ЮЬ.1) Лемма. Пусть F — циклическая матрица размера (пХп) над К. с характеристическим многочленом х- Тогда X (г) (zi — F)~1 = v (г) w' (z) mod %, где: (а) компоненты (t>b ..., vn) вектора v и компонентыл (Wi, ..., wn) вектора w линейно независимы над К; I (Ь) если &Ф' = vw' mod х, то v = ev, а & = e~lw, где е есть* единица в K[z]/K[z]x. I Доказательство. Существование этого представления является ча-Д стным случаем теоремы об инвариантах. Действительно, согласно! утверждениям (10а.4) и (10а.5), цикличность означает, что если| есть „числитель" матрицы (г! — К)-1, 1 то в представлении (10.3) имеем Lw = diag(l, 0, ..., 0). Поэтому,! согласно (10.3), можно положить v равным первому столбцу мат-1 рицы Р, a w'— первой строке матрицы Q. Если w'(z)a = 0 (при всех z) для некоторого аеКп, то X (2) (zi — F)~l а = 0 mod х- А так как (zi— F~l)—правильная дробно-рациональная матрица это означает, что s x(z)(z/-F)~1a = 0, или, что то же, (z/-F)~’a = 0. Но матрица (z/ —Р)-1 не вырождена как дробно-рациональная; матрица (даже несмотря на то, что в смысле «сравнения по мо< дулю х» ее ранг естественно равен 1), откуда следует, что а = 0. Точно так же из того, что b'v(z) = 0 (при всех г), следует, что b = 0. Этим доказан пункт (а) леммы (10Ь.1). Выберем теперь ае Кп так, чтобы и w'a и w'a были едини-- цами в K[z]/K[z]x. (Существование такого а очевидно из-за того, что при любых а е Кп не может быть (w'a, х)¥= 1, поскольку эле-
10.10 Применения алгоритма вычисления матричных инвариантов 317 менты w образуют базис для ^degz-) Но тогда vw' — vw' mod% означает, что б = (w'a) • v, что и доказывает утверждение (Ь) нашей леммы. В общем случае явная форма v и w будет зависеть не только от выбора единицы в пункте (Ъ) из (ЮЬ.1), но и от конкретного вида матрицы F. (ЮЬ.2) Пример. Рассмотрим матрицу 0 0 0 1 которая является циклической, поскольку ее собственные числа различны. Характеристический многочлен этой матрицы есть Xf(z) — z2 — z. Поэтому z— 1 ‘ z XP(z)(zI-F)~l = 0‘ z [— z + 1, z] mod %. Заметим, что в этом случае элементы о и w оказываются делите- лями нуля по модулю %. (ЮЬ.З) Пример (Калман [1966b]). Если F — сопровождающая мат- рица вида (4.9) из гл. 2, то простой расчет показывает, что v и w можно выбрать в виде - 1 “ Z zn~l + a1z'1-2 + .. v(z) = _Zn~'_ , w(z) = z + cti 1 где %р (г) = zn + o^z"-1 + ... + a„. Требуемая линейная независимость над К компонент v и w оче- видна. Построим теперь явные формулы для канонических реализа- ций системы с передаточной матрицей W правильных рациональ- ных дробей. Прежде всего вычислим представление (10.3) (или (10.2), если это окажется проще). Для каждого инварианта ф/ матрицы W выберем такую циклическую матрицу F<, чтобы было =фг (Например, F, может быть сопровождающей матрицей Ф<.) Представим L в виде (А, ...) и обозначим i-й столбец матрицы F через р{, а i-ю строку матрицы Q из представления (10.3) —
318 10 Алгебраическая теория линейных систем через q't,. Пусть Vi и Wi — векторные многочлены, свойства которых указаны в лемме. Рассмотрим систему уравнений (10b.4) HtVt = Pi mod фг, i=l, .... m; (10b.5) ay'Gz = g, mod фр i=l, .... tn. Учитывая сравнение по модулю фг-, векторные многочлены в правых частях этих уравнений можно выбирать так, чтобы степени их компонент были меньше чем deg фг-. В этом предположении лемма показывает, что уравнения (10Ь.4) и (10Ь.5) имеют един- ственные решения Н{ и Gt. Но тогда, вспоминая, что щ = (/<, ф), а фг- = ф/pi, положим, что liP^i = Рг [№/) Pi^ = [Я гагг<Ог] mod ^фР Воспользовавшись леммой (lOb.l) еще раз, найдем liPi4'i = - Г)-1 Ог] mod р£фг = ф[//г(z/ - Гг)-1 Gf] mod ф. Отсюда, согласно соотношению (10.3), имеем q 41Г == 2 m°d 4 = 42 Нг(х1 — F,)-1 Gt mod 4. Рассматривая правую часть этого равенства и помня, что каж- дый элемент матрицы W представляет собой правильную рацио- нальную дробь, убедимся, что это равенство справедливо не толь- ко по модулю 4д, но и в обычном смысле. Отсюда получаем Q (ЮЬ.6) r(z) = 2 HikzI-FiY1 Gt. /«=1 Тем самым мы доказали искомый результат. (10b.7) Теорема о реализации. Каждая передаточная матрица W правильных рациональных дробей может быть реализована в виде прямой суммы систем li = (Fi, Gh где Fi есть циклическая матрица с характеристическим многочле- ном фй a Gi и Hi вычисляются по формулам (ЮЬ.4) и (10Ь.5), в которых используется представление (10Ь.1) для матрицы W-Fi)-'. (10Ь.8) Упражнение. Дайте строгое определение «прямой сумме» линейных систем в том смысле, в каком это выражение употреб- ляется в сформулированной теореме.
10.10 Применения алгоритма вычисления матричных инвариантов 31$ (10Ь.9) Следствие. Реализация, определенная в теореме (10b.7), является канонической. Доказательство. С учетом утверждения (6.10) нам достаточно по- казать, что предлагаемая реализация имеет ту же размерность, что и модуль Xfw соответствующего отображения вход — выход fw. Другими словами, нужно показать, что dim Svr = dimXw Но, согласно утверждениям (10.6) и (8.5), dimXw = deg4i+... ... + deg гр,. С другой стороны, очевидно, что dim 2» = deg 4,, так что размерность прямой суммы S, совпадает с dimXw- Примеры требуемых численных расчетов можно найти в рабо- тах Калмана [1965а, 1966а]. Приведем здесь всего лишь один пример. (10b. 10) Пример. Пусть ' 1 z+ 1 0 0 F(z) = 0 1 z + 2 0 0 0 1 z + 3 _ Ясно, что 4(z) = (z + 1) (z + 2) (z + 3). Инварианты матрицы 4 IT имеют следующий вид: Л= diag (1, 4, 4), а представление (10.3) выглядит следующим образом: L = diag(l, 0, 0), " (z + 2)(z + 3) Р= 2(z+l)(z + 3) _ (z+l)(z + 2) 1 2 1 0 2 2 "l(z + 2)(z + 3) -l(z+l)(z + 3) l(z+l)(z + 2)“ Q = -1 1 -1 0 -i 1 Для того чтобы убедиться в том, что RLQ = 4lTmod 4, придется заняться вычислениями следующего вида: (z + 2)2(z + 3)2 = (z + 2)(z + 3)(z+ 1 + 1) (z+1 + 2) = = 2 (z + 2) (z + 3) mod (z + 1) (z + 2) (z + 3).
320 10 Алгебраическая теория линейных систем Если теперь выбрать v и w так же, как в,примере (ЮЬ.З), то решение уравнения (10Ь.4) будет иметь вид 5 1 ’ 8 2 3 1 . Вычисление матрицы G оставляем читателю. (10b. 11) Замечание. Схема канонической реализации показана на рис. 10.2. Эта схема самым решительным образом отличается от той, которая обычно приводится в литературе и которая дана на рис. 10.3. Поскольку реализация скалярных передаточных функ- ций представляет собой известную решенную задачу, на рис, 10.3, безусловно, показана одна из реализаций передаточной матри- цы W. На самом деле эта схема получается сразу же из условий линейности. Однако эта реализация очень редко оказывается кано- нической. В связи с этим простота схемы на рис. 10.3 объясняется произвольностью ее выбора, и, несмотря на графическую привле- кательность, эта схема может не иметь никакого отношения к реальной системе S с передаточной функцией W. Схема на рис. 10.2 кажется более подходящей в качестве модели реальной системы, поскольку в таких системах (вычислительные машины, мозг животного и т. д.) «обычно» проявляется внутренняя связ- ность очень высокого уровня, отсутствующая на схеме рис. 10.3. (10b.12) Историческое замечание. Изложенные результаты были впервые получены Калманом в работе [1965а]. Инварианты же ф1 были вычислены значительно раньше Мак-Милланом [1952] с по- мощью представления (10.2) матричных многочленов и алгоритма, по существу совпадающего с алгоритмом (10.5). Однако в работе Мак-Миллана есть некоторые недостатки. Например, он не заме- тил, что по-настоящему содержательное представление имеет вид (10.3), а не (10.2). (Ненужные осложнения могут возникнуть в том случае, когда некоторые А из представления (10.2) оказываются равными нулю по модулю ф.) Систематическое использование сравнения по модулю ф{, характерное для работы Калмана [1965а], наводит на мысль о необходимости и возможности более тонкого алгебраического' анализа. Именно это и привело к созданию тео- рии, которой посвящена настоящая глава. с. Описание эквивалентных канонических реализаций. Посколь- ку ра'зличные канонические реализации отличаются друг от друга; лишь выбором базиса в X, класс эквивалентности всех канониче- ских реализаций заданного отображения вход—выход f находит- ся в взаимно однозначном соответствии с классом всех невырож- денных матриц порядка, равного dim f. (Это одно из следствий
Рис. 10.2. Общая структура линейной системы. Рис. 10.3. Обычная реализация матричной передаточной функции. 11 Зак. 693
322 10 Алгебраическая теория линейных систем теоремы (6.9)!) Используя лемму (ЮЬ.1), мы можем дать не-j сколько более явное описание эквивалентных реализаций. Рассмотрим скалярный случай т = р = 1. В этом случае Wf = = 0/ф, где, конечно, предполагается, что (6, ф) = 1. Выберем неко- торую фиксированную циклическую матрицу F, у которой = ф и соответствующие v и w удовлетворяют требованиям леммы (10b.1). Запишем 0 = е(е”’0), где е — произвольная единица в1 К[г]/К[г]ф. Тогда h и g канонической реализации (F, g, h') опреде- ляются следующими уравнениями: (10с. 1) e = Yomodi|), (10с.2) е~’0 = и^тобф (см. уравнения (10Ь.4) и (10Ь.5)), поскольку условие т — р — Г гарантирует цикличность. Но так как (0, <р) = 1, то 0 есть еди- ница в КМ/К[г]ф. Кроме того, легко видеть, что w'g и h'v ока- зываются единицами каждый раз, когда (F, g) полностью дости- жимо, a (F, h') полностью наблюдаемо. Поэтому уравнения (10с.1) и (10с.2) справедливы для любых канонических реализа- ций. Вспоминая теперь, что F была выбрана произвольным обра- зом, получаем еще одну «структурную» теорему. (10с.З) Предложение. Пусть т = р = 1. Тогда класс всех канони- ческих реализаций заданного отображения вход — выход f с мини- мальным многочленом ф изоморфен множеству {все циклические матрицы F над К с %₽ = ф}Х{все единицы в ЛН/КМф}- Принимая во внимание теорему единственности канонических реализаций (6.9), мы видим, что второе из множеств в фигурных скобках должно быть изоморфно множеству всех изменений базиса, не изменяющих F, или, другими словами, множеству всех невы- рожденных матриц, коммутативных с F. На самом деле это клас- сический результат (см. § 3.15 учебника Джекобсона [1953]): (10с.4) Предложение. Квадратная матрица А над К коммута- тивна с циклической матрицей F над К тогда и только тогда, Когда A — <x(F), а аеОД. Более того, матрица А невырождена тогда1 и только тогда, когда а есть единица в КЫ/КЙХр- Доказательство. Рассмотрим К[г]-модуль XF, индуцированный ма-; трицей F (предложение (5.1)). Поскольку F циклическая, цикли- ческим должен быть и модуль XF (именно таким образом мы onpe-j делили в (8.7) цикличность матрицы F). Если А коммутативна: с F, то A (z х) = (AFx) = (FAx) = z (Ах),
10.10 Применения алгоритма вычисления матричных инвариантов 323 т. е. А является гомоморфизмом модуля. Пусть g—некоторая об- разующая модуля Хр, и пусть A: g >—> a-g = a(F)g. Но так как ХР циклично, то А полностью определяется посредством а. Более того, если (а, %) ¥= 1 (т. е. если а не есть единица в K[z]/K[z]x), то существует такое б, что ба = р% и, следовательно, 6(F)a(F) = (pX)(F) = 0, а матрица А вырождена. Поэтому А невырождена тогда и только тогда, когда а есть единица. Обобщение предложения (Юс.З) на случай q циклических под- систем предоставляем читателю. Результат для этого случая, ана- логичный предложению (10с.4), был получен со всеми подробно- стями Джекобсоном [1953, § 3.16—3.18]. d. Степень дробно-рациональной матрицы. Пользуясь грубой аналогией с определением степени многочленной матрицы, Мак- Миллан [1952] определил степень правильной дробно-рациональной матрицы следующим образом: я (10d. 1) deg W = S deg Фь i = 1 где deg W, очевидно, совпадает с нашим определением dim IF = = dim Xfw (см. утверждение (8.5)). Даффин и Хазони [1963] иссле- довали некоторые свойства dim(-), пользуясь специально разрабо- танными для этого методами. Сравнение различных определений, предложенных ими вместо определения (lOd.l), приведено в ра- боте Калмана [1965а]. Как было показано в этой работе, все ре- зультаты, относящиеся к степеням матриц, являются простыми следствиями интуитивно очевидных (и легко доказываемых) свойств реализаций. Приведем несколько таких результатов на выбор. (10d.2) Предложение. Если V — подматрица матрицы W, то deg V < deg W. Доказательство. Если 2 — минимальная реализация матрицы W, то S будет также и реализацией подматрицы V после отбрасы- вания лишних входов и выходов. Но так как такое 2 может быть неминимальной реализацией подматрицы V, то нужно допустить и знак неравенства. (10d.3) Предложение, deg WW deg W + deg W. Доказательство. Если 2 и 2— минимальные реализации матриц IF и IF соответственно, то последовательное соединение 2 и 2 реа- лизует WW, но эта реализация, возможно, неминимальна. 11*
324 10 Алгебраическая теория линейных систем е. Неискажающие и воспроизводящие системы1)- В заключение этого параграфа рассмотрим задачу, при решении которой пона- добится представление (10.2), а не (10.3) для ф№. Нам потребуются следующие специальные определения (не ис- пользуемые дальше). Линейная система Называется неискажаю- щей тогда и только тогда, когда при произвольном заданном на- чальном состоянии х(т) и выходной последовательности у(х), ... • ••» */(r + Z) (при этом, естественно, считается, что Fs, Gs и известны) можно однозначно определить входную последователь- ность и (т), .... и (т + I — d). (Здесь d 1 есть подходящее за- паздывание, позволяющее вычислять выходную последователь- ность.) Точно так же система 2 называется воспроизводящей тогда и только тогда, когда для любых х(т) и всех требуемых выходных последовательностей у(х), ..., у (г + I — d) существует входная последовательность и (т), ..., и (т + /), формирующая эту выход- ную последовательность. Ниже станет ясно, что свойства неиска- жаемости и воспроизводимости взаимно дополняют друг друга. Мы рассмотрим лишь первое из них. Наша задача состоит в том, чтобы не только выяснить, является ли заданная система 2 неис- кажающей или искажающей, но и в том, чтобы найти систему 2*, формирующую требуемую входную последовательность по задан- ной выходной последовательности. Грубо говоря, нам нужно найти систему 2*, обратную системе 2. Поскольку системы линейны, мы можем (и будем) предпола- гать, что х(т) = 0. Скалярный случай: т = р = 1. Если нас интересует входная последовательность с точностью до сравнения по модулю ф, то эта задача, по сути дела, сводится к задаче определения состояния и может быть решена методом, описанным в § 2.6. Если же нас инте- ресует вся входная последовательность, то придется решать урав- нение (lOe.l) Was = (0/ф) ® = у. Искомое решение получается сразу из того, что (0, ф) = 1 то- гда и только тогда, когда система 2 каноническая; фу должно быть многочленом, делящимся на 0, а частное должно равняться о. Общий случай. Если ранг матрицы W меньше т (над полем ра- циональных дробей /([z] переменной z), то найдется такой ненуле- вой вектор со е Km[z], что IF© = 0. Поэтому необходимо, чтобы rank ф IF =/и и чтобы т. Согласно теореме об инвариантах, имеем i = 1, .... т, и, следовательно, эти условия также и достаточны. Действительно, рассмотрим представление (10.2) и *) Результаты этого раздела принадлежат в основном д-ру П. Л. Фарру.
10.11 Алгоритм Б. Л. Хо 325 положим у — А"’у, а и = В®. (Вспомните алгоритм (10.5), но не забывайте, что все операции теперь выполняются в K[z], а не в К[г]/К[г]ф.) Тогда необходимо иметь М>г = фуг, 1=1, ...» пг, <10е'2) 0 = у/, i = m+l...............р. Первое из этих уравнений решается, как и в скалярном случае, а следовательно, ® известно, так как det В есть единица в K[z], Вто- рое уравнение, известное в теории кодирования как «проверка на четность», может использоваться для исправления ошибок неко- торого типа в предполагаемых значениях у. Поскольку rank W = т, имеется невырожденная подматрица Wi размера (tn X п), полученная вычеркиванием подходящих строк матрицы IF, соответствующих выходам, не использованным для определения и. Матрица IFf1 дробно-рациональна, но (обычно) она не является правильной и поэтому не может быть представле- нием динамической системы. Но если разрешить подходящее за- паздывание d на декодирование входной последовательности по выходной, то матрица z~dW~x окажется правильной дробно-ра- циональной и представляющей искомую систему S*. (Для мини- мизации запаздывания d необходимо рассмотреть все матрицы С размера (tn X р) над К, такие, что ранг CW равен т. Тогда dmtn зависит от С, но явный вид этой зависимости пока неизвестен. Трудность этой задачи состоит в том, что максимальные степени элементов матриц А и В совершенно произвольны и, более того, эти матрицы, естественно, не определяются однозначно видом i|?IF.) Поскольку = rank ip IF = т и строгий знак неравенства вполне возможен (как, например, в (10b. 10)), ясно, что рассмо* тренные здесь вопросы имеют очень мало общего с внутренней структурой системы 2, но зависят лишь от преобразующих свойств этой системы. 10.11 Алгоритм Б. Л. Хо Решение задачи реализации с помощью теоремы об инвариан- тах из § 10.10b позволяет получить всю необходимую информацию о структуре канонической реализации. К сожалению, этот метод требует очень сложных и утомительных расчетов, что неразрывно связано с характером классического алгоритма определения ин- вариантов. Предположим, однако, что нам не нужно знать инвариантов и что нас интересуют лишь три матрицы F, G и Н реализации. Тогда Разумно поискать более простой алгоритм. Эта задача впервые была решена Б. Л. Хо весной 1965 г. (Хо [1966]; Хо и Калман 11965, 1966] и независимо Юлой и Тиши [1966]. Последующие
326 10 Алгебраическая теория линейных систем исследования показали, что этот алгоритм, совершенно неизвест- ный в теории систем до 1965 г., играет центральную роль. Этот алгоритм базируется на теореме об инвариантах над К (а не над К[г], как в § 10.10). Вследствие этого результат данного параграфа приложим не только в случае произвольного поля К, но и в слу- чае весьма общих колец. В этой области осталось еще много нере- шенных (и, возможно, плодотворных) задач. Принятый здесь метод'изложения основывается на работах Хо и Калмана [1965, 1966, 1969], а также Зейгера [1967Ь]. Рассмотрим линейную систему, заданную своим отображением вход—выход f. Из-за линейности системы знание f эквивалентно информации о бесконечной последовательности (f(eft)(l), f(eft)(2), ...), где f(ek)(i)^Kp. Мы можем также сопоставить отображению f некоторую бесконечную последовательность {Ai,А2, ...} матриц размера (р X tn) над К, где каждая матрица определяется соот- ношением Ар Кт-*КР, (ЦП т : (аь ...» am)b-»Saftf(eA)(j), aft<=K, /=1, 2, .... £=1 Поэтому f также эквивалентно бесконечной в двух направлениях блочной матрице А] А2 A3 ... /и ох _ ^2 А3 А4 ... которую мы назовем ганкелевой матрицей отображения f. (Ма- трицу, элемент которой с индексами (i, j) задается значением не- которой функции в точке ( )«+,, часто называют ганкелевой.) За- метим, что, хотя матрица <%(f) и «блочно-симметрична», она не- обязательно симметрична в обычном смысле слова. Нас будут интересовать в основном только блочные подматрицы размера N' X N, занимающие верхний левый угол матрицы 5^ (f), т. е. А] ... Ajy (U.3) (f) ~ An' ... Ajy'+дг-1
10.11 Алгоритм Б. Л. Хо 327 Операторы сдвига, определенные на Й иГ, индуцируют на 36(f) свой оператор сдвига, определяемый следующим уравнением: (11.4) J36 (f) = 36 (<?/) = A+& A+s • A+s A+* • • • _ 4 • где akf: ai—>f(zl 4=*4(®) (последнее равенство вытекает из коммутативности диаграммы (2.1с)). Короче говоря, ганкелеву матрицу 36(f) можно рассматривать как математический объект, эквивалентный отображению f, кото- рый можно использовать вместо f в качестве «исходного мате- риала» для различных расчетов. Например, оператор сдвига о можно представить как отображение 36(f) -+36(zf), задаваемое в явной форме, поскольку 36 (zf) является блочной матрицей ма- трицы 36 (f). Различные другие применения 36(f) можно найти в работе Хо и Калмана [1969]. Опишем теперь алгоритм Б. Л. Хо. Он позволяет получить яв- ные выражения для матриц (F, G, Н) канонической реализации. Объем необходимых вычислений определяется объемом расчетов, нужных для определения инвариантов К-матрицы 36N+\,n(f), где N не превосходит dimf. Мы приведем два доказательства этого алгоритма. Первое из них использует обычную линейную алгебру, но довольно сложным образом. Второе, принадлежащее Зейгеру, требует лишь манипуляций с коммутативными диаграммами того же типа, что и в § 10.6. Второе доказательство особенно ярко по- казывает, как можно было бы вывести этот алгоритм из абстракт- ной теории реализации в духе § 10.6. Однако нужно признать, что оригинальное открытие Б. Л. Хо основывалось на соображениях, весьма близких к используемым в первом доказательстве. Рассматриваемый алгоритм опирается на три следующие леммы. (11.5) Лемма. Пусть для f существует некоторая конечномерная реализация. Тогда индуцированная последовательность (At,Az, ...) для f (см. 11.1) удовлетворяет соотношению Ar+i+i — ~ 5 fiiAi+ь i = Q, 1, .... справедливому для некоторых 0Ь ..., 0Г е К, где г можно выбрать не меньше, чем deg ф/. Доказательство. Определение отображения вход — выход f и урав- нения (1.5) сразу показывают, что матрицы (F,G,H) реализуют
328 10 Алгебраическая теория линейных систем f тогда и только тогда, когда (11.6) A^HF^G, i =1,2..................... Пусть 0 — любой аннулирующий многочлен К[г]-модуля Xf, инду- цированного отображением f. (В частности, можно положить 0 = ф/.) Если '0f (z) zn 4- a/z"-1 + ... +a„, то, полагая Pi = an-i+i, мы с помощью теоремы Кэли — Гамиль- тона (или теории модулей) получим требуемое соотношение. (Нам не требуется знать, что если г < deg %, то приведенное соотноше- ние не выполняется. Доказательство этого факта предоставляем читателю в качестве легкого упражнения, связанного с теорией достижимости и наблюдаемости.) В последующем нам не потребуется вычислять р,. Достаточно убедиться лишь в факте их существования. В действительности же одну реализацию можно получить непосредственно из леммы (11.5). Для этого потребуются следующие специфические обозначения: Еп матрица размера (/n X п) вида матрица размера (rn X и) вида если т<п, если т>п, единичная матрица размера (tn X т) вида [/„], если т = п, где 1п и 0" - соответственно единичная и нулевая матрицы раз- мера (т X п). (11.7) Лемма. Если для f существует некоторая конечномерная реа- лизация, то это отображение реализуется тройкой (F,H,G), где (11.8) Н=ЕРРГ, (П.9) G 'Ур /£\ Г'тг — (7К>ГГ \I) - ор Ip ор . .. Ор - 0Р Ор А» Ор (11.10) Г = С = • • 0Р Ор Ор /р — Р/р - Рз^р -Р/р- Здесь г и pi, .... такие же, как в лемме (11.5), a 1Р и 0р — со- ответственно тождественная и нулевая матрицы размера (р X р) .
10.11 Алгоритм Б. Л. Хо 329 Доказательство. Прежде всего заметим, что, согласно лемме (11.5), имеем (^(0 = ^(1) для всех Z = 0, 1, 2.......... (Это показывает важность представления системы ее ганкелевой матрицей. В этом случае оператор сдвига автоматически пред- ставляется через матрицу F реализации. Отметим еще тесную связь между оператором сдвига и «блочной сопровождающей матри- цей» С.) Ясно, что A^E’rMrrtfjEX-HG и что для любых i = 1,2, ... справедливо, что (11.11) ~е>г\с1~хЖгг(Г)\е™г= = HCl~xG, что и доказывает утверждение леммы (11.6). Следовательно, ма- трицы (11.8) — (11.10) реализуют отображение f. Остается сделать еще одно принципиально важное замечание. (11.12) Лемма. Пусть для f существует некоторая конечномерная реализация S. Тогда при любых положительных целых N и N' имеет место соотношение rank o^n’n (f) dim f < dim S. Доказательство. Пусть S = (F, G, H) есть произвольная реализа- ция отображения f. Определим 5?№[G, FG, .... Fw~'g] И = F'H', .... (F'}n'~xH'\ Тогда, согласно лемме (11.6), справедливо равенство ^N'N — (У N'SIn для любых реализаций и любых положительных N и N'. Предполо- жим теперь, что реализация S каноническая. Тогда rank S^n'n (f) min {rank $#, rank (Jn'} < dim f. (Во втором неравенстве знак < можно заменить равенством, если, по крайней мере, N, N' > deg г|>/.) (11.13) Замечание. Приведенное доказательство становится яснее и интереснее, если вспомнить, что матрица играет ключевую
Й 330 10 Алгебраическая теория линейных систем роль в получении условий полной достижимости (теорема (3.18), ; гл. 2). В соответствии с принципом дуальности матрица играет аналогичную роль в теории наблюдаемости. Теперь мы готовы описать искомый алгоритм. I (11.14) Реализация алгоритма Б. Л. Хо. Построение канонической реализации произвольного конечномерного отображения, вход — вы- ход f можно осуществить следующими шагами: \ 1. Выбираем г, удовлетворяющее ограничению леммы (11.5). ". 2. С помощью алгоритма определения инвариантов над полем К (или любым другим1) эквивалентным методом) находим невы- рожденные матрицы Р размера (pr X рг) и М размера (mr х mr) | над К, такие, что (И. 15) P[W„(f)]M = __ Т?РГ Г?П 3. Вычисляем матрицы канонической реализации отображения f по следующим формулам: (11.16) F = EprP [(o^)rr (f)] МЕТ, (11.17) О = ЕпргР(Жгг(1)}ЕТ, (11.18) H = Eppr[Wrr(f)]MET. Квадратные скобки в этих формулах должны подчеркивать, что в качестве основной информации всегда выступает матрица 38rr(f) или результат ее сдвига, а данные, используемые для расчетов, со- держатся в матрицах Р и М. Матрица Е соответствует операции «редактирования», а не вычислительной операции. Первое доказательство (Б. Л. Хо). Размерность системы S = = (F,G,H), построенной согласно формулам (11.16)—(11.18), оче- видно, равна рангу матрицы 36„(f). Согласно лемме (11.12) за- ключаем, что если тройка (F, G, Н) определяет реализацию отобра- жения f, то эта реализация каноническая. Поэтому остается пока- зать, что матрицы, вычисленные по формулам (11.16) — (11.18), удовлетворяют условиям леммы (11.6). Для простоты будем писать 36 вместо 36rr(f) и ak36 вместо (oh36)„(f) и опустим некоторые несущественные индексы при Е2). Матрица 36* = МЕпЕпР 1) Изящное описание «обычного» алгоритма можно найти в работе Андрэ [1949]. 2) Читатель должен, конечно, проверить, определены ли все матричные про- изведения, встречающиеся ниже.
10.11 Алгоритм Б. Л. Хо 331 называется псевдообратной матрицей Ж в том смысле, что = Ж С помощью мы просто проверим, определяют ли формулы (11.16) — (11.18) некоторую реализацию или нет. Это делается в несколько этапов: Ai = Ep[a‘~1^]Em = = ЕрС1~'ЖЕт = = Ерс1~'жж*зеЕт = = ЕрС1~'ЗММЕпЕпРЖЕт = = EpC‘~'^MEnG = = Ep3@Di~'MEnG = 0/П In От 0/п (11.19) £> = Ofn 1щ (по определению а), (согласно (11.14)), (по определению операции #), (по определению ЗЮ*), (по определению G), (где D есть результат блочного транспонирования матрицы С и С3% = 3MD) • • • Р1Лп • • • РгЛп От • • • Рз^т ’ _ 0/п 0щ ®т • • • РгЛп _ = Ep2@3ti>*3/@Di~1MEnG = (по определению #), = Ep3%MEnEnP3MDl~'MEnG = (по определению 3%*), = HEnP3^D‘~1MEnG = (по определению Я), = НЕпРС*~13@МЕпО (в силу равенства 3/&D = С3%>). Остается только проверить, что (11.20) EnPCi~13^MEn = (ЕпРСЗ@МЕп)‘~' = F‘~\ Для случая I = 3 имеем: F2 = ЕпРСЗёМЕпЕпРСЗЮМЕп = (по определению F), « ЕпР(Жё*СЖМЕп = (по определению ^*), = EnPC3^3^*3^DMEn = (согласно С^ = ад, = EaPC3$DMEn— (по определению #), = ЕпРС2#вМЕп (согласно Ж> = О). В общем случае утверждение (11.20) доказывается точно так же с помощью индукции по i. (11.21) Замечание. Основное ограничение алгоритма Б. Л. Хо со- стоит в том, что все в нем зависит от справедливости следующего абстрактного утверждения: для f существует некоторая конечномерная реализация.
332 10 Алгебраическая теория линейных систем Согласно лемме (11.12), мы можем сформулировать более ясное эквивалентное утверждение: (11.22) Существует целое п, такое, что rank^^(f)^n для любых положительных целых N и N'. И, конечно, справедливость даже такого утверждения невоз- можно выяснить эмпирическим путем, так как для этого пришлось бы перепробовать бесконечное множество значений N и N'. Эту трудность можно в некотором смысле обойти следующим образом. С помощью более тонкого доказательства алгоритма (11.14) мы покажем (см. также работы Хо и Калмана [1965, 1966, 1969], что условие (11.23) ranko^n’n(f) = ranko^n’+i, лг(/) = гапкЖлг', n+i(F) гарантирует, что система S с матрицами, вычисленными по фор- мулам (11.16) — (11.18), удовлетворяет условиям леммы (11.6) при i — 1, ..., N + N'. Более того, пользуясь соотношениями (11.23), мы покажем, что S в этом случае является некоторой подсистемой канонической реализации отображения f (последнее может быть даже бесконечномерным). Второе доказательство алгоритма (11.14) должно как раз и внести ясность в эти вопросы. Второе доказательство (Зейгера — Калмана)’). Идея этого до- касательства состоит в том, чтобы непосредственно вычислить ка- ноническую реализацию отображения f с помощью следующих основных фактов: 1) f стационарно; 2) f имеет конечный ранг (обладает конечномерной фактори- зацией) ; 3) каноническая факторизация отображения f расщепляет f на сюръективное и биективное отображения. И хотя это доказательство довольно длинно, оно, безусловно, очень просто. Шаг 1. Конечность. Предположим, что f факторизуется следую- щим образом: где X = Кп. Пусть есть К-векторное пространство, образованное k последними членами последовательностей из Й, т. е. всевозмож- ными многочленами (k — 1)-й степени из Km[z], Аналогично пусть Гл будет К-векторным пространством, образованным первыми k ') Более раннее доказательство можно найти в работе Зейгера [1967b], но в нем есть серьезные недостатки.
10.11 Алгоритм Б. Л. Хо 333 членами последовательностей из Г. Тогда у нас есть тривиальное вложение йл->й (многочлены из й& можно рассматривать как многочлены из й) и тривиальная проекция Г-*Гл (ограничиваю- щаяся k первыми компонентами векторов из Г). Пусть и = ЙЙ^Й->Х] Хй = кег(/г\: Х-^Г->1\). Это позволяет построить возрастающую и убывающую цепочки подпространств пространства X: (11.24) ... ^Х, и (11.25) X 3 Х{ g Х'2 g ... g (0). Поскольку /(-векторное пространство X конечномерно, существует такое положительное целое N, что XN = Xk при всех k > N. Точно так же существует такое положительное целое N', что Хм' = Хь при всех k^-N'. Если отображение й->-Х является сюръективным, то XN = X, и если Х->Г биективно, то XN' = {0}. Легко видеть, что f индуцирует отображение In’n' матричное представление которого имеет следующий вид: Нам хочется заменить задачу канонической факторизации ото- бражения f задачей канонической факторизации матрицы В этом и состоит второй шаг алгоритма (11.14). Таким образом, нам надо найти Л-линейные отображения, соответствующие штри- ховым стрелкам в следующей коммутативной диаграмме /(-линей- ных отображений:
334 10 Алгебраическая теория линейных систем Рассмотрим векторные многочлены ekzj, k= 1, ..т и / = 0, 1, .... из Q, где ек = (б,*) е Кт (см. предложение 3.5). Они образуют базис для й, рассматриваемого как свободный /(-модуль. Посколь- ку отображение gN: Q^-^X является сюръективным, каждый класс эквивалентности [e^z/jf содержит некоторый элемент && из Qn. Пусть р: ekzJ (И/ь, и продолжим р, на Q, сохраняя линейность. Для того чтобы построить р, заметим, что h: Х->Г и hN-. Х-*-Гы, являются взаимно однозначными. Пусть тогда р: у = (ЛойЛ,/)(¥') каждый раз, когда у' е R с: Г^. Поскольку IV есть /(-вектор- ное пространство, Р[йлг] является одним из слагаемых представ- ления IV в виде прямой суммы, и ясно, что р можно линейно про- должить на IV Обратите внимание на то, что, рассматривая «вход- ную» и «выходную» части диаграммы, мы пользуемся строго дуальными рассуждениями. (Упражнение (Зейгер): покажите, что Xr — Xr+i означает, что ХТ — Хк при всех и что справедливо аналогичное утверждение для Хь-) Так как N, N' V г, эти числа можно рассматривать как более точные оценки, необходимые для численных расчетов, чем те, ко- торые получаются в результате умножения размеров блочных ма- триц матрицы 3@(f) на г. Шаг 2. Каноническая факторизация отображения fN,N. Так же как и в первом доказательстве, теорема об инвариантах над К1) показывает, что каноническая факторизация матричного представ- ления отображения fN,N имеет вид где А = pN' X pN' (невырождена), В = tnN X mN (невырождена), Задача сведена, таким образом, к тривиальной: к задаче факто- ризации матрицы Л. 9 Теорема об инвариантной факторизации над полем очень проста, по- скольку теперь все Хг- являются единицами. На самом деле А, В и Л можно вычислить с помощью обычного алгоритма определения ранга (Андрэ [1949]).
10.11 Алгоритм Б. Л. Хо 335 Следующая коммутативная диаграмма К-линейных отображе- ний подводит итог всем этим результатам: Х„м “*Г"' В этой диаграмме при всех k{ е К отображения я: KmN-+Kn: (ftb .... kmN)^(kb .... kn) являются естественными проекциями (сохраняющими п первых ко- ординат и отбрасывающими остальные), а отображения i: Kn->KpN': (kit .... kn)^(kt, .... kn,Q.0) являются естественными вложениями (получающимися с помощью приписывания нужного числа нулей). Шаг 3. Определение G и Н. Пусть i: Кт йх — естественное вложение k\—> (многочен Q = k степени 0). Тогда G имеет вид отображения (И хотя мы еще не доказали, что G составляет часть реализации, ясно, что такое определение естественно, так как G отображает одношаговое входное воздействие в соответствующее состояние.) Аналогично, Н есть отображение Kn-+KpN'-A+rN'-^Kp, где л отображает; степенной ряд в его первый член. Выражения, приведенные выше для G и Н, не согласуются с формулами (11 17) и (11.18), так как в уравнении (11.15) имеем Р = А-1 и М = В-1. Для того чтобы получить формулу Б. Л. Хо для G, заметим, что на основании коммутативности нашей исход- ной диаграммы можно доказать коммутативность и следующей:
336 10 Алгебраическая теория линейных систем А тогда имеем G = Л ° Р ° &@N'N ° I, что эквивалентно с точностью до обозначений соотношению (11.17*) - G=Enp^P^NE^N. Для того чтобы вычислить Н, рассмотрим еще одну коммутатив- ную диаграмму: Согласно этой диаграмме, имеем t Н = Л ° 3$fi'jf ° М ° I, или эквивалентно (11.18*) Н = Ер n^n'nME1^. j Шаг 4. Определение F. Теперь нам нужно учесть предположе- ij ние о стационарности отображения f. В качестве частного случая j коммутативной диаграммы (2.1с) мы можем построить коммута- I тивную диаграмму
10.11 Алгоритм Б. Л. Хо 337 Существование диагонального отображения очевидно из опреде- ления оператора сдвига. Пользуясь тем же построением, что и на шаге 1, мы с помощью факторизации приведем эту диаграмму к виду а затем «приклеим» диаграмму предыдущего типа к верхнему и нижнему краям диаграммы. Очевидно, что эта операция не нару- шает коммутативности. (Заметим, что эта диаграмма абстрактным образом выражает стационарность отображения f, которая сказы- вается на матрице в том, что обеспечивает специфический ганкелевский характер блочных матриц.) В результате такого склеивания получим диаграмму U G Y
338 10 Алгебраическая теория линейных систем где, как и раньше, U = X = Кп и У = Кр. Требуется найти отображение’/7: Х-+Х, соответствующее штриховой стрелке. Но так как gN (в верхней части диаграммы) сюръективно и hN, (в нижней части) биективно, мы можем воспользоваться леммой Зейгера о заполнении (6.2) и доказать существование единственного отобра- жения F. Кроме того, из диаграммы следует, что (11.28) или что (11.16*) F = EnoN'P(aW)N,NME™N. Основываясь на симметрии диаграммы, мы можем ожидать, что в общем случае отображение F необратимо. Действительно, F об- ратимо тогда и только тогда, когда отображения о, g и р также обратимы, что в общем случае неверно. Заметим также, что F нельзя в общем случае вычислить, не обращая матриц А и В. Это связано с тем, что fN,N в общем случае необратимо. Короче говоря, формулы Б. Л. Хо дают наиболее эффективный способ определе- ния искомых F, G и Н. Никакие другие формулы в общем случае не работают. Шаг 5. Проверка того., что (F, G, Н) определяют реализацию. То, что At = HG, следует сразу из коммутативности диаграммы (верхний контур определяет HG, а нижний определяет Ai). С по- мощью диаграммы, использованной для вычисления F, мы по- строим диаграмму доказывающую, что А2 = HFG. Повторяя этот же прием, мы смо- жем доказать, что Ai = HF^G при всех i>2.
10.11 Алгоритм Б. Л. Хо 339 (11.29) Замечание. Алгоритм Б. Л. Хо замечателен тем, что он об- ходится без определения инвариантов модуля X/, индуцированного отображением f. В то же время он дает нам все то, что дают инва- рианты. Напротив, примитивная реализация, определяемая леммой (11.7), зависит от знания аннулирующего многочлена 0 модуля Xf. Поскольку же мы не знаем, справедливо ли равенство 0 — ф/ или нет и какова циклическая структура," размерность реализации нужно выбирать так, чтобы формулы были справедливы в самом худшем возможном случае, т. е. если ф1 = . ..= фд. В связи с этим приходится полагать п = [min(m, p)][deg 0], а это значит, что по- лученная реализация, описываемая формулами (11.8) — (11.10), почти во всех случаях будет неминимальной. Теорема Б. Л. Хо по- казывает, кроме того, что неэффективную реализацию (11.8) — (11.10) можно упростить в том случае, когда нам известен лишь ранг матрицы 38n'n(J) для достаточно больших N и N'. Другими словами, формулы (11.16) — (11.18) минимальной реализации мож- но рассматривать как достаточно хорошо «отредактированный» вариант реализации (11.8) — (11.10). Отметим еще, что от простого и с первого взгляда полезного уравнения (11.10) для F приходится отказаться в процессе этого «редактирования» (обратитесь еще и к замечаниям в конце § 10.10b). (11.30) Замечание. Второе доказательство довольно ясно свиде- тельствует о том, что инварианты не играют в теореме Б. Л. Хо никакой роли. В этой теореме мы заменяем блочные матрицы раз- мера (г X г) на блочные матрицы размера (N' X N) и отказы- ваемся от использования леммы (11.5) (и даже аннулирующего многочлена), предпочитая основываться на условиях (11.24) и (11.25) убывания и возрастания соответствующих цепочек. Нару- шая блочную структуру матрицы 3@(f), мы можем измельчить эту цепочку и дальше так, что придется иметь дело лишь с невырож- денными подматрицами матрицы 3@(f). (С вычислительной точки зрения этот путь лишь незначительно отличается от процесса опре- деления ранга матрицы 3&rr(f).) (11.31) Замечание. Важно отметить, что хотя при r<dimf лемма '(11.5) уже неверна, этот факт совершенно не влияет на алгоритм реализации. Например, пусть F— циклическая матрица размера (n X п). Рассмотрим ганкелеву матрицу Зё, определяемую после- довательностью {/, F, F2, ...}. Поскольку Зв реализуется тройкой (F,1,I), ясно, что можно положить N<N'=\, хотя г = п (по определению цикличности). Поэтому для того, чтобы доказать справедливость алгоритма (11.14), не требуется теории модулей. Но, с другой стороны, структурная теория модулей, развитая в § 10.8 и 10.10, довольно полезна для того, чтобы убедиться в воз- можностях предложенного алгоритма.
340 10 Алгебраическая теория линейных систем Все приведенные выше предварительные результаты позволяют поставить один основной вопрос. Предположим, что отображение вход — выход f и соответствующая последовательность {Л1, -42» заданы, но мы ничего не знаем и не предполагаем относительно конечномерности отображения f. (Другими словами, у нас нет воз- можности выполнить шаг 1 алгоритма (11.14).) Предположим, что мы выбрали г (или пару (N, N') произвольным образом, а затем с помощью шагов 2 и 3 алгоритма (11.14) вычислили динамическую систему 2. Каковы же свойства этой системы? И в частности, реа- лизует ли система 2 некоторую часть последовательности {Дь Az, ...}? Является ли эта реализация канонической? Наиболее пол- ный ответ на этот вопрос из всех известных к настоящему времени (1967) дается следующим основным результатом этого параграфа. (11.32) Критерий реализуемости. Пусть {АьА2, ...} — произвольная бесконечная последовательность матриц размера (р X т) над К, и пусть 26— соответствующая ганке лева матрица. Тогда система 2, определенная по формулам (11.16*) — (11.18*), реализует эту после- довательность вплоть до члена Ам, включительно, т. е. уравнение (11.6) справедливо при i= 1, .... Nq тогда (i) и только тогда (ii), когда существуют положительные целые N и N', такие, что: (a)N + N' = Nou (b) rankrank Жлг+i, № ranker,/v+i. , Доказательство, (ii) Необходимость. Пусть матрицы системы 2 удовлетворяют уравнениям (11.16*) — (11.18*), а система реализует конечную последовательность {Аь Д№}. Тогда f rank 26n'+i, n 1 dim/, < dim Z- rank | | dim /„ где последнее неравенство вытекает из леммы (11.12), если учесть, что все элементы матрицы 26ц’+\. n, так же как и все элементы матрицы 26ц', N+l, принадлежат последовательности {Л......Дат}, (i) Достаточность. Заметим, что во втором доказательстве ал- горитма (11.14) мы воспользовались предположением о конечно- мерности отображения f всего один раз — в коммутативной диа- грамме (11.27), где нужно было доказать существование отобра- жений nN: QN+l-*QN и pw,: rr->I\,+1. Условие rank = rank 26n'+i, n означает, что последняя блочная строка матрицы 26n'+i. n линейно связана с предыдущими блочными строками, т. е. линейно зависит от 26ц'ц. Это означает, что выходной сигнал «/(Л/' + 1) можно вы- числить с помощью линейной комбинации значений #(!), .... y(N').
10.11 Алгоритм Б. Л. Хо 341 Поэтому существует отображение Pn- Y^+1 = (vr, у (N' + 1)). Аналогичным образом условие гапк5!?дг'м = rank 3^^', n+i гарантирует существование отображения цх. Тот факт, что эти отображения не нарушают коммутативности диаграммы (11.27), следует сразу из специфического расположения элементов в ганкелевых матрицах. Остается доказать, что при этих условиях система 2, заданная уравнениями (11.16*) — (11.18*), реализует последовательность (Ai, ..., AaJ. Это делается в точности так же, как в шаге 4 вто- рого доказательства алгоритма (11.14), в котором использу- ются лишь описания отображения fN,N и коммутативная диа- грамма (11.27). (11.33) Следствие. Если условия (а) и (Ь) теоремы (11.32) выпол- нены, то система 2, заданная уравнениями (11.16*) — (11.18*), яв- ляется канонической. Доказательство. Система 2 представляет собой действительную (а не частичную) реализацию одного отображения вход — выход, а именно своего собственного отображения. Поэтому система 2 яв- ляется реализацией отображения fz, вычисленного согласно алго- ритму (11.14). Поэтому система 2 каноническая. Утверждение этого следствия далеко не тривиально (см. при- мер (11.40), приведенный ниже). Содержание теоремы (11.32) можно сформулировать более чет- ко с помощью новой терминологии. Будем говорить, что 2 частично' реализует отображение вход — выход тогда и только тогда, когда уравнение (11.6) справедливо для I = 1, ..., Уо’)- Число No назы- вается тогда порядком частичной реализации. Если 2 — частичная реализация отображения f, то f — называется остатком отобра- жения f (относительно системы 2). Ясно, что у каждого отображения вход — выход существуют конечномерные канонические частичные реализации любого поряд- ка N. Для того чтобы доказать это, возьмем произвольные кон- станты Рь ..., р№еК, а затем продолжим частичную последова- тельность {А}, .... AmJ, используя рекуррентную формулу из лем-- мы (11.5). Верхней гранью размерности этой реализации будет,, естественно, min (mN0, pN0). 1) Или можно говорить, что S реализует частично определенное отображен ние вход — выход. Различие между этими двумя точками зрения здесь несу- щественно.
342 10 Алгебраическая теория линейных систем Минимальной частичной реализацией назовем частичную реа- лизацию минимальной размерности. Легко видеть, что «минималь- ность» частичной реализации гарантирует и ее «каноничность». Однако из того, что реализация «каноническая», не следует, что она «минимальна», в действительности мы увидим, что «минималь- ная» реализация необязательно единственна. Пользуясь нашей но- вой терминологией, мы можем сформулировать теорему (11.32) в следующем эквивалентном виде. (11.34) Теорема. Система S, определяемая уравнениями (11.16*) — (11.18*), представляет собой минимальную частичную реализацию порядка No отображения вход — выход f тогда и только тогда, ко- гда No = N + N' и выполняются ограничения на ранги (11.32b). Более того, если последние ограничения не выполняются, то каж- дая частичная реализация отображения f имеет размерность, боль- шую, чем ранг матрицы В одном интересном случае условия (11.32) выполняются авто- матически. (11.35) Предложение. Рассмотрим скалярный случай m = р = 1. Пусть rankj^nn(Z) = «• Тогда уравнения (11.16) — (11.18) опреде- ляют единственную частичную реализацию отображения f, для ко- торой No = 2п, и эта частичная реализация отображения f является минимальной. Доказательство. В данном случае условие (11.32b) тривиально вы- полняется. Поэтому уравнения (11.16) — (11.18) определяют частич- ную реализацию S отображения /, причем dim S rank o^n'n (f) при всех N и N'. Поэтому рассматриваемая частичная реализация наверняка минимальна, что и завершает доказательство. Если условие (11.32b) не выполняется, то минимальная частич- ная реализация отображения вход —выход f может быть не един- ственной, поскольку тогда придется задать новую матрицу Ллы-i, чтобы иметь возможность использовать формулы (11.16*) — (11.18*). Другими словами, матрица ЛЛ+1 определяется необязательно единственным образом из требования минимальной размерности искомой реализации. Если же условие (11.32b) выполнено, но ранг матрицы 26 н'и меньше чем dimf, то, вычисляя реализацию по формулам (11.16*)—(11.18*), мы получаем частичную реализацию, но она может оказаться не слишком хорошей. Однако мы можем по край- ней мере быть уверены, что частичная реализация f не слишком затрудняет реализацию остатка отображения f. (11.36) Предложение. Если для f существует конечномерная реа- лизация, то остаток от частичной реализации отображения f так- же имеет конечномерную реализацию.
10.11 Алгоритм Б. Л. Хо 343 Доказательство. Пусть {Ai, А2, ...} — бесконечная последователь- ность, индуцированная отображением f. Пусть S* — некоторая ча- стичная реализация отображения /, и пусть {Bi,B2, ...} — бесконеч- ная последовательность, индуцированная /2,. Тогда остаток f —f2, индуцирует бесконечную последовательность {0.........0, Д^+i — — Влго+1, • • Поскольку по предположению как f, так и f2, конеч- номерны, лемма (11.12) пбказывает, что rank ^n'n (f) dim f и rank ^,JV(f2.)< dim f2. при любых положительных W и JV'. А так как Зв есть аддитивный функционал, определенный на последовательностях, индуцирован- ных f, имеем rank Зв^ (f - f2.) = rank N,N (f) - 3SN,N (f2,)j < < rank 3$N,N (f) + rank Зв^ы (f2.) < dim f + dim f2. < oo. Другое доказательство, использующее лишь понятия теории си- стем, схематически показано на рис. 10.4. Предлагаем читателю самостоятельно получить его словесную формулировку. Рис. 10.4. Графическое доказательство предложения (11.36). Здесь S — реализация отображения f; 2* — частичная реализация отображения Е а система в большой рамке — реализация отображе- НИЯ (f — fx»). К сожалению, решить, полезна ли частичная реализация ото- бражения f или нет, далеко не просто. С одной стороны, ее можно в содержательном смысле считать полезным приближением мини- мальной реализации отображения f (см. пример (11.40) ниже). Но с другой стороны, рассмотрим дробно-рациональную передаточную матрицу W(z) = Wl(z) + z~hW2(z)
344 10 Алгебраическая теория линейных систем (см. предложение (11.37) ниже). Выберем h достаточно большим, например намного больше степени общего знаменателя матрицы Wi. Тогда второе слагаемое не скажется на 3@„, degi^ < h, и, следовательно, с помощью формул (11.16) — (11.18) мы построим минимальную реализацию Si передаточной матрицы W\. Но так t как Г (г) - (г) = «7 (г) - «7, (г) = z~hW2 (г), л I ясно, что минимальная реализация остатка будет иметь размер- » ность, равную dimz~hU72(z). (Упражнение-, докажите это с по- < мощью теории инвариантов из § 10.10.) | Более глубокое исследование теории минимальной реализации \ частичных отображений вход — выход содержится в работе Кал- f мана [1968] и в приложении В. 1 Займемся теперь вопросом о применениях алгоритма Б. Л. Хо. ) Прежде всего отметим тривиальный, но интересный факт. (11.37) Предложение. Пусть {Л^Лг, ...} — бесконечная последова- | тельность, индуцированная отображением вход — выход f по фор- ) муле (11.1). Тогда передаточная функция, соответствующая ото- I бражению f, может быть вычислена по формуле 1-1 ! Доказательство. Это просто переформулировка исходного опреде- ления. Приведенный результат важен, поскольку показывает, что фун- даментальные параметры {ЛьЛ2, ...}, необходимые для алгоритма реализации, можно получить и из передаточной функции отображе- ния f. Для этого нам нужно представить Wf сходящимся степей- i ным рядом в окрестности бесконечности, а Л£ будут как раз коэф- фициентами этого ряда. Таким образом, алгебраические вычисле- ния, предписываемые алгоритмом Б. Л. Хо, остаются одними и теми же, независимо от того, пользуемся ли мы данными из частотной (117) или временной (/) области. Оказывается, что алгоритм остается в точности таким же, даже если перейти от систем с дискретным временем к системам с не- прерывным временем. Набросаем общую линию рассуждений. Прежде всего пусть К. = R. Импульсная характеристика £(•) ста- ционарной вещественной линейной системы с непрерывным вре- менем описывается формулой 1 HeptG, если /^0, ( 0, если t < 0
10.11 Алгоритм Б. Л. Хо 34$ (за подробностями отсылаем к § 10.13). Легко видеть, что £(•) представляет собой вещественную целую функцию на интервале [0, оо], допускающую разложение в степенной ряд i-0 где А{ удовлетворяют уравнению (11.6). Таким образом, основная информация для алгоритма Б. Л. Хо может быть получена в ре- зультате вычисления производных, от £(•) в точке t = 0. (Это не слишком практично, но к этому вопросу мы еще вернемся в заме- чании (11.38) ниже.) Передаточная матрица стационарной веще- ственной линейной системы с непрерывным временем удовлетво- ряет уравнению W(s) = H(sI-F)~1G, которое совпадает с соответствующим выражением для системы с дискретным временем. Поэтому необходимые для алгоритма дан- ные можно получить и в частотной области. (11.38) Замечание. Поскольку алгоритм преследует цель обеспе- чить равенство первых No членов последовательности {ЛьА2, ...}, из предыдущего ясно, что с эвристической точки зрения этот алго- ритм обращает основное внимание на высокочастотные свойства отображения вход — выход. Но это создает большие практические трудности, связанные с присутствием измерительных помех и низ-, кочастотных систематических ошибок. Все эти проблемы хорошо известны и давно опубликованы (см. работу Калмана [1958], в ко» торой затрагиваются тесно связанные с этим вопросы), но они ни» когда еще не были тщательно исследованы. (11.39). Замечание. Алгоритм Б. Л. Хо можно также рассматри- вать как средство получения дробно-рациональной аппроксимации (сходящихся или формальных) степенных рядов, гарантирующее совпадение первых No членов разложения. Некоторые алгебраиче- ские черты нашего метода в действительности связаны с классиче- ской теорией аппроксимаций Падэ (см. работу Хо и Калмана [1970] и приложение В). Закончим этот параграф одним численным примером. (11.40) Пример. Рассмотрим отображение вход — выход, индуци- рующее последовательность (11.41) 1, 1, 1, 2, 1, 3, ?, Поскольку матрица Зёц есть матрица полного ранга, реализация первых двух членов имеет вид Si = (1,1,1),
346 10 Алгебраическая теория линейных систем и соответствующая бесконечная последовательность выглядит сле- дующим образом: 1, 1, 1, 1............. Последовательность отстатка имеет вид (11.42) 0, 0, 0, 1, 0, 2, ?- 1, ??- 1.......... Ганкелева матрица этого ( эстатка размера (4 X 4) имеет следую- щий вид: -ооо 1 - а&44 — 0 0 1 0 0 10 2 . 1 0 2 ?-1. и независимо от выбора (?) она имеет полный ранг. Поэтому в силу предложения (11.35) «последовательность остатка (11.41) имеет 4-мерную реализацию. Поскольку каждая реализация после- довательности (11.42) индуцирует А7 = ? — 1 и А» = ?? — 1, то су- ществует ровно оо2 неизоморфных минимальных реализаций по- следовательности (11.42). (Одновременно мы имеем пример ча- стичной последовательности с No = 2п и 3@nn < п, минимальная реализация которой неединственна.) Теперь мы знаем, что после- довательность (11.41) может быть реализована системой, размер- ность которой не выше 5. Сравним это утверждение с предло- жением (11.36) и его доказательством. На самом же деле для последовательности (11.41) имеется минимальная трехмерная реа- лизация. Действительно, для последовательности (11.41) матрица имеет полный ранг. Подходящая пара (Р, М), удовлетворяющая условиям (11.15), имеет следующий вид: -1 -Г 0 1 1 0- Тогда формулы Г 1 F = 0 .1 (11.16) — (11.18) позволяют вычислить 1 01 Г1 *) Соответствующая передаточная функция в данном случае будет равна (г2 + 2г + I)/!*3 + г2-г —2).
10.12 Полугруппы и простые линейные конечномерной системы 347 Для этой реализации ? = 2, ?? =3,. ??? = 5, ???? = 2, ?5 = 9. (Непросто догадаться, что именно так выглядит естественное про- должение последовательности (11.41)!) Наконец, отметим, что если воспользоваться формулами (11.16) — (11.18) для последователь- ности (11.41) при г = 2, то получится, например, F = /, G = [J , Я = [1 0], а все А{ окажутся равными 1, так же как и в случае г = 1. Таким образом, если условие (11.32b) не выполняется, то система, скон- струированная согласно формулам (11.16) — (11.18), может ока- заться и не канонической, и не частичной реализацией. (11.43) Упражнение. Докажите, что минимальная реализация бес- конечной последовательности 1, 2, 3, 4, ... двумерна. (11.44) Упражнение (простое). Реализуйте последовательность Фи- боначчи 0, 1, 1, 2, 3, 5, 8, 13, ... . (11.45) Упражнение (трудное). Докажите, что последовательность простых чисел 2, 3, 5, 7, 11, 13, ... не имеет конечномерной реализации. 10.12 Полугруппы и простые линейной конечномерной системы Этот параграф носит чисто иллюстративный характер. В нем мы рассмотрим на примере задачу вычисления простых в смысле Крона — Роудза. Поскольку их теория приложима только для ко- нечномерных систем, нам потребуется рассматривать только такие поля К, для которых X = Лп — некоторое конечное множество. Итак, предположим, что К — конечное поле. (С теорией конечных полей можно познакомиться по книге Альберта [1956].) Первый шаг состоит в определении полугруппы Ss линейной системы S. А для этого нам потребуется согласовать между собой некоторые понятия теории автоматов и теории модулей. Начнем с напоминания некоторых определений § 7.2. Как обыч- но, будем обозначать входные и выходные алфавиты через U и У. В теории автоматов отображением вход — выход называется f: V* -► У, где U* — свободная полугруппа над U (т. е. множество всевозможных последовательностей символов из U с операцией сшивания в качестве умножения). Отношение эквивалентности Май-
348 10 Алгебраическая теория линейных систем хилла, sf, индуцируемое отображением f в U*, определяется усло- вием (12.1) <o==fc/ тогда и только тогда, когда f(ao©op) = /;(ao(i)'op) при любых a, ре!/’. Множество Sf = {{со}/: со е (/*} классов эквивалентности Майхилла, индуцируемое f, является полугруппой с умножением, определен- ным следующим образом: (12.2) {<o}f •{«/}/ = {со ° <o'}f. Это Sf мы называем полугруппой отображения f. Аналогично мы определим структуру полугруппы на fl = Am[z], воспользовавшись в качестве умножения операцией (12.2) на множестве Q/s=s/. Если система S есть каноническая реализация отображения f, то необ- ходимо положить S2 = S/2- Любое другое определение не будет согласовываться с существованием взаимно однозначного соответ- ствия между отношениями вход — выход и их минимальными реа- лизациями. В общем случае естественно выражать S2 через функ- ции перехода в пространстве состояний системы S (но это обсуж- дается ниже). Для наших целей вместо того, чтобы рассматривать кольцо обычных многочленов A[z], удобнее рассматривать кольцо много- членов формальной степени, или просто формальные многочлены, ' которое мы также будем обозначать через К[г]. Это позволит нам ’ использовать и многочлены, у которых главный коэффициент ра- вен нулю. Точнее говоря, мы рассматриваем следующую ситуацию, j Теперь K[z] есть множество пар (л, d), где л — обычный многочлен, ? а d = d„, формальная степень многочлена л, есть произвольное целое число d deg л, где deg л — обычная степень многочлена л. i Эти пары образуют кольцо со сложением и умножением, исполь- зующими главные члены даже тогда, когда их коэффициенты рав- ны нулю, (л, d) + (л', d') = (л + л', max (tZ, d'))> (л, d) • (л', d') = (ял7, d + d'). Читателю следует формально проверить выполнимость аксиом кольца (см. аксиомы (А.1) и (А.2) из приложения) >). Множество A[zj таких формальных многочленов изоморфно мно- жеству А* всевозможных конечных цепочек (произведений), со- ставленных из символов К- Каждой цепочке и длины /и из К* можно поставить в соответствие некоторый формальный много- •J Другой подход заключается в том, чтобы задать на U* структуру век- ( горного пространства, а затем рассматривать I/* как пространство входных воз- действий некоторой линейной системы.
10.12 Полугруппы и простые линейной конечномерной системы 349 член (лх, Zx—1),коэффициентами которого являются элементы х. (В частности, цепочка из I нулей определяет формальный много- член (0,1—1).) Этот изоморфизм множеств распространяется и на структуру полугруппы: умножение в К* выражается через умно- жение в k[z], согласно соотношению (12.3) (я, d)°(«', d') = (zrf'+1x + ?i', d + d'+l). (Единицей относительно операции сшивания является элемент (О,—1), но это нам понадобится только при доказательстве экви- валентности утверждений (12.7) и (12.9).) Наконец, /n-мерный век- тор формальных многочленов, естественно, определяется как ' Ob d) (лт, J) где d^degn/, «=1, .... т. (12.4) Определение. Структура полугруппы в Q = Km[z]« (Km)*, равная свободной полугруппе в Кт, определяется следующим об- разом: (а) рассматривается как множество m-мерных векторов формальных многочленов; (Ь) на Km[z] определяется операция умножения (сшивание) типа (12.3). Для заданной динамической системы 2 рассмотрим различные связанные с ней объекты (й, X, q>, F, G, (Для упрощения обо- значений мы будем опускать нижний индекс 2 каждый раз, когда это не будет вносить путаницы.) Определим сначала семейство отображений вход — выход где fx: Q-+X: (®, d)i—><р(1; — d, х, (со, </)). (Напомним, что ф есть переходное отображение (1.1) системы 2.) Семейство ZF показывает всевозможные виды действия й на 2. Определим отношение ss.gr , потребовав, чтобы оно совпадало с s=tjc при любых Тогда можно сформулировать следую- щее определение. (12.5) Определение. Полугруппой Ss динамической системы 2 на- зывается полугруппа классов эквивалентности йг/^^r с опера- цией сшивания в качестве умножения. (12.6) Упражнение. Докажите, что Ss = Sf, если 2 — минималь- ная реализация отображения /.
350 10 Алгебраическая теория линейных систем Определение (12.5) является содержательным для произволь- ных динамических систем. Мы же хотим выяснить, к каким упро- щениям можно прийти, если предположить, что: (1) система 2 ли- нейна (а также конечномерна и с дискретным временем) и (2) про- странство состояний системы 2 конечно. По-видимому, наиболее убедительный подход решению этой задачи состоит в вычислении Ss с помощью уравнений перехода в пространстве состояний (1.5). Утверждение co^^v, с абстрактных позиций эквивалентное следующему: fx (а ° со ° 0) — fx (а ° v ° 0) для всех а, 0 е Q, все х е X, с помощью уравнений (1.5) может быть приведено к виду (12.7) Г^+1[^ш+1(^а+1х + Ха) + хш] + Хр = = Fdp+1 [F'v-1-’ (f'V’x + Ха) + Xv] + Хр, где (12.8) хш= 2 Упрощая выражение (12.7), мы получаем, что (12.9) тогда и только тогда, ( Х(д Ху, когда ( . .. ... I F“a+ х = Fdv+1x для всех хеХ. Обозначение, принятое в уравнении (12.8), с содержательной точки зрения выражает следующее: хш есть состояние, устанавливаемое входным воздействием (©, d) в момент времени /= 1. Совершенно ясно, что xw зависит от со, но не зависит от d®, если da > deg co. (С точки зрения теории систем это очевидно: пока входное воздей- ствие остается нулевым, нулевым будет и состояние системы, на- ходившейся в нем до этого.) Но в соответствии с соотношением (12.9) отображение ©i—>xffl постоянно на классах эквивалентности {со}^-. Поэтому существует строго определенное отображение (12.10) р: S->Z: Для того чтобы найти место этому соответствию в теории авто- матов, читателю следует убедиться, что р есть просто проекция ~ класса эквивалентности Майхилла на класс эквивалентности Не- рода, содержащий первый из этих классов. Воспользуемся теперь предположением о конечномерности про- странства состояний системы 2. Отметим прежде всего, что мини-
10,12 Полугруппы и простые линейной конечномерной системы 351 (12.12) С: мальный многочлен ф такой системы 2 имеет однозначное пред- ставление вида ф (z) — zrQ (z), где 0 (0) 0, г 0. Воспользуемся затем одним фактом теории конечных полей, со- гласно которому для любого многочлена 0 е K[z], где К конечно, существует такое q^Z, что 0| (z«—1). Наименьшее такое q яв- ляется периодом многочлена 0 и обозначается через р(0) = Р. Но тогда, согласно теореме Кэли — Гамильтона, (12.11) рь+Р = р для всех k^r. Соотношение (12.11) индуцирует конечную циклическую абелеву полугруппу С с индексом г и периодом Р, записываемую аддитивно (см. § 8.2, в котором аналогичный результат получен без ссылки на конечность поля). Другими словами, полугруппа С определяется следующим образом: элементы: 0, 1, ..., (P + r — 1); сложение: обычное сложение по модулю Р, так что Р + г = г; наибольшая подгруппа: г, г+1, ..., (P + r— 1). Если теперь a, b^Z а а = b в смысле соотношения Р + г = г, то мы будем писать, что а = b (mod С). Тогда, согласно определению (12.9) и соотношению (12.11), можно определить отображение (12.13) <т: S -> С: {со}^ 1 + ^ (mod С), или в более симметричных обозначениях 1®}^-* *& Поскольку отношение (12.9) определяет эквивалентность, ста- новится ясным, что множество S изоморфно множеству X х С и что этот изоморфизм устанавливается отображением Р X а: {®}^г1 > (^®> А#)* Интересно выяснить, можно ли использовать этот изоморфизм так- же и для того, чтобы установить структуру полугруппы в S, т. е. можно ли задать структуру полугруппы в S с помощью структуры абелевой группы в X (пространстве состояний) и структуры цик- лической полугруппы в С. Прежде всего отметим, что определение сшивания (12.3) пока- зывает, что Хв>оу==Р X® + Xvl во-вторых, /®ov = daov + 1 = do> + dy + 2 = /® + ly (mod С).
352 10 Алгебраическая теория линейных систем Таким образом, умножение в Ss можно представить в виде (12.14) (xv, Zv) ° (xa, ZJ = (F1®xv + х&, lv + Zj. Это показывает, что S есть полупрямое произведение X на С с ото- бражением F в качестве гомоморфизма связи (см., например, § 7.3 настоящей книги или § 6.5 книги Холла [1959]). Таким образом, мы доказали *) следующую теорему. (12.15) Теорема. Полугруппа Ss линейной конечномерной динами- ческой системы 2 с дискретным временем над некоторым конечным полем является полупрямым произведением Ss = Xs X f2Cs, определенным согласно соотношению (12.14), где Cs— некоторая конечная циклическая полугруппа с периодом p(0s) и индексом rs, zrs0s = xs; здесь —минимальный многочлен системы 2, a p(0s) —период многочлена 0s. (12.16) Следствие. Если detfs ¥=0, то Cs есть циклическая груп- па порядка р(ф2) и Ss также является группой. Доказательство. Так как det Fs 0 гарантирует, что rs = 0, ясно, что Cs есть некоторая циклическая группа. У каждого элемента Ss есть обратный Поэтому Ss является группой. Теперь мы в состоянии установить связь с теорией декомпози- ции, развитой в гл. 7 и 8. (12.17) Упражнение. Реализуйте линейную систему 2 с конечным пространством состояний в виде конечного автомата, представляю- щего собой последовательное соединение факторполугруппового ав- томата, соответствующего Ss/Xs, и следующего за ним автомата нормальной подгруппы, соответствующего Xs (см. § 9.1). (12.18) Замечание. Упражнение (12.17) приводит к довольно «не- естественной» реализации линейной системы. И это неудивительно, поскольку основная цель теории Крона — Роудза состоит в фор- мулировке и доказательстве теорем существования последователь- но-параллельных реализаций, которые почти всегда оказываются неминимальными. (Не минимальна ли реализация из упражнений ') Этот результат был впервые получен, по-видимому, Зейгером (поль- зовавшимся непосредственно теорией групп) в неопубликованном отчете (ноябрь 1964 г.),
10.13 Реализация отображений вход — выход с непрерывным временем 353 (12.17)?) В этом смысле теория модулей, гарантирующая мини- мальность реализаций, безусловно превосходит теорию Крона — Роудза. Но, с другой стороны, последняя применима и для нели- нейных систем, а это во много раз труднее. (12.19) Упражнение. Докажите, что простые элементы конечной абелевой группы являются циклическими группами Z/pZ, где р простое. (12.20) Упражнение. Докажите, что простые элементы конечной циклической полугруппы являются в точности такими же, как и простыв конечной циклической группы плюс ее единицы (см. лемму (2.3) из гл. 9). (12.21) Упражнение. Докажите, что простые элементы полупрямого произведения содержатся в объединении простых элементов сомно- жителей. С помощью этих фактов можно доказать основной результат настоящего параграфа. (12.22) Теорема. Простые элементы линейной конечномерной ди- намической системы (с дискретным временем) над конечным полем являются циклическими группами с простыми порядками. (12.23) Следствие. Каждая циклическая группа простого порядка является простым элементом некоторой системы. Доказательство. Достаточно положить К « Z/pZ, где р простое и n= 1, как X становится абелевой группой порядка р и, следова- тельно, простым элементом в смысле теории Крона — Роудза. (12.24) Замечание. Все результаты этого параграфа зависят лишь от двух простых фактов: (1) выполняется уравнение перехода в про- странстве состояний вида x(t + 1) = Fx(t)-, (2) множество X яв- ляется конечным. А так как мы нигде не использовали особые свой- ства конечных полей, ясно, что все результаты этого параграфа сохраняют свою силу и в том случае, когда U есть произвольное (а не обязательно коммутативное) конечное унитарное кольцо. 10.13 Реализация нестационарных отображений вход — выход с непрерывным временем В этом параграфе мы будем рассматривать нестационарные си- стемы с непрерывным временем и заниматься их теорией реализа- ции. Поначалу это потребует совершенно другого подхода, чем для систем с дискретным временем, но к концу наше исследование бу- дет все больше и больше напоминать теорию, развитую в § 10.6. Напомним, как в § 2.2 определялась конечномерная линейная гладкая система S над полем вещественных чисел R. В дифферен- 12 Зак. «а
354 10 Алгебраическая теория линейных систем циальной форме система 2 задавалась векторными уравнениями (13.1) % = F(t)x+G(t)u(t), (13.2) y(i) = Н (t)x(t), где t е Т = R, хе Rn, ue Rm, r/e R?, a F(-), <?(•)» #0 и **(•) ~ вещественные непрерывные функции1), причем прилагательное «гладкое» будет всегда свидетельствовать о принадлежности рас- сматриваемого объекта к классу q^O. В пространстве состоя- ний система~2 описывается уравнением (13.2) и уравнением t (13.3) х(/) = ф(/; т, х, «(‘)) = Ф(/, т)х + j Ф(/, s) G (s)u(s)ds, т где Ф (% •) есть переходная матрица (отображение), соответствую- щая F('). Мы будем по-прежнему пользоваться обозначением S= (F(•), G(•), Н(•)). На протяжении всего параграфа мы рас- сматриваем лишь вещественные системы с непрерывным временем и, следовательно, не будем специально оговаривать это каждый раз. Нас не будет также особо интересовать случай бесконечно- мерной системы (п — оо). В связи с этим пространства Q и Г целесообразно определять так: = {векторное пространство всевозможных непрерывных функ- ций ых(-): (— оо, т]н-»Rm: t*-*-ux(t) с компактным носителем); Гт = {векторное пространство всевозможных непрерывных функций ух(-): [т, oo)->Rp: t^yx{t)}. Число те R играет тогда роль «настоящего времени» или «началь- ного времени». (Мы не можем теперь пользоваться нормировкой г = О, так как рассматриваемая система нестационарна.) Как пра- вило, мы будем использовать символ t для обозначения будущих моментов времени и символ s— для прошлых. (13.4) Определение. Причинным линейным гладким отображением вход — выход fcx (линейной системы 5) в нулевом состоянии отно- сительно настоящего времени т называется линейное отображение fv йт-*Гг их(-)>-^ух(-), *) Многие результаты этого параграфа допускают интересную модификацию в случае, когда 2 определена на подинтервале множества Т. Оставляем обсу- ждение этих возможностей на усмотрение читателя.
10.13 Реализация отображений вход —выход с непрерывным временем 355 определенное для каждого те 7 с помощью соотношения т (13.5) f Le(t, s)их(s)ds, — co в котором функция Lc: (Т X Т)с-> {матрицы размера р X иг) непрерывна по обоим аргументам, а (Т X Т)е = {(/, s): />s}. Ото- бражение Le называют причинным импульсным отображением (ха- рактеристикой) соответствующей линейной системы. Отметим, что это определение, так же как и определение из § 10.2, автоматически включает в себя требование причинности (прошлое влияет на будущее, а не наоборот). Принятая здесь тер- минология существенно отличается от технической тем, что сейчас мы не требуем выполнения так называемого «условия причинности» (13.6) Lc(t, з) = 0 для всех t<s, а предпочитаем считать, что Lc вообще не обязательно определено на Т X Т — (Г X Т)с и что значения Lc вне (Т х Т)е (если они определены) не влияют на отображение вход — выход f" (см. уравнение (13.5)). Впоследствии мы увидим, что устанавливать условия причинности с помощью уравнения (13.5) удобнее, чем с помощью (13.6). Заметим еще, что нижний предел —оо интеграла (13.5) есть не более чем условное обозначение. Ведь, согласно определению QT, в действительности этот интеграл всегда опреде- ляется на компактном интервале. Подчеркнем еще раз: наше определение отображений вход — выход fx специально выделяет особую роль настоящего времени т, которое раньше можно было нормировать в виде т = 0. Предо- ставляем читателю самостоятельно вывести все формулы, описы- вающие поведение системы и обобщающие формулы § 10.1—10.12. Точно таким же образом, но обратив направление времени, можно определить «антипричинные» отображения вход — выход. Отсылаем читателя к работе Вейсса и Калмана [1965], в которой он найдет исходные понятия, и к работе Калмана [1969], в которой дан более полный анализ. Если (fj: ге?) есть семейство отображений вход—выход для нулевого состояния, соответствующих системе S, определенной уравнениями (13.2) и (13.13), то простые выкладки показывают, что (13.7) Lcs(M) = tfs(0<I>s(M)Gs(s) на (Т X Т)е, ‘ 12*
SS6 10 Алгебраическая теория линейных систем где Lx — причинное импульсное отображение системы S. Будем ; говорить, что 2 реализует Lc (или семейство те Г}) тогда и только тогда, когда Lx = Lc на (Т X Т)?. В частности, система 2 реализует единственное отображение вход — выход fcx тогда и . только тогда, когда L^, = LC при всех t'^-x'^s. Теперь без труда можно сформулировать следующую хорошо известную теорему. (13,8) Критерий существования (см. теорему 1 работы Калмана • [1963с]). Причинное импульсное отображение можно реализовать конечномерной линейной гладкой динамической системой (i) то- гда и (ii) только тогда, когда существуют непрерывные отобра- . жения Р(-): Т-+{матрицы размера р X п}, Q(-): Т-> {матрицы размера пХш}, такие, что з (13.9) Lc{t,s) = P(t)Q(s) для всех t^-s. 5 Доказательство, (i) Если справедливо уравнение (13.9), то 2 = j = (0, Q(«), Р(-)) может служить такой реализацией. Действитель- S но, поскольку переходная матрица Р(-) = 0 определяет тождествен- ное отображение, условие (13.9) в этом случае эквивалентно уело- • вию (13.7). (ii) Если конечномерная система 2 реализует Lc, то справед- ливо соотношение (13.7). Если же положить P(t) — Нх. (/)Фх (t,r), a Q (s) = Фх {г, s) Gx (s) (где геТ, причем г произвольно, но фик- сировано), то из условия (13.7) в силу свойства композиции пере- ходных отображений следует справедливость уравнения (13.9). (13.10) Определение. Канонической (или естественной) реализа- цией (единичного) причинного линейного гладкого отображения вход — выход для нулевого состояния называется конечномер- ная линейная гладкая динамическая система 2, реализующая fcx и, кроме того, являющаяся полностью достижимой и полностью наблюдаемой при t = т. Аналогично система 2 является канонической реализацией Lc тогда и только тогда, когда она обладает перечисленными выше свойствами при каждом геТ. Читателю следует теперь вернуться к § 2.2 и 2.6, чтобы вспом- нить определения и свойства понятий «достижимости» и «наблю- даемости». Так же как и раньше, конечномерная каноническая реализа- ция S отображения fcx отвечает канонической факторизации
10.13 Реализация отображений вход—выход с непрерывным временем 357 fx=*hx° gx, где (13.11) % : их(>)*~* j Фх(т, s) G^(s)ux(s)ds\ — оо (13.12) hx: Х2->Гх, : х*-+ух(-)-. [т, oo)->Rp, : /ь-»Ях(/)ф2(/, т)х. (13.13) Упражнение. Убедитесь в том, что утверждение о сюръек- тивности gx эквивалентно утверждению о полной достижимости системы S в момент т, а утверждение о биективности Лт эквива- лентно утверждению о полной наблюдаемости в момент временит. Поскольку теперь мы не предполагаем стационарности системы, нам потребуется более общее определение эквивалентности си- стемы. При установлении эквивалентности мы будем обращать вни- мание на следующие свойства системы: ее масштаб времени, при- чинное импульсное отображение, линейность и гладкость. Эти тре- бования приводят к следующему определению. (13.14) Определение. Две n-мерные линейные гладкие динамиче- ские системы S и S алгебраически эквиваленты на открытом ин- тервале J аТ тогда и только тогда, когда существует такое диф- ференцируемое линейное отображение Л(-): /->-{матрицы размера п X п}, что det Л (t) 4= 0 на J, а биективное соответствие (т, х) (т, А (т) х) = (т, £) согласуется с структурами 2 и 2, т. е. соотношения (а) Ф2(/, 5) = Л(0Ф2(Лз)Л-‘(5), (b) (/) = А (0 (0 Л"1 (0 + А (/) Л’1 (/), (13Л5) (с) С2(0»Л(0С2(0, (d) выполняются при всех (f, s) e(Jx J)ccz (Т X Т)е. Такая эквивалентность называется стационарной тогда и толь- ко тогда, когда Л (•) = const. Заметим, что соотношения (13.15) являются естественным обоб- щением уравнений (1.6) и (1.7). (13.16) Замечание. Термин «алгебраическая эквивалентность» дол- жен указывать'на то, что речь идет об относительно слабом виде
358 10 Алгебраическая теория линейных систем изоморфизма. Алгебраическая эквивалентность не сохраняет струк- туру нормированного пространства состояний, поскольку А(-) мо- жет быть и неограниченным (если только J некомпактно). Норми- рованная алгебраическая эквивалентность предполагает наличие алгебраической эквивалентности и выполнения условий IIA (OIKci и | Л-1 (0|<с2 на J, где Ci и cj не зависят от J. Без этой более сильной эквивалентности не гарантируется сохранение свойств внутренней устойчивости (см. Калман [1962b]; Сильверман, Андерсон [1968]). Здесь же мы не бу- дем более заниматься этим вопросом. Отношения (13.15) сразу показывают, что (13.17) (0 Ф2 (/, s) (s) = (0 Ф2 (Л s) Gs (з) для всех t, s е= J. Отсюда в качестве частного случая получается следующее пред- ложение. (13.18) Предложение. Причинные отображения вход —выход и причинные импульсные отображения инвариантны относительно алгебраических эквивалентностей на Т. Как уже отмечалось в § 10.6, первый важный результат тео- рии реализации имел форму следующей теоремы. (13.19) Первая теорема единственности (Калман [1963с], теорема 7 (ii)). Пусть Б и Б есть две любые (конечномерные) канонические реализации семейства те/} причинных отображений вход — выход, где J с. Т есть открытый промежуток. Тогда системы 2 и Б алгебраически эквивалентны на J. Короче говоря, каноническая реализация единственна с точностью до ал- гебраической эквивалентности. В приложении В приводится первое доказательство этой тео- ремы, полученное весной 1962 г. автором и нигде не публиковав- шееся раньше. Оно основывается непосредственно на свойствах до- стижимости и наблюдаемости. Для удобства мы приведем здесь также и короткое современное доказательство в духе § 10.6. Доказательство теоремы (13.19). Прежде всего заметим, что тео- рему достаточно доказать для частного случая F^ (•) = 77^(*) = 0. Это вытекает из свойства транзитивности алгебраической эквива- лентности и следующего хорошо известного факта. (13.20) Лемма. Каждая конечномерная линейная гладкая динами- ческая система Б алгебраически эквивалентна на Т системе Б,
10.13 Реализация отображений вход — выход с непрерывным временем 359 у которой (•) = 0. Изоморфизм, этих двух систем задается соот- ношением Л(-) = Фх (г,*), где г^Т произвольно, но фиксировано. Если Fs (•) = 0, то система 2 называется нормальной. Доказательство леммы. Согласно хорошо известной формуле для сопряженной линейной дифференциальной системы, Л(*) удовле- творяет следующему дифференциальному уравнению: -^-Фх(г, 0 = Фх(г. Отсюда, очевидно, что Д(-)еС’, а согласно условию (13.15b) имеем Fg (•) = 0. Доказательство леммы окончено. Предположим теперь, что 2 и 2 нормальны. (Читателю может быть полезно отказаться от использования леммы (13.20) и по- вторить нижеследующие рассуждения, учитывая множитель Ф(6 0-) Если система 2 нормальная и каноническая, то для fx суще- ствует каноническая факторизация относительно Х? при каждом г s Л Согласно предположению о полной достижимости в момент времени т, существует такое х' < т, зависящее от т, что любое событие (т, х) является достижимым из « 0). (См. теорему (2.24) из гл. 2.) Поэтому отображение т : «%(-)|-*х = J Gs(s)«t(s)ds и' является сюръективным. В свою очередь предположение о полной наблюдаемости в момент времени т гарантирует, что если „ Ях(0х = 0 для всех /а[т, оо), 4 то х = 0. (См. определение полной наблюдаемости в § 2.6.) По- этому отображение h%’. Xi~ : хь-*йт(-): [т, оо)—>R₽, : /|->Я2(/)х является биективным. Наконец, легко видеть, что (ср. с доказательством предложения (13.18)), и наше утверждение доказано. Итак, системы 2 и 2 определяют две канонические факториза- ции hcx ° gcx = hcx ° — fx относительно векторных пространств Х%
360 10 Алгебраическая теория линейных систем и ^2- Согласно лемме (6.8), существует такой изоморфизм аг, что (13.21) & = <М£, и (13.22) 'hx°ax = hx. При каждом т изоморфизм ат может быть представлен неко- торой постоянной матрицей Ах. В связи с этим соотношения (13.21) и (13.22) эквивалентны следующим: (13.23) G^(s) = AxGs(s) для всех ss(- оо, т], все те/ и (13.24) (/) Ах = Я2(0 для всех t е [т, оо), все те/. В действительности же отображение Ах постоянно при всех те!. Для того чтобы доказать это, рассмотрим, например, урав- нение (13.24). Выберем произвольное ae J, такое, что о <т. Тогда Н-% (t)(Ax — Ла) = 0 для всех t е [т, оо). Если Ах Ад, то найдется такое х ¥= 0, что х' = (Ат— Лст)х=£0. Но тогда Н-% (f)xr = Она [т, оо), а это противоречит условию полной наблюдаемости системы S в точке т. Таким образом, Ат постоянно при любом т > о и os J, так что Ах постоянно на всем множе- стве J. Поскольку А постоянно, оно, очевидно, принадлежит к классу С1. Но в наших предположениях условия (13.15а) и (13.15b) три- виальны, а условия (13.15с) и (13.15d) совпадают с уравнениями (13.23) и (13.24), что и доказывает теорему (13.19). К сожалению, теорема (13.19) не дает исчерпывающего реше- ния задачи реализации. (Такой же вывод, однако, можно получить и из теоремы 8 работы Калмана [1963с].) Причина состоит в том, что в классе гладких динамических систем может не существовать канонической реализации всего семейства [fx: те/]' Это стано- вится ясным даже из простейших примеров. (13.25) Пример. Рассмотрим следующую импульсную характери- стику: „ „ ( is для Lc(t,s)=>\ А .С ' (0 для f > s 0. Соответствующее семейство {/*: те J) может быть реализовано канонической системой S = (0, I, f) на интервале 1 = (0, оо). В то же время ни одна реализация этого семейства не может быть ка- нонической на интервале Г *= (—е, 0) (в > 0, а в остальном про- извольно), если не считать системы (0, 0, 0). Это следует из того,
10.13 Реализация отображений вход ««выход с непрерывным временем 361 что, поскольку Lc тождественно равно нулю на (J' X J')e, в любой реализации положительной размерности каждое достижимое со- стояние должно быть ненаблюдаемым, а каждое наблюдаемое — недостижимым. Одновременно с этим, поскольку Lc(t, •) =# 0, на интервале (0, оо) не существует нульмерной реализации этого се- мейства. (13.26) Замечание. Единственная возможность построения доста- точно стройной теории реализации, не делающей специальных пред- положений относительно Lc, состоит в обобщении понятия динами- ческой системы таким образом, чтобы размерность ее пространства состояний могла меняться во времени. Можно показать, что в об- щем случае такие системы нельзя описывать дифференциальными уравнениями, определенными на всем Т = R, даже если допустить использование обобщенных функций (дельта-функций) в качестве коэффициентов уравнения. Этот вопрос более глубоко рассматри- вается в работе Калмана [1969], хотя исследование соответствую- щих проблем далеко не закончено. Для того чтобы понять, почему дифференциальное уравнение может не подойти в качестве канонической реализации причинного отображения вход — выход, заметим, что понятие причинности вно- сит асимметрию по отношению ко времени, никак не учитываю- щуюся в определении дифференциального уравнения. (Решения обыкновенных дифференциальных уравнений всегда существуют (если вообще существуют) в любом открытом интервале, содержа- щем начальный момент времени т; см. также замечания, следую- щие за теоремой (2.10) гл. 2.) Эта нетривиальная ситуация вызвала много путаницы в литера- туре, вышедшей в свет в период с 1963’ по 1967 г. Для того чтобы гарантировать существование канонических реализаций в классе гладких динамических систем, нам придется отказаться от требо- вания причинности. В соответствии с первыми попытками в этом направлении (см. работу Вейсса и Калмана [1965]) примем сле- дующие определения. (13.27) Определение. Весовой характеристикой L называется про- извольное непрерывное отображение L: Т X Т -> {матрицы размера р X т}. Весовой характеристикой Lx конечномерной линейной гладкой динамической системы S называется отображение Lx: (t, а)*->Я2(/)Ф2(/, s)G2(s). Реализацией весовой характеристики L называется любая ли- нейная гладкая динамическая система S, такая, что Lx = L. (Гло- бально) приведенной реализацией весовой характеристики L назы-
362 10 Алгебраическая теория линейных систем вается реализация L минимальной размерности. (Если же у £ нет конечномерной реализации, то все реализации считаются приведен- ными.) Сразу отметим, что предложение (13.18) эквивалентно следую- щему. (13.28) Предложение. Весовые характеристики любых конечномер- ных линейных гладких динамических систем, алгебраически экви- валентных друг другу на Т, одинаковы. Теперь мы докажем теорему, согласно которой конечномерные глобально приведенные реализации некоторой фиксированной ве- совой характеристики L принадлежат одному классу эквивалент- ности по отношению к алгебраической эквивалентности. Этот ре- зультат был сформулирован в работе Вейсса и Калмана [1965; на нижней половине стр. 155] и независимо доказан в работе Юла [1966]. В действительности он представляет собой лишь некоторую ослабленную модификацию теоремы (13.19). При этом централь- ную роль играет тот факт, что понятие глобальной приведенности оказывается эквивалентным понятию каноничности, а это в свою очередь является тривиальным следствием линейной независимости. Для того чтобы поставить эту задачу в духе § 10.6, введем еще несколько понятий. Пусть J с:Т есть произвольный конечный от- крытый промежуток, и пусть = {векторное пространство всевозможных непрерывных функций «,( •): Г7 = {векторное пространство всевозможных непрерывных функций Введем также еще одно определение, аналогичное определению (13.4), но суженное на множество моментов времени /. (13.29) Определение. Абстрактным линейным гладким отображе- нием вход — выход в нулевом состоянии на J называется линей- ное отображение Гг а,-Гр : L(t, s)uj(s)ds, j в котором L — заданная весовая характеристика. Реализацией отображения f, считается любая линейная глад- кая динамическая система S, такая, что Ls= L на J X J. Приве- денной реализацией отображения f] называется реализация ми- нимальной размерности. Канонической реализацией отображения
10.13 Реализация отображений вход — выход с непрерывным временем 363 f* называется такая реализация, для которой при любом r^J (произвольном, но фиксированном) отображение (13.30) g'f. ->Х2: и} (•) J Ф2 (г, s) G2 (s) u} (s) ds j является сюръективным, а отображение hf. X%—>Г/, (13.31) : J^RP, : 11—> Hz (0 Ф2 (t, r) x биективным. Заметим, что — а, согласно лемме (13.20), выбор г несуществен, что и позволило исключить г из обозначений. Для того чтобы обобщить определение (13.29) на случай J=T, положим £2 = {векторное пространство всевозможных непрерывных функций и (•): Т -> Rm с компактным носителем}; Г = {векторное пространство всевозможных непрерывных функций г/( •): T-*R₽}. Тогда естественным обобщением определения (13.4) будет сле- дующее. (13.32) Определение. Абстрактным, линейным гладким отображе- нием вход — выход в нулевом состоянии f*T на Т называется ли- нейное отображение 1?: £2->Г; и (•) и-> | L $) и (s) ds, т где L — заданная весовая характеристика. Определения реализации, приведенной реализации и канони- ческой реализации аналогичны соответствующим определениям для fj. Существование приведенных реализаций отображения f*7 (или вытекает непосредственно из критерия существования (13.8). Чтобы убедиться в этом, достаточно взять два отображения Р(*) и Q(-), таких, что уравнение (13.9) справедливо на J X J (или на Т X Т), а целое число п минимально. Остается лишь выяснить, ка- кова связь между минимальностью п в факторизации L и канонич- ностью факторизации отображения /у (или /у). (13.33) Лемма. Пусть 5° = (0, G(-) Н()) — произвольная конеч- номерная приведенная и нормальная реализация отображения
364 10 Алгебраическая теория линейных систем fj(uAU f*T^. Тогда найдется такой конечный замкнутый интервал Icz/czT, что столбцы Я(-) и строки Q(') являются линейно не- зависимыми функциями на I. Доказательство. Шаг 1. Предположим, что столбцы Н(-) линейно зависимы на некотором открытом интервале / (необязательно ко- нечном). Тогда существует такое х¥=0, что H(t)x=0 на J. Пусть С — произвольная невырожденная матрица, такая, что ( 0 для 1 «С i < п, (Сх\ = { . х z* I 1 ДЛЯ 1 = п. (Например, С может быть подходящей перестановочной матри- цей.) Тогда система S° = (0, G(-), Я(-)) = (0, CG(-), Я(-)С-1) является реализацией. Поскольку В(')Сх = Я(*)х = 0, последний столбец матрицы Я(-) должен состоять на / из одних нулей. По- этому, не нарушая условий реализации £(•>•)= Н (•) G(-) => = Я (•) G (•), можно отбросить и последнюю строчку матрицы G (-). Но в этом случае система S0 не является минимальной реализа- цией, что противоречит условиям теоремы; итак, столбцы матри- цы Я(-) линейно независимы на J. Точно таким же образом можно доказать, что строки матрицы G(-) линейно независимы на J. При этом мы нигде не пользовались предположением о конечности J. Поэтому полученные утверждения остаются справедливыми и то- гда, когда J — Т. Шаг 2. В соответствии с только что приведенным доказатель- ством предположим, что столбцы матрицы Я(-) линейно незави- симы на I. Обозначим через 1о произвольный конечный замкнутый промежуток, содержащийся в J. Рассмотрим подпространство Х0 = {х: H(t)x = 0, te=I0}. Если Хо — 0, то лемма доказана. Если же нет, то существует та-: кое А е /, что H(ti)x0 Ф 0 при некотором х0 ф 0 из Хо, как это сле- дует из линейной независимости столбцов матрицы М (•) на /. Пусть тогда Х, = {х: Я(/)х = 0, t еZoUZJ, где 1\ — произвольный конечный замкнутый интервал, содержащий- ся в / и содержащий Л. Тогда dim Jo > dimXI( так как Xi не содер- жит луча, порожденного элементом х0. Но dim Хо < dim S° < оо по определению реализации. Поэтому при некотором k—q^ 1+dimS0 имеем dimXft = 0. Таким образом, линейная независимость столб- цов матрицы Я(-) гарантируется не только на /, но и на конечном
10.13 Реализация отображений вход — выход с непрерывным временем 365 объединении Г конечных замкнутых промежутков из J. Аналогич- ные рассуждения применимы и по отношению к строкам матрицы G(-) и дают нам некоторое конечное объединение 1" конечных замкнутых промежутков. В завершение доказательства остается лишь выбрать подходящий конечный интервал 7 с. J, содержащий 7'U7"’). Отметим теперь одно очевидное утверждение. (13.34) Предложение. Для любого абстрактного линейного глад- кого отображения вход — выход в нулевом состоянии Г}(или f'T) понятия «каноническая реализация» и «приведенная реализация» совпадают. С интуитивной точки зрения это означает, что в линейном слу- чае условие минимальной размерности (приведенность) можно ис- пользовать вместо условия каноничности. Другими словами, это предложение обобщает утверждение (6.10). Доказательство. С учетом леммы (13.20) без потери общности можно предположить, что реализация отображения fj (или f*T) нормальна. Пусть такой реализацией является система S°= (0, G (•),//(•)). Докажем, что ее приведенность гарантирует и каноничность. Ли- нейная независимость столбцов матрицы Я(-) на I с J (гаранти- рованная леммой (13.33)) сразу свидетельствует о том, что ото- бражение^h*Jt определенное в уравнении (13.31), является биектив- ным. С другой стороны, если отображение gp определенное в урав- нении (13.30), не является сюръективным, то найдется некоторый х0 е Rn, *о 0, ортогональный области значений g*j с R". Полагая тогда, что «/(•): *G'(f)x0, мы получаем, что 0 = (*о. J G G' х°ds) = f И G' (s) хо II2 ds- ] j Но отсюда имеем G'(s)x0 s 0 на 7, что свидетельствует о линейной зависимости строк матрицы G(-) на 7с 7 в противоречии с выво- дами леммы (13.33). Аналогичные рассуждения можно использо- вать при рассмотрении отображения f*T, но в этом случае нужно определить «(•) как «(•): />—>0(()G'(t)x0, где 0: Т->R, 0еС°, 0 ф 0 на int I и такая, что supp 0 = 7. (В этом случае «(•) е Q, так как Q содержит любые отображения Т-»- Rn с компактным носи- телем.) ') Заметим, что эта лемма играет такую же роль, как и соображения ко- нечности на шаге 1 второго доказательства теоремы (11.14).
366 10 Алгебраическая теория линейных систем Строго обратными рассуждениями доказывается, что из кано- ничности следует приведенность. Нам осталось только привлечь факт изоморфизма (6.8) кано- нических факторизаций линейных отображений, после чего непо- средственно доказывается еще одна теорема единственности. (13.35) Вторая теорема единственности. Каждое абстрактное ли- ! нейное гладкое отображение вход — выход в нулевом, состоянии i f*j [или для которого существует конечномерная реализация, имеет приведенную реализацию. Каждая приведенная реализация является и канонической. Приведенные реализации фиксирован- ного отображения f, [или f J.) принадлежат одному и тому же классу эквивалентности по отношению к алгебраической эквивалентности на J [или Т). Короче говоря, приведенная реализация абстрактного отобра- жения вход — выход является единственной с точностью до алгеб- раической эквивалентности. Закончим этот параграф некоторыми соображениями о кон- I струировании регуляторов, продолжающими тему § 2.6. Воспользовавшись подходящим определением канонической реа- лизации для общего случая как некоторой кусочно-гладкой дина- мической системы (см. Калман [1969]), мы можем сформулировать требуемую теорему. (13.36) Теорема единственности в причинном случае. Каноническая реализация семейства т е J, J есть произвольный открытый , промежуток} причинных отображений вход — выход единственна с точностью до алгебраической эквивалентности на J- такая система является одновременно полностью достижимой и полностью наблю- даемой. ! Однако отсюда еще не следует, что такая система ни полностью 1 управляема, ни полностью идентифицируема при каждом те/. (13.37) Пример. Пусть g(-) еС°° и g(-): R->-R, причем g(-) не : обращается в нуль на интервале (—оо,0) и тождественно равна нулю на интервале [0, 4-оо). Пусть h[t) — g(—t). Тогда причинная । импульсная характеристика Lc[t, s) = h(t)g[s), t^s, канонически реализуется системой 2 = (0, g(-), *(•))• Однако в этой системе ни одно состояние не является управляемым при т 0, и ни одно состояние не является идентифицируемым при т-<0. Мы можем переформулировать это утверждение, сказав (см.
10.13 Реализация отображений вход—выход с непрерывным временем 367 Вейсс, Калман [1965]), что антипричинная импульсная характери- стика этой системы La (t, s) = Hi (t) Фе (t, s) Gt (s) = h (t) g (s) для t < s тождественно равна нулю. Обращая направление времен, т. е. переходя к изучению анти- причинных систем вместо причинных, мы получим следующее зер- кальное отражение результата (13.36). (13.38) Теорема единственности для антипричинного случая. Кано- ническая реализация семейства те/] антипричинных ото- бражений вход — выход является единственной с точностью до алгебраической эквивалентности на J\ такая система одновре- менно полностью управляема.и полностью идентифицируема. Любая реализация 2 некоторого причинного импульсного ото- бражения Le определяет естественно и какое-то антипричинное им- пульсное отображение £х, равное правой части выражения (13.7) на полуплоскости (Г X Т)а = {(/, s): t < s, t, s <= Т}. Будем называть Lt антипричинным продолжением отображения Lc. Если 2 оказывается канонической реализацией отображения Le на Т, то, согласно первой теореме единственности, система 2 и ее отображение Lt единственны, как это и было в примере (13.37). Если 2 не является канонической реализацией своего собствен- ного отображения Lt, то в общем случае системой 2 нельзя управ- лять и в ее пространстве состояний содержатся неидентифицируе- мые состояния. Но так как тем не менее система 2 единственна (а алгебраическая эквивалентность не сказывается на свойствах управляемости или идентифицируемости), мы все же можем ре- шать задачу синтеза регулятора для некоторого подпространства X] с: Хт. (Заметим, что Х\ теперь уже неоднозначно, так как Х1 = {управляемые состояния}П{идентифицируемые состояния}, а последнее подпространство зависит от выбора системы координат.) Однако в наиболее общем случае ситуация существенно слож- нее. Отображение Lc может иметь более чем одно антипричинное продолжение, и поэтому может оказаться, что невозможно надеж- ным способом указать, какие состояния системы относятся к числу управляемых, а какие —к числу идентифицируемых, при условии, что система задается единственно своим причинным импульсным отображением. Такое положение вещей оставалось незамеченным в классической теории систем (с 1940 по 1960 г.), в которой поня- тие «системы» часто считалось синонимом преобразования вход- ных воздействий в выходные величины. (Например, Задэ [1952]
368 10 Алгебраическая теория линейных систем встал на крайнюю в этом смысле точку зрения, которую нужно рассматривать в историческом плане.) Подведем итог. Специалист по теории систем, собирающийся решать задачу конструирования регулятора, пользуясь одним лишь причинным импульсным отображением системы, стоит перед сле- дующей ситуацией: 1. В каждый момент времени известно значение состояния си- стемы в некоторой заданной системе внутренних координат. Это такое сильное предположение, что оно устраняет все теоретические трудности. Однако вероятность подобной ситуации на практике незначительно отличается от нуля. 2. Решение должно основываться на неполной информации о свойствах управляемости и идентифицируемости системы. Это ис- ключительно сложная задача, и до сих пор ей уделялось мало вни- мания теорией. 3. Сделав специальные предположения о характере системы, можно по причинным ее свойствам однозначно выяснить ее анти- причинные свойства, после чего систему можно эффективно опи- сывать ее весовой характеристикой, и тогда применима вторая тео- рема единственности. Предположение о стационарности системы относится к послед- ней категории. И вообще, в настоящее время третий путь кажется наиболее плодотворным. Например, в последнее время удалось показать, что большинство результатов алгебраической теории из предыдущих параграфов применимы также и к аналитическим нестационарным системам (см. Калман [1969]; Хо, Калман [1970]).
ПРИЛОЖЕНИЯ К ГЛАВЕ 10 10.А Обзор теории модулей В этом приложении содержатся некоторые из основных фактов современной алгебры, к которым приходилось часто обращаться на протяжении всей этой главы. У читателя предполагается зна- комство с элементарными понятиями алгебры, соответствующее уровню, например, книг Херстейна [1964] или Ху Сы-цзяна [1965]. Здесь же читатель найдет все определения и результаты, в явном виде не обсуждавшиеся в гл. 10. Начнем с того, что напомним определение кольца R. Кольцом называется множество R с заданными на нем двумя ассоциатив- ными законами композиции, первый из которых записывается адди- тивно, а второй — мультипликативно, такими, что /? образует абе- леву группу относительно сложения и (не обязательно абелев) моноид относительно умножения1). Кроме того, необходимо, что- бы эти два закона композиции были взаимно согласованы в смысле выполнимости аксиом дистрибутивности: (А. 1) а (р + у) = ар + ау, (А. 2) (а + Р) у = ау + ру при всех а, р, уе/?. В нетривиальных случаях, т. е. когда ₽=#{0} (где 0 есть нейтральный элемент относительно сложения, т. е. проще говоря, нулевой элемент множества R), имеем 1¥=0 (где 1 есть нейтральный элемент относительно умножения, т. е., иначе говоря, единичный элемент множества /?), и, следовательно, у 0 не может быть обратного относительно умножения элемента. Если для элемента г е R существует мультипликативно обратный, то г называют единицей кольца R. Если элементы г и s отличны от нуля кольца R и rs = 0, то г и s называются (соответственными) дели- телями нуля. Единица кольца R не может быть делителем нуля. Кольцо называется коммутативным тогда и только тогда, когда его закон умножения коммутативен. Коммутативное кольцо без делителей нуля называется кольцом целостности, областью целост- ') Здесь нет смысла рассматривать кольца без единицы, 13 Зак, 693
370 10 Алгебраическая теория линейных систем ности или просто областью. Если R— {0} есть абелева группа отно- сительно умножения, то R называется полем. Другими словами, поле есть коммутативное кольцо, в котором каждый элемент, кро- ме 0, является единицей. Всякое поле является областью. ь (А.З) Пример (из § 17, 18 гл. 1 книги Зарисского и Самюэля [1958]). Рассмотрим множество всевозможных многочленов {л(г)} незави- симой переменной z с коэффициентами, принадлежащими полю К. Другими словами, пусть л(z) = «о + a{z+ .+ a„zn, n<oo. Если an ¥= 0, то п называется степенью многочлена л. Определим сложение и умножение многочленов естественным образом: л + л' = л", где л" (г) = 2 (aft + «*) zk; лл' = л", где л" (г) = 2 ( 2 a,a'\zk. к \/+/=fe Ч Тогда.множество {л(г)} есть кольцо и одновременно область. Это кольцо обозначим через /([г]. Единицами кольца K[z] являются все многочлены степени 0 (их множество изоморфно К). (А.4) Пример (из § 3 гл. VI книги Ленга [1965]). Формальным сте- пенным рядом с коэффициентами из К и независимой переменной г называется бесконечная последовательность (oto, ab ...), которую можно формально представить в виде 2а^. о Формальные степенные ряды образуют кольцо (обозначаемое через АЦз]]), если определить на нем умножение и сложение так же, как и в примере (А.З). Единицами K[[z]] являются любые степен- ные ряды, у которых (Хо =# 0. Вспомним еще определение абстрактного (левого) векторного пространства X над полем К, или просто К-векторного простран- ства. Этими терминами обозначается множество X, являющееся абелевой группой, и отображение (называемое скалярным умно- жением) К X X -> X: (а, х) >—> а • х,
10.А Обзор теории модулей 371 такое, что для всех а, 0 е К и всех х, у е X справедливы условия (А. 5) а • (х + у) = а • х + а • у, (А. 6) (а + 0) • х = а • х + 0 • х, (А. 7) (а0) • х = а • (0 • х), (А. 8) 1 • х = х. Последняя аксиома играет роль условия нормировки. Множе- ство n-ок K = (k\, ..., kn), ki^K, с покоординатным сложением и скалярным умножением является векторным пространством над К и всегда обозначается через Кп. Векторное пространство отно- сится к категории структур с операторами. В них один объект (поле К) действует на другой (абелеву группу X). Элементы поля К называются операторами или скалярами. Заметим, что К можно рассматривать как векторное пространство над собой, поскольку аксиомы кольца гарантируют выполнение аксиом векторного про- странства. Линейные отображения /: Х->-У из одного А-векторного пространства X в другое У мы часто называем К-линейными ото- бражениями или К-гомоморфизмами, чтобы подчеркнуть характер используемого поля. В тех случаях, когда не возникает опасность путаницы, мы будем опускать точку в обозначениях скалярного умножения. Понятие R-модуля^) есть обобщение понятия X-векторного про- странства, в котором поле К заменяется на кольцо /?, а в осталь- ном аксиомы (А.5) — (А.8) сохраняют свое значение. В этом смысле понятие модуля более естественно, чем понятие векторного про- странства, так как в аксиомах векторного поля используются лишь операции структуры кольца, а существование мультипликативно обратных не требуется. Отметим один интересный частный случай. Любое кольцо R является Х-модулем над собой, если определить в нем скалярное произведение как произведение в структуре коль- ца. Отметим также, что Х-модуль (где К — некоторое поле) есть векторное пространство. Поскольку нас будут интересовать лишь коммутативные кольца, здесь нет нужды различать левые и правые Х-модули. Мы будем всегда записывать скалярное произведение слева. Отображение f: X -> У между Х-модулями X и У назовем R-eo- моморфизмом (модулей) (или R-линейным) тогда и только тогда, когда (А.9) f (x + y) = f(x) + f(y), х, уе=Х; (А. 10) f(a-x) = a-f(x), a<=/?, х<=Х. !) Термин «модуль» (без упоминания кольца R) является устаревшим для обозначения «абелевой группы» с групповой операцией, обозначаемой симво- лом + . 13*
372 10 Алгебраическая теория линейных систем Это определение строго согласуется с обычным определением /(-ли- нейного отображения. Назовем /?-модуль X конечным или, точнее, порождаемым конечным множеством образующих gi еX, gnl<=X тогда и только тогда, когда каждый элемент множества X можно пред- ставить в виде х = ^г{(х)- gb fi<=R. Коэффициенты г»(х), вообще говоря, неединственны. Если же они единственны для всех х, то /?-модуль X называется свободным, a множество {gi, gm} называется базисом модуля X. Другими словами, в свободном модуле из того, что S figi = 0, следует, что г{ s 0. Таким образом, свободный модуль почти, в точности эквивален- тен векторному пространству. Если задан КИ-модуль X, то его можно автоматически рассма- тривать как /(-векторное пространство, ограничив скаляры подпо- лем /C°>[z] поля /([г], образованным многочленами нулевой степени. Легко видеть, что K(O)[z] я* К. (А.11) Пример. Множество 7(m[z] многочленных m-ок (т. е. /«-мер- ных векторов с компонентами из кольца /([z]) представляет собой абелеву группу относительно поко'мпонентного сложения. На Km[z] можно задать и структуру /(-векторного пространства, определив скалярное умножение в Z(m[z] следующим образом: а£/(. Более того, если заменить в этой формуле a s К на ле /([z], то множество /("‘[г] становится /([г]-модулем. В этом случае Km[z] оказывается свободным модулем с ровно tn образующими: векто- рами et.....em, где eh == Обычно мы пользуемся одной и той же буквой, скажем X, для того, чтобы обозначать: (1) множество, (2) абелеву группу, (3) век- торное пространство и (4) модуль. Это не только удобно, но и по- казывает, что одно -и то же множество в различных контекстах мо- жет наделяться различными структурами. Приведем еще несколько фактов из теории колец и модуЛёй. Подмножество J кольца R называется (левым) идеалом тогда и только тогда, когда:
10.А Обзор теории модулей 373 1) J устойчиво относительно сложения (т. е. х, у^.1 гаранти- рует, что х — у это можно также записать в виде J — J с: J); 2) J устойчиво относительно умножения слева на элементы кольца /? (т. е. из того, что г е Я, s е /, следует, что rs е J, что можно выразить также отношением RJczJ). Правые идеалы и двусторонние идеалы определяются анало- гичным образом. Но так как здесь нас интересуют лишь коммута- тивные кольца, эти различия несущественны и все идеалы могут записываться как левые. Пересечение идеалов (как множеств) является идеалом. Идеа- лом, порожденным множеством А — {п, ..., rg}, называется пере- сечение всех идеалов, содержащих А. Идеал J, порожденный од- ним элементом г из R, называется главным. В этом случае можно написать, что J — Rr (в тех случаях, когда характер кольца R ясен, J обозначают через (г)). Если каждый идеал кольца R яв- ляется главным, то R называют кольцом главных идеалов. Кольцо главных идеалов, являющееся одновременно областью, можно на- зывать областью главных идеалов. Подмодулем У 7?-модуля X называется подгруппа X, устойчи- вая относительно скалярного умножения (из того, что г G 7? и i/еУ, следует, что ry^Y или RYczY). Последнее обозначение сразу показывает, что J является идеалом кольца R тогда и толь- ко тогда, когда J есть подмодуль модуля R, рассматриваемого как модуль над собой. Пусть R — некоторое коммутативное кольцо, a J — один из его идеалов. Семейство множеств {г + J: r^R} называется классами вычетов кольца R относительно J. Приведенное обозначение неод- нозначно: классы вычетов г + J и г' + J совпадают тогда и только тогда, когда г — г' ^J. Классы вычетов образуют кольцо R/J и R — J, называемое кольцом классов вычетов, или факторкольцом, или кольцом разностей. В этом кольце операции сложения и умно- жения определяются «естественным» образом: (г + /) + (s + J) = (г + s + J), (г + J) (s + 7) = (rs + /). Но так как используемая система обозначений неоднозначна, не очевидно, что выписанные соотношения вполне определены. Воз- можность такого определения следует из свойств (двусторонних) идеа'лов. Читателю придется самому заняться соответствующей проверкой. - В кольце R/J мы иногда записываем равенства в виде а = Ъ (/) или а = b mod J,
374 10 Алгебраическая теория линейных систем что должно означать, что а — b Если идеал J главный, J = Rq, то предыдущие соотношения можно переписать в виде а = b mod q (что читается: а равно b по модулю q). (А. 12) Пример. Кольцо A'[z] есть область главных идеалов. Этот факт легко доказывается с помощью алгоритма Евклида для мно- гочленов с учетом того, что их коэффициенты принадлежат полю. (А.13) Пример. Произвольный многочлен х s A[z] порождает со- ответствующее факторкольцо K[z]/A[z]x- Это кольцо (как множе- ство) изоморфно множеству всех многочленов степени, меньшей deg %, так как в классе вычетов 0 + K[zJx для любого многочлена 0 е K[z] всегда найдется единственный многочлен б, имеющий та- кую же (минимальную) степень. Другими словами, каждое 06 е A[z] имеет однозначное представление 6 = б + РеХ, deg6<degx, Ре s К И- Таким образом, многочлены {6} изоморфны (как множества) мно- жеству классов вычетов {0 + K[z]x} и б можно рассматривать в ка- честве «канонического» представителя класса вычетов 0 + K[z]x- Множество {6} можно наделить структурой кольца. Для этого сло- жение можно определить, как и для обычных многочленов, а умно- жение определить следующим соотношением: б • ф = 0ф. Читается это так: «Нужно перемножить б и ф как обычные многочлены, а за- тем в классе вычетов фф -I- K[z]x найти элемент наименьшей сте- пени». Кольцо K[z]/K[z]x очевидно изоморфно кольцу {б}. Очень часто кольцо K[z]/A[z]x удобнее представлять себе как {б}, так как для последнего кольца операция умножения проще. Таким отожде- ствлением пользуются очень часто, чаще всего даже не оговари- вая его специально. Множество {6} обычно называют кольцом клас- сов вычетов (относительно % или по модулю х). Кольцо {6} « K[z]/K[z]x необязательно является областью. В нем могут существовать делители нуля, которыми служат как раз мно- гочлены, имеющие множитель, общий с х- Действительно, если а, Ф» X» %/а е и 0 — (х/«)ф, то а0 = фх = О mod X- В кольце K[z] единственными единицами являются отличные от нуля многочлены степени 0. В кольце же A[z]/K[z]x единицами слу- жат все многочлены, взаимно простые с х- Действительно, если 0 и х взаимно просты, то с помощью алгоритма Евклида можно по- казать, что 1 = сс0 + ₽х> гДе е КМ; следовательно, имеем сс0 = 1 mod х, откуда находим 0-1 = a mod х- Тем самым мы доказали следующую фундаментальную тео- рему.
10. А Обзор теории модулей 375 (А.14) Предложение. Пусть % есть произвольный элемент кольца Л'[г]. Тогда каждый элемент кольца R[z]//([z]x является либо еди- ницей, либо делителем нуля. Многочлен л е A[z] называется неприводимым (или простым) тогда и только тогда, когда для него не существует факторизации л = ро, где р, os А[г], а р и о не являются единицами кольца A[z] (т. е. р, $ (£&). С помощью этого определения и предложения (А.14) просто доказать следующее предложение. (А. 15) Предложение. Если элемёнт % е /([z] неприводим, то кольцо A[z]/A[z]% является полем. Другими словами, если /C[z]/A[z]% яв- ляется кольцом целостности, то оно одновременно есть и поле. (А. 16) Упражнение. Покажите, что Z[z] не является областью глав- ных идеалов. (Указание: рассмотрите идеал, порожденный (q, z), Наиболее важным результатом теории областей главных идеа- лов (и, в частности, A[z]) является следующая теорема. (А. 17) Теорема об инвариантах. Пусть R есть область главных идеалов, а П есть произвольная матрица размера р X m с элемен- тами из R. Тогда П можно представить в виде П = ААВ, где: (а) А — матрица размера рХр с элементами из R и такая, что det А есть единица в R (это означает, что А является единицей кольца матриц размера р X р над R). (Ь) В — матрица размера пгх пг с элементами из R и такая, что det В есть единица в R. (с) Л — матрица размера рХ нг, все элементы которой равны нулю, кроме тех, которые находятся на главной диагонали и кото- рые равны X], ..., Хг, 0...0, причем справедливы следующие отношения делимости: |Хг-+1, i = 1, ..., г— 1. Элементы одно- значно определяются матрицей П с точностью до единиц в R. Они называются инвариантами матрицы П. Целое число г определяет ранг матрицы П. (d) Инварианты X, можно вычислять непосредственно по фор- мулам = &i/hi-i, где До = 1, a Af есть наибольший общий дели- тель всех миноров матрицы П размера i X i. (е) В общем случае матрицы А и В неединственны. Доказательство этой теоремы базируется на одном классиче- ском алгоритме сведения матрицы П к Л с помощью элементарных матричных операций. Этот процесс мы будем называть алгоритмом вычисления инвариантных множителей. Исчерпывающие доказа- тельства теоремы можно найти в книгах Гантмахера [1953, гл. VI]
376 10 Алгебраическая теория линейных систем и Альберта [1956, гл. III]. Более сжатые доказательства приводятся в литературе, указанной в § 10.8 после теоремы (8.1), которая пред- ставляет собой перефразировку теоремы (А. 17) в рамках теории модулей. Впервые эта теорема была использована в прикладных целях Фрэзером, Дунканом и Колларом [1946] в их исследовании задач теории вибрации из области аэронавтики. В этой работе много интересных примеров. Близкие вопросы рассматриваются также в работе Калмана [1965а]. Если Р = К, где К есть некоторое поле, то все X, можно поло- жить равными 1, так как каждый элемент поля, кроме нуля, яв- ляется единицей и теорема (А. 17) сводится к определению алго- ритма нахождения ранга г К-матрицы П. Этот ранг является ин- вариантом произвольного К-гомоморфизма X -> У относительно изменений базисов К-векторных пространств X и У. В общем слу- чае можно говорить, что/ П эквивалентно Л, и писать это в виде П ~ Л. ю.в Частичная реализация отображения вход — выход (в скалярном случае) Продолжая наше обсуждение вопроса частичной реализации (см. теорему (11.32)), мы приведем здесь подробное решение за- дачи существования, единственности и вычисления минимальной частичной реализации для специального случая, когда m — р= 1. Общий случай рассматривается в работе Калмана [1970]. (B.I) Теорема. Пусть {Ai,А2, ...} — произвольная бесконечная по- следовательность элементов из некоторого фиксированного поля К, и пусть — соответствующая ганкелева матрица. Тогда для каждого фиксированного No возможен один из следующих случаев: (а) Минимальная частичная реализация единственна (т. е. определяет единственный класс эквивалентности относительно изо- морфизма систем). (Ь) Условия задачи чрезмерны, т. е. минимальная частичная реализация порядка No единственна и в то же время является единственной минимальной частичной реализацией порядка Л40, где Л1о < Nq. (с) Условия задачи недостаточны, т. е. найдется такое целое Ро > Но, что каждая минимальная частичная реализация порядка No в то же время является и единственной минимальной частичной реализацией порядка Ро для некоторого произвольного продолже- ния Bn„+i, ..., Вр„ заданной последовательности. Короче говоря, в этом случае имеется (Ро — No) -параметрическое семейство ми- нимальных реализаций. Случай (а) возможен тогда и только тогда, когда No = 2п и rank Жпп = rank ^п+1, п = п.
10.В Частичная реализация отображения вход — выход 377 Случай (Ь) возможен тогда и только тогда, когда rank Жпп.’ = rank Ж«+1, П' = п' — q, где q>0 и п' = п [п' = п + 1], если No = 2п [No = 2п + 1]. При этом Мо = 2(п — q). Случай (с) возможен тогда и только тогда, когда rank З^пп' = п' — q, rank Ж1+1, п' = п' — q + 1, где q > О и п' = п [п + 1], если No — 2п [No = 2п + 1]. При этом Ро = 2(п + q). Во всех случаях формулы (11.16) — (11.18), в которых г — п, а Мо и Ро определены соответственно, определяют минимальную ча- стичную реализацию порядка No, причем в случае (с) это утвер- ждение нужно понимать в том смысле, что к последовательности Ль ..., Лдг„ необходимо предварительно добавить (Ро — No) про- извольных параметров Bn<,+\, Размерность минимальной частичной реализации равна соответственно п, п — q и п + q. Доказательство. Учитывая утверждения теоремы, рассмотрим пре- жде всего случай No = 2п. (Основная причина этого заключается в необходимости определить 2п коэффициентов передаточной функ- ции искомой n-мерной реализации S. Короче говоря, число неиз- вестных всегда должно быть четным.) Случай (а). В этом случае матрица %ёПп имеет полный ранг, так что условие (11.32b) тривиально выполняется. (Отметим, что в частном случае р = m = 1 матрица Жг-м, п является транспони- рованной матрицей относительно 3@n,n+i-) Для того чтобы дока- зать единственность, предположим, что существуют две минималь- ные частичные реализации 2 и 2 с соответствующими последова- тельностями {В^ и {BJ, такими, что Ai = Bi = Bi, i=l, ...» Nq', Bi = Bb i = N0 + \, ..., N-, Bn+i^Bh+i. Согласно лемме (11.12), обе матрицы Л1 ... Ап A„+i (В. 2) Ап ... А2п_] А2п _BN_n+l ... BN BN+i_
378 10 Алгебраическая теория линейных систем И Ai • • • Ап Ап + 1 (В.З) Ап • • • ^2п~1 ^2п -BN-n+i...BN BN+i_ имеют ранг п. Но по условиям теоремы подматрица ЗёПп порядка га X га матрицы (В.2), расположенная в верхнем левом углу, имеет ранг п. Поэтому n-мерный вектор (BN_n+\, •. •, Bn) должен быть линейно зависимым от строк матрицы <3$пп, а так как ранг матрицы (В.2) равен п, матрица Bn+i однозначно определяется этой линей- ной зависимостью. Но тогда BN+i = BN+i, поскольку в противном случае ранг матрицы (В.З) должен бы быть равным п + 1. Случай (Ь). Предположим, что гапк5^Пп = гапкЖг+i.n = = п — q, q>0. Согласно теореме (11.32), в этом случае существует реализация 2 размерности (п — <?), определяемая формулами (11.16) — (11.18), в которых нужно положить г = п. В соответствии с леммой (11.12) эта реализация безусловно минимальна. По- скольку система 2 является (п — q)-мерной, степень ее минималь- ного многочлена не может быть выше (п — q). В связи с этим си- стему 2 можно рассчитать так же, положив в формулах (11.16) — (11.18) г = п — q. Отсюда следует, что 2 полностью определена частичной последовательностью порядка Мо = 2 (п — q). С другой стороны, если г <.п — q, a s^n — q, то rank3@rs < n — q, так что построить частичную реализацию порядка No, используя частичную последовательность порядка меньше ЛГо, невозможно. Единствен- ность 2 доказывается так же, как и для случая (а). Случай (с). Предположим, что rank Жпп = n — q< rank o^n+i, п = п — q + 1, <7 > 0. Тогда последняя строка матрицы <№n+i,n линейно независима от и предыдущих строк. Таким образом, последняя строка матрицы 2^п+1,п линейно независима от предыдущих п строк длины (n + 1) независимо от значения элемента /А2п+1. Но это значит, что rank Жж, n+i — п — ? + 2 при любых продолжениях частичной по- следовательности {Ль ..., А2п) до (41, ..., Дгп+i}, и мы получаем новую оценку снизу для минимальной частичной реализации по- рядка 2п. Предположим теперь, что найдутся такие числа А2п+1 и 42п+2, что rank Жге+1, „+1 = rank ^п+2, „+) = п - q + 2.
10. В Частичная реализация отображения вход —выход 379 Это означает, что некоторые частичные последовательности по- рядка 2(n + 1), согласующиеся с исходной последовательностью вплоть до члена А2п включительно, имеют реализацию S размер- ности (п — 9 + 2). Если то отсюда следует, что минималь- ный многочлен системы S имеет степень не более п, т. е. систему 2 можно рассчитать по формулам (11.16) — (11.18) для г п и dimS = rank Но rankj#nn = п — q<n-—q + 2. Этим дока- зано, что для любых продолжений частичной последовательности (Ль ..., А2п} до {Ль ..., А2п+2) справедливы, соотношения rank ^„+i, п+1 = « ~ 9 + 2 < rank ^п+2, n+i = « — <7 + 3. Мы свели, таким образом, случай (с) к новому, где No = 2п + 2 и q' = 9—1, 9 > 0. Для завершения доказательства остается лишь воспользоваться принципом конечной индукции. Доказательство для случая No = 2п + 1 сводится к случаю No = 2п с помощью очевидных рассуждений, аналогичных исполь- зованным выше. С учетом предложения (11.35) наша задача теории систем «по- строения минимальной частичной реализации порядка No после- довательности {Ль А2, ...} с элементами из К» эквивалентна сле- дующей задаче теории функций. (В.4) Задача (об аппроксимациях Падэ). Найти два многочлена а, /е K[z], deg <т < deg %, таких, чтобы коэффициенты формального степенного ряда были согласованы с заданной последовательностью {ЛьА2, вплоть до No-го члена включительно, причем degx должна быть минимальной. Приведенные выше результаты можно перевести на язык этой новой задачи следующим образом. (В.5) Теорема. Пусть N = 2п или 2п + 1. Тогда решение задачи (В.4) находится по формуле где F, G и Н вычисляются по формулам (11.16) —(11.18), deg% = = п + 9, а «дефект» равен _( Мо - n - rank если rank Жн-i, w,-n> rank Ж», лг0-п, У rank З^п, Na-n - п, если rank 3^n+i, - rank 3@п, Nt.n. (В.6) Историческое замечание. Основные результаты для задачи. (В.4) были получены Коши и Якоби (см. обзор классических
380 10 Алгебраическая теория линейных систем результатов и особенно замкнутых формул, описывающих а и / че- рез определители в работе Фробениуса [1881]). Но для многих целей формулы (11.16)— (11.18) Б. Л. Хо удобнее определителей Якоби и Фробениуса. Еще важнее, возможно, то, что классические результаты, видимо, никогда не обобщались на случай матрич- ных последовательностей или числовых последовательностей, не принадлежащих полю. Напротив, наши методы охватывают, по сути дела, обе возможности обобщения, что связано с важными практическими последствиями в теории вычислительных систем и теории систем (см. Калман [1968]). 10. С Первое доказательство теоремы единственности канонических реализаций Мы воспроизводим здесь с некоторыми улучшениями редакцион- ного характера первоначальное доказательство теоремы (13.19) (полученное весной 1962 г. автором и ранее не публиковавшееся). Его основные идеи очень близки тем, которыми впоследствии (но независимо) воспользовался Юла [1966]. Для доказательства потребуется несколько небольших лемм. Мы докажем их без обычных формальностей, прямо по ходу до- казательстйа теоремы. Предположим, что J = (а, Ь), где а обязательно конечно, но b может быть и +оо. Напомним, что 2 и 2 определены йа всем Г = R d /. Возьмем любое те/. По определению реализации Я 2 (0 Ф2 (*, з) G2 (з) = Я2 ю Ф2 (/, з) G2 (з) при всех / из, таких, что s'-Ct^CZ. Согласно полугрупповому свой- ству переходных отображений (см. уравнение (2.21) в гл. 2), это соотношение эквивалентно следующему: (С. 1) Я2 (0 Ф2 (/, т) Ф2 (т, з) G2 (з) = Я2 (/) Ф2 (t, т) Ф2 (т, з) G2 (з). Отметим, что мы не делаем при этом предположения (а на самом деле мы пока еще этого й не знаем), что п — dimS = n = dimS. В силу полной достижимости 2 на J в точке т найдется такое х' < т, что матрица (С. 2) | Ф2 (т, з) G2 (з) G2 (з) Ф2 (т, з) ds Хг положительно определена (теорема (2.24) гл. 2). Таким образом, равенство (С.1) гарантирует, что (С. 3) (0 Ф2 (t, т) А (т; х') = Я2 (/) Ф2 (/, т)
10.С Первое доказательство теоремы единственности реализаций 381 при всех где т А (т; т') = J (т, s)G% ($) G's (s) Ф2 (т, s) ds X %' - t -i-l X J Ф2 (т, s) G2 (s) G2 (s) Ф' (t, s) ds - %' Подставляем выражение (С.З) в (C.l): (С. 4) Ht (О Ф2 (/, т) [А (т; /) Ф2 (т, s) G2 (s) - Ф2 (т, s) G2 (s)] = 0. Выражение в квадратных скобках тождественно равно нулю при любых s-Ст. Действительно, в противном случае всегда нашлось бы такое х =h 0, что имело место Я£(/)Ф^(/, т)х = 0 для всех t^x. Но это невозможно, так как система 2 полностью наблюдаема в момент времени х. Таким образом, при всех имеем (С. 5) Ф2 (т, s) Gs (в) = А (т; т') Ф2 (т, s) Gs (s). Поменяв ролями системы 2 и 2 (и используя тот факт, что система 2 полностью достижима в момент времени г, а 2 в этот же момент времени полностью наблюдаема), мы получим еще два соотношения, аналогичных уравнениям (С.З) и (С.5): (С, 6) Я2 (0 Ф2 (/, т) В (г; т") = Н^ (t) Ф$ (t, т) дйя всех t х и (С. 7) где Ф2 (T> s) G2 (s) = В (т; х") Ф$ (т; s) Gj (s) для всех s <т, т в (т; х") = J Ф2 (т, s) G2 (s) g's (s) Ф2(т, s) ds X %" - % X Уф5(т, s)Gs(s)G's(s)<b's(x, s)ds Теперь легко доказать, что матрицы А и В не вырождены, а на самом деле являются обратными по отношению друг к другу. На- пример, подставим уравнение (С.З) в уравнение (С.6). Тогда Нг (0 Ф$ (i, т) [А (т; т') В (т; х") - /] = 0, а из полной наблюдаемости 2 в момент времени т сразу следует в том же смысле, что и раньше, что выражение в квадратных скоб- ках тождественно равно нулю. Но это показывает, что-матрица В
382 10 Алгебраическая теория линейных систем является правой обратной по отношению к матрице А (и что А есть левая обратная для В) и, в частности, что n^Ln. Но из соображе- ний симметрии ясно, что п^п и, следовательно, п=4, и наше утверждение оправдано. Все предыдущие рассуждения сохраняют свою силу и при за- мене т' или т" на некоторое меньшее число т"'. Более того, если Т1<т2, то всегда можно выбрать т[<т'. (Доказательство: рас- смотрим матрицу (С.2) и заметим, что ее ранг не убывает с убы- ванием нижнего предела интегрирования.) Поэтому т' и т" можно заменить на единственное т!" = minfr^a), т"(я)} = с, и такой ew- бор возможен для любых Будем теперь для простоты писать Д(т) вместо Л(т; с) и Д-1(т) вместо В(т; с). Выберем затем произвольно ое /, такое, что о < т. Перепишем уравнение (С.5) в виде Ф2 (т, ст) Ф2 (ст, s) G2 (s) = А (т) Ф2 (т, ст) Ф2 (ст, s) Gs (s). Полная достижимость системы S в момент времени т требует, чтобы Ф^ (т, ст) = А (т) Ф2 (т, ст) Л-1 (ст), т >ст, т, я s J (как и раньше, мы умножаем соответствующее выражение на s) справа и интегрируем произведение по s). Но если /, S Е J, Г Е / И /, S >Г, ТО (С. 8) Ф2(/,5) = Ф2а,г)Ф^(5.г) = = А (0 Ф2 (t, г) А~1 (г) [Л (s) Фх (s, г) Л"1 (г)]-1 = = Л (0 Фх (/, г) Ф£‘ (s, г) Л-1 (s) = = Л (0 Фх (f, s) Л-1 (s), что доказывает утверждение (13.15а). Объединяя этот результат с уравнениями (С.З) и (С.5) и используя невырожденность Ф, по- лучаем, что (0 л (0 -(0, а также о2(о = л(ос2(0, что доказывает утверждения (13.15с) и (13.15d). Итак, мы убедились в справедливости трех из четырех соотно- шений теоремы (13.15). Остается лишь доказать, что отображение Л(-): /->{матрйцы размера п X п} принадлежит классу С1. Эго можно сделать, продифференцировав Л (т; а) впрямую. Однако нижеследующее доказательство более содержательно.
10.D Указатель обозначений 383 Рассмотрим сначала частный случай, когда (•) = ® О, так что Ф2 (t, s) = (/, s) = I при всех t и s. Тогда уравнение (С.8) показывает, что Л(-) постоянно на J и, значит, наверняка принадлежит классу С1. Но так как отношение алгебраической эк- вивалентности транзитивно, доказательство справедливости этого последнего утверждения теоремы (13.15) сводится к только что исследованному частному случаю с помощью леммы (13.20). Итак, мы доказали теорему для случая, когда левый предел а интервала J не был —оо. Если же это именно так, то можно рас- смотреть вложенную последовательность множеств id Д, где 4 = Ь), ак->- оо, £->оо, . А так как предыдущие результаты справедливы при любых k, то они справедливы и для J = (—оо, Ь) или (—оо, оо). Это замечание завершает доказательство теоремы единствен- ности. 10.D Указатель обозначений Общие обозначения J — промежуток из множества R (точное опреде- ление приводится в каждом конкретном слу- чае) К — произвольное поле 7? — произвольное кольцо С — множество комплексных чисел R — множество вещественных чисел Z — множество рациональных чисел -> — отображение (множество —» множество) н-> — отображение (элемент элемент) 2^. — изоморфизм ф — прямая сумма (а, Ь) — наибольший общий делитель (a, b <= R, где R есть кольцо) а\Ь — а делит b а->(Ь — а не делит b Специальные обозначения ek — стандартный векторный базис простран- ' ства Кт 273 A fx, fj — отображения «вход — выход» 272 g — образующая модуля 297 gk — достижимые образующие модуля 282 A, A(t), а —изоморфизм пространства состояний 271
384 10 Алгебраическая теория линейных систем Ау — аннулятор подмножества У некоторого модуля 297 {Ai, А2, ...} —бесконечная матричная последователь- ность, индуцируемая отображением f 326 .Еп — «редактирующая» матрица 328 F, F2 — одношаговое переходное отображение или матрица (S) в пространстве состояний 270 G, Gy, Gf — входное отображение или матрица (S J »лвП 270 G, Gy, Gf — отображение мгновенного значения вход- ного воздействия в мгновенное состояние 284 Н, Ну, /7.— выходное отображение или матрица (S 'ИЛИ f) 270 Н, Ну, Hf~ отображение состояния в мгновенное зна- чение выходных величин 285 /(" — векторное пространство м-ок, k = (ki, ... ...,kn),ki^K 269 К [z] — кольцо многочленов с коэффициентами из К. и независимой переменной z 276 /(" [г] — /(-векторное пространство n-мерных век- торных многочленов 276 /С [[*]]— Х-векторное пространство формальных степенных рядов с коэффициентами из К и независимой переменной z 277 /(" [[z]] -/(-векторное пространство формальных степенных рядов с n-мерными векторны- ми коэффициентами 277 L, L2 — весовая характеристика (S) 361 Lc, La — причинное (антипричинное) импульсное отображение 354 Т — множество моментов'времени 269 «т (.), «,(•). «(•) — входные воздействия 354 ух (.), i/j (•), у (•) — выходные величины 354 U — множество входных значений (алфавит) 269 W, Wf, IFj. — передаточные матрицы 308 X, Х^, Xf — множество, пространство, модуль (S или f) 281 У — множество значений выходных величин (выходной алфавит) 269 у — выходная последовательность 272 Л/—инварианты многочленной матрицы 314 л» Vfe, ©б — многочлены е /([z] 276 о, аа, <тг — операторы сдвига (в Q, в Г) 274 т —текущий момент времени 354
iO.D Указатель обозначений 385 Ф — отображение перехода 269 X. Хл— характеристический многочлен (матри- цы F) 302 ф. фх, фр, ф2 — минимальные многочлены (модуля X, ма- трицы F, системы 2) 297 фй — инварианты (модуля,Х или матрицы F) 304 © — входная последовательность 272 Г, Гт — пространство выходных величин 269 Л = diag(li,..., Хт, 0, ...,0), где X,— инва- рианты многочленной матрицы 314 2 —линейная динамическая система 267 Q, — постранство входных воздействий 269 &п ~ /(-векторное пространство многочленов л е K[z], для которых deg л < п 298 Ж (f) — бесконечная ганкелева матрица (f) 326 п (f) — бесконечная ганкелева матрица (f) из блочных матриц размера tn X п 326 deg — степень (векторного) многочлена 280 d — степень формального многочлена 348 Ef — отношение эквивалентности Нерода, ин- дуцируемое отображением f 280 « — отношение эквивалентности модулей от- носительно f 280 =f — отношение эквивалентности Майхилла, индуцируемое отображением f 348 (®)f — класс эквивалентности Нерода 280 [©]f — класс эквивалентности модулей 280 {©}f — класс эквивалентности Майхилла 348 о-в выражениях вида ©<>v — операция сши- вания входных воздействий, а в выраже- ниях вида х ° © — действие © на х 280 ~ — канонический представитель класса вы- четов по тодф 298
ЛИТЕРАТУРА Альберт (А 1 b е г t А. А.) [1956] Fundamental Concepts of Higher Algebra, University of Chicago Press (modern paperback reprint in Phoenix Science Series). Андрэ (Andree R. V.) [1949] Computation of the inverse of a matrix, Am. Math. Monthly, 58:87-—92. A p б и b (A r b i b M. A.) [1964] Brains, Machines, and Mathematics, McGraw-Hill. (Есть русский пере- вод: Мозг, машина и математика, «Наука», М., 1968.) [1965] A common framework for automata theory and control theory, SIAM J. Contr., 3 : 206—222. [1966] Automata theory and control theory: a rapprochement, Automatica, 3 : 161—189. [1967] Tolerance automata, Kybernetik, 3 : 223—233. [1968a] (ed.) The Algebraic Theory of Machines, Languages and Semigroups, Academic Press. [1968b] Automaton decomposition and semigroup extensions, chap. 3 of [Arbib, 1968а]. [1969] Theories of Abstract Automata, Prentice-Hall. A p б и б, 3 e й г e p (Arbib M. A., Z e i g e r H. P.) [1968] An automaton-theoretic approach to linear systems, preprints of IFAC Symposium, Sydney, Australia (Institution of Engineers, Australia), pp. 91-97. Ат а н c (Athans M.) [1966] On the uniqueness of the extremal controls for a class of minimum fuel systems, IEEE Trans. Automatic Control, AC-11: 660—669. Ат а н с, Фалб (Athans M., F a 1 b P. L.) [1966] Optimal Control: An Introduction to the Theory and Its Applications, McGraw-Hill. (Есть русский перевод: Оптимальное управление, тео- рия и применение, «Энергия», М., 1968.) Балакришнан, Нейштадт (Balakrishnan А. V., Neustadt L. W. (eds.)) [1964] Computing Methods in Optimization Problems, Academic Press. Блюм (В 1 u m E. К.) [1964] Minimization of functionals with equality constraints, SIAM J. Contr., 3:299—316. Болтянский В. Г. [1964] Достаточные условия оптимальности и обоснование метода динами- , ческого программирования, Изв. АН СССР, Серия математическая, 28: (3), 481—514. Брайсон, Д е н х э м (Bryson А. Е., Denham W. F.J [1962] A steepest-ascent method for sojving optimum programming problems, /. Appl. Meeh. (Trans. AS ME, Ser. E), 29 : 247—257.
Литература 387 Брэкуэлл, С пейер, Брайсон (Breakwell J. V., Speyer J. L., Bryson A. E.) [1963] Optimization and control of nonlinear systems using the second varia- tion, SIAM J. Contr., 1 : 193—223. Бурбаки (Bourbaki N.), [1962] Elements de Mathematique; Livre II; Algebre, chap. 2: AJgebre lineaire (3d ed.), Actualites Scientifiques et Industrielles № 1236, Hermann. (Есть русский перевод: Алгебра. Алгебраические структуры, линей- ные и полилинейные алгебры, Физматгиз, М., 1962.) [1964] Ibid., chap 7: Modules sur les anneaux principaux (2d ed.), Actualites Scientifiques et Industrielles No. 1179, Hermann. (Есть русский пере- вод: Алгебра. Модули, кольца, формы. «Наука», М., 1966.) Бушау (Bushaw D.) [1963] Dynamical polysystems and optimization, Contr. to Diff. Equations. 2 :361—365. Ван Дайн (Van DineC. P.) [1965] An application of Newton’s method to the finite-difference solution of nonlinear boundary-value systems, United Aircraft Res. Lab. Rept. UAR-D37. Ван дер Варден (Van der WaerdenB. L.) [1931] Moderne Algebra, 2 vols., Springer. (Есть русский перевод: Совре- менная алгебра, т. 1, 2. Гостехиздат, 1934.) Вейсс, Калман (W е i s s L., К a 1 m a n R. E.) [1965] Contributions to linear system theory, Intern. J. Engr. Sci.t 3: 141—171. Витценхаузен (Witsenhausen H.) [1965] Some iterative methods using partial order for solution of nonlinear boundary-value problems, MIT Lincoln Laboratory Technical Note 1965-18. Гамкрелидзе P. B. [1965] On some extremal problems in the theory of differential equations with applications to the theory of optimal control, SIAM J. Contr., 3: 106— 108. Гантмахер Ф. P. [1953] Теория матриц, ГИТТЛ; изд. 2, «Наука», 1966, изд. 3, 1967. Гинзбург (Ginsburg А.) [1966] Six lectures on algebraic theory of automata, Center for the Study of Information Processing, Carnegie Institute of Technology. Гинзбург (GinsburgS.) [1962] An Introduction to Mathematical Machine Theory, Addison-Wesley. Греб (G r e u b W. H.) [1967] Linear Algebra, 3d ed., Springer. Дакуна, Полак (DacunhaN., Polak E.) [1967] Constrained minimization under vector-valued criteria in finite-dimen- sional spaces, /. Math. Anal, and Appl.. 19: 103—124. Данфорд, Шварц (Dunford N., Schwartz J. T.)^ [1958] Linear Operators, Part I: General Theory, Interscience. (Есть русский перевод: Линейные операторы, ч. 1. Общая теория, ИЛ, М. 1962.) Д а ф ф и н, X а з о н и (D u f f i n R. J., H a z о n у D.) [1963] The degree of a rational matrix function, SIAM J.t 11 : 645—658.
388 Литература Ден хэм (Denham W. F.) [1963] Steepest-ascent solution of optimal programming problems, Raytheon Report, BR-2393. Джекобсон (Jacobson N.) [1953] Lectures in Abstract Algebra, v. II: Linear Algebra, Van Nostrand. Джонсон (Johnson C. D.) [1965] Singular solutions in problems of optimal control, in Advances in Con- trol Systems: Theory and Applications, v. II, С. T. Leondes (ed.), Aca- demic Press. Джонсон, Гибсон (Johnson C. D., Gibson J. E.). [1963] Singular solutions in problems of optimal control, IEEE Trans. Auto- matic Control, AC-8: 4—14. Дуб (D о о b J. L.) [1953] Stochastic Processes, Wiley. (Есть русский перевод: Вероятностные процессы, ИЛ, М., 1956.) Дэй, У о л л а с (D а у Е. М., W а 11 а с е A. D.) [1967] Multiplaciton induced in the state space of an act, Math. System Theory, 1 : 305—314. Д ь e д о н н e (Dieudonne J.) [1960] Foundations of Modern Analysis, Academic Press. (Есть русский пере- вод: Основы современного анализа, М., 1964.) 3 а д э (Z a d е h L. А.) [1952] A general theory of linear signal transmission systems, J. Franklin Inst., 253 : 293—312. 3 а д э, Д e з о e p (Z a d e h L. A., D e s о e r C. A.) [1963] Linear System Theory, McGraw-Hill. (Готовится русский перевод: Теория линейных систем, «Наука».) Зарисский, Самюэль (Zariski О., Samuel Р.) [1958] Commutative Algebra, v. 1, Van Nostrand. (Есть русский перевод: Коммутативная алгебра, т. 1, ИЛ, М., 1963.) Зееман (Zeeman Е. С.) [1962] The topology of the brain and visual perception, in The Topology of 3-Manifolds, M. K. Fort (ed.), 240—256. 3 e й г e p (Z e i g e r H. P.) [1965] Cascade synthesis of finite automata, Proc. Sixth Ann. Conf. Switch- ing Theory and Automata, IEEE. [1967a] Yet another proof of the cascade decomposition theorem for finite automata, Math. System Theory, 1 :225—228. [1967b] Ho’s algorithm, commutative diagrams, and the uniqueness of minimal linear systems, Inf. and Control, 11: 71—79. [1968] Cascade decomposition of automata using covers, chap. 4 in [Arbib, 1968а]. Итон (E a t о n J. H.) [1962] An iterative solution to time-optimal control, /. Math. Anal. Appl.t 5: 329—344. Калаба (KalabaR.) [1959] On nonlinear differential equations, the maximum operation and mono- tone convergence, J. Math. Meeh., 8: 519—574. Калман (К a 1 m a n R. E.) [1958] Design of a self-optimizing control system, Trans. ASME, 80:468—478.
Литература 389 [1960а] Contributions to the theory of optimal control, Bol. Soc. Mat. Mexi- сапа, 5 : 102—119. [1960b] On the general theory of control systems, Proc. 1st IFAC Congress, Moscow; Butterworths, London. [1962a] Canonical structure of linear dynamical systems, Proc. Nat. Acad, of Sci. (USA), 48 : 596—600. [1962b] On the stability of time-varying linear systems, Trans. IRE PGCT, 9:420—422. [1963a] The theory of optimal control and the calculus of variations, chap. 16 in Proc, of Conference on Mathematical Optimization Techniques (San- ta Monica, 1960), R. Bellman (ed.), University of California Press. [1963b] New methods in Wiener filtering theory, Proc. 1st Symp. on Engi- neering Applications of Random Function Theory and Probability, Purdue University, November 1960, pp. 270—388, Wiley. (Сокращен- ный вариант из RIAS Technical Report 61-1.) [1963c] Mathematical description of linear dynamical systems, SIAM J. Contr., 1 : 152—192. [1963d] Lyapunov functions for the problem of Lur’e in automatic control, Proc. Nat. Acad. Sci (USA), 49:201—205. [1964] When is a linear control system optimal? /. Basic Engr. (Trans. ASME, Ser. D), 86D: 51—60. (Есть русский перевод: Когда линейная система управления является оптимальной? Труды американского общества инженеров-механиков, серия D, № 1 (1964), 69.) [1965а] Irreducible realizations and the degree of a rational matrix, SIAM J, Contr., 13:520—544. [1965b] Algebraic structure of linear dynamical systems. I. The module of S, Proc. Nat. Acad. Sci. (USA), 54: 1503—1508. [1966a] Toward a theory of difficulty of computation in optimal control, Proc. 4th IBM Scientific Computing Symposium, pp. 25—43. [1966b] On structural properties of linear, constant, multivariable systems, Proc. 3rd IFAC Congress, London, to appear. [1967] Algebraic aspects of the theory of dynamical systems, in Differential Equations and Dynamical Systems, J. K. Hale and J. P. LaSalle (eds.), pp. 133—146, Academic Press. [1969] Lectures on controllability and observability, C. I.M. E. Summer School 1968, Edizioni Cremonese, Roma. [1970] On partial realizations of a linear input/output map, Guillemin Anni- versary Volume, Holt, Winston and Rinehart К а л м а н, Б ю с и (К a 1 m a n R. E., В u с у R. S.) [1961] New results in linear prediction and filtering theory, J. Basic Engr. (Trans. ASME, Ser. D), 83D: 95—100, (Есть русский перевод: Новые результаты в линейной фильтрации и теории предсказания, Труды американского общества инженеров-механиков, серия D, № 1 (1961), 123.) Калман, Хо, Нарендра (Kalman R. Е., Но Y. С., Narendra К.) [1963] Controllability of linear dynamical systems, Contr, to Diff. Equations, 1: 189—213. Канторович Л. В., Акилов Г. П. [1959] Функциональный анализ в нормированных пространствах, «Физмат- гиз», М. Келли (Kelley Н. J.) [1960] Gradient theory of optimal flight paths, ARS J., 30:947—953. [1962] Method of gradients, in Optimization Techniques, G. Leitman (ed.)', Academic Press. Кенон, Каллум, П о лл к (Canon М., Cullum С., Polak Е.) [1967] Constrained minimization problems in finite-dimensional spaces, SIAM J. Contr., 4 : 528—547.
390 Литература Клиффорд, Престон (Clifford А. Н., Preston G. В.) [1961] The Algebraic Theory of Semigroups, v. I, Mathematical Surveys, № 7, Amer. Math. Soc. (Готовится русский перевод т. т. 1 и 2.) Коддингтон, Левинсон (Coddington Е. A., Levinson N.) [1955] Theory of Ordinary Differential Equations, McGraw-Hill) (Есть рус- ский перевод: Теория обыкновенных дифференциальных уравнений, ИЛ, М„ 1968.) К о л л а т ц (С о 11 a t z L.), [1964] Funktionalanalysis und jnumerische Mathematik, Springer. (Есть рус- ский перевод: Функциональный анализ и вычислительная математика, «Мир», М., 1969.) Кранц, С а р а ч и к (К г a n с G. М., S а г а с h i k Р. Е.) [1963] An application of functional analysis to the optimum control problem, J. Basic Eng. (Trans. ASME, Ser. D), 85D: 143—150. (Есть русский перевод: Применение функционального анализа к задаче оптимального управления, Труды американского общества инженеров-механиков, се- рия D, № 2 (1963), 10.) Крон, Р о у д з (Krohn К. В., Rhodes J. L.) [1965] Algebraic theory of machines. I. The main decomposition theorem, Trans. Am. Math. Soc., 116 : 450—464. Крон, Роудз, Тилсон (Krohn К. В., Rhodes J. L., Tilson B.) [1968] The prime decomposition theorem of the algebraic theory of machines, chap. 5 of [Arbib, 1968а]. Куликовский (KulikowskiR.) [1959] On optimum control with constraints, Bull. Polish Acad. Sci., Ser. Tech. Sci., 7: 385—394. Курант (CourantR. (revised by Moser J.)) [1962] Calculus of Variations (lecture notes)4, New York University, Courant / Institute of Mathematical Sciences. К у p о ш А. Г. [1953] Теория групп, изд. 2, ГИТТЛ; изд. 3, «Наука», 1967. Кэртис, Рейнер (Curtis С. W., Reiner I.) [1962] Representation Theory of Finite Groups and Associative Algebras, Interscience-Wiley. (Есть русский перевод: Теория представления ко- нечных групп и ассоциативных алгебр, «Наука», М., 1969.) Ленг (LangS.) [1965] Algebra, Addison-Wesley. (Есть русский перевод: Алгебра, «Мир», М., 1968.) Ли, М а р к у с (L е е Е. В., М а г k u s L.) [1961] Optimal control for nonlinear processes, Arch. Ration. Meeh. Anal., 8:36—58. (Есть русский перевод: Кибернетический сборник, новая серия, Вып. 2, «Мир», 1966.) Люенбергер (LuenbergerD. G.) [1964] Observing the state of a linear system, IEEE Trans. Military Electro- nics, MIL-8: 74—80. Мак-Гилл, Кеннет (McGill R., Kenneth P.) [1963] A convergence theorem on the iterative solution of nonlinear two-point boundary-value systems, XIV IAF Congress, Paris.
Литература 391 Мак-Калох, Питтс (McCulloch W. S., Pitts W. Н.) [1943] A logical calculus of the ideas immanent in nervous activity, Bull. Math. Biophys., 5: 115—133. Мак-Лейн, Биркгоф (MacLaneS., Birkhoff G.) [1967] Algebra, Macmillan. M а к - M и л л а н (M с M i 1 fa n B.) [1952] Introduction to formal realizability theory, Bell System Tech. J., 31 : 217—279, 541—600. * Myp (Moore E. F.) [1956] Gedanken-experiments on sequential machines, in Automata Studies, С. E. Shannon and J. McCarthy (eds.), pp. 129—153, Princeton Uni- versity Press. (Есть русский перевод: сборник «Автоматы», ИЛ, 1956.) Мур (ред.) (Moore Е. F. (ed.)) [1963] Sequential Machines — Selected Papers, Addison-Wesley. Нейштадт (Neustadt L. W.) [1960] Synthesizing time-optimal control systems, /. Math. Anal. Appl., 1 : 484—493. [1965] Optimal control problems as extremal problems in a Banach space, Proc, of the Symposium on System Theory, Polytechnic Institute of Brooklyn, pp. 215—224. [1966] An abstract variational theory with applications to a broad class of optimization problems. I. General Theory, SIAM J. Contr., 4: 505—528. [1967] An abstract variational theory with applications to a broad class of optimization problems. II. Applications, SIAM J. Contr., 5: 90—137. Немыцкий В. В., Степанов В. В. [1949] Качественная теория дифференциальных уравнений, ГИТТЛ, М. Нерод (N erode А) [1958] Linear automaton transformations, Proc. Amer. Math. Soc., 9 :541—544. Пешон (P eschon J. (ed.)) [1963| Disciplines and Techniques of Modern Systems Control, Ginn-Blaisdell. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищен- ко Е. Ф. [1961] Математическая теория оптимальных процессов, Физматгиз, М. Рабин, Скотт (Rabin М. О., Scott D.) [1959] Finite automata and their decision problems, IBM J. Res. Develop., 3:114—125. (Есть русский перевод: Кибернетический сборник, Вып. 4, ИЛ, 1962.) Р о к с и н (R о х i n Е.) [1962] The existence of optimal controls, Mich. Math. J., 9:109—119. [1965] On generalized dynamical systems defined by contingent equations, J. Diff. Equations, 1 : 188—205. Роте (R о t h e E. H.) [1948] Gradient mappings and extrema in Banach spaces, Duke Math. J., 15:421-431. Сильверман, Андерсон (Silverman L. M., Anderson B. D. O.) [1968] Controllability, observability, and stability of linear systems, SIAM J. Contr., 6: 121—130. Тодд (Todd J. (ed.)) [1962] Survey of Numerical Analysis, McGraw-Hill.
392 Литература Уаймор (Wymore A. W.) [1967] A Mathematical Theory of Systems Engineering: The Elements, Wiley. Уиллис, Брокетт (Willis В. H., Brockett R. W.) [1965] The frequency domain solution of regulator problems, 1965 JACC, Troy, New York, 228—235. Уиндекнехт (Windeknecht T. G.) [1967] Unpublished class notes on General Systems Theory, Case-Western Reserve University. Фалб (F a 1 b P. L.) [1964] Infinite-dimensional control problems I: On the closure of the set of attainable states for linear systems, /. Math, Anal. Appl., 9:12—22. [1967] Infinite-dimensional filtering: the Kalman-Bucy filter in Hilbert space, Information and Control, 11: 102—137. [1968a] Stochastic differential equations in Hilbert space, to appear. [1968b] Direct Methods in Optimal Control, McGraw-Hill. Фалб, Д e й о н г (F a 1 b P. L., D e j о n g J. L.) [1968] On Successive Approximation Methods in Control and Oscillation Theory, Academic Press. Фалб, К л e й н м а н (F a 1 b P. L, К1 e i n m a n D. L.) [1966] Remarks on the infinite-dimensional Riccati equation, IEEE Trans. Automatic Control, AC-11 : 534—537. Фалб, П о л а к (F a 1 b P. L., P о 1 a k E.) [1968] Conditions for optimality, in Systems Theory, L. Zadeh and E. Polak (eds.), McGraw-Hill. Ф о p p (F a u r r e P.) [1965] EM 270a term paper, Stanford University, December, 1965. Фримэн (Freeman H.) [1965] Discrete-Time Systems, Wiley. Фробениус (Frobenius G.) [1881] Uber Relationen zwischen Naherungsbr lichen von Potenzreihen, J. reine u. angew. Math., 90: 1—17. Фрэзер, Дункан, Коллар (Frazer R. A., Duncan W. J., Col- la r A. R.) [1946] Elementary Matrices and Some Applications to Dynamics and Diffe- rential Equations, 3d ed., Cambridge University Press. (Есть русский перевод: Теория матриц и ее приложения к дифференциальным урав- нениям и динамике, ИЛ, М., 1950.) Халкин (Halkin Н.) [1963а] On the necessary condition for optimal control of nonlinear systems, J. Anal. Math. (Jerusalem), 12: 1—82. [1963b] The principle of optimal evolution, in Nonlinear Differential Equations and Nonlinear Mechanics, J. P. LaSalle and S. Lefschetz (eds.), Aca- demic Press. [1964] Topological aspects of optimal control. of dynamical polysystems, Contr. Diff. Equations, 3 : 377—385. [1967] An abstract framework for the theory of process optimization, Bull. Am. Math. Soc. X а л м о ш (H a 1 m о s P. R.) [1958] Finite-Dimensional Vector Spaces, 2d ed., Van Nostrand. (Есть русский перевод: Конечномерные векторные пространства, Физматгиз, М., 1963.)
Литература 393 Хартманне, Стирнз (HartmanisJ., Stearns R. Е.) [1966] The Algebraic Structure Theory of Sequential Machines, Prentice- Hall. Херстейн (Herstein I. N.) [1964] Topics in Algebra, Ginn-Blaisdell. X о (H о B. L.) [1966] An effective construction of realizations from input/output descriptions, doctoral dissertation, Stanford University. X о, К а л м а н (H о B. L., Kalman R. E.) [1965—1966] Effective construction of linear state-variable models from input/ output functions, Proc. Third Allerton Conf., pp. 449—459; Regelungs- technik, 14:545—548. [1970] The realization of linear, constant input/output maps. I. Complete rea- lizations, SIAM J. Contr., to appear. Холл (H a 11 M., Jr.) [1959] The Theory of Groups, McMillan. (Есть русский перевод: Теория групп, ИЛ, М., 1962.) X у С ы - ц з я н (Н u S. Т.) [1965] Elements of Modern Algebra, Holden-Day. Юла (Y о и 1 a D. C.) [1966] The synthesis of linear dynamical systems from prescribed weighting patterns, SIAM J. Appt. Math., 14 : 527—549. Юла, T и ш и (Y о и 1 a D. С., T i s s i P.) [1966] n-port synthesis via reactance extraction. Part I, IEEE Intern.^ Conven- tion Record.
ИМЕННОЙ УКАЗАТЕЛЬ Акилов Г. П. 112, 164,166—168,171,173 Альберт (Albert А. А.) 347, 376 Андерсон (Anderson В. D. О.) 358 Андрэ (Andrtee R. V.) 334, 384 Анликер (Anliker М.) 8 Арбиб (Arbib М. А.) 5, 6, 8, 9, И, 23, 185, 196, 210, 231, 232, 235, 245,257, 296 Атанс (Athans М.) 94, 108, 139, 142, 149, 162, 163, 164, 180 Балакришнан (Balakrishnan А. V.) 173 Веллман (Bellman R.) 58, 63 Бертрам (Bertram J. Е.) 62 Биркгоф (Birkhoff G.) 391 Блатт (Blatt J.) 8 Блюм (Blum Е. К.) 166/171 Болтянский В. Г. 94, 137, 139, 141, 158 Брайсон (Bryson А. Е.) 166, 171, 173 Брокетт (Brockett R. W.) 97 Брэкуэлл (Breakwell J. V.) 166, 385 Бурбаки (Bourbaki N.) 19, 237, 267, 304, 306, 314 Бушау (Bushaw D.) 23, 166 Бэсс (Bass R. W.) 62, 69 Бюси (Вису R. S.) 26, 72, ПО, 129, 130 Ван Дайн (Van Dine С. Р.) 164 Ван дер Варден (Van der Waer- den В. L.) 237, 267, 306 Вейсс (Weiss L.) 23, 74, 355, 361, 362, 367 Вербеек (Verbeek L. A. M.) 210 Весткотт (Westcott J.) 8 Витценхаузен (Witsenhausen H.) 89 Гамкрелидзе P. B. 137, 139, 141, 158 Гантмахер Ф. P. 48, 315, 375 Гибсон (Gibson J. E.) 163 Гинзбург (Ginsburg A.) 262, 263 Гинзбург (Ginsburg S.) 201 Греб (Greub W. HJ 267 Дакуна (Dacynha N.) 151, 152 Данфорд (Dunford N.) 103, 111, 112, 115—117, 120, 124, 129, 134, 135, 149, 152 Даффин (Duffin R. J.) 323 Дезоер (Desoer C. A.) 22,23,38,194,195 Дейонг (Dejong J. L.) 168, 174 Денхэм (Denham W. F.) 166, 171, 173 Джекобсон (Jacobson N.) 55, 304, 322, 323 Джильберт (Gilbert E.) 8 Джонсон (Johnson C. D.) 163 Дуб (Doob J. L.) Ill, 114, 117, 118, 124, 129 Дункан (Duncan W. J.) 376 Дьедонне (Dieudonne J.) 86, 92, 102, 103, 107, 118, 119, 152, 153, 157 Дэй (Day E. M.) 303, 386 Задэ (Zadeh L. A.) 22, 23, 38, 194,195, 367 Зарисский (Zariski O.) 370 Зееман (Zeeman E. C.) 204 Зейгер (Zeiger H. P.) 9, 196, 235, 256, 257, 260, 262, 288, 292, 326, 327,332, 352 Итон (Eaton J. H.) 164 Калаба (Kalaba R.) 166 Каллум (Cullum C.) 27, 131,137,149,150 Калман (Kalman R. E.) 5, 6, 8, 9, 11, 23, 25, 26, 31, 34, 44, 51, 57, 60—64, 66, 72, 74, 97, 99, 108, 110, 130, 203, 266—268, 286, 287, 295, 296, 315— 317, 320, 323, 325—327, 332, 344,345, 355, 358—362, 367, 368, 376, 380 Канторович Л. В. 112, 164, 166—168, 171, 173 Келли (Kelley J.) 164, 166, 171 Кеннет (Kenneth P.) 166, 174 Кенон (Canon M.) 27, 131,137,149,150 Клейнман (Kleinman D. L.), 8, 108 Клиффорд (Clifford A. H.) 211, 247 Коддингтон (Coddington E. A.) 46,47 Коллар (Collar A. R.) 376 Коллатц (Collatz L.) 89, 166, 168 Коши (Cauchy A.) 379 Кранц (Kranc G. M.) 89 Крон (Krohn К. B.) 30, 232, 235, 245, 254—256 Куликовский (Kulikowski R.) 89 Курант (Courant R.) 27, 165, 175, 177
Именной указатель 395 Курош А. Г. 248 Кушнер (Kushner Н.) 8 Кэртис (Curtis С. W.) 304 Левинсон (Leviilsdn N.) 46, 47 Ленг (Lang S.) 304, 306, 370 Ли (Lee Е. В.) 164 Люенбергер (Luenberger D. G.) 73, 74 Мак-Джилл (McGill R.) 166, 174 Мак-Калох (McCulloch W.. С.) 391 Мак-Лейн (MacLane S.) 391 Мак-Миллан (McMillan В.) 320, 323 Маркус (Markus L.) 164 Мищенко Е. Ф. 137, 139, 141, 158 Мозер (Moser J.) 27 Мур (Moore Е. F.) 391 Нарендра (Narendra К. S.) 44, 51, 57, 60 Нейштадт (Neustadt L. W.) 27, 89, 131, 137, 149—151, 158, 164, 173 Немыцкий В. В. 22 Нерод (Nerode А.) 391 Нолан (Nolan К.) 9 Ньюком (Newcomb М.) 9 Омура (Omura К.) 9 Парсонс (Parsons J.) 9 Пешон (Peschon J.) 391 Понтрягин Л. С. 137, 139, 141, 157, 158 Рабин (Rabin М. О.) 196 Рейнер (Reiner I.) 304 Роксин (Roxin Е.) 23, 146, 148 Роте (Rothe Е. Н.) 146, 177 Роудз (Rhodes J. L.) 232, 235, 245, 254—256 Самюэль (Samuel Р.) 370 Сарачик (Sarachik Р. Е.) 89 Свенсон (Swanson R.) 8 Сильверман (Silverman L. М.) 358 Скотт (Scott D.) 196 Спейер (Speyer J. L.) 166 Стерайов В. В. 22 Стирйз (Stlafns R. Е.) 257 Тилсон (Tilson В. L.) 235 Тиши (Tissi Р.) 325 Тодд (Todd J.) 89 Уаймор (Wymore A. W.) 23 Уиллис (Willes В. Н.) 97 Уиндекнехт (Windeknecht Т. G.) 22,23 Уоллес (Wallace A. D.) 303 Фалб (Falb Р. L.) 5, 6, 8, 9, 11, 26, 82, 89, 94, 108, 111, 116, 120, 123, 124, 126, 129, 130, 139, 142, 146, 149, 162—164, 168, 174, 180, 184, 384 Форр (Faurre Р.) 9, 203, 324 Фриман (Freeman Н.) 31, 310 Фробениус (Frobenius G.) 380 Фрэзер (Frazer R. А.) 376 Хазони (Hazony D.) 323 Халкин (Halkin Н.) 23, 27, 131, 137, 141, 146, 149—151, 158 Халмош (Halmos Р. R.) 51 Хартманне (Hartmanis J.) 257 Херстейн (Herstein N.) 369 Хо (Но В. L.) 44, 51, 57, 60, 267, 325— 345, 368, 380 Холл (Hall М.) 352 Ху Сы-цзян (Hu S. Т.) 211, 213, 369 Шварц (Schwartz J. Т.) 103, 111, 112, 115—117, 120, 124, 129, 134, 135, 149, 152 Шютценберже (Schutzenberger М. Р.) Юла (Youla D. С.) 296, 325, 362, 380 Якоби (Jacobi К. G. J.) 379
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автомат 27, 28, 217 — естественно толерантный 208 — конечный 17, 187, 218 — s-неприводимый 234 — приведенный 28, 218 — тождественно-возвратный 30, 233 — толерантный 204—206 -----внешне 207 Автоматы, слабо эквивалентные 29 Аддитивность систем 191 Аксиомы дистрибутивности 369 Алгебраическая эквивалентность си- стем 357 ------- нормированная 358 ------- стационарная 357 Алгоритм Б. Л. Хо 325 — вычисления инвариантных множи- телей 375 Алфавит входной 217 — выходной 217 Анцулятор множества 297 Асимптотический дифференциатор 71 Базис модуля 372 Блок разбиения 215 Векторное пространство 370 Весовая характеристика 361 Возмущение управления временное 142 ----- пространственное 142 -----фундаментальное 142 / Гомоморфизм 213 — автоматов 224 — моноидов 214 Группа 211 — абелева 212, 237 — Р/?-автоматов 235 — простая 238 Декомпозиция конечных автоматов 231 — РР-автоматов 252 Делимость 211 Делители нуля 369 Дискретные преобразования Лапласа 275 Дуальность систем 191 Единица кольца 369 — левая 239 — правая 239 Задача идентификации 65 — наблюдения 65 — оптимального управления 209 — регулирования 40 ----в пространстве выходных вели- чин 99 ----------состояний 99 — управления абстрактная 84 ---- стандартная 86, 87 Закон управления 37, 58 Идеал двусторонний 373 — левый 239, 372 — правый 239, 373 — собственный 239 Идемпотент 239 Изоморфизм систем 271 Импульсная реакция 273 — характеристика 194 Инварианты матриц 314 — модуля 304 — эндоморфизма 306 Каноническое представление матриц 56 -------идентификационное 70 Качество конечного состояния 87 — траектории перехода 87 Качество управления 84 Класс идентификации 65 — наблюдения 65 — начальный 262 — эквивалентности 215 ----Майхилла 348 ----Нерода 281 Кольцо главных идеалов 373 — классов вычетов 373, 374 — коммутативное 369 — разностей 373 — целостности 369 Конструирование систем управления 159 Конструкция регуляторов 74 Косостояние системы 136 Котраектория системы 136 Коэффициент затухания 79 — корреляции 113 Критерий реализуемости 340 — существования 256 Матрица ганкелева 326 — переходная 41
Предметный указатель 397 Метод градиентный 167, 169 — Ньютона 167 — Ньютона — Рафсона 171 — последовательных приближений 168, 173 Многочлен модуля, минимальный 297 — неприводимый 375 Множество входных воздействий 13 — выходных величин 13 — допустимых управлений 84 — достижимости 146 — конечное 216 — моментов времени 13 — несчетное 216 — состояний 13 — счетное 216 — целевое 84 — частично упорядоченное 215 Модуль 285, 371 — конечный 372 — с кручением 297 — циклический 297 Момент достижения 84 Моноид 212, 213, 223 Мощность множества 216, 217 Наблюдаемость систем 198 Необходимые условия оптимальности 131, 150 Нуль левый 239 — правый 239 Область главных идеалов 373 Объект управления 24 ---линейный 24 ---стационарный 24 Оператор сдвига 16, 274 Операция ассоциативная 211, 242 — коммутативная 212 — неассоциативная 212 — сложения 212 — умножения 212 Отношение бинарное 214 — конгруэнтности 216 — с конечным индексом 216 — эквивалентности 215, 218 ---Майхилла 221 ---Нерода 220, 280 Отображение «антипричинное» 355 — биективное 214 — вход — выход 20, 272 ------- абстрактное 362 — Я-гомеоморфное 371 — ошибок 166 — переходное 40, 41 — причинное 354 ---импульсное 355 Отображение сюръективное 214 — цикличное 48 Поверхность качества 95 Подгруппа нормальная 236 Подмодуль 373 Подполугруппа 213 Покрытие автомата 258 Поле 370 Полугруппа 185, 212 — неприводимая 242 — расширенная 258 — системы 349 Последовательность простых чисел 347 — Фибоначчи 347 Принцип дуальности управления 64 — максимума Понтрягина 137, 141, Произведение полупрямое 242 — узловое 244 Производящая функция системы 86 Пространство Банаха 17 — событий 14 — фазовое 14 Процесс винеровский 114 Процесс с ортогональными прираще- ниями 113 — ц3стационаРными приращениями — стохастический 111 Разбиение множества 215 Реализация 7, 21, 274, 292 — алгоритма Б. Л. Хо 330 — весовой характеристики 361 ------- приведенная 361 — каноническая 267, 287, 291, 293 — минимальная 267, 291 — нестационарных отображений 353 — причинного отображения 356 — частичная 341 ---минимальная 342 Реализуемое подмножество 220 Регулятор 37 Ряд композиционный 239 — нормальный 238 Система 11 — аддитивная 191 — асимптотической оценки 69 - - воспроизводящая 324 — восстанавливающая 197 — гамильтонова 140 — гладкая 19, 22, 85 — динамическая 11, 13, 20 — дуальная 196
398 Предметный указатель Система идентифицируемая 68 — каноническая 140 — классическая 22 — конечномерная 17 — линейная 18, 97 — . наблюдаемая 68, 202 — неискажающая 324 — обратимая 15, 22 — полностью достижимая 43 — постоянная 15, 16 — приведенная 186, 189 — свободная 15 — с дискретным временем 16 ---непрерывным временем 16 — сильно связная 186 — «состояние — выход» 189 — стационарная 15, 16 ---линейная 46, 47 — строго устойчивая НО — управляемая 43, 199 Системы изоморфные 271 — примитивно эквивалентные 201 — сопряженные 194, 195 Скалярное умножение 370 Случайная величина 111 Событие достижимое 42, 146 — управляемое 43 Соединение автоматов каскадное 29, 231 --- параллельное 29, 231 ---последовательное 29, 231 Сопряженная траектория 136 Состояние системы достижимое 186 --- нулевое 190 Степень дробно-рациональной матри- цы 323 — многочлена 370 Структура конечных К[з]-модулей 303 — полугруппы 349 Теорема единственности, антипричин- ный случай 367 ---причинный случай 366 --- вторая 366 --- первая 358 — Жордана — Гёльдера 239, 250 — Крона — Роудза 235 — об инвариантах 375 — о гомоморфизмах 238 ---представлении 298, 308 — реализации 290, 319 — структурная для конечных моду- лей 304 Теорема существования 145 — фундаментальная теории линейных систем 281 Теория автоматов 185 — Гамильтона — Якоби 90 — линейных систем алгебраическая 31, 266 — оптимального управления 24, 82 — регулирования линейных объектов 34 — управления, элементарная 23, 34 Толерантное произведение 209 — пространство 204 Толерантность 204 Триггер 233 Управление минимальное 92 — Я-минимальное 160 — оптимальное 88 Управляемость систем 198’ Уравнение Винера — Хопфа 121 Уравнение возмущенного движения 133, 169 — Гамильтона — Якоби 92 — Риккати 101 Факторгруппа 237 Факторизация каноническая 289 Факторкольцо 373 Факторы 238 Фильтр Калмана — Бюси НО Формальный многочлен 348 — степенной ряд 370 Функционал качества квадратичный 98 Функция, выходная одношаговая 28, 217 — s-интегрируемая 118 — передаточная 306, 308 — переходная одношаговая 28, 217 — характеристическая 220 Эквивалентные состояния 186, 218 — системы 186, 189 Эксперимент множественный 200 ----ветвящийся 200 — простой 200 ----ветвящийся 200 Элемент оптимальный 149, 151 Элементы 234 Эпиморфизм канонический 237
ОГЛАВЛЕНИЕ Предисловие редактора перевода .................................... 5 Предисловие........................................................ 7 ВВОДНАЯ ЧАСТЬ 1 В помощь читателю................................................11 1.1. Системы и состояния..........................................11 1.2. Элементарная теория управления...............................23 1.3. Теория оптимального управления . :...................24 1.4. Автоматы.....................................................27 1.5. Алгебраическая теория линейных систем........................31 ПЕРВАЯ ЧАСТЬ. ЭЛЕМЕНТАРНАЯ ТЕОРИЯ УПРАВЛЕНИЯ С СОВРЕМЕННОЙ ТОЧКИ ЗРЕНИЯ 2 Теория регулирования линейных объектов.......................... 34 2.1. Постановка задачи управления.................................35 2.2. Гладкие линейные системы.....................................40 2.3. Стационарные линейные системы...........т . . ...............46 2.4. Замена координат и канонические формы........................53 2.5. Понятие закона управления....................................58 2.6. Определение состояний........................................63 2.7. Конструкция регуляторов..................................... 74 ВТОРАЯ ЧАСТЬ. ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 3 Основы теории оптимального управления............................82 3.1. Абстрактная задача управления................................83 3.2. Гладкие динамические системы.................................85 3.3. Стандартная задача управления................................86 3.4. Теория Гамильтона — Якоби.............................. ... 90 3.5. Линейные системы с квадратичным критерием качества...........97 3.6. Фильтр Калмана — Бюси........................................ПО 4 . Необходимые условия оптимальности.............................131 4.1. Необходимые условия оптимальности . . . ....................131 4.2. Принцип максимума Понтрягина................................137 4.3. Теорема существования ......................................145 4.4. Замечания о необходимых условиях оптимальности в задачах упра- вления . .......................................................148 Приложение к главе 4 4.А. Необходимые условия оптимальности..............................150 5 Конструирование систем управления...................................159 5.1. Один простой пример............................................159 5.2. Конструирование систем управления с помощью принципа Понтрягина 163 5.3. Численные методы теории управления; общие замечания............164 5.4. Вычислительные методы теории управления; косвенные методы . . .168 5.5. Вычислительные методы теории управления; прямые методы .... 175
ТРЕТЬЯ ЧАСТЬ. ТЕОРИЯ АВТОМАТОВ 6 Теория автоматов г точки зрения теории управления ............ 185 6.1. Полугруппы................................................ 185 6.2. Аддитивность и дуальность..................................190 6.3. Управляемость и наблюдаемость..............................198 6.4. Толерантные автоматы ......................................204 7 Основные понятия теории автоматов и теории полугрупп...........211 7.1. Полугруппы и конгруэнтность................................211 7.2. Автоматы, приведенные формы и отношения эквивалентности . . . 217 7.3. Автоматы и полугруппы.................................... 224 8 Декомпозиция конечных автоматов без петель ....................231 8.1. Общий взгляд на теоремы декомпозиции.......................231 8.2. Некоторые сведения из теории групп и полугрупп.............236 8.3. Результаты о неприводимости................................241 8.4. Доказательство теоремы Жордана — Гёльдера..................248 9 Доказательство теорем о декомпозиции конечных автоматов........252 9.1. Декомпозиция Р/?-автоматов.................................252 9.2. Доказательство теоремы о декомпозиции с помощью теории полугрупп 254 9.3. Декомпозиции с помощью «покрытий»..........................257 9.4. Декомпозиция на Р/?-автоматы...............................260 ЧЕТВЕРТАЯ ЧАСТЬ. СОВРЕМЕННАЯ ТЕОРИЯ ЛИНЕЙНЫХ СИСТЕМ 10 Алгебраическая теория линейных систем.........................266 10.1. Основные определения.....................................268 10.2. Отображение вход — выход для линейной системы............272 10.3. Структура К[?]-модулей в Q и Г...........................275 10.4. Модули и эквивалентность Нерода .........................279 10.5. Пространство состояний как модуль........................282 10.6. Теория абстрактной реализации............................286 10.7. Циклические модули.......................................296 10.8. Структура конечных К[г]-модулей..........................303 10.9. Передаточные функции.....................................306 10.10. Применения алгоритма вычисления матричных инвариантов . . .311 10.11. Алгоритм Б. Л. Хо........................................325 10.12. Полугруппы и простые линейной конечномерной системы .... 347 10.13. Реализация нестационарных отображений вход — выход с непре- рывным временем................................................ 353 Приложения к главе 10..............................................369 10.А. Обзор теории модулей (369). 10.В. Частичная реализация отобра- жения вход—выход (в скалярном случае) (376). 10.С. Первое доказа- тельство теоремы единственности канонических реализаций (380). 10.Д. Указатель обозначений.................................. 383 Литература....................................................... 386 Именной указатель................................................ 394 Предметный указатель . . ..........................................396