Текст
                    УДК 517.9:62.50	((	Издание осуществлено при поддержке
ББК 22.161.6	FctpM Российского фонда фундаментальных
~ исследований по проекту 01-01-14011
Егоров А. И. Уравнения Риккати. — М.: ФИЗМАТ ЛИТ, 2001. — 320 с. —
ISBN5-9221-0159-5.
Рассматриваются скалярные, матричные и операторные уравнения Риккати. Из-
Излагаются теоретические вопросы и практические методы решения таких уравнений.
Приводится необходимый вспомогательный материал из алгебры, функционального
анализа и теории групп Ли. Теоретические вопросы иллюстрируются решением мно-
многочисленных примеров. Наиболее полно представлен материал по матричным уравне-
уравнениям Риккати. Для их анализа предлагается специально разработанный аппарат групп
Ли на матрицах. Теоретические вопросы по матричным и операторным уравнениям
излагаются на базе различных прикладных задач из математической физики и теории
управления системами с сосредоточенными и распределенными параметрами.
Для преподавателей университетов и технических вузов, а также студентов соот-
соответствующих специальностей.
© ФИЗМАТЛИТ, 2001.
ISBN 5-9221-0159-5	© А.И. Егоров, 2001


ПРЕДИСЛОВИЕ Замысел написать эту книгу возник после безуспешных попыток автора этих строк найти в современной литературе работу, в которой были бы представле- представлены с достаточной полнотой различные результаты по теории уравнений Риккати (скалярных, матричных и операторных). Как оказалось, подобные работы были опубликованы достаточно давно, и они ни в коей мере не отражают современное состояние в исследовании этих уравнений. К таким работам следует отнести прежде всего монографию В.Т. Рида [45] и обстоятельный обзор М.Х. Захара- Иткина [21]. В последующих работах изучались, к сожалению, лишь частные типы уравнений Риккати в связи с той или иной проблемой прикладного харак- характера1. Вместе с тем, бурное развитие теории управления в последние десятилетия породило ряд новых математических задач (аналитическое конструирование ре- регуляторов, оценка параметров и состояния систем и т.д.; см., например, [1, 10, 27, 28]) решение которых приводит к операторным уравнениям в конечномерных и бесконечномерных функциональных пространствах. Общность и многообразие возникающих здесь проблем делает естественным стремление рассмотреть урав- уравнения Риккати во всей их полноте, начиная со скалярных и кончая уравнениями в бесконечномерных функциональных пространствах. Следует также отметить возросший интерес к уравнениям Риккати в связи с использованием метода прогонки в решении различных задач математической физики. Как известно, многие задачи теории теплопроводности, диффузии и динамики процессов в сплошных средах можно описать краевыми задачами для линейных уравнений в частных производных. При численном решении таких задач с использованием метода прогонки удается существенно упростить проце- процедуру получения приближенных решений. Попытка собрать воедино весь необходимый материал по уравнениям Риккати привела к значительному увеличению объема этой работы и изложить его в виде одной небольшой книги не удалось. Поэтому предлагаемая книга содержит весь, как нам кажется, необходимый вспомогательный материал и наиболее важные (а может быть, даже наиболее простые) результаты, относящиеся к различным классам уравнений Риккати. Более сложные и содержательные факты предпола- предполагается рассмотреть в следующей книге на эту же тему. Что касается приложений, то пришлось ограничиться лишь двумя направлениями. Это теория управления и метод прогонки. Сформулированы также некоторые задачи математической физики, приводящие к бесконечномерным уравнениям Риккати. По материалам книги автор прочитал спецкурс для студентов-математиков См., например: Зеликин М.И. Однородные пространства и уравнения Риккати в вариационном исчислении. — М.: Факторил, 1998. — 352 с.
4 Предисловие Запорожского государственного университета. Ее содержание неоднократно об- обсуждалось с М.А. Егоровым, который предоставил автору весь собранный им ма- материал по групповому анализу, необходимому для исследования уравнения Рик- кати, а также свои опубликованные и неопубликованные работы. Часть этого материала включена в книгу. Это § 1.5, 1.6, 2.3, 2.6-2.9. Автор искренне при- признателен И.В. Богун, которая оказалась первым читателем книги и помогла в ее редактировании, П.И. Когуту, прочитавшему третью главу и сделавшему ряд полезных замечаний, и В.Н. Шакирову за критические замечания по работе. Книга, безусловно, не лишена недостатков (малых и, возможно, принципиаль- принципиальных). Поэтому, рассчитывая на внимательного творческого читателя, автор с благодарностью примет каждое критическое замечание. А.И. Егоров
ВВЕДЕНИЕ Перед Вами книга, посвященная разнообразным проблемам теории и приложе- приложений скалярных, матричных и операторных уравнений Риккати. Еще на заре раз- развития теории дифференциальных уравнений уравнение Риккати было объектом многочисленных исследований и источником новых идей. Достаточно напомнить замечательный результат Ж. Лиувилля, который показал, что скалярное уравне- уравнение где а, Ъ и а — постоянные, интегрируется в квадратурах лишь при условии, что постоянная а представима в виде 4т ±1±2 При всех других значениях а решение уравнения не может быть выражено квад- квадратурами от элементарных функций. Каждая новая идея в исследовании нелинейных дифференциальных уравнений непременно апробировалась на уравнениях Риккати. Замечательный норвежский математик Софус Ли, создавший теорию групп (позже названных его именем) и показавший ее эффективность в решении дифференциальных уравнений, также не обошел вниманием уравнение Риккати. В частности, исследуя задачу о су- существовании фундаментальной системы решений таких уравнений, он показал, что уравнение Риккати является наиболее общим уравнением первого порядка, которое имеет фундаментальную систему решений. Интенсивное развитие вычислительной техники породило множество новых идей в теории приближенных методов решения дифференциальных уравнений. Одна из них, предложенная И.М. Гельфандом и О.Б. Локуциевским [7], лежит в основе метода прогонки решения краевых задач для обыкновенных дифференци- дифференциальных уравнений и уравнений в частных производных. При численном решении линейных краевых задач с многоточечным заданием граничных условий методом прогонки все дополнительные условия удается перенести в одну точку. Однако для этого необходимо решать уравнения Риккати, которые неизбежно появляют- появляются в процессе этого переноса. Эффективность предложенного метода проверена при решении многочисленных задач в аэрогидродинамике, атомной технике, при расчетах линий электропередач (см., например, [20, 33]). Интерес к уравнению Риккати определялся не только внутренними проблема- проблемами математики. Математический анализ различных задач прикладных наук при- приводит к необходимости решать или исследовать уравнения Риккати. Отметим лишь некоторые из них. Как оказалось, при исследовании многих физических
6 Введение процессов важная роль уравнений Риккати определяется физической интерпре- интерпретацией его решений. В электродинамике слоистых сред [4], в теории многоволно- многоволновых линий электропередачи [20], в гидравлике трубопроводов [9] и т.д. решение уравнения Риккати дает основной параметр линейной системы — импеданс или коэффициент отражения, матрицу рассеяния электромагнитных волн, либо сто- стохастическую матрицу диффузионного процесса. Принципиально новый этап в использовании уравнений Риккати при реше- решении прикладных задач наступил в 50-е годы XX столетия. Возникновение и стремительное развитие теории управления породило массу принципиально но- новых математических задач, непосредственно относящихся к дифференциальным уравнениям (задачи об оптимальном управлении, задачи оценки параметров сис- системы и ее состояния и т.д.). Их решение для обыкновенных дифференциальных уравнений довольно часто приводит к матричным дифференциальным уравнени- уравнениям Риккати вида (см., например, [1, 25, 27, 35]) ^ = P(t) + A(t)X + XB(t) + XR(t)X, A) где A(t), B(t), P(t) и R(t) — заданные квадратные матрицы, а X — искомая матрица. В журнальной и учебной литературе, а также в монографиях по теории управ- управления таким уравнениям уделяется достаточно много внимания и они анализи- анализируются с позиций тех приложений, которые в этих работах рассматриваются. Ряд задач из теории управления приводит к уравнения вида A), но с постоян- постоянными матрицами А, В, Р и R. В этом случае актуальным оказывается вопрос о существовании, свойствах и единственности решения алгебраического уравнения Риккати Р + АХ + ХВ + XRX = 0, где О — квадратная матрица, все элементы которой являются нулями. С развитием теории управления системами с распределенными параметрами возникла необходимость рассматривать различные обобщения уравнения A) в бесконечномерных пространствах. Такими обобщениями стали интегро-диффе- ренциальные краевые задачи Риккати, которые появляются, например, при реше- решении задач об оптимальном управлении диффузионными и тепловыми процессами (см., например, [10]). Аналогичные краевые задачи Риккати необходимо изучать при решении оптимизационных задач для волновых процессов. К настоящему времени сделаны лишь первые шаги в практическом решении этих краевых задач и их теоретическом исследовании. Некоторые вопросы те- теории уравнения Риккати в гильбертовых пространствах разработаны А.В. Ба- лакришнаном [2]. Уравнения Риккати в других функциональных пространствах рассмотрены Ж.-Л. Лионсом [28]. В настоящей книге сделана попытка последовательно изложить различные на- направления теории уравнений Риккати и способы их практического решения. Круг рассматриваемых вопросов оказался большим. Поэтому пришлось привле- привлекать много вспомогательного материала (по теории матриц [5, 30, 26], по функ- функциональному анализу [2, 24, 36, 39], по теории групп Ли [19, 22, 23, 32, 33] и т. д.).
Введение 7 Он излагается в первой главе и сопровождается решением многочисленных при- примеров. Некоторые из этих вопросов представлены несколько более полно, чем это диктуется непосредственными применениями в излагаемой теории, что дает реальную базу для углубленного изучения рассмотренных в книге проблем. В этой связи следует обратить внимание прежде всего на содержание четвер- четвертой главы. В ней достаточно много внимания уделяется описанию прикладных задач, которые приводят к бесконечномерным уравнениям Риккати. Эти задачи взяты из математической физики и теории управления. Однако в ней почти нет детального анализа полученных уравнений (как это сделано в главе 2 по отноше- отношению к матричным уравнениям). Аппарат банаховых алгебр и теории групп Ли, кратко изложенный в первой главе, предназначен непосредственно для исследо- исследования операторных уравнений Риккати. Исходя из тех же соображений (работа на перспективу!) в библиографии указаны монографии [6, 8], которые могут быть полезными при использовании теории групп в анализе матричных и операторных уравнений Риккати. В оглавлении достаточно подробно отмечены все те вопросы, которые рассмот- рассмотрены в книге и нет необходимости еще раз останавливаться на этом. Отметим лишь, что, к сожалению, вне книги оказались многие важные разделы теории и приложений уравнений Риккати, в решении которых получены существенные результаты. В частности, в нее не включены довольно содержательные исследо- исследования по применению полугрупп дробно-линейных преобразований к матричным дифференциальным уравнениям Риккати [21]. Не рассмотрены также сингулярно возмущенные уравнения Риккати и многие другие важные вопросы теории таких уравнений. Этим и другим, не менее интересным и содержательным результа- результатам, относящимся к уравнениям Риккати, предполагается посвятить следующую книгу на ту же тему. Тем не менее, как нам кажется, изложенный в книге материал может дать представление о многообразии идей и методов, используемых при исследова- исследовании уравнений Риккати, об их разнообразных приложениях. Книга может быть полезной студентам и преподавателям университетов и технических вузов, из- изучающим и применяющим алгебру и дифференциальные уравнения. Изложение каждого раздела в теории уравнения Риккати не завершается формулировкой наиболее общего и всеобъемлющего результата. Излагаются, как правило, лишь наиболее простые факты. Автор также не стремился наиболее полно отразить со- содержание каждого метода по рассматриваемому теоретическому вопросу. Цель была скромнее: изложить самые простые результаты теории и показать ее прак- практическое использование при решении соответствующих примеров. В частности, указанная методика применена при изложении проблемы чис- численного решения алгебраического матричного уравнения Риккати. Этой теме посвящено множество работ (см., например, [1, 25, 27, 35, 37]). Из них выбрана статья [37] и подробно изложены ее результаты. Аналогичный подход выбран и при изложении вопросов, относящихся к теоремам существования и единст- единственности решения задачи Коши для дифференциальных матричных уравнений Риккати. При изложении материала по бесконечномерным уравнениям Риккати пришлось ограничиться лишь выводом соответствующих уравнений, исходя из
8 Введение конкретных прикладных задач. Избранный способ отбора материала определил характер и объем ссылок на литературу. В приведенной библиографии указаны лишь те работы, на которые есть ссылка в тексте книги. Несколько слов об оформлении книги. Ее содержание разбито на главы, па- параграфы в которых имеют двойную нумерацию (§ 2.3 означает параграф три из второй главы). Аналогично используется нумерация примеров и теорем (теоре- (теорема 3.2 — это теорема вторая из параграфа три текущей главы). Примеры имеют аналогичную нумерацию.
Глава 1 Матрицы, операторы и группы § 1.1. Матричные многочлены Анализ и решение алгебраических и дифференциальных уравнений Риккати в значительной мере опираются на теорию матриц, особенно в той ее части, кото- которая связана с так называемыми А-матрицами или, как их еще иначе называют, матричными многочленами. Мы приведем лишь некоторые, основные факты из этой теории, опуская доказательства соответствующих теорем, и будем стре- стремиться иллюстрировать эти утверждения анализом подходящих примеров. Рас- Рассматриваемая теория применима, вообще говоря, к произвольным прямоуголь- прямоугольным матрицам. Однако в дальнейшем речь будет идти лишь о квадратных мат- матрицах. 1. Эквивалентные матрицы и инвариантные множители. Рассмотрим квадратную матрицу //п(А) Д2(А) ... /ш(А) п/и /21 (А) /22 (А) ... /2п(А) b (A) = \/ш(А) /п2(А) ... fnnC< элементами которой являются многочлены относительно А с коэффициентами из числового поля К. Матрицы такого типа будем называть Х-матрицами или многочленными матрицами. Каждое из следующих четырех преобразований в дальнейшем будем называть элементарным. 1. Умножение какой-либо строки на число (отличное от нуля) из поля К. 2. Прибавление к одной строке матрицы какой-либо другой ее строки, умно- умноженной на произвольный многочлен /(А). 3. Умножение какого-либо столбца на число (отличное от нуля) из К. 4. Прибавление к какому-либо столбцу элементов другого столбца, умноженного на произвольный многочлен /(А). Две матрицы F(X) и G(X) называются эквивалентными, если они получаются одна из другой цепочкой элементарных преобразований. Для упрощения формул, будем обозначать через {/i(A),...,/П(А)} матрицу вида A.1), у которой по главной диагонали стоят элементы fi(X), а все остальные элементы матрицы равны нулю, т. е. /Л (А) 0 ... О О /2 (А) ... О A.2) V 0 0 ... /П(А), Тот же символ {/i(A),..., /П(А)} обычно используется и для обозначения век-
10 Гл. 1. Матрицы, операторы и группы тора с компонентами /г(А). Чтобы избежать недоразумений при употреблении этого обозначения, будем использовать слова «вектор» или «матрица» в зависи- зависимости от того, в каком смысле употребляется символ {/i(A),..., /П(А)}. Определение 1.1. А-матрица A.2) называется канонической диагональной, ес- если каждый диагональный элемент /г (А) является делителем следующего /^+i(A) и если все отличные от нуля многочлены /i(A),... ,/т(А) имеют старший коэф- коэффициент, равный единице. Отсюда, в частности, вытекает, что нули, имеющиеся в цепочке функций /i(A),..., /п(А), должны занимать последнее место, так как нуль не может быть делителем никакого ненулевого многочлена. С другой стороны, если среди этих функций имеются отличные от нуля числа, то все они должны быть равными единице и располагаться в начале цепочки. Таким образом, в общем случае к п-к-1 А-матрица имеет вид { 1,..., 1, Д+ь ..., fk+u 0,..., 0 }. Теорема 1.1. Всякая Х-матрица конечным числом элементарных преобразо- преобразований приводится к канонической диагональной форме. Доказательство. Поскольку доказательство теоремы конструктивно, то при- приведем его полностью. Пусть G — некоторая матрица. Если все ее элементы нули, то доказывать нечего. Она уже имеет каноническую диагональную форму. Поэтому предполо- предположим, что G — ненулевая матрица. Среди всех эквивалентных ей матриц выберем ту, у которой элемент, стоящий в левом верхнем углу, отличен от нуля и имеет наименьшую степень. Пусть матрица A.1) является именно такой матрицей. Покажем, что все элементы первой строки и первого столбца этой матрицы делятся без остатка на /ц(А). В самом деле, пусть /н(А) = /п(А)^(А) + г»(А), г = 1,...,п, A.3) где qi(X) и гДА) — полиномы, причем степень гДА) ниже степени /ц(А). Произведем над матрицей A.1) следующее элементарное преобразование: из элементов г-го столбца вычтем элементы первого столбца, умноженные на qi(X). Из равенства A.3) следует, что элемент, стоящий в первой строке и г-м столб- столбце, равен гДА). Так как по предположению элемент /ц(А) имеет наименьшую степень среди всех fij(X), то гДА) = 0, Аналогично доказывается, что /ii(A) = /n(A)Si(A), j = l,...,п. A.4) Учитывая установленные свойства матрицы F(A), выполним две следующие последовательности элементарных операций. Сначала обратим в нуль /н(А), г = 2,...,п. Для этого умножаем первый столбец на qi(X) и то, что получится, вычитаем из элементов г-го столбца при г = 2,...,п. Затем такую же цепочку операций выполним и относительно строк полученной матрицы. В силу соотно-
1.1. Матричные многочлены 11 шений A.3) и A.4) получим матрицу //и (А) О /122 (А) Я(Л) = о V о A.5) Лп2(А) где hij(X) — некоторые полиномы. Покажем, что все полиномы hij(X) делятся на /ц(А) без остатка. Предполо- Предположим противное, что, например, /i22(A) не делится на /ц(Л). Прибавим к первой строке матрицы Н ее вторую строку. В результате получим матрицу Н, которая обладает следующими свойствами. 1. Н эквивалентна G. 2. Левый верхний элемент матрицы Н отличен от нуля и имеет наименьшую степень. 3. В первой строке матрицы Н имеется элемент /i22(A), который не делится на первый элемент этой строки. Как показано выше, сочетание этих свойств у одной и той же А-матрицы не- невозможно. Рассмотрим теперь матрицу /122 (А) ... h2n(X)\ (Л) = \hn2(X) ... /inn (A)) которую подвергнем тем же преобразованиям, что были сделаны с F(X). В ре- результате получим матрицу вида /<?22(А) 0 ... О \ #2 (А) = \ о Следовательно, матрица -F(A) преобразуется к виду //ii(A) 0 0 ... О О Л22(А) 0 ... О #2= 0 0 fc33(A) ¦¦¦ к3п(Х) \ 0 0 кп3(Х) ... knn(X)J Продолжая этот процесс дальше, через конечное число шагов получим требуемую каноническую диагональную форму A.6) Полиномы d/c(A), к = 1,...,п, называются инвариантными множителями матрицы A.1). Замечание 1.1. Из доказанной теоремы следует, что в любом классе эквива- эквивалентных матриц существует хотя бы одна, имеющая каноническую диагональ- диагональную форму. Однако справедлива теорема единственности.
12 Гл. 1. Матрицы, операторы и группы Пример 1.1. Рассмотрим класс матриц, эквивалентных данной матрице /А-2 -1 О F(X) = I О Л-2 -1 V О О А-2, У этой матрицы имеются ненулевые постоянные элементы. Поэтому на первом шаге выписываем эквивалентную F(X) матрицу, у которой в левом верхнем углу стоит такой ненулевой элемент. Пусть это будет матрица, полученная из F(X) перестановкой первого и второго столбцов: / -1 А-2 О Fi(A) = А-2 0 -1 \ 0 0 А-2у Чтобы сделать второй элемент первый строки нулевым, первый столбец умно- умножаем на А —2 и полученный результат прибавляем ко второму столбцу. Получаем следующую матрицу / -1 О О F2(A) = А-2 (А-2J -1 V О О А-2, На следующем шаге добиваемся того, чтобы первый элемент второй строки был равен нулю. С этой целью первую строку умножаем на А — 2 и полученный результат прибавляем ко второй строке. Получаем матрицу /-1 О О ВД)= О (А-2J -1 V 0 0 А-2у Теперь переставим второй и третий столбцы с тем, чтобы в верхнем левом углу матрицы из двух последних строк и столбцов оказался полином наименьшей степени относительно А. В итоге имеем /-1 О О ВД)= 0 -1 (А-2J V О А-2 О Умножаем второй столбец на (А - 2J и результат прибавляем к третьему столбцу. Получаем матрицу /-1 О О F4(A) = 0 -1 О V О А-2 (А-2K, Вторую строку полученной матрицы умножаем на А — 2 и складываем с третьей строкой. В итоге получаем /-1 О О ВД) =o-i о V 0 0 (А-2K Умножая, наконец, первую и вторую строки на -1, получаем матрицу в канони-
§ 1.1. Матричные многочлены 13 ческой диагональной форме F6(A) = {l,l,(A Возвращаясь вновь к матрице A.1), отметим, что каждый ее минор являет- является полиномом. Обозначим через D/c(A) наибольший общий делитель миноров к-го порядка матрицы A.1) со старшим коэффициентом, равным 1. Тогда Di(A) — НОД элементов матрицы F(X), a Dn(X) равен определителю матрицы F(X), деленному на свой старший коэффициент. Для матрицы М(А), определяемой формулой A.6), мы имеем Dfc(A) = di(A)...dfc(A), k = l,...,n. A.7) Из формул A.7) следует, что если d\ ф 0,..., dm ф 0, то d1(A)=U1(A), d2(\) = ^l ..., dm(X)= nm(XL- A-8) Важное значение для дальнейшего анализа свойств А-матриц имеет следующая Теорема 1.2. Эквивалентные Х-матрицы имеют один и тот же наибольший общий делитель миноров k-го порядка, к = 1,..., п. Доказательство этой теоремы приводить не будем, так как в дальнейшем ана- анализе оно не используется. Из теоремы 1.2 следует, что матрицы F(X) и G(X) эквивалентны тогда и только тогда, когда их наибольшие общие делители к-ro порядка совпадают при к = 1,... ,п. Другой критерий эквивалентности матриц F(X) и G(X) состоит в том, что справедливо равенство F(A)=P(A)G(A)Q(A), A.9) где Р(А) и Q(X) — А-матрицы с постоянными, отличными от нуля определите- определителями. Матрицы F(X) и G(X) называются скалярно эквивалентными, если Р и Q в соотношении A.9) постоянны. А-матрица В{\) = ВОХШ + ВгХ™-1 + ... + ?m_iA + Вш называется регулярной, если Во — неособенная матрица. Следующие две теоремы, играющие важную роль в теории А-матриц, также приведем без доказательств, поскольку эти доказательства не представляют са- самостоятельного интереса. Теорема 1.3. Если Х-многочлены первой степени АХ + В и СХ + D регулярны и эквивалентны, то они и скалярно эквивалентны. Постоянные матрицы А и В называются подобными, если существует неосо- неособенная матрица Г такая, что А = Т-гВТ. A.10) Теорема 1.4. Для того чтобы матрицы А и В были подобными, необходимо
14 Гл. 1. Матрицы, операторы и группы и достаточно, чтобы их характеристические матрицы ХЕ — Аи ХЕ — В были скалярно эквивалентными. Эта теорема дает практически удобный алгоритм установления факта подобия матриц А и В. Он состоит в следующем. 1. Сначала составляем характеристические матрицы ХЕ -Аи ХЕ - В. 2. Затем каждую из них приводим к канонической диагональной форме А = {dia(A),..., dra(A)}, В = {dib(A),..., dgb(A)}. Если эти матрицы совпадают, то ХЕ — Аи ХЕ — В эквивалентны, а следо- следовательно, А и В подобны. В ряде случаев для подобных матриц А и В нужно находить матрицу Т такую, чтобы выполнялось равенство A.10). Пока известен только один способ. Следует решать уравнение ТА = ВТ. При невысоком порядке матриц это уравнение решается просто. Многие полезные свойства Л-матриц устанавливаются с помощью операции правого (левого) деления матрицы на матрицу. Пусть заданы матрицы А(Х) = АОХШ + AiA™ + • • • + Am_iA + Am, В(Х) = В0Хр + ВгХР'1 + • • • + Ар-гХ + Ар, причем матрица В(Х) является регулярной, т.е. у нее постоянная матрица Во является неособенной. Будем говорить, что матричные многочлены Q(X) и R(X) являются соответ- соответственно правым частным и правым остатком при делении А(Х) на В(Х), если справедливо равенство A(X) = Q(X)B(X)+R(X) A.11) и степень R(X) меньше степени В(Х). Аналогично будем называть многочлены Q(X) и R(X) соответственно левым частным и левым остатком, если A(X)=B(X)Q(X)+R(X) A.12) и степень Д(А) ниже степени В(Х). Формулы A.11) и A.12) строятся достаточно просто. Рассмотрим правое де- деление А(Х) на В(Х). Если т < р, то можно положить Q(X) = О, R(X) = А(Х), где О — матри- матрица с нулевыми элементами (см. ниже A.15)). В случае, когда т ^ р, применим обычную процедуру деления многочлена на многочлен. «Разделим» старший член делимогоАоА771 на старший член делителя В$ХР. Получим старший член искомого частного АоВ^1Хгп~р. Умножим этот член справа на делитель В(Х) и получен- полученное произведение вычтем из А(Х). В результате имеем первый «остаток» ^\ А(Х) = А0В^1Хш-рВ(Х) + А^(Х). A.13) Степень т^ многочлена А^(Х) меньше т: А^(Х) = А^ХШ + ..., где
§ 1.1. Матричные многочлены 15 т. Если ттт^1) ^ р, то, повторяя этот процесс, получаем Так как степени многочленов A^\\), А^2\Х), ... убывают, то на некотором этапе мы прийдем к остатку Д(А), степень которого меньше р. Тогда из фор- формул A.13) и A.14) будет следовать справедливость формулы A.11). Аналогично получается доказательство справедливости формулы A.12). Теорема 1.5. Для произвольной Х-матрицы А(Х) и регулярной матрицы В(Х) представления A.11) и A.12) однозначны, т.е. в каждой из этих формул мат- матрицы Q(A), Д(А), R(X) и Q(X) определяются однозначно. Пусть р(Х) = poXq + р\Хд~г + ... + Pq-iX + pq — некоторый полином. Он на- называется аннулирующим для матрицы n-го порядка А, если следующая матрица р{А) = poAq + p\Aq~x + ... + pq-iA + pqE имеет только нулевые элементы, т. е. /о о ... о \о о ... о Согласно теореме Гамильтона-Кэли, характеристический полином матрицы А яв- является ее аннулирующим многочленом. Аннулирующий многочлен наименьшей степени со старшим коэффициентом, равным единице, называется минимальным многочленом. Он определяется по формуле (AL, A-16) где ,Dn_i(A) — наибольший наибольший общий делитель миноров п —1-го порядка матрицы А. При этом установлено, что если Д(А) = (А - Ai)ni ... (А - As)ns, где s п\ + ... + ns = п, то ф(Х) = (А - Ai)mi ... (А - Х3)Шз, здесь ^ mj = ш, rrij > 0. 2. Каноническая форма Жордана. Практически все вопросы, связанные с использованием матриц в решении различных прикладных задач, в той или иной форме используют преобразование матрицы к жордановой форме. Пробле- Проблемы, связанные с матричным уравнением Риккати, не являются исключением. Более того, практическое решение конкретных уравнений в ряде случаев оказы- оказывается возможным при практическом приведении заданных матриц к каноничес- канонической жордановой форме. В этом можно убедиться на многочисленных примерах, рассмотренных во второй главе. Поэтому мы очень кратко сформулируем основные положения теории вопро- вопроса о жордановой форме матрицы и несколько подробнее рассмотрим различные иллюстративные примеры. Здесь очень важно напомнить некоторые известные факты. Для его практически удобного использования нам представляется целе- целесообразным применять не совсем установившиеся обозначения. Пусть X — матрица порядка п с вещественными или комплексными компо- компонентами Хц~. Тогда характеристическая матрица ХЕ - X является А-матрицей,
16 Гл. 1. Матрицы, операторы и группы элементы которой являются полиномами не выше первой степени. Элементар- Элементарными преобразованиями эта матрица приводится к канонической диагональ- диагональной форме: Х(Х) = {di(A),..., dm(A)}, где d&(A) является делителем полинома dfc+i(A), к = 1,...,т — 1. При этом те элементы dj(X), которые тождествен- тождественно равны нулю, стоят в конце цепочки di(A),..., dm(A). Каждый отличный от постоянной элемент di(X) разлагается в поле комплексных чисел на множители: di(X) = е™п(Х).. . е™^(А), где е^(А) = А - Л^-, Xij — постоянные. Биномы е™гз называются элементарными делителями инвариантного множителя di{\). Элементарные делители всех непостоянных инвариантных множителей назы- называются элементарными делителями матрицы X. Здесь важно отметить, что если один и тот же бином является элементарным делителем нескольких инва- инвариантных множителей, то как элементарный делитель матрицы он повторяется столько раз, сколько встречается у инвариантных множителей. Аналогичным образом определяются элементарные делители произвольной А-матрицы. /2 1 0\ Пример 1.2. Пусть задана матрица X = 0 2 1 . Ее характеристичес- \0 0 2/ кая матрица приводится к канонической диагональной форме (см. пример 1.1) Х(Х) = {1,1, (А — 2K}. Следовательно, в этом случае бином (А — 2K является единственным, отличным от постоянной, инвариантным множителем матрицы X. Он же является ее единственным элементарным делителем. Теорема 1.6. Порядок, ранг и система элементарных делителей Х-матрицы полностью определяют ее инвариантные множители и, следовательно, определя- определяют саму матрицу с точностью до элементарных преобразований. Пример 1.3. Требуется построить матрицу X, если известно, что ее порядок равен 4, ранг равен 3 и задана система элементарных делителей (А + 1K, (А + 2J, (А + 2J, А-3, А-3. Записываем искомую матрицу в следующей канонической диагональной фор- форме: X = {di (Л), б?2 (А), б?з (А), с?4 (А)}. Так как ранг матрицы равен трем, а нули должны стоять в конце цепочки инвариантных множителей, то имеем сЦ(А) = 0. Множитель б?з(А) должен делиться без остатка на все предыдущие множители, т.е. на d2(X) и di(A). Поэтому d3(A) = (А + 1K(А + 2J(А - 3). Остались не востребованными делители (А + 2J и А - 3. Их произведение берем в качестве d2 = (A + 2J(A-3). Таким образом, получаем X = {1, (А + 2J(А - 3), (А + 1K(А + 2J(А - 3), 0}. Для дальнейшего анализа различных задач особый интерес представляют мат- матрицы ттг-го порядка, называемые клетками Жордана: Нт(р) = (р 0 0 ^о 1 р 0 0 0 1 0 0 ... 0\ ... 0 ... 1 ... р) ±± тп ( U ) ±1 т 5 -L-LTn\KJJ -^^ТП /0 0 0 1 0 0 0 0 1 0 0 ... 0^ ... 0 ... 1 ... 0) A.17)
§ 1.1. Матричные многочлены 17 Элементы {Нш}ц~ матрицы Нш можно определить формулой 1, если к — г = 1, О, если к — г ф\. Из формул A.17), в частности, следует, что Нш(р) = рЕш + Нт, A.18) где Еш — единичная матрица порядка т, и, следовательно, л л Z, A-19) где (?) = С^ — число сочетаний из v элементов по к. Легко проверяется, что 0\ /О О О Г2 _ 1 О о/ гЗ _ 0 0 0 0 0 0 0 \о о о о, где ^ —матрица, все элементы которой являются нулями. Отсюда получаем сравнительно простые формулы 1, если к — г = v, ' . ' г/ = 1,2,.... A.20) 0, если к — г ф г/, Если теперь воспользоваться формулой A.19), то с учетом соотношений A.20) получим первое важнейшее свойство матрицы Н(Х): Г ПА^', если 0 ^ к - г = j ^ v, {Я^(Л)Ь= ^ " ^ ' A.21) [ 0, если А: — г < 0 или к — г> v . Теорема 1.7. Характеристическая матрица клетки Жордана \ЕШ — Нш(р) имеет единственный элементарный делитель (Л — р)ш и при этом р является единственным собственным значением матрицы Нш(р). Следовательно, если матрица А подобна клетке Жордана Нт(р), то существует неособенная матрица Т, такая, что А = Т~1Нш(р)Т. В общем случае справедлив следующий принципиальный факт. Теорема 1.8. Если характеристическая матрица матрицы А порядка п име- имеет элементарные делители {\-\г)п\ (А-АаГ2, •••, (А-А,Г*, A.22) то существует неособенная матрица Т такая, что A = T-1{Hni(X1),Hn2(X2),...,Hns(\s)}T. A.23) Имея в виду, что (см. A.18)) Н^{р) = рЕ^ + #ь формулу A.23) можно пред- представить в виде А = Т-^АхЯщ + НП1,Х2ЕП2 + НП2,.. .,ХвЕПв + НПе}Т, A.24) где введено обозначение (см. A.17)) Н^ = Н^@), а Е^ — единичная матрица порядка к.
18 Гл. 1. Матрицы, операторы и группы Так как А2 = АА, то по правилу умножения блочных матриц получаем 12^ A.25) где H^.(Xj) можно представить по формуле A.19). Этот результат позволяет просто строить матрицу Т, с помощью которой мат- матрица А приводится к канонической жордановой форме (см. A.24)) {Л1.БП1 + НП1, \2ЕП2 + НП2,..., \sEUs + Hns\. A.26) В самом деле, сначала клетке Жордана Нш(р) поставим в соответствие мат- матрицу H!^(p), которую, в соответствии с формулами A.19) и A.21), можно пред- представить в виде ниш(Р) = Вводя матрицу о \о о / О ао V О О / v \ и-гп+2 \т-2)г О (ш-1)! 1 (ш-2)! am_i а>т-2 A.27) можно записать drn-lpu ' dp''"' dp™-1 J ' Матрица A.27) (играющая, кстати, чрезвычайно важную роль в теории функ- функций от матриц) обладает следующими важными свойствами. 1. Gra (ао, ai,..., am_i) + Gm (bo, bi, • • • •> bm-i) — = Gm (a0 bm_i). A.28) 2. Если а\ ф 0, то Gm(ao,ai,...,flm_i) имеет единственный элементарный делитель (Л — ao)m, и поэтому существует единственная неособенная матрица Т такая, что Gm(a0, ab ..., am_i) = T^Hm^T. A.29) 3. Матрица Т определяется по формуле Г = T(ai,a2,...,am_i) = (V 0 0 и 0 0 0 .. 2! "• а2 .. 0 .. 0 \ О"гп-1 } ' (ш-1)! ' (m-2)! aT1 / В случае, когда а\ = а2 = ... = a/c-i — ^^ak Ф 05 матрица Gm также приво- приводится к канонической жордановой форме. Однако в этом случае матрица преоб- преобразования Т имеет довольно сложную структуру (см., например, [26]). 3. Преобразование матриц. В дальнейших наших рассуждениях, свя- связанных с решением матричных, алгебраических и дифференциальных уравне- уравнений Риккати, важным окажется вопрос о приведении матрицы к канонической
§ 1.1. Матричные многочлены 19 жордановой форме. Поэтому интересны практические способы построения мат- матрицы Т, с помощью которой заданная матрица А приводится к жордановой форме ТАТ'1 = J. A.30) В связи с этим приведем основные факты, относящиеся к преобразованию мат- матриц. Наглядное изложение преобразований удобно дать, исходя из матричного представления линейного оператора в конечномерном евклидовом пространстве. Итак, пусть задан линейный оператор А: Еп —у Еш, векторы {ei,...,en} и {/i,...,/m} — системы базисных векторов в этих пространствах. Так как Ле\ Е Еш, ..., Аеп Е Еш, то существуют такие постоянные а^, г = 1,...,т; к = 1,... ,п, что + \~ CLmlfm, A.31) , Леп = ain/i + a2nf2 H Ь атп/т. Вывод. Каждый линейный оператор А : Еп -у Еш при заданных базисах {ei,..., еп} и {/i, /2,..., /m} соотношениями A.31) однозначно определяет мат- матрицу (an а12 ... air a2i a22 ... а2 arn2 • • • Ее важнейшей особенностью является тот факт, что ее г-й столбец представляет собой вектор координат элемента Aei в базисе {/i,..., /m}. Очевидна справедливость и обратного утверждения. Если в пространствах Еп и Еш заданы базисы {ei,...,en} и {/i,...,/m}5 T0 матрица А, заданная формулой A.32), однозначно определяет линейный оператор А : Еп —у Еш с помощью формул A.31). Воспользуемся этими фактами для представления линейного оператора с по- помощью матриц в подходящих базисах. Пример 1.4. Пусть Еп — пространство полиномов степени п - 1. Каждый из этих полиномов Pn-i(t) =ao + ai?H ban-it71 однозначно определяется его коэффициентами ao,ai,... ,an_i. Линейный оператор А: Еп+1 -у Еп определим формулой = Qn-i(t). A.33) dt Его линейность очевидна. В пространстве Еп+1 возьмем базис е\ — 1, е2 = ?, ... , en+i = tn. В Еп выберем такой же базис /i = 1, f2 = t, ... , /n = tn~1. Тогда, в соответствии с формулой A.33), имеем —- = 0, —- = /i, —- = 2/2, ... , —j^- = nfn. Так как г-ый столбец соответствующей матрицы является вектором координат элемента
20 Гл. 1. Матрицы, операторы и группы Лвг в базисе {Д}, получим прямоугольную матрицу @ 1 0 ... (Г 0 ° 2 ••• о о о ... Пример 1.5. Пусть матрица ••• а1п \ А = A.34) определяет линейный оператор А: Еп ->• Еп в базисе Предположим далее, что матрица А имеет только простые вещественные соб- собственные значения. Обозначим их через Ai, A2, ... , Ап. Тогда собственному значению А& соответствует собственный вектор хк, определяемый соотношени- соотношением Ахк = XkXk. Поэтому, если базисом взять векторы ж1,..., жп, то в этом базисе оператор А определяется матрицей Ai 0 ... О \ О А2 ... О V 0 0 Пример 1.6. Пусть матрица A.34) имеет единственное собственное значение Ао и ему соответствует единственный элементарный делитель (А — Ао)п. Тогда канонической жордановой формой матрицы А является матрица Ао 1 0 ... 0 J= , 0 Ао 1 ... 0 0 0 0 ... Ао, Обе эти матрицы определяют один и тот же линейный оператор, но в различ- различных базисах. Если воспользоваться представлением A.31) этого оператора, то, положив в качестве первого базисного элемента собственный вектор х1 матрицы А, будем иметь Ах1 = Xqx1 . Определим последующие базисные элементы следующими соотношениями Ах2 = х1 + Аож2, ... , Ахп = хп~1 + Хохп. Поэтому, в силу соотношений A.31), получаем, что в базисе {ж1, ж2,... ,жп} оператор А определяется матрицей J. Векторы ж1,...,^71 называются присоединенными векторами, соответствующи- соответствующими собственному значению Ао. Рассмотрим теперь общий случай, когда канонической жордановой формой матрицы А является матрица J = {Ji,..., Jm}, где J& является клеткой Жорда- на, соответствующей элементарному делителю (А — Х^)Пк. Тогда для приведения матрицы А к канонической жордановой форме базис строим следующим образом. Сначала находим собственный вектор ж1 матрицы А, соответствующий собст- собственному значению Ai. Он определяется соотношением Ах1 = Хгх1. Последующие
§ 1.1. Матричные многочлены 21 базисные элементы, соответствующие этому собственному значению, определяем соотношениями Ах2 = хг +\1х2,...,АхП1 =xni+Aixni. A.35) Затем аналогичным образом поступаем для получения следующих базисных элементов. Сначала — соответствующих собственному значению Л2. Таких эле- элементов будет ровно П2- После этого переходим к построению базисных элементов, соответствующих Аз, и т. д. В итоге получаем полный набор базисных элементов, с помощью которых матрица А приводится к виду J = {Ji,..., Jm}, где J& — клетка Жордана, соответствующая элементарному делителю (Л — \к)Шк. Приведенные рассуждения дают алгоритм, по которому следует действовать для канонического представления произвольной матрицы А. Он состоит в следу- следующем. Сначала элементарными преобразованиями приводим матрицу А — ХЕ к ка- канонической диагональной форме. Затем определяем элементарные делители мат- матрицы и по ним даем представление матрицы в канонической жордановой форме J = {Ji,...,Jm}. По указанной выше процедуре строятся базисные векторы (см. A.35)) ж1,... , ж7711,... ,жп. В этом базисе матрица А имеет каноническую жорданову форму. 4. Перестановочные матрицы. В рамках рассматриваемых здесь вопро- вопросов по теории Л-матриц уместно проанализировать некоторые факты, относящие- относящиеся к перестановочным матрицам. Получение условий, при которых матрицы А и В перестановочны, имеет определенное значение и при построении общего реше- решения уравнения Риккати. В этом плане важным оказывается и ответ на вопрос о том, что представляет собой множество всех матриц, перестановочных с данной матрицей А. Не вдаваясь особенно в детали этих вопросов, ограничимся лишь анализом некоторых принципиальных результатов и несколько более подробно остановимся на практических аспектах применения теоретических выводов. Итак, пусть задана матрица А. Обозначим через Т матрицу, которая приводит А к канонической жордановой форме: ГАГ = {Л,...,Л} = J, A.36) где J&, к = 1,..., s, — клетки Жордана. Как известно, матрица В называется перестановочной с А, если справедливо равенство АВ = В А. A.37) Справедливо простое, но очень важное утверждение. Теорема 1.9. Если матрица X перестановочна с жордановой матрицей J (см. A.36)), то матрица Y = Т~гХТ перестановочна с А. Доказательство. Так как JX = XJ, то, с учетом соотношения A.36), полу- получаем AY = Г JTY = T-XJTT~XXT = Г JXT = X XXJT = YA.
22 Гл. 1. Матрицы, операторы и группы Матрицу X разобьем на клетки, соответствующие клеткам матрицы J: Хц Х\2 ••• X\s \ I л X = JPXpq=XpqJq, .. Xt_ Тогда условие JX = X J приводит к равенствам p,gr = l,...,s. A.38) Таким образом, для каждой клетки Xpq получаем одно равенство в системе A.38), из которого надо определить элементы матрицы Xpq. Пусть порядок матриц Jp и Jq равен кит, соответственно, а р и а — их собственные значения. Тогда Xpq будет прямоугольной матрицей с к строками и т столбцами. Обозначим элементы матрицы Xpq через ф^, где г = 1,..., к; j = 1,..., m, и перепишем соотношение из A.38) более подробно: О ... 0\ /фц ф\2 ... Ф\п> О р 1 О Р/ Ф21 Ф22 Фк1 Фк2 Фкт/ Ф\2 Ф21 Ф22 ,Фк1 Фк2 ... Фкт/ \0 0 0 Выполняя здесь умножение и сравнивая элемент, который получится в г-й строке и j-м столбце левой части полученного равенства, с соответствующим элементом справа, мы прийдем к уравнениям Если р рфкз = Фк^-i + а рфк1 = a рфп + ^г+1,1 = афп, а, то A.41) следует, что t/j^i = 0. ПРИ ^ при j 1, A.40) A.41) при г ^ *• D.42) Тогда из A.42) последовательно получаем ф^2 = Фкз — • • • — Лт = 0, а из A.39) выведем, что все остальные фц^ равны нулю. Следовательно, если р ф а, то Xpq = в. Рассмотрим случай, когда р = а. Уравнения A.39)-A.42) теперь можно пере- переписать в иной форме: ^i+i,j = Фг^-ъ г = 1,...,/с-1; j = 2,...,m, A.43) Фк,з-1=0, j = 2,...,m, A.44) ^i=0, i = l,...,fc. A.45) Если к ^ ттг, то, полагая г/?ц = ^i, Ф12 = ^2, ••• , ^im = Фт, мы приведем уравнения A.43), A.44) и A.45) к уравнениям ф^ = ф3--1+\ при г ^ j, ^^j = 0 при г > j, из которых следует, что матрица Xpq имеет линейную треугольную
1.1. Матричные многочлены 23 форму для к = т и к > т (Фг О ... Фгп-1 Фз 0 0 0 0 Vo о о ' ° ° ° V о о о соответственно. Если к < т, то аналогичным путем получаем матрицу ... 0 ф1 ф2 0 ... 0 0 фл о о / ... О 0 0 0 ... ф1 Обратно, если клетки матрицы X имеют указанный выше вид, то матрицы X и J перестановочны. Пример 1.7. Пусть жорданова матрица имеет три клетки: J = {Ji, J2, </з}5 (р 1 0\ , х (а 1 0\ Л= 0 р 1 , J2=fJ J, J3= 0 а 1 , ^а. \0 0 р) V ^У \° 0 а/ Матрицу X, перестановочную с J, записываем в клеточной форме / Хц Х\2 X = I X21 ^22 -X Она имеет порядок 8. Чтобы проще разобраться в размерностях блоков Xpqj запишем произведение блочных матриц J и X: Л 0C,2) 0C,3) \ /1ц Х12 Xi 0B,3) J2 0B,3) Х21 Х22 Х23 ,0C,3) 0C,2) J3 / \^31 ^32 Хг где в(к,1) — матрица с нулевыми элементами порядка к х I. Используя правило перемножения блочных матриц, можно легко определить размерность каждого блока Xpq. Так, например, размерность блока Xi2 равна 3x2. Тогда в соответствии с приведенными выводами, мы получаем блоки -^22 — A) Pi о 0о где с^, /3j, — произвольные постоянные. Остальные блоки являются нулевыми матрицами. Матрица X с такими блоками является перестановочной с матрицей J.
24 Гл. 1. Матрицы, операторы и группы § 1.2. Функции от матриц Решение многих проблем, связанных с исследованием алгебраических и диф- дифференциальных уравнений Риккати, опирается на теорию функций от матриц. Здесь не представляется возможным изложить эту чрезвычайно интересную те- теорию в полном объеме. Однако стоит свести воедино многие ее факты, разбро- разбросанные по различным работам, мало относящимся к уравнениям Риккати. 1. Мажорантные матрицы. Ряды матриц. Будем рассматривать п-мер- ные матрицы X, элементы которых будем обозначать через {Х}^. Через \Х\ обозначим матрицу с элементами |{Х}^|, так что справедливо равенство {\X\}ik = \{X}ik\. B.1) Если для двух матриц X и Y выполняются соотношения \SY\ , I <Г SV\ , \SY\ , I << SVX \\лПк\ ^ V /гА;? 11А/г/с| < 1-^ /г/с? то будем писать \Х\ 4 Y, \Х\ < Y. B.2) Теорема 2.1. Если \А\ ^ В и если ? иг\ суть максимумы модулей собственных значений А и В, соответственно, то ? ^ г\. Множество рассматриваемых n-мерных матриц является конечномерным и его можно сделать конечномерным комплексным или вещественным банаховым пространством L, вводя на матрицах одну из следующих эквивалентных между собой норм '\\X\\L=m^\{X}ik\, г, к \\x\\L= г,/с = 1 B.3) 1/2 ък\ Назовем окрестностью матрицы Хо множество матриц X, удовлетворяющих условию \Х — Хо\ < А, где матрица А имеет положительные постоянные элемен- элементы. Будем говорить, что последовательность матриц Хт, т = 1,..., сходится к матрице Хо, если для любого произвольно малого положительного г можно указать число М такое, что \ХШ — Х$\ < \\e\\ при т > М, где '' е е ... г ... Каждой аналитической функции m=0 B.4)
§ 1.2. Функции от матриц 25 комплексной переменной z поставим в соответствие степенной ряд матриц оо F(X) = Y, ашХт. B.5) 771 = 0 Каждой сумме в ряде B.5) соответствуют элементы п {F{X)}lk = ао6гк + аг{Х}гк + а2 Y,{X}i5{X}jk + ..., B.6) j=i i,k = 1,..., п, й^/с — символ Кронекера. Степенной ряд B.5) называется сходящимся, если сходятся все степенные ря- ряды B.6), и тогда под матрицей F(X) понимается матрица с элементами {F(X)}ik. Поскольку каждый из рядов B.6) имеет свой радиус сходимости г^, то ряд B.5) имеет область сходимости \Х\ < R, где ГЦ Г12 ... Г и. Г21 Г22 ... Г2г R = Из введенных определений следует, что сходимость ряда B.5) в окрестнос- окрестности \Х\ < R влечет за собой сходимость ряда оо ?|а*11*1* B-7) к = 0 и обратно, из сходимости ряда B.7) в той же окрестности следует сходимость ряда B.5). Теорема 2.2. Если функция F(z) комплексной переменной z, определяемая рядом B.4), голоморфна в круге \z\ < np, то ряд B.5) сходится абсолютно в окрестности \Х\ < \\p\\, B.8) где р Р ••• р\ р р ... р \р р ••• р/ Функция F(X), удовлетворяющая условиям теоремы 2.2, называется голо- голоморфной в окрестности B.8). Теорема 2.3. Пусть оо Y = F(X) = Y^ akxk B-9) k = 0 — функция матрицы X, голоморфная в окрестности \Х\ < \\p\\, причем а\ ф 0. оо Тогда существует единственная функция матрицы Y: X = ^^biY1, голоморф- г=1 ная в окрестности точки Y = в, не содержащая свободного члена и дающая об-
26 Гл. 1. Матрицы, операторы и группы оо ращение ряда B.9), т.е. удовлетворяющая уравнению Y = 2^ akXk. Практическая значимость этой теоремы состоит в том, что, определив функ- функции eAt, sin At, cos At и т. д. с помощью степенных рядов, можно, используя эту теорему, определить обратные им функции (конечно, в тех случаях, ког- когда выполнены все условия теоремы). В частности, для функций eAt и sin At условия теоремы выполняются и можно определить обратные им функции In At, (AtJ arcsin At, а в разложении cos At = E — -—p—\- ... коэффициент а\ равен нулю и для обращения этой функции теоремой 2.3 воспользоваться нельзя. Теорема 2.4. Для того чтобы ряд B.5) сходился на матрице X с каноничес- каноническим представлением (еж.A.23)) X = Г-^Яш! (Ai),..., НШз (Ав)}Г, B.10) необходимо и достаточно, чтобы сходились числовые ряды v=0 \*--L±J a = 0,..., nik — 1; k = l,...,s. Здесь Hmk(\k) — клетка Жордана порядка т^ матрицы X, соответствую- соответствующая собственному значению А&. Тогда ряд B.5) можно представить в виде г(х) — Т~г1П \F(\-i) Ff(\-i) FA7ll~1")(\-i)] где функции Gm[ao,ai,...,am_i] определяются формулой A.27), a F^ — про- производная порядка п. В частности, если Х = Т-1{\1,\2,...,\п}Т, B.13) то F{X) = T-1{F(X1),F(X2),..., F(Xn)}T. B.14) Эта теорема чрезвычайно важна для теории функций от матриц, так как она, во-первых, дает условия, при которых ряд B.5) сходится, а, во-вторых, дает явное представление ряда в конечной замкнутой форме. Доказательство ее несложно и опирается на указанные выше факты. Поэтому приведем его полностью. Доказательство. По определению жордановых клеток находим, что N Г N N Л и=0 Ки=0 и=0 ) Но, в силу A.27) и следующей за ней формулы, имеем то_ „л N и=0 N d[ ? auW) d™! ? av\v
§ 1.2. Функции от матриц Следовательно, для сходимости ряда F(Hm(X)) = 27 необходимо и v0 достаточно, чтобы сходились ряды для F(X), F'(X),... ,Frn~1(X). В таком случае из формулы B.12) следует справедливость теоремы, и мы имеем F(Hm(X)) = J2 avH^(\) = Gm(F(X), F'(X), ...,Fr F'(X) ... 0 \ о '" (m-2)! F(X) B.16) или Gms(F(Xs),Fl(Xs),...,F^-1\Xs))}T. Следствие 1.1. Из доказанной теоремы следует, что для сходимости ряда \du\ I-^T? необходимо, чтобы собственные значения Ai,...,As матрицы \Х\ находились внутри или на границе круга сходимости степенного ряда ' •> и 0 достаточно, чтобы они находились внутри этого круга. В качестве интересной иллюстрации теоремы 2.4 можно рассмотреть случай, когда числовые ряды B.11) имеют единственную точку сходимости А = 0. Тогда в соответствии с формулами B.10) и B.12), функция F(X) будет определены на особенных матрицах вида Хо = Т~1{НГП1 @),..., Hms @)}Т, где Т — произволь- произвольная неособенная матрица. Следующая теорема (см., например, [26, с. 44]) также очень важна в теорети- теоретических исследованиях и практических применениях. Теорема 2.5. Пусть Аь ..., As и (А - Ai)mi, ..., (А - As)ms — собственные значения и элементарные делители матрицы X. Тогда: 1) если значения рядов F'(Ai),... ,Ff(Xs) отличны от нуля, то F(Ai),..., F(XS), (r/ - F(Ai))mi,...,(»?- F(X8))m' — собственные значения и элементарные делители матрицы F(X); 2) если F(Xa) = ... = F^-^iXa) = 0, F^k\Xa) ф 0, то собственному значе- значению Аа матрицы X отвечают к элементарных делителя матрицы F(X) r^,..., fa - F(AQ))*».*, B.17) B.18) где показатели pa,i, • • • ,Pa,k определяются соотношениями
28 Гл. 1. Матрицы, операторы и группы Здесь Ez — целая часть числа z, т. е. если ра = кг + q, где 0 ^ q < к, то Ра,1 = • • • = Pa,q = Г + 1, ра,д+1 = • • • = Ра,к = г- 2. Представление функций от матриц. Приведенные теоремы практичес- практически полностью характеризуют свойства матрицы F(X) в зависимости от свойств матрицы X. Однако в дальнейшем нас будет особенно интересовать случай, ког- когда X является переменной матрицей, принимающей всевозможные значения в некоторой области пространства матриц. Поэтому естественной является задача об аналитическом представлении функ- функции от матриц. Одно такое представление дается формулой B.5). В ряде простей- простейших случаев эта формула определяет функцию от матрицы в замкнутой форме (т.е. не в виде ряда). /О 1 1\ Пример 2.1. Пусть X = А = 0 0 2 I . Требуется построить матрицу eAt, \0 О О/ где t — числовой параметр. Согласно формуле B.5) эта матрица представима в виде eAt = Е -\ -\ ; Ь... -\ ; Ь... Непосредственными вычислениями 1! 2! п! 2! '0 0 0 0 0 0 3 0 0 находим, что А2 = 0 0 0 , А3 = в = 0 0 0 . Поэтому A2t2 гм = Е + At + ^Л = I 0 Другое представление можно получить, исходя из теоремы 2.4. Однако для этого требуется, чтобы матрица X была представлена в виде B.10). /-3 -12 0" Пример 2.2. Требуется построить матрицу sin At, где А = 2 7 0 V 0 0 2, Собственными значениями матрицы А являются Ai = 1, Л2 = 2 и Аз = 3. Поэтому она представима в виде B.13) А = Т-1{1,2,3}Т. Матрицы Т и Т находятся известным способом и представимы в виде /1 2 0\ /30 Г= 0 0 1 , Г= -1 \1 3 0/ \ 0 Тогда по формуле B.14) определяем матрицу sin sin At = Г {sin t, sin 2t, sin 3t} Г = /3sint-2sin3t 6sint-6sin3t 0 = -sint + sin3t -2sint+ 3sin3t 0 \ 0 0 sin2t. Теорема 2.4 вместе с ее формулами B.12) и B.14), казалось бы, дает исчер- исчерпывающий ответ на вопрос о представлении функции от матрицы. Однако, в
§ 1.2. Функции от матриц 29 каждой из этих формул содержится произвольная неособенная матрица Т, кото- которая создает обманчивое впечатление о том, что значение функции F(X) зависит от выбора Т. В действительности такой зависимости нет по той простой причине, что, согласно определению, функция F(X) задана степенным рядом B.5). Это означает, что формулы B.12) и B.14) должны приводить к представлениям F(X), которые не содержат Т. Мы приведем три таких представления. 1. Формула Лагранжа-Силъвестра. Сначала рассмотрим случай простых соб- собственных значений матрицы X. Пусть ими являются Ai,... ,ЛП. Тогда, полагая Д(Л) = (Л - Ai)... (А - Ап), можно записать F(X) = LF(\)\X=X = k = l А(А) (\-\к)А'(\к) B.19) x=x где LF(X) — интерполяционный полином Лагранжа функции F(X). Пример 2.3. Пусть X = At, где t — параметр, А = ( 1. Требуется построить матрицу F(X) = eAt. Собственными значениями матрицы А являются Ai = г, А2 = —г. Поэ- Поэтому, согласно формуле B.19), имеем следующий интерполяционный полином Лагранжа Lp(X) = elt—: Ь e~lt г = Asint + cost. Отсюда находим, что — sm t J Рассмотрим теперь общий случай, когда матрица А имеет собственные значе- значения Ai, ..., As кратностей ni, ..., ns, соответственно. Тогда п\ + ... + ns —п. В этом случае сначала нужно выписать интерполяционный полином Лагранжа- Силъвестра U h Ui(A)>/JA=A. (A-A,)^1' B.20) где ^(А) = (А — Ai)mi ... (А — As)ms — минимальный многочлен матрицы X, а ij)j{X) = , . После этого матрица F(X) определяется по формуле (X — Xj) з F(X) = LSF(X)\X=X. B.21) Пример 2.4. Пусть X = At, где А = ( 1. Требуется построить матрицу F(X) = eAt. В этом случае матрица А имеет единственное собственное значение Ai = 0 кратности 2. Минимальный многочлен определяем по формуле (см. A.16)) ф(Х) = —у\ = А2. Поэтому LSf(X) = At + 1 и, следовательно, выполняется L>(A) соотношение eAt = tA + E = ( 2. Формула Коши. Поскольку первоначальное определение функции от матри- матрицы введено с помощью степенного ряда, то представляется вполне естественным
30 Гл. 1. Матрицы, операторы и группы использовать теорию аналитических функций комплексного переменного для по- получения подходящих рабочих формул. При этом очевидно, что аппарат теории аналитических функций на этом этапе следует использовать лишь в области схо- сходимости соответствующих степенных рядов. 1 Г Можно воспользоваться формулой Коши F(X) = —— ф 2тгг Jq 4dz. z — Л В теории функций от матриц доказывается, что формуле B.12) можно придать вид F(X) = ^-<f F(X)Rx(X)d\. B.22) 2тгг Jc Здесь С —произвольный непрерывный замкнутый контур, охватывающий об- область, внутри которой находятся все собственные значения матрицы X, а R\(X) = (ХЕ - Х)~г — резольвентная матрица матрицы X. Пример 2.5. Пусть X = At, где А = ( ). Требуется построить матрицу F(X) = eAt, используя формулу Коши. Матрица имеет единственное собственное значение Ai = 0. В качестве контура С берем окружность единичного радиуса с центром в начале координат. Находим, что R\(A) = (ХЕ — А)~1 = ( 1 At_ 1 / „At /А А-2\ „ (\ t Поэтому eAt = — ф еА* ' ;' ЫА = . п Л 3. Разложение F(X) no компонентам матрицы X. Из представления функции F(X) с помощью полиномов Лагранжа и Лагранжа-Сильвестра (см. B.19)—B.21)) следует, что F(X) можно представить в виде F(X) = ^[F(A,)^i + F\\-)Z& + ... + F^-^iX^Zjm.], B.23) группируя слагаемые по их принадлежности к F(Ai), ..., F(rris~1\Xs). При этом оказывается, что множители Zjp не зависят от функции F и ее производных и определяются исключительно матрицей X. Поэтому их записывают в виде Zjp = Zjp(X) и называют компонентами мат- матрицы X. Можно показать (см., [5, с. 111]), что компоненты матрицы X всегда линейно независимы. Отсюда, в частности, следует, что ни одна из матриц Zjp не равна нулю, а любые две из этих компонент перестановочны между собой и с матрицей X. Последнее следует из того, что, согласно определению, все компо- компоненты Zjp представляют собой скалярные многочлены от X. Набор чисел F(Ai), F'(Ai), ..., F^i , B.24) F'(Xs), ..., F("l«)(Ae) называется значением функции F на спектре матрицы X. Формулой B.23) для F(X) удобно пользоваться тогда, когда приходится иметь дело с несколькими функциями от одной и той же матрицы X, либо когда функция
§ 1.2. Функции от матриц 31 F(X) зависит не только от Л , но и от некоторого параметра t (см. приведенные выше примеры с функцией ext). В последнем случае в правой части формулы B.23) компоненты Zjp не зависят от ?, и параметр t входит только в скалярные коэффициенты при этих матрицах. Если дана матрица X, то для конкретного нахождения ее компонент можно в основной формуле B.23) взять какую-либо пробную функцию и с ее помощью определять компоненты Zjp. Эту операцию удобно выполнять, при F(/i) = , Л — \i где Л — некоторый параметр. Тогда получаем (ХЕ X)-1 - С(Х) - V [ Z^ + + {m3±)\Z3mA где С(Х) — приведенная присоединенная матрица для ХЕ — X, а ф(Х) — мини- минимальный многочлен. Матрицы (р — l)\Zjp являются числителями простейших дробей в разложении B.25), и потому, по аналогии с разложением скалярной дро- дроби, эти числители могут быть получены через значения С(Х) на спектре матрицы X по формулам г у 1 di ГОД1 . 1 Следовательно, Zjp = ^ _ Щт. _ р), ^^ [^щ\ д=д^ , где j = 1,.... в; р = 1,... ,?7ij. Поэтому формулу B.25) можно переписать в виде Пример 2.6. Пусть /2 -1 1\ /А-2 1 -1 Х= О 1 1, ХЕ-Х=1 О А-1 -1 V-1 11/ V 1 -1 л-!, В этом случае А(А) = det(XE-X) = (А-1J(А-2). Поскольку минор элемента A,2) в ХЕ - X равен 1, то Д2(А) = 1 и поэтому ^(А) = А(А) = (А - 1J(А - 2) = А3 - 4А2 + 5А - 2, ) = Ш^|(А) 2 + (л_4) л2_ /JL — X Значит, С(Х) = Ф(АЯ, X) = X2 + (А - 4)Х + (А2 - 4А + Ь)Е. Основная формула B.23) в рассматриваемом случае принимает вид F(X) = F(l)Zi + F'A)Z2 + FB)Z3. B.23a) Полагаем здесь F(/jl) = (A — /i) и находим, что ivl Z2 Z% ф(Х) А-1 (А-1J А-2'
32 Гл. 1. Матрицы, операторы и группы Отсюда получаем Zi = -СA) - C"(l), Z2 = -C(l), Z3 = СB). Используя приведенное выше выражение для С(А), находим соотношения GA) = X2 - ЗХ + 2Я, С"A) = X - 2?, GB) = X2 - 2Х + Я. и, следова- следовательно, Zi = -X2 + 2Х, Z2 = -X2 + ЗХ - 2Е, Z3 = X2 - 2Х + Я. Подставляя найденные значения Zi, Z2 и Z3 в формулу B.23а), окончательно получаем F(X) = -[F(l) + F'(l) - FB)]X2 + [2FA) + 3F'A) - 2FB)]X - 3. Аналитическое продолжение функции от матрицы. Функции от матриц, представленные в вид формулы Коши или с помощью полинома Лаг- ранжа-Сильвестра, позволяют использовать аппарат теории аналитического про- продолжения функций скалярного аргумента, для получения сходных результатов в области функций от матриц. В этом пункте мы рассмотрим некоторые из по- подобных вопросов, не вдаваясь в детали теории, а останавливаясь, в основном, на прикладной стороне дела. Рассмотрим случай, когда матрица X имеет простые собственные значения Ai,..., Ап. Тогда канонической ее формой Жордана будет X = T~1{Ai,..., An} T, а для аналитической функции оо F(z) = Y, akzk B.27) k=o скалярного аргумента z с радиусом сходимости пр можно получить функцию от матрицы (см. B.19)) п F(X)= Д(А) к = 1 (\-\к)А>(\к) B.28) х=х если только выполняется условие (см. теорему 2.2) |Х| < ||^||, где \\p\\ — матрица, все элементы которой равны р. Однако практическое значение этой формулы выходит за рамки просто удобного представления аналитической функции от матрицы. Она позволяет получить аналитическое продолжение F(X) за границы области сходимости ряда к = 0 Сходимость этого ряда означает (см. теорему 2.2), что все числовые ряды, определяющие элементы правой части формулы B.29), являются сходящимися, т. е. должны сходиться ряды {F(X)}ik = aoSik + ai{X}ik + со / п \ / \-<*- \ггл \-<*- \гл го ' ' ' \^*- \т —лк I 1 \Z.o\j) Z_-/ v J ^ri,...,r1/_i = l У для г = 1,..., п; к = 1,..., п. Если функция B.27) целая, т. е. имеет бесконечный радиус сходимости, то функция B.29) также целая и нет необходимости в аналитическом ее продолже- продолжении. Если же радиус сходимости ряда B.27) равен нулю, то ряд B.29) сходится лишь на матрицах X, все собственные значения которых являются нулями.
§ 1.2. Функции от матриц 33 Действительно, в этом случае характеристическое уравнение каждой такой матрицы имеет вид А(Л) = Лп = 0 и, в соответствии с теоремой Гамильтона- Кэли, имеем Хп = в. Следовательно, в этом случае ряд B.29) можно переписать п-1 в виде F(X) = 2^, акХк. Во всех остальных случаях (т.е. когда радиус ряда к=о B.27) ограничен и отличен от нуля) можно рассматривать вопрос об аналити- аналитическом продолжении функции от матрицы, представленной с помощью полинома Лагранжа. Пусть этот радиус равен пр. Аналитическое продолжение матрицы B.28) строим, исходя из аналитического продолжения степенных рядов B.30), определяющих элементы {F(X)}ik матри- матрицы F(X). Способы продолжения степенных рядов B.27) излагаются в теории функций комплексного переменного. Поэтому можно описать классы матриц X, для которых определено понятие функции F(X) как аналитического продолжения функции F(X). Если такое продолжение существует, то соответствующие ряды B.30) мож- можно преобразовать в ряды по степеням {X}ik — {Х}^, которые будут сходиться в некоторой окрестности матрицы X. Выполняя эту процедуру относительно каждого из числовых рядов B.30), мы можем получить все аналитические про- продолжения функции F(X). Рассмотрим теперь те трансформации, которые при этом происходят с форму- формулой Лагранжа B.28). Если матрица X изменяется непрерывным образом, то ее собственные значения Ai,..., Ап, которые являются аналитическими функциями от {X}ik, изменяются также непрерывно. Главный вывод, который при этом следует, состоит в том, что результат ана- аналитического продолжения F(X) в F(X) не зависит от того, пользуемся ли мы степенными рядами B.26) или исходим из формулы Лагранжа B.28). При этом формула Лагранжа B.28) дает представление F(X) в зависимости от значений функции скалярного аргумента на спектре матрицы X. Поэтому мы получаем однозначное или многозначное продолжение, в зави- зависимости от того, многозначны или нет F(\j), j = l,...,n. Та же ситуация сохраняется и в случае кратных собственных значений. Если какая-либо из этих функций многозначна, то соответствующую ветвь матричной функции следует рассматривать лишь в малой окрестности той матрицы, спектр которой опреде- определяет выбранный полином Лагранжа-Сильвестра. 4. Некоторые свойства функций от матриц. Установленные факты о функциях от матриц и различные представления этих функций позволяют уста- установить некоторые полезные нам их свойства. Теорема 2.6. Пусть G[ui,... ,щ] — многочлен относительно ui,...,ui, а /i(A),... //(А) — функции, определенные на спектре матрицы А, и 5(A) = G[/i(A),...,/,(A)]. B.31) Тогда из (см. B.24)) д(Кл) — 0 следует, что G[h(A),...Ji(A)\=e. B.32) Доказательство. Обозначим тч(А), ..., п(А) интерполяционные полиномы
34 Гл. 1. Матрицы, операторы и группы Лагранжа-Сильвестра для функций /i(A),...,//(А) и h(X) = G[ri(A),... ,г/(А)]. Тогда из B.31) будет следовать, что Н(Аа) = 0, а значит, G[fi(A),.. .,МА)} = G[n(A),... ,Г1(А)} = h(A) = в, что и требовалось доказать. С помощью этой теоремы можно получить важные формулы, аналогичные со- соответствующим формулам из теории функций скалярного аргумента. Приведем некоторые из них. Пусть G[ui,U2] = и\ + и\ - 1, /i(A) = sin A, /2(A) = cos А. Тогда из формулы sin2 А + cos2 А = 1, согласно теореме 2.6, следует, что sin2 A + cos2 А — Е для любой матрицы А. Здесь Е — единичная матрица. Аналогичным образом можно установить справедливость равенства (И) =е~А. B.33) Для этого рассматриваем функцию G[u\,U2] = u\U2 - 1 и функции /i(A) = ел, /2(Л) = е~л. Тогда, очевидно, имеем G[/i(A),/2(А)] = 0. Следовательно, для любой матрицы А справедливо равенство еАе~А = Е, из которого легко получаем равенство B.33). Покажем, далее, справедливость формулы eiA = cos A + i sin A. B.34) С этой целью в качестве G возьмем функцию G[ui,U2,us] — и\ — U2 — ^з- По- Положим, далее, /i(A) = егЛ, /2 (A) = cos А, /з(А) = г sin А. Тогда очевидно, что при любом значении А справедливо равенство G[/i(A), /2(А), /з(А)] = 0 и, соглас- согласно теореме 2.6, имеем равенство G[fi(A), f2(A), fs(A)] = в, из которого следует B.34). Обозначим через /i(A) = л/А однозначную ветвь многозначной функции л/А, определенную в области, не содержащей начало координат и содержащей все соб- собственные значения неособенной матрицы А. Тогда, полагая G[ui,U2] = = u\—U2 и /2(А) = А, находим, что G[/i(A), /2(А)] = 0 и, следовательно, G[fi(A), f2(A)] = (9, тем самым (л/1J = А. B.35) Рассмотрим функцию /(А) = 1/А и произвольную неособенную матрицу А. Тогда функция /(А) определена на спектре матрицы А и поэтому в равенстве Л/(Л) = 1 вместо параметра А можно подставить матрицу A: Af(A) = Е. Отсюда следует, что f(A) = А~г. Если теперь обозначить через г(А) интерполяционный полином для функции 1/А, то получаем нетривиальный вывод А~г = г(А), т.е. обратная к любой неособенной матрице А может быть представлена в виде полинома от этой матрицы А. Рассмотрим рациональную функцию ф(Х) = , где д(А) и /i(A) — взаимно h(X) простые многочлены относительно А. Эта функция определена на спектре мат- матрицы А в том и только в том случае, когда собственные значения матрицы А не являются корнями многочлена h(X). При выполнении этого условия можно в
§ 1.2. Функции от матриц 35 тождестве ф(Х)Н(Х) = д(Х) заменить Л на А: ф(А)Н(А) = д(А). Отсюда следует, что ф(А) = g(A)h-\A) = h-\A)g(A). B.36) Теорема 2.7. Если составная функция д(Х) = h[f(X)] определена на спектре матрицы А, то g(A) = h[f(A)], т. е. д(А) = h(B), где В = f(A). Доказательство. Пусть ^(А) = (А - Ai)mi ...(A - Х3)Шз — минимальный многочлен матрицы А. Тогда значения функции д(Х) на спектре матрицы А определяются по формулам д(\) = \д(\г) = Л(/л), B.37) где fik = f(Xk), k = l,...,s. Многочлен ?(//) = (// - ^i)mi . ¦. (// - ns ется аннулирующим для матрицы В. Действительно, каждое число А& является корнем по крайней мере кратности ти функции ?(А) = ?[/(А)]= П[/(А)-/(АЛ)Г*. k = l Следовательно, ^(Л) = 0 и, согласно предыдущей теореме, имеем следующее ра- равенство q(A) = ^[/(А)] = ?(В) = 0. Поэтому среди значений Цт), h'im), ..., h^o-^ink), k = i,...,s, B.38) содержатся все значения функции h(fi) на спектре матрицы В. Используя значе- значения B.38), построим интерполяционный многочлен г (А) для функции h(X). Тогда, с одной стороны, h(B) = г (В). С другой стороны, как показывает формула B.37), функции д(Х) и gi(X) = = г [/(А)] будут равны на спектре матрицы А. Поэтому, применяя к разности д(Х) - г[/(А)] теорему 2.6, получаем что д(А) - r[f(A)} = 0. Тогда верно д(А) = r[f(A)} = г (В) = h(B) = h[f(A)], что и требовалось доказать. Комбинируя теоремы 2.6 и 2.7, приходим к следующему их обобщению. Теорема 2.8. Пусть д(Х) = G[/i(A),... ,Д(А)], где функции Д(А), ..., //(А) определены на спектре матрицы А, а функция G[ui,... ,щ] есть результат по- последовательного применения к величинам ui, ..., щ операций сложения, умно- умножения, умножения на число и замены величины произвольной функцией от нее. Тогда из д(Л^) = 0 следует, что G[fi(A),..., fi(A)] = в. Из этой теоремы вытекают чрезвычайно важные следствия. Рассмотрим не- некоторые из них. Пусть А — неособенная матрица. Обозначим через In А однозначную ветвь многозначной функции LnA, определенную в некоторой окрестности, не содер- содержащей точки 0 и содержащей все собственные значения матрицы А. Тогда в скалярном тождестве е1п Л — А = 0 можно заменить скалярный аргумент А на матрицу А: е1п А - А = в, т. е. eln A = А. Другими словами, матрица X = In А удовлетворяет матричному уравнению ех = А, т. е. является «натуральным логарифмом» матрицы А. Взяв в качестве
36 Гл. 1. Матрицы, операторы и группы In А другую ветвь той же многозначной функции Ln А, получим другой лога- логарифм матрицы А. Не останавливаясь на детальном анализе этой функции (с ее различными ветвями), отметим лишь два важных частных случая. Пусть А — неособенная матрица с вещественными элементами а^. Кроме того, предположим, что А не имеет отрицательных собственных значений. Обо- Обозначим через lnoA однозначную ветвь многозначной функции Ln X в комплексной А-плоскости с разрезом вдоль отрицательной действительной оси, определяемую равенством lnoA = In г + iip, —тг < ср < тг, т. е. А = relLf>. Эта функция принимает вещественные значения при положительных вещественных А и комплексно сопря- сопряженные значения при комплексно сопряженных значениях А. Поэтому функция 1п0А вещественна на спектре матрицы А, а, следовательно, 1п0А — вещественная матрица. Рассмотрим еще один случай. Пусть А = В2, где В — вещественная матри- матрица. Наряду с функцией lnoA рассмотрим две однозначные ветви функции In А в комплексной плоскости с разрезом вдоль положительной вещественной оси: lni A = In г + icp, 0 ^ ср < 2тг, 1п2 А = In г + iip, —2тг < ip ^ 0. Предположим также, что все собственные значения Ai,..., Ап матрицы В раз- различны. Выберем круговые окрестности Gk точек Хк так, чтобы они не пересе- пересекались и не содержали точку 0. В области, составленной из этих окрестностей, определим функцию /(А) равенствами /(А) = 1п0А2, если A е Gk и Re Xk ф 0, /(А) = lni А2, если A е Gk и Re Хк = 0, Im Xk > 0, /(А) = 1п2 А2, если A е Gk и Re Хк = 0, Im Xk < 0. Тогда функция /(А) представляет собой однозначную ветвь функции In А2, опре- определенную и вещественную на спектре матрицы В. Поэтому f(B) вещественная матрица и е^в^ — В2 — А, т.е. f(B) является вещественным натуральным логарифмом матрицы А. Завершая анализ функций от матриц, отметим один чрезвычайно важный для нас факт, относящийся к теории функций от операторов. Примечание. Если Л — линейный оператор в n-мерном пространстве Еп, то f(A) определяется точно так же, как и f(A): f(A) = г (Л), где г (А) — интер- интерполяционный полином Лагранжа-Сильвестра для /(А) на спектре оператора Л (спектр оператора Л определяется минимальным аннулирующим многочленом ф(Х) оператора Л). Согласно этому определению, если оператору Л отвечает матрица А = {ctjk} в некотором базисе пространства, то оператору f(A) в том же базисе отвечает матрица f(A). Все утверждения и формулировки этого параграфа, в которых фигурирует матрица А, остаются в силе и после замены А оператором Л.
§ 1.3. Операторы и абстрактные функции 37 § 1.3. Операторы и абстрактные функции В этом параграфе вводится ряд объектов функционального анализа и уста- устанавливаются различные их свойства, необходимые в дальнейшем при изучении операторных уравнений Риккати. Излагаемый здесь материал достаточно полно представлен в учебниках и научных трудах. При желании с ним можно ознако- ознакомиться более детально по соответствующей литературе. Необходимость изложе- изложения этого материала в предлагаемой книге диктуется весьма простыми сообра- соображениями: собрать воедино нужный вспомогательный материал и ввести удобные для использования обозначения. 1. Линейные операторы. Всюду в дальнейшем под линейным оператором понимается оператор, определяемый следующим образом. Пусть X и Y — линейные пространства, оба вещественные или оба комплекс- комплексные. Оператор А : X ^ Y с областью определения D(A) называется линейным, если: 1) D(A) — линейное многообразие; 2) A(XiXi + А2Ж2) = XiAxi + \2Ax2 для любых х±,Х2 Е D(A) и любых скаляров Ai и А2. Практически наиболее важны два случая задания линейных операторов: 1) D(A) = X, т. е. А задан всюду в X; 2) пусть X — нормированное пространство, и пусть D = X (D — замыкание области D). В этом случае говорят, что оператор А плотно задан в X или что область определения А плотна в X. Пусть X и Y — нормированные пространства и А : X —У У, причем А — ли- линейный оператор, заданный всюду в X, т.е. D(A) = X. Оператор А называется непрерывным в точке жо G X, если Ах —у Ах$ при х —У х$. Если А непрерывен во всех точках х Е X, то он называется непрерывным. Если X и Y — банаховы пространства и D(A) = X, то оператор А называется ограниченным, если существует постоянная М > 0, такая, что ||Дж||у ^ М||ж||х для всех х Е X. Оказывается, что если X и Y — банаховы пространства, А — линейный опе- оператор и D(A) = X, то А непрерывен тогда и только тогда, когда ограничен. В предыдущих параграфах мы рассматривали линейные операторы, определен- определенные на элементах конечномерных евклидовых пространств. Дополним их опера- операторами в бесконечномерных пространствах. Пример 3.1. Пусть х = {xi,X2, • • • } Е 1Р, у = {yi,y2,... } G /g, т. е. выполня- выполняется оо оо Е xk\p < 00, > \yj q 00. k=l j=l Обозначим через А — линейный оператор, определяемый матрицей 00 j, k = 1, 2,..., отображающий х в у по формуле yj = V^ ajkxki j = 1,2,... Тогда, если выполнены условия: II оо оо 1) —|— = 1, 2) V^ V^ laj/c|g < °°5 то оператор А будет ограниченным. Р q j=ik=i
38 Гл. 1. Матрицы, операторы и группы Пример 3.2. Рассмотрим линейный интегральный оператор, определяемый формулой гЪ v(x) = / K(x,s)u(s)ds. C.1) J a Если предположить, что он определен на функциях и(х) Е С(а,Ь), а ядро K(x,s) непрерывно по переменным х и s в области а ^ ж, s ^ 6, то выражение C.1) определяет линейный ограниченный оператор А : С(а,Ь) —>¦ С(а,Ь). Пример 3.3. Рассмотрим дифференциальный оператор, определяемый диф- дифференциальным выражением Аи = V^ aa(x)Dau, где все коэффициенты _ аа(ж) непрерывны в замкнутой ограниченной области G С Еп векторов вида х = \Х\,..., хп\. Из оценки ЦЛ^Ц^с^л ^ max ||аа(ж)||С/^л max N, |^а^| следует, что Л явля- \ ется линейным ограниченным оператором, действующим из Cl(G) в C(G). 2. Пространство линейных операторов. Будем рассматривать всевоз- всевозможные ограниченные операторы Л, В, С,..., определенные всюду в нормирован- нормированном пространстве X и со значениями в нормированном пространстве Y. Опре- Определив на них операции сложения и умножения на число с помощью формул (Л + В)х = Ах + Вх, (ХЛ)х = ХЛх, находим, что это множество является линей- линейным пространством. В этом пространстве операторов норму можно задавать различными способа- способами. Однако наиболее употребительной является норма ||Л||= sup ||Лх||. C.2) Отсюда, в частности, следует, что II^IKIHIIINI (з-з) для всех х G X. Полученное нормированное пространство обычно обозначают через L(X, Y). Пусть дана последовательность операторов {Ап},Ап G L(X,Y). Будем гово- говорить, что Ап —> A G L(X,Y) при п —> оо равномерно, если \\Ап — А\\ —> 0 при п ->• оо. Можно показать, что из этого определения вытекает справедливость следующего утверждения. Теорема 3.1. Если пространство X нормировано, a Y банахово, то L(X,Y) банахово. В дальнейшем нам также потребуется другой тип сходимости элементов из L(X,Y). Будем говорить, что последовательность операторов {Ап} из L(X,Y) сильно сходится к A G L(X,Y), если для любого элемента х G X выполняется условие \\Апх- Ах\\ ->0, п-^оо. C.4) Как известно, введенные сходимости не эквивалентны. Из равномерной схо-
§ 1.3. Операторы и абстрактные функции 39 димости последовательности операторов непременно следует их сильная сходи- сходимость. Однако обратное не всегда верно. Среди многих разнообразных применений понятия непрерывности операторов особо следует отметить свойство продолжимости оператора по непрерывности. Оно состоит в следующем. Пусть А — линейный оператор с областью определения D(A), плотной в норми- нормированном пространстве X, и с областью значений в нормированном пространстве Y. Будем говорить, что А ограничен на D(A), если ||Л|| = sup \\Ax\\ < оо. xeD(A), При этом величина ||Л|| называется нормой оператора А. Справедливо следующее утверждение. Теорема 3.2. Пусть X — нормированное, a Y — банахово пространства и А — линейный оператор с D(A) С X и областью значений R(A) С Y, причем D(A) — X и на D(A) оператор А ограничен. Тогда существует линейный ограни- ограниченный оператор А такой, что 1) Ах = Ах для любого х Е D(A); 2) 3. Обратные операторы. Вопросы существования обратного оператора и анализа их различных свойств достаточно многообразны. Здесь мы остановимся лишь на некоторых из них. Прежде всего, приведем основную теорему сущест- существования обратного линейного оператора. Пусть задан линейный оператор А : X ->• Y, где X nY — линейные простран- пространства, причем его область определения D(A) CI,a область значений R(A) С Y. Обозначим, далее, через N(A) множество N(A) = {х е D(A) : Ах = 0}. Справедливо следующее предложение. Теорема 3.3. Оператор А переводит D(A) в R(A) взаимно однозначно тогда и только тогда, когда N(A) = {0}. Если это условие выполнено, то существует обратный оператор А~г, отображающий R(A) в D(A) взаимно однозначно. При этом А~г также является линейным оператором. В том случае, когда X и Y — нормированные пространства, доказывается следующая Теорема 3.4. Оператор А~г существует и одновременно ограничен на R(A) тогда и только тогда, когда для некоторой постоянной т > 0 выполняется не- неравенство \\Ax\\ ^ 7тг||х||, для всех х G D(A). Из свойств обратимых линейных операторов отметим лишь одно, ибо оно имеет принципиальное значение в практическом применении теории при построении функций от операторов. Теорема 3.5. Пусть А, В Е L(X,Y), А непрерывно обратим и выполнено не- неравенство \\(В-А)А~1\\ < 1. C.5) Тогда В непрерывно обратим и справедливы оценки ¦¦g-i|i < II-4!! |.g-i л-ч<\\л-Ч\\(в-л)Л-Ч IIй "^Ц' Р Л |К 1-\\(В-А)А-Ц •
40 Гл. 1. Матрицы, операторы и группы 4. Абстрактные функции числового аргумента. Пусть Л — некоторое множество на числовой оси или в комплексной плоскости, а X — нормирован- нормированное пространство. Рассмотрим функцию х(Х) с областью определения Лис областью значений в X. Такие функции называются абстрактными. На аб- абстрактные функции числового аргумента без труда переносятся многие понятия и факты математического анализа. Имеются и такие, которые играют принци- принципиальную роль во многих разделах функционального анализа и его приложений. Остановимся на некоторых из них. Элемент а е X называется пределом функции х(Х) в точке Ло G Л и записыва- записывается а = Нтл-^Ло XW или XW ~^ а ПРИ ^ "^ 'Vb если \\XW — а|| ->• 0 при Л ->• Ао- Определим производную абстрактной функции: ж'(Ао) = Нт —— —-. Л—^Ло А — Ао Последовательности элементов ж^, k = 1, 2,..., из пространства X можно по- поставить в соответствие степенной ряд C.7) п и соответствующие ему частичные суммы Sn(X) = /~^ х^Хк, п = 1, 2,... k=i Тогда под суммой ряда C.7) понимается элемент 5(А) = lim Sn(X). Множес- п—^оо тво всех тех значений A G Л, при которых S(X) существует, называется областью сходимости ряда C.7). Абстрактную функцию х(Х) будем называть аналитической при А = 0, если она представима в некоторой окрестности точки А = 0 сходящимся степенным рядом C.8) k=0 с ненулевым радиусом сходимости. Справедливо следующее утверждение. Теорема 3.6. Если абстрактная функция ж (А) является аналитической при А = 0, то х(Х) непрерывна и дифференцируема в круге Sr@), где R — радиус сходимости степенного разложения C.8). Доказательство почти дословно повторяет доказательство соответствующего утверждения из теории функций комплексного переменного. Если абстрактная функция х(Х) бесконечно дифференцируема в точке А = 0, то ряд V^ ———Хк называется рядом Тейлора функции ж (А). к=о к' 5. Резольвентный оператор R\(A). Пусть X — комплексное банахово пространство. Рассмотрим линейный оператор Л : 1ч!с областью опреде- определения D(A), плотной в X. Этому оператору поставим в соответствие оператор М. = XS — А, где А — комплексный параметр, а ? — единичный оператор в L(X,X) = L(X)
§ 1.3. Операторы и абстрактные функции 41 Определение 3.1. Точка Л называется регулярной точкой оператора Д, если оператор Л4 непрерывно обратим. Совокупность регулярных точек оператора А называется резольвентным множеством оператора А и обозначается через р(Л). Если Л Е р(А), то линейный оператор R\(A) = Л4~г Е L(X) называется резольвентой оператора А. Отметим основные свойства множества р(А). 1) Резольвентное множество р(А) всегда открыто. 2) Если А е ЦХ), то {Л : |А| > ||Л||} С р(А). 3) Если оператор А ограничен, то множество р(А) неограничено. Определение 3.2. Дополнение к р(А) (в комплексной плоскости) называется спектром оператора А и обозначается через а(А). Из первого свойства множества р(А) следует, что множество а(А) замкнуто, а из второго свойства получаем, что спектр ограниченного линейного оператора А сг(А) С 5||дц@) (спектр Л лежит в круге |А| ^ \\A\\) и, следовательно, являет- является ограниченным множеством. При этом оказывается, что если точка A Е сг(Д), то возможны три следующих случая. 1) Оператор М. не обратим. 2) Оператор М обратим, но его область значений R(M) не совпадает с X. 3) Оператор М обратим, R(M) = X, но оператор (М)~г неограничен. Определение 3.3. Число А называется собственным значением оператора Л, если существует вектор ж / 0, х Е D(A), такой, что Ах = Хх. При этом элемент х называется собственным элементом оператора А. Ясно, что если А — собственное значение, то оператор Л4 не обратим и, сле- следовательно, имеет место первый случай. Теорема 3.7. Пусть A Е L(X), где X — комплексное банахово пространство. Тогда существует конечный предел ra(A)= lim \\Лп\\^п C.9) п—ь-оо и имеет место соотношение Ы\\Лп\\1^ = г<7(Л)^\\Л\\, C.10) а предел C.9) называется спектральным радиусом оператора А. Учитывая чрезвычайную важность этой теоремы, а также конструктивность ее доказательства, приведем его полностью. Доказательство. Положим inf ЦЛ71!!1/71 = г. Согласно определению нижней 71^1 грани, для всякого г > 0 можно найти номер т такой, что будет справедливо неравенство ЦЛ771!!1/771 ^ г + г. Известно, что всякое натуральное число п однозначно представимо в виде п = рпт + qnj где рп — натуральное число, aO^gn ^ т — 1. Следовательно, справедливо соотношение
42 Гл. 1. Матрицы, операторы и группы Легко видеть, что = 1 у 1, У 0 при п —> оо, а поэтому п п п lim (г + г)т^/п||Д||^/п = г + г. п—юо Но тогда можно найти номер 7V такой, что для любых номеров п > N справедливы соотношения (г + е)тРп^п\\А\\Яп^п < (г + г) + г = r + 2г. Таким образом, мы имеем неравенства г ^ ЦЛ71!!1/71 < г + 2s, справедливые для всех п > N. Это и означает существование предела C.10) и справедливость равенства га(Л) = г (см. формулу C.10)). Осталось заметить, что Значит, га(Л) ^ ||Л|| и теорема доказана. Теорема 3.8. Пусть Л G L(X), X — комплексное банахово пространство. Если |А| > га(Л), то Хе р(А). оо Доказательство. Рассмотрим ряд Y^ A"^^. Если |А| > га(Л), то lim ||А-1-/сЛ/с||1//с = (Ар1 lim |A~=L|=L/^11^L^ к—юо /с—^оо оо оо ~к~гЛк Это означает, что ряд ^~^ 11А ^ =L^L/c11 сходится, а значит, ряд 2^ Х~к~гЛк схо- k=o к=о дится абсолютно. Обозначим через 5(А) его сумму (при |А| > гст(Л)), а через SVi(A) — его п-ю частичную сумму. Легко проверить, что Sn(A)(.M) = (M)Sn(X) =?- A-n"Mn+1. Переходя в этих равенствах к пределу при п ->• оо предполагая, что |А| > гст(Л), получаем S(X)(M) = (Л^M(А) = ?. Следовательно, оператор М непрерывно обратим, т.е. A G р(Л). Кроме того, 5(А) = М~г = R\(A). Теорема доказана. Пример 3.4. Пусть K(t,s) — непрерывная функция двух переменных в тре- треугольнике Д = {?,з:а^?^?, а ^ t ^ b} и рассмотрим интегральный ft оператор Вольтерра y(t) = Kx(t) = / K(t,s) x(s) ds. Найдем спектральный J a радиус pcr{K) этого оператора. Пусть к = max |lf(?, s)| и xn(t) G C(a,b), n = 1,2,..., последовательность функций, определяемая формулами rt rt x\(t) = / K(t,s) x(s) ds, X2(t) = / K(t,s) xi(s) ds, J a J a ..., xn(t) = K(t,s)xn-1(s)ds, ..., «/a
§ 1.3. Операторы и абстрактные функции 43 где x(t) Е C(a,b). Последовательно получаем оценки ft \xi(t)\ ^ / \K(t, s)\ \x(s)\ds ^ k(t — a) max \x(t)\ = k(t — а)||ж||, Ja [aM ft |^2(^)| ^ к I k(s — a)ds • \\x\\ = kz- J a ,2(t-aJ Ja (n-1)! ds ¦ \\x\\ = n\ Так как xn(t) = Knx(t), то получаем неравенство ||Хпж|| ^ j ||ж||, из ) которого следует, что ||i^n|| ^ : . п! Поэтому г о-(К) = lim ЦХ71!!1/71 = 0. Значит, все точки А / 0 комплексной п—юо плоскости являются точками резольвентного множества интегрального операто- оператора Вольтерра. Рассмотрим теперь оператор-функцию Л (Л). Она называется аналитической в точке Л = Ло, если она разлагается в некоторой окрестности этой точки в степен- оо ной ряд Л(Х) = /~^ Лп(Х — Ло)п, сходящийся по норме L(X) в этой окрестности. п=0 Если в качестве Л(Х) взять резольвенту И\(А) оператора Л G L(X), то, в соот- соответствии с теоремой 3.8 при |А| > га(Л) имеет место равенство \"Л"МЛ, (з.п) k = 0 которое представляет собой разложение 1Z\(A) в окрестности бесконечно уда- удаленной точки А = оо. Отсюда, в частности, следует, что бесконечно удаленная точка также является регулярной точкой, т.е. точкой из р(А). Теорема 3.9. Если A G L(X), то его спектр а(А) — непустое множество. Доказательство. Допустим, что спектр сг(А) пуст. Для всяких х Е X и / G X* (X* — пространство, сопряженное с X) можно рассмотреть числовую функцию комплексного переменного А: (р(Х) = AZ\(A)x, /). Так как п п \(llx(A)x,f) + Y, ^k-HAkx,f)\ ^ \\Пх(Л) + Y, A"fe-Mfe|| INI Il/H, k=0 k=0 00 то из C.11) следует, что ip(X) = — V^ Х~к~г(Акх, /). Функция ip(X) аналитична k = 0 на всей комплексной плоскости и ц>(оо) = 0. Тогда, по теореме Лиувилля из теории функций комплексного переменного следует, что выполняется тождество ц>(Х) = 0. Так как элемент / произволен, то 1Z\(A)x = 0. А поскольку элемент х также произволен, то 1Z\(A) = (М)~г = 0. Это невозможно. Полученное противоречие доказывает теорему.
44 Гл. 1. Матрицы, операторы и группы С чисто формальной точки зрения существует большая аналогия между сте- степенными рядами, рассматриваемыми в теории функций от матриц и степен- степенными рядами, определяющими оператор-функции, например, И\(А). Поэтому представляется естественным рассмотреть вопрос о функциях от операторов. К такого типа функциям можно отнести, в частности, 1Z\{A), ибо этот оператор оо представим в виде степенного ряда вида И\(А) = ^ CkAk. к = 0 Чтобы дать их общее определение, можно поступить следующим образом. Сначала следует определить понятие интеграла на множестве оператор-функций А = А(Х), где Л — комплексный параметр. Делается это почти дословным по- повторением того, что говорится при определении интеграла в теории функций комплексного переменного. После этого обозначим F(A) совокупность всех комплекснозначных функций /(Л), каждая из которых голоморфна в некоторой окрестности спектра оператора А. Эта окрестность может быть несвязной и, вообще говоря, зависит от функции /(Л). Пусть Г — контур, состоящий из конечного числа спрямляемых замкнутых жордановых кривых, лежащих в области голоморфности функции /(Л). Кроме того, контур Г должен ограничивать область, содержащую спектр оператора А. Направление обхода области возьмем левое, т. е. при положительном направлении обхода области по контуру Г охватываемая им область должна находиться слева. Затем строится линейный ограниченный оператор f(A) = -±- j f(\)Rx(A) d\. C.12) Это определение функции от оператора согласуется полностью с определением та- оо кой же функции с помощью степенного ряда f(A) = V^ cj~Ak, который строится, исходя из числового ряда /(А) = V^ с/Д^, сходящегося в некоторой окрестности к=о спектра оператора А. Пример 3.5. Пусть спектр оператора А не содержит и не окружает Л = 0. Разрежем плоскость (Л) по любой кривой, соединяющей 0 и оо, например, по вещественной отрицательной полуоси и рассмотрим на плоскости с этим разрезом однозначную функцию In Л. В качестве контура Г возьмем кривую, окружающую спектр оператора Лине пересекающую линию разреза. Тогда определен оператор — /in XRx(A)dX. 1пЛ=- — 2тгг Отметим важнейшие свойства введенных так функций от операторов. 1. Если f,g? F(A) и а,C — комплексные числа, то af+Cg G F(A), fg G F(A) и af(A) + /3g(A) = (a/ + /3g)(A), f(A)g(A) = fg(A). 2. Если f G F(A), то равенство f(A) = 0 возможно тогда и только тогда, когда /(Л) =0 во всех точках открытого множества, содержащего весь спектр оператора А, за исключением, быть может, конечного числа полюсов резолъвен-
§ 1.3. Операторы и абстрактные функции 45 ты R\(A), в которых функция /(А) имеет нули, кратность которых превосходит порядок соответствующих полюсов. 3. Если / е F(A), то f e F(A*) и /(Л*) = /(Л)*, где А* — оператор, сопряженный с А. 4. Если Л(Л) — спектр оператора А, то /(Л(Л)) — спектр оператора f[A). 5. Если / е F(A), Q e F(f(A)) и h[X) = g(f(X)), то справедливо h е F(^) м 6. #а/ш /n Е F(A), функции fn(X) голоморфны в некоторой фиксированной окрестности спектра оператора А и равномерно сходятся в этой окрестности к функции /(Л), то последовательность операторов fn(A) сходится по норме к оператору f(A). Перечисленные свойства дают основания утверждать, что на построенных функциях от операторов мы имеем все необходимое для операторного исчисления на ограниченных операторах, хотя в этом исчислении фигурируют лишь анали- аналитические функции. В ряде задач требуется иметь непрерывные или достаточно гладкие функции от операторов. Это иногда удается сделать для специальных классов операторов, причем построение такой теории в банаховом пространстве встречает существенные трудности. Для самосопряженных операторов в гиль- гильбертовых пространствах эта задача решается гораздо проще и в этом направлении получены весьма важные общие результаты. Предположим, что А — линейный оператор, действующий в X с плотной в X областью определения D[A). Рассмотрим резольвенту 1Z\[A) = (А — Х?)~1 этого оператора в предположении, что Л G р(А). Если Ло G р(А), то, согласно формуле C.9), ряд оо ПХ(А) = [? + (Л - АоЖао^Г^АоМ) = Е(До " А)^л^(Л) (ЗЛЗ) k = 0 сходится в круге |А — Ао| < Н^-Ао^)!!- Следовательно, R\(A) — аналитическая функция параметра А в любой точке Ао G р(А). 6. Нелинейные операторы и их дифференцирование. Предположим, что X и Y — нормированные пространства, а Т — оператор, действующий из X в Y с областью определения D(F) и областью значений R{T). Этот оператор называется дифференцируемым в данной точке х е D(T), если существует такой ограниченный линейный оператор АХ{Т) G L(X, F), что Т{х + Л) - Т[х) = Ах(f)h + а(х, Л), C.14) где ^Р^О „р„||Л|Н0. C.15) Выражение Ax{T)h представляет собой, очевидно, элемент пространства Y и называется сильным дифференциалом [дифференциалом Фреше) оператора Т в точке х. Сам оператор АХ{Т) называется сильной производной [градиентом) опе- оператора Т в точке х. Будем обозначать эту производную символом Т'[х). Легко показать, что если оператор Т дифференцируем в точке ж, то соответ-
46 Гл. 1. Матрицы, операторы и группы ствующая производная определяется однозначно. При этом она обладает следу- следующими свойствами. 1. Если Т{х) = у о = const, то J7' (х) = 0. 2. Производная непрерывного линейного оператора А есть сам этот оператор. Действительно, по определению имеем А(х + К) — Ах = Ah. 3. (Производная сложной функции.) Пусть X, Y, Z — три нормированных пространства, U(xq) — окрестность точки хо G X и Т — непрерывное ото- отображение этой окрестности в Y, причем уо = Т(хо), a W(yo) — окрестность точки у о и Q — непрерывное отображение этой окрестности в Z. Тогда, если оператор Т дифференцируем в точке хо, а оператор Q дифференцируем в точке уо, то оператор % = QT дифференцируем в точке хо е X и П'(хо) = д/(уо)Т'(хо). C.16) Доказательство. Действительно, в силу сделанных предположений, имеем f(xo+O =Я(жо)?+ ai(f), 9(уо+г1)=9'(уо)г1 + <Х2(г1). Так как Я (ж0) и д'(у0) — ограниченные линейные операторы, то 0 = ОЫ + = 6(уо) 4. Пусть Т и Q — два непрерывных оператора, действующих из X в Y. Если Т и Q дифференцируемы в точке х$, то и операторы Т + G и аТ (а — число) также дифференцируемы в этой точке, причем (Т + G)''(жо) = Т'(xq) + Q'(xq), Наряду с дифференциалом Фреше в теории и приложениях нелинейных опе- операторов применяется слабый дифференциал, который определяется следующим образом. Пусть Т — нелинейный оператор, действующий из нормированного простран- пространства X в нормированное пространство Y. Слабым дифференциалом или диффе- дифференциалом Гато оператора Т в точке х называется предел DF(x, h) = jt?(x + th) v Т{х + th) - Т(х) = hm —^ f ^, C.17) I r\ 1У T \J i, где сходимость понимается как сходимость по норме в пространстве Y. Слабый дифференциал может и не быть линейным по h. Если же такая линей- линейность имеет место, т. е. если DT[x, h) = T'c[x)h, где Т'с[х) — линейный оператор, то этот оператор называется слабой производной или производной Гато. Заметим, что для слабых производных теорема о дифференцировании сложной функции, вообще говоря, не верна. Однако, в этом случае справедлива формула конечных приращений. Она получается следующим образом. Пусть О — открытое множество в X и О С D(T), в О целиком содержится отрезок [жо,ж] = ^хо + A — А)ж, 0 ^ А ^ 1. Предположим, далее, что оператор Т имеет слабую производную Т'с в каждой точке отрезка [жо,ж]. Положим Ах = х — хо и, взяв произвольный линейный функционал (/) G У*, рассмотрим числовую функцию /(?) = ip(Jr(xo +tAx)), определенную при всех
§ 1.3. Операторы и абстрактные функции 47 О ^ t ^ 1. Эта функция дифференцируема по ?, так как в выражении fit + At) - fit) (ТЫ + tAx + At Ax) - Р(х0 + tAx), Д* = ^ Д* ) можно перейти к пределу под знаком непрерывного линейного функционала (р. В результате получаем f'(t) = (р(Т'с(хо -\- tAx)(Ax)). Применяя к функции /(?), 0 ^ t ^ 1, формулу конечных приращений, получаем /A)-/@) = /'(#), гдеО^О, т.е. <р{Т{х) - T{xq)) = <р(Г'с(х0 + 0Ax)(Ax)), C.18) причем это равенство справедливо при любом функционале ip Е Y*, а величина в не зависит от (р. Поэтому из C.18) следует, что \ч>(Т(х) - ТЫ)\ ^ IMI sup ||^(х0 + 0Ах)\\ \\Ax\\. C.19) Выберем ненулевой функционал (р, чтобы (р(Т(х) - Т(х$)) = \\ip\\ \\F(x) - (существование такого функционала следует из теоремы Хана-Банаха). При этом из соотношения C.19) получаем неравенство sup ||^(хо+#Аж)||||Ах||, Ах = х-х0, C.20) Это неравенство можно рассматривать как аналог теоремы о среднем для число- числовых функций. Применяя неравенство C.20) к оператору Т(х) — Jr/c(xo)(Ax), получаем следу- следующее неравенство \\Т{х) - Нх0) - ^Ы(Ах)|| ^ sup \\Г'с(х0 + вех) - Г'СЫ\\ 1|Ах||, C.21) которое называется формулой конечных приращений. Завершая анализ дифференцируемости операторов, приведем теорему о связи между слабой и сильной дифференцируемостью. Теорема 3.10. Если слабая производная Т'с[х) оператора Т{х) существует в некоторой окрестности U(xo) точки хо и представляет собой в этой окрестнос- окрестности непрерывную (операторную) функцию от ж, то в точке хо сильная производная Т'{хо) существует и совпадает со слабой. Из существования сильной производной всегда следует существование слабой производной и они всегда при этом совпадают. В дальнейшем всегда, если не оговорено противное, будем рассматривать толь- только сильные дифференциалы и сильные производные. 7. Производные и дифференциалы высших порядков. Формула Тей- Тейлора. Пусть Т — дифференцируемый оператор, действующий из нормирован- нормированного пространства X в нормированное пространство Y. Его производная Т'{х) при каждом х G X является элементом из L(X, Y), т. е. Т' отображает простран- пространство X в пространство линейных операторов L(X, Y). Если это отображение (т. е. этот оператор) дифференцируемо, то соответствующая производная называется второй производной оператора Т(х) и обозначается символом Т".
48 Гл. 1. Матрицы, операторы и группы Таким образом, Тп'(ж) есть элемент пространства L(X, L(X, Y)) линейных опе- операторов, действующих из X в L(X, Y). Покажем, что элементы этого пространст- пространства допускают более удобную и наглядную интерпретацию в виде так называемых билинейных отображений (билинейных операторов). Будем говорить, что задан билинейный оператор, отображающий простран- пространство X в пространство У, если каждой упорядоченной паре элементов ж и х' поставлен в соответствие элемент у = B(x,xf) Е Y так, что выполнены следую- следующие условия: 1) для любых x,x/,xi,X2,x/1,x/2 из X и любых чисел а и /3 справедливы ') + /Щж2,ж'), В(х, ах[ + (Зх'2) = аВ(х, х[) + /Щж, х'2); 2) существует такое положительное число М, что ||23(ж,ж')|| ^М\\х\\\\х'\\ C.22) при всех ж, ж' G X. Иначе говоря, первое из этих условий означает, что оператор В линеен по каждому из своих аргументов, а из второго условия следует, что В непрерывен по совокупности аргументов. Наименьшее из чисел М, удовлетворяющих условию C.22), называется нормой билинейного оператора В и обозначается через ||В||. Очевидным образом определяются линейные операторы, заданные на множес- множестве билинейных операторов. Тем самым билинейные операторы В : X ->• Y сами образуют линейное нормированное пространство, которое в дальнейшем обозначается через B(X2,Y). При этом каждому линейному оператору Л из L(X,L(X,Y)) можно поставить в соответствие элемент из B(X2,Y), положив B(x,xf) = (Ax)xf. C.23) Легко устанавливается, что это соответствие линейно. Покажем, что оно так- также изометрично и отображает пространство L(X,L(X,Y)) на все пространство B(X2,Y). В самом деле, если у = В(х,х') = (Дж)ж', то \\y\\ ^ \\Ax\\ \\xf\\ ^ \\A\\ \\x\\ \\х'\\. Отсюда следует, что РИ ^ ||Л||. C.24) С другой стороны, если задан билинейный оператор В, то при фиксированном х е X отображение х' ->• (Ах)х' = В(х,х') представляет собой линейный опера- оператор, отображающий пространство X в Y. Тем самым каждому х G X ставится в соответствие элемент Ах пространства L(X,Y). При этом очевидно, что Ах ли- линейно зависит от ж, т. е. билинейный оператор В представляет собой некоторый элемент А пространства L(X,L(X,Y)). Кроме того, оператор В восстанавлива- восстанавливается по А при помощи формулы C.23) и ||Лж||= sup ||(Дж)ж'||= sup Отсюда следует, что 1И11 < \\B\\- C.25)
1.3. Операторы и абстрактные функции 49 Сопоставляя соотношения C.24) и C.25), получаем, что ||Л|| = Значит, соответствие между пространствами B(X2,Y) и L(X,L(X,Y)), опре- определяемое равенством B.23), линейно и изометрично, а, следовательно, и взаимно однозначно. При этом образ пространства L(X,L(X,Y)) есть все пространство B(X2,Y). Пример 3.6. Пусть X и У — конечномерные евклидовы пространства размер- размерностей тип соответственно. Тогда каждый оператор, отображающий X в У, можно задать (т х п)-матрицей. Таким образом, производная Т'(х), зависящая от ж, оператора Т', действующего из X в У, представляет собой матрицу. Если в X и У выбраны следующие базисы: ei,..., em в X и /i,..., /п в У, то дуг ду2 дуп <Эжт <9жт <9жт / Вторая производная Т" [х) определяется совокупностью т х т х п величин , д2ук , a^j = ——-—, i,j = l,...,m, к = 1,...,п. Такую совокупность величин а^ т можно рассматривать или как определяемое формулой Щ = V^ a^jXi линейное г=1 преобразование пространства X в пространство L(X,Y), или как определяемое т формулой с = V^ a^jXiXj билинейное отображение пространства X в простран- пространство У. Аналогичным образом можно ввести понятие третьей, четвертой и вообще п-ой производной оператора J7, действующего из X в У, определив n-ю производную, как производную от производной (п — 1)-го порядка. При этом очевидно, что п-я производная является элементом пространства L(X, L(X,..., L(X, У)...)). Повторяя рассуждения, приведенные для второй производной, можно каждо- каждому элементу этого пространства естественным образом поставить в соответствие элемент пространства N(Xn, У) n-линейных отображений X в У. При этом под п- линейным отображением понимается такое соответствие у — N(x',хП,... ,х^) между упорядоченными системами (ж',ж",... ,х^) элементов из X и элемен- элементами пространства У, которое линейно по каждому из х^ при фиксированных остальных элементах ж^1),... ,ж^г~1\ж^г+1\ ... ,ж(п) и удовлетворяет при неко- некотором М > 0 условию ||ЛГ(ж',ж",...,ж(г1))|| ^ М\\х'\\ ||ж"|| ... ||ж(п)||. Тем самым n-ю производную оператора Т можно считать элементом пространства N(Xn, У). Используя приведенные результаты, легко определяются понятия дифференци- дифференциалов высших порядков. Выше был определен сильный дифференциал оператора Т как результат применения к элементу h G X линейного оператора Т'(х)^ а имен- именно dT — Т'{x)h. Поэтому естественно определить дифференциал второго порядка по формуле d2^ = ^Г//(ж)(/г,/i), т.е. как квадратичное выражение, отвечающее оператору Я'(ж) G B{X2,Y). Дифференциалом п-го порядка называется dnT — T^{x){h, /i,..., /i), т. е. тот
50 Гл. 1. Матрицы, операторы и группы элемент пространства У, в который элемент (ft,..., ft) G X х ... х X = Хп переводится отображением Т^п\х). Имея эти понятия, можно ввести весьма полезную в анализе формулу Тейлора. Делается это следующим образом. Сильная дифференцируемость Т означает, что разность Т[х + ft) — Т{х) мо- может быть представлена в виде суммы линейного члена и слагаемого, имеющего порядок выше первого относительно \\h\\. Справедливо более общее утверждение. Теорема 3.11. Пусть оператор Т : X —у Y определен в некоторой области D{T) С X и такой, что Т^п\х) существует и представляет собой равномер- равномерно непрерывную функцию от х Е D(T). Тогда справедливо равенство [формула Тейлора) Т[х + ft) - F(x) = T'{x){h) + ^-T"{x){h, h) + ... ... + ^j^n)(x)(h,..., Л) + ш(х, h), C.26) 2de\\io(x,h)\\=o(\\h\\n)- Доказательство. Теорему будем доказывать методом полной математичес- математической индукции. При п = 1 равенство C.26) тривиально. Пусть оно верно для п — 1 при любом удовлетворяющем условиям теоремы операторе Т. Тогда для оператора Т' [х) имеем Т\х + К) = Т'{х) + T"{x){h) + ^T"'{x){h, h) + ... •'' + (^ГТ)ТТЫ^^ • • •, Л) + ^i(^ Л), C.27) Интегрируя по отрезку [ж, x+h] обе части этого равенства и используя формулу Ньютона-Лейбница, получаем T{x)= f F(x + th)(h)dt= f \f'(x)+tf"(x)(h) + Jo Jo ^ ^t2Tm(x){h, h) + ... + l^-i^)(Ж)(Л,..., ft)}(ft) dt + Дп, C.28) z! n! ) где Rn = I Jo I o Отсюда непосредственно следует формула C.26). Теорема доказана. § 1.4. Банаховы алгебры При анализе матричных и, особенно, операторных уравнений Риккати ока- оказывается весьма полезным современный аппарат теории банаховых алгебр. Эта теория достаточно обширна и имеет содержательные приложения. Изложить ее даже вкратце на нескольких страницах не представляется возможным. Мы при- приведем лишь основные определения и утверждения, непосредственно относящиеся
§ 1.4. Банаховы алгебры 51 к содержанию книги. Чтобы излагаемый материал не выглядел слишком «сухим», по мере возможности будем приводить иллюстративные примеры. 1. Основные определения и примеры. Пусть X — комплексное линейное пространство. Оно называется комплексной алгеброй, если для любых x,y,z Е X и любого комплексного числа а в нем определено умножение, удовлетворяющее следующим условиям: x(yz) = (xy)z, D.1) (х + y)z = xz + yz, x(y + z) = xy + xz, D.2) a(xy) = (ax)y = x(ay). D.3) Если к тому же X является банаховым пространством по отношению к неко- некоторой норме, удовлетворяющей мультипликативному неравенству INKIMIIMI, хех, уех D.4) и, кроме того, X содержит единичный элемент е такой, что ех = хе = ж, х Е X, ||е|| = 1, D.5) то X называется банаховой алгеброй. Отметим, что в определении не требуется, чтобы алгебра была коммутатив- коммутативной, т. е. чтобы выполнялось условие ху = ух для всех х и у из X и это условие не предполагается выполненным, если оно не оговаривается специально. Большин- Большинство естественным образом возникающих банаховых алгебр обладают единицей, и любая банахова алгебра может быть дополнена единицей. В силу условия D.4), умножение является непрерывной операцией в X в том смысле, что из условий хп —> ж, уп —> у следует, что хпуп —> ху. Пример 4.1. Пусть С (К) — банахово пространство всех комплексных непре- непрерывных функций ж(?), заданных на компакте К = {t = {ti,...,tn} : \ti\ ^ M}, наделенное нормой ||ж|| = sup |ж(?)|. Определим умножение обычным способом, teK а именно, xy(t) = x(t)y(t). В результате С [К) становится коммутативной бана- банаховой алгеброй, единичным элементом которой является функция, тождественно равная единице. Пример 4.2. Пусть X — банахово пространство. Тогда S(X) = L(X) (про- (пространство ограниченных линейных операторов, действующих из X в X) яв- является банаховой алгеброй относительно обычной операторной нормы. Опера- Оператор X тождественного преобразования служит единицей этой алгебры. Если dimX = п < оо, то алгебра S(X) совпадает (изоморфна) с алгеброй всех квад- квадратных матриц порядка п. При этом если dimX > 1, то алгебра S(X) не комму- коммутативна. Любая замкнутая подалгебра в S(X), содержащая оператор /, также является банаховой алгеброй. Замечание 4.1. Вместо введенного понятия комплексной банаховой алгебры можно рассматривать вещественную банахову алгебру, используя вместо комп- комплексных чисел вещественные. Замечание 4.2. В рассматриваемой теории весьма значительное место зани-
52 Гл. 1. Матрицы, операторы и группы мают вопросы отображения одной банаховой алгебры в другую. Одним из особо важных типов таких отображений служит гомоморфизм. Линейное отображение h называется гоморфизмом, если оно мультипликативно, т. е. если h(xy) = h(x)h(y). Особый интерес представляет случай, когда образом относительно h служит простейшая алгебра — поле комплексных чисел С. Пусть X — комплексная алгебра, а ср — линейный функционал на X, не равный нулю тождественно. Если (р(ху) = <р(х)(р(у) D.6) для всех z,j/Gl, то функционал ср называется комплексным гомоморфизмом на алгебре X. Элемент х Е X называется обратимым, если он обладает обратным в X, т.е. если существует такой элемент х~г Е X, что х~гх = хх~г = е, где е — единич- единичный элемент в X. Доказано, что никакой обратимый элемент не может иметь более одного обратного элемента. Справедливо также следующее утверждение. Теорема 4.1. Если ср — комплексный гомоморфизм на комплексной алгебре X с единицей е, то ср(е) = 1 и ср(х) ф 0 для каждого обратимого элемента х Е X. Доказательство. Для некоторого у Е X имеем неравенство (р(?/) ф 0. Так как <рB/) = ip(ye) = (p(y)ip(e), то отсюда следует, что <р(е) = 1. Если элемент х Е X обратим, то (^(ж)(^(ж~1) = (^(жж) = <р(е) = 1. следовательно, ip(x) ф 0. Теорема 4.2. Пусть X — банахова алгебра, х € X и \\x\\ < 1. Тогда: 1) элемент е — х обратим; 3) |<^(ж)| < 1 для каждого комплексного гомоморфизма на X. Доказательство. Так как ||жп|| ^ \\х\\п и ||ж|| < 1, то элементы образуют в X последовательность Коши. Поскольку алгебра X (как банахово пространство) полна, то найдется элемент s Е X такой, что sn ->• s при п ->• оо. Так как хп->0и sn(e—ж) = е-жп+1 = (e—x)sn, то из непрерывности умножения вытекает, что элемент s является обратным к (е — х). Далее, из D.7) вытекает, 112 что А Е С и |А| > 1. Так как по доказанному элемент (е - А-1ж) обратим, то, в силу теоремы 4.1, справедливы соотношения 1 - Х~1(р(х) = ip(e - Х~гх) ф 0. Поэтому (р(х) ф А. Теорема доказана. Утверждения 1) и 3) этой теоремы представляют собой, по-видимому, наибо- наиболее широко используемые факты теории банаховых алгебр. В частности, из 3) вытекает, что все комплексные гомоморфизмы банаховых алгебр непрерывны. Следующую теорему также приведем с полным доказательством, учитывая ее чрезвычайную важность как в теории, так и в приложениях. Кроме того, значительный интерес представляет и приводимое здесь доказательство. Теорема 4.3. Если (р — такой линейный функционал на банаховой алгебре X, 00 II 1| что lls — е—х\\ = 1|ж2 + - • -+жп + ... II ^ У^ ll^||fc = п—п- Наконец, предположим, N Щ
§ 1.4. Банаховы алгебры 53 что ip(e) = 1 и ip(x) ф 0 для каждого обратимого элемента х Е X, то <р(ху) = (р(х)<р(у) D.8) при всех х,у е X. Доказательство. Пусть N — множество нулей (р. Если ж, у Е X, то из предположения <р(е) = 1 следует, что х = а + ср(х)е, y = b + ip(y)e, D.9) где а Е N, Ъ Е N. Если теперь операцию ip применить к произведению левых и правых частей соотношений D.9), то получим (р(ху) = (p(ab) -\- (р(х) (р(у). Таким образом, теорема будет доказано, если сможем показать, что ab Е N, если a G N и Ь G N. D.Ю) Предположим, что частный случай утверждения D.10), а именно, о2 G N, если а е N, D.11) уже доказан. Тогда, полагая в формулах D.9) х = у, будем иметь ф2) = Ых)\2 D.12) для всех х G X. Если в формуле D.12) заменить х на х + 2/, то получим <р(ж2/ + 2/ж) = 2^0*0 ф(у) D.13) для всех х,у Е X. Поэтому ху + ух ? N, если х ? N или у ? N. D.14) Рассмотрим, далее, тождество (ху - ухJ + (ху + 2/жJ = 2[жB/ж2/) + (уху)х]. D.15) Если ж G AT", то, согласно соотношению D.14), правая часть тождества D.15) также содержится в N. Кроме того, из D.12) и D.14) вытекает, что и элемент (ху + ухJ содержится в N. Поэтому (ху — ухJ также принадлежит N. Еще раз применяя D.12), получаем, что ху — ух G N, если х G N и 2/ E N. D.16) Если теперь сопоставить D.14) и D.16), то получим D.10) и, поэтому, D.7). Таким образом, справедливость формулы D.7) вытекает из D.11) чисто алгеб- алгебраически. Доказательство соотношения D.11) получается аналогичным методом. По предположению, множество N не содержит обратимых элементов алгебры X. Поэтому, согласно утверждению 1) теоремы 4.2, имеем ||е — ж|| ^ 1 для всех х G N. Значит, ||Ае-ж||^|А| = ИАе-ж)| D.17) для всех х е N и A G С. Так что ip является непрерывным линейным функцио- функционалом на X с нормой, равной 1. Для доказательства справедливости соотношения D.11) фиксируем некоторый элемент а е N. Не ограничивая общности, можно считать, что ||а|| = 1. Положим 71 = 0
54 Гл. 1. Матрицы, операторы и группы Так как |(^(ап)| ^ ||ап|| ^ |Н|П = 1, то / оказывается целой функцией, причем |/(Л)| ^ ехр |Л| для всех A Е С. Непосредственно из D.18) следует, что верно /@) = <р{е) = 1, а /"@) = <р{а) = 0. В теории функций комплексного переменного доказывается следующее ут- утверждение. Если /(А) — целая функция комплексного переменного Л, причем /@) = 1, /'@) = 0 и 0 < |/(Л)| < ехр |А| при А е С, то /(А) = 1 при всех A е С. Поэтому, если мы сможем доказать, что /(А) ф 0 для всех А Е С, то из этого утверждения будет вытекать, что /(А) = 1 и, следовательно, /"@) = 0. Поэтому будем иметь (р(а2) = 0 и тем самым соотношение D.11) будет доказано. Ряд ад = Е ^таП D-19) п=0 сходится по норме алгебры X при всех A Е С. По непрерывности функционала ip получаем, что f{\)=ip(E(\)), ЛёС. D.20) Как и в скалярном случае из D.19) вытекает, что Е(Х) удовлетворяет функ- функциональному уравнению Е(Х + /i) = E(X)E(/i). В частности, Е(Х)Е(-Х) = Е@) = е, A G С. D.21) Поэтому для каждого A G С элемент Е(Х) обратим в алгебре X. По предположе- предположению отсюда следует, что ip(E(X)) ф 0, т.е., согласно D.20), приходим к выводу, что /(А) ф 0. Теорема полностью доказана. 2. Основные свойства спектра. Пусть X — банахова алгебра, a G(X) — множество всех обратимых элементов этой алгебры. Если х е G и у е G, то элемент у~гх е G является обратным к элементу х~гу е G. Следовательно, G является группой (см. § 1.5). Резольвентным множеством р(х) элемента х называется множество всех тех A G С, при которых Хе — х имеет обратный элемент. Спектром а(х) элемента х G X называется дополнение к р(х) в С. Спек- Спектральным радиусом элемента х G X называется число ra(x) = sup{|A| : A G <г(х)}. D.22) Очевидно, что эта формула теряет смысл, если а(х) пусто. Однако, как показано ниже, такого никогда не бывает. Следующие две теоремы имеют большое значение в теории банаховы алгебр. Их доказательства довольно просты. Поэтому приведем их полностью. Теорема 4.4. Пусть X — банахова алгебра, предположим, что х е G(X), h e X и \\h\\ < A/2)||ж~1||~1. Тогда х + h e G(X) и справедливо неравенство \\(x + h)-1-x-1+x-1hx-1\\^2\\x-1\\3\\h\\2. Доказательство. Так как x + h = x(e + x~1h) и Нж/?,!! < 1/2, то вытекает из теоремы 4.2, что х + h G G(X) и что норма элемента в правой части тождества (х + /i) — х~г + x~1hx~1 = [(е + x~1h)~1 — е + x~1h]x~1 не превосходит 2||x~1/i||2||x~1||. Теорема доказана. Теорема 4.5. Если X — банахова алгебра, то G(X) образует открытое мно-
§ 1.4. Банаховы алгебры 55 жество в X, а отображение х —У х~г является гомеоморфизмом G(X) на себя. Доказательство. Из теоремы 4.4 следует, что G(X) открыто в X и что ото- отображение х —У х~г непрерывно. Так как это отображение взаимно однозначно переводит G(X) на себя и совпадает с обратным к нему, то оно является гомео- гомеоморфизмом. Следующая теорема (теорема 4.6 о спектральном радиусе) имеет большое зна- значение для различных прикладных задач, в том числе и тех, которые рассматрива- рассматриваются в настоящей книге. Однако, для ее доказательства нам потребуются новые понятия и факты, которые мы приведем без доказательства. Пусть Л — открытое множество в пространстве комплексных чисел С и пусть X — комплексное банахово пространство, которое, в частности, может быть банаховой алгеброй. Функция / : Л —> X называется сильно голоморфной в Л, если для каждой точки А Е Л существует сильный предел lim в в /1-Х смысле топологии пространства X. 1 Г А Величина indr(A) = ф -, где Г — замкнутая спрямляемая кривая, не 2тгг Jr \i — Л проходящая через точку Л, называется индексом точки А относительно конту- контура Г. Функция / : Л Е X называется слабо голоморфной в Л, если для любого линейного функционала ip Е X* функция ip(f) голоморфна в Л в обычном смысле. Теорема 4.6. Пусть / : Л —у X — слабо голоморфная функция на открытом множестве А С С со значениями в комплексном банаховом пространстве X. Тогда справедливы следующие утверждения. 1) Функция f сильно непрерывна на Л. 2) Для функции f имеют место теорема Коши и формула Коши: если Г — такой спрямляемый замкнутый контур в Л, что indr(A) = 0 для всякой точки f 1 / А Е Л, то ф f(/jL)d/ji = 0 и /(Л) = ф (/i — Л) /(/i) d/i для любой точки Jr 27гг Jr Л G Л \ Г, удовлетворяющей условию indr(A) = 1. Если Гх и Г2 — такие замкнутые спрямляемые контуры в Л, что верно indr1(A) = indr2(A) для всякой точки A G Л, то ф /(/i) d\i — ф /(/i) d/i. J?\ Jv2 3) функция f сильно голоморфна в Л. Теорема 4.7. Пусть X — банахова алгебра и х Е X. Тогда: 1) спектр а(х) элемента х есть непустое компактное множество; 2) спектральный радиус га(х) элемента х удовлетворяет условию ra(x)= lim ||xn||1/n= inf \\xn\\^n. D.23) Доказательство. Если |А| > ||ж||, то элемент е — А-1ж, согласно теореме 4.1, содержится в G(X). Поэтому (Ае — х) G G(X), так что А ^ а(х). Отсюда следует, что а(х) — ограниченное множество. Для доказательства замкнутости а(х) определим отображение (оператор) g : G -У X, полагая д(Х) = Ае - х. Тогда д непрерывно и дополнение п к
56 Гл. 1. Матрицы, операторы и группы а(х), совпадающее с g~1(G(X)), открыто в силу предыдущей теоремы. Таким образом, а(х) — компакт. Определим теперь отображение / : П —у G(X), полагая /(Л) = (Ле-х), А ЕС. D.24) Применим теорему 4.4, когда вместо элемента х взят Ле - ж, а вместо h — элемент (/i - Л)е. Если Л Е П и \i достаточно близко к Л, то в результате такой подстановки получим неравенство ||/(/i)-/(A) + (/i-A)/2(A)|| ^ 2||/(A)||3|/i-А|2, так что Ит /М ЯЛ) = _/2(A) А е с. /л->Л /i — А Таким образом, /(А) является сильно голоморфной Х-значной функцией в п. оо Если |А| > ||ж||, то, как легко видеть, /(А) = ^ Х~п~1хп. Этот ряд сходит- п=0 ся равномерно на окружности Гг с центром в точке 0 и радиусом г > ||ж||, а коэффициенты хп определяются по формуле хп = ^-Ж An/(A)dA, n = 0,l,... D.25) 2тгг JTr Если допустить, что а(х) пусто, то п будет совпадать с С и по теореме Коши все интегралы D.25) окажутся равными 0. Но при п = 1 левая часть в D.25) равна е ф 0. Полученное противоречие означает, что о[х) непусто. Так как область п содержит все А, для которых |А| > га(х), то, применяя теорему Коши, мы видим, что в формуле D.25) условие г > ||ж|| можно заменить на г > га(х). Из непрерывности функции / вытекает, что M(r) = max \f(reie)\ < оо, г > га(х). D.26) 6 В сочетании с D.25) это дает ||жп|| ^ rn+1M(r), поэтому lim sup Цж77'||1/77' ^ г, п—^оо г > га(х), и, наконец, lim sup Цж71!!1/71 ^ га(х). п—>-оо С другой стороны, если A G сг(х), то из тождества (Апе - хп) = (Ае - х)(Апе + ... + х71'1) D.27) вытекает, что элемент Апе — хп необратим. Поэтому An G а(хп) и |An| ^ ||^n||, для п = 1, 2,... Таким образом, ra(x) ^ inf ||жп||1/п. D.28) ^1 Из формул D.27) и D.28) следует справедливость D.23). Теорема доказана. Представляется полезным взять в качестве алгебры X пространство линей- линейных ограниченных операторов, сформулировать доказанную теорему в терми- терминах этого пространства и сравнить полученный результат с тем, что изложено в предыдущем параграфе. Теорема 4.8. Если X — такая банахова алгебра, в которой каждый ненулевой элемент обратим, то X изометрически изоморфно полю комплексных чисел С. Доказательство. Если х е X и Ai ф А2, то не более чем один из элементов из \\е—х и \<ze-x может быть равным нулю. Поэтому хотя бы один из них обратим.
§ 1.4. Банаховы алгебры 57 Так как а(х) непусто, то отсюда вытекает, что а(х) состоит ровно из одной точки. Обозначим ее Х(х) для каждого х Е X. Так как элемент Х(х)е — х необратим, то он равен нулю, т. е. х — Х(х)е. Следовательно, отображение х —у Х(х) осуществляет изоморфизм алгебры X в С, причем этот изоморфизм изометрический, поскольку |А(ж)| = ||Л(ж)е|| = ||ж|| для каждого х Е X. Замечание 4.3. Быть или не быть элементу алгебры X обратимым — чис- чисто алгебраический вопрос, не зависящий от топологических особенностей X. Поэтому спектр а(х) и спектральный радиус каждого элемента х Е X полнос- полностью определяются алгебраической структурой пространства. С другой стороны, lim Цж71!!1/71, очевидно, зависит от метрических особенностей X. В этом состоит одно из замечательных свойств формулы спектрального радиуса: она устанавли- устанавливает совпадение величин совершенно различной природы. Замечание 4.4. Алгебра X может оказаться подалгеброй более широкой ал- алгебры У. При этом вполне может оказаться, что некоторый элемент х Е X необратим в X, но обратим в У. В этом смысле спектр элемента х зависит от пространства, в котором мы его рассматриваем. В понятных обозначениях имеет место включение ах(х) Э ау(х), но фигурирующие здесь спектры могут разли- различаться. Спектральный радиус, однако, совсем не реагирует на переход от X к У, поскольку формула спектрального радиуса выражает эту величину в терминах метрических свойств элемента х и они не зависят от того, что происходит вне алгебры X. Более детально взаимодействие <Jx(x) и о~у(х) описывается теоремой. Теорема 4.9. а) Если X — замкнутая подалгебра банаховой алгебры У, при- причем X содержит единицу алгебры У, то G(X) (множество всех обратимых эле- элементов из X) есть объединение компонент множеств X f]G(Y). б) Если при тех же условиях х Е X, то ах(х) есть объединение множества ау(х) и некоторого (возможно, пустого) семейства ограниченных компонент до- дополнений к ау(х). В частности, граница множества <Jx(x) содержится в ау(х). Доказательство этой теоремы излагать не будем. Однако приведем очень важ- важное ее следствие. Следствие 4.1. Если сгу(х) не разделяет пространство С, т. е. если его до- дополнение Пу(х) связно, то (Ту(х) = сгх(х)- В заключение этого пункта приведем еще два очень важных результата, отно- относящихся к свойствам банаховых алгебр. Теорема 4.10. Если для данной банаховой алгебры X существует такая по- постоянная М < оо, что \\x\\ \\y\\ ^ М||ж2/|| для всех х и у из X, то алгебра X изометрически изоморфна полю С комплексных чисел. Теорема 4.11. Пусть X — банахова алгебра, х е X, п — открытое множес- множество в С и а(х) С П. Тогда существует такое S > 0, что а(х + у) С П, если уех и\\у\\<5. Теорема 4.11 дает ответ на вопрос о том, будут ли спектры двух элементов х и у из X близки (и в каком смысле), если близки элементы х и у.
58 Гл. 1. Матрицы, операторы и группы 3. Функциональное исчисление на банаховых алгебрах. В этом пункте вкратце излагается материал из банаховых алгебр, подобный тому, который в предыдущем параграфе назывался теорией функций от матриц. Пусть ж — элемент банаховой алгебры X, тогда произвольному скалярному полиному /(А) = ао + aiA + ... + an\n соответствует единственный элемент /(ж) Е X, определяемый формулой /(ж) = ао + а\х + ... + апхп. Аналогичным образом можно определить /(ж) Е X, если /(А) — целая функ- оо ция, определяемая степенным рядом /(А) = ^ ап\п. Исходя из тех же сооб- п=0 ражений, можно определить /(ж) Е X, если /(А) = . В этом случае /(ж) а — А определяется равенством f(x) = (ае-ж), которое имеет смысл для всех х Е X, спектр которых не содержит а. Эти примеры показывают, что /(ж), как элемент X, допускает разумное опре- определение, если функция /(А) голоморфна в некоторой открытой окрестности мно- множества сг(ж). Это предположение действительно оправдывается и цель может быть достигнута с помощью варианта формулы Коши, преобразующей комплекс- комплексные функции на некотором открытом подмножестве комплексной плоскости С в Х-значные функции, заданные на некотором открытом множестве в X. Как и в классическом анализе, формула Коши оказывается здесь лучшим средством, чем разложение в степенные ряды. Определяемые таким образом функции /(ж) Е X обладают рядом интересных свойств, которые рассматриваются в настоящем пункте. Для некоторых алгебр можно получить более тонкие результаты. В частности, если ж — ограниченный нормальный оператор в гильбертовом пространстве Н, то /(ж) можно интерпре- интерпретировать как некоторый ограниченный нормальный оператор в Н для каждой непрерывной комплексной функции /(Л) на сг(ж) и даже для каждой ограничен- ограниченной комплексной борелевой функции. Однако эти вопросы мы здесь затрагивать не будем. Сначала напомним некоторые известные определения. Определение 4.1. Система множеств S называется полукольцом, если она содержит пустое множество 0, замкнута по отношению к образованию пересече- пересечений и обладает тем свойством, что из принадлежности к S множеств А и А\ С А п вытекает возможность представления А в виде А = \J A^, где А^ — попарно /с = 1 непересекающиеся множества из 5, первое из которых заданное множество А\. Определение 4.2. Непустая система множеств Е называется кольцом, если она обладает тем свойством, что изАеЕи??еЕ следует ААВ С Е и АГ\В С Е. Определение 4.3. Функция множества /а(А) называется мерой, если: 1) об- область определения D(/a) функции /а(А) есть полукольцо; 2) значения функции /а(А) действительны и неотрицательны; 3) jjl{A) аддитивна: для любого конечного разложения А = А\ U ... U Ап множества A G D(/a) на попарно непересекающиеся п множества А^ из D(fi) выполнено fi(A) = 2^ M^fc)- k = l
§ 1.4. Банаховы алгебры 59 Определение 4.4. Борелевской мерой на компактном (локально компактном) хаусдорфовом пространстве Q называется мера, определенная на сг-алгебре всех борелевских подмножеств пространства Q, т.е. на минимальной сг-алгебре, со- содержащей все открытые подмножества пространства Q. Пусть X — банахова алгебра и / — Х-значная функция на компактном ха- хаусдорфовом пространстве Q, на котором определена комплексная борелевская мера. Тогда, поскольку X является банаховым пространством, интеграл / / dfi J Q существует и обладает всеми теми свойствами, которые присущи классическому интегралу по мере в теории функций действительного переменного. Кроме того, он обладает следующими дополнительными свойствами, которые нам потребуются в дальнейшем. Если ж Е X, то х f fdfi= f xfdfi D.29) Jq j q x= f f(p)xd^(p). D.30) iq J Jq Доказательство этих формул приводить не будем. Пусть, далее, К — компактное подмножество некоторого открытого множес- множества п С С и Г — конечное семейство ориентированных отрезков 7ъ---?7п в П, ни один из которых не пересекается с К. В этой ситуации интеграл по Г определяется равенством г п г / ip(\) dX = 2^ / vW ^- D-31) Известно, что Г можно выбрать с таким расчетом, чтобы dX { 1, если С G К, 1F = {n г** D'32) r A - С L 0> если С i К, и в этом случае для каждой голоморфной в п функции / и каждой точки ( е К справедлива формула Коши ^J D.33) Кратко мы будем описывать ситуацию D.32) словами: контур Г охватывает К в п. Однако следует заметить, что при этом не предполагается, что К, п и объединение отрезков 7/с являются связными. Теорема 4.12. Пусть X — банахова алгебра, х?Х,а?С,а$: а(х), П — дополнение к а в С и контур Г охватывает а(х) ей. Тогда ^- I (а - Х)п(Хе - x)~1dX = (ае - ж)п, п = 0, ±1, ±2,... D.34) 2тгг /г Доказательство. Интеграл в D.34) обозначим через уп. Если А ^ сг(ж), то (Ае — ж) = (ае — ж) + (а — Х)(ае — х)~1(Хе — ж). Поэтому, в соответствии с формулой D.34) получаем Уп = (ае-х)-1— I (а - X)ndX + (ае - ж) — / (а - А)п+1(Ае - ж)^. 2тгг Jr 2m Jr
60 Гл. 1. Матрицы, операторы и группы Следовательно, (ае — х)уп = yn+i, n = 0, ±1,±2,... Это рекуррентное соот- соотношение показывает, что общий случай формулы D.34) получается из частного случая п = 0. Таким образом, мы должны доказать, что 1 f 1 -— ф (Ае - x)~1d\ = е. D.35) 2тгг Jv Пусть Гг — положительно ориентированная окружность с центром в 0 и ра- оо диусом г > ||ж||. На Гг имеем (Ае — ж) = 2_^ Х~п~1хп. п=0 Почленно интегрируя этот ряд, получаем D.35), но с заменой Г на Гг. Но под знаком интеграла стоит Х-значная функция, голоморфная вне а(х). Кроме того, indr(C) = 1 = indrr(C) Для каждой точки ( Е а(х). Поэтому, согласно теореме Коши, интеграл D.35) не изменится при замене Г на Гг. Теорема доказана. Следствие 4.2. Пусть Д(А) = Р(Х) + ^2сш^(Х - аш)~к — рациональная т,к функция с полюсами в точках ат (Р(Х) — полином и сумма имеют только ко- конечное число членов). Если х G X и а(х) не содержит полюсов функции Д(А), то положим пухj — г ух) п^ j ^m,k\X ^т^) • y±.o\jj m,k Пусть ft — открытое множество в С, содержащее а(х), и контур Г охваты- охватывает а(х) в П. Если Д(А) голоморфна в П, то R(x) = ^- I Д(А)(Ае - х)~1а1Х. D.37) 2тгг /г Введем новый класс абстрактных функций, который широко используется в теории банаховых алгебр и ее различных приложениях. Пусть X — банахова алгебра, П — открытое множество в С и H(Q) — алгебра всех комплекснозначных голоморфных функций в П. Тогда следующее множес- множество Xq = {x G X : а(х) С Щ будет открытым (см. теорему 4.11). Алгебре H(Q) поставим в соответствие множество H(Xq), состоящее из X- значных функций /, заданных в Xq, причем функция / получается из / G H(Q) по формуле 70*0 = ^~ i /(A)(Ae - х)~Ч\ D.38) где Г — произвольный контур, охватывающий а(х) в П. Отметим некоторые важнейшие особенности введенных функций. 1. Так как Г отстоит от а(х) на положительном расстоянии и так как переход к обратному оператору — непрерывная операция в G(X), то подынтегральное выражение в D.38) непрерывно и, следовательно, интеграл существует и /(ж) действительно существует и является элементом алгебры X. 2. Подынтегральная функция в D.38) фактически является голоморфной X- значной функцией в дополнении к а(х) (точнее, в пересечении этого множества с областью голоморфности функции /). Поэтому из теоремы Коши вытекает, что f(x) не зависит от выбора контура Г, охватывающего а(х) в п.
§ 1.4. Банаховы алгебры 61 3. Если ж = ае и a Е П, то из формулы D.38) следует, что /(ае) = /(а)е. D.39) Заметим, что ае Е Х^ тогда и только тогда, когда а Е П. Если отождествить точку Л Е С с точкой Ле Е X, то каждую функцию /(Л) Е i?(fi) можно будет рас- рассматривать как отображение некоторого подмножества множества Xq (а именно пересечения Xq с одномерным подпространством в X, порожденным элементом е) в X. При этом /(ж) можно интерпретировать как продолжение функции /(Л). Поэтому часто в данном контексте пишут просто f(x) вместо f(x). Однако мы будем пользоваться обозначением /(ж), поскольку оно позволяет избежать некоторых двусмысленностей, которые могут привести к недоразуме- недоразумениям. 4. Если S — произвольное множество и X — некоторая алгебра, то семейство всех Х-значных функций на S относительно поточечных операций умножения на скаляр, сложения и умножения образует алгебру. Например, если и и v — отображение S в X, то (uv)(s) = u(s)v(s), s Е S. В частности, это надо иметь в виду по отношению к Х-значным функциям, определенным в Aq. Теорема 4.13. H(Xq) есть комплексная алгебра. Отображение / —>¦ / пред- представляет собой изоморфизм алгебры H(Q) на алгебру H(Xq), причем это ото- отображение непрерывно в следующем смысле: если fn Е H(Q,), n = 1,2,..., и fn —У f на компактных подмножествах мно- множества П, то f(x) = Hindoo fn(x), х е Xq; если и(Х) = Л и г?(А) = 1, то п{х) = х и v(x) = е для каждого х G Xq. Доказательство этой теоремы приводить не будем. Следующую теорему обычно называют теоремой об отображении спектров. Она позволяет включить суперпозицию функций в число операций функциональ- функционального исчисления на банаховых алгебрах. Теорема 4.14. Если х е Xq и / е Н(п), то: 1) элемент f(x) обратим в X тогда и только тогда, когда выполняется нера- неравенство /(Л) ф 0 при каждом Л G сг(х); 2) аG(х)) = f(a(x)). Доказательство. Если /(А) не имеет нулей на а(х), то функция g = 1// го- голоморфна на некотором открытом множестве Qi таком, что а(х) С Hi С П. Так как fg = 1 в Qi, то теорема 4.13 (с заменой П на Qi) показывает, что f(x)~g(x) = e. Поэтому элемент /(ж) обратим. Обратно, если f(a) = 0 для некоторого а С сг(х), то найдется такая функция h(X) G H(Q), что (А — a)h(X) = /(A), A G П. Отсюда следует, что (х — ae)h(x) = f(x) = h(x)(x — ае). Так как элемент х — ае необратим в X, то элемент /(ж) также не может быть обратимым. Первая часть теоремы доказана. Фиксируем, далее, некоторое C G С. По определению C G a{f{x)) тогда и только тогда, когда элемент /(ж) — /Зе необратим в X. Применяя доказанную часть теоремы к функции /(А) — /3, видим, что это происходит в том и только том случае, когда функция /(А) - /3 имеет нуль на сг(ж), т.е. когда /3 е /(сг(ж)). Теорема полностью доказана.
62 Гл. 1. Матрицы, операторы и группы Теорема 4.15. Предположим, что х Е Xq, / Е Н(П), Qi — открытое мно- множество, содержащее f(a(x)), g Е H(Qi) и h(X) = g(f(X)) в По, г^е ^о — мно- множество всех A G О, для которых /(A) Е fii. Тогда f(x) Е Х^х и h(x) = ~g(x)f(x). Последующие теоремы дают представление о некоторых применениях аппа- аппарата банаховых алгебр. В них речь идет о применениях построенного функцио- функционального исчисления. Чтобы указать эти применения, введем несколько новых понятий. Говорят, что элемент х Е X является корнем n-й степени в X, если х = уп для некоторого у Е X. Аналогично, если х = ехр(^) для некоторого yGl, то у называется логарифмом от х. оо п 7/ В этих определениях мы исходим из того, что функции z = ехр(т^) = 2^ —г п=0 П- и z = уп уже были определены выше. Кстати, экспоненциальная функция может быть определена при помощи интегральной формулы Коши. Теорема 4.16. Пусть X — банахова алгебра, х Е X и спектр а(х) не разде- разделяет 0 и оо (т. е. точка 0 принадлежит неограниченной компоненте дополнения к спектру). Тогда: 1) элемент х обладает корнями всех степеней в X; 2) элемент х обладает логарифмом в X; 3) если г > 0, то найдется такой полином Р, что \\х~г - Р(х)\\ < г. Кроме того, если а(х) лежит на положительной вещественной полуоси, то корни в A) можно выбрать обладающими теми же свойствами. Доказательство. По предположению, точка 0 принадлежит неограниченной компоненте дополнения к а(х). Поэтому существует функция /, голоморфная в некотором односвязном открытом множестве П С сг(х), для которой справедливо ехр(/(А)) = А. Из теоремы 4.14 вытекает, что ехр(/(ж)) = х и поэтому у = /(ж) служит логарифмом для х. Если 0 < А < оо для каждого A G сг(х), то функция / может быть выбрана вещественной на а(х). По теореме об отображении спект- спектров в этом случае а(у) будет лежать на вещественной оси. Пусть z = ехр(у/п). Тогда zn = х. Кроме того, применяя еще раз теорему об отображении спект- спектров, получаем, что a(z) С @, оо), если а(у) С (—оо,оо). Тем самым доказаны утверждения 1) и 2), а также заключительное утверждение. Для доказательства утверждения 3) заметим, что функция 1/А допускает рав- равномерную аппроксимацию полиномами на некотором открытом множестве, со- содержащем а(х) (теорема Рунге). После этого остается воспользоваться лишь теоремой о непрерывности. Хотя приведенное доказательство теоремы не слишком сложно, сформулиро- сформулированные в ней результаты не совсем тривиальны даже в случае конечномерной алгебры X. Например, из утверждения 2) теоремы в этом частном случае из- извлекается тот факт, что квадратная матрица М порядка п в том и только том случае служит экспонентой некоторой матрицы, если 0 не является собственным значением матрицы М, т. е. матрица М обратима. Чтобы вывести этот факт из утверждения 2), достаточно в качестве X рассмотреть алгебру всех комп-
§ 1.4. Банаховы алгебры 63 лексных квадратных матриц порядка п. Мы этого здесь делать не будем, однако отметим, что эти вопросы более обстоятельно обсуждены в параграфе 1.2 при рассмотрении функций от матриц. Теорема 4.17. 1) Пусть X — банахова алгебра, х е X, Р — полином от одного переменного и Р(х) = 0. Тогда а(х) содержится во множестве нулей Р. 2) В частности, если х — идемпотент, т. е. х2 = х, то а(х) С {0,1}. 3) Если в алгебре X имеется элемент, спектр которого несвязен, то X содер- содержит нетривиальный идемпотент. Тривиальными идемпотентами называются 0 и е. Доказательство. По теореме об отображении спектров находим, что справед- справедливы равенства Р(а(х)) = а(Р(х)) = сг(О) = 0, из которых сразу получаются утверждения 1) и 2). Если а(х) несвязно, то найдется пара открытых множеств По и Oi с пустым пересечением, каждое из которых пересекается с а(х) и объ- Г 0, если Л Е По, единение которых с П содержит а(х). Пусть /(А) = < Тогда [ 1, если Л Е Qi. / G Н(п). Пусть у = f(x). Так как /2 = /, то у2 = у и, следовательно, у — идемпотент. По теореме об отображении спектров имеем: а(у) = f{a{x)) = {0,1}. Поэтому идемпотент у нетривиален, так как тривиальные идемпотенты 0 и е об- обладает одноточечным спектром. Теорема доказана. Пусть В(Х) — банахово пространство линейных ограниченных операторов, действующих в банаховом пространстве X. Оно, очевидно, является банаховой алгеброй. В этом частном случае теорема об отображении спектров допускает ин- интересное уточнение, которое сформулируем без доказательства. Однако сначала напомним некоторые понятия спектральной теории операторов. Точечным спектром оператора Т G В(Х) называется множество всех его собственных значений и обозначается через ар(Т). Множество всех элементов х G X, для которых (Л/ — Т)х = 0, Л G ар(Т), называется ядром оператора XI — Т. Здесь / — оператор тождественного преобразования. Теорема 4.18. Пусть Т Е В{Х), П — открытое множество в С, сг(Т) с ft и 1) Если х G X, a G П и Тх = ах, mo f(T)x = f(a)x. 2)/(<7р(Г))с<7?G(Т)). 3) Если а е (Tp(f(T)) и функция f - а не обращается в нуль тождественно ни в одной из компонент множества п, то а е f(ap(T)). 4) Если f непостоянна ни в одной из компонент открытого множества п, то f(ap(T))=ap(f(T)). 4. Дифференцирование. Рассмотрим теперь вопрос, в какой мере пове- поведение тех или иных элементов алгебры H(Xq) похоже на поведение голоморф- голоморфных функций. Нас будут интересовать такие свойства как дифференцируемость, представимость степенными рядами и т. д. Основная цель при этом состоит в том, чтобы подготовить функциональную базу для исследования операторных уравнений Риккати.
64 Гл. 1. Матрицы, операторы и группы Определение 4.5. Пусть X и Y — банаховы пространства и 11 — открытое множество в X, F — отображение (оператор) множества П в Y и а — некоторая точка из X. Если существует такой элемент Л Е B(X,Y) (B(X,Y) — банахово пространство всех линейных ограниченных операторов, действующих из X в У, Trvvw v \\F(a + x)-F(a)-A(a)x\\ . ранее оно обозначалось через ДА, У)), что lim -— — ., ^-—и = о, ||Я5||—>О \\X\\ то оператор Л = Л(а) называется производной Фреше от F в точке а. Это определение эквивалентно тому определению производной Фреше, которое было приведено в предыдущем параграфе. Однако для дальнейшего анализа ба- банаховых алгебр оно более удобно. Обозначать производную будем так же, как и в предыдущем параграфе, через F'(а). Если эта производная непрерывна по а на П, то оператор F называется непрерывно дифференцируемым в П. Пусть X — банахова алгебра и ж, ж + ft Е X. Если обе части следующего тождества (Ле — ж) — (Ле — х — ft) = ft умножить слева на (Ле — х — h)~1 и справа на (Ле — ж), то получается (Хех - h)'1 - (Ле - ж) = (Ле - х - к^ЦХе - ж) D.40) при выполнении очевидного условия, что соответствующие обратные элементы существуют. Пусть теперь П — открытое множество в С, х G Xq, х + h G Xq и / G H(Q). Выберем контур Г, охватывающий а(х) U а(х + К) в П. Тогда из соотношения D.40) следует, что /(ж + К) - /(ж) = — / /(Л)(Ле -х- h^hiXe - x^dX. D.41) 2тгг J 2тгг _ Если элементы ж и ft коммутируют, т. е. если xh = hx, то множитель ft можно вынести за знак интеграла. Этим оправдано следующее определение. Элемент (Qj)(x;h) = — I f{X){Xe-x-hyx{Xe-x)-xdX D.42) 2тгг Jr называется разделенной разностью. В предположении, что xh = hx, эта разность удовлетворяет условию J(x + h)- J(x) = h(Qj)(x; h). D.43) До конца этого параграфа будем предполагать, что условие xh = hx выполняется. Пусть М > ||(Ле - ж)!! и \\h\\ < 1/М. Тогда ряд оо (Ле - ж - ft) = ^2 (Ле ~ х)'71^'1 D.44) 71=1 сходится по норме в X, причем сходимость равномерна по Л G Г. Поэтому пред- представление D.42) разделенной разности допускает следующее преобразование 00 1 г (Qf)(x;h) = V^ —; Ф /(Л)(Ле — x)~n~1dXhn~1 = n=i 2ш Jr = У^ —г : Ф f(n\X)(Xe — x)~1dXhn~1 = У^ ¦ 71=1 ' JV 71=1
§ 1.4. Банаховы алгебры 65 где /(п) — производная порядка п от /, а через / обозначен элемент [/(п)]. Норма коэффициента при hn~x оценивается произведением константы, завися- зависящей от / и Г на Мп. Следовательно, этот степенной ряд сходится по норме, а из D.43) и D.45) получается представление в виде степенного ряда {\x)hn, D.46) n! n=0 которое справедливо, если xh = hx и если норма \\h\\ достаточно мала. Из полученных результатов, в частности, вытекает справедливость следующе- следующего утверждения. Теорема 4.19. Пусть X — коммутативная банахова алгебра, П — открытое множество в С, х Е Xq и / E H(Q). Тогда существует S > 0 такое, что оо 1 D.47) для всех heX таких, что \\h\\ < S. Следовательно, F/(x)h = F/(x)h, heX. D.48) В решении многих вопросов группового анализа дифференциальных уравнений имеют большое значение коммутаторы. Они оказываются полезными также при решении ряда теоретических вопросов в самой теории банаховых алгебр. Здесь мы отметим лишь один результат, относящийся к этому кругу вопросов. Но сначала введем необходимые определения. Обозначим через Lx и Rx операторы умножения слева и справа на элемент х (некоммутирующий) банаховой алгебры X. Так как алгебра X ассоциативна, т.е. y(xz) = (yx)z, то каждый оператор Ьу умножения слева на у коммутирует с каждым оператором Rz умножения справа на элемент z. В частности, операторы Lx и Rx коммутируют друг с другом и с оператором CX=RX-LX. D.49) Оператор Сх(у) — ух - ху называется коммутатором элементов х и у. Дальнейшее уточнение свойств производной Фреше дается следующей теоре- теоремой, которую мы приведем без доказательства. Теорема 4.20. Пусть X — банахова алгебра, п — открытое множество в С, xeXQ u_f еН(п). Тогда f есть непрерывно дифференцируемое отображение из Xq в X и / (х)у = -—: Ф /(Л)(Ле — х)~1у(Хе — х)~1о1Х, у Е X, где Г — произвольный контур, охватывающий а(х) ей. Оператор f (x) может быть также представлен в виде В(Х)-значного интег- интеграла 7(х) = ^-? /(А)(Л/ - RX)~\XI - ЬХ)~ЧХ D.50)
66 Гл. 1. Матрицы, операторы и группы и в виде разделенной разности 7(x) = (Qf)(Lx;Rx). D.51) Если область п содержит все такие А, что |А| ^ 3||ж||, то 7(х)=Т,^(п)(х)СГ1- D-52) 71=1 Комментируя эту теорему, отметим, что ограничение \\h\\ ^ 3||ж|| является существенным. Ряд D.52) может оказаться расходящимся, если функция / обла- обладает особенностью на расстоянии 3||ж|| от начала координат. Если алгебра X коммутативна, то Сх = 0 и среди членов ряда D.52) сохраня- сохраняется лишь слагаемое с п = 1, что согласуется с теоремой 4.19. Теорема 4.21 (Теорема об обратной функции). Предположим, что: 1) W — открытое множество в банаховом пространстве Х\ 2) оператор F : W —>¦ X — непрерывное дифференцируемое отображение; 3) для каждой точки ж Е W производная Фреше F'(x) является обратимым элементом алгебры S(X). Тогда каждая точка a Е W обладает такой окрестностью U, что: 1) отображение F инъективно на U; 2) множество F(U) = V открыто в X; 3) отображение F : V —> U непрерывно дифференцируемо. Эта теорема дает некоторую информацию о локальных свойствах элементов банаховых алгебр, в том числе и отображений /. § 1.5. Группы Ли Среди разнообразных методов решения и исследования дифференциальных уравнений особое место занимают групповые методы. С их помощью не только решаются отдельные типы уравнений в обыкновенных и частных производных, но и дается их классификация по различным классам точных решений. Не вда- вдаваясь в тонкости теории и ее разнообразных приложений, мы приведем основ- основные факты, которые в последующих главах используются при анализе уравнения Риккати (см., например, [33, 34]). Материал, относящийся непосредственно к групповому анализу на матрицах, взят из работ [11, 17]. 1. Основные определения и примеры. Пусть X — банахово простран- пространство, a R = Е1 — пространство вещественных чисел, в котором выбрана малая окрестность А точки а = 0. Каждой точке a G А поставим в соответствие не- некоторое преобразование (оператор) Та = /(ж, а) : X —У X, причем точке а = 0 соответствует оператор тождественного преобразования 7о = I- В дальнейшем для указания каждого из преобразований будем пользоваться символом Та или /(ж, а), где под / понимается оператор / : X х А —у X. Будем говорить, что этот оператор принадлежит классу С^[Х х А), к = 1,2,..., если отображение /(ж, а) к раз непрерывно дифференцируемо по совокупности переменных ж и а. В дальнейшем будем предполагать, что преобразование (оператор) /(ж, а) опре-
§ 1.5. Группы Ли 67 делено на некоторой открытой области V С X и симметричном относительно точки а = 0 малом интервале А. Такое преобразование называется локальным. Определение 5.1. Локальной однопараметрической группой Ли (группой Ли) локальных преобразований банахова пространства X называется такое однопа- раметрическое семейство локальных преобразований / : V х А —у X, которое обладает следующими свойствами: 1) /(ж, 0) = ж для любого ж е V; 2) /(/(ж, а), Ь) = /(ж, а + Ь) для любых a, b, a + b e A, x e V; 3) если а Е А и /(ж, а) = х для всех х Е У, то а = 0; 4) /eCUVxA). Пример 5.1. Пусть X = i?n. В качестве / возьмем преобразование /(ж,?) =eAtx, E.1) в котором t играет роль группового параметра. Непосредственной проверкой можно убедиться, что при заданной постоянной матрице А множество преобра- преобразований E.1) образует группу. Группа Ли часто обозначается через G1. Отсутствие в обозначении группы G1 множеств У и А объясняется тем, что они с точки зрения локальной теории играют служебную роль и их конкретизация не требуется. С позиций приве- приведенного определения порождающее группу G1 преобразование / : V х А —у X можно также рассматривать как локальное действие аддитивной группы R на пространство X. При этом группа G1 может рассматриваться как представ- представление /(А) С т(Х), элементами которого являются локальные преобразования fa : V -У X пространства X. Здесь т(Х) — совокупность всех преобразований пространства X в X. Каждой точке х е V отображением /(А) ставится в соответствие однопарамет- рическое многообразие, задаваемое уравнением х' — /(ж, а), которое называется орбитой точки ж. Элемент —\-^—- называется касательной к орбите в точке да х. Тем самым на V определено векторное поле, задаваемое формулой «*) = ^, xev. E.2) В теории групп это векторное поле называется касательным векторным полем группы G1. Связь между группой G1 и ее векторным полем весьма существенна. Оказыва- Оказывается, что группа вполне определяется ее векторным полем. Если воспользоваться тем, что / G Coo(V,A), то, разлагая /(ж, а), как абстрактную функцию параметра а, в ряд Тейлора, соотношение x' = f(x,a) E.3) можно представить в виде х' = /(ж,а) =ж + ?(ж)а + о(а), М^Ж _> 0 при а -^ 0, E.4) где ?(ж) определяется формулой E.2).
68 Гл. 1. Матрицы, операторы и группы Аналогично получаем /(ж, а + Ъ) = /(ж, а) + то же самое, + о(Ь) или, что ftfir a) /(ж, а + Ъ) = /(ж, а) + ^д^Ь + о(Ъ). E.5) С другой стороны, /(ж, а+ 6) = /[/(ж, а), 6] = /(ж, а) + d/[/fofl)» °Wo(fr) или, учитывая обозначение E.2), получаем /(ж, а + 6) = /(ж, а) + Щ(ж, а)]Ь + о(Ь). E.6) <Э/(ж, a) Из соотношений E.5) и E.6) следует равенство ——-— = ^[/(ж,а)]. В теории групп доказывается более сильное утверждение, называемое теоре- теоремой Ли, которое формулируется следующим образом. Теорема 5.1. Пусть функция /(ж, а) удовлетворяет групповому свойству f[f(x,a),b] = f(x,a + b) E.7) и имеет разложение E.4). Тогда она является решением дифференциального урав- уравнения первого порядка (называемого уравнением Ли) с начальным условием Обратно, для любого гладкого векторного поля ?(/) решение задачи Коши E.8) удовлетворяет групповому свойству E.7). Пример 5.2. В качестве пространства X возьмем пространство С(Еп) линей- линейных операторов Л, В, ..., отображающих Еп в i?n. Тогда соотношение E.3) можно представить в виде A' = f(A,t), E.9) где t — параметр, а / — оператор, отображающий С(Еп) в себя. Пусть, далее, векторное поле задается функцией ?(Д) = А2 и для определения / получаем следующую задачу Коши (см. E.8)) Ц- = /2, /|t=0 = A E.10) Дифференциальное уравнение из E.10) можно записать в виде Z^/ = i, E.11) где г — оператор тождественного преобразования в С(Еп). Так как справедливо //-1 = = /-1/ = i и, следовательно, —/-1 + / = 0, то уравнение E.11) at at можно записать в виде —-— = —г. Отсюда получаем CJT/ f~1(A,t) = c-it, E.12) где с — пока не определенный оператор из С(Еп). Следовательно, верно равенство f(A,t) = (с-it). Учитывая начальное условие из E.10), отсюда находим, что выполняется f(A,t)\t=0 = с = А и, значит, с = Л. Поэтому решение задачи E.10) можно представить в виде \ E.13)
§ 1.5. Группы Ли 69 где / — единичный оператор в пространстве X. Нетрудно проверить, что преобразование E.9), в котором оператор / опреде- определяется формулой E.13), удовлетворяет всем аксиомам группы Ли. Определение 5.2. Оператор Т, отображающий банахово пространство X в банахово пространство У, называется инвариантом группы преобразований E.4), если для всех допустимых х Е V и a Е А выполняется равенство T[f(x,a)]=T(x). E.14) Особый интерес представляют инварианты, когда в качестве Т берется ве- вещественный функционал, т.е. когда Y — Е1. Здесь следует отметить одно важное обстоятельство. Определение инварианта связано с суперпозицией операторов (преобразований) в абстрактных пространствах. Однако, условия существования такой суперпо- суперпозиции мы здесь не обсуждаем. Если ограничиться случаем, когда X является банаховой алгеброй, то необходимый материал по этому вопросу можно найти в предыдущем параграфе. Для нас здесь важен лишь сам факт существования опе- операторов Т и /, для которых справедливы излагаемые ниже результаты. Вопрос же о том, при каких условиях все эти построения можно выполнять, видимо, следует решать в каждом конкретном случае отдельно. Теорема 5.2. Оператор Т является инвариантом тогда и только тогда, когда его производная Фреше — удовлетворяет условию ах ^-ах) = 0, E.15) где 0 — нулевой элемент пространства X. Доказательство. Если Т удовлетворяет условию инвариантности E.14), то выполнение условия очевидным образом вытекает из следующего разложения о1Т(х) F[f(x,a)] = Т\х + ?(х)а + о(а)] = Г(х) + К Ч(ж)а + о(а). Пусть теперь из- ах вестно, что Т{х) — решение уравнения E.15). Равенство E.15) выполняется в любой точке х е V и, следовательно, в точке х' — /(ж, а). Поэтому можно за- dTix) писать —¦г-г^^(х') — 0- Если воспользоваться уравнением Ли, то будем иметь ах' da = —*? da~ = -u^t(x ) = (^Следовательно, T[f{x,a)], как функция от а, является решением задачи Коши — = 0, /|a=0 = F(%) Это дает требуемое равенство E.14). Теорема доказана. Пример 5.3. Пусть X = Е2 и группа преобразований задана соотношениями х[ = fi(xi,X2,a) = —, х'2 = /2(жь х2, а) = —. E.16) 1 — ах\ 1 — ах\ Тогда, в соответствии с формулой E.2), векторное поле группы определяется вектором ?(ж1,Ж2) = {x\,x\x<z\. В качестве Y берем Е1 и тогда уравнение E.15)
70 Гл. 1. Матрицы, операторы и группы принимает вид rrf^—+Ж1Ж2Д— =0. E.17) г, „ dxi dx2 , Соответствующая система уравнении характеристик —~- = имеет общий xf XX Т1 интеграл — = с. Следовательно, общее решение уравнения E.17) можно пред- Х2 ставить в виде Т = T[x\jx2) и поэтому инвариантом группы E.16) является произвольная дифференцируемая функция Т{х\)х<2). Пример 5.4. Пусть, как и в предыдущем примере, X = Е2 и группа задана своим векторным полем ?(ж) = {х\,х\Х2}. В качестве пространства F возьмем Е2. Требуется построить инвариант Т — — {^(жья^),^2(^1,^2)}. Уравнение E.15) в этом случае принимает вид дХ1 дх2 \( х\ \ _ /0\ а^2 а^2 \х1х2) ~ \о) дх2 Отсюда находим, что инвариантом является следующая векторная функция Т — {T\{x\jX2)-)T2{x\jX2)]-) где Ji и^2 — произвольные дифференцируемые функции. Пример 5.5. Возьмем в качестве X пространство С@,1) непрерывных функ- функций ж(?), 0 ^ t ^ 1, наделенных нормой ||ж|| = max \x(t)\. Оно, очевидно, удов- удовлетворяет всем аксиомам банаховой алгебры. Поэтому будем рассматривать его как банахову алгебру. В качестве Y возьмем Е1. Векторное поле группы опре- определим по формуле ?(ж) = х - 1. Тогда, в соответствии с теоремой Ли, находим преобразование х' = /(ж, а) = (ж - 1)еа + 1. E.18) Поскольку Т — функционал, определенный на С@,1), то производная Фреше —— является линейным ограниченным функционалом на G@,1). Как известно, ах для любого элемента v G С@,1) линейный ограниченный функционал ip опреде- г1 интегралом Стилтьеса (теорема Рисса) (p(v) = / v(t)dg(t), где g(t) — функция с ограниченным изменением, однозначно определяемая этим функцио- функционалом. Поэтому уравнение E.15) в рассматриваемом случае можно записать в виде / (s(t) - 1) <fo(M) = 0. E.19) o Таким образом, для построения инварианта следует найти функционал F(x), производная Фреше которого определялась бы функцией g(x,t), удовлетворяю- удовлетворяющая уравнению E.19). Если не ставить задачу поиска общего решения уравнения E.19), то можно найти некоторые частные инварианты группы. Можно посту- поступить, например, так. В качестве g(x,t) возьмем дифференцируемую функцию. Тогда можно записать dg(x,t) = h(x,t)dt и уравнение E.19) можно записать в ляется
§ 1.5. Группы Ли 71 следующем виде / (x(t) -l)h(x,t)dt = O. E.20) Jo Следовательно, задача сводится к решению уравнения E.20), в котором не- известна функция h(x,t), однозначно определяющая линейный функционал ——. ах Однако, по содержанию задачи нас не интересует эта производная. Нужен функ- функционал Т. Выражение, стоящее слева в уравнении E.15), представляет собой результат применения линейного оператора — к элементу ?(ж) из пространства X. ах Обычно задача состоит в том, чтобы с помощью этого уравнения найти опе- оператор Т. При решении такой задачи, а также при анализе свойств левой части уравнения, удобно пользоваться следующими обозначениями: Оператор ?>(*,?) называется инфинитезималъным оператором группы G1. Отметим некоторые важнейшие факты, относящиеся к инвариантам групп. Если F : X —У Y — инвариант группы G1 и Z — банахово пространство, то для любого отображения Ф : Y —У Z оператор Ф(Г) также является инвариантом. Инвариант J : X —У Y называется универсальным, если для любого банахова пространства Z и любого инварианта F : X —У Z существует такое отображение Ф : Y —У Z, что будет справедливо равенство F = Ф(«7). В силу этого определения, с помощью универсального инварианта можно полу- получить все возможные инварианты группы G1. Поэтому отыскание универсального инварианта является основной задачей теории инвариантов. К универсальному инварианту группы G1 следует предъявить также требование гладкости: он дол- должен быть локальным отображением класса Соо- Теорема 5.3. Для любой группы G1 преобразований банахова пространства X в X существует банахово пространство Y и универсальный класса Соо инвари- инвариант J : X —У Y. Так как доказательство теоремы конструктивно, то приведем его полностью. Доказательство. Пусть ?(ж) — касательное векторное поле, а точка хо из X такова, что элемент е = ?(жо) не является нулевым, т.е. ||е|| ф 0, и пространст- пространство X представляется в виде прямой суммы X — Т 0 Y Здесь Т — одномерное пространство векторов вида ?е, где t — вещественное число, а У — прямое допол- дополнение Т в X. Тогда для векторов х и хо из X справедливы формулы разложения х = te + у, хо = toe + уо, в которых число t и элемент у однозначно определены элементом х. Благодаря этому представлению, любое отображение и : X —У Z можно рас- рассматривать как отображение Е1 х Y —У Z, действующее по формуле z = u(t,y). При этом касательное векторное поле ? группы G1 и порождающее ее отображе- отображение / запишутся в виде ?(ж) = c(t,y)e + Tj(t,y), /(ж, а) = p(t,y,a)e + cp(t,y,a). Кроме того, в силу определения элемента е = ?(жо), справедливы равенства
72 Гл. 1. Матрицы, операторы и группы c(to,yo) = 1, r)(to,yo) = 0. Пусть, далее, z' = /(ж, а) = t'e + 2/'. Тогда t'=p(t,y,a), y' = <p(t,y,a). E.22) В этих обозначениях групповое свойство f(y,b) = f(x,a + b) принимает вид p(t', у', Ъ) = p(t, у, а + Ъ), <p(t',y', Ъ) = у>(*, у,а + Ъ). E.23) Следовательно, уравнение Ли E.8) можно переписать в виде системы уравнений dt' ^-=c(t',y'), t'(O)=t; ы E'24) ^-=*/(*', у'), y'@)=y. оа Пусть г = Н + |? —?о| + ||2/ —2/о||- ^ак как вьшолняется равенство с(?о? 2/о) = 1, то при достаточно малом г будет верно неравенство c(t,y) > 1/2. Поэтому первое из равенств E.22) можно разрешить относительно параметра а в виде а = a(t,y,tf). Теперь можно исключить параметр а, как «аргумент» отображения ip и сфор- сформировать отображение ф : R x Y x R —>¦ У, действующее по формуле фA, у, ?') = <p(t, у, а) = <p(t, у, a(t, у, ?'))• E.25) Наконец, если зафиксировать tf = to, то получится отображение J : i? x Y —У У, определенное формулой J(t,y)=iP(t,y,t0). E.26) Утверждается, что отображение E.26) является универсальным инвариантом группы G1. В самом деле, сначала покажем, что J — инвариант. Действительно, так как равенство cp(t,y,b) = /0(t,^,p(t,^, b)) является тождеством по переменным ?, у и 6, то оно справедливо и для значений ?' и ?" из формулы E.22), т.е. име- имеет место cp(tf,yf,b) = /0(t/,^/,p(t/,2//, 6)) или, в силу группового свойства E.23), выполняется cp{t, у,а + b) = ip(tf, yf, p(t, у, а + Ь)). Если сравним последние два тождества, то прийдем к следующему равенству 'ipit'iy'iPitiVid + b)) = ip(t,y,p(t,y,a + b)), в котором b — свободный параметр, так как t' и у' зависят только от значений ?, у и а. Поэтому при достаточно малом г, за счет выбора параметра Ь, можно удовлетворить равенству p(t,y,a + b) = to- Это следует из того, что оно равносильно равенству а + b = a(t,y,to), причем a(to,yo,to) = 0 в силу начального условия p(t, у, 0) = t. Но если p(t, у, а + b) = to, то, согласно определению E.26), последнее равенство принимает следующий вид J(tf\y') = J(t,y) или, что то же самое, J(x') = J(x) для всех достаточно малых значений параметра а. Следовательно, отображение J — инвариант. Из способа построения инварианта J следует, что он является отображением класса Соо некоторой окрестности V точки х$. Остается показать, что построенный инвариант универсален. Рассмотрим ото- отображение J\ : X —У X, определяемое формулой Ji(t,y) = (t,J(t,y)), и покажем, что оно является взаимно однозначным отображением некоторой окрестности V dJ(to,yo) точки жо- Для этого достаточно установить, что производная является ду
§ 1.5. Группы Ли 73 гомеоморфизмом Y —У У, так как тогда и производная — будет гомеомор- ах физмом X -у X. Непосредственными вычислениями находим, что dJ(t,y) = d(p(t,y,a) d(p(t,y,a(t,y,to)) = ду ~ ду да ду Так как для преобразований E.23) справедливы уравнения Ли E.24), то по- последнее соотношение можно переписать в виде dJ(t,y) _ dip(t,y,a) , , d(p(t,y,tp) ду ду ду Используя определение функции a(t,y,to) и уравнения E.24), можно показать, da(tOjyo,to) что —^— = 0. ду Поэтому при малом г второе слагаемое будет малым по норме пространства L(X). Что же касается первого слагаемого, то оно при этом стремится к единич- единичному оператору 1у пространства Y. Следовательно, при малом г производная dJ(t,y,a) мало отличается от 1у и, следовательно, является гомеоморфизмом ду пространства Y. Итак, отображение J\ взаимно однозначно на У, и потому существует обрат- обратное ему отображение Jj : X ->• X. Если F : X ->• Z — какой-нибудь инвариант группы G1, то определено отображение Ф\ — F^^1) : X ->• Z, с которым спра- справедливо равенство F = ^i(Ji) или F(t,y) = ^i(t, J(t,y)). Утверждается, что на самом деле значение Ф-\_{Ь,у) не зависит от t. Действительно, так как F и J — инварианты, то можно переписать равенство F(t',y') = ^i(?', J(t',y')) в виде F(t,y) = <J?i(t',J(t,y)) и сравнение его с исход- исходным дает Фх(?', J) = Фх(?, J) для любого t из i?1. Так как для каждого t при некотором а будет t' = to, то Фх(?? ^) — ^i(^o? ^)- Тем самым определено отображение Ф : Y —у Z, действующее по формуле Ф(у) = Фх(^о?2/)? с которым справедливо равенство F = ^(J). Этим универсаль- универсальность инварианта J доказана. Анализируя инварианты группы, отметим, что во многих случаях группа мо- может иметь несколько различных и независимых инвариантов ^, i = l,...,m. Множество элементов х пространства X, удовлетворяющих условиям jr.(x)=0, г = 1,...,ш, E.27) называется инвариантным многообразием и обычно обозначается через М. Теорема 5.4. Система уравнений E.27) инвариантна относительно группы G тогда и только тогда, когда ЧЪ,Ом=0, г = 1,...,ш. E.28) 2. Теория продолжения. Пусть X и Y — банаховы пространства. Оператор if : Xk —у Y называется полилинейным (^-линейным), если он непрерывен в нуле и если для каждого I, 1 ^ I ^ к, любых элементов х\,... ,ж&, х\ е X, и любых
74 Гл. 1. Матрицы, операторы и группы чисел а и а' выполнено равенство (p(x!,...,axi + a/x/h...,xk) = а(р(хг,... ,х[,... ,хк) + aVOb ... ,x'h ... ,хк). Совокупность всех полилинейных отображений (операторов) ср : Хк —у Y обра- образует банахово пространство, которое будем обозначать через Lk(X, Y). Частным случаем полилинейных отображений являются линейные операторы, банахово пространство которых использовалось в предыдущем параграфе и обозначалось через L(X,Y). Полилинейное отображение ip : Хк —у Y называется симметричным, ес- если равенство (р(хт1,... , жт/с) = (p(xi,... ,хк) выполнено для любых векторов xi,..., xk G X и для любых перестановок (mi,... ,тк) индексов l,...,fc. Сим- Симметричные полилинейные операторы ip : Хк -у Y также образуют банахово про- пространство, которое будем обозначать через Lk(X,Y). Пример 5.6. Пусть X = Е1 и, следовательно, Хк = Ек, а Y = Е1. Рассмот- Рассмотрим преобразование х' — f(x,y), у' = д(х,у), в котором ж считается независи- независимой переменной, а / G Соо(^, ^), # G Соо(^, ^)- Оно определено в пространстве Z = X xY = Е1 х Е1 = Е2. В качестве оператора (р(х) возьмем операцию диффе- d dy ренцирования ——. Обозначим через у производную —— и множество полученных ах 1 ах таким образом элементов будем называть первым продолжением пространства Y и обозначать через Y\. В результате вместо исходного преобразования (х,у) —у (х1\у') получаем новое преобразование (х,у,у) —у (xf,yf,yf), определяемое соотношениями 1 1 х' = /(ж, у), у' = д(х, у), у' = д(х, у, у), E.29i) 11 1 в которых д G Coo(^, ^^l)- Преобразование E.29i) определено в пространст- 1 ве Z\ — X х Y х Y\ — Е3. С помощью той же операции дифференцирования можно получить второе продолженное пространство У^? состоящее из элементов d2y у = —- и соответствующее ему преобразование (х,у,у,у) —У {х'\у'\у'\у'). Оно 2 dxz 12 12 определено в пространстве Z<z — X х Y x Y\ x Y<z — ЕА. Продолжая этот процесс, можно получить преобразования х' = /(ж, у), у' = д(х, у), у' = #(ж, у, у), / Г ^ * 1 9 ' ' ( / =д{х,у,у,...,у), к = 1,2,..., к к 1 к которые определены в пространствах Zk = Ек+2, к = 1,2,... Указанную процедуру построения преобразований вида E.29^) можно повто- повторить в общем случае, когда X и Y — банаховы пространства. Делается это следующим образом. Пусть X и Y — банаховы пространства и задано следующее преобразование (ж,у) —у (xf,yf) G X х У, определяемое соотношениями х' = f(x,y), у' = д(х,у). Пусть также задано симметричное полилинейное отображение ср, определенное на X. Пусть, далее, Z = X х Y. Считая ж независимой переменной, определяем
§ 1.5. Группы Ли 75 (jIJ производную Фреше —. Согласно определению, она является линейным опе- ах du ратором, определенном на X. Вводя обозначение — = у, имеем пространство ах 1 Y\ — LS(X,Y), состоящее из элементов у. В результате получаем преобразование 1 типа E.29i), в которых /,дид — операторы. На следующем этапе аналогич- 1 ных построений Y<2 будет пространством линейных операторов, отображающих X в LS(X, F), т. e.G = LS(X,LS(X,Y)) = L2(X,Y). Продолжая этот процесс, определим пространство L^(X,Y). Пространство Y& = L^(X,Y) будем называть к-м продолжением пространства Y с помощью X. Элемент этого пространства будем обозначать через у. к Пространство Z\ — Z x Y\ называется первым продолжением пространства Z. Продолжения высших порядков определяются индуктивно: Zj~ = Zfc-i x Yj~, к = 2,3,... Элемент пространства Zj~ будем обозначать через z. Если х G X, а к у е Y, то элемент z можно представить в виде к z = (x,y,y,...,y). E.30) к 1 к В соответствии с этой общей идеологией можно получить продолжение опера- оператора дифференцирования. Начнем с простейших примеров. Пример 5.7. Пусть задана группа преобразований в пространстве Е2 х = (р(х,у,а), у = ф(х,у,а), E.31) которую можно также задать соотношениями х = х + а?(х, ?/) + ..., у = у + arj(x, 2/) + ... E.32) Если в пространстве Е2 задана некоторая функция у = у(х), E.33) то в этом пространстве естественным образом вводится понятие производной dy ——. Преобразованием E.31) функция E.33) преобразуется ву = уAЁ), и поэтому dx естественно возникает вопрос о представлении производной —. dx В соответствии с формулами E.31), можно записать <% Фх + У'Фу _ , <Ру dP Рх+у'Ру+у"Ру, = ±ХУУ *1) dx (рх+ у'if у dxz dx (px+ у'if у Если стартовать от группы G преобразований E.31), то после добавления первой из формул E.34) получается продолженная группа G, действующая в простран- пространстве трех переменных ж, у и у'', а после добавления еще и второй формулы из B.34) — дважды продолженная группа G, действующую в пространстве четы- 2 рех переменных ж, у, у' и у".
76 Гл. 1. Матрицы, операторы и группы Подставляя в формулы E.34) значения ж и у из E.32), получим 2// = 2// + aCi+o(a), E.35) 2/" = 2/" + aC2 + o(a), E.36) где Если воспользоваться символом «полного» дифференцирования ^ dv ,dv „ <% ax a?/ a?/' то формулы E.37) и E.38) можно записать в более компактной форме E.39) B=D(A)-y"D@. E.40) Таким образом, продолженная группа G, действующая в трехмерном простран- пространстве переменных х,у,у', определяется преобразованиями E.32) и E.35), а соот- соответствующее этой группе уравнение E.15) имеет вид где d определяется формулой E.34). Аналогично, второе продолжение G группы G определяется соотношениями E.32), E.35) и E.36), а соответствующее ему уравнение E.15) принимает вид ВТ дТ . дТ . дТ Л ^ я" + ^^ + ^^7 + С2^-77 = в, 5.42 аж a^/ a^/' ду" где ^i и ^2 определяются формулами E.39) и E.40). Подведем итоги по рассматриваемому примеру. В качестве X и Y взяты одно- одномерные пространства переменных х и у, соответственно. Пространством L(X, Y) служит пространство операторов дифференцирования по переменной х. Тогда, по построению, элементом у является производная у'. Аналогично элементом у 1 2 является вторая производная у". Пример 5.8. Предположим, что X = Еп — пространство независимых пе- переменных х = {ж1,... ,жп}, а Y = Еш — пространство зависимых векторов у = {^/15... ,2/т}. По ряду причин здесь удобнее пользоваться верхней индекса- индексацией компонент векторов х и у. Qyk Пусть, далее, символ у\ обозначает производную тг^-. Аналогично положим ох
§ 1.5. Группы Ли 77 d2yk т. Теперь можно ввести понятие «полного» дифференциала по хг: ^ / ч dv h dv и dv Здесь использовано известное соглашение о том, что каждое произведение представляет собой сумму слагаемых, в которой суммирование проводится по я гп я повторяющемуся индексу. В частности, у?—— = /^ ?/? —— • В результате можно пользоваться следующими обозначениями: х = {хг}, у = {уа}, у = {yf}, 1 у = {yf-},... Здесь х и у — векторы, у — двумерная матрица размерности т х п, 2 J 1 у — пространственная матрица размерности т х п х п и т. д. Элементы х G X, 2 2/ G F, ^/ G Yi, у G 1^2, ••• считаются алгебраически независимыми, но связан- 1 2 ными указанными выше дифференциальными соотношениями, которые можно представить в виде y? = Di(ya), y?j = Dj(y?) = DjDi(ya), i,j = l,...,n; a = 1,... ,ш. E.44) Рассмотрим теперь точечное преобразование xfi = Г(х,у,а), Г\а=о=х\ г = 1,...,п, E.45) y/a=ipa(x,y,a), <pa\a=0=ya, а = 1,...,ш, E.46) которое удовлетворяет групповым свойствам и, следовательно, его можно запи- записать в виде хп = х1 + а?г + о(а), 2//а = уа + а?7а + о(а), г = 1,..., п, а = 1,..., т. При этом выполняются соотношения dfi да ," V = а=0 да E.47) а=0 а уравнение E.15) можно записать в виде1 С—i+V™—- = 0> E.48) где в качестве Т взят оператор Т : Еп+гп —у Е1, т. е. Т представляет собой скалярную функцию п + т переменных х1 и уа. При построении продолжения группы в этом случае удобно воспользоваться следующим свойством операции «полного» дифференцирования E.43), связанным с переходом от старых независимых переменных хг к новым переменным хп. Оно состоит в том, что Г). — Г)( fJ)r)f. (К АО) где Dj — операция «полного» дифференцирования по новой независимой перемен- переменной х'3. Кроме того, очевидно, что общие правила «полного» дифференцирования E.44) Здесь так же, как и выше, подразумевается суммирование произведений по повто- повторяющимся индексам.
78 Гл. 1. Матрицы, операторы и группы в новых переменных остаются верными: 2/7=^B/'°)- E-44') Продифференцируем теперь обе части равенства E.46), используя соотношения E.49) и E.44'): Di(<pa) = О^Щ{у'а) = 1/'" W). Таким образом, замена первых производных при точечных преобразованиях E.45), E.46) определяется формулой y^Di(n = Di(ipa), E.50) edf у' или более подробно —- + уг —— \у . = ——- - \дхг дуР) J ox1 их- Для практического применения аппарата теории групп Ли нам требуется не столько продолжение преобразований E.45), E.46), сколько продолжение инфи- нитезимального оператора E.21). Запишем первое продолжение этого оператора в виде V = V + $*Lt E.51) 1 dyf где V — инфинитезимальный оператор преобразований E.45), E.46), определяе- определяемый формулой V = C-^+ г]а^-, а С? = Л— Задача состоит в том, чтобы указать способ вычисления функций rOL а=0 ния функций <^ Продифференцируем равенство E.50) по параметру а в точке а = 0. Учитывая перестановочность операции дифференцирования по а и операции D^, а также соотношения E.47) и начальные условия в E.45) и E.46), получаем соотношение Di(r]a) = (?Di(xj) + y^Di(^) = Cf^l + yJDi^i), где Sj — символ Кронекера. Получаем искомую формулу продолжения оператора E.21) в виде E.51), где ??=Di(ria)-y?Di№). E.52) Как видно из формулы E.52), для построения продолженного оператора E.51) нужно знать лишь координаты ?г и г]а исходного инфинитезимального оператора V. Запишем теперь продолжение оператора E.51) на вторые производные в виде V = V + (in^> E-53) где ?7" = о "J . Тогда изложенным выше способом можно показать, что а=0 Следовательно, в рассматриваемом примере в качестве Y\ взято пространст- пространство матриц, элементами которых являются производные yf всех функций уа, т. е. элементами Y\ являются матрицы у. Элементами Y<z являются пространст- 1 венные матрицы производных yf-, т. е.у. Первым продолжением пространства J 2 переменных х и у, т.е. элементов z = {x,y}, является пространство Z\ эле- элементов z\ — {х,у,у}, Аналогично, Z<z образовано элементами z<z — {х,у,у,у}. В 1 12 терминах тех же пространств Z^ можно определить и оператор «полного» диффе- дифференцирования следующим образом.
§ 1.5. Группы Ли 79 Введем обозначения2 D = (Di,..., Dn), я я \ гя я^ ( я 1 a=m>i=n Тогда операторам «полного» дифференцирования E.43) можно поставить в соот- соответствие один оператор ?>* = <9ж*+<9*2/ + <9*2/ + ..., E.55) 1 1 2 2 действие которого на функцию F определяется формулой DF = dxF + dFy + dFy + ... . E.55') 1 1 2 2 171 dF Символом dFy обозначена n-мерная вектор-строка с компонентами V^ ——yf, 1 ! ^дУа г = 1,... ,п, т. е. dFy является результатом обычного умножения строки dF на 1 ! 1 матрицу у. 1 Аналогично определяется символ dFy, как вектор-строка со следующими ком- 2 2 n m ^^ понентами У^ У^ ——у%, г — 1,... ,п. Легко видеть, что символ 9 представляет собой производную (сопряженный градиент) в пространстве У&-ь ^ — • к а у k-i Поэтому формулу E.55') можно записать в следующей алгебраической форме ^Jl + ^,J + iff+... E.55») дх dy I dy 2 i В формуле E.55") у является элементом пространства Y&. к После анализа приведенных примеров можно рассмотреть задачу продолжения оператора дифференцирования и группы в общей функциональной постановке. Итак, пусть X и Y — банаховы пространства, a Z = X х Y. Указанным выше способом построим пространства Y& и Z&, выбрав в качестве полилиней- полилинейных симметричных отображений ср операторы дифференцирования по Фреше в соответствующих пространствах Y&. Эти производные будем обозначать симво- лами —, & = 0,1,..., — = —. Тогда оператор «полного» дифференцирования в dy dy dy к О функциональных пространствах можно определить формулой ^ dv dv dv /^ ^^ч дх дуг ду2 1 Используя этот результат, можно рассматривать так называемые усеченные 2Круглыми скобками обозначены вектор-строки,
80 Гл. 1. Матрицы, операторы и группы операторы полного дифференцирования: ^ <9* ^ <9* <9* ^ <9* <9* <9* D* = —, D* = — + —y, D* = — + —y + --y, о дх 1 дх дуг 2 дх ду i ду 2 1 которые можно определить рекуррентными соотношениями * = 23 * +^ 2/ , /с = 0,1, 2,... E.560 + /с Предположим, что задана локальная однопараметрическая группа преобразо- преобразований пространства Z = X х У, определяемая соотношениями х'= f(x,y,a), у' =g(x,y,a), f(x,y,0)=x, g(x,y,0)=y, E.57) или ж' = ж + af (ж, ?/) + ..., у' = у + arj(x, 2/) + ... , E.58) где df(x,y,a) да г)(х,у) = дд{х,у,а) а=0 да E.59) а=0 Предполагается также выполненным следующее условие. Линейные отображения д fix,у,а) _ т^ дд(х,у,а) _ : Z —>- А и : Z —У У являются гомеоморфизмами для точек дх ду z = (ж, у) G У, где У — некоторое открытое множество в Z = X х Y. В преобразованиях E.57) х считается независимой переменной и поэтому в U11 ( Т I пространстве Z определена производная Фреше —^- отображения X ->• У, дей- ах ствующего по формуле у = и{х). Если это отображение из класса Соо(Х), то его можно продолжить до отображения X —> Y& с помощью введенных выше dku(x) операторов дифференцирования по следующему правилу: )—^- = у Е IV ах70 Тем самым каждое отображение и : X ^ Y продолжается до отображения и : X ->• Z&. В частности, Цж) = (ж,и(ж)) является «нулевым» продолжением /с О отображения и : X —>- У до отображения и : X —>¦ Z, а при произвольном к это отображение действует по формуле ^), t_lF... (,60) Если наряду с отображением и : X —У Y задано отображение v : Z^ —у Р (Р — банахово пространство), то можно образовать композицию v * и : X —У Р, дейст- действующую по формуле (v*u)(x) = v(u(x)). Дифференцирование таких композиций к к выполняется с помощью оператора «полного» дифференцирования E.56). Теорема 5.5. Для отображений v : Zj~ —>¦ Р и и : X —> Y справедливы формулы dv[u(x)] —h = Dv[u(x)] =Dv[u(x)], A: = 1,2,... E.61) Располагая этими фактами, продолжим преобразование E.57) Z —> Z до пре- преобразования Z^ —> Z^, т.е. каждому элементу z = (х,у,у,... ,у) поставить в к 1 к
§ 1.5. Группы Ли 81 соответствие элемент z' = (V,у',у',...,?/'), которые связаны между собой соот- к 1 к ношением z' = h(z), к = 1,2,... E.62) /с /с к Если записать это соотношение покомпонентно, то очевидно, что первыми дву- двумя компонентами преобразования h окажутся операторы / и д из E.57). После- Последующие компоненты преобразования E.62) можно записать в виде у' = v{x, у,у,...,у), s = 1, ...,&. E.63) s s Is При этом операторы v можно выразить через усеченные операторы полного диф- s ференцирования следующим образом. Непосредственно из определения операторов дифференцирования находим, что dx' . dy' dy' . .._-, = Dt. = Da, и поэтому = v = Dq(Df) . Аналогично получаем для dx iJ' dx iy' У dxf i iuyiJJ У любого s: v = (D v)(Df)-\ 8 = 1,2,... E.64) s ss—1 1 На первый взгляд кажется, что формулы E.64) выглядят искусственными, но в действительности они имеют простую аналитическую природу. Пусть дано отображение и : X —У У, действующее по формуле у = и(х). С помощью преоб- преобразования E.57) оператор и переводится в новый оператор и', действующий по формуле у1 = и'(х'). Этот новый оператор получается исключением х из уравне- уравнений х1 = /(ж, и(х)), у1 = д(х, и(х)). E.65) du'ix') Формулы E.64) устроены так, что они дают значения производных — , вы- dx' du(x) раженные через значения производных —-—. Это свойство производных можно dx сформулировать через обозначения E.60). Теорема 5.6. Справедливы тождества V^ = v[u(x)], x' = f(x,u(x)), u(x)=u(x), A: = 1,2,... E.66) dx к к О Доказательство. Непосредственно из определения и' и из формул E.64) сле- следует, что d^ uix)) = Dg{u{x)) = Dg{u{x)). Выражение, стоящее справа в этой цепочке равенств, представляет собой не- d ij (т i которую функцию от ж, и{х) и ——. Поэтому его можно обозначить через v(u). Следовательно, можно записать тт2 = ;<*"»• <'»
82 Гл. 1. Матрицы, операторы и группы Аналогичным образом из E.66') получаем: da;' da;' da; da;' Правая часть этих равенств представляет собой функцию от ж, и(х), —;— и ах d2u(x) —. Поэтому можно записать dx2 ^ = «(«(*))• E-66") Продолжая этот процесс, получаем последовательность формул E.66). Теорема полностью доказана. 3. Продолжение группы и инфинитезимального оператора. Пусть G1 — локальная группа преобразования h = (f,g) : Z = X х Y —>¦ Z, где 2 = (ж, 2/) и, следовательно, G1 задана соотношениями E.57) или E.58). Каждому конкретному значению параметра а соответствует конкретное преобразование h = ha, которое по указанному выше правилу можно продолжить до преобразо- преобразования ha : Zk —>¦ Z}~. В результате такого продолжения получается однопарамет- к рическое семейство преобразований, порождаемое преобразованием h — h. Оказывается, что преобразование h определяет локальную группу преобра- к зований пространства Z&, которую будем обозначать через G1(/i) и называть к продолженной группой, получаемой к-м продолжением группы G1(/i). Эта группа, очевидно, задается теми же соотношениями E.57) (или E.58)), а лежащие в Y& компоненты fc-ro продолжения h отображения h определяются формулами вида к у' = у(ж,7/,7/,...,7/,а), E.67) к к 1 к причем отображение v определяется через / и g формулами E.64). к Пример 5.9. Пусть группа преобразований задана соотношениями х = х + Ла, у = у + /на, где а — групповой параметр, аАи/i — заданные постоянные. Таким образом, в рассматриваемом случае /(ж, у, а) = х + Ла, д(х, у, а) = у + /ла. Отсюда находим, что Df = 1, Dg = у. 1 1 1 Поэтому v = у и, согласно формулам E.64), получаем 1 1 и fc-oe продолжение G1 исходной группы G1 определяется соотношениями к ^ ^ dy dy dky dky dx dx^ ' dxk dxk Важнейшей характеристикой группы преобразований G1 является ее инфини- тезимальный оператор (см.E.21)). Поэтому естественно рассматривать вопрос о таком операторе fc-ой продолженной группы, к = 1, 2,...
§ 1.5. Группы Ли 83 Пусть группа задана соотношениями E.57), ( = (?,rj) — ее векторное поле. Тогда, в соответствии с формулой E.21), инфинитезимальный оператор можно определить формулой dF dF ад с) = ~дх~^х'у) + ~д^ф'у)' E<68) Касательный вектор ( группы G1(/i) можно представить в виде к к С = U, ту, ту,..., ту}, E.69) к 1 к где 77, при s = 1,2,...,&, — компоненты вектора ( Е Zk. Компоненты 77, для s к к всех к = 1,2,..., выражаются через ? и ц с помощью так называемых формул dv(zO) продолжения векторного поля п = — . к да Так как оператор полного дифференцирования перестановочен с оператором дифференцирования по параметру а, то в формулах E.69) можно выполнить сле- следующие преобразования: ±[vDf] = ±[Dvl J^Df + v D Ш = D (%. dak+n* dak+ik] да l fc+i 1 \daj k+i \da I Положим во втором из этих равенств а = 0 и учтем соотношения: v(z,0) = у, к к к df(x у 0) ^—^— = ?(ж,2/), f(x,y,0) = х. Тогда будем иметь г] + у D(?) = D G/). Отсюда, считая, что г] = 77, окончательно получаем рекуррентные формулы о продолжения векторного поля ц =DM- У Ш), * = 0,1,2,... E.70) fc+i x В соответствии с представлением E.69) касательного вектора продолженной группы G1^), ее инфинитезимальный оператор можно представить в виде к к дх ду ду 1 9?/ /с 1 /с Он называется продолженным оператором или fc-л* продолжением оператора группы G1. Важнейшую роль в теории групп Ли играют специальные операторы, назван- названные коммутаторами, с помощью которых к анализу групп Ли привлекается ап- аппарат векторных пространств. Это позволяет сравнительно просто алгебраичес- алгебраическими методами получить достаточно весомые результаты как в теории групп Ли, так и в ее приложениях. Приведем основные факты, относящиеся к этому направлению теории. 4. Коммутаторы. При решении ряда задач теории и, особенно, ее приложе- приложений, приходится рассматривать семейства (конечные или бесконечные) однопа- раметрических групп. Каждое такое семейство состоит из групп, объединенных какими-либо общими признаками. Возникает естественный вопрос: нельзя ли объединить их в одну, возможно многопараметрическую группу? Если это воз-
84 Гл. 1. Матрицы, операторы и группы можно, то естественным является и следующий вопрос: а каково наименьшее число параметров, определяющих эту группу? Для ответа на эти вопросы вво- вводится понятие коммутатора. Двум инфинитезимальным операторам T>i(*,?) и T>2(*,rj) поставим в соответ- соответствие оператор, называемый коммутатором Имея в виду, что результат применения инфинитезимального оператора к опера- оператору Т можно записать так: V(T\^) = —— ?, находим, что коммутатор можно ах представить в виде РМ*;?№(*;»?)] = ?>(*;<)> ( = Vi(r,;O-V2(t;v)- E-72) Непосредственно из определения следует, что коммутатор обладает следую- следующими свойствами. 1) Он билинеен, т.е. при любой постоянной с, »?)] = [©(*; ^№ (*;?)] + Р>(*; V), 2) он антисимметричен: [?>].(*; ?),?>2(*;?7)] = ~[^2(*;^)?^i(*;0] и удовлетво- удовлетворяет тождеству Якоби Векторное пространство, в котором задан билинейный закон умножения век- векторов, называется алгеброй. Таким образом, линейное пространство инфините- зимальных операторов является алгеброй, если под произведением операторов понимать их коммутатор. Поскольку коммутаторы обладают еще свойством ан- антисимметричности и удовлетворяют тождеству Якоби, то мы имеем дело со спе- специфичной алгеброй. Эта алгебра называется алгеброй Ли и обозначается обычно через L. Она представляет собой векторное пространство инфинитезимальных операторов вместе со всеми их коммутаторами, поскольку каждый коммутатор, в силу формулы E.72), имеет ту же структуру, что и инфинитезимальные опе- операторы, принадлежащие этому пространству. Размерность алгебры Ли понимается как размерность обычного векторного пространства. Если эта размерность конечна и равна г, то в L можно выбрать базис. Пусть его образуют операторы ?>]_,...,XV. Тогда любой оператор V можно представить в виде ciT>i, E.73) г=1 где сг — некоторые постоянные.
§ 1.6. Многопараметрические группы 85 Поэтому, каждый коммутатор [Оп,Т>ш] можно представить в форме E.73): г nmVi. E.74) г=1 Постоянные с1пш называются структурными постоянными алгебры L. Этот результат можно сформулировать в виде следующей теоремы. Теорема 5.7. Для того чтобы векторное пространство L инфинитезималъ- ных операторов с базисом V\,..., Vr образовывало алгебру Ли, необходимо и до- достаточно, чтобы коммутаторы базисных операторов были представимы форму- формулой E.74). Пример 5.10. В плоскости переменных t,x рассмотрим следующих два опе- оператора Х\ = t—, X2 = х — . Непосредственной проверкой находим, что верно ох ох [Xi,X2] = —Х\ и, следовательно, векторное пространство с базисом Х\, Х2 яв- является двумерным. § 1.6. Многопараметрические группы в конечномерных пространствах Используя общие идеи, изложенные в предыдущем параграфе, рассмотрим те- теперь некоторые результаты теории групп Ли с векторным групповым парамет- параметром. Однако, при этом будем предполагать, что пространство X, в котором определено преобразование, является конечномерным. 1. Группы, векторные поля и алгебры Ли. Пусть X = EN — про- пространство векторов3 х = {ж1,... ,xN}. Преобразованием пространства EN бу- будем называть взаимно однозначное отображение Т : EN —у EN, определенное в некоторой малой окрестности точки ж0 ? EN. При этом тождественное преобра- преобразование пространства EN будем обозначать символом IN. Пусть Ег — другое евклидово пространство векторов а = {а1,..., аг}, которое в дальнейшем будем называть параметрическим пространством, а координаты а1, ..., аТ — параметрами. Семейство Gr = {Та} — семейство преобразований, зависящих от параметра a G Ег. Каждое преобразование действует по формуле Та : х -у х' = /(ж, а) = Тах, или в координатах Та : х'г = /г(ж, а), г = 1,..., N. При этом функция /, как отображение Еп х Ег —у Еп, предполагается бес- бесконечно дифференцируемой (т.е. / G Coo(EN x Ег)). Если для значений па- параметров а и Ъ из некоторой области композиция (произведение) ТъТа G Gr, то возникает функция с = ip(a,b), с помощью которой композиция записывается формулой Т\уТа — Т^(аь), равносильной соотношению /(/(ж, a), b) = f(x,(p(a,b)). Функция (^(а, Ь) называется законом умножения преобразований. Определение 6.1. Семейство Gr называется локальной г-параметрической группой Ли преобразований пространства EN (в дальнейшем просто группой 3Здесь удобно пользоваться верхней индексацией компонент векторов.
86 Гл. 1. Матрицы, операторы и группы Gr), если существует окрестность нуля О С Ет такая, что при всех a Е О пре- преобразования Та Е Gr, и если: 1) То = IN; 2) из того, что a Е О и Ъ Е О, следует, что Т^Та Е Gr; 3) из того, что а G О, & G О и Та = Т^, следует, что а = Ь; 4) (p(a,6)GGoo(OxO). Пример 6.1. Группа линейных преобразований с равным единице определи- определителем получается из выражения для общей линейной группы х' = х + \ix + vy, yf = у + тх + 6у введением условия на определитель Точками обозначены члены более высокого порядка малости. Отсюда следует, что в = —/i, т.е. имеется три независимых параметра и тем самым получена группа преобразования G3, определяемая соотношениями х' — х + \ix + vy и у' = у + тх- цу. Для теории Ли характерно параллельное рассмотрение групп Ли Gr, векторных полей Lr и алгебр Ли. Векторным полем называется отображение v : EN —у EN. В дальнейшем предполагается, что v E Coo(EN). Обычным способом определе- определены понятия сложения векторных полей и умножение поля на постоянное число. Коммутатором векторных полей v\ и v2 называется векторное поле4 i = l,...,N. F.1) Эту систему равенств запишем в следующей компактной векторной форме dv2 dv\ [vi,v2] = -^— (vi) - -^— {v2). F.2) ox ox Определение 6.2. Множество L векторных полей называется алгеброй Ли (векторных полей), если L — векторное пространство (над полем комплексных чисел) и если из того, что v\ E L и и2 Е L следует, что [^1,^2] € L. Каждой группе Gr ставится в соответствие касательное отображение я ' F-3) оно каждой точке х Е EN ставит в соответствие линейное отображение Ег —у EN. Отображение представляет собой матрицу размерности г х JV, т.е. если е е Ег, то образ при линейном отображении ?(ж) есть элемент ?(ж)е = ^е(^) ^ EN. Поэтому ^е(ж) при фиксированном е является векторным полем на EN. При переменном е получается семейство векторных полей, которое является г-мерным 4Здесь каждое произведение суммируется по повторяющимся индексам.
§ 1.6. Многопараметрические группы 87 векторным пространством, более того, алгеброй Ли Lr. Базис в Lr образован векторными полями df(x,a) х -+ ?а(х) = дас F.4) а=0 Таким образом, каждой группе Ли Gr соответствует более простой объект — алгебра Ли Lr. Это соответствие является взаимно однозначным, т.е. каждой конечномерной алгебре Ли Lr соотносится некоторая группа Gr, для которой данная Lr является ее алгеброй Ли векторных полей. Более того, соответствие Gr <-> Lr распространяется на подгруппы и подалгебры, нормальные делители и идеалы. Однако при решении прикладных задач алгебры Ли векторных полей появляются независимо от групп, как решения специальных систем уравнений. 2. Определяющее уравнение и производная Ли. Пусть разыскивается отображение ? : EN —у EN, как решение системы линейных дифференциальных уравнений (среди них могут быть и конечные) /,@ = о, 0 = i,...,e, F.5) где Iq — линейные дифференциальные операторы. Система F.5) называется сис- системой определяющих уравнений, если для любых двух ее решений ?i и ?2 их коммутатор [?i,?2] также является решением этой системы. Следовательно, множество всех решений определяющих уравнений образует алгебру Ли L векторных полей. Если эта алгебра конечномерна и есть Lr, то ей соответствует локальная группа Ли Gr преобразований EN -у EN. Однако, часто встречаются случаи, когда L бесконечномерна. Бесконечномер- Бесконечномерной алгебре Ли L векторных полей также сопоставляется множество преобразо- преобразований EN —у EN, которое называется бесконечной псевдогруппой Ли и строится следующим образом. По каждому векторному полю ? G L можно построить однопараметрическую группу G1(?), преобразования которой получаются интегрированием уравнений dx1 Ли = ?(ж'), ж'|а=о — х- Совокупность всех возможных композиций преобра- аа зований, принадлежащих группам G1(?) и получаемых, когда векторное поле ? пробегает всю алгебру L, и есть бесконечная псевдогруппа Ли. В конечномерном случае, когда L = Lr, достаточно взять базис F.4) в Lr и рассматривать группы G1(?a) = Tax. В этом случае соответствующая группа Gr состоит из преобразований TaiTa2 .. .Гаг, когда точка а = {а1,... ,ат} пробегает окрестность нуля в Ег. Преобразованием отображения F : EN —у EN называется отображение F' = TaF, действующее по формуле TaF(x) = F(Tax). Производная диффе- дифференцируемого отображения F &F(x) = dF(Tax) да (б.б) а=0 называется производной Ли отображения F относительно группы Gr'. В этом смысле касательное отображение ? является производной Ли тождественного пре- преобразования Iм.
88 Гл. 1. Матрицы, операторы и группы Пример 6.2. Пусть задано линейное преобразование плоскости с определите- определителем, равным единице (см. пример 6.1) х' = fi{x,y,a) =ж + fix + vy, yf = f2(x,y,a) = у + тх - \iy, F.7) где а = {/i, г/, т}. Полагая / = {/ь/2} и вычисляя производную Фреше по фор- формуле ,a) = df(x,y,a) ft находим, что касательное отображение (см. F.3)) представляет собой матрицу _ df(x,y,a) х у О — l n ^ ]. Следовательно, семейство векторных da a=0 полей при каждой фиксированной точке (х,у), соответствующее рассматривав- { х у 0\ ЛЛ мои группе, определяется следующим выражением I \ \ ь> , которое \—у U хJ I I в скалярной форме представляется в виде \ix + z/?/, тж — \iy. Оно же определяет трехмерную алгебру Ли. Ее базисом (в соответствии с формулами F.4)) можно взять вектор-функции {ж, — у}, {2/5О}, {0, ж}. F-9) Возьмем теперь произвольное отображение х' — Fi(x,y), у' = F2(x,y) и вы- вычислим его производную Ли с соответствии с преобразованием F.7). Для этого по известному правилу вычислим производную Фреше по а = {/i,z/, г} от векторной функции F(x,y,a) = {F1(f1(x,y,a)J2(x,y,a)),F2(f1(x,y,a)J2(x,y,a))}. Используя формулу F.8), после несложных вычислений получаем производ- производную Ли в виде ~^~х~ ~^~У ~^~У ~^~х дх ду дх ду i /fi 1 m dF2 dF2 dF2 dF2 I ' ^'iUJ ~^~x~ ~я~У ~я~У ~^~x ox oy ox oy Если воспользоваться базисными элементами F.9) алгебры Ли, то для каждого элемента матрицы F.10) можно получить представление через эти элементы: х \ (dFx дРЛ(у\ (dFi дх' ду J \-yj ' \дх' dyjyoj' \дх' ду J \X/ dF2 dF2\ ( x \ (dF2 dF2\ (y\ (dF2 dF2\ /0ч { ' ' dx'dy Эти формулы определяют три инфинитезимальных оператора Д Д г\ г\ Х1=х—-у—, Х2 = у—, Х3=х—, F.12) дх ду дх ду каждому из которых соответствует своя однопараметрическая группа.
§ 1.6. Многопараметрические группы 89 Тот факт, что элементы производной могут быть представлены через базисные элементы алгебры Ли по формулам типа F.11) в общем виде записывается в форме ZF(x) = y^-(Z(x)). F.13) В случае однопараметрической группы G1 = G1(^) касательное отображение ?(ж) отождествляется с векторным полем на EN. При этом производная Ли обозначается через X и выражается через координаты ?г векторного поля ? по формуле х = ?ш FЛ4) Эта формула устанавливает взаимно однозначное соответствие ? «->¦ X между векторным полем и инфинитезимальным оператором X, которое продолжается на коммутаторы согласно следующему правилу. Из того, что ? «->¦ X, г\ *-> Y, следует [?, ту] +* [X, Y]=XY -YX. Производную Ли для группы Gr можно выразить через базисные операторы Ха <-> ?,а однопараметрических групп G1(?a) (см- пример 6.2, формулы F.11)). Поэтому вместо алгебры Ли векторных полей оперируют с алгеброй Ли операто- операторов группы Gr, которая имеет базис Ха=С(х)—., a = l,...,r. F.15) В примере 6.2 таким базисом являются операторы F.12). Важность перехода от группы Gr к соответствующей алгебре Ли Lr опреде- определяется тем, что этот переход позволяет «линеаризировать» задачи, связанные с изучением свойств инвариантности различных объектов. Функция J(x) называется инвариантом группы Gr, если для любого Та из Gr справедливо тождество J(Tax) = J{x). Оказывается, что это тождество равно- равносильно равенству &J(x) = 0 F.16) или в базисе F.15) XaJ(x) =0, a = l,...,r. F.17) Система уравнений F.17) является полной, в силу чего нахождение инвариан- инвариантов группы Gr сводится к интегрированию системы обыкновенных дифферен- дифференциальных уравнений. Если г* — ранг матрицы {?д}, то существует t = N — г* функционально независимых инвариантов J5(x), 5 = 1,... ,?, и любой инвари- инвариант является функцией от них. Многообразие М С EN называется инвариантным многообразием группы Gr, если Тах G М для каждой точки х G М и любого преобразования Та G Gr. Такое многообразие называется регулярно заданным, если оно задано системой уравнений вида ^(х)=0, г = l,...,s ^7V, F.18)
90 Гл. 1. Матрицы, операторы и группы причем функции грг непрерывно дифференцируемы и ранг матрицы < ——г > равен [ дхЭ J s. Критерий инвариантности регулярно заданного многообразия формулируется с помощью операторов F.15) в виде Хагрг(х) | м = 0, г = 1,..., s; а — 1,..., г. Многообразие М называется неособым относительно группы Gr, если общий ранг матрицы {^(ж)} на М равен г*. В противном случае многообразие называ- называется особым. В теории многопараметрических групп известен следующий важный факт. Всякое гладкое неособое инвариантное многообразие группы Gr может быть задано системой уравнений вида F.18), в которых левые части являются инва- инвариантами группы Gr. 3. Продолженные группы и их инварианты. При использовании теории групп в решении дифференциальных уравнений чрезвычайно важную роль игра- играют продолженные группы и их инварианты. Общие методы построения продол- продолженных групп изложены в предыдущем параграфе. Поэтому здесь отметим лишь те факты, которые непосредственно связаны с многопараметричностью группы. Имея в виду, что речь идет о применениях групп к исследованию и решению дифференциальных уравнений, вектор переменных х = {ж1,... ,xN} следует раз- разбить на два вектора х = {ж1,...^71} и и = {гл1,... ,глт}, считая первый из них вектором независимых переменных. Тогда преобразование Та : (х,и) —у (xf,uf) удобно представить в виде х' = /(ж, и, а), и' = д(х,и,а). F.19) Соответствующие этому отображению касательное отображение и оператор за- запишем в виде ?(ж, и) = (ж(ж, и),и(х, и)), х = {ж1,..., жп}, и = {и1 ..., и171}. F.20) А -Ж {X,U)dx.+U [X,U)guk. (O.ZL) Для получения основных формул теории продолжения групп в рассматривае- рассматриваемом многомерном случае удобно пользоваться следующими обозначениями. 1. Через v — {г/i,..., ип} обозначается целочисленный вектор (мультииндекс), причем все щ ^ 0 и \и\ = v\ + • • • + vn. 2. Для каждого к вводится величина ик, определяемая следующей формулой и^(х) = . При этом упорядоченный набор всех ик с \г/\ = q обозначается символом и. я. Способом, изложенным в предыдущем параграфе, преобразования F.19) про- продолжаются до преобразований х' — f(x,u,a), и' = д(х,и,а), и' = h(x,u,u,a). Со- Соответствующее пространство (первое продолженное пространство) обозначим че- через ENl(x,u,u). Через EN<2(x,u,u,u) обозначим второе продолженное простран- пространство и т.д. до формально бесконечномерного пространства Е°°(х,и,и,и,...).
§ 1.6. Многопараметрические группы 91 При этом производные определяются по формулам и' = Нк(х,и,и,... ,и, а), v I q Q=W • В полученных продолженных пространствах обычным способом определяются (имея в виду, что ж, и, ..., и считаются независимыми геометрическими коорди- q натами) продолженные векторные поля и алгебры Ли. В связи с этим возникает необходимость ввести некоторые новые понятия, о которых не говорилось в пре- предыдущем параграфе. Многообразие в продолженном пространстве называется дифференцируемым многообразием. Дифференцируемое многообразие, инвариантное относительно продолженной группы, называется дифференциальным инвариантным многообра- многообразием. Инварианты продолженной группы называются дифференциальными ин- инвариантами группы Gr. Порядок дифференциального инварианта определяется как наибольший из порядков входящих в него производных. В совокупности дифференциальных инвариантов определена новая операция — операция инвариантного дифференцирования, переводящая любой инвариант порядка q в инвариант порядка q + 1. При этом установлено, что во множестве всех дифференциальных инвариантов данной группы Gr существует конечный функциональный базис со следующим свойством. Любой дифференциальный инвариант группы Gr может быть получен из инва- инвариантов этого базиса с помощью операций образования функций от инвариантов и инвариантного дифференцирования. Оператор D инвариантного дифференцирования определяется формулой5 D = оог(х,и,и,.. .)Di, где Di — оператор полного дифференцирования по пе- переменной X1'. я °° я q=0\v\ = q V 4. Вычисление основной группы. Каждую систему S дифференциальных уравнений Фу(х,и,щ...,и) =0, v = 1,...,сг, F.22) 1 q порядка q с неизвестными функциями и = {и1,..., и171} от независимых перемен- переменных х = {x1,...,xN} можно рассматривать как систему уравнений, задающую дифференциальное многообразие в пространстве ENq(x,u,u,... ,и). Это много- 1 q образие будем обозначать также через S. Кроме того, будем также предполагать, что уравнениями системы S задано регулярно. Говорят, что система дифференциальных уравнений S допускает группу Gr преобразований EN(x,u) ->• EN(x,u), если S является дифференциальным инва- инвариантом этой группы Gr. Если L — алгебра Ли той же группы Gr, то говорят, что S допускает алгебру Ли L. Напомним, что здесь и далее по повторяющимся в произведении индексам произ- производится суммирование.
92 Гл. 1. Матрицы, операторы и группы Очевидно, что справедливо следующее утверждение. Для того, чтобы система S допускала многопараметрическую группу Gr, необ- необходимо и достаточно, чтобы S допускала любую однопараметрическую подгруппу G1 С Gr. Используя этот факт, предположим, что система F.22) допускает однопара- однопараметрическую группу G1(^) с инфинитезимальным оператором X «->¦ ? вида F.21). Тогда для q продолжения оператора X должны выполняться равенства = 0, г = 1,...,сг. F.23) Так как выполнение этих равенств достаточно для того, чтобы S допускала груп- группу G1(?), то их можно рассматривать как уравнения относительно ?, т.е. как систему уравнений относительно хг и ик векторного поля ?. Из теории продолжения следует, что система F.23) с неизвестным ? является системой определяющих уравнений. Тем самым ее решение дает наиболее широ- широкую псевдогруппу Ли преобразований EN, допускаемых данной системой S — так называемую основную группу системы S. Важной особенностью этой системы определяющих уравнений является то, что в ней искомые функции ик и хг должны зависеть только от переменных х и и. В то же время, определяющие уравнения F.23) содержат переменные и, I = l,...,g, связанные только уравнениями F.22). В результате получается, как правило, сильно переопределенная система определяющих уравнений, для которой сравнительно просто строится общее решение. Приведенные рассуждения дают следующий алгоритм вычисления основной группы данной системы дифференциальных уравнений порядка q. 1. Выписать q-e продолжение вектора ?. 2. Написать действие оператора X на систему S. q 3. Исключить некоторые из зависимых переменных и, к = 1,...,д, из полу- полученных уравнений с помощью системы S. 4. Найти общее решение оставшихся определяющих уравнений. Примеры, иллюстрирующие практические возможности указанного алгорит- алгоритма, здесь приводить не будем. Они достаточно полно представлены в последую- последующих главах при исследовании различных типов уравнений Риккати. 5. Групповая классификация и инвариантные решения. Дальнейшим развитием задачи построения основной группы для данной системы дифферен- дифференциальных уравнений является задача их групповой классификации. Она пред- представляет большой интерес для различных приложений как теории групп, так и теории дифференциальных уравнений, так как ее решение позволяет отбирать наиболее перспективные по их возможностям решения конкретных задач. Рассматриваемая проблема состоит в следующем. Предположим, что исходная система S дифференциальных уравнений содер- содержит некоторое число параметров или функций, которые не считаются строго определенными. Совокупность этих параметров или функций обычно называют
§ 1.6. Многопараметрические группы 93 «произвольным элементом» и обозначают через П. Каждое конкретное задание этого элемента П = По дает конкретную систему So- При этом По и So называ- называются специализациями элемента П и системы 5, соответственно. Если S допускает некоторую группу G независимо от специализации П, то оче- очевидно, что эту группу допускает и любая специализация So этой системы. Вместе с тем, возможны случаи, когда основная группа Go системы So окажется более широкой, нежели G. Эти случаи подлежат отбору в групповой классификации. Точнее, задача формулируется следующим образом. Для системы дифференциальных уравнений S, содержащей произвольный эле- элемент П и допускающей не зависящую от П основную группу G, требуется найти все такие ее специализации So, для которых основная группа Go является более широкой по сравнению с G. При решении этой задачи существенную роль играют так называемые преоб- преобразования эквивалентности, которые определяются следующим образом. Преобразование Т : EN(x,u) —> EN(x,u) называется преобразованием эквива- эквивалентности для системы 5(П), если под действием Т (соответствующим образом продолженного) система переходит в систему Т5, отличающуюся от S только значением произвольного элемента П. Иначе говоря, Т не меняет структуры системы 5, а преобразовывает только П. Этот факт выражается символической формулой Т5(П) = 5(ТП). Системы S и TS в этом случае называются эквива- эквивалентными. Всевозможные преобразования эквивалентности образуют группу Q — группу эквивалентностей систем вида 5(П), которая содержит основную группу G в качестве нормального делителя. По отношению к группе Q множество систем 5(П) разбивается на классы эквивалентных систем. Поэтому итогом групповой классификации должна быть факторгруппа эквивалентностей Q классов эквива- эквивалентности систем 5(П). С теоретико-групповой точки зрения каждое решение системы дифференци- дифференциальных уравнений F.22) удобно рассматривать как многообразие Ф С RN(x,u), заданное уравнением Ф:ик=(рк(х), /с = 1,...,т. F.24) Пусть п = {Ф} есть многообразие всех решений F.24) системы уравнений F.22). Основная группа G этой системы наделяет множество п определенной структу- структурой благодаря следующему его свойству. Любое решение Фей под действием любого преобразования Т е G переходит снова в решение ТФ е П. Следовательно, группа G действует на множество п и оно расслаивается на классы решений, эквивалентных относительно G. Этот факт остается верным и для любой подгруппы Н С G. Особый интерес представляют «неподвижные точки» относительно действия группы Н на П. Они выделяются следующим определением. Определение 6.3. Решение Ф (см. F.24)) системы дифференциальных урав- уравнений F.22) называется инвариантом или Н-решением, если ТФ = Ф для любого преобразования Т е Н.
94 Гл. 1. Матрицы, операторы и группы Прежде всего отметим, что инвариантные решения существуют не для любой группы. В том случае, когда они существуют, будем предполагать, что каждое из них не является особым для данной группы Н. В теории установлены необходимые и достаточные условия существования инвариантных решений. В общих чертах они состоят в следующем. Группа Н должна иметь не меньше, чем т (см. F.24)) независимых инвари- инвариантов JT(x,u), г = 1,...,т. Тогда решение Ф можно представить с помощью уравнений, содержащих только эти инварианты, если „,. F.25) При выполнении условия F.25) и еще некоторых менее существенных, но бо- более громоздко формулируемых условий, задача сводится к интегрированию так называемой S/H системы. В итоге можно указать алгоритм построения таких инвариантных i^-решений. Он состоит в следующем. 1. Найти полный набор независимых инвариантов группы Н. 2. Проверить необходимые условия существования инвариантных ^-решений (если есть необходимость в такой проверке). 3. Построить систему S/H.
Глава 2 Матричные алгебраические и дифференциальные уравнения Риккати § 2.1. Матричные многочленные уравнения Эта глава полностью посвящена матричным уравнениям Риккати. Здесь из- излагается достаточно широкий круг вопросов по теории и приложениям таких уравнений. Теоретические вопросы относятся, в основном, к методам практи- практического построения решений с использованием того аппарата, который изложен в предыдущей главе. Рассматриваются методы точного аналитического решения. В заключение довольно кратко отмечены приближенные методы. Для решения алгебраических и дифференциальных уравнений Риккати нам по- потребуются некоторые факты о способах решения различных многочленных мат- матричных уравнений. В одних случаях они тривиальны, в других требуется со- соответствующее обоснование. Хотя многие из приводимых ниже результатов без особого труда распространяются на случай прямоугольных матриц, мы этими об- обобщениями увлекаться не будем, а всюду в дальнейшем ограничимся анализом уравнений только с квадратными матрицами. 1. Уравнение АХ — ХВ = 0. Будем рассматривать уравнение АХ-ХВ = 0, A.1) где О — нулевая матрица, а А и В — заданные n-мерные матрицы. Пусть (Л - Ai)ni,(А - А2)П2,..., (Л - Ав)п% щ + ... + ns = п, (А - /ii)Pl, (Л - v<iY\ • • •, (А - /ir)*\ Pl + ... +Рг = п, — элементарные делители матриц А и В, соответственно. Тогда существуют неособенные матрицы U и V такие, что А и В приводятся к канонической жор- дановой форме 1, B = VBV~1J A.2) где
96 Гл. 2. Алгебраические и дифференциальные уравнения Здесь E^q' — единичная матрица порядка q, a /О 1 0 ... 0\ О 0 1 ... О (*) О О О ... 1 \О О О ... О/ Умножим обе части уравнения A.1) слева на U и справа на У. Тогда по- получим U AXV~X = UXBV~1. Очевидно, что это уравнение можно переписать в виде AUXV'1 = UXV^B, A.4) поскольку справедливы равенства U~1U = V~XV = E. Если ввести обозначение X = UXV~\ A.5) то уравнение A.4) принимает вид АХ = ХВ. A.6) Для решения этого уравнения матрицу X разобьем на блоки X — {Хар}, здесь а = 1,..., s; /3 = 1,... , г, каждый из которых является прямоугольным, но они построены так, чтобы матрица Хар имела размерность па х pp. Тогда уравнение A.6) распадется на систему независимых друг от друга урав- уравнений /Л /^(п«) -I- Н(Па^\Х а — X ак И аЕ(рР^ + 77 ^Н ГУ ~ 1 S* /? — 1 Г Эти уравнения перепишем в более удобной форме {/ip — Ха)Хар = НаХар — XapGp, а = 1,..., s; /3 = 1,..., г, A-7) где введены обозначения На — Н^Па), Gp—H^^K A-8) Следовательно, На имеет порядок па, а порядок матрицы G/з равен pp. Проана- Проанализируем каждое из полученных уравнений. Возьмем одно из них и рассмотрим возможные случаи. 1-й случай, Ха ф /ip. Обе части выбранного уравнения из A.7) умножим на ИC — ^сп а затем в уравнении заменяем (/ip — \а)Хар на НаХар — XapGp. Эту операцию повторим q — 1 раз. В итоге получим уравнение A.9) Из определения матриц На и G/з (см. (•) и A.8)) следует, что Я^ = Gp/ = 6>. A.10) Поэтому если теперь в уравнении A.9) взять q ^ па + рр — 1, то в каждом члене суммы, стоящей в правой его части, выполняется по крайней мере одно из соотношений а ^ па, т ^ pp. Значит, в силу равенств A.10), либо Я^ = 0, либо GTp = #. Так как, кроме того, в рассматриваемом случае Ла ф /ар, то из
2.1. Матричные многочленные уравнения 97 уравнения A.9) следует, что A.11) 2-й случай, Ха =11C- В этом случае уравнение A.7) принимает вид НаХар = XapGp. A-12) Согласно определению (см. A.8) и (*)), в матрицах На и G/з отличны от ну- нуля только элементы первой наддиагонали (каждый из них равен единице). Все остальные элементы матриц нули. Учитывая это, положим Хар = {?г/с}> Для г = 1,... ,па; к = 1,... ,р/з- Тогда уравнение A.12) можно заменить эквивалент- эквивалентной ему системой уравнений г = 1,2,.. .,na - 1, fe = 2,3,... ,р/з; , , 0, * = 2,...,na; fe = 1,...,р/з - 1. Полученные уравнения определяют решение, которое обладает следующими свойствами. 1) В матрице Хар на каждой линии, параллельной главной диагонали, стоят равные между собой элементы. 2) &1 = ?31 = • • • = ?na,l = ?32 = • • • = ?na,na-l = 0. Пусть па = Р/з- Из этих свойств 1) и 2) следует, что матрица Ха/з квадратная. Все ее элементы, расположенные под главной диагональю, равны нулю. Элемен- Элементы главной диагонали равны одному и тому же постоянному числу. Обозначим его через сар. Элементы на линии над главной диагональю равны другому по- постоянному числу cl и т.д., т.е. эта матрица имеет вид /с 0 =ТПа, A.14) где сар, ca Если же V о „(n«-l) _ 0 са/3 ^ произвольные постоянные. > na, то легко показать, что в этом случае а при па > о A.15) A.16) \ о / Про матрицы A.14), A.15) и A.16) говорят, что они имеют правильную верхнюю треугольную форму. Число произвольных постоянных в такой матрице Хар равно наименьшему из чисел па и pp. Таким образом, при решении каждого из уравнений A.7) возможны две прин- принципиально различные ситуации. 1) \а ф цр, В этом случае уравнение имеет только тривиальное решение.
98 Гл. 2. Алгебраические и дифференциальные уравнения 2) Ла = \ip. В этом случае уравнение имеет нетривиальное решение правиль- правильной верхней треугольной формы, а число произвольных параметров в решении равно наименьшему из чисел па и pp. Полученный результат позволяет определить структуру каждого блока Хар в блочном представлении матрицы X = {Хар}, которая является решением урав- уравнения A.6). У этой матрицы имеются ненулевые блоки в том и только том слу- случае, когда матрицы A.3), входящие в уравнение A.6), имеют хотя бы по одному одинаковому собственному значению (не обязательно одинаковой кратности). Чтобы получить решение исходного уравнения A.1), следует воспользоваться формулой A.5). Пример 1.1. Требуется решить уравнение / 2 1 0\ /2 0 -1\ АХ = ХВ, А=1 0 2 0 1, Я=[0 1 II. A.17) V-1 -11/ \0 0 1 / Сначала решаем характеристическое уравнение Д^(А) = \ХЕ—A\ = 0 матрицы А. В результате находим, что А^(А) = (А —2J(А —1) и, следовательно, собственные значения матрицы А таковы: А1=2, щ = 2; А2 = 1, п2 = 1. A.18) Для приведения матрицы А к канонической жордановой форме умножим ее слева на U, а справа на С/, где /1 1 0\ / 1 -1 0\ ?/=010, U'1 = 0 1 0 . A.19) \1 0 1/ \-1 1 1/ В итоге получим /2 1 0\ UAU'1 = 0 2 0 = А A.20) \0 0 1/ Аналогичные действия выполняем относительно матрицы В. Корнями ее ха- характеристического уравнения являются числа /XI =2, pi = 1; ц2 = 1, р2 = 2. A.21) С помощью матриц /1 0 -1\ /Ю 1\ У = 0 1 1 , V'1 = 0 1 -1 A.22) \0 0 1 / \0 0 1 / матрица В приводится к канонической жордановой форме: /2 0 0\ УБУ = 0 1 1 \=В. A.23) \0 0 1/ Вводя замену (см. A.5)), X = UXV~1, A.24)
§ 2.1. Матричные многочленные уравнения 99 получаем уравнение АХ = ХВ, A.25) где матрицы А и В определяются формулами A.20) и A.23). Матрицу X представляем в блочной форме X = {Хар}, а = 1, 2; /3 = 1, 2. По индексу а мы перебираем собственные значения матрицы А, а по индексу /3 — собственные значения матрицы В. Так как собственному значению Ai = 2 (см. A.18)) матрицы А соответству- соответствует кратный элементарный делитель (Л — 2J, а собственному значению \i\ — 2 (см. A.21)) матрицы В соответствует простой элементарный делитель \i — 2, то матрица (блок) Хц имеет размерность 2x1. (хц х12 х13 х2\ х22 ^23 5 то получаем S31 ^32 ^33 . Анализируя другие пары Л^, //7, аналогично определим структуру x2i) остальных блоков матрицы X Х\2 = ( ), Х2\ — жзъ ^22 = (^32,^зз)- \Х22 Х2з J Уравнение A.25) теперь записываем в виде 2 1 0\ ч /2 0 0\ О 2 О И*11 Xl2\ = (Xl1 12j 0 1 1 . A.26) 001/4 7 ч /\001/ All в А" = (о г)' уравнение A.26) можно записать в виде Если же представить обе матрицы А и 5 в блочной форме А = ( . V # ^22 ' где А" = (о г)' А22 = х' Б" = 2' В22 = (J !)' то Гц Х12 в А22 J \X2i X22 J \Х21 Х22 Согласно правилам перемножения блочных матриц, отсюда получаем следую- следующую систему матричных уравнений относительно блоков Xiy. А22Х2\ = X2iBu, A22X22 = Х22В22. Решая эти уравнения, получаем Хц = ( х 1, Xi2 = б1, Х21 = 0, Х22 = @,С2), /ci 0 0 где ci и С2 — произвольные постоянные. Следовательно, X = 0 0 0 \ 0 0 с2 Чтобы получить решение исходного уравнения A.17), следует воспользоваться формулой A.24), согласно которой 1 -1 0\ /ci 0 0 \ /1 0 -Г X = и-гХУ = (О 1000001 1 -1 1 1/ V 0 0 с2 \0 0 1
100 Гл. 2. Алгебраические и дифференциальные уравнения (ci 0 -ci 0 0 О -ci 0 ci + c2 t Полученный результат, проиллюстрированный решением примера, позволяет сформулировать процедуру решения матричного уравнения A.1). Она состоит в следующем. 1. Найти собственные значения матриц А и В. 2. Построить все элементарные делители этих матриц. 3. Построить матрицы U и У, с помощью которых матрицы Аи В приводятся к канонической жордановой форме А и В (см. A.2)). 4. В уравнении A.1) сделать замену переменной X на X по формуле A.5), в результате чего уравнение A.1) приведется к виду A.6). Здесь матрицы А и В имеют жорданову форму и, следовательно, имеют блочную структуру (см. A.3)) А = {Ац, • • •, А33}, В = {Вц, ..., Brr}. A.27) 5. Матрицу X представить в блочной форме Дп Xi2 ••• Xir\ Х= Х21 Х22 ••• Х2г , A.28) \Xsi Xs2 ... XsrJ где размерности матриц Х^ определяются соответствующими блоками матриц А и В (см. A.27)). В частности, число строк матрицы Хц равно порядку матрицы An, а число ее столбцов равно порядку матрицы Вц. 6. Подставить матрицы A.27) и A.28) в уравнение A.6) и получить систе- систему независимых уравнений относительно блоков Xij. Решить эту систему, в результате чего будет найдена матрица A.28). 7. С помощью преобразования A.5) найти искомое решение X. Замечание 1.1. Если матрицы А и В не имеют общих характеристических чисел (т.е. характеристические полиномы det \ХЕ — А\ и det \/лЕ — В\ взаимно просты), то уравнение A.1) имеет только тривиальное решение. 2. Перестановочные матрицы. Особый интерес представляет уравнение A.1) в частном случае, когда А = В, это уравнение принимает вид АХ = ХА. A.29) Как показано выше, изложенная выше процедура позволяет находить общее решение уравнения A.1). Применительно к уравнению A.29) рассматриваемая задача может быть сформулирована так. Найти все матрицы, перестановочные с данной матрицей А (задача Фробени- уса.) Если выполнять все этапы построения решения, указанные в предыдущем пункте настоящего параграфа, то в рассматриваемом случае нужно действовать следующим образом. 1. Найти все корни характеристического уравнения матрицы А и выписать все соответствующие им элементарные делители. 2. Определить матрицу U, с помощью которой эта матрица А приводится к
§ 2.1. Матричные многочленные уравнения 101 канонической жордановой форме (см. A.2)) А = UAU~1. В итоге уравнение A.29) записывается в виде UAXZJ-1 = UXAZJ-1. A.30) 3. Ввести новую переменную X = UXU~1. A.31) В результате уравнение A.30) примет вид АХ = ХА, A.32) где А = {Ац,..., Ass} — жорданова форма матрицы А. 4. Представить матрицу X в блочной форме ' Х \\ X = A.33) si Xs2 ... Xss/ где размерности блоков определяются порядком соответствующих жордановых клеток Ац матрицы А. В результате уравнение A.32) распадется на систему независимых уравнений относительно блоков Xij. 5. Решить полученные уравнения, а затем с помощью формул A.31) и A.33) определить матрицу X, перестановочную с данной. Пример 1.2. Требуется найти все матрицы, перестановочные с матрицей (см. пример 1.1) /2 1 0\ А = 0 2 0 . A.34) V-i -1 1/ Для решения задачи составляем уравнение АХ = ХА и решаем его по ука- указанной процедуре. С помощью матриц A.19) матрицу А приводим к канони- канонической жордановой форме A.20). Вводя замену A.31), уравнение A.29) при- /2 1 0\ /2 1 0\ водим к виду (см. формулу A.32)) 0 2 0 X = X 0 2 0 I . Полагая \0 0 1/ \° 0 1/ ^ /2 l\ ^ А = {^-11,^-22}, Ац = ( I, A22 = 1, матрицу X представим в блочной фор- \0 2) ^ (X X \ ме X — ( ), где размерность блоков Xij определяем в соответствии с кратностью элементарных делителей матрицы А. Первому корню Ai = 2 соот- соответствует кратный элементарный делитель (А — 2J, а второму корню \2 = 1 — простой элементарный делитель А — 1. Поэтому размерности блоков Xij таковы: Хц — 2 х 2, Х12 — 2 х 1, X2i — 1 х 2, Х22 — 1 х 1. (жп х12 х13\ Х2\ ^22 ^23 •> то ПОЛуЧИМ формулы ^31 ^32 ^33/ A21 =
102 Гл. 2. Алгебраические и дифференциальные уравнения Тогда уравнение A.29) с матрицей А, определяемой по формуле A.34), можно записать в виде (см. A.32)) 4ц в \ (ХХ1 Х12\ _ /In X12\ [Ап и А22 ) \^21 ^22/ \^21 ^22/ \ " Отсюда получаем систему уравнений относительно блоков X АцХц = ХцАц, А\\Х\2 — 1 L, ^22-^22 = /ci с2 0 Решая ее, находим, что X — 0 с\ 0 ) , где ci, с2 и сз — произвольные V 0 Ос постоянные. Если, наконец, воспользоваться формулой преобразования A.31), то получаем решение задачи. Каждая матрица, перестановочная с матрицей A.34), имеет вид / ci с2 0 X = 0 ci 0 \с3-С1 -с2 с3/ Можно было бы подробно характеризовать структуру матрицы X для различ- различных сочетаний элементарных делителей матрицы А. Однако, этого делать не будем, ограничившись лишь практическими рекомендациями по процедуре ре- решения задачи Фробениуса. Приведенный пример достаточно полно иллюстрирует эффективность этой процедуры. 3. Решение линейного неоднородного уравнения. Рассмотрим уравне- уравнение AX-XB = F. A.35) Это уравнение эквивалентно системе скалярных уравнений для i, к = 1,...,п п п Xipbpk = /г/с- Будем предполагать, что матрицы А, В и F ве- j=i p=i щественны. Соответствующая однородная система уравнений может быть пред- представлена в виде АХ = ХВ. A.36) и вопрос о ее разрешимости, а также о практическом способе построения общего решения уравнения A.36) рассмотрен в п.1 настоящего параграфа. Там было установлено, что это уравнение имеет только нулевое решение в том и только в том случае, когда матрицы А и В не имеют общих характеристических чисел. Отсюда можно сделать важный Вывод. Если матрицы А и В не имеют общих характеристических чисел, то уравнение A.35) имеет единственное решение. Если же у них есть общие характеристические числа, то, в зависимости от свободного члена F, возможны два случая: либо уравнение A.35) противоречиво, либо оно имеет бесчисленное множество решений, определяемых формулой X = Хо + Х\, где Хо — общее решение однородного уравнения A.36), аХ\ — частное решение уравнения A.35).
§ 2.1. Матричные многочленные уравнения 103 4. Скалярное уравнение. Рассмотрим уравнение д(Х) = 0, A.37) где 5(Л) = (Л-Л1)(А-А2)^...(Л-ЛОПЛ, n1 + ... + nh = N, A.38) — заданный многочлен переменной Л. Требуется решить это уравнение. Для каждого решения X полином д(Х) является аннулирующим и поэтому делится без остатка на минимальный многочлен фх(Х) матрицы X. Если п — порядок матрицы X, то в качестве фх(Х) может быть любой из полиномов, начиная с А — А^ и кончая полиномом типа A.38) (с теми же корнями), степень которого равна п. Поэтому каждый из них можно представить в виде фх(Х) = (А - \пуп ... (Л - Xiu)Piu , A.39) где ,Z2,... jiu = 1? 2,..., h, h ^ m,...,piu ^ nq, A.40) .Ph +Pi2 + ...+Pih ^n, причем среди индексов ii,Z2,... ,iv могут быть и равные. Отсюда следует, что искомая матрица представима в виде X = T{\hE^n) + Н(рп\ ..., \iuE^ + Н^}Т~\ A.41) где Г — произвольная неособенная матрица. Значит, решение представляет собой многопараметрическое семейство, которое распадается на конечное число классов подобных матриц, определяемых формулой A.41). Пример 1.3. Дано уравнение X2 = X. A.42) Матрица, удовлетворяющая этому уравнению, называется идемпотентной. Элементарными делителями идемпотентной матрицы могут быть только Л и Л — 1. Поэтому идемпотентную матрицу можно определить как матрицу простой структуры (т. е. приводящейся к диагональной форме) с характеристическими числами, равными нулю или единице. Формула, охватывающая все идемпотент- ные матрицы данного порядка, имеет вид Х = Ги,1,...,1Д0,...,0}Г-1, A.43) п где Г —произвольная матрица порядка п. Эти матрицы распадаются на классы эквивалентных между собой матриц. К первому классу относятся матрицы вида Х\ — Г{1, 0,..., 0}Т~г. Во второй класс входят матрицы Х2 = Т{1,1,0,..., 0}Т~г и т. д. Рассмотрим теперь более общее уравнение f(X) = 0, где /(Л) — регулярная функция в некоторой области G комплексного аргумента. От каждого решения X потребуем, чтобы все его характеристические числа лежали в области G. Пусть Ai,A2,...— все нули функции /(Л), a ni,n2,... — соответствующие
104 Гл. 2. Алгебраические и дифференциальные уравнения им кратности. Как и в предыдущем случае, каждый элементарный делитель матрицы X должен иметь вид (Л — Xi)Pi, Pi ^ П{. Поэтому решениями будут матрицы X = T{\hE(pii) + Н^рп\ ..., XiuE^ +Я^)}Г, здесь индексы n,22j... ,г^ = 1,2...; Pii ^ ^гиРг2 ^ Щ21-">Рги ^ nV 5 Рп + Рг2 + • • • + Piv = n-> а Т — произвольная неособенная матрица. 5. Полиномиальные уравнения. Рассмотрим уравнения АОХШ + АгХ™-1 + ... + Аш = 0, A.44) где А^ — заданные, а X и F — искомые матрицы порядка п. Теорема 1.1. Каждое решение матричного уравнения A.44) является реше- решением скалярного уравнения д(Х) = в, A.46) где д(Х) = det(XmA0 + А^Лп-! + ¦ ¦ ¦ + Ат). A.47) Этому скалярному уравнению удовлетворяет и любое решение Y уравнения A.45). Доказательство. Обозначим через F(X) следующий матричный многочлен F(X) = ХШАО + Хгп~1А1 +_... + Аш. Тогда уравнения A.44) и A.45) можно записать в виде F(X) = в, F(Y) = в. Согласно обобщенной теореме Безу, если X и Y — решения этих уравнений, то матричный многочлен F(X) делится без остатка справа на ХЕ — X и слева на ХЕ - Y: F(X) = Q(X)(XE - X) = (ХЕ - F)Qi(A), где Q(X) и Qi(A) — полиномы. Отсюда следует, что g(X) = det(F(A)) = det(Q(A)) det(XE - X) = det(Qi(A)) det(AE - У). A.477) Здесь det(XE — X) = A(A) и det(A.E —У) = Ai(A) — характеристические опреде- определители матриц X и Y. По теореме Гамильтона-Кэли имеем А(Х) = Ai(F) = в. Поэтому из A.47) следует, что д(Х) = g(Y) = в. Теорема доказана. Проанализируем полученный результат. Скалярное уравнение имеет степень тп и, как показано в предыдущем пункте настоящего параграфа, его решения распадаются на классы подобных между собой матриц. Поэтому решения из одного класса можно искать в виде X^TDT'1, A.48) где D — известная матрица заданной структуры. При желании можно считать, что D имеет нормальную жорданову форму. Подставляя матрицу A.48) в урав- уравнение A.46), получаем линейное уравнение относительно матрицы Г AqTD™ + A^D™-1 + ... + АШТ = в. A.49) Известен единственный удовлетворительный способ получения матрицы Т из этого уравнения. Он состоит в переходе от матричного уравнения A.49) к его скалярной форме в виде системы уравнений относительно элементов матрицы Т.
§ 2.2. Квадратный корень из матрицы 105 Каждое решение Т уравнения A.49), подставленное в формулу A.48), опреде- определяет решение уравнения A.44). Аналогично находятся решения уравнения A.45). § 2.2. Квадратный корень из матрицы В этом и следующем параграфах будем рассматривать алгебраическое уравне- уравнение Риккати A JXА -+- ЛЛ -\- A JD -\- г — G, \^-*-) где R, А, В и Р — заданные постоянные матрицы порядка п, а 0 — матрица с нулевыми элементами. Сначала рассмотрим наиболее простой частный случай, который представляет и самостоятельный интерес. Речь идет об уравнении вида X2 = Q, B.2) которое получается из уравнения B.1) при Я = Е,А = В = 6иР = —Q. Его решение удобно рассматривать последовательно для следующих частных случаев. 1) Q имеет каноническую жорданову форму Q = {Qi,..., Qq}, где (\i 1 0 ... О \ О Аг 1 ... О Lji — \ihji -\- ±±i — Hi = (° 0 0 Ко 1 0 0 0 0 1 0 0 ... 0\ ... 0 ... 1 0/ 0 0 0 ... 1 V о о о ... \ij При этом все собственные значения А^ матрицы Q отличны от нуля. 2) Матрица Q не имеет канонической жордановой формы, но не является осо- особенной. 3) Q — особенная матрица. 1. Уравнение с жордановой матрицей. В соответствии с общей теорией функций от матриц, справедливо утверждение (см. раздел 1.2). Лемма 2.11. Если F(p) — непрерывно дифференцируемая функция комплекс- комплексного переменного р и F'{pi) ф 0, г = 1,..., q, где pi — собственные значения матрицы А, то при переходе от матрицы А к матрице F(A) элементарные делители не расщепляются, т. е. если А имеет элементарные делители (Р - Pl)Pl ,...,(p — Pq)Pq , B.3) то F{A) имеет элементарные делители Чтобы воспользоваться этой леммой, в качестве матрицы А возьмем искомое решение X уравнения B.2) и положим F(X)=X2. B.5) В соответствии с уравнением B.2), биномы B.4) являются элементарными дели- делителями матрицы Q. Обозначим их через (А - Xi)Pl,..., (А - Xq)Pq. Поэтому при каждом конкретном j для определения pj имеем следующее урав- 1См. гл. 1, теорему 2.5.
106 Гл. 2. Алгебраические и дифференциальные уравнения нение F(pj) = Xj. В силу обозначения B.5) это уравнение принимает вид Pj = Aj. B-6) В комплексной плоскости это уравнение имеет два решения РП = лЛ7> Pj2 = ~лА7- B-7) Придавая параметру j последовательно значения 1,..., q, получим следующую систему 2q возможных элементарных делителей матрицы X: (р - Plly\..., (р - Pql)p\(p - р12)Р1,. ..,(Р- Рч2)р"- B.8) Сначала предположим, что матрица Q в уравнении B.2) состоит из одной клетки Жордана Qj = XjEj + Hj. Имея в виду, что y/~Xj определяется одной из формул B.7), вычислим матрицу л/XjEj + Hj. С этой целью рассмотрим функцию ip(X) = л/А в достаточно малой окрестности точки Л = Aj, не содержащей начало координат, т.е. радиус г этой окрестности удовлетворяет условию г < \Xj\. В этой окрестности двум корням уравнения B.6) соответствуют две ветви функции (р(Х). Возьмем конкретную ветвь, соответствующую, например, перво- первому корню из B.7). На этой ветви рассматриваем однозначную функцию фA1) == л/ЛдДТ^ = л/Л И + -fj, - ^i? + . Ей соответствует аналитическая функция от матрицы Ряд, стоящий справа в формуле B.9), содержит конечное число слагаемых, так как HJ1 = 0 при достаточно большом т. Этой функции соответствует матрица \, - ^\~~2Н] + ... B.10) Поэтому двум корням уравнения B.6), определяемым формулами B.7), соот- соответствуют две матрицы Хд и Xj2, которые вычисляются по формуле B.10). Пример 2.1. Требуется решить уравнение 2 l_2). B.11) В этом случае матрица Q имеет единственное собственное значение Ai = —2 и ему соответствует единственный элементарный делитель (А + 2J. Уравнение B.6) здесь принимает вид р2 = —2. Представляя число —2 в комплексной форме, имеем —2 = 2(costt + г sinvr). ,— i-( -к + 2к-к тг + 2ЬЛ Поэтому V—2 = л/2 I cos hi sin 1, k = 0,1, т.е. имеем два корня р\ = л/2 (cos — + г sin — j = г л/2, р2 = л/2 ( cos -тт + г sin -тт) = —г л/2. Берем матрицу Н = ( ) и находим, что Н2 = в. Поэтому два различных
§ 2.2. Квадратный корень из матрицы 107 значения ряда B.10) имеют вид Следовательно, найдены две матрицы — решения уравнения B.11): .л/2 / _2 1 \ Далее, если неособенная матрица X перестановочна с 1, то матри- V и ~1) цы Х\ — XXiX, X2 = ХХ2Х также являются решениями исходного уравнения B.11). Решая полученное уравнение, находим, что X = ( ), \ U а ) X — \ ' 1) , где а и Ъ — произвольные постоянные, причем а ф 0. V 0 1/а ) Непосредственными вычислениями получаем, что при такой матрице X справед- справедливы равенства Х\ — Xi, X2 = Х2. Это означает, что уравнение B.11) имеет только два решения Х\ и Х2, опре- определяемые по формулам B.12). Предположим теперь, что матрица Q в уравнении B.2) состоит из нескольких клеток Жордана, т.е. будем считать, что Тогда матрица {v^Ai^Ei + Hi,..., ^\qEq + Hq} имеет те же элементарные дели- делители из семейства B.8), что и искомая матрица X (решение уравнения B.2)). Поэтому существует неособенная матрица Т такая, что X = ТуХгЕг + Яь ..., y/\qEq + Hq}T-\ B.13) Так как (л/АJ = А, то (y/\jEj + Hj) = XjEj + Hj и, следовательно, при под- подстановке X в уравнение B.2), где Q имеет вид (*), получим Т{Х1Е1 + #i,..., XqEq + Hq} = {А1Я1 + #i,..., XqEq + Hq}T. B.14) Это соотношение можно рассматривать как уравнение относительно матрицы Т, определяющей искомое решение X по формуле B.13). Задачу такого типа мы уже рассматривали при построении матриц, перестановочных с данной матрицей. Поэтому подробный анализ уравнения B.14) делать не будем. Отметим лишь, /Ai 1 0 \ что в частном случае, когда матрица Q = 0 Ai 0 , матрица Т имеет вид V 0 0 А2 / /а Ъ 0\ Т = 0 а 0 , где а, Ъ и с — произвольные постоянные. \0 0 с) Таким образом, в трехмерной задаче решение B.13) зависит от произвольных постоянных а, Ъ и с. Число независимых постоянных может быть установле-
108 Гл. 2. Алгебраические и дифференциальные уравнения но лишь дополнительным анализом каждого конкретного примера. Кроме того, каждому характеристическому числу Xj соответствует два значения л/Xj. Чис- Число различных решений в этом случае равно шести, причем каждое из них может зависеть от произвольных постоянных, число которых в каждом решении не пре- превышает трех. Поэтому формула B.13) определяет 2q различных решений, каждое из которых, вообще говоря, может зависеть от произвольных постоянных, число которых зависит от структуры матрицы Q. Пример 2.2. Требуется решить уравнение /1 1 0\ X2 = Q, Q = 0 1 0 . B.15) \0 0 1/ В этом случае матрица Q имеет два элементарных делителя (Л — IJ и Л — 1 и может быть записана в форме Q = {Ai^Ei + Hi,X2E2 + Н2}, где Ai = Л2 = 1, '1 0\ тт /0 Г Матрица Г, перестановочная с Q, имеет вид (а Ъ с\ Г = I 0 а 0 , B.16) \0 d e) где а, Ь, с, d и е — произвольные постоянные. В соответствии с формулой B.13), решение строим в виде X = Т{у/\1Е1+Нъ ^\2Е2+Н2}Т~1. B.17) Так как ^/Aj — р — ±1, то формула B.17) определяет четыре решения уравне- уравнения B.15) ^3 = После элементарных вычислений эти решения можно привести к виду X, = X1 ' п л п ' rr~i V- — т I п 1 п I т1-! где матрица Т определяется формулой B.16) и, следовательно, зависит от пяти произвольных постоянных2. Замечание 2.1. Если матрица Q в уравнении B.2) не является особенной и не Как показано в [5, с. 216, 217], независимыми оказываются только два парамет- параметра. Выбором значений этих параметров можно получить четыре независимых решения исходного уравнения.
§ 2.2. Квадратный корень из матрицы 109 приведена к канонической жордановой форме, то задача сводится к предыдущей следующим образом. Пусть Т — неособенная матрица, приводящая Q к канонической жордановой форме, т.е. TQT'1 = {Ai-Ei +ЯЬ... ,\qEq + Hq} = Q. Тогда из уравнения B.2) легко получаем ТХ2Т~г = Q. B.18) Вводя новую переменную Х = ГХГ, B.19) уравнение B.18) приводим к виду X2 = Q, B.20) где правая часть имеет каноническую жорданову форму. Решив его изложенным выше методом, решение исходного уравнения B.2) находим по формуле B.19). 2. Уравнение с особенной матрицей. Пусть в уравнении B.2) матрица Q особенная, т. е. Л = 0 является ее собственным значением. Приведем уравнение к виду, когда его известная матрица принимает каноническую жорданову фор- форму, т. е. поступаем так, как это сделано в предыдущем замечании. Мы можем исходить из того, что уравнение B.2) заменой B.19) приведено к виду B.20). Однако, в рассматриваемом случае жорданова матрица Q имеет вид Q = {XiE + Ни ..., XSES + HS,HS+1,..., Нд}, B.21) где матрица Q1 = {\1E1+H1,...,XSES+HS} B.22) определяется отличными от нуля собственными значениями, а матрица Q° = {Hs+1,...,Hq} B.23) соответствует элементарным делителям APs+1,..., \p<i матрицы Q. Пусть Хо — решение уравнения B.20), в котором Q определяется формулой B.21). Тогда справедливы равенства QXq = Q2, XqQ = Q2, и поэтому можно выписать последовательность равенств QXl = XlQ -> XoQX* = X*X0Q -> X0QX* = QX0Q -> QX0 = X0Q. Из последнего равенства следует, что матрицы TQT~X и ТХоТ~г также пе- перестановочны при любой неособенной матрице Т. Лемма 2.2. Пусть матрицы ТАТ~г = {А\, А2} и ТХТ~г перестановочны, причем А\ и А2 не имеют общих характеристических чисел. Тогда матрица ТХТ~г будет иметь такую же, как и ТАТ~г, квазидиагональную структуру Из этой леммы следует, что решение Хо уравнения B.20) представимо в виде Xq = {Xi,X2}, а задача построения этого решения сводится к решению двух уравнений Х\ = Q\ Xl = Q0, B.24) где Q1 и Q0 определяются формулами B.22) и B.23).
110 Гл. 2. Алгебраические и дифференциальные уравнения Первое из этих уравнений решается указанным выше способом. Следователь- Следовательно, остается решить второе уравнение. Его главная особенность состоит в том, что матрица Q0 имеет единственное собственное значение Л = 0, а ему соответ- соответствует несколько элементарных делителей. Рассмотрим второе уравнение более подробно. С этой целью уточним харак- характеристики клеток Hj матрицы Q0, определяемой формулой B.23). Они опреде- /0 1 0 ... 0\ 0 0 1 ... 0 ляются по формуле Hj = Порядок j-ой клетки обозначим 0 0 0 ... 1 \0 0 0 ... 0/ через Vj и положим /1 = max{vs+i,...,vq}. (*•) Согласно структуре матрицы Q0, имеем (Q°)M = в, и поэтому из второго уравнения B.24) получаем Х2^ = в. Определение 1. Если некоторая степень матрицы X представляет собой ну- нулевую матрицу (у нее все элементы нули), то говорят,что X называется ниль- потентной матрицей, а наименьший из показателей степени г/, при котором Xv = в, называется индексом нильпотентности. Значит, матрица Х2, определяемая вторым уравнением из B.24), является нильпотентной с показателем нильпотентности г/, удовлетворяющим условию 2/i-l<z/^2/i (•••) Матрицу Х2 представим в виде Х2=Г{Я1,...,ЯГ}Г-1, B.25) где Hj имеют порядок Vj. Так как Х% = 0, то vi, • • • ,vr ^ v. B.26) Это следует из того, что Х\ = Т{НЪ ..., НГ}{НЪ ..., tfjT = T{Hl..., Н2г}Т-\ ... ...,Х%= Т{Щ,..., Н^Т'1 = в. Последнее равенство возможно тогда и только тогда, когда Щ — в, j = 1,... ,г. Поскольку Hj имеет порядок Vj, то H,j = в. Это означает, что неравенства B.26) действительно справедливы. Из приведенных рассуждений следует, что рассматриваемое уравнение (второе уравнение из B.24)) будет решено, если найдем матрицу Т, число г —количество клеток в представлении Х2 в форме B.25) и порядок Vj каждой клетки Hj. Для решения этой задачи воспользуемся следующей теоремой, которая явля- является частью теоремы 2.5 из § 1.2 гл. 1). Теорема 2.1. Если матрица Р имеет элементарный делитель (Л — Ло)т и функция F(X) такова, что F'(\o) = ... = ^"^(Ло) = 0, F^k\\0) ф 0, то при переходе от матрицы Р к F{P) элементарный делитель (Л — Ло)т распадает- распадается на элементарные делители (Л - F(Ao))mi,..., (Л - F(Ao))mfc, где величины
§ 2.2. Квадратный корень из матрицы Ш пц = [{тп — 1)/к] + 1,..., rrik = [(m — к)/к] + 1. Здесь [I] — целая часть числа I. Скалярная функция F(X) = Л2, связанная с решением рассматриваемого урав- уравнения, такова, что F'(jS) = 0, F"(jS) ф 0. Поэтому каждый элементарный дели- делитель Лт матрицы X<z при переходе к Р(Х2) = Х| порождает два элементарных делителя Л7711 и А7712, которые являются элементарными делителями матрицы Q0 (см. уравнение B.24)). Но каждому элементарному делителю соответствует своя клетка Жордана. Поэтому в матрице Х2, определяемой формулой B.25), долж- должно быть в два раза меньше клеток, чем в матрице Q0 (см.B.23)), т.е. должно выполняться равенство 2r = q-s. B.27) Отсюда, в частности следует важный Вывод 1. Если матрица Q0 такова, что число q — s нечетно, то второе урав- уравнение из B.24) не имеет решения. Поэтому в дальнейшем предполагается, что условие B.27) выполнено, т.е. что число q — s четно. Подставляя матрицу B.25) во второе уравнение из B.24), получим Т{#2,..., Н?}Т-г = {Н3+1,..., Hq}. B.28) В правой части этого равенства стоит жорданова матрица. Матрица слева не является жордановой. Более того, каждая клетка Я2 не является жордановой. В соответствии с указанной выше теоремой, каждый элементарный делитель Xpj матрицы X при переходе к F(X) = X2 распадается на два делителя А771-?1 и А771-?2, где тпп = [fa - 1)/2] + 1, mj2 = [& - 2)/2] + 1. Поэтому в представлении матрицы Х|, как решения второго уравнения из B.24), можно внести некоторые коррективы, основываясь на соотношении B.28): Х| = T{i?s_|_i,..., Hq} T, где каждая матрица Hj имеет два элементарных делителя А™?1 и А™?2. Отсюда следует, что если матрица Pj приводит Hj к канонической жордановой форме, то будем иметь Hj = Pj{Hj ,Щ jP, где в фигурных скобках стоят клетки Жордана, соответствующие элементарным делителям А7™-?1 и Ат-?2. Имея это в виду, а также равенство B.27), соотношение B.28) записываем в виде H^}p-1T-1 = {Hs+1,...,Hq}, B.29) В фигурных скобках полученного равенства записаны жордановы формы двух матриц с одними и теми же элементарными делителями. Значит, они могут отли- отличаться лишь порядком следования клеток Жордана. Обозначим через S матрицу, которая осуществляет перестановку клеток так, чтобы S-^HP, Н[2\ ..., Н^\ ЯB)}5 = {tfs+i, • • •, Hq]. Тогда B.29) представимо TPS{Hs+lj..., Hq}S~1P-1T-1 = {Hs+1,..., Hq}. Это равенство можно записать в виде (см. B.23)) XQQ° = Q°XQ, где XQ = TP~\ B.30) т. е. в качестве Xq можно брать любую неособенную матрицу, перестановочную
112 Гл. 2. Алгебраические и дифференциальные уравнения с Q0. Из формулы B.30) следует, что Г = XQS~1P~1. Таким образом, в соответствии с формулой B.25), решение второго уравнения из B.24) имеет вид Х2 = XgS-ip-^tfi,..., H^PS^Xq1, B.31) где Р и S находятся в процессе решения, Xq — произвольная матрица, переста- перестановочная с Q°, Hj — клетка Жордана порядка Vj, причем (см. (**), (* * *) и B.26)) i?i,... ,i?r ^ г/, 2/jl — I < v ^ 2/i, \i — индекс нильпотентности матрицы Q0. Приведем способ построения матрицы Р. Пусть Hj — клетка Жордана поряд- ка U а е1 = О О /О 1 О О 1 с матрицей Hj = О \О/ О 0 . Обозначим через Hj оператор О\ О ООО \0 О О 1 о/ в базисе е\,..., ev.. Поэтому Определение 2. Говорят, что векторы ei,... ,еп образуют жорданову цепочку матрицы А, соответствующую собственному значению Ао, если для соответ- соответствующего оператора Л выполняются следующие равенства (Л - Ao?)ei = 0, (Л - Ао?)е2 = ei, ... , (Л - Хо?)еп = en_i, где ? — оператор тождественного преобразования. Следовательно, из формул B.32) вытекает, что ei,..., eVj —жорданова цепочка матрицы Hj. Из B.32) также следует, что оператор Hj, порождающий матрицу Hj, удовлетворяет условию = 0, Ще2 = ЩЩе2 = 0, = eVj-2. /0 0 1 Значит, матрица i?^ в базисе ei,..., eVj. имеет вид f2 _ B.33) 0\ 0 0 0 0 0 0 \0 0 0 1 0 о/ Чтобы привести эту матрицу к канонической жордановой форме, представим оператор ^Н,- в базисе при Vj = 2k и ei, 1/2 = e3, • • •, ^/c = ej-i = e2, ..., = e3, ..., uk = eVj., = 62, B.34) B.35) при ^j = 2fc —
§ 2.2. Квадратный корень из матрицы 113 Тогда, в соответствии с формулами B.34), будем иметь 3 3 3 /л /2 с\ ''7/2 о /2 7TjUk-\-l = U, /LjUk-\-2 — ^/c + l? • • • 5 ttjUy- — Uv-—\. Значит, последовательность i&i, . . .,Uk образует жорданову цепочку матрицы /О 1 0 ... 0V О 0 1 ... О > к строк. О 0 0 ... 1 \0 0 0 ... О/, Аналогично, последовательность Uk+i, ••• ,U2k образует жорданову цепочку для той же матрицы, которую для удобства в этом случае будем обозначать через Н) , т. е. ггA) _ Нз ~ /О 1 О О 0 1 0 0 0 \о о о о\ 1 о 1 о/J к строк Таким образом, в базисе щ,... ,u2k-i оператор V2- определяется квазидиаго- квазидиагональной матрицей 4)Z)}. B.36) (см. B.34)) приводит к тому, Вывод 2. Переход от базиса {ej} к базису - что матрица Н2 преобразуется в матрицу B.36), т.е. Матрица преобразований Pj определяется соотношениями B.34). Записав эти соотношения в виде г=1 г = 1,...,г;7-, B.38) определяем эту матрицу Pj = {pir}. Отсюда, в частности, находим, что при Vj =4: Р4 = /1 0 0 0\ 0 0 10 0 10 0 \0 0 0 1/ Аналогичными рассуждениями можно показать, что при Vj = 2к — 1 матрица Н2 приводится к виду Я2 D Г Г_7ч / ILTv уЛ Т>—1 /О QП^ j — 3\ j '7 J 7 ' {Л.ОУ) Здесь матрицы Щ ' и Щ ' имеют жорданову форму. Первая из них имеет поря- порядок к, а вторая — к — 1. Матрица преобразования Pj находится из соотношений /1 0 0\ B.35), записанных в форме B.38). В частности, Рз = I 0 0 1 = Р3 . \0 1 0/
114 Гл. 2. Алгебраические и дифференциальные уравнения Формулы показывают, что в общем случае матрицу B.25) можно представить в виде X2 = ТР{н[г\ Н[2\ ..., Я^\ Я^Р!1-1, где Р = {Рь ..., Рг}. /О 1 0\ Пример 2.3. Требуется решить уравнение X2 = Q°, Q0 = I О 0 0 . В \0 О О/ этом случае матрица Q0 имеет два элементарных делителя Л2 и Л и соответству- соответствующие им жордановы клетки Hi = ( 1, H<i — @). В соответствии с приведенной выше теоремой, матрица F(X) = X2 имеет два элементарных делителя Л2 и Л. Поэтому X имеет только один элементарный делитель и можно записать /0 1 0\ X = Т{Н}Т-г, Я = 0 0 1 . B.40) \0 0 0/ Для определения матрицы Г получаем X2 = TPzQ{H^x\ /1 0 0 При этом Q = Е, Р3 = 0 0 1 \ Так как по построению матрица TP3Q = Xq должна быть перестановочна с (а Ъ с\ Q0, то, решая уравнение XqQ° = Q°Xq, можно получить Xq =0 а 0 , \0 d e/ 'a'1 a-2{cde~x - b) -a^ce'1^ 0 а 0 1. Матрицу Г можно представить 0 -a~1de~1 e'1 ) в следующем виде Г = XqP^1 . Поэтому решению B.40) можно придать вид /о 1 о\ X = XqP3 1 I 0 0 1 I Рз-^g1- Выполняя необходимые вычисления, оконча- \0 0 0/ /0 а /3\ тельно получим X = 0 0 0 , где а = са — de~x и C = а~1е~1 — \о /з-1 о/ произвольные постоянные. § 2.3. Алгебраическое уравнение Риккати 1. Общий анализ. Примеры. Продолжим анализ алгебраических мат- матричных уравнений Риккати. Начнем с частного случая. С этой целью рассмот- рассмотрим уравнение ZRZ + Z = P, C.1) в котором R — неособенная матрица, а Р — произвольная матрица. Задача состоит в том, чтобы найти все решения этого уравнения. Введем замену переменной U = RZ. C.2)
§ 2.3. Алгебраическое уравнение Риккати 115 Тогда уравнение C.1) можно привести к виду и2 + и = Рг, P1=RP. C.3) Матрицу Pi можно привести к канонической жордановой форме: Р1 = S{X1E1 + Ни ..., XSES + tfJS = SJpS'1. C.4 ) Поэтому, полагая U = SVS~\ C.5) приходим к уравнению V2 + V = Jp. C.6) Это уравнение рассматривавем как частный случай уравнения АОХШ + АгХ171'1 + ... + Аш=в. C.7) Тогда в соответствии с теоремой 1.1 настоящей главы матрица V, определяемая уравнением C.6), должна быть решением скалярного уравнения д(У) = в, C.8) где д(р) = det(^2.E + рЕ — Jp). В соответствии с формулой C.4), получаем что Таким образом, каждому собственному значению А& кратности р^ матрицы Р соответствуют два корня уравнения д(р) = 0 той же кратности -l + Vl + 4Afe -l-Vl + 4Afe Pki = ^ ' рк2 = 2 ' ^ ) Так как ^(А) является аннулирующим многочленом для искомой матрицы У, то он делится без остатка на минимальный многочлен ipv(\) этой матрицы и, следовательно, многочлен д(Х) должен содержать двучлены, соответствующие всем корням pik,P2k, к = 1,..., s, т. е. этот полином должен иметь вид Фу (Р) = (Р- РИГ11 (Р - Pl2)qi2 • • • (Р ~ Pls)qis (Р ~ P2s)q2s , (З.Ю) 1 ^ (lik ^ Рк, 211+021 + ... + qis + Q2s ^ п. C.11) Значит, каждая матрица V, у которой минимальный многочлен представим в виде C.10), где числа д^ь * — 152, /с = l,...,,s, удовлетворяют условию C.11), является аннулирующей для полинома #(А), т.е. g(V) = в. Теперь среди матриц V, обладающих этим свойством, следует выделить те, которые удовлетворяют уравнению C.6). Матрицу V представим в канонической жордановой форме V = Т^риЕ1'1 + Н1>\р21Е2>1 + Н2'1,.. .,Ps2E2>s + Я2'8}?. Подставляя ее в уравнение C.6), получаем Tv{(Ai + (ри)Е1Л + Bpii + ЦН1'1 + (Я1-1J,... ..., (p2s2 + ра2)Е2'8 + Bps2 + 1)Я2'* + (Я2-*J}!;-1 = Jp. C.12) Матрица (р2п + р^Е1'1 + Bpii + 1)Я1Д + (Я1'1J не является жордановой, тем не менее, она имеет единственный элементарный
116 Гл. 2. Алгебраические и дифференциальные уравнения делитель р — (р2г + pn)qi1 = (р — Xi)qi1. Обозначим через 5ц неособенную матрицу порядка qn такую, что = {(Pii + Pn)^1'1 + Я1'1} = {AiE1'1 + Я1'1}. C.13) Последнее равенство в этой цепочке следует из того, что р2г + рц = Ai (см.C.9)). Аналогичное равенство можно получить для второго корня того же уравнения р2 + р = Ai. Равенства типа C.13) можно записать для блочных матриц, соответствующих корням pik уравнения р\+ рк — ^к- Эти равенства будут иметь вид l + Ры)Ек'' + {2РЫ *' k^2 при к = 1,..., s, i = 1, 2. Поэтому равенство C.12) можно представить в виде Ti5{(pf! + pi^E1'1 + Я1'1, (р212 + р12)Ег>2 + Я1'2,... ..., (p2s2 + ps2)E2's + H^S'1^-1 = Jp, C.14) где5={511,...,52Л- Так как из уравнения C.6) следует, что матрицы V2 + V и Jp должны иметь одинаковые элементарные делители с одинаковыми кратностями, то в левой час- части C.14) не могут одновременно присутствовать блоки (р2г + pi^E1'1 + Н1*1 и (^12 + р12)Ег'2 + Я1'2. Оба они соответствуют блоку Ai^E1 + Н1 матрицы Jp и ни при каких неособенных преобразованиях не преобразуются в матрицу, содержащую одновременно эти два блока. Значит в левой части соотношения C.14) может содержаться вектор вида (Pii + Pii)E1:1 + Я1'1, либо вида (р22 + р\2)Ех->2 + Я1'2. При этом в каждом случае должно выполняться равенство (Pifc + Pik)E^k + Я1'* = AiEi + Яь C.15) Аналогичный факт устанавливаем относительно блоков {р\^ -\- рк1)Ек'г +Я/с'1 и (р\2 + Рк2)Ек'2 + Я^'2, к = 1,..., s, т. е. должны выполняться равенства (pii + ры)Я*'* + Я*'* = AfeJBfc + Я*. C.15л,) Следовательно, уравнение C.14) распадается на 2s различных уравнений. Возь- Возьмем одно из них. Пусть это будет уравнение ЗД(р?1 + Pi^E1 + Я1, ..., (p2sl + \ - psl)Es + H^S^T-1 = Jp. Учитывая равенства C.15к), к = 1,..., s, отсюда получаем уравнение fiJp = Jpfb C.16) где Xi = Ti5. Общее решение этого уравнения находим по известной методике (см. § 2.1, п. 2). Таким образом, общее решение уравнения C.16) представляет собой многопа- многопараметрическое семейство неособенных матриц, перестановочных с Jp. Каждому такому семейству матриц Т\ соответствует семейство матриц Ti, определяемых формулой Т\ = T\S~X. Этому классу матриц Ti, в свою очередь, соответствует целый класс решений Vi = TiipuE1'1 + Я1'1, ..., psiEs^ + Я^^Г.
2.3. Алгебраическое уравнение Риккати 117 Аналогично находятся остальные из 2s классов решений уравнений C.5). Во- Вопрос о точном числе решений пока обсуждать не будем, а рассмотрим простейшие примеры. Пример 3.1. Требуется найти все решения уравнения /1 1 0\ Х2+Х = J, J= 0 1 0. C.17) \0 0 0/ Матрица J имеет каноническую жорданову форму с двумя клетками Жордана, соответствующими элементарным делителям (Л — IJ и Л. Применяем теорему 1.1 из § 2.1, в которой рассматривается уравнение A.44) (в этом параграфе оно записано под номером C.7)). Тогда, согласно этой теореме, будем иметь т = 2, А$ = А\ + Е, А2 = — J, a р2+р-1 -1 0 д(р) = 0 р2 +р-1 0 0 0 р2 +, Полином #(р) можно представить в виде д(р) = (р- риJ(р - Pi2Jp(p + 1), C.18) где л/5 -1 - л/5 ^ Он является аннулирующим для любого решения уравнения C.17). Поэтому ми- минимальным многочленом решения может быть любой набор сомножителей из правой части формулы C.18), лишь бы общая степень не превосходила трех (по- (порядка матрицы X). Следовательно, возможны следующие варианты ф\{р) = р, Ф2(р) = р(р + 1), • • • , Фк(р) = (р ~ РиJР- Однако, из всего набора матриц X с этими минимальными многочленами нас интересует лишь та их часть, которая состоит из решений уравнения C.17). Значит, элементарными делителями матрицы X могут быть лишь: 1) р, (р—рцJ; 2) р, (р - Р12J; 3) р + 1, (р - Поэтому полагаем ; 4) р + 1, (р - р12J где а = 0 или а = —1, а Е2 = в уравнение C.17), будем иметь ?i{p?i + Ри)Е2 или Х2(а) = ), Н2 = ( Я2, ajT'1, C.20) Подставляя эти матрицы 1)Н2 ^1 = J C.210 или + Р12)Е2 + B^2 + 1)Я2 + Я|, а2}^-1 = J. C.212) Сначала рассмотрим случай, когда a = 0. Так как i?! — нулевая матрица, а согласно формулам C.19), справедливы равенства p\i + рц = 1, г = 1,2, то (Ai + Рн)Е2 + Bри + 1)Я2 + Щ
118 Гл. 2. Алгебраические и дифференциальные уравнения Находим преобразование Si такое, что чо 1 ;^~ vo \)- Одно из решений этого уравнения имеет вид Тогда уравнения C.21i) и C.212) можно записать в виде + Я2,0}{5f1, ljTf1 = J, {,}{ + H2H}{S2-1, ОД = J. Полагая fi = Ti{Si,l}, г = 1,2, C.24) приходим к уравнениям TiJ = JTi, г = 1,2, из которых получаем (оц /3i 0\ Г»= 0 «г 0 , г = 1,2, C.25) \0 0 7г/ где ai, /3i и л — произвольные постоянные. По формулам C.24) находим, что Г; = f^S,!}, 771 = {^г,!}^. Тогда, в соответствии с формулами C.20), получаем семейство решений, соответствую- соответствующих значению а = 0 Xi = Т^рцЕ2 + Я2, OjTf1, г = 1, 2. Выполняя необходимые вычисления с учетом формул C.23) и C. 25), находим прежде всего два решения (т. е. все произвольные постоянные в процессе этих преобразований исчезают) fPli BPU + 1)-1 0\ Xi= 0 рц 0 , г = 1,2, C.26) V 0 0 0/ где числа ^i^ определяются по формулам C.19). Если в формулах C.20) положить а = -1, аналогичными рассуждениями по- получим решения (обозначим их через Х% и Х^) (pxj B/oij + l) 0 \ X2+j= 0 рхз 0 , i = 1,2. C.27) V 0 0 -1/ Таким образом, уравнение C.17) имеет всего четыре решения C.26) и C.27). Пример 3.2. Требуется найти все решения уравнения X2 + ]-ЕХ + ]-ХЕ + Р = 6>, C.28) / 1 ?л где 6> — нулевая матрица, Е — единичная матрица, а матрица Р = ( Сначала находим собственные значения матрицы Р, решая уравнение А + 1 6 -1 Л-4 В итоге получаем Ai = 1, Л2 = 2. Поэтому жордановой формой матрицы Р
§ 2.3. Алгебраическое уравнение Риккати 119 является J = I J. Теперь находим матрицу Г, приводящую Р к жордановой форме. С этой целью составляем уравнение ТРТ~г = J, которое записываем в виде ТР = JT. Его решение можно найти, выписывая соответствующую систему уравнений относительно элементов матрицы Т. Эта система состоит из четырех однородных уравнений. Возьмем одно из ее решений, это решение запишем в виде матрицы '1 2\ _ , / 3 -2N Вводя обозначение Y = ТХТ г и учитывая, что ТРТ 1 = J, исходное урав- уравнение можно представить в виде Y2 + Y + J = 0 C.280 Это уравнение можно решать, выписывая соответствующую систему алгебра- алгебраических уравнений относительно элементов матрицы Y. Элементарными вычислениями находим, что она представима в следующем виде: Y = ( ), и для определения ?/i, г/2 имеем уравнения у\ + у\ + 1 = О, V (J г/о ) 2/2+2/2 + 2 = 0. Следовательно, -1 + гл/З -1-гл/З 2/п = , 2/12 = , — 1 + гл/7 —1 — гл/7 2/21 = " , 2/22 = " • В итоге получаем четыре матрицы Y^ — ( ^ ), г, к = 1, 2. V ° 2/2/с/ Возвращаясь к исходной переменной X, получаем четыре решения Xifc = ( П* , ^ о,Ь. , о,2/С. )» г, А: = 1,2. C.29) Ясно, что вместе с Х^ решением уравнения C.28) является матрица vik = cxikc-\ (з.зо) где С — произвольная перестановочная с Р матрица. Для определения всех матриц С такого типа решаем уравнение PC = СР. Запишем это уравнение в виде системы скалярных уравнений относительно эле- элементов матрицы С: ' С12 + 6С21 = 0, бСц — 5ci2 — 6С22 = 0, СЦ + 5С21 - С22 = 0, , С12 + 6С21 = 0. Ее общим решением является сц = d — 5с, ci2 = —6с, С21 = с, С22 = d. Таким образом, находим, что 'd — 5с —6с\ ^_i I f d 6с с dj' ^ -(d-2c)(d-3c) 1-е d- и все решения уравнения C.28) определяются формулами C.30), в которых Х^
120 Гл. 2. Алгебраические и дифференциальные уравнения находятся из C.29), а С и С~г — из C.31). Они представляют собой четыре двупараметрических семейства решений, которые не зависят друг от друга. 2. Уравнение вида Y2 + AY + YB + Р = в. Будем рассматривать урав- уравнение Y2 + AY + YB + Р = 0, C.32) в котором А, В и Р — произвольные вещественные матрицы одного и того же порядка п. Если А = В, то это уравнение можно переписать в виде (У + АJ -\- Р — А2 — Q. Вводя замену Z — Y + A, Ро = А2 — Р, уравнение C.32) приводим к виду Z2 = Ро, которое уже рассмотрено в предыдущем параграфе. Поэтому в дальнейшем предполагается, что А = В + С, где С ф 0. C.33) В этом случае уравнение C.32) можно представить в виде (Y + ВJ + CY + Р - В2 = 0. Вводя обозначения Z = Y + Б, Q = B2 + CB-P, C.34) из C.33) получаем уравнение Z2 + CZ = Q. C.35) Случай, когда С — Е, рассмотрен в предыдущем пункте. Если Q = О, то уравнение C.35) можно представить в виде (Z + C)Z = 0. C.36) Оно имеет два очевидных решения Zi = 6>, z2 = -a C.37) Вместе с Z2 решением уравнения C.36) является матрица Z3 = TZ2T-\ C.38) где Т — произвольная перестановочная с С матрица. Кроме того, уравнение C.36) можно рассматривать как условие ортогональ- ортогональности матриц Z и Z + С и, исходя из этого, искать его решение. Подробнее об этом см. примеры 1.3 и 3.3. Пример 3.3. Если С = , то уравнение C.36) имеет решение \-c-a -с-а.) (а а\ Z — \ , получаемое из условия ортогональности. \ol a J Таким образом, уравнение C.36), рассматриваемое как условие ортогональ- ортогональности матриц Z и Z + С может определить решение Z^. Оно, в свою очередь, определяет семейство решений Z§ = TZ^T~1J где Т — произвольная перестано- перестановочная с С матрица. Проанализировав таким образом различные частные случаи, будем предпола- предполагать в дальнейшем, что матрицы С и Q в уравнении C.35) произвольны. Пусть Л — комплексный параметр и вместе с уравнением C.35) рассмотрим
§ 2.3. Алгебраическое уравнение Риккати 121 функцию F(X) = Л2 + СХ - Q, C.39) которая представляет собой полином второй степени с матричными коэффициен- коэффициентами. Так как С и Q — матрицы n-го порядка, то определитель д(Х) = det F(X) = \EX2 + CX-Q\ C.40) имеет степень, равную 2п. Как было показано выше (см. теорему 1.1 из §2.1), каждое решение уравнения C.35) является решением уравнения g(Z) = в. C.41) Так как полином C.40) является скалярным, то решениями уравнения C.41) являются матрицы, для которых он является аннулирующим. Построим эти матрицы. Пусть Ai,..., А& — различные корни уравнения д(Х) = 0. C.42) Тогда можно записать д(Х) = (А - Xi)Pl ... (А - Xk)Pk, pi + ... + Рк = 2п. Так как искомая матрица Z удовлетворяет уравнению C.35), то полином д(Х) является аннулирующим для Z. Поэтому он должен без остатка делиться на минимальный многочлен (pz(X) матрицы Z. Порядок матрицы Z равен п, а число различных корней характеристического уравнения det(XE — Z) = 0 не больше п, т.е. может быть меньше числа корней уравнения C.42). Следовательно, (pz(X) представим в виде (pz(X) = (А — Xjx)q^ ... (А — Xjp)Qjp, Я.з\ + • • • + Qjp ^ п, гДе <\п>..., Ajp — любые корни уравнения C.42). Значит, элементарные делители искомой матрицы Z имеют вид (Х—Х^I^ ,..., (A—A^)z^ , где i1,i2,...,iu = 1, 2,..., к, lix ^Рп,...,ки ^ Piv, кх + • • • + kv = п. Отсюда находим, что искомым решением является матрица вида Z = T{XhEhi + Hhi,..., \ivEhy + Hliv }Т~\ C.43) где Т — произвольная неособенная матрица. Эта формула показывает, что мно- множество решений уравнения g(Z) = в с заданным порядком матрицы Z распада- распадается на конечное число классов, схожих между собой матриц. Пример 3.4. Пусть д(Х) = (А - гJ(А + 3J(А + гJ. Следовательно, уравнение д(Х) = 0 имеет корни Ai = г, А2 = —г, Аз = -3. Все они имеют кратность, равную двум. Требуется найти все решения уравнения g(Z) = в, где Z — матрица третьего порядка. Возможны следующие случаи распределения элементарных делителей искомой матрицы: 1) А - г, А + г, А + 3; 2) (А - гJ, А + г; 3) (А - гJ, А + 3; 4) А - г, (А + гJ; 5) А - г, (А + ЗJ; 6) (А + гJ, А + 3; 7) А + г, (А + ЗJ. Каждому из этих случаев соответствует свое множество решений искомого уравнения. В частности, в первом случае такими решениями являются матрицы /г 0 0 \ Z\ — Т 0 —г 0 Т, где Т — произвольная неособенная матрица. Ана- \0 0 -3/ логично, из C.43) определяются решения во всех остальных случаях. Каждое из них представляет собой многопараметрическое семейство подобных матриц.
122 Гл. 2. Алгебраические и дифференциальные уравнения Имея этот результат, вернемся к уравнению C.35). По доказанному, его реше- решение является также решением скалярного уравнения C.41), все классы решений которого определяются формулой C.43). Поэтому теперь задача состоит в том, чтобы из решений C.43) уравнения C.41) выбирать решения уравнения C.35). Делается это следующим образом. Сначала из всех матриц C.43) выбираем одно семейство, определяемое конкретной жордановой формой (т. е. определен- определенным набором элементарных делителей). Матрицу Т пока считаем произвольной. Пусть Z = TDiT~1. Подставляем ее в уравнение C.35). В итоге получаем ли- линейное матричное уравнение относительно матрицы Г: TD2 + CTDi = QT. Для его решения нужно выписать соответствующую систему скалярных уравнений относительно элементов tjk матрицы Г. В итоге получим систему п2 уравнений. Эта система может иметь ненулевое решение, а может и не иметь. Если такое решение существует, то оно не единственно, а зависит от одного или нескольких параметров. Обозначив такое решение через Т/, получаем соответствующую ему матрицу Z\ — TiDiT^1, которая является первым построенным многопарамет- многопараметрическим семейством решений уравнения C.35). Повторяя эту процедуру вновь для следующего набора элементарных дели- делителей в матрице C.43), будем получать все новые и новые семейства решений уравнения C.35). Пример 3.5. Пусть уравнение C.35) имеет вид F(Z) = Z2 + CZ-Q = 0, C.44) где /6 0 0\ /-9 О О G=001, Q= 0 -1-1 \1 0 0/ V 0 0 - Тогда скалярное уравнение C.41) принимает вид д(р) = det F(p) = 0, т.е. о2 + 6/о + 9 0 0 det F(p) = 0 р2 + 1 р + 1 р 0 р2 +1 В предыдущем примере найдены все решения уравнения g(Z) = в. Ими явля- являются матрицы Zi,..., Z7, зависящие от произвольных неособенных матриц Т. Из этих решений нужно выбрать те, которые удовлетворяют уравнению F(Z) = в. Берем матрицу Z\ из этой системы и подставляем ее в уравнение C.44). Ум- Умножая полученный результат справа на Т, приходим к уравнению Г = 0. C.45) Обозначая через tj^ элементы матрицы Г, отсюда получаем систему из 9 урав- уравнений относительно неизвестных tjk- Здесь вряд ли следует приводить процеду- процедуру решения этой системы. Более того, нам не потребуется результат решения. Однако принципиальные выводы следует сделать. Если эта система имеет нетривиальное решение, то оно определяет матрицу Г/, которой соответствует решение Z\\ — T\Z\T7X уравнения C.44). Если уравнение
§ 2.3. Алгебраическое уравнение Риккати 123 C.45) имеет только нулевое решение, то матрице Z\ не соответствует ни одного решения уравнения C.44). Аналогично анализируем все последующие матрицы Пример 3.6. С помощью излагаемой теории проанализируем пример, который был решен выше иным способом. Рассмотрим уравнение (а2 1 0\ Z2= \ 0 а2 0 , а2 фЬ2. C.46) \0 О Ь2) В этом случае д(р) = (р2 - а2J(р2 - Ь2). Так как матрица Z — решение уравнения C.46) — имеет порядок три, то она должна принадлежать одной из групп подобных матриц с элементарными делителями: 1) р — а, р + а, р — Ь; 2) р — а, р + а, р + Ь; 3) р — а, р — Ь, р + Ь; 4) р-\-а,р — b,р-\-Ь] 5) (р — а),р — Ь] 6) (р-\-а) ,р — Ь] 7) (р — а) ,р-\-Ь] 8) (р-\-а) ,р-\-Ь. В эти группы включены все возможные элементарные делители матриц треть- третьего порядка, для которых полином д{р) является аннулирующим. Правило этой группировки состоит в том, что а) в каждой группе общая степень элементарных делителей должна быть равна трем, т.е. порядку искомого решения уравнения C.46); б) каждый элементарный делитель должен быть делителем полинома д(р). Обозначим через Qi жорданову матрицу с элементарными делителями из г-й группы. Выпишем некоторые из них. 1 а О Тогда все решения уравнения C.46) можно представить в виде Г7 ГГЛ f~\ ГГЛ 1 /Q Л >~7\ Zj = ijQjlj . C.47) Здесь индекс j может принимать все значения от 1 до 8, хотя при некоторых j матрица C.47) может и не быть определенной. Последнее может случиться тог- тогда, когда система уравнений относительно элементов матрицы Tj имеет только нулевое решение. Матрица Tj определяется из уравнения (а2 1 0\ TjQ2 = 0 а2 ОТ C.48) \0 О Ь2) которое получается подстановкой матрицы C.47) в уравнение C.46). Для ре- решения этого уравнения следует перейти к соответствующей системе уравнений относительно элементов tJik матрицы Tj. Уравнение C.48) имеет только тривиальное решение Tj = в при j = 2,3,4. В этих случаях формула C.47) не определяет решения исходного уравнения, в чем можно убедиться непосредственными вычислениями [Q2, = Q2 = Q2)- Иная ситуация складывается при j = 1,5. При таких значениях j уравнение C.48) имеет нетривиальное решение. Подробно рассмотрим случай, когда j = 5. Соответствующая матрица Z$ а = 0 \о 0 —а 0 0 0 Ь -а 0 0 1 —а 0 0 0 -Ь
124 Гл. 2. Алгебраические и дифференциальные уравнения определяется формулой (а 1 0\ Z5=T5 0 а 0 Ts C.49) \ / и уравнение C.48) в этом случае принимает вид /а2 2а 0 \ /а2 1 0\ Г5 0 а2 0 = 0 а2 0 Т5. \0 0 Ъ2) \0 О Ъ2) Соответствующая система уравнений относительно элементов ?^/с матрицы Т$ имеет ненулевое решение и матрица Г5 определяется формулой /а C 0^ Г5 = 0 2аа 0 \0 0 где а, /3 и 7 — произвольные постоянные. Следовательно, по формуле C.49) получаем первое семейство решений /а C 0\ (а 1 0\ /а'1 -РBаа2)~1 Z5 = 0 2аа 0 0 а 0 0 Bаа) \0 0 7/ \9 9 6/ V 0 0 Аналогично анализируются остальные случаи. В заключение рассмотрим наиболее трудный для теории случай, когда р = 0 является собственным значением матрицы Q из уравнения C.35). Пример 3.7. Требуется решить уравнение /0 1 0\ Z2 = 0 0 0 . C.50) \0 0 0/ Сначала выписываем соответствующий полином ^(/?): '0 1 = det р2Е - 0 0 0 0 Следовательно, искомая матрица Z может иметь элементарные делители од- одного из следующих трех типов: 1) р2, р; 2) р3; 3) р, р, р. Значит, решения нужно искать среди матриц /0 1 0\ /0 1 0\ Z1=T1[0 0 0 Tf1, Z2 = Г2 0 0 1 Гз. C.51) \о оо/ \° о о/ В случае простых элементарных делителей соответствующая матрица Z3 явля- является нулевой и ее, очевидно, рассматривать не следует. Далее анализируем каждый случай отдельно. Матрица Z\ является решением уравнения C.50), если матрица Т\ будет не- /0 1 0\ /0 1 0\ /0 1 0\ особым решением уравнения гЛо 0 00 0 0-0 0 0\Т1=в. \0 0 0/ \° 0 0/ \° 0 0/ Однако, это уравнение имеет лишь особые решения (каждая из матриц Xi, опре-
§ 2.3. Алгебраическое уравнение Риккати 125 деляемая этим уравнением, необратима). Тем же способом анализируем второй случай. Матрица Z2 будет решением уравнения C.50), если уравнение /0 1 0\ /0 1 0\ /0 1 0\ Г2 0 0 10 0 1 = 0 0 0 Г2 \о о о/ \о о о/ \° о о/ имеет не особые решения. Оказывается, что такие решения есть и они об- образуют многопараметрическое семейство, которое можно представить в виде /а /3 7\ Тг = I 0 0 а , где а, /3, 7, <5 и е — произвольные постоянные, причем а ф 0 и 8 ф {). Подставляя найденное Т<2 в матрицу Z<2 (см.C.51)), находим, что урав- /0 а Ь\ нение C.50) имеет двупараметрическое семейство решений Z^ = 0 0 0 , \о ъ-1 о/ где а и 6 — произвольные постоянные. 3. Связь уравнений Риккати с линейными уравнениями. Пусть А, В, Q и R — постоянные матрицы порядка п, определяющие уравнение Риккати Q + АХ + ХВ + XRX = 0. C.52) Для решения этого уравнения составим систему матричных уравнений Г (АЯ - В)х -Rp = 0, \У J C.53) [ Qx + (АЯ + А) 6> v ; Чтобы упростить дальнейший анализ задачи, сначала предположим, что все собственные значения матрицы "'{-Q -а) <3-54» являются простыми. Обозначим их через Ai,..., \2П и пусть (з-55) — собственные векторы матрицы М, соответствующие собственным значениям Ai,..., А2п, т. е. для к = 1,..., 2п ( ХкЕхк = Вхк + Rpk, < (о.оо) [ \кЕрк = -Q A Из векторов Ж1,...,Ж2п и Pi, • • • ,Р2п составим n-мерные матрицы Xv и Ри, различающихся набором вектор-столбцов (но не их порядком). Это означает, что
126 Гл. 2. Алгебраические и дифференциальные уравнения Xi и Xj различны лишь в том случае, когда в Х{ есть хотя бы один столбец, которого нет в Xj. Аналогично различаются Р{ и Pj. Кроме того, матрицы Xj и Pj (с одинако- одинаковым номером) имеют г-е столбцы (тоже с одинаковым номером), соответствую- соответствующие одному и тому же собственному вектору Zji = {xji,Pji}. Количество пар таких матриц (Хи,Ри) равно п2. Каждой паре этих матриц можно поставить в соответствие матрицу Ки, определяемую формулой Ри = КиХи. C.57) Теорема 3.1. Пусть все собственные значения матрицы М, определяемой формулой C.54), являются попарно различными, а полная система ее собствен- собственных векторов определяется формулами C.55). Тогда каждая матрица Kj, определяемая формулой C.57), является решением уравнения Риккати C.52), а, следовательно, это уравнение имеет не менее п2 независимых решений. Доказательство. Если г-е столбцы pui и xVi матриц Ри и Хи соответствуют k-му собственному значению матрицы C.54), то для г = 1,... , п можно записать \кр„г = XkKuxui и, в соответствии с соотношениями C.56), будем иметь равен- равенства — [Q + AKu]xui = Ки[В + RKu]xui, г = 1,..., n; v — 1,..., п2. Полученный результат можно записать в виде [Q + АКи + КиВ + KURKU]XU = 0, v = 1,... ,п2. C.58) Матрица, стоящая в квадратных скобках в полученном равенстве, при конкрет- конкретном v представляет собой значение левой части уравнения Риккати на матрице Kv. Поэтому здесь логически возможны два случая. 1) Матрица Kv является решением уравнения Риккати. 2) Матрица Su, определяемая формулой Q + АКи + КиВ + KVRKV — Su, ортогональна матрице Хи. В первом случае анализ задачи завершается. Во втором случае по известной матрице Хи можно построить все ортогональные ей матрицы Su. Если столбцы матрицы Хи образуют базис в n-ном евклидовом пространстве, то из г/-го со- соотношения системы C.58) следует, что Su = 0 и, следовательно,^ — решение уравнения Риккати. В противном случае Ки не является решением уравнения Риккати. Таким образом, получаем следующий вывод. Пусть Ai,...,A2n — простые собственные значения матрицы C.54), опреде- определяемой уравнением Риккати C.52), а соответствующие им собственные векторы определяются формулами C.55). Тогда среди матриц Ки, определяемых форму- формулами C.57), находятся решения уравнения Риккати C.52). Приведенная осторожная формулировка полученного вывода означает, что: 1) не все матрицы Ки могут оказаться решениями уравнения Риккати; 2) возможны решения уравнения Риккати, которые не попали в указанное семейство. Поэтому для завершения доказательства теоремы нужно показать, что при каждом j матрица Xj неособенная. Для этого достаточно установить, что столб-
§ 2.3. Алгебраическое уравнение Риккати 127 цы матрицы Xj линейно независимы. Допустим противное, что существует матрица Xj, полученная указанным вы- выше способом, столбцы которой линейно зависимы. Тогда существуют постоянные «1,... ,ап такие, что столбцы Xjk удовлетворяют условию a\Xj\ + .. .+anXjn = 0. Тогда в силу соотношений C.57) будем иметь Qt'\_P'i'\_ ~\ • • • ~\ OtfiPin — OL\J\. пXо]_ ~\~ . . . ~\~ Ск.ryi J\ пXпryi — = Kj(a1Xj1 + ... + anxjn) = 0. [хл\ [х- \ Отсюда следует, что а\ 3 +.. .+ап Jn = 0, а это невозможно, поскольку \PjiJ \PjnJ собственные векторы Zj\ — {xji,pji}, ... ,Zjn = {xjn,pjn} матрицы М линейно независимы. Пример 3.8. Применим доказанную теорему к решению следующего уравне- уравнения (см. пример 3.2) X2 + X + Q = 6,Q=( ). Матрица М, определяемая формулой C.54), в этом случае имеет вид М = ( / L. H /oNn и ее харак- теристическое уравнение det(A.E — М) = 0, как легко подсчитать, имеет корни х л/3. . л/3. х л/7. х л/7. Соответствующие этим собственным значениям матрицы М собственные век- векторы можно определить формулами Zl = {1,0, к, 0}, z2 = {1,0, к, 0}, z3 = {0,1,0,1}, zA = {0,1,0, Г}, fc = -- + Ab fe = -- + A2j ^ = ~2+Лз, Г=-- + А4. Векторы zn являются четырехмерными и каждый из них может быть пред- представлен парой двумерных векторов в виде zn = {xn,pn}, где, например, вектор х1 = {1,0}, а вектор р\ — {&,0}. Из векторов жп, п = 1,2,3,4 сформируем дву- двумерные матрицы Хптп = (жп,жт), различающиеся столбцами, но не их порядком. В частности, Х12 = ( п ), -X"i3 = ( ) • Таких матриц будет шесть. Из них лишь четыре являются неособенными. Это Х13, X14, -^23, -^24• По тому же правилу построим матрицы Рпш. Их также будет шесть. Искомое решение уравнения Риккати ищем в виде Рпш = КпшХпш. Выпол- Выполняя необходимые вычисления, находим, что лишь четыре из этих шести уравне- уравнений имеют решения и эти решения совпадают с соответствующими решениями (см. решения уравнения C.287)), полученными иным способом. Из доказанной теоремы можно получить некоторую дополнительную информа- информацию о свойствах решений уравнения Риккати в рассматриваемом случае простых корней характеристического уравнения матрицы М. Согласно теореме, уравнение Риккати C.32) всегда имеет п2 независимых ре- решений. Однако, она не отрицает того, что возможно еще хотя бы одно такое же решение. Поэтому вопрос о полном числе линейно независимых решений требует дополнительного исследования.
128 Гл. 2. Алгебраические и дифференциальные уравнения Анализ случая кратных собственных значений матрицы М начнем с решения примера. Пример 3.9. Рассмотрим уравнение X2 + X + Q = 6>, C.59) где /-2 0 0 \ C.60) Чтобы в дальнейших построениях фигурировали все матрицы А, В, Q и R из уравнения C.52), уравнение C.59) записываем в виде X2 + ]-ЕХ + ]-ХЕ + Q = 0, C.61) т. е. в рассматриваемом случае А — В — A/2)Е, R = Е, где Е — трехмерная единичная матрица, а матрица Q определяется формулой C.60). Согласно предложенной методике, сначала составляем матрицу C.54). Она имеет вид М = ( 1 , , , . Характеристическое уравнение этой мат- V / рицы приводится к виду (Л2 - 1/4K - 10 (А2 - A/4)J + 28 (Л2 - A/4)) - 24 = 0. Это уравнение имеет корни Ai52 = 3/2, A3,4 = —3/2, А5 = 5/2, Аб = —5/2. Дальнейшее решение задачи проще получается, если в качестве базисных век- векторов шестимерного пространства брать собственные и присоединенные векторы. Для получения такого базиса сначала решаем уравнение Mz = C/2J, определяю- определяющее собственный вектор матрицы М, соответствующий собственному значению Ai,2 = 3/2. Берем частное решение z1 = {0,1,0,0,1,0}. Затем находим при- присоединенный вектор, решая уравнение Mz = z1 + C/2J. В итоге получаем z2 = {-3,0,0,-3,1,0}. Следующий базисный вектор находим из уравнения Mz = —C/2J. Отсюда получаем решение z3 = {0,1, 0, 0, -2, 0}, а из уравнения Mz = х3 - C/2J имеем 24 = {3,1,0,-6,-1,0}. Из уравнений Mz = E/2J и Mz = —E/2J также получаем два следующих вектора z5 = {0,0,1,0,0,1} и z6 = {0,0,1,0,0, -3}. Найденные базисные векторы будем представлять в виде zl = {хг,рг}, для i = 1,...,б, где х1 и рг — трехмерные векторы. В частности, будем иметь х1 = {0,1,0}, р1 = {0,1,0}, х2 = {-3,0,0}, р2 = {-3,1,0}. Решения уравнения Риккати C.61) определяют матрицу К = {kij}, для кото- которой справедливы равенства pi = Кх\ Полагая в этом соотношении г = 1, получаем уравнение [ 1 ) = К [ 1 ) , из КОТОРОГО НаХОДИМ, ЧТО fci2 = 0, &22 = 1, &32 = 0.
2.3. Алгебраическое уравнение Риккати 129 Полагая г = 2, приходим к уравнению 1 = К V о ЧТО кц = 1, &21 = -1/3, &31 = 0. Аналогично при i = 5 следует, что kis = &23 = получаем матрицу 1 0 0 К125 = -1/3 10 V 0 0 2 \ 0 . Отсюда получаем, о &зз = 2. Таким образом, C.63) Здесь индексы 1, 2, 5 у матрицы К указывают номера тех векторов zl', с помощью которых эта матрица была определена. Тем же приемом можно построить матрицы 1 0 0 \ /-2 0 0\ /-2 0 0 К126 = ( -1/3 10, КМ5 =1/3 -2 0 , КМ6 =1/3-2 0 0 0 -3/ \ 0 0 2/ V 0 0 -3 Остальные сочетания векторов, из которых следовало бы определять матри- матрицы Kiji, приводят к противоречивым уравнениям относительно элементов этих матриц и, следовательно, не определяют матриц K^i и поэтому не определяют решения уравнения Риккати. Каждому из полученных четырех решений попытаемся поставить в соответ- соответствие многопараметрическое семейство решений. С этой целью определяем все матрицы Т, перестановочные с матрицей Q из уравнения Риккати. Они опреде- /-2 0 0 \ ляются уравнением QT = TQ, где Q = 1 -2 0 . Выписывая систему V 0 0 -6/ уравнений относительно элементов tij матрицы Т, получим, что tij = 0 при i ф j а 0 0  = Щ, т.е. Г = 0  0 0 с а 0 , Г = -6 0 0 с/ \ 0 0 с Отсюда следует, что из равенства Т~гРТ = Р вытекает справедливость ра- равенства T~1KijiT = Kiji. Поэтому таким путем мы находим лишь указанные выше четыре решения уравнения Риккати. Пример 3.10. Рассмотрим уравнение X /-2 1 О О \ 0-200 0 0-31 V 0 0 0 -3/ C.64) Перепишем это уравнение в виде X2 + A/2)ЕХ + A/2)ХЕ + Q = в и составим матрицу C.54) М = ( 1 , , , . Ее характеристический определи- тель det(AE - М) можно вычислить, разлагая его по элементам первой строки.
130 Гл. 2. Алгебраические и дифференциальные уравнения Выполняя det(XE - необходимые М) = (А2 - а2 операции ) А — а 0 0 -2 0 0 , получим С А- С С - а -3 С о - z X- 0 0 -2 0 0 0 0 0 1 -3 а а л / 0 -1 0 0 0 0 \ — а 0 0 -3 0 а X 0 0 \ — а 0 1 -3 0 -1 0 0 + 0 ) 2 -1 0 0 V + 0 0 0 0 -1 0 0 А + а ( ( а ( - 3 -1 3 3 А + а ( 3 0 0 -1 0 0 А + а где а = 1/2. Повторяя те же операции относительно каждого определителя в правой части равенства, получим det(A.E — М) = (Л2 — а2 — 2J(Л2 — а2 — ЗJ. Следовательно, характеристическое уравнение det(A.E — М) = 0 имеет четыре корня Ai52 = ±3/2, Аз,4 = ±л/ТЗ/2, каждый из которых имеет вторую кратность. Теперь находим собственные векторы матрицы М, решая уравнение (ХкЕ - M)z = 0 C.65) при каждом к, к = 1, 2, 3,4. Представляя вектор z в форме z = {х,р}, где х и р четырехмерные векторы х = {ж1,Ж2,жз,Ж4} ир= {pi,P2,P3,P4J, уравнение C.65) можно записать в виде следующей системы уравнений (Afc - a)Xj - Pj =0, j = 1, 2,3,4, C.66fc) -2xi + x2 + (Afc + a)Pl = 0, -2ж2 + (Afc + a)p2 = 0, C.67*0 -Зжз + ж4 + (A* + a)p3 = 0, -Зж4 + (Xk + <ф4 = 0 C.68&) при каждом конкретном к,к — 1,2,3,4. Полагаем в этой системе к — 1 и, следовательно, имеем А& = 3/2. Тогда получим вектор z1 = {ж1,/?1}, где х1 = rr(Ai) = {1,0,0,0}, р1 = p(Ai) = {Ai - а, 0,0,0}, C,69i) a Ai = 3/2, a = 1/2. Аналогичный результат получаем при к = 2: z1 = {ж2,р2}, где х2 = х(А2) = {1,0,0,0}, р2 = р(Х2) = {А2 - а, 0,0,0}, C.692) а А2 = -3/2. Если в системе уравнений (З.бб/с)-C.б8/с) положить к = 3, то теми же вы- вычислениями получим вектор z3 = {x3,p3}, в котором Ж3 = Ж(Аз) = {0,0,1,0}, р3=р(А3) = {0,0,А3-а,0}, C.693) где Аз = л/ТЗ/2. Аналогично при к = 4 будем иметь z4 = {ж4,р4}, ж4 = ж(А4) = {0,0,1,0}, р4 = р(А4) = {0,0, А4 - а, 0}, C.694) где А4 = -л/ТЗ/2. К полученным собственным векторам добавляем еще соответствующие присо-
2.3. Алгебраическое уравнение Риккати 131 единенные векторы. С этой целью решаем уравнение Mz = zk + \kz C.70/,) при каждом к, к = 1, 2,3,4. Представляя вектор z в виде z = {ж,р}, это уравнение можно записать как систему скалярных уравнений (см. (З.бб/с)-C.б8/с)) (Хк - a)Xj - pj + x) =0, j = I, 2,3,4, -2xi + Х2 + (Afc + a)pi + pj = 0, -2ж2 + (Хк + а)р2 + рк — 0, ( -Зж3 + x4 = 0, -3x4 = 0, из полученной системы при fe = 1 находим z — {х ,р }, где ж = {0, —2Ai, 0, 0}, При к = 2,3,4 последовательно получаем z6 = {ж6,/}, где х6 = {0, -2А2,0,0}, р6 = {1, -2А2(А2 - а), 0,0}; z7 = {ж7,/}, где х7 = {0,0,0, -2А3}, р7 = {0,0,1, -2А3(А3 - а)}; z8 = {ж8,/}, где ж8 = {0,0,0, -2А4}, р8 = {0,0,1, -2А4(А4 - а)}. Тем же способом, который был использован при доказательстве теоремы 3.1, строим матрицы Ри и Хи и с помощью формулы C.57) определяем соответству- соответствующие матрицы Ки. Сначала берем векторы z1, z3, z5 и z7. В итоге получаем матричное уравнение 0 \ 0 1 -2А3(А3-а)У fen fei2 fei3 fei4 — a 0 0 0 0 0 A3 - a 0 1 -2Ai(Ai 0 0 -a) Отсюда получаем матрицу /Ai-a 0 fe32 fe42 ^33 ^43 &34 /1 0 0 0 -2Ai 0 0 о \ 0 0 -2A3/ ^1357 = A3-a -BA3)-1 0 A3 -a -BA1)-1 0 0 Ai-a 0 0 0 0 \ 0 0 Непосредственной проверкой можно убедиться, что эта матрица действитель- действительно является решением уравнения C.63). Выбирая векторы z2, z4, z5 и z7 получаем следующее решение уравнения C.63) /A2-a -BA2) 0 0 0 А2 - а 0 0 0 0 Аз-а -BАЗ) \ 0 0 0 A3 - a Теперь, используя подмеченную закономерность, можно выписать матрицы ^2468, ^1368 и убедиться в том, что эти матрицы являются решениями урав- уравнения C.63). Любая иная комбинация векторов zl, г = 1,...,8, не определяет ^2457 =
132 Гл. 2. Алгебраические и дифференциальные уравнения решение этого уравнения. Изложенный в рассмотренном примере метод решения уравнения C.63) поз- позволяет получить некоторые содержательные выводы относительно более общих уравнений, нежели уравнение C.63). В самом деле, рассмотрим уравнение Л + Л + Ц/ = С7, (О. (Z) в котором — \Ц/15 • • • 5 Ц/s / уо. i оj — n-мерная диагональная блочная матрица с блоками Qj = ( 3 ). V и ~аз ) Для решения этого уравнения строим соответствующую матрицу М, опреде- / /-| /о\ 771 тр \ ляемую формулой C.54): М = ( 1 . . . ). По методике, изложенной s в предыдущем примере, можно показать, что det(A.E — М) = ТТ (А2 — а2 — аиJ, а = 1/2. Каждый корень этого уравнения имеет кратность 2. Обозначим их через An, Ai2,...,Asi5 AS2- Каждый собственный вектор zlJ матрицы М пред- представляем в виде zlJ = {xlJ\plJ}. Эти векторы, очевидно, обладают свойством MzlJ = XijZlJ\ i = 1,..., s, j = 1, 2. Им соответствуют присоединенные векторы, определяемые формулами M2^+S'J = z1-5' -\-XijZl+s'3'. Эти векторы также предста- представим в виде zl+s'3' = {xl+s>J\pl+s>J}. Используя результаты решения уравнения в предыдущем примере, можно выписать явное представление всех этих векторов. В частности, х11 = {1,0,..., 0}, р11 = {Ац - а, 0,..., 0}, х21 = {0,0,1,0,..., 0}, р21 = {0,0,A2i-a,0,...,0}. 2г-2 Однако можно выписать и общие формулы для х13 = {0,..., 0,1, 0,..., 0} и 2г-2 ргэ = {0,..., 0, Xij - а, 0,..., 0}, где г = 1,..., s; j = 1, 2. Присоединенные век- 2г-1 торы определяются следующими формулами xs+^J = {0,..., 0, —2A^j, 0,..., 0}, 2г-2 ps+t'j = {67^~0,1, -2Xij(Xij - а), 0,..., 0}. Соответствующие им матрицы if (решения уравнения C.72)), построенные излагаемым методом, имеют блочно-диагональную структуру К = {К^^,...,Кр^}, C.74) где 0 (Х^ - аJ Полученный результат можно сформулировать следующим образом. Теорема 3.2. Если в уравнении C.72) матрица Q имеет блочно-диагональ- блочно-диагональную структуру C.73), то оно имеет не менее s2 решений, каждое из которых представимо в виде C.74) с блоками вида C.75).
§ 2.3. Алгебраическое уравнение Риккати 133 Пример 3.11. Рассмотрим уравнение C.72), в котором матрица Q определя- определяется формулой /-Ь 1 0\ (9=0 -Ь 1 . C.76) V о о -ь) .. f(l/2)E E В этом случае характеристическое уравнение матрицы М = I ' /1 /f \ ~Q ~ принимает вид (\2 — а2 — ЪK = 0, а = 1/2, и, следовательно, ее собственное значе- значение Ai (A2 = — Ai) имеет кратность 3, а соответствующий собственный вектор z1 = {ж1,/}1} определяется формулами ж1 = {1, 0, 0}, р1 = {Ai — а, 0, 0}. Два присоединенных вектора z2 = {ж2,р2} и z3 = {ж3,р3} определяются урав- уравнениями Mz2 = z1 + А12:2, М2:3 = z2 + Xiz3. Решив их, получаем следую- следующие величины ж2 = {0,-2Аь0}, р2 = {l,-2Ai(Ai - а),0}, ж3 = {1,-1,4А?}, р3 = {Ai - а, -3Ai + а, 4Af (Ai - а)}. Эти векторы определяют единственное матричное уравнение вида C.57) отно- относительно матрицы К ' \\ — а 1 Ai - а \ 0 -2Ai(Ai -a) -3Ai +а = 0 0 4A2(Ai-a)/ /Ai-a -BА!) Отсюда находим матрицу К = 0 Ai - a V 0 0 единственным решением уравнения C.72) с матрицей Q, определяемой формулой C.76). Пример 3.12. Рассмотрим уравнение C.72), в котором C.77) .. f(l/2)E E В этом случае характеристическое уравнение матрицы М = I ' можно представить в виде det(XE - М) = (А2 - а2 - 2L = 0, а = 1/2, и, следо- следовательно, оно имеет два корня Ai = 3/2 и А2 = —3/2. Кратность каждого из них равна 4. Легко находим собственные векторы (см. C.69i) и C.692) z1 — {х1^1} и z2 = {ж2,р2}, где IV = {1,0,0,0}, рг = {Xi -a,0,0,0}, \ х2 = {1,0,0,0}, р2 = {А2 - а, 0,0,0}. Другая пара собственных векторов z3 = {ж3,р3} и z4 = {ж4,р4} определяется формулами Гж3 = {0,0,1,0}, p3 = {0,0,A!-a,0}, \ж4 = {0,0,1,0}, / = {0,0,А2-а,0}. Две пары присоединенных векторов zk = {хк,рк}, к = 5,6,7,8, определяются
134 Гл. 2. Алгебраические и дифференциальные уравнения формулами для г = 1, 2 Гж4+* = {0,-2А*,0,0}, P4+i = {0,-2Ai(Ai-a),0,0}, \x6+i = {0,0,0, -2Ai}, р6+* = {0,0,1,-2А;(А;-а)}, С помощью векторов C.78)-C.80) можно построить искомые решения урав- уравнения C.72) с матрицей, определяемой формулой C.77). Для этого достаточно повторить приведенные в примере 3.10 рассуждения, которыми были получены матрицы Kijim. Так же, как и в том примере, этих матриц оказывается четыре. Отметим одну из них. /Ai-a -BA1)-1 0 0 _0 Ai-a 0 0 1357 " 0 0 Ai-a -BAi)" \ 0 0 0 Ai-a Теперь можно рассмотреть общий случай уравнения C.72), в котором матрица Q имеет диагональную жорданову форму. Итак, пусть требуется решить уравнение C.72), в котором матрица Q имеет вид Q = {Qi,...,Qm}, C.81) где жорданова клетка Q& имеет порядок п^ и, следовательно, п\ + ... + пш = п. Как показывают рассмотренные примеры, число получаемых изложенным ме- методом решений должно быть равным т2. Этот результат можно представить в виде теоремы. Однако, приводить ее формулировку, а тем более доказательство, не будем. Это мало что дает для практического решения задач. Способ решения достаточно полно проиллюстрирован решением приведенных примеров. Вместе с тем, следует сделать одно общее замечание. При решении примеров неоднократно подчеркивалось, что в каждом конкретном случае мы рассматри- рассматривали лишь решения, которые можно получить излагаемым методом. Вопрос о существовании других решений здесь не обсуждался. § 2.4. Линейные дифференциальные уравнения Анализ матричных дифференциальных уравнений начнем с линейных уравне- уравнений вида X = A(t)X + XB(t) + F(t), D.1) где X — искомая n-мерная матрица, A(t), B(t) и F(t) — заданные непрерывные матрицы. Задача состоит в определении свойств решений таких уравнений, а также в описании практических методов построения общих и частных решений. 1. Однородное уравнение. Рассмотрим однородное уравнение X = A(t)X + XB(t). D.2) Для его анализа полезно вспомнить некоторые факты из теории систем ли- п нейных однородных дифференциальных уравнений типа гц = 2^, aik(t)l/ki Для к = 1
§ 2.4. Линейные дифференциальные уравнения 135 г = 1,... , п. Такую систему можно записать в векторной форме У = A(t)y, D.3) где у = {?/i,... ,Уп}- Указанная система имеет п линейно независимых решений yi(t) = {y{(t),... ,2/rUt)}, j — 1,... ,n, которым можно поставить в соответствие /y\{t) l неособенную матрицу Y(i) = и общее решение урав- Wn() yn() v нения D.3) можно записать в виде y(t) = Y(t)c, D.4) где с = {ci,..., сп} — вектор произвольных постоянных. Если требуется найти частное решение того же уравнения, удовлетворяющее начальному условию 2/(*о)=2/°, D.5) то постоянный вектор с можно определить из условия Y(to)c = у0. Поэтому решение задачи Коши D.3), D.5) можно представить в виде y(t) = W(t,to)y°, W(t,t0) = Y{t)Y-\t0). D.6) Матрица W(t, s) называется матрицей Коши и, как будет видно из дальнейше- дальнейшего анализа, она играет принципиальную роль в характеристике уравнений D.1) и D.2). Отметим ее важнейшие свойства. Свойство 1. Матрица Коши удовлетворяет условию W(t,t) = Е при любом значении t. Здесь Е — единичная матрица. Свойство 2. Матрица Коши W(t,s) удовлетворяет уравнению D.3) по пере- переменной t при любом значении параметра s, т.е. W(t,s) = A(t)W(t,s). Свойство 3. Матрица Коши W(t,s) однозначно определяется матрицей A(t), входящей в уравнение D.3). Из этих свойств, в частности, следует, что матрица Коши W(t,to) является решением матричного дифференциального уравнения Y = A(t)Y, D.7) удовлетворяющим начальному условию Y(to) = Е. Отсюда получаем важное для нас свойство. Свойство 4. Если известна матрица Коши W(t,s), то общее решение уравне- уравнения D.7) находится без квадратур по формуле Y(t) = W(t,s)C, где С — произ- произвольная n-мерная постоянная матрица. Впрочем, это свойство можно обобщить и сформулировать его следующим образом. Лемма 4.1. Если известна матрица Y(t), составленная из п линейно неза- независимых частных решений уравнения D.3), то общее решение уравнения D.7) находится без квадратур. Решение Y(t) уравнения D.3), указанное в этой лемме, в дальнейшем будем называть неособенным.
136 Гл. 2. Алгебраические и дифференциальные уравнения Вместе с уравнением D.7) рассмотрим еще одно матричное дифференциальное уравнение Z = ZB(t), D.8) где B(t) — заданная непрерывная матрица. Обозначим через Z(t) произвольное частное решение этого уравнения. Для его построения можно воспользоваться следующим приемом. К обеим частям уравнения D.8) применим операцию транспонирования. В результате получим уравнение Z* =B*(t)Z*. D.81) Это уравнение того же типа, что и D.7). Его свойства уже описаны выше и можно рассматривать его матрицу Коши. Для этого выписываем соответствующее векторное уравнение z = B*z и мат- матрицу U(t) произвольных его п линейно независимых решений. Тогда соответ- соответствующая матрица Коши определится формулой V*(t,s) = U(t)U~1(s) и частное решение уравнения D.81) можно представить в виде Z*(t) = V*(t,to)Z*(to). По- Поэтому частное решение уравнения D.8) получаем в виде Z(t) = Z(to)V(t, to). Особенно наглядно изложенная процедура выглядит в случае, когда матрица В постоянна. Тогда матрица V*(t,s) имеет вид V*(t,s) = eB (*~в) и, следова- следовательно, Z(t) = Z(to)eB(t~t°\ Поэтому принципиально новые вопросы в решении уравнения D.8) не возникают. Теорема 4.1. Если известны неособенные решения Y(t) и Z(t) уравнений D.7) и D.8), соответственно, то общее решение уравнения D.2) находится без квад- квадратур по формуле X(t) = Y(t)CZ(t), D.9) где С — произвольная постоянная матрица. В частности, если матрицы А и В в уравнении D.2) постоянны, то общее его решение можно представить в виде X(t) = eAtCeBt. Доказательство. Тот факт, что матрица D.9) является решением уравнения D.2), проверяется непосредственной ее подстановкой в это уравнение. Для дока- доказательства того, что это решение является общим, обозначим через X(t) некото- некоторое решение и пусть X(t0) = X°. D.10) В равенстве D.9) положим t = to и учитывая равенство D.10), получаем урав- уравнение Y(to)CZ(to) = Х° относительно постоянной С. Решая его, находим, что С = Y~1(to)X°Z~1(to). Подставляя это значение С в D.9), получаем решение уравнения D.2) в форме X(t) = W(t,to)X°V(t,to), D.11) где V(t, to) = Z~1(to)Z(t) — матрица Коши уравнения D.8). Это решение удовле- удовлетворяет условию D.10) и, в силу теоремы единственности, оно совпадает с X(t). Следовательно, решение D.9) действительно является общим. Пример 4.1. Требуется построить решение уравнения X = АХ + ХВ, где
§ 2.4. Линейные дифференциальные уравнения 137 п п Ь5= 1 пЬс начальным условием Х@) = I UU/ V 1U/ у 1 о Для решения задачи находим матрицы Коши двух уравнений Y — AY, Z = ZB. ъ jxru \ f1 t-s\ ( . / cos(t-s) sin (t-s)\ Это матрицы W(t,s) = , У(?,«) = . . ' ) ' у 0 1 у у - sin (t - s) cos(t — s) Поэтому искомое решение, в соответствии с формулой D.11), можно предста- v,^ (\ t\ /0 2\ / cost sint\ вить в виде X(t) =[п,)[,о)[ . . . . w уО 1 у V1 Зуу-smt costy Замечание 1. Завершая анализ однородного уравнения, можно предложить вопрос для размышлений. Для уравнения вида D.7) очевидна справедливость утверждения о том, что знание одного частного его решения Y\(t) позволяет получить без квадратур его общее решение по формуле Y(t) = Yi(t)C, где С — произвольная постоянная матрица. Однако, знание одного частного решения Y(t) уравнения D.2) ничего не говорит о решениях уравнений D.7) и D.8), кроме одного факта, что это решение можно представить в виде Y(t) = W(t,to)Y(to)V(t,to) (см. формулу D.11)). Вопрос состоит в следующем. Достаточна ли эта информация для того, чтобы восстановить матрицы W(t,s) и V(t,s)? 2. Неоднородное уравнение. Рассмотрим теперь вопрос о свойствах ре- решений неоднородного уравнения D.1). Поскольку матричное уравнение D.1) представляет собой своеобразную форму системы скалярных дифференциальных уравнений, то очевидно, что справедливо следующее утверждение. Теорема 4.2. Общее решение неоднородного уравнения D.1) представляет со- собой сумму общего решения соответствующего однородного уравнения D.2) и част- частного решения уравнения D.1). Для уравнения вида X = A(t)X + F(t) D.12) эта теорема дает важное Следствие 4.1. Если известны два частных решения уравнения D.12) Х\ и Х2, то общее решение этого уравнения находится без квадратур по формуле X = (Xi — X<z)C + X2, где С — произвольная постоянная матрица. Аналогичное утверждение справедливо и относительно уравнения Y = YB(t) + Ф(t). D.13) В общем случае для уравнения D.1) этот вопрос решается несколько сложнее. Теорема 4.3. Если известны три частных решения Xi(t), ^(t) и X$(t) неод- неоднородного уравнения D.1) и существует момент времени to такой, что матрица Х®2 = Xi(to) — X2(to) неособенная, то общее решение неоднородного уравнения D.1) находится без квадратур. Доказательство. Очевидно, что следующие матрицы Xi2(t) = X\(t) — X2{t) и Xis(t) = = Xi(t) —Xs(t) являются частными решениями однородного уравнения
138 Гл. 2. Алгебраические и дифференциальные уравнения D.2). Поэтому можно записать X12(t) = W(t, to)X°12V(t, t0), X13(t) = W{t, to)X°3V(t, t0), D.14) где W(t,to) и V(t,to) — неизвестные пока матрицы Коши уравнений D.7) и D.8). Однако, их можно определить следующим образом. Так как матрицы Х\2 и Х®3 неособенные, то соотношения D.14) можно разре- разрешить относительно W(t,to) и У(?,?о), выразив их непосредственно через извест- известные частные решения Xi(t), X2(t) и Xs(t) уравненияD.1). Первое уравнение из D.14) можно разрешить относительно V(t,to): V(t,t0) = (Х^2)-^-\1М)Х12A). D.15) Подставляя найденное значение V(t,to) во второе уравнение из D.14), получим уравнение относительно W(t,to), которое можно записать в виде M) = WfrtoWbiXb)-1. D.16) Поэтому общее решение уравнения D.1) теперь можно представить в виде X(t) = W(t,to)CV(t,to) + X3(t), D.17) где W(t,to) и V(t,to) определяются уравнениями D.15) и D.16). Следствие 4.2. Для любых трех частных решений Xi(t), X2(t) и Xs(t) спра- справедливы равенства Г W-\t,s)X13(t)X^1(t)W(t,s) =X13(s)Xu\s), \ л л л D.1о) \ V(t,s)Xr31(t)X12(t)V-1(t,s)=Xr31(s)X12(s), где Xjk = Xj-Xk. D.19) Доказательство. Первое из равенств D.18) непосредственно следует из соот- соотношения D.16). Для получения второго равенства следует уравнения D.14) ре- решать в обратном порядке. Сначала нужно второе из этих уравнений разрешить относительно W(t,to), а затем решать первое уравнение. 3. Частное решение неоднородного уравнения. Формула Коши. Ис- Используя приведенные выше факты о решении уравнения D.2), можно показать, что общее решение уравнения D.1) представимо в виде X(t) = Y(t)CZ(t) + X(t), D.20) где первое слагаемое в правой части равенства представляет собой общее решение уравнения D.2) (см. формулу D.9)), а второе слагаемое является произвольным частным решением уравнения D.1). ^ Чтобы получить частное решение X(t), можно воспользоваться стандартным методом вариации произвольной постоянной. Пусть известно общее решение однородного уравнения D.2), представленное в форме X(t)=Y(t)CZ(t), D.21) где С — произвольная постоянная. Решение неоднородного уравнения ищем в
§ 2.4. Линейные дифференциальные уравнения 139 виде X(t) = Y(t)C(t)Z(t), D.22) где C(t) — подлежащая определению матричная функция. Подставляя функцию D.22) в D.1), получим YCZ + YCZ + YCZ = A(t)YCZ + YCZB(t) + F(t). По- Поскольку при постоянной матрице С матрица D.21) является решением однородно- однородного уравнения D.2), то отсюда находим, что Y(t)C(t)Z(t) = F(t) и, следовательно, C(t) = / Y-1{s)F{s)Z-1{s)ds. Jt0 Подставляя найденное значение C(t) в формулу D.22), получаем частное ре- шение уравнения D.1) в виде X(t) = / W(t, s)F(s)V(t, s) ds, где W(t, s) и V(t, s) Jt0 — матрицы Коши однородных уравнений D.7) и D.8), определяемые формулами W(t,s) = Y^Y'^s), V(t,s) = Z-1(s)Z(t). D.23) Следовательно, общее решение неоднородного уравнения D.1) можно предста- представить в виде X(t) = Y(t)CZ(t) + / W(t, s)F(s)V(t, s) ds, D.24) Jt0 где С — произвольная постоянная матрица, Y(t) и Z(t) — частные решения уравнений D.7) и D.8), соответственно, а матрицы W(t,s) и V(t,s) определяются формулами D.23). Решение уравнения D.1), удовлетворяющее начальному условию X(t0) = Х°, D.25) очевидно, определяется следующей формулой Коши rt X(t) = W(t, to)X°V(t, t0) + / W(t, s)F(s)V(t, s) ds. D.26) Jt0 4. Уравнение Бернулли. В заключение этого параграфа рассмотрим урав- уравнение X = A(t)X + XB(t) + XR(t)X, D.27) которое в дальнейшем будем называть уравнением Бернулли. Оно является еще одним частным случаем общего матричного дифференциального уравнения Риккати X = P(t) + A(t)X + XB(t) + XR(t)X. Решается уравнение D.27) путем сведения его к линейному уравнению. Дела- Делается это следующим образом. Обе части уравнения D.27) сначала умножаем слева на матрицу X, а затем справа на ту же матрицу. В уравнении Х~гХХ~г = Х~гА^) + В^Х'1 + R(t) сделаем замену переменной, положив U = X~1. D.28) d(XX~1) Так как XX'1 = Е, то —— = XX'1 -\-XX~1 = в, здесь в — матрица с dt нулевыми элементами, а Е — единичная матрица. Отсюда находим, что выпол- выполняется равенство Х~гХХ~г = —Х~1. Поэтому из соотношений D.27) и D.28)
140 Гл. 2. Алгебраические и дифференциальные уравнения получаем линейное уравнение -U = B(t)U + UA(t) + R(t). D.29) Оно того же типа, что и уравнение, рассмотреное в предыдущих пунктах. Поэтому к нему можно применить теорему 4.3: если известны три частных решения U\, U<z и С/з этого уравнения, то его общее решение получается без квадратур по формуле (см. D.17)) U(t) = W(t, to)CV(t, t0) + U3(t). D.30) Здесь матрицы W(t,to) и V(t,to) определяются соотношениями D.15) и D.16), в которых следует положить Xjj~ = Uj — Uk- Они являются фундаментальными матрицами уравнений X = -B(t)X и Y = -YA(t), D.31) соответственно. Каждому решению Uj уравнения D.29) соответствует частное решение уравнения Бернулли D.27), определяемое формулой (см. D.28)) Xj = U~\ D.32) Поэтому можно считать доказанным следующее утверждение. Теорема 4.4. Если известны три решения Х\, Х<± и Хз уравнения Бернулли D.27), то его общее решение находится без квадратур. Из формул D.28) и D.30) следует, что матрица X(t), определяемая формулой X(t) = (W(t,to)CV(t,to) + Us(t))~1, является решением уравнения Бернулли. Теорема 4.5. Если матрицы Z(t) и U(t) не являются особенными, то сущест- существует уравнение Бернулли, решением которого является матрица X(t) = (Z(t)CU(t) + R(t))-\ D.33) С — произвольная постоянная матрица, a R(t) — дифференцируемая матрица. Доказательство. Соотношение D.33) разрешим относительно матрицы С, а именно Z~1(X~1 — R)U~X = С. Равенство продифференцируем по t. В итоге имеем Z~1X~1U~1 — Z~1X~1XX~1U~1 + Z~1X~1U~1 = в, alt где в — нулевая матрица. Это равенство умножим слева на XZ, а справа — на UX. Получаемое таким образом равенство можно записать в следующем виде X = U~1UX + XZZ-1-XZ— -UX, а это означает, что матрица X(t), at определяемая формулой D.33), является решением уравнения Бернулли X = A(t)X + XB(t) + XS(t)X, D.34) где A(t) = U-W = -и-ги, B(t) = ZZ = -ZZ~\ S(t) = -Z^Z **U V. аъ § 2.5. Скалярное уравнение Риккати Будем рассматривать скалярное уравнение y=p(t)+q(t)y + r(t)y2, E.1) в котором p(t), q(t) и r(t) — заданные непрерывные функции. Известно, что его
§ 2.5. Скалярное уравнение Риккати 141 решение не может быть выражено в квадратурах, хотя, в соответствии с тео- теоремой существования решений дифференциальных уравнений, уравнение имеет решение при любом начальном условии вида у (to) = у0, где точка t = to принад- принадлежит отрезку непрерывности функций p(t), q(t) и r(t). Рассматриваемая нами задача состоит в том, чтобы исследовать общие свойст- свойства уравнений вида E.1) и проанализировать поведение решений некоторых типов таких уравнений. 1. Общие свойства решений. Здесь отметим некоторые важнейшие свойст- свойства скалярных уравнений Риккати. Они окажутся полезными в анализе свойств матричных и операторных уравнений того же типа. Свойство 1. Произвольное преобразование независимой переменной t = ц>(т), где if — дифференцируемая функция, не изменяет типа уравнения E.1). Доказательство очевидно. Свойство 2. Уравнение Риккати сохраняет свой вид при произвольном дробно- линейном преобразовании зависимой переменной у = (ах + {3)/(jx + S), где а, /3, 7 и S — произвольные дифференцируемые функции от переменной ?, удовлетво- удовлетворяющие условию aS — /3j ф 0 в рассматриваемом интервале времени t. Доказательство получается непосредственной проверкой. Свойство 3. Коэффициент при квадрате зависимой переменной в уравнении E.1) можно сделать равным ±1 с помощью замены y = ±r~1(t)x. E.2) Доказательство. Используя замену E.2), уравнение E.1) получаем в виде х = ±r(t)p(t) + [q(t) + f(t)/r(t)] x±x2. Вводя новые обозначения pi(t) = ±r(t)p(t), qi(t) = q(t) — r(t)/r(t), полученное уравнение можно записать в виде x=p1(t) + q1(t)x±x2. E.3) Свойство 4. Не изменяя коэффициента при квадрате зависимой переменной, уравнение E.3) можно привести к виду, когда коэффициент при первой степени зависимой переменной будет равным нулю. Доказательство. Введем новую зависимую переменную z, положив т\ — =Ы, х = z , то уравнение D.3) приводится к виду 2ri z=P2(t)±z2, E.4) где р2 определяется через коэффициенты уравнения E.2). Как отмечалось выше, решение уравнения Риккати не сводится, вообще гово- говоря, к квадратурам. Однако, можно установить некоторые интересные факты о его решениях. Теорема 5.1. Если известно одно частное решение уравнения Риккати, то общее его решение получается двумя квадратурами. Доказательство. Пусть у = yi(t) — известное частное решение для E.1), т. е. yi(t)=p(t)+q(t)yi+r(t)yl E.5)
142 Гл. 2. Алгебраические и дифференциальные уравнения Делая замену зависимой переменной 2/= 2/1 (*)+*, E.6) получаем относительно z уравнение: z — r(t)z2 + Bn/i + g);z. Это уравнение Бернулли, которое заменой z = u~1 E.7) сводится к линейному неоднородному уравнению первого порядка и + Bn/i + q)u + г = 0. E.8) Его общее решение находится двумя квадратурами и имеет вид u = c<p(t) + i/>(t), E.9) где с — произвольная постоянная Из формул E.6) и E.7) следует, что и = 1/B/ — 2/1) и, согласно формуле E.9), получаем 2/ = 2/1 + V(c?>(*) + Ф^)) = (q/i(*M*) + yi(t)i/>(t) + 1) / (су>(*) + ^(*)). Заключительная формула приведенного доказательства дает важное Следствие 5.1. Общее решение уравнения Риккати представляет собой дроб- дробно-линейную функцию относительно произвольной постоянной. Справедливо и обратное утверждение. Теорема 5.2. Если общим решением дифференциального уравнения является дробно-линейная функция от произвольной постоянной, то этим уравнением яв- является уравнение Риккати. Доказательство. Пусть у = (api(t) + y>2(t)) / (c^i(t) + ip2(t)) — общее реше- решение некоторого уравнения. Разрешим его относительно произвольной постоянной с. Тогда получим с = fait) - 2/^2(*)) / (уфгф - <Pi(*)). Исключая с дифференцированием по t полученного соотношения, будем иметь + (Ф1Ф2 -<i>24>\) = 0, т. е. мы действительно получили уравнение Риккати. Теорема 5.3. Если известны два частных решения уравнения Риккати, то его общее решение находится одной квадратурой. Доказательство. Пусть у\ и 2/2 — решения уравнения E.1). Как показано при доказательстве теоремы 5.1, замена и = —— E.10) У-У1 сводит уравнение Риккати к неоднородному уравнению E.8). Согласно этой фор- формуле, частное решение у2 уравнения E.1) определяет функцию т = —-—, E.11) У2 ~У\ которая, очевидно, является частным решением линейного неоднородного урав- уравнения E.8). Чтобы получить еще одно частное решение этого уравнения, доста- достаточно одной квадратуры. Построив таким образом общее решение и линейного
§ 2.5. Скалярное уравнение Риккати 143 уравнения E.8), получим общее решение уравнения Риккати. Теорема 5.4. Если известны три частных решения уравнения Риккати, то его общее решение находится без квадратур. Доказательство. Пусть 2/1,2/2 ^ Уз — частные решения уравнения Риккати. Тогда очевидно, что функции Ul = , и2 = E.110 2/2 - 2/1 2/з - 2/1 являются частными решениями линейного неоднородного уравнения E.8). По двум частным решениям уравнения E.8) его общее решение находится без квад- квадратур по формуле и = ui + c(u2 - и\), где с — произвольная постоянная. Это решение можно представить в виде и = + с ( ) E.12) 2/2-2/1 V2/3-2/1 2/2-2/1/ и, следовательно, общее решение уравнения Риккати находится без квадратур, например, по формуле и = 1/(у — 2/1 )• Следствие 5.2. Ангармоническое отношение любых четырех частных реше- решета 2/4 - 2/2 2/з - 2/2 нии уравнения Риккати равно постоянному, т. е. : = с. 2/4 - 2/1 2/з - 2/1 Доказательство. Если известны четыре частных решения 2/1,2/2,2/3 и 2/4 урав- уравнения Риккати, то, кроме решений E.11') линейного уравнения E.8), существует еще третье его решение из = 1/B/4 - 2/i), которое, очевидно, может быть также получено из формулы E.12) при некотором значении постоянной с. Значит, мож- можно записать равенство 1/(у4 - у г) = 1/B/2 - 2/i) + с [1/B/3 - 2/1) ~ 1/B/2 - 2/i)], из которого непосредственно следует справедливость утверждения. 2. Примеры интегрируемых уравнений Риккати. Существует бесчис- бесчисленное множество уравнений типа E.1), решение которых можно получить в квадратурах. Здесь мы рассмотрим некоторые из них. Пример 5.1. Если в уравнении E.1) р, q и г постоянны, то переменные разде- разделяются и получаем dy /' — =t-t0. E.13) ту1 Это решение задачи Коши с начальным условием y[to) — 2/°, где у0 не является корнем уравнения ту1 +qy+p = 0. E.14) Если 2/1 и 2/2 — вещественные корни уравнения E.14), то они являются посто- постоянными решениями уравнения E.1). Этот факт позволяет установить и некото- некоторые свойства непостоянных решений уравнения E.1) с постоянными коэффици- коэффициентами. ГУ Записываем E.13) в виде / [1/(у - уг) - 1/(у - у2)] dt = r(yi - y2)(t - t0). JyO Формулой (у - yi)/(y - 2/2) = [B/1 - 2/°)/B/2 - У0)] es^~to\ s = г(уг - у2), опре- определяется решение задачи Коши. С помощью этой формулы можно исследовать поведение решения при различных соотношениях между 2/°, 2/1 и 2/2-
144 Гл. 2. Алгебраические и дифференциальные уравнения В частности, легко устанавливается следующий факт. Если у\ < у0 < У2, то решение y(t) ограничено при t —у ± оо и у\ < y(t) < У2- Пример 5.2. Если в уравнении E.1) г = A/ (t2), q = B/t и А, В и р — постоянные, то уравнение E.1) является однородным и интегрируется с помощью подстановки у = tz. Пример 5.3. Если в уравнении E.1) р = A/ (t2), q = B/t и А, В и р — постоянные, то уравнение интегрируется подстановкой и = ty. Пример 5.4. Рассмотрим уравнение у + ау2 = Ыа, E.15) где а, Ъ и а - постоянные. Попытаемся выделить те значения этих постоян- постоянных, при которых уравнение E.15) интегрируется в квадратурах. Прежде всего, имеем очевидный результат. Если а = 0, то в E.15) переменные разделяют- разделяются и уравнение решается в квадратурах. Если же а = -2, то уравнение E.15) принимает вид у + ау2 = Ы~2. E.16) Заменой у = г~г это уравнение приводится к виду z = a — b(z/tJ. Полученное уравнение является однородным и интегрируется в квадратурах. Для нахождения других значений параметра а, при которых уравнение интег- интегрируется в квадратурах, в уравнении E.15) сделаем подстановку y = uz + v. E.17) Функции и = u(t) и v = v(t) подберем так, чтобы преобразованное уравнение не содержало первой степени искомой функции и чтобы свободный член не изме- изменился. Имеем uz + iiz + v + au2z2 + 2auvz + av2 = bta. Поставленные условия дают два уравнения относительно функций и и v: й + 2auv = 0, v + av2 = 0. Сначала из второго уравнения находим частное решение v = l/(at). После этого из первого уравнения находим также частное решение и = t~2. Следова- Следовательно, искомая подстановка имеет вид у — zj (t2) + I/(at), а уравнение E.15) приводится к виду Далее, делаем дробно-линейную подстановку z = z^1. При этом переменная z\ связана с у соотношением y = tk + h- <**> Уравнение относительно z\ имеет вид z\ + atOL~^2z2 = a/ (t2) или, деля обе части этого уравнения на ta+2, получим Очевидно, что для приведения этого уравнения к виду E.15) достаточно по- положить t\ — ?а+3. При такой замене независимой переменной уравнение E.18)
§ 2.5. Скалярное уравнение Риккати 145 принимает вид ^ + -Ц*? = ^4*Г^- E.19) dt1a + 31a + 31 K J Уравнение E.19) имеет вид уравнения E.15), где коэффициенты принимают следующие значения: а\ = Ь/(а + 3), Ь\ = а/(а + 3), а показатель а заменился на Последнюю дробно-линейную подстановку, связывающую аищ, приводим к следующему «каноническому виду» или —^— = 1 + —?—. E.20) «1+2 а + 2 у J Применяя к уравнению E.19) с новыми коэффициентами а\ и Ь\ и показателем «1 те же преобразования, с помощью которых из уравнения E.15) было получено уравнение E.19), мы придем к уравнению — \-a2u2 — Ъ*^2 •> где «канонический at 2 вид» зависимости между «i и «2, в соответствии с соотношением E.20) будет иметь вид 1/(а2 + 2) = 1 + l/(ai + 2). Отсюда и из E.20) получаем 1/(а2 + 2) = 2 + 1/(а + 2). В результате к подобных преобразований придем к показателю а^, связанному с исходным показателем а соотношением —-— = к+—^—, /с = 1,2,.... E.21) ак+2 а + 2' ' ' v J Если же, отправляясь от показателя а, мы проведем в обратном порядке вы- вышеуказанные последовательные преобразования переменных, то придем к урав- уравнениям с показателями a_i, a_2, ..., ск-fc? связанными с а соотношениями a-k + 2 а + 2 Отсюда получаем важный E.22) Вывод 1. Если в результате приведенных преобразований мы придем к по- показателю, для которого уравнение Риккати интегрируется в квадратурах, то и начальное уравнение обладает тем же свойством. Как показано выше, уравнение E.15) интегрируется в квадратурах при а = -2 и а = 0. Легко видеть, что преобразованиями E.21) и E.22) число а = — 2 преобразуется в о>\ = a_i = —2, т.е. показатель a = —2 преобразованиями E.21) и E.22) не изменяется и, следовательно, не может произойти в результате этих преобразований от другого показателя. Поэтому нас будут интересовать лишь те случаи, когда для некоторого нату- натурального к мы имеем а^ = 0 или a-k = 0. Отсюда, в соответствии с форму- формулами E.21) и E.22), получаем относительно а уравнение 1/(а + 2) = —к + 1/2, к = =Ы, ±2,... Решая его, находим что Ак а=——, * = ±1,±2,... E.23) 1 — 2к
146 Гл. 2. Алгебраические и дифференциальные уравнения Вывод 2. При каждом показателе вида E.23) уравнение Риккати E.15) ко- конечным числам преобразований указанного выше типа приводится к уравнению z + az2 = Ъ и следовательно, интегрируется в квадратурах. Как показал Лиувилль, при значениях а, отличных от E.23), решение уравне- уравнения E.15) не может быть выражено квадратурами от элементарных функций. Пример 5.5. Здесь мы рассмотрим пример уравнения типа E.15), который решается с помощью процедуры, изложенной в предыдущем примере. Рассмотрим уравнение ^+ж2 = г-4/3_ E24) ат Если его записать в обозначениях уравнения E.15), то будем иметь а = Ъ = 1 и а = -4/3. Представляя параметр а в виде E.23), находим соответствующее чис- число к, т.е. имеем к = -1. Следовательно, все подстановки, которые выполнялись при преобразовании уравнения E.15) к виду E.19), нужно выполнять в обратном порядке. Записывая уравнение в обозначениях E.19), будем иметь — \- z\ — i^_ ' . at i При этом а\ = -4/3 = -(а + 4)/(а + 3), т. е. а = 0. Сделаем замену независимой переменной, полагая t3 = t\. Тогда dt\ = 3t2dt и уравнение можно переписать в виде z\ + 3t2z2 = 3/ (t2). Теперь переходим к переменной z = z^1. В результате получаем i + ^z2 = 3t2. E.25) Рассматривая его как уравнение (*), находим, что а = Ъ = 3. Поэтому, перехо- переходя к переменной у, через которую записано E.15), имеем у = z/ (t2) + l/Ct). В итоге уравнение E.25) преобразуется к виду у + Зу2 = 3, которое интегрируется в квадратурах. Выполнив необходимые вычисления и возвратясь к исходным переменным жиг, получим общее решение уравнения E.24). 3. Свойства решений. Здесь мы рассмотрим некоторые частные случаи уравнения Риккати и покажем, что можно обнаружить многие свойства реше- решений таких уравнений, хотя в конечном виде эти решения получить не удается. Будем рассматривать уравнение (см.E.1)) y2, E.26) где p(t) и q(t) — непрерывные функции при всех конечных значениях переменной ?, ограниченные при —оо < t < оо. Предположим, что уравнение у2 + q(t)y + p(t) = о E.27) имеет вещественные корни a\(t) и a2(t), т.е. E.26) можно записать в виде у = (у - ai(t))(y - a2(t)) E.28) и очевидно, что q2(t) - 4p(t) ^ 0.
§ 2.5. Скалярное уравнение Риккати 147 Сначала предположим, что = a2{t)=a{t). E.29) Тогда уравнение E.26) можно записать в виде y = (y-a(t)J, a(t) = -q(t)/2. E.30) Следовательно, функция у = a(t) ограничена, т. е. существуют постоянные т и М такие, что т ^ a(t) ^ М. E.31) В общем случае уравнение E.30) не интегрируется в квадратурах, хотя в некото- некоторых случаях это возможно. Например, уравнение у = (у + 2/?J имеет решения у = -1/?, у = -4/t. Как было показано выше, этого достаточно, чтобы построить общее решение уравнения Риккати. Теорема 5.5. Все решения уравнения E.30), подчиненные условию y(t0) =y°>M, E.32) обладают свойствами ^ 1 y(t) -)> оо при t -)> ti = t0 + -5 — - 0, E.33) y(t) -^mi^m при t -у -oo, E.34) где постоянные т и М взяты из неравенств E.31), a mi — некоторое постоян- постоянное число. Доказательство. Так как из уравнения E.30) следует, что у > 0, то y(t) — a(t) ^ y(t) — М > 0 при t > to. Поэтому, если у — y(t) — решение уравнения $={у-МJ E.35) с условием V(to) = у0, E.36) то будет выполняться неравенство у ^ уи, следовательно, будем иметь y(t) ^ y(t) у0 - М при t>t0. Но из E.35) и E.36) следует, что y(t) = М + (, , w 0 ttv- I — [t — to){y — М ) Отсюда следует, что условие E.33) действительно выполняется. Пусть теперь t < to. Так как решение задачи E.30), E.32) обладает свойством y(t) > 0, то y(t) < у0 при t < to- Кроме того, y(t)-m ^ y(t)-a(t) > 0, по крайней мере, при значениях t из достаточно малой окрестности точки ?0- Следовательно, если y(t) — решение задачи Коши $=(у-тJ, y(to)=y°, E.37) то y(t) = (y(t) - a(t)J ^$(t). Отсюда находим, что y(t) ^ y(t), при t < to- Так как из E.37) следует, что ^ у^ — 771 y(t) = m + т z-t-r г ->• тп при t ->• -оо, тогда и y(t) ->• mi ^ m при 1 - (?-?o)Ur -ш) t —у —оо. Теорема доказана. Следствие 5.3. При выполнении условий теоремы 5.6 решение y(t) задачи Ко- Коши E.30), E.32) ограничено при t -у -оо и определено при -оо < t < t\ ^ t\.
148 Гл. 2. Алгебраические и дифференциальные уравнения Пример 5.6. На простом примере покажем, что если начальная точка у0 не удовлетворяет условию у0 > М, то решение задачи Коши E.30), E.32) может и не обладать свойством E.33). Пусть в уравнении E.30) Г -2/t при t ^ 2, a(t) = < 1-1 при t < 2. Поэтому неравенства E.31) принимают вид -1 ^ a(t) ^ 0, т.е. в этом случае, когда т = —1, М = 0. Непосредственной проверкой убеждаемся, что решением уравнения E.30) является функция Г1 при t ^ 2, (t - 3)/(t - 4) при t < 2. Она удовлетворяет начальному условию y(to) = уB) = у0 = —1/2 < 0 = М. Следовательно, в этом случае to = 2, ?/0 = —1/2 и, значит, в условии E.33) t\ — 0, и это условие принимает вид y(t) —у оо при t —> 0 — 0. Однако, для решения E.38) имеем y(t) —у —3/4 при t —у 0 — 0. Продолжим анализ уравнения E.30) и рассмотрим свойства его решений при начальных данных, удовлетворяющих условию y(t0) =y°<m. E.39) Интегрируя обе части этого уравнения, получаем y(t) =y°+ [ (у- a(t)Jdt. E.40) Jt0 Попытаемся выяснить, существует ли непрерывное решение с условием E.39), которое при t -у оо обладает свойством y(t) < у\ < т ^ a(t). Если предположить, что такое решение есть, то, в силу соотношения E.40), из неравенств (y(t) - a(t)J ^ (y(t) - тJ ^ Ь2 > 0, следует, что y(t) ^ у0 + b2(t - to) при t ^ to- Значит каждое решение уравнения E.30), удовлетворяющее условию E.39), неограниченно возрастает при t —у оо. Рассмотрим теперь это же решение при t < to- Непосредственно из E.30) следует, что у > 0, по крайней мере, в малой окрестности точки t = to- Следова- Следовательно, y(t) убывает при уменьшении t. Так как l/(y(t) — тJ ^ l/y(t) — a(t)J, то, согласно уравнению E.30), будем иметь dy ^ Г dy _, , г л Г dy [V (y(t) - a(t)J ) -^ о _m у Отсюда следует, что рассматриваемое решение обладает следующим свойст- свойством: y(t) -> -оо при t-to->ti-to^ yiI_rn^ h-to < 0. Тем самым доказана Теорема 5.6. При всех у0 < m ^ a(t) непрерывное решение у = y(t) уравнения E.30), удовлетворяющее условию E.39), либо пересекает кривую у = a(t), либо a(t) — y(t) —У 0 при t —У оо. В последнем случае имеем решение, ограниченное при t —у оо и y(t) —у —оо при t —у t\ < to-
§ 2.5. Скалярное уравнение Риккати 149 Пример 5.7. Рассмотрим уравнение E.30) при той же функции a(t), что и в предыдущем примере: -2/t при t ^ 2, Г \ E.41) -1 при t < 2. V ; Как отмечалось в примере 5.6, в этом случае при t ^ 2 уравнение E.30) имеет частное решение ?/i(t) = —t~1. Вводя замену у = v — t, приводим к виду v = B/t)v + v2. Получаем линейное уравнение z + B/t)z + 1 = 0 с помощью замены z = г;. Решая его и возвращаясь к исходным переменным, получаем 4t3 — Зс решение у = _ 3 , t ^ 2, уравнения у = (у - a(t)J, a(t) = -2/t, ? ^ 2. Решение, удовлетворяющее начальному условию E.39), представимо в виде 4?3 _ Зс° У = ^^У' ^2' E-42) где постоянная с0 определяется равенством ——^ от = 2/°- Для определения toCcu -Ц) точки пересечения решения E.42) с кривой у = a(t) = —2/t, t ^ 2, составим 4t3 - Зс° 2 уравнение tCcQ_t3)=-? Отсюда находим точку пересечения (t,y): ) 4 E43) Из формул E.43) следует, что при 2/° = —1/2 — а2, где a — малое число, будет выполняться неравенство t3 > 23, т.е. при t > 2 всякая интегральная кривая с у0 = —1/2 — а2 пересекает кривую у = a(t) = —2/t. Но при у0 —у —1, t3 —>¦ 23. При у0 = — 1 — а2, т. е. при 2/° < —1 будем иметь t3 = 8 ( 1 « ) < 8. \ 1 + 2ar у При таком значении t решение E.42) не определено, что и утверждается тео- теоремой 5.6. Завершая анализ примера, отметим еще одно важное свойство решения E.42): y(t) —у оо при t —> t\ — 0, где t3 = Зс°. Непосредственными вычислениями легко проверяется, что это условие выполняется при t > 2, если —1/2 < у0 и, тем более, если —B/t) = a(t) < 0 < у0, что соответствует общему утверждению теоремы 5.5. Если же у0 ^ —1/2, то решение E.42) обладает свойством y(t) —> 0 при t —у оо. Результаты, полученные в примерах 5.6 и 5.7 при анализе решений уравнения E.30), при функции a(t), определяемой формулой E.41), показывают, что реше- решения этого уравнения с начальным условием у (to) = у0 можно разбить на четыре следующих класса. 1. y(t) - a(t) чОи y(t) -У 0 при t -у оо, если у0 < —1. 2. Интегральная кривая у = y(t) пересекается с линией у = a(t) в конечных точках, но при этом y(t) —У 0 при t —у оо, если — 1 ^ у0 < —1/2. 3. y(t) -У 0 при t -у оо, если 2/° = -1/2. Здесь у = -1/t. 4. з/(?) -»• оо при t -»> ti, где tf = Зс°, если -1/2 < у0.
150 Гл. 2. Алгебраические и дифференциальные уравнения В общем случае решение уравнения E.30) может существовать в полубесконеч- полубесконечном промежутке. При этом решение может обладать любым из перечисленных свойств, хотя проинтегрировать уравнение в квадратурах обычно не удается. Здесь, конечно, возникает задача: найти признаки, по которым можно узнать, какой из указанных случаев имеет место и как построить решение во всей облас- области его существования. Этот вопрос обсуждается ниже. Однако, сначала вернемся к исходному уравнению E.26). Теоремы 5.5 и 5.6 характеризуют свойства решений этого уравнения в том частном случае, когда алгебраическое уравнение E.27) имеет лишь один корень a(t). Теперь рассмотрим более общий случай, когда уравнение E.26) приводится к виду E.28). Сначала рассмотрим решение уравнения при начальном условии у (to) = у0, в котором величина у0 удовлетворяет неравенствам у0 - ai(to) < 0, у0 - a2(t0) < 0. E.44) Тогда из уравнения E.28) следует, что у (to) > 0 и, значит, в окрестности точки t = to функция у = y(t) возрастает с увеличением t. Однако при этом может оказаться, что это решение будет ограниченным. Теорема 5.7. Всякое решение уравнения E.28), начальное значение которого подчинено условию E.44), будет ограниченным, если существует функция a(t), удовлетворяющая условиям аг(Ь) < a(t) < a2(t), E.45) (a(t) - ai(t))(a(t) - a2(t)) < a(t). E.46) При этом оно обладает одним из свойств y(t) — a\(t) —> 0 при t —У оо, или Доказательство. Итак, если условие E.44) выполнено, то, по крайней мере, в малой окрестности точки to решение y(t) является возрастающей функцией времени t. При этом не существует постоянной Ъ такой, что (y(t) - a!(t))(y(t) - a2(t)) ^ b2 > 0 при t ^ оо. E.47) Если бы такая постоянная существовала, то из уравнения E.28) и условия E.47) следовало бы что у > Ъ2 при t —у оо, а, значит, y(t) неограниченно возрас- возрастает. Так как у0 удовлетворяет условиям E.44), то в некоторый момент времени t = t1 должно выполняться равенство y(t\) — a\(t\) = 0, что противоречит нера- неравенствам E.47). Поэтому рассматриваемое решение либо обладает свойством y(t) -ai(t) -У 0 при t-> оо, E.48) либо существует момент времени t = t\ такой, что 2/(*i)-ai(*i) >0. E.49) Последнее возможно в силу того, что функция y(t) — OL\(t) изменяется с течением времени не только за счет того, что изменяется y(t). Монотонное возрастание y(t) вместе с монотонным убыванием a\(t) может породить ситуацию, отмеченную неравенством E.49).
§ 2.5. Скалярное уравнение Риккати 151 Если выполняется условие E.48), то решение y(t) ограничено при t —> оо. Во втором случае (когда выполняется неравенство E.49)) можно считать, что y(ti) — a2(ti) < 0, так как по предположению a\(t) < a2(t). Тогда при t > t\ вблизи точки t\ имеем y(t) < 0. Значит, решение y(t) при этом убывает, по крайней мере, вблизи точки t\. При дальнейшем увеличении t может оказаться, что y(t) — a2(t) < 0 при t > t\ (ведь a(t) может возрастать!). Если не существует t = t2 > ti такое, что у fa) < «1(^2), то это возвращает нас к исходному пункту рассуждений. Так как по предположению существует функция a(t), удовлетворяющая усло- условиям E.45) и E.46), то не может существовать ?2 такое, что у fa) > a2fa). Из условия E.45) следует, что в начальный момент времени t = to выполняется неравенство y(to) < a(to), а из E.46) находим, что функция a(t) является реше- решением уравнения a(t) = (a(t) -ai(t))(a(t) -a2(t)) + /32(t). Значит, y(t) < a(t) при Аналогичным образом можно исследовать поведение решения y(t) уравнения E.28), когда начальное его значение у (to) удовлетворяет условиям у fa) - ai(to) > 0, у fa) - a2fa) > 0. E.50) Из этих условий следует, что существуют постоянные а и Ъ такие, что f yfa)-ot!fa) ^yfa)-a>0, \yfa)-a2fa) ^yfa)-b>0. Отсюда следует, что неравенство——— w . . . ~ . . . . ... . . . .. (y(t) ~ a)(y(t) -Ъ)' (y(t) - ax(t))(y(t) - a2(t)) справедливо, по крайней мере, в достаточно малой окрестности точки t = t0 . Так как y(t) — решение уравнения E.28), то в той же окрестности точки t = to dy . dy справедливы соотношения . . . . . . . — > . . . . .. . . . —— = at (y(t) - a)(y(t) - b) ' (y(t) - с ^^^-^ - ^ при dy > O,dt > 0 и, следовательно, fy dy fy dy Ф{У) = Jy0 (y(t)-a)(y(t)-b) > Jyo (y(t) - ai(t))(y(t) - a2(t) =t~to- Очевидно, что ф(у) —У —оо при у —>¦ Ъ так как Ъ > а. Поэтому y(t) ->• Ь\ ^ Ъ при t ->• -оо. E.51) Может оказаться, что ^y(t) убывает с уменьшением t. Однако, при этом всегда остается справедливым неравенство E.51). Тем самым доказана Теорема 5.8. Если выполнены условия E.50), то решение уравнения E.28), удовлетворяющее условию у (to) = у0, остается ограниченным при t —>¦ — оо и при этом справедливо свойство E.51). Пример 5.8. Рассмотрим уравнение ii — r?(i\ 7/2 (^ ^9"! У — Р \") — у 1 yo.o^j в котором функция p(t) удовлетворяет условию 0 < а2 ^ p2(t) ^ Ъ2.
152 Гл. 2. Алгебраические и дифференциальные уравнения Заменой z — —у уравнение E.52) приводится при условии p(t) > 0 к виду E.28): z = (z -\-p(t))(z — p(t)), в котором a\(t) = —p(t), (%2(t) = p(t) и, следова- следовательно, 0 < а ^ —OL\(t) = ct2(t) ^ Ъ. Поэтому, если начальная точка z(to) такова, что выполняются неравенства E.53) то, согласно теореме 5.8, решение z(t) будет обладать свойством E.51). Нетрудно проверить, что точка z(to) будет удовлетворять неравенствам E.53), если спра- справедливо Ъ < z(to). Рассмотрим, наконец, случай, когда алгебраическое уравнение E.27) имеет комплексные корни. Тогда уравнение E.26) можно представить в виде y = (y-a(t)J + b2(t). E.54) Будем предполагать, что функции a(t) и b(t) определены, непрерывны на всей числовой оси и удовлетворяют условиям при-оо<?<оо, E.55) где а и b — постоянные. Из уравнения E.54) получаем y(t) = y(t0) + I [(у- a(t)J + b2(t)} dt. E.56) Jt0 Будем предполагать, что b2(t) = 0 лишь в изолированных точках. Тогда, как видно из уравнения E.54), у > 0, а у = 0 может быть только в изолированных точках. Значит, любое решение этого уравнения является возрастающей функ- функцией. Сначала рассмотрим решение у = y(t), которое удовлетворяет начальному условию у (to) = у0 > а, в котором постоянная а взята из условия E.55). Так как это решение возрастает при t > to, то справедлива цепочка неравенств (y(t) - a(t)J + b2(t) >(y- aJ > (у0 - аJ > 0. E.57) Но тогда из E.56) получаем у — у0 ^ (у0 — aJ(t — to) —> оо при t —У оо. Следовательно, если у = y(t) существует при всех t > to, то y(t) ->• оо при t ->• оо. Если же y(t) ->• оо, то из уравнения E.54) получаем следующее равенство Гу dy = / т~п\ ,.w> , ,9/л =t-t0. Если же учесть E.57), то будем иметь Jy° (УКЧ ~а(ч) +b2(t) Г Jy У (у -a)~2dy < tyo" ' ' У0-а' Отсюда находим, что для этого решения справедливы при у —У оо соотношения t - to -У t\ - to ^ -q . Допущение, что решение y(t) возрастает, но остается ограниченным или существует лишь при ?, стремящемся к некоторому конечному ?*, противоречит тому, что решение у — y(t) —у у0 при t —У to определено при t > to для любых конечных чисел to и у0.
§ 2.5. Скалярное уравнение Риккати 153 Подводя итоги приведенным рассуждениям, приходим к выводу, что реше- решение у = y(t), удовлетворяющее начальному условию у (to) = у0 > а, обладает свойством y(t) —У оо при t —У t\ < (у0 — а)~г. Рассмотрим теперь произвольное решение у = y(t) того же уравнения E.54), т.е. не будем предполагать, что выполняется условие у (to) > а- Такое решение существует и, как следует из уравнения E.54), его производная всегда положи- положительна и, следовательно, оно является монотонно возрастающей функцией. Из rt уравнения E.54) получаем, что y(t) — у0 ^ / b2(t)dt. J to rt Поэтому если / b2(t) dt ->• оо при t ->• оо, то решение y(t) не будет ограничен- J to ной функцией. В случае, когда ft 9 / bz(t)dt^A, E.58) Jto может возникнуть неординарная ситуация. Пример 5.9. Рассмотрим уравнение у = (у — arctgtJ Н ^• Здесь условие E.58) выполнено. Легко находится частное решение этого уравнения y(t) = arctgt = f -^. E.59) Jo J- +t С помощью этого частного решения известным способом находим общее ре- решение y(t) = Ь arctgt. Решение с начальным условием у@) = у0 имеет с — t вид y(t) = + arctgt. E.60) Решение E.59) определено при всех t > 0 и ограничено при t —У оо, но оно не является решением с условием у@) > а (см. E.54) и E.55)). Из формулы E.60) следует, что определяемое ею решение при любом у0 > О обладает свойством у —У оо при t —У t\ = —тт. У0 4. Существование решений. Чтобы проанализировать вопрос о существо- существовании решения уравнения c(t), E.61) предположим, что функции a(t), b(t) и c(t) непрерывны при A^t^B. E.62) Покажем, как можно построить решение уравнения E.61) во всей области его существования. Пусть функции и = u(t) и v = v(t) образуют решение системы уравнений (u=(b(t)+B(t))u + c(t)v, \ (О.Do) I у = -a(t)u + B(t)v,
154 Гл. 2. Алгебраические и дифференциальные уравнения где B(t) — произвольная непрерывная функция. Тогда непосредственной про- проверкой можно убедиться в том, что у = u(t)/v(t) E.64) — решение уравнения E.61). Если положить B(t) = 0, то уравнения E.63) при- принимают вид I у = —a(t)u. Построим два линейно независимых решения этой системы, которые удовле- удовлетворяют условиям ui(to) = 1, vi(to) = 0; U2(to) = 0, ^2(^0) = 1- Тогда пара функций u(t) = y°ui(t) + u2(t), v(t) = y°vi(t) + v2(t) E.66) образует решение системы E.65), удовлетворяющее двум условиям и (to) = у0, v(to) = 1 и, следовательно, функция = y-f + -f E.67) W y°vi(t)+v2(t) У ! является решением уравнения E.61) и удовлетворяет условию yit0) = у0. E.68) По предположению, функции a(t), b(t) и c(t) непрерывны на отрезке E.62). Поэтому функции E.66) определены на этом же отрезке. Решение E.67) может обратиться в бесконечность или оказаться неопределенным в точках ?*, в кото- которых выполняется равенство V°v1(f)+v2(n=0. E.69) Число таких точек может быть различным в зависимости от структуры функций v\(t) и v2(t) и величины у0. Однако, всегда в точке ?*, в которой выполнено равенство E.69), числитель в E.67) не обращается в нуль. Если бы это было не так, то одновременно с E.69) выполнялось бы равенство y®u\(t*) + u2(t*) = 0. Отсюда следует, что ^fl = V-iP = X. E.70) u2(t*) v2(t*) У ' С другой стороны, векторы {ui(t),vi(i}} и {u2(t),V2(t)} образуют матрицу Коши системы линейных уравнений E.65), нормальную при t = to: Из соотношений E.70) следует, что H/(t*,to)— особенная матрица, а это проти- противоречит тому, что она является значением матрицы Коши в точке t = t*. 5. Некоторые дополнительные свойства уравнения Риккати. Обоз- Обозначим через х = x(s,t) решение уравнения Риккати на оси ?, принимающее нулевое значение при t = s. Поскольку в дальнейшем s и t рассматриваются как переменные, то уравнение будем записывать в виде дх — = a(t)x2 + 2b(t)x + c(t), x(s, s) = 0. E.71a)
§ 2.5. Скалярное уравнение Риккати 155 Вместе с этим уравнением будем рассматривать пару линейных уравнений ду -? = b(t) + a(t)x, y(s,s) = Q, E.71b) ^=а(г)е2^'*), z(s,s)=0. E.71c) Система уравнений E.71Ь)-E.71с), ассоциированная с уравнением Риккати E.71а), рассматривается на интервале J существования решения этого уравнения при t ^ s Е J. Соответствующая область на плоскости (s,t) обладает свойством выпуклости; вместе с точкой [so,to) ей принадлежит и отрезок с концевыми точками (s0, s0) и (so,?o). Теорема 5.9. Пусть функции х = x(s,t), у = y(s,t) и z — z(s,t) образуют решение задачи E.71) в области s,t Е J, t ^ s, причем y(s,t) непрерывна по s при каждом фиксированном t. Тогда частные производные по s существуют и в каждой точке области J эти функции удовлетворяют системе -^=ф)е2^.*), E.72а) OS -^- = b(s)+c(s)z(s,t), E.726) OS —1= c(s)z2(s, t) + 2b(s)z(s, t) + a(s). E.72c) OS Выше было показано, каким образом по известному частному решению урав- уравнения Риккати можно практически построить общее его решение. Поэтому не- нетрудно проверить что общее решение этого уравнения выражается через тройку функций x(s,t), y(s,t) и z(s,t). Теорема 5.10. Пусть функции х = x(s,t), у = y(s,t) и z — z(s,t) образуют решение задачи E.71) на интервале J, t ^ s G J. Тогда дробно-линейная функция от к e x(s, t- к) = x(s, t) + г _ E.73) удовлетворяет граничному условию x(s, s;k) = к и уравнению Риккати E.71а) в каждой точке J, где kz(s,t) ф 1. Доказательство теоремы получается непосредственной проверкой и его приво- приводить не будем. Однако отметим, что этот результат используется для констру- конструирования системы функциональных уравнений, эквивалентных ассоциированной системе E.71). Теорема 5.11. Пусть функции х = x(s,t), у = y(s,t) и z = z(s,t) образуют решение задачи E.71) на интервале J. Тогда для точек s* < t < s того же
156 Гл. 2. Алгебраические и дифференциальные уравнения интервала справедливы функциональные уравнения x(s,t) =x(t,r) l-x(s,t)z(t,rY 5^т, E.74) Обратно, если функции х = x(s,?), ?/ = y(s,t) и z — z(s,t) — непрерывные ре- решения функциональных уравнений E.74), удовлетворяющие граничным условиям x(s,s) = y(s,s) = z(s,s) = 0 и имеющие частные производные по ?, то сущест- существуют функции a(t), b(t) и c(t) такие, что в области s,t G J, s ^ ?, удовле- С/ Z ( S S ) творяются дифференциальные уравнения E.71), E.72), причем a(s) = —^—, b(s) = ^, Ф) = . Используем функциональные уравнения E.74) для введения бинарной опера- операции на тройках функций x(s,t), v = ey(s^ и z(s,t), которую обозначим символом 0 и будем называть R-произведением: [2 -Ж1^2 1-X1Z2 Следствие 5.4. Задача Коши E.71) эквивалентна уравнению Операция R-перемножения, определяемая формулой E.75), изоморфна пере- перемножению матриц Zi которые известны в теории линий передачи в электротехнике как матрицы пере- передачи и связывают амплитуды падающих и отраженных волн слева и справа отрез- отрезка линии. Несмотря на кажущуюся искусственность и некоторую изощренность, перемножение E.76) имеет физический смысл композиции матриц передачи при припасовывании отрезков линии передачи. Тройке [x,v,z] можно поставить в соответствие матрицу которая имеет физический смысл матрицы рассеяния волн, падающих на отрезок линии передачи слева и справа, причем R-перемножение E.75) интерпретируется
§ 2.5. Скалярное уравнение Риккати 157 как закон композиции матриц рассеяния при припасовывании отрезков линии передачи. Вхождение в матрицу рассеяния E.77) функций x(s,t) и z(s,t) имеет физичес- физический смысл коэффициентов отражения отрезка при падении волн слева и справа, функция v(s,t) = ey(s^ — смысл коэффициента преломления. Если распростра- распространение волн в линии происходит с потерями (без потерь) энергии, то из закона сохранения энергии следует неравенство < 1 (равенство = 1) для модуля ко- коэффициента отражения — решения уравнения Риккати — и нормы матрицы рассеяния. В связи с этим вводится Определение 5.1. Тройка [x,v,z] называется диссипативной, если матрица E.77) определяет преобразование сжатия, и называется консервативной, если матрица E.77) унитарна, т.е. если она удовлетворяет условию М*М = Е, где Е — матрица тождественного преобразования. Таким образом, поставив в соответствие уравнению Риккати задачу Коши E.71), мы определили тройку функций х = x(s, ?), у = y(s, t) и z = z(s, ?), которой соответствуют вполне определенные физические понятия, и поэтому сама задача E.71) имеет физическое содержание. Однако, при этом, для полноты описания всех закономерностей в рассматриваемых процессах, целесообразно считать, что а(?), b(t) и c(t) являются комплекснозначными функциями вещественного аргу- аргумента. Следствие 5.1. Если две тройки диссипативны (консервативны), то таково же их R-произведение. Теорема 5.12. Пусть функции х = x(s,t), у = y(s,t) и z — z(s,t) образуют решение задачи Коши E.71) на интервале J, причем функции а, Ъ и с кусочно- непрерывны. Тогда , если тройка [x,y,z] диссипативна (консервативна), то не- непрерывное дробно-линейное преобразование к —> x(s,t;k) no формуле E.73) ото- отображает единичный круг \к\ ^ 1 в себя ( на себя). Теорема 5.13. Пусть a(t), b(t) и c(t) непрерывны на интервале J и, сле- следовательно, задача Коши имеет непрерывное решение [x(s,t),y(s,t),z(s,t)] для s,t G J. Тогда: а) тройка [x(s, ?), еу^8^\ z(s, t)] диссипативна во всей области s ^ t G J, если и только если a(t) + c(t) | + 2 Re b(t) ^0, t G J; б) тройка [x(s,t),ey^S:t\z(s,t)] диссипативна во всей области s ^ t —> J, если и только если \a(t) + c(t)\ - 2Reb(t) ^0, t G J; в) тройка [x(s, ?), еу^3^\ z(s, t)] консервативна при выполнении следующего ус- условия: \a(t) +c(t\) = | Reb(t)| = 0. Другое понятие диссипативности и консервативности решения уравнения Рик- Риккати введено для изучения физической модели диффузии частиц вдоль стержня и на этом пути получены результаты, аналогичные только что сформулированным. Однако, на этом останавливаться не будем, поскольку все эти понятия основаны на статистических характеристиках процесса.
158 Гл. 2. Алгебраические и дифференциальные уравнения § 2.6. Матричное дифференциальное уравнение Риккати Во всех последующих параграфах этой главы рассматривается дифференци- дифференциальное уравнение X = Q(t) + A(t)X + XB(t) + XR(t)X, F.1) в котором Q(t), A(t), B(t) и R(t) — заданные п-квадратные матрицы, определен- определенные на некотором (конечном или бесконечном) отрезке времени ?, X — искомая n-квадратная матрица. 1. Простейшие свойства уравнения. Отметим некоторые простейшие свойства уравнения F.1), которые в дальнейшем окажутся полезными при ре- решении различных задач. Свойство 1. Тип уравнения не изменяется при замене независимой перемен- переменной по формуле t = (р(т), где (р(т) — произвольная дифференцируемая функция. Свойство 2. Если матрица Д существует, то заменой Y = RX уравнение F.1) приводится к виду Y = Qi(t) + A^t)Y + YB^t) + Г2, F.2) где Qi = RQ, Аг = (RA + Д)Д"\ Вг = В. Доказательство. Если обе части уравнения F.1) умножить слева на R и ввес- ввести соответствующие обозначения, то получим уравнение F.2). Свойство 3. Заменой переменной Y = Z-B1 F.3) уравнение F.2) приводится к виду Z = Q2 + A2Z + Z2, F.4) где А2 = А\ — ??i, Q2 = Qi — А\В + В\. Аналогично, заменой У = г-Аг F.5) уравнение F.2) приводится к виду Z = Q3 + ZB3 + Z2J (б.б) где В3 = В1 - Аи Q3 = Qi- АгВ2 - Аг. Теорема 6.1. Если X = X\(t) — частное решение уравнения F.1), то с по- помощью замены X = Y + X! F.7) это уравнение сводится к уравнению Бернулли Y = A3Y + YB3 + YRY, F.8) где А3 = А + ХгЯ, В3=В + ЯХг. F.9) Доказательство. Так как X = X\(t) — решение уравнения F.1), то справед- справедливо тождество Хф) = Q(t) + A(t)Xi(t) +Хф)В(г) + X1(t)R(t)X1(t). Поэтому, подставляя замену F.7) в уравнение F.1), получим уравнение F.8).
§ 2.6. Матричное дифференциальное уравнение Риккати 159 Теорема 6.2. Если X\(t) — частное решение уравнения F.1), a Z = Z\(t) и U — U\ (t) — неособенные решения уравнений Z = -B3(t)Z, F.10) U = -UA3{t), F.11) соответственно, где матрицы А3 и В3 определяются формулами F.9), то общее решение уравнения F.1) находится одной квадратурой. Доказательство. В соответствии с теоремой 6.1, уравнение F.1) сводим к уравнению Бернулли F.8) заменой X = Y+X\. Как отмечалось в § 2.4, уравнение F.8) сводится к линейному уравнению V + B3V + VA3 = -R F.12) с помощью замены V = У. F.13) В том же § 2.4 показано, что общее решение уравнения F.12) можно предста- представить в виде V = V° + V!, F.14) где Vi — частное решение этого уравнения, а У0 — общее решение соответству- соответствующего однородного уравнения W + B3(t)W + WA3(t) = в. F.15) Общее решение этого уравнение можно представить в виде (см. § 2.4) V° = Z1(t)CU1(t), F.16) где С — произвольная постоянная матрица, a Z\(t) и U\(t) — неособенные реше- решения уравнений F.10) и F.11). Зная общее решение F.16) уравнения F.15), мы можем определить частное решение V\ неоднородного уравнения F.12) методом вариации постоянной матрицы С (см. § 2.4). Если теперь в цепочке преобразований переменных, которые использовались в ходе доказательства теоремы, вернуться к исходной переменной X, то можно определить структуру решения исходного уравнения Риккати в зависимости от произвольной постоянной матрицы С: X = (ZiCT/i + V1)-1 + Xi. F.17) Теорема 6.3. Матрица X(t) = (Z(t)CU(t) + ^(t)) + S(t), где С — про- произвольная постоянная матрица, Z(t) и U(t) — неособенные матрицы, a Z(t), U(t), Z~x, t/~1(t), S(t) и R(t) дифференцируемы, является решением некоторого уравнения Риккати. Доказательство. Согласно теореме 4.5, матрица V = X - S = (ZCU + К)~г является решением некоторого уравнения Бернулли. Отсюда следует, что X яв- является решением уравнения Риккати. Теорема 6.4. Пусть Х\, Х<2, Х3 и Х/^ — частные решения уравнения F.1), aU(t) — неособенное решение уравнения U + UA3(t) =0, где A3(t) определяется
160 Гл. 2. Алгебраические и дифференциальные уравнения формулой F.9). Тогда существует постоянная матрица Со такая, что U(X4 - Хг)(Х4 - Х2)-\Хг - Х2)(Х3 - ХгГ1^1 = Со. F.18) Доказательство. В соответствии с теоремой 6.2, общее решение уравнения F.1) можно представить в виде (см. F.17)) X = (ZCU + У) + Х\. Придавая матрице С конкретные значения, определим решения Х2, Х3 и Х^ в следующей форме Xi = (ZdU + V^+Xu i = 2,3,4. Отсюда получаем (Xi - X{)(ZCiU + U) = E, i = 2,3,4, где E — единичная матрица, и поэтому Z(Ci - Cj) = [(Xi - Хг)-1 - (Xj - X^p-1, i,j = 2,3,4, i ф j F.19) Равенства F.19) можно представить в виде z{Ci - Cj) = (Xi - x1)-\xj - хх Следовательно, справедливы равенства Z(C2 - С3) = (X2 - ХгГ^Хз - X2)(X3 - Z(C2 - C4) = (X2 - X1)~1(X4 - X2)(X4 - Xi)!/-1. Предполагая, что матрицы С2 - Сз и С2 - С4 обратимы, получаем равенство (Х3 - Х2)(Х3 - Хг)-1!!-1^ - Сз) = (Х4 - Х2)(Х4 - X^U^iCi - C4)-\ Отсюда получаем равенство F.18), в котором Со = (С2 — С^)~1(С2 — Сз). Замечание 1. В формуле F.19) использовано решение U уравнения F.11). Однако, можно получить аналогичную формулу, в которой вместо U фигурирует решение Z уравнения F.10). Точнее, тем же способом можно доказать справед- справедливость соотношения Z-^Xs - ХгГНХз - Х2)(Х4 - Х2Г\Х4 - XX)Z = С, F.20) где С — постоянная матрица. 2. Уравнение с постоянными коэффициентами. Рассмотрим уравнение X = Q + АХ + ХВ + XRX, F.21) где Q, А, В и R — постоянные матрицы. Доказанные выше теоремы о решени- решениях уравнения Риккати, а также результаты анализа алгебраического уравнения Риккати (см. § 2.3) можно использовать для получения общего и частного реше- решений уравнения F.21). Сначала возьмем наиболее простое уравнение X = X2 - Q. F.22) Очевидно, что каждый корень уравнения X2 -Q = 0, F.23) где О — нулевая матрица, является частным решением уравнения F.22). Пусть Х\ — один из таких корней. Тогда заменой X = Y + Хг F.24) уравнение F.22) сводится к уравнению Бернулли Y = X{Y + YX\ + Y2. Вводя замену Z = Y~1, F.25)
§ 2.6. Матричное дифференциальное уравнение Риккати 161 получаем уравнение Z + XXZ + ZX1 +E = 0. F.26) Его общее решение находим в виде Z = U(t)CV(t) + Uu F.27) где U(t) и V(t) — неособенные решения уравнений U = -X1U, V = -VX1(t), F.28) a Gi — частное решение уравнения F.26). Если, в частности, матрица Х\ не яв- является особенной (т.е. Х~г существует), то в качестве JJ\ можно взять решение алгебраического уравнения X\U + JJX\ = — Е. Выражая, наконец, X через Z и JJ\ в соответствии с формулами F.24), F.25) и F.27), получаем общее решение уравнения F.22) в виде X(t) = (U(t)CV(t) + иг)'1 + Хг. F.29) Тем самым доказана Теорема 6.5. Общее решение уравнения F.22) представляется в виде F.29), где Х\ — некоторое решение квадратного уравнения F.23), U(t) uV(t) — неосо- неособенные решения уравнений F.28), aU\ — частное решение уравнения F.26). Пример 6.1. Требуется найти общее решение уравнения /-2 { _2y (б.зо) Сначала находим решение уравнения X2-Q = 0. F.31) Как показано в примере 2.1, это уравнение имеет два решения (см. B.12)) (пу \ / /2 \ гл/2 -г—г | у I -iV% i~r I (а ъо\ 4 , А2 = I 4 F.32) 0 гл/2 / \ 0 -гл/2/ Возьмем первое из них, т.е. Xi, и в уравнении F.30) сделаем замену переменной X = Y + Xl F.33) В итоге получим уравнение Y = X{Y + YX\ + F2, для решения которого делаем еще одну замену Z = y-1. F.34) Получаем линейное неоднородное уравнение Z + XiZ + ZXi = -E. F.35) Сначала решаем однородное уравнение U = -.Tl?r, .Y, = f ^ 0 гл/2
162 Гл. 2. Алгебраические и дифференциальные уравнения Чтобы определить матрицу U, решаем векторное дифференциальное уравнение х = —Х\х. Имеем два линейно независимых решения /ехр(-гл/2?)\ (х^\ = ( i^-texp (-iy/2t) V О У' К***) которые и определяют матрицу .л/2 тт — I схр (—гл/2^) i—— и — \ 4 О Аналогично находим частное решение уравнения V = — VX\. Опуская проме- промежуточные выкладки, запишем окончательный результат. Частное решение этого уравнения получается изложенным выше способом в виде / . г ч гл/2 / л/2 \ \ V(t) = 6ХР (-<V^} ^t6XP ^TV . F.37) \ 0 exp(-iy/2t) ) Следовательно, общее решение однородного уравнения U = —X\U — UX\ можно представить в виде Uo(t) = U(t)CV(t), где С — произвольная постоянная матри- матрица. Частное решение JJ\ уравнения F.35) находим из линейного алгебраического уравнения X\U + UX\ = —E. Из него получаем, что л/2 .л/2 Таким образом, общее решение уравнения F.35) можно представить в виде Z = U(t)CV(t) + U!, F.39) где U(t), V(t) и JJ\ определяются формулами F.36), F.37) и F.38), а С — про- произвольная постоянная матрица. Тогда, в соответствии с теоремой 6.5 и формулой F.29), можно записать общее решение уравнения F.30) в следующем виде X(t) = (U(t)CV(t) + t/i) + Хь F.40) где матрица Х\ определяется первой формулой из F.32). Аналогичный результат можно получить, если при построении общего решения этого уравнения с самого начала вместо Х\ взять матрицу Х2, определяемую второй формулой из F.32). Рассмотрим теперь более общий случай, когда уравнение F.1) можно привести к виду Х = (X - А)(Х - В). F.41) В этом случае в качестве частного решения уравнения можно взять Х\ = А. Все последующие рассуждения, связанные с построением общего решения, не отличаются от того, что приведено выше и проиллюстрировано примером 6.1. Если уравнение F.1) не приводится к виду F.22) или F.41), то для построения его общего решения по предложенной методике следует найти решение алгебра-
§ 2.6. Матричное дифференциальное уравнение Риккати 163 ического уравнения Q + АХ + ХВ + XRX = 0. Методы решения такого типа уравнений изложены в § 2.3. Поэтому можно счи- считать, что на этом пути принципиальных трудностей в решении рассматриваемой задачи нет. Наиболее существенные сложности в построении общего решения уравнения F.1) связаны с получением собственных значений матриц и опре- определением соответствующих им элементарных делителей. Однако, эти вопросы достаточно подробно рассмотрены в первой главе. Пример 6.2. Требуется найти общее решение уравнения . F.42) Для определения постоянного решения этого уравнения выписываем уравнение Q + X + X2 = 0. В примере 3.9 получены четыре его решения. Возьмем одно из них (см. C.63)): / 1 0 0\ Х1 = -1/3 1 0 F.43) V 0 0 2/ и в уравнении F.42) произведем замену переменной, положив X = Y + Х\. В итоге получим уравнение Бернулли Y = X{Y + YX\ + У2, которое реша- решаем с помощью еще одной замены Y — Z. В результате получаем линейное дифференциальное уравнение Z + XXZ + ZXX = -E. F.44) Для получения его общего решения находим неособые решения двух уравнений U = —XiU, V = —VX\. Несложными вычислениями находим эти решения F.45) Частное решение Z\ уравнения F.44) получаем, решая матричное алгебраическое /-1/2 0 0 уравнение XiZ+ZXi = —Е. Отсюда находим, что Z\ — -1/6 -1/6 0 V 0 0 -1/4, Следовательно, общее решение уравнения F.44) можно также представить в виде Z — U(t)CV(t) + Zi, где С — произвольная постоянная матрица, U(t) и V(t) определяются формулами F.45). В соответствии с теоремой 6.5 и формулой F.29), общее решение уравнения F.42) можно представить в виде X(t) = (U(t)CV(t) + Zi) + Хи F.46) где Х\ находится по формуле F.43). 3. Существование решения. Подобно тому, как это сделано в § 2.5 для скалярного уравнения, рассмотрим вопрос о существовании решения уравнения
164 Гл. 2. Алгебраические и дифференциальные уравнения F.1). Будем предполагать, что матрицы Q(t), A(t), B(t) и R(t) непрерывны на отрезке a^t^b. F.47) Изложенные выше практические способы построения решения этого уравнения не дают ответа на вопрос о том, на каком отрезке времени определено решение и в каком случае решение задачи Коши для такого уравнения является единствен- единственным. Здесь мы покажем, как можно построить решение уравнения F.1) во всей области его существования. С этой целью определим две n-мерных вектор-функции x(t) = {xi,... ,хп} и y(t) = {2/1,... ,уп} как решение системы дифференциальных уравнений х = -B(t)x - R(t)y, у = Q(t)x + A(t)y, F.48) удовлетворяющее начальному условию x(to) = x°, y(to)=y°. F.49) Обозначим, далее, через W(t, to) 2п-мерную матрицу Коши системы уравнений F.48). Тогда решение задачи Коши F.48)-F.49) можно представить в виде z(t) = W(t,to)z°, z = {х, у}, z° = {x°,y0}. F.50) Если же матрицу W(t,to) представить через ее n-мерные блоки w(tt\f W (ht0) ~ \W2i(t,t0) W22(t,t0) то формулу F.50) можно записать в виде ( x(t) = Wu(t, to)x° + W12(t, to)y°, \y(t) = W21(t,to)x° + W22(t,to)y0. При этом очевидно, что выполняются равенства Wu(t,t) = E, Wij(t,t)=e при i^j. F.52) Ясно также, что решение F.51) определено на отрезке F.47). Обозначим через K(t) матрицу такую, что y(t) = K(t)x(t). F.53) и покажем, что она удовлетворяет уравнению F.1) во всех тех точках отрезка F.47), в которых она непрерывна и дифференцируема. Так как векторы x(t) и y(t) образуют решение системы уравнений F.48), то из равенства y(t) = K(t)x(t) + K(t)x(t) получаем K(t)x(t) = K(t)[B(t)x(t) + R(t)y(t)] + Q(t)x(t) + A(t)y(t). Подставляя в это соотношение вместо y(t) его значение из F.53), получаем ра- равенство, которое можно записать в виде [K(t) - Q(t) - A(t)K(t) - K(t)B(t) - K(t)R(t)K(t)]x(t) = 0, F.54) где через 0 обозначен нулевой n-мерный вектор. Равенство F.54) должно выполняться при любых значениях вектора x(t). По- Поэтому выражение в квадратных скобках этого равенства должно представлять собой матрицу с нулевыми элементами, а это означает, что K(t) — решение уравнения F.1).
§ 2.6. Матричное дифференциальное уравнение Риккати 165 Чтобы дать аналитическое представление матрицы K(t), воспользуемся со- соотношениями F.51). Допустим, что нас интересует решение уравнения F.1), которое удовлетворяет условию К(Т) = F, а^Т О, F.55) где F — заданная матрица. В равенстве F.51) заменим t на Т, a to на t. В результате получим равенство Г х(Т) = Wu{T,t)x{t) + W12(T,t)y(t), \ 0.00 | у(Т) = W2i(T,t)x(t) + W22(T,t)y(t). V J Если теперь воспользоваться тем, что у(Т) = К(Т)х(Т) и у(Т) = Fx(T), то, с уче- учетом F.56), получаем y(t) = [VF22(T, t) -FW12(T, t^'^FWuiT, t) - W2i(T, t)]x(t). Следовательно, решение K(t) уравнения F.1), удовлетворяющее начальному усло- условию F.55), определяется формулой Kit) = [W22(T,t) + FW12(T,t)]-1[FW11{T,t) +W2i(T,t)}. F.57) Из этой формулы, в частности, можно получить и некоторую характеристику свойства решения задачи F.1), F.55). Если изучать поведение решения задачи Коши на отрезке времени а ^ t ^ Т, то очевиден факт, что это решение определено лишь на отрезке t\ < t ^ T, где t\ — ближайшая к Т точка, в которой матрица ^22(^1) — FWi2(t,ti) необратима. Замечание 2. Теоремой 6.3 утверждается, что общее решение уравнения F.1) можно представить в виде X(t) = (Z(t)CU(t) + Rit))'1 + S(t). F.58) Если в этом решении сделать незначительные преобразования, то его можно при- привести к виду F.57). В самом деле, перепишем функцию F.58) в форме X(t) = (Z(t)CU(t) V(t) = U(t)S(t), 5i(t) = E + R(t)S(t). Отсюда X(t) = (CU(t) +Y(t))-1Z-1(t)[Z(t)CV(t) + Si(?)], Y(t) = Z^ifyRit) и, следовательно, X(t) = (CV(t) + Yit^iCVit) + Q(t)], Q(t) = Z-^S^t). F.59) Функции F.57) и F.59) действительно имеют одинаковую структуру. Замечание 3. Так как каждое из решений F.57) и F.59) представляет собой произведение одной (обратной) матрицы на другую матрицу, то связь между линейным уравнением и уравнением Риккати F.1) может быть установлена с помощью замены X(t) = U-\t)V(t), F.60) где U и V — подлежащие определению матрицы. Так как матрица F.60) должна удовлетворять уравнению F.1), то должно
166 Гл. 2. Алгебраические и дифференциальные уравнения выполняться тождество = Q(t) Это тождество можно представить в виде U-\t){U(t) + U(t)A(t) 1 _ t/-i{y(t) - V(t)B(t) - U(t)Q(t)} = в. Полученное тождество будет выполняться, если матрицы U(t) и V(t) являются неособенными и образуют решение системы уравнений U + UA(t) + VR(t) = <9, V - UQ(t) - VB(t) = в. F.61) § 2.7. Групповой анализ уравнения Риккати Одно из важнейших приложений теории групп Ли связано с решением диф- дифференциальных уравнений и классификацией этих уравнений по их групповым свойствам. Некоторые из таких результатов имеют непосредственное отношение к уравнению Риккати. Поэтому анализ уравнений начнем с формулировок, а при необходимости, и с обсуждения соответствующих общетеоретических фактов. 1. Группы, допускаемые уравнениями. Фундаментальные решения. Будем рассматривать систему обыкновенных дифференциальных уравнений где функции Фг предполагаются непрерывно дифференцируемыми необходимое число раз по совокупности всех своих аргументов, t — скалярная независимая переменная, у = {^д,... ,уп\ —вектор зависимых переменных, а символом —— обозначен вектор dt™ \ сЙ™1 '""' dt™n J' [ ' } TTii,... ,?тгп — некоторые постоянные. Задача состоит в том, чтобы, используя аппарат теории групп Ли, указать способы решения таких уравнений и привести их групповую классификацию. С этой целью рассмотрим многопараметрическую группу точечных преобра- преобразований t* = Ж2/ъ--->2/п,ао,а1,...,ар), /(t,^/b ... ,^/п, 0,..., 0) = ?, G.2) Vi = 9i(t,Vi,- • • ,Уп,а>о,а>1,- • • ^р), 9i(t,yi,-.. ,^/n, 0,..., 0) = ^, г = 1,.. .,п. G.3) Разлагая функции / и gi в ряды Тейлора, преобразованиям G.2), G.3) можно
§ 2.7. Групповой анализ уравнения Риккати 167 придать вид з=о t, У) + • • •, G.5) з=о которые порождают инфинитезималъные операторы г) П г) хз = а1?з(*>у) + щЕ1о^:г1»Ы, j = o,i,...,p. G.6) Предполагая, что все параметры ао, ai,..., ар независимы (т. е. не могут быть заменами сведены к меньшему числу), находим, что операторы G.6) линейно независимы (вторая основная теорема Ли). Значит, не существует таких, не всех равных нулю, чисел Ао, Ai,..., Ар, что Ао^о + AiXi +... + \рХр = 0. Числа Aj, j = 0,1,...,р, при этом считаются независящими от ?,?/i,... ,уп. Поэтому операторы G.6) можно взять базисом в пространстве операторов, свя- связанных с данной группой. Любой оператор X этого пространства можно пред- представить в виде 3 = 0 где Ао, Ai,..., Хр — координаты оператора X в этом пространстве. Произведение операторов в нем определяется как коммутатор [U, V] = UV- VU. G.8) Коммутатор обладает двумя важнейшими свойствами, которые заключаются в следующем. Для любых операторов U, V и W справедливы равенства: 1) [U, V] = — [V, U]— свойство косой симметрии; 2) [[[/, У], W] + [[W, U],V} + [[У, W],U] = 0 — тождество Якоби. Так как коммутатор G.8) принадлежит тому же пространству, то существуют постоянные Cfj такие, что ^^Х8. G.9) Числа Cfj, г, j, s = 0,1, ..., р, называются структурными константами группы и определяют группу однозначно. Линейное пространство операторов группы G.2), G.3) с введенной в нем опе- операцией умножения операторов называется алгеброй Ли. Таким образом, абстрактное определение алгебры Ли не связано ни с группами, ни с операторами и определяется посредством введения в линейном пространстве кососимметрической и удовлетворяющей тождеству Якоби операции умножения. Тем не менее, алгебра Ли однозначно определяет соответствующую ей группу Ли, если ее элементами являются операторы из указанных выше функциональных пространств. Ту же алгебру Ли можно получить, если воспользоваться общими построения-
168 Гл. 2. Алгебраические и дифференциальные уравнения ми, которые были приведены в § 1.6, когда алгебра строится исходя из операторов, определяемых производной Ли. Этой методикой мы воспользуемся при анализе матричного уравнения Риккати. Пока же ограничимся этими общими замечани- замечаниями и займемся вопросами, которые имеют непосредственное отношение прежде всего к скалярному уравнению Риккати. Для этого рассмотрим однопараметрическую группу G\ преобразований y' = g(t,y,a), g(t,y,O) = y, G.11) где у = {з/ъ ... ,2/п}? 9 — {di? • • • i9n}- Ей соответствует инфинитезимальный оператор3 X = ?(?,2/) Ь rf(t?y) •> G-12) в котором df(t,x,a) да dgdt,y,a) а=0 да G.13) а=0 Поскольку исходное уравнение G.1) имеет порядок т = maxjmi,... ,mn}, то т-е продолжение оператора G.12) можно представить в виде X = X + Cij-^-, G.14) т dyij где введены обозначения С1 = ?>(»,*) - VilD@, Cij = DiC'i-1) - VijD@, F) г) D = — +j l i l dt dt dyij-x Как отмечалось в первой главе, система уравнений G.1) допускает однопара- однопараметрическую группу тогда и только тогда, когда выполняются условия ХФг = 0, г = 1,...,п. G.15) т Эта система (называемая системой определяющих уравнений) вместе с уравне- уравнениями Ли df_=^fgi gn) f\ =t ,dfl ' a=0 ' d9i (t \ I -i -^ = riKJ,gi,---,gn), 9i\a=0=yi, г = l,...,n, определяет все группы, допускаемые системой уравнений G.1). В соответствии с формулой продолжения G.14), определяющие уравнения пред- представляют собой систему линейных однородных дифференциальных уравнений относительно координат ? и Т]г оператора G.12). Так как эти координаты ищут- ищутся как функции от t и у\,... ,уп, а в определяющие уравнения входят также и производные yij(t), то полученная система уравнений относительно ? и т]г будет переполненной, что облегчает решение полученных уравнений. 3Здесь произведения суммируются по повторяющемуся индексу.
§ 2.7. Групповой анализ уравнения Риккати 169 Естественно возникает вопрос: а что дает знание группы, допускаемой данной системой уравнений? Один из ответов на этот вопрос дает следующий Пример 7.1. Рассмотрим уравнение Риккати у + у2 = 2/t2. G.17) Выпишем для него инфинитезимальный и первый продолженный операторы в соответствии с формулами G.12), G.14) и G.15) х-х с1 — dt +Уду' Уравнение G.17) переписываем в виде F(t,y,y) = у + у2 - 2/t2 = 0. Тогда определяющее уравнение XF = 0 принимает следующий вид 4t~3^-\-2yr]-\-A = 0, .-, дп .дп . с?? .9<9? тт ., С = ——\- у— у— у — • Исключая из этих соотношений С и подставляя at oy at oy в полученное уравнение вместо производной у ее значение из G.17), получим одно уравнение B/t3 - у2J^ + B/t2 - у2) ? - ^ - 4/t3? - 2уг] - ^ = 0 oy \ot oy) at относительно двух неизвестных функций ? и 77. Легко проверить, что оно имеет решение ? = t, 77 = —2/. Следовательно, уравнения Ли принимают вид — = /, /| _ = t, — = — g, ^| _ = ^/. Решая их, did did находим группу преобразований, допускаемых уравнением G.17): f = tea, у' = уе~а, G.19) v д Э с инфинитезимальным оператором X = t— У~^~- ot oy Под действием группы G.19) всякое решение уравнения G.17) переходит в его же решение, а значит, всякий интеграл J(t,y) = С перейдет в интеграл J(t',y') = С'. Поэтому интегралом будет XJ = С. Записывая уравнение Риккати G.17) в виде dy - B/t2 - y2)dt = 0, G.20) находим, что оно эквивалентно уравнению в частных производных следующего дФ дФ вида ——Ь B/t —у)-^— = 0. Значит, относительно интеграла J(t,y) = С можно at oy dJ /rt, 9 9^дJ r, dJ dJ T, T4 записать два соотношения —- + B/t — у )-r— = 0, t— 2/тг" = Ф(«/)? гДе введено at a^/ at oy gj (y2 — 2/t2)Ф(J) обозначение XJ = \?(J). Отсюда получаем равенства —- = ^-—^ , L •> dt t(y2 - 2/t2) - у dJ Ф(«7) dJ (y2 -2/t2)dt + dy или T^TTV = -TTb WT^\ • B результате получаем = rтгтили = rтгт• dy t(y2-2/t2)-y ФG) t(y2 - 2/t2) - у интегрирующий множитель а = ty2 - у - 2/t t2y2 -ty-2 Умножая обе части уравнения G.20) на этот множитель и интегрируя полу-
полу170 Гл. 2. Алгебраические и дифференциальные уравнения 2t3 + C ченное уравнение, находим его решение в виде у = — —-. t(t — С) Рассмотренный пример показывает, что использование инвариантных реше- решений позволило найти интегрирующий множитель без использования каких-либо искусственных приемов. Знание интегрирующего множителя позволяет стан- стандартным способом получить общее решение уравнения. Следующее направление в использовании теории групп в решении дифферен- дифференциальных уравнений основано на применении следующей теоремы. Теорема 7.1. Всякая однопараметрическая группа G1 локальных преобразова- преобразований G.10), G.11) преобразованием t = F(t,y), y = G(t,y) G.21) приводится к группе переноса вдоль оси i: t' = t + а, у' = g(t,y,a), g(t,y,O) = у. G.22) Поскольку доказательство конструктивно, приведем его полностью. Доказательство. Инфинитезимальным оператором X группы G1 является оператор G.12) с коэффициентами G.13). Выберем п функционально независи- независимых инвариантов Ji(t,?/), ..., Jn(t,y) группы G1 в качестве новых переменных 2/i,..., уп, а переменную t найдем из уравнения Xt=l. G.23) Полученная система функций i = T(t,y), y\ = Ji(t,y),... ,уп = Jn{t,y) функ- функционально независима и определяет искомую замену переменных. Действитель- Действительно, как нетрудно показать, в этих переменных оператор G.12) принимает вид X = —- и определяет группу переноса вдоль оси i. Теорема доказана. ot Применим эту теорему к решению уравнения Риккати, рассмотренному в пре- предыдущем примере. Пример 7.2. Уравнение y + y2 = 2/t2 G.17) F) г) допускает группу G1 с оператором X = t— Утг- ot oy Находим инвариант J(t,y), как решение уравнения XJ = 0. После несложных вычислений находим, что J(t,y) = ty. Одним из решений уравнения XF = 1 является функция F = Int. Поэтому вводим замену переменных t = lnt, y = ty. G.24) В результате оператор X преобразуется к виду X = ^, который определяет группу переноса вдоль оси Ot. Если же замену G.24) сделать в уравнении G.17), то оно приводится к виду A11 II I 1 —=+у2-у-2 = 0, которое легко интегрируется и дает In =Ы + С. at у — 2 Таким образом, знание группы в рассмотренных примерах позволило решить
§ 2.7. Групповой анализ уравнения Риккати 171 уравнение Риккати двумя различными способами. Продолжая обсуждение проблем интегрирования обыкновенных дифференци- дифференциальных уравнений, остановимся на вопросе о том, какие уравнения (кроме линей- линейных) обладают фундаментальной системой решений, так что задача построения их общих решений сводится к нахождению конечного числа частных решений. Оказывается, что этот вопрос решается также при помощи теории групп. Будем говорить, что система уравнений ^=Fi(t,yi,...,yn), i = l,...,n, G.25) обладает фундаментальной системой решений, ук = {г/f,...,укп} = ipk(t), к = 1,...,т, G.26) если общее решение этой системы можно представить в виде у = (^((^1 (?),..., (pm(?),ci,...,cn), G.27) где ci,..., сп — произвольные постоянные, а у = {у\,..., уп}. Система частных решений G.26) при этом называется фундаментальной системой частных реше- решений уравнений G.25). Основной результат, относящийся к проблеме уравнений с фундаментальными решениями, получен Софусом Ли и он состоит в следующем. Теорема 7.2. Система уравнений G.25) обладает фундаментальной систе- системой решений, если она представима в виде ^ = Тг(*)#(у) + ... + Tr(t)?(y), г = 1,..., п, G.28) так, что операторы4" образуют г-мерную алгебру Ли a Ti(?),... ,ТГ(?) — некоторые скалярные непре- непрерывные функции. При этом число т необходимых частных {фундаментальных) решений G.26) удовлетворяет условию пт ^ г. G.30) 2. Скалярное уравнение Риккати. Теорема 7.2 позволяет найти все обык- обыкновенные дифференциальные уравнения вида G.25), имеющие фундаментальную систему решений, сводя задачу к перечислению всех групп Ли преобразований с конечным числом параметров (или соответствующих конечномерных алгебр Ли операторов G.29)) в n-мерном пространстве переменных у1,... ,уп. Такое перечисление выполнено для прямой п = 1 и для плоскости п = 2. Рассмотрим случай, когда п = 1. В этом случае выбор ограничен: всякая группа преобразований на прямой совпадает (с точностью до замены перемен- переменных) с группой проективных преобразований, трехмерной алгеброй Ли с базисом операторов Xi = ^~, Х2 = У7Г, Хз = 2/2|- G.31) ду ду ду Напоминаем, что в последующей формуле произведения суммируются по повторя- повторяющемуся индексу.
172 Гл. 2. Алгебраические и дифференциальные уравнения или же с некоторой ее подгруппой. Операторы G.31) определяются коэффициен- коэффициентами fi(s/) = 1, &(у) = У, Ыу) = У2- Следовательно, общий вид уравнения G.28) в одномерном случае является та- таким: ^L=P(t) + Q(t)y + R(t)y2, G.32) что представляет наиболее общую форму скалярного уравнения Риккати. Это означает, что при п = 1 уравнение Риккати является наиболее общим урав- уравнением, имеющим фундаментальную систему решений. Таким образом, уравне- уравнение Риккати — это своеобразная реализация группы проективных преобразова- преобразований. Отражением этого факта является теорема о постоянстве ангармонического отношения любых четырех решений уравнения Риккати. В § 2.5 эта теорема была получена путем классического анализа частных решений (см. следствие 5.2). В том же параграфе было установлено, что дробно-линейное преобразование зависимой переменной переводит уравнение Риккати в уравнение того же типа. Интересным дополнением к этому результату является следующее утвержде- утверждение, которое приведем без доказательства. Теорема 7.3. Всякая группа преобразований в одномерном пространстве изо- изоморфна с группой дробно-линейных подстановок или какой-либо ее подгруппой. Итак, каждому уравнению Риккати G.32) соответствует по теореме 7.2 трех- трехмерная алгебра Ли Ь% или ее подалгебра (одно- или двумерная). Оказывается справедливой следующая Теорема 7.4. Уравнение Риккати G.32) линеаризуется преобразованием за- зависимой переменной у в том и только в том случае, когда оно может быть представлено в специальном виде ^y) G.33) так, что операторы Х1=Ш^, Х*=ш1у G-34) образуют алгебру Ли Lr размерности г = 2 или г = 1, т. е. [Х1,Х2] =аХг+рХ2 G.35) или Х2 = olX\ с постоянными коэффициентами а и /3. Доказательство. Сначала отметим, что любая замена переменной у сохраня- сохраняет уравнение G.33) и структурное соотношение G.35). Поэтому линеаризируе- линеаризируемому уравнению G.33) соответствует алгебра Ли Lr, r ^ 2; в двумерном случае (г = 2) линеаризирующей является замена, приводящая базис алгебры Ь2 к виду *1 = 7Г' Х*=У1Г- G-36) ду ду Докажем теперь, что если операторы G.34) образуют алгебру Lr, r ^ 2 то уравнение G.32) линеаризуется. При г = 1 имеем feiy) — &€i(y) и G.33) ста- новится уравнением с разделяющимися переменными — = [Xi(t) + aT2(t)]?i(y), которое, очевидно, линеаризируется. В случае, когда г = 2, для доказательства
§ 2.7. Групповой анализ уравнения Риккати 173 теоремы достаточно показать, что всякая двумерная алгебра L2 на прямой при- приводится заменой у к алгебре с базисом G.36). Для доказательства этого свойства двумерных алгебр воспользуемся теоремой 7.1 о том, что однопараметрическая группа заменой переменных приводится к группе переноса. Поэтому будем счи- считать, что один из операторов рассматриваемой двумерной алгебры L2 приведен к виду X = ——. Пусть Y = f(y)— другой, линейно независимый от X оператор ду ду из той же алгебры L2. Выберем эти операторы в качестве базиса в L2. Для них, очевидно, спра- справедливо равенство [X, Y] = f(y)-^~, так что условие G.35) для них имеет вид — = а + Pfj причем хотя бы одна из постоянных а или E отлична от нуля. Из ау этого уравнения получаем: / = ах + С, Y = ах—- + СХ, если /3 = 0, ду ^ ^^ если C ф 0. В первом случае в качестве базиса L2 можно взять операторы G.36), а во втором — операторы Х\ — —, Х2 — е^у-^—, которые приводятся к виду G.36) ду ду дополнительной заменой у1 = е~у. Тем самым, теорема полностью доказана. Пример 7.3. Применим теорему 7.4 к уравнению ^ = P(t) + Q(t)y + [Q(t) - P(t)]y2. G.37) Оно имеет вид G.33) с Ti(t) = P(t), T2(t) = Q(t), &(у) = 1 - у2, &(у) = У + У2¦ Поэтому операторами G.34) здесь являются Xi = (l-y2)^, Х2 = (у + у2)^. G.38) Вычислим их коммутатор. После несложных вычислений находим, что комму- коммутатор имеет вид [Xi,X2] = Х\ + 2X2. Следовательно, операторы удовлетворяют условиям G.35) двумерности алгебры, и условия теоремы 7.4 полностью выпол- выполняются. Значит, уравнение G.37) линеаризуется. Для отыскания линеаризующей замены сначала выбираем вместо G.38) новый базис X — Х\ + 2Х2 = A + уJтг, Y = Х2 = (у + У2)тг- Тогда получаем ду ду равенство [X, Y] = X, которое в представлении G.35) дает а = 1, а /3 = 0. Теперь найдем замену z = z(y), приводящую оператор X к виду X = —-. Для этого решаем уравнение Xz = A + уJ~г = 1 и находим, что dy 1 + у V } Замена G.39) переводит алгебру, порожденную операторами G.38), в алгебру с операторами G.36) и, следовательно, линеаризует уравнение G.37). После ука-
174 Гл. 2. Алгебраические и дифференциальные уравнения занной замены уравнение G.37) принимает вид — = Q(t) — P(t) + [Q(t) — 2P(t)]z. Пример 7.4. Рассмотрим уравнение — = t + (у/2 + tJy + 2л/2B + t)y2. Оно at представимо в виде G.28). Для этого достаточно положить Т\ — t, Т2 = (y/2 + tJ, Т3 = 2л/2B +?), ^1 = 1, ?2 — 2/5 ?з = 2/2- Поэтому соответствующая алгебра трех- трехмерна и совпадает с алгеброй для общего уравнения Риккати. Однако, было бы не- неверно заключать отсюда, что рассматриваемое уравнение не линеаризуется. Его можно переписать в двучленном виде G.33): — = t(l + 2y/2y) + B + t2)(y + 2y/2y2) Сии и получить операторы Х\ — A + 2л/2у)—-, Х2 = (у + 2л/2у2)—-, которые удов- ду ду летворяют условию G.35): [Xi,X2] = X\ +2л/2-^2- Следовательно, рассматрива- рассматриваемое уравнение линеаризуется. Этот пример показывает, что неоднозначность представления уравнения в ви- виде G.28) создает определенные неудобства, в частности, при использовании те- теоремы 7.4. Следующая теорема, которая непосредственно вытекает из теоремы 7.4, содержит другие критерии линеаризуемости, не зависящие от специального представления G.33). Теорема 7.5. Если уравнение Риккати G.32) обладает одним из следующих четырех свойств, то оно обладает и тремя другими: 1) уравнение G.32) линеаризуется заменой переменной у; 2) уравнение G.32) можно записать в виде G.33) так, что операторы G.34) порождают двумерную алгебру Ли, т. е. выполнено условие G.35) (при условии [Xi,X2] = 0 алгебра одномерна, и в уравнении Риккати переменные разделяются); 3) уравнение G.32) либо имеет вид § = Q(t)y + R(t)y2, G.40) at либо ^ = P(t) + Q(t)y + k[Q(t) - kP(t)]y2 G.41) с некоторым постоянным (вообще говоря, комплексным) коэффициентом к; 4) уравнение G.32) допускает постоянное, вообще говоря, комплексное реше- решение. Замечание. Уравнение G.41) имеет постоянное решение у = -к~г. Поэтому линейное уравнение, являющееся частным случаем уравнения G.41) при к = 0 можно рассматривать как частный случай уравнения Риккати, имеющее в ка- качестве постоянного решения бесконечно удаленную точку. 3. Уравнение Риккати на плоскости. Рассмотрим систему уравнений -тг = Qi + РиУ1 + Р12У2 + г11у1 + 2г12угу2 + г22у2, f G.42) dy2 2 2 г» 2 2 2 —jjT = <12+ Р21У1 + Р22У2 + r11y1 + 2г12угу2 + r22y2, в которой qi = qi(t), pik = Pik(t), r{k = r{k(t) — заданные функции. Ясно, что эта
§ 2.8. Групповой анализ матричного уравнения Риккати 175 система является частным случаем системы уравнений G.28). Поэтому можно воспользоваться теоремой 7.2 для выяснения числа фундаментальных решений. Существенным подспорьем в решении этой задачи является установленный факт о группах на плоскости. В теории групп установлено, что всякая группа преобразований на плоскости совпадает с восьмипараметрической группой преобразований (или ее подгруп- подгруппой), базисными инфинитезимальными операторами которой являются Y 9 Y 9 Y 9 Y 9 Y 9 дуг ду2 дуг ду2 дуг _ ^ д 2 д д д 2 д ду2' ду\ ду2' ду\ ду2 Если воспользоваться обозначениями G.29) для операторов G.43), то получим: J S1 — •> S1 — ' S2 ~ •> S2 — 5 S3 — i/1' S3 — 5 S4 — 5 S4 — i/15 /^ д.ч \ -1 2 j.i j-2 /-1 2 /-2 >-1 v-9 9 V •^t^t/ Предположим, далее, что выполнены условия r\2 = r?i = 0, г!! = 2r?2, 2rJ2 = rl2. G.45) Тогда систему уравнений Риккати G.42), с учетом обозначений G.44), можно представить в виде G.28), где п = 2, г = 8, а функции Tj(?) определяются формулами T1(t) = q1(t), T2(t)=q2(t), T3(t)=Pll(t), T4(t) =p2i(t), T5(t) = Pl2(t), Te(t) = p22(*), T7(t) = г^(*), Ts(t) = r222{t). Поэтому на основании теоремы 7.2 можно сформулировать следующий резуль- результат. Теорема 7.6. Если система уравнений Риккати G.42) удовлетворяет усло- условиям G.45), то она имеет не менее четырех фундаментальных решений [см. неравенство G.30)). § 2.8. Групповой анализ матричного уравнения Риккати Будем рассматривать уравнение вида Y,^pj =^-P(t)-Q1(t)Y-YQ2(t)-YR(t)Y = e, (8.1) где P(t), Qi(t), Q2(t) и R(t) — заданные квадратные матрицы порядка n, a Y — искомая матрица того же порядка, в — матрица с нулевыми элемента- элементами. Этому уравнению посвящен §2.6, где изложены различные аналитические методы исследования уравнения и построения его решений. Здесь предлагается анализ с позиций теории групп Ли. Поэтому получаемые результаты иногда бу- будут повторять то, что уже приведено в § 2.6. Однако, способ их получения здесь иной. 1. Однопараметрические группы преобразований и их операторы. Рассмотрим банахово пространство Мп, состоящее из n-квадратных матриц, норму элемента в котором определим по одной из формул ||А|| = max{|ai7|},
176 Гл. 2. Алгебраические и дифференциальные уравнения А / \1/2 PII = /2 Ы> \\A\\ = ( E7j=i\aij\2j - В пространстве Мп х Е1 задана группа Ли локальных однопараметрических преобразований f = f(t,Y,a), f(t,Y,O) = t, (8.2) Y'=g(t,Y,a), g(t,Y,0) = Y, (8.3) где fug — вообще говоря, нелинейные операторы. Очевидно, что при фик- фиксированных t и Y отображение (8.2) представляет собой скалярную функцию скалярного аргумента, а отображение (8.3) — матричную функцию скалярного аргумента. Групповое преобразование (8.2), (8.3) можно представить в виде Y=Y+ да dg(t,Y,0) (8.4) да Of dg где производные —— и —— можно рассматривать как производные Фреше в соот- оа да ветствующих функциональных пространствах. Вводя привычные обозначения вместо формул (8.4) и (8.5) получим t' = t + ?(t,Y)a + ..., (8.4') Y' = Y + 7]{t,Y)a + ... . (8.5') С помощью дифференциала Фреше это преобразование можно представить в виде t' = t + D(f(t,Y,0),a) + ..., (8.4") Y' = Y + D(g(t,Y,0),a) + ... (8.5") Если воспользоваться обозначениями (8.6), то соответствующий инфинитези- мальный оператор можно записать так X = at,Y)-+DY(*;v(t,Y)). (8.7) Если оператор применяется к функции F(?,F), то этот факт записывается в виде XF = ?(t, Y)dFftY) + DY(F(t, Г); rj(t, Y)), (8.8) где Dy(F(t, Y); rf) — дифференциал Фреше функции F, определяемый формулой F(t,Y + ri)-F(t,Y)=DY{F(t,Y);ri)+w(t,ri), ^^^^=0. (8.9) Непосредственными вычислениями можно показать, что DY{F{t,Y)]V) =
2.8. Групповой анализ матричного уравнения Риккати 177 где B/и 2/12 ... У1п\ Y = 2/21 2/22 2/2r \Уп1 Уп2 Упп/ , ri&Y) = /711 ^12 mi ^22 Поэтому формула (8.7) представляет собой иную запись инфинитезимального оператора, используемого в теории точечных преобразований. Ее можно записать в виде д п д X = ?(?,2/11,. • .,2/пп)^т + ^2 rjij(t,yii,...,ynn)-(87') ^т n У1Э Как уже отмечалось выше, один из способов решения дифференциальных урав- уравнений с помощью групп основан на замене переменных. Поэтому естественно рассмотреть вопрос о том, что происходит с инфинитезимальным оператором при замене переменных. Пусть Y = Y(t) — матричная функция скалярного аргумента t. Перейдем к новым переменным, положив x = x(t), Z = Z(t,Y). Тогда получаем очевидную цепочку равенств + 5t))-Z(t,Y) dt — = ot dx Z(t + 5t,Y(t)) (8.10) dZ л. — = hm dx St \dt s St J dY Так как Y(t + St) = Y(t) + —-St + ..., то dt Z(t + St, Y(t + St)) - Z(t + St, Y(t)) St V = hm St, Y(t) t, Y(t)) St Поэтому из соотношения (8.11) следует, что Если, в частности, х = t + a?(t), Z — Y + au(t, F), то из (8.12) получаем
178 Гл. 2. Алгебраические и дифференциальные уравнения Следовательно, с точностью до малых по а первого порядка, будем иметь Следующим этапом в создании необходимого аппарата для решения диффе- дифференциальных уравнений является построение продолжения инфинитезимального оператора. Будем рассматривать группу преобразований (8.4'), (8.5'). Построение про- продолженного оператора в преобразованиях на матрицах ничем не отличается от того, что предлагается в случае точечных преобразований. Однако, здесь тре- требуются иные обозначения и мы вынуждены повторить некоторые рассуждения, изложенные в предыдущих параграфах. r dY' Сначала строим продолженную группу, определяя производную —- с помо- ,Олп to*'\ dY> dY + [rk(t,Y)dt + DY(n(t,Y);dY)]a + ... щью формул (8.4') и (8.5'): -^ = dt+fe(t)y)<ft +^ Отсюда обычным способом находим, что где Поэтому соответствующий продолженный инфинитезималъный оператор опре- определяется формулой X = X + Z^(*;C(t,F,F)), Y = ^. (8.18) Аналогичным образом можно построить вторую продолженную группу и соот- соответствующий ей второй продолженный оператор. Однако, они нам в дальнейшем не потребуются. 2. Многопараметрические группы и их операторы. При групповом анализе матричного уравнения Риккати особый интерес представляют многопа- многопараметрические группы матричных преобразований. Будем рассматривать группу tf = t + f (*, Y)a + ..., У = Y + f](t, Y)a + ..., (8.19) где a — вектор: a = {ai,..., ap}, а ?(?, Y) и rj(t, Y) — строки: причем rji(t,Y) — матрицы. Каждому скалярному параметру ai соответствует свой инфинитезималъный г) операторXi, определяемый формулой типа (8.7): Xi = ^(t, Y) — +Dy(*; rji(t, F)),
2.8. Групповой анализ матричного уравнения Риккати 179 Значит, векторному групповому параметру а = {ai,... ,ар} можно поставить в соответствие векторный инфинитезималъный оператор X = {ХЬ...,ХР}. (8.20) Если р = пт, где т — целое число, то вектору а можно поставить в соответствие прямоугольную матрицу К = &21 171 и вместо (8.19) рассмат- рассматривать группу преобразований с матричным групповым параметром t' = t + ?(?, У) * if + ..., У' = У + 0*К + ..., (8.21) где ^ 22 smn / 7711 \ ^22 \Vml Vmn / S(t,F) *K = ^2&jkij, Q(t,Y) *K = ^rjijkij, щ — матрицы. При этом каждому скалярному параметру kij соответствует свой инфините- J / зимальный оператор Хц = ?ij(t,Y)——\- Dy(*; Т]ц), г = l,...,n; j = 1,...,?тг. at Следовательно, матричному групповому параметру К можно поставить в соот- соответствие матрицу-оператор X = Хц (8.22) у у у *-ml Aro2 • • • ^тг. Имея в виду, что оператор (8.7) представляет собой иную форму записи ин- финитезимального оператора однопараметрической группы (см. (8.7')), можно определить коммутатор операторов вида (8.7). Пусть Xk = t;k(t,Y)— + DY(*]r)k(t,Y)), к = 1,2. Тогда по определению ОЪ 3.23) Отсюда очевидным образом определяем коммутаторы вектор-операторов и матриц-операторов. Если Хк = {Х±,..., Х^ }, к = 1,2, то (8.24) Аналогично, если Хк = 12 k -22 ук 2п , к = 1,2, то справедливо ук ук Aml Аго2
180 Гл. 2. Алгебраические и дифференциальные уравнения следующее соотношение All>AllJ LA12>A12J '•• LAlm?AlmJ \ [vl v2 I [vl v2 I [vl v2 I 25) Определенные таким образом коммутаторы, очевидно, удовлетворяют свойст- свойству антисимметрии (косой симметрии) [Хг,Х2] = —[Х2,^1] и тождеству Якоби [[Х\Х%Х*\ + [[Х^Х^Х2] + [[Х^Х^ЪХ1] =0. 3. Определяющее уравнение. Алгебра Ли. Определив таким образом понятия инфинитезимальных операторов, можно перейти к построению групп, допускаемых данным дифференциальным уравнением (8.1). Сначала будем искать однопараметрическую группу. Ее инфинитизимальный оператор представим в виде Ct(t,Y)), (8.26) Ul где ?(t) — скалярная функция, а матрица Q,(t,Y) представима в виде Q(t, Y) = L1(t)YL2{t) + Mi(t)F + YM2(t) + N(t). (8.27) Здесь Li(t), Mk(t) и N(t) — подлежащие определению матрицы. Для решения этой задачи выписываем первый продолженный оператор (см. (8.18)) X = ?(*)— + DY (*; u(t, Y)) + DY(*; ?(t, Y, Y)), (8.28) 1 ut где (см. (8.15)) C(«, F, F) = ^ + IV(fi(t, Л; Л - ^(*)^- (8-29) Теперь ?(t) и Q(t,F) ищем из условия XF = в, (8.30) где F — левая часть уравнения (8.1). Непосредственными вычислениями находим, что ¦ DY(F{t,Y,Y);Q) =-Q!(t)Q(t,Y)- - u(t, Y)Q2(t) - u(t, Y)RY - YRU(t, Y), (8.31) DY(F(t, Y, Y); ф, Y, Y)) = C(t, Y, Y). Учитывая формулу (8.29), из (8.31) получаем Dy(F{t,Y,Y);ф,Y,Y)) = ^f^ + DY(Q(t,Y);Y) - C(t)Y. (8.32) Поэтому соотношение (8.30) можно переписать в виде Ht) - Qi(t)Y - YQ2(t) - YR{t)Y] - Qx{t)u{t,Y) - U(t,Y)Q2(t)- - Q(t,Y)R(t)Y - YR(t)u(t,Y) + mftY) + DY(u(t,Y);P(t)) + + DY(U(t, Y)-Q1{t)Y) + DY(U(t, Y);YQ2(t)) + DY(U(t, Y); YR(t)Y)- - i(t) [P(t) + Qx{t)Y + YQ2(t) + YR(t)Y] = в.
§ 2.8. Групповой анализ матричного уравнения Риккати 181 Объединяя слагаемые, содержащие выражения в квадратных скобках, а также учитывая формулу (8.27), из последнего соотношения получаем _ ^ _ щйу _ ущ& _ г«у _ Ql(t){Ll(t)YL2it)+ at at at at + Mi(t)y + YM2(i) + N(t)} - {L1(t)YL2(t) + Mi(t)y + YM2(i) + N(t)}Q2(t)- - {L1(t)YL2(t) + Mi(t)r + YM2(t) + N(t)}R(t)Y - YR(t){L1(t)YL2(t) + Ml{t)Y + YM2(t) + N(t)} ^ ^p P(t)M2(t) + L1Q1YL2+ + MXQXY + QxYM-2 + LXYQ2L2 + MXYQ2 + YQ2M2 + L1YRYL2 + + MXYRY + YRYM2 = 9. (8.33) Уравнение (8.33) является определяющим. Оно должно выполняться при произ- произвольных матрицах Y. Поэтому можно потребовать, чтобы выполнялись следую- следующие равенства: ? + [Li(t)YL2(t) + YM2(t)]RY + YR[Lx{t)YL2{t) + - Li(t)YR(t)YL2(t) = в, (8.34) QXLXYL2 + LXYL2Q2 + NRY + YRN- at at dLlvT т vdL2 dM^v v -г-YL2 - L{Y— —Y - Y at at at гYL2 L{YY YL1Q{YL2 MxQ\Y at at at at YM2 - L1YQ2L2 - QiMiY - YQ2M2 = в, (8.35) dt ^ ^z dt Равенства (8.34) содержат слагаемые со вторыми степенями матрицы Y. В ра- равенствах (8.35) содержатся только первые степени У, а в (8.36) каждое слагаемое свободно от Y. Эти соотношения можно рассматривать как уравнения относительно неизвест- неизвестных матриц Li, Mi и N. Они достаточно сложны. Поэтому введем предположе- предположения, существенно упрощающие задачу построения их решения. 1) Предположим сначала, что матрицы Р, Qi и R таковы, что существуют функции ?(?) и N(t), при которых выполняются равенства а) -vwiy +NR = e "vw*; +RN = e (8.37) J dt dt dt Тогда уравнения (8.34)-(8.36) имеют решение Mi = M2 = L\ = L2 = 0 и, со- согласно формуле (8.27), уравнение Риккати (8.1) допускает однопараметрическую
182 Гл. 2. Алгебраические и дифференциальные уравнения группу с инфинитезимальным оператором (8.27), в котором ? = ?(«), n = N(t). (8.38) Следовательно, допускаемая уравнением (8.1) однопараметрическая группа име- имеет инфинитизимальный оператор г\ (8.39) Замечание 1. Аналогично можно получить инфинитизимальный оператор при L\ = L2 = в и в том случае, когда в условиях (8.37) уравнения а) и Ъ) заменены уравнениями JD a1) -j-=0, RM1 + M2R = 0, Ь') dt 3.40) dt RN - Q2M2 + M2Q2 = где i? — единичная матрица, а вместо с) берется (8.36). 2). Предположим, что матрицы Р, Qi и R таковы, что существуют функции ?(t), Mi(t) и A^(t), при которых справедливы равенства а) b) dt M2R + RM1 = dt dt (8.41) dt - M2Q2 = 6>, - МгР - PM2 - —- = at Тогда допустимая группа имеет инфинитизимальный оператор X = ^ + ?у(*; MXY + YM2 + N). (8.42) Замечание 2. Тот же результат получается и в случае, когда в условиях (8.41) вместо уравнений Ь) взяты уравнения ъ') dt RN - dt dM2 3.43) - Q2M2 - M2Q2 = dt dt Приведенные результаты показывают, что для различных частных случаев матричного уравнения Риккати можно практически построить допускаемые од- нопараметрические группы. Следовательно, их можно использовать для решения таких уравнений и для их групповой классификации. Пример 8.1. Рассмотрим уравнение (8.1), в котором имеем Р = ( 3 V t Zt Qi = 0 t3 и о 0 t3 о о , R = t о о t В этом случае непосредственной
§ 2.8. Групповой анализ матричного уравнения Риккати 183 проверкой можно убедиться, что при ~02) (8-44) выполняются условия (8.37) и, следовательно, уравнение допускает однопарамет- рическую группу с оператором X = at)g-t+DY(*;N), (8.45) в котором ? и N определяются формулами (8.44). В соответствии с формулами (8.7) и (8.7') этот оператор можно переписать в «скалярной» форме X = t-1^--2^-. (8.45') at ду12 Пример 8.2. Пусть в уравнении (8.1) Л, Qi = (в"* - 1)Д, Q2 = 0. (8.46) В этом случае условия (8.41) выполняются, если положить 1 l (8.47) Следовательно, уравнение допускает однопараметрическую группу с операто- оператором X = е*— + DY(*; -е*ДУ). Если взять ?(?) = О, М<2 — — Mf, N = в, где Mi — произвольная постоян- постоянная матрица, то условия (8.41), очевидно, будут выполняться, и мы получаем четырехпараметрическое семейство операторов X = Dy(*;MiF — УМ-j*), где в качестве параметров выступают элементы т™ матрицы Mi = ( 11 12 \ 777,21 ^22 Рассмотренные примеры показывают, что условия (8.37) и (8.41) могут давать достаточную информацию для получения инфинитезимальных операторов одно- параметрических групп, допускаемых уравнением Риккати вида (8.1). Поэтому естественно попытаться найти достаточные условия, при выполнении которых это уравнение допускает однопараметрическую группу с оператором вида (8.39) (или (8.42)). Начнем с оператора (8.39). Из уравнений Ъ) в условиях (8.37) находим, что М = _ЩАК-^ М = _К-гЩА. (8.48) at at Следовательно, матрица JV, удовлетворяющая этим условиям, существует, если можно указать скалярную функцию ? = ?(?) такую, что выполняется равенство RmA_mAR=e_ (8.49) at at Подставляя значение N из (8.48) в уравнение с) из условий (8.37), будем иметь dt ^ dt dt ~\~ ~ I : л ~h it ; 1^6'. (8.50) 2dt\ dt dt J v J
184 Гл. 2. Алгебраические и дифференциальные уравнения Здесь, в последнем слагаемом, в соответствии с формулами (8.48), мы положили Полученный результат сформулируем в виде теоремы. Теорема 8.1. Если существует скалярная функция ? = ?(?) такая, что спра- справедливо = в, а матрицы Р, R, Qi и Q2 удовлетворяют условиям (8.49) и Ол/ (8.50), то уравнение (8.1) допускает однопараметрическую группу с оператором (8.39), в котором матрица N определяется формулой (8.51). Аналогичный результат получаем при анализе условий (8.41). Получим условия, при выполнении которых уравнение (8.1) допускает одно- параметрическую группу с оператором X = ?— + Dy(*;MiF + YM2). С этой целью положим в условиях (8.41) N = в и исключим из них матрицы М\ и М2. Предполагая, чпо R — неособенная матрица, из условия а) в (8.41) получаем: Mi = —R~1— R~1M2R. Тогда условие с) из (8.41) можно представить в ВИде цЩ?1 + в + M2RP - RPM2 = в. dt dt Пусть М° и Мз таковы, что М2°RP - RPM% = 6>, RM® + М2°Я + <^р- = в. (8.52) O Тогда условия Ъ) и с) из (8.41) будут выполнены, если матрицы Р, Qi, Q2 и R связаны соотношениями d^ Q^-M?Q1=e, (8.53) Полученный результат можно сформулировать следующим образом. Теорема 8.2. Пусть: 1) матрица R(t) — невырожденная (неособенная) при любом t; 2) существует скалярная функция ?(?) такая, что матрицы P(t) и R(t) свя- связаны между собой первым соотношением из (8.53); 3) существуют матрицы М® и М®, определяемые уравнениями (8.52), такие, что матрицы Qi и Q2 удовлетворяют условиям (8.53). Тогда уравнение (8.1) допускает однопараметрическую группу с инфинитези- мальным оператором X = ?— + Dy(*; M?Y + YMS). dt dt В каждом из рассмотренных примеров мы построили группы, указав соот- соответствующие им инфинитезимальные операторы. Они получены путем решения определяющего уравнения. Оно может иметь конечное или даже бесконечное чис- число решений. Поэтому возникает естественный вопрос: нельзя ли все множество
§ 2.8. Групповой анализ матричного уравнения Риккати 185 М таких решений определяющего уравнения объединить в одну многопарамет- многопараметрическую группу? Накопленный опыт группового анализа систем обыкновенных дифференциаль- дифференциальных уравнений показывает, что обычно каждая такая система допускает конечно- конечномерную группу, многообразие М инфинитезимальных операторов, определяемых данной системой уравнений, является конечномерным линейным пространством с естественной операцией умножения оператора на комплексное число. В нем вы- выделяются базисные операторы Xi,... ,Хр такие, что каждый оператор X из рас- рассматриваемого семейства однозначно представим в виде X = а\Х\ + ... + арХр, где ai,..., ар — постоянные. Если, кроме того, каждый коммутатор [X, У], где X е М, Y е М, также принадлежит М, то множество М называется алгеброй Ли, а число р называется размерностью алгебры. Так как Xi,... ,Хр — базис алгебры, то существуют постоянные С\а такие, что [XU Xj] = С^Хг + ... + CfjXp. (8.54) Числа С\а называются структурными постоянными. 4. Интегрирование уравнения Риккати заменой переменных. Тео- Теоремы 8.1 и 8.2 дают достаточные условия, при выполнении которых уравнение (8.1) допускает однопараметрические группы. Здесь мы рассмотрим вопрос об использовании групп для решения таких уравнений. Рассмотрим уравнение F(t,Y,Y) = %- Pit) - Qx{t)Y - YQ2(t) -Y2=0 (8.55) at и построим соответствующий ему инфинитизимальный оператор X = ttt)^+DY(*;L(t)Y + C(t)). (8.56) Введем замену переменных r = r(t), U = M(t)Y + N(t), (8.57) в которой т(?), M(t) и N(t) выберем так, чтобы оператор (8.56) приводился к виду X = ——. Для этого достаточно, чтобы выполнялись тождества Х(т) = 1, от X(U) =0. Первое из этих условий дает ?— = 1 и, следовательно, аъ ? (8-58) Второе условие можно переписать в виде X(U) = ?—— Y+?—— + MLY + MC = в. at at Так как это тождество должно выполняться при любой матрице У, то получаем два уравнения относительно искомых матриц М и N: Z*M-+ML = 6, ^-+МС = в. (8.59) at at По предположению оператор (8.56) допускается уравнением Риккати (8.55) и, следовательно, его матрицы L и С удовлетворяют некоторым условиям, вытека-
186 Гл. 2. Алгебраические и дифференциальные уравнения ющим из определяющего уравнения F=e 1 (8.60) Выпишем эти условия. Согласно определению, X = X + Dy(*; С), где С = L(t)Y + C(t) + L(t)F - ?(t)Y. Следовательно, уравнение (8.60) можно представить в виде at at at - QiC - CQ2 -CY-YC + C = 0. Так как это равенство должно выполняться при произвольной матрице У, то должны быть справедливы соотношения at , d) iY2 + YLY = 0. Равенство d) из (8.61) должно быть справедливым при произвольной матрице Y. Поэтому оно однозначно определяет матрицу L: L = -?/, (8.62) где / — единичная матрица, и остальные равенства из (8.61) упрощаются: (8.63) л+ с = в> ^Г + С = в- Полученный результат можно сформулировать следующим образом. Теорема 8.3. Пусть в уравнении Риккати (8.55) матрицы P(t), Qi(t) и таковы, что существует матрица C(t) и скалярная функция ?(?), при которых выполняются условия (8.63). Тогда это уравнение допускает группу с оператором (8.56), в котором матрица L определяется формулой (8.62). При использовании условий (8.63) можно исходить из того, что одно из соот- соотношений системы (8.63) (например, последнее) можно рассматривать как урав- уравнение, определяющее матрицу С. Остальные соотношения представляют собой условия, при выполнении которых уравнение Риккати (8.55) допускает оператор вида (8.56). Из последнего уравнения системы (8.63) находим, что С = , и тогда оставшиеся уравнения этой системы можно представить в виде ~ Ql Ht dTQ2 + 1Г + tp-ei (8.63/)
§ 2.8. Групповой анализ матричного уравнения Риккати 187 где Со — произвольная постоянная матрица. Поэтому теорему 8.3 можно сформулировать так. Теорема 8.3'. Если существует скалярная функция ?(?) такая, что матрицы P(t), Qi(t) и Q2(t) в уравнении (8.55) удовлетворяют условиям (8.63'), то это уравнение допускает группу с оператором (8.56), в котором (8.62') ас Последующий анализ уравнения (8.55) посвящен поиску тех преобразований (8.57), с помощью которых оно приводится к уравнениям, решаемым в квадра- квадратурах. Из первого уравнения системы (8.59) с учетом (8.62) получаем матрицу М и упрощенное второе уравнение системы: М = ?А, ^+АС = в, (8.64) где А — постоянная матрица. Имея в виду эти факты, делаем замену переменных в уравнении (8.55) по формулам (см. (8.57), (8.58) и (8.62)) Г* dt т= —г-, U = ?(t)AY + N(t). (8.65) dU d(?(t)AY + N(t)) dt _ чA, ч ЛЛ, _ .dN(t) ^2/ч AdY Следовательно, — = V^V ; ^ — = Z(t)?(t)AY + ?(t)—-^ + i2it)A-— dr dt dr dt dt и, в соответствии со вторым уравнением из (8.64), находим, что справедливо равенство ^ = №М№ - ф)АСA) + ?2(*)^- dr ф dt Заменяя производную Y ее значением из (8.55), отсюда сразу же получаем Заменяя Y его значением из (8.65), приходим к уравнению ^ - C(t)} + (i(t)i+ ~ N)Q2(t) + (U- N)A-X(U - N), (8.66) в котором А — произвольная постоянная матрица, N определяется вторым урав- уравнением из (8.64), а матрица C(t) должна быть связана с P(t), Qi(t) и Q2(t) соотношениями (8.63). Из уравнений (8.61) и (8.62') находим, что N(t) = MWQiit) + No, (8.67) где No — произвольная постоянная матрица. Если C(t) выбрать по своему усмотрению, то соотношения (8.63) будут пред- представлять собой условия, при выполнении которых исходное уравнение (8.55) до- допускает группу с оператором (8.56), а заменой переменных (8.65) оно приводится к виду (8.66). При этом скалярная функция ?(?) также может выбираться произ- произвольно.
188 Гл. 2. Алгебраические и дифференциальные уравнения Имея в виду этот факт, положим 2 ^ (8.68) вводя тем самым вместо C(t) новую матрицу R(t). Если учесть последние два уравнения из условий (8.63), то из соотношений (8.63) и (8.68) можно получить уравнения ( - С) ^ п т; г ?,-г + ц/iO at t) + Co, (8-69) dt которые связывают между собой матрицы-функции P(t), Qi(t), Q2(t), R(t), по- постоянные матрицы Со, А^о и скалярную функцию ?(?). Тогда из уравнений (8.64) получаем М = ?1. (8.70) Совокупность уравнений (8.69) определяет достаточные условия, при выпол- выполнении которых уравнение (8.55) допускает однопараметрическую группу с опе- оператором (8.56). Подставляем матрицы C(t), A, M(t) и N(t), определяемые соотношениями (8.67), (8.68), (8.69) и (8.70) в уравнение (8.66). В итоге после некоторых преоб- преобразований его можно представить в виде ^ = Р0(т, Со, No)) + (Со - N0)U - UN0 + U2, (8.71) ат где Po(T,Co,No)=N2-CoNo-at)CoQ2(t)-R(t), т= —-. (8.72) Полученный результат сформулируем в виде следующей теоремы. Теорема 8.4. Пусть в уравнении Риккати (8.55) матрицы P(t), Qi(t) и Q2(t) таковы, что: 1) существуют скалярная функция ?(t) и матрица R(t), с помощью которых матрицы P(t), Qi(t) и Q2(t) связаны соотношениями (8.69); 2) матрицы L(t), M(t) uN(t) определяются формулами (8.62'), (8.64) и (8.67). Тогда уравнение (8.55) допускает группу с оператором (8.56) и заменой пере- переменных по формулам (8.65) приводится к виду (8.71). Так как система уравнений (8.69) содержит больше искомых матриц (R(t), Co, P(t)i Qi(t) и Q2(t)), чем число уравнений, то некоторые из них можно выбирать по своему усмотрению и, следовательно, можно проанализировать различные частные случаи, когда решение уравнения (8.71) можно получить в квадратурах. Рассмотрим некоторые из таких случаев. 1-й частный случай. Пусть 0. (8.73)
§ 2.8. Групповой анализ матричного уравнения Риккати 189 Тогда уравнение (8.71) принимает вид —— = {Cq—Nq)U—UNq-\-U2. Записывая CLT его в форме U~1 — U~1 = U~1(Co — No) — N$U~1 + / и вводя замену ат V = U~1, (8.74) приходим к линейному уравнению ^- = N0V - V(C0 - No) - I, (8.75) ат которое легко интегрируется (см. § 2.4). Полученный результат можно сформулировать следующим образом. Теорема 8.5. Пусть выполнены условия теоремы 8.4 и, кроме того, матрица Po(t,Co,No), определяемая формулами (8.72), тождественно равна нулевой мат- матрице (см. (8.73)). Тогда заменами переменных (8.65) и (8.74) уравнение (8.71) сводится к линейному уравнению с постоянными матрицами (8.75). 2-й частный случай. Пусть выполнены условия Со =N0=0, R(t) = Ro, (8.76) где Ro — постоянная матрица. Тогда уравнение (8.71) принимает вид f- = U2 - Ro. (8.77) ат Используя методы, изложенные в § 2.2, можно найти постоянные решения этого уравнения путем решения алгебраического уравнения U2 - Ro = в. (8.78) Обозначим одно из таких решений через С/о и сделаем замену U = V + U0. (8.79) dV Тогда уравнение (8.77) приводится к виду — = V2 + UoV + VUo- Отсюда ат получаем V~1——V~1 = I + У-1С/о + C/oV и, следовательно, ат = / + UoV-1 + у-ги0. (8.80) ат Линейное уравнение (8.80) имеет общее решение У-Х(т) = -т1 + е-и°тКе-и°т. (8.81) Отсюда находим,что V(t) = eUoT [К - еи°ттеи°т] ~*'еи°т, (8.82) где К — произвольная постоянная матрица. Полученный результат сформулируем в виде следующей теоремы. Теорема 8.6. Пусть: 1) матрицы C(t) и R(t) связаны между собой формулой (8.68) и выполнены условия (8.76); 2) матрицы P(t), Qi(t), C(t) и Q2(t) удовлетворяют условиям (8.69).
190 Гл. 2. Алгебраические и дифференциальные уравнения Тогда уравнение Риккати (8.55) заменой переменных (8.65) приводится к ви- виду (8.77), общее решение которого находится в виде (8.79), где Uq — решение алгебраического уравнения (8.78), а V определяется формулой (8.82). 3-й частный случай. Пусть Со = No = в, До (г) = -t~2R0j где Ro — посто- постоянная матрица. Тогда уравнение (8.71) можно записать в виде ?? = и2+г-2Яо. (8.83) ат Непосредственной проверкой можно убедиться, что матрица U(r) =rZ (8.84) является решением этого уравнения, если Z — решение алгебраического уравне- уравнения Риккати Z2 + Z + До = 0. (8.85) Это уравнение достаточно полно проанализировано в § 2.3. Поэтому можно счи- считать, что решение (8.84) можно практически построить всегда, когда решение уравнения (8.85) существует. Полученный результат можно сформулировать следующим образом. Теорема 8.7. Пусть: 1) матрицы C(t) и R(t) связаны между собой соотношением (8.68) и при этом Со = No = #5 Д(?) = t~1Ro, где Ro — постоянная матрица; 2) матрицы P(t), Qi(t), Q2(t) и C(t) удовлетворяют условиям (8.69). Тогда уравнение Риккати (8.55) заменой переменных (8.65) приводится к виду (8.83). Уравнение (8.83) имеет решение (8.84), где Z —решение алгебраического уравнения Риккати (8.85). Мы ограничимся рассмотренными частными случаями, хотя можно указать и другие ограничения на матрицы P(t), Qi(t) и Q2(t), при выполнении которых уравнение (8.55) может быть решено с использованием групповых преобразова- преобразований. Аналогичным образом можно проанализировать другие матричные уравне- уравнения Риккати, более общие, чем уравнение (8.55). 5. Инвариантные решения. В заключение рассмотрим вопрос об инва- инвариантных решениях уравнения Риккати. Они играют существенную роль в групповом анализе уравнений в обыкновенных и частных производных. Пусть система дифференциальных уравнений У% = fi(t,yi,...,yP), г = 1,...,р, (8.86) имеет решение Vi=yi(t), г = 1,...,р, (8.87) и допускает группу G. Напомним, что если множество М в пространстве пере- переменных ?, 2/i,... ,2/р, определяемое соотношениями (8.87), является инвариантом группы G, то решение (8.87) называется инвариантным. Одно из важнейших свойств инвариантных решений заключается в том, что с их помощью в ряде случаев удается получить общее решение системы вида (8.86). При этом используется следующее важное утверждение.
§ 2.8. Групповой анализ матричного уравнения Риккати 191 Теорема 8.8. Пусть система уравнений Fj (У1,..., yq) = 0, j = 1,..., s, s < q, (8.88) допускает группу G, инфинитизималъный оператор которой не обращается в нуль на многообразии М из Eq, определяемом уравнениями (8.88). Тогда эту сис- систему можно равносильным образом переписать так, что левые части уравнений будут инвариантами группы G, т.е. в виде *i(JiA/),...,Jg_i(!/))=O, j = l,...,s, (8.88') где Ii(y),..., Iq-i(y) — базис инвариантов группы G ( т. е. набор всех функ- функционально независимых инвариантов). Уравнения (8.88) и (8.88') равносильны в том смысле, что они определяют одно и то же многообразие М. Используя эти факты, вернемся к анализу уравнения (8.83). Непосредственной проверкой можно убедиться, что оно допускает группу с оператором X = t^-Dy(*;Y), (8.89) а сама группа определяется соотношениями т/=геа, У/ = е~аУ (8.90) Записывая решение (8.84) в новых переменных У = ^ (8-91) и учитывая соотношения (8.90), находим, что решение (8.84) является инвари- инвариантным относительно группы преобразований (8.90). Соотношение (8.84) можно рассматривать как систему п2 уравнений yik=zikr~1, i,/c = l,...,n, (8.92) к которым можно применить теорему 8.8. Определяемое этими соотношения- соотношениями многообразие М в (п2 + 1)-мерном пространстве переменных т, уц,... ,упп допускает группу (8.90), которую можно записать в виде т'=теа, y'ik=yike-a, i,k = l,...,n, (8.93) с инфинитезимальным оператором (8.89), который можно записать в скалярной форме Х = Т7Г- Е ViklT-- (8-94) На многообразии М, т.е. на функциях (8.92), этот оператор не обращается в нуль. Поэтому уравнения (8.92) можно переписать в виде Фг&(Лъ • • • Дпп) = 0, г, к = 1,...,п, где /ц,..., 1пп — базис инвариантов группы (8.93). Этот базис „ dr dyn dynn можно определить из системы уравнении — = = ... = , т.е. Т УН Упп можно положить /ц = хуц,..., 1пп = хупп. Этим скалярным инвариантам можно поставить в соответствие матричный инвариант / = тУ. Следовательно, инвариантное решение уравнения (8.83) можно записать в виде тУ = Г. (8.95)
192 Гл. 2. Алгебраические и дифференциальные уравнения Подстановка этого решения в уравнение (8.83) дает уравнение Г2 + Г + Ro = в, (8.96) которое совпадает с уравнением (8.85). Пусть Т — неособенная матрица, с помощью которой Ro приводится к кано- канонической жордановой форме, т.е. T~1R$T = J, где J — жорданова матрица. Умножая обе части уравнения (8.96) слева на Т, а справа на Т, и вводя обозна- обозначение V = Т-1ГТ, уравнение (8.96) можно записать в виде V2 + V + J = в. Это уравнение можно решить методом, который подробно рассмотрен при анализе примера 3.1. Тем самым можно получить все решения уравнения (8.96), каждое из которых однозначно определит инвариантное решение Y = Y{r) уравнения (8.83) по формуле (8.95). § 2.9. Линеаризация матричного уравнения Риккати Один из способов решения дифференциальных уравнений, основанный на при- применении групп Ли, состоит в том, что находится замена переменных, с помощью которой нелинейные уравнения линеаризуются. Тем самым упрощается проце- процедура их решения. Выбор соответствующего преобразования переменных опреде- определяется групповыми свойствами исходных нелинейных уравнений. К настоящему времени накоплен достаточно богатый опыт такого решения скалярных и век- векторных дифференциальных уравнений. Здесь мы воспользуемся тем же приемом линеаризации матричных дифференциальных уравнений (см. [11, 17]). 1. Условия линеаризуемости. Будем рассматривать уравнение Y = P(t) + Qi(t)Y + YQ2(t) + YR(t)Y, to<t<T, (9.1) в котором P(t), Qi(t), Q2(t) и R(t) — непрерывные матрицы порядка п. Соот- Соответствующая ему система скалярных дифференциальных уравнений может быть представлена в виде Угз = Pij(t) + ^уйкУкз + VikQkj + ^2 ТкшУгкУшз ), г, j = 1,... ,п. (9.2) m=l Вводя вектор у = {у1,... ,уп } = {^/ц,... ,2/пп}5 систему уравнений (9.2) можно записать в виде yi=T1(t)tHy) + --- + Tr(t)?(y), i = l,...,N = n2, (9.3) и затем воспользоваться теоремой 7.2. В соответствии с этой теоремой, система (9.3) обладает фундаментальной сис- системой решений, если операторы N д ^ = ЕЙ%' а = 1,...,г, (9.4) k=i y образуют r-мерную алгебру Ли. При этом число m необходимых частных реше- решений удовлетворяет оценке Nm ^ г. (9.5)
§ 2.9. Линеаризация матричного уравнения Риккати 193 Применительно к системе уравнений (9.2) операторы (9.4) имеют вид: дп п (9.6) xtj= Эти операторы образуют алгебру Ли 1/4п2, поскольку их коммутаторы удовле- удовлетворяют соотношениям rvi vi I п fvi y2 "I с x^i fvi v3 1 х v^ LAiJ5ApgJ ~~ U5 L ij'ApgJ — °iq^pj? L ij'^-pgj ~ °3P^iq-> lAij> Apq\ - °ipAjq + Oqi^jp, [Xiji Apq\ ~ Oqi^pj ~ °jPAiq, ( . г 2 ^3 1 (л [ v2 x^4 "I с Г\^3 уЗ I r ^3 с х^З W*'/ где ^j — символ Кронекера. Следовательно, система уравнений (9.2) обладает фундаментальной системой решений и условие (9.5) при этом принимает вид т ^ 4. (9.8) (В случае одного скалярного уравнения Риккати т ^ 3). Теперь найдем условия, при выполнении которых матричное уравнение Рик- Риккати (9.1) может быть линеаризовано аналитической заменой переменной Y. С этой целью рассмотрим линейное матричное уравнение X = A(t) + B(t)X + XC(t), (9.9) где матрицы n-го порядка A(t), B(t) и C(t) предполагаются непрерывными. Пусть X = F(Y) — аналитическая функция от матрицы У, и пусть преобра- преобразование, определяемое этой функцией, отображает уравнение (9.1) в уравнение (9.9). Это означает, что на F(Y) накладывается ограничение вида = Fi(Y)—F2(Y), (9.10) где F\(Y) и F2(Y) — некоторые аналитические функции матрицы У. Рассмот- Рассмотрим, в частности, функцию X = Y(K + У), где К — некоторая постоянная матрица. Тогда, очевидно, что —— = (Еп — [К + Y)~1)——(K + У), и, еле- CLV CLV довательно, выбранная функция удовлетворяет условию (9.10). В то же время, 9 dX dY dY функция X — Y этому условию не удовлетворяет, так как = У + У . dt dt dt Учитывая условие (9.10) и тот факт, что замена X = F(Y) есть преобразование матрицы У, отображающее уравнение (9.1) в уравнение (9.9), легко убедиться в справедливости следующего утверждения. Элементы матриц P(t), Qi(t), Q2(t) и R(t) являются линейными комбинация- комбинациями элементов матриц A(t), B(t) и C(t). Следовательно, для существования линеаризующей замены X = F(Y) необхо- необходимо, чтобы размерность векторного пространства элементов матриц P(t), Qi(t), Q2(t) и R(t) не превосходила п2. Учитывая ограничения (9.10), будем считать, что элементы одной из этих матриц являются линейными комбинациями элемен-
194 Гл. 2. Алгебраические и дифференциальные уравнения тов трех остальных матриц, например, (9.11) где z^7, /i^7 и ^7 — неизвестные пока постоянные. Линейное матричное уравнение (9.9), рассматриваемое как система линейных дифференциальных уравнений, имеет фундаментальную систему решений, так как операторы О о *¦?' д fci образуют алгебру Ли L\n. Преобразование X = F(F) уравнения (9.1) в уравнение (9.9) отображает операторы (9.6) в операторы (9.12). Поэтому уравнение (9.1) может быть линеаризовано заменой X = F(Y), если операторы д к = 1 ъ 1 д myjj I Fm7 I Q •> bjJ — J-T--j'bj образуют алгебру Ли L\n. Найдем щр', fi^1 и р™р', удовлетворяющие этому условию. Коммутаторы [У^, 1^], г, j,p, g' = 1,..., п, определяют условия на /ylj7- Непосредственные вычисления дают: ?7^7 = 0 при г,т ^ J, 7 7^ 77г- Отличные от нуля постоянные ?7^7 = ?7J7 обозначим через lj1. Следовательно, операторы (9.13) можно представить в виде Uik Аналогично, вычисляя [F^-,Fp2g] и [Y^Ypq] при i,j,p,q = g, ...,n, определяем параметры /i^7. В результате получаем: г, j = 1,... ,п, (9.15) •3,1^] определяет те ^7, при (9.16) Набор коммутаторов [^,Ур2д], [^-,УД] и которых операторы (9.13) образуют группу 1 Я1 = —Imil ' В результате, операторы У^- можно представить в виде п з - Y^ У-3 = I'Ml' 9 jm fc,m=l %fem' (9.17)
2.9. Линеаризация матричного уравнения Риккати 195 Таким образом, условие (9.11) принимает вид i,j = l,...,n. k = l ^ rn=l Условие (9.18) означает, что уравнение (9.1) имеет постоянное решение 'hi hi (9.18) L = Чп hn (9.19) (-1 1>п2 • • • 1"пп , Полученный результат можно сформулировать следующим образом. Теорема 9.1. Матричное дифференциальное уравнение (9.1) линеаризуется тогда и только тогда, когда оно допускает постоянное решение. Линеаризую- Линеаризующей при этом является замена, отображающая операторы (9.14), (9.15) и (9.17) в операторы (9.12): X = (L-Y)~1. (9.20) Этот результат является обобщением критерия линеаризуемости скалярного дифференциального уравнения Риккати [22]. Замечание. Введем обозначение , д д д dY \ дун д д a д д V дуп1 дуп2 Тогда операторы (9.5) можно представить в виде (9.21) Y1-— Y2- Y— dY' dY' Y3-—Y dY ' (9.22) d d При этом -prpY подразумевает формальное перемножение матриц —— и Y. 2. Ангармоническое отношение решений уравнения (9.1). Известно, что ангармоническое отношение любых четырех решений скалярного уравнения Риккати постоянно (см. § 2.5). Из условия (9.8), в частности, следует, что в об- общем случае это условие не выполняется для решений уравнения (8.1). Здесь мы приведем некоторые частные случаи, когда четыре решения матричного уравне- уравнения Риккати функционально зависимы, причем эта зависимость непосредственно обобщает указанное выше свойство четырех решений скалярного уравнения. Рассмотрим задачу Коши Г X = P(t) + Qx{t)X + XQ2(t) + XR(t)X, to<t<T, \ X{T) = F. (9.23) Как известно (см. § 2.6, формула F.57)), решение задачи можно записать в виде X(t)=[W22(T,t)+FW12(T,t)] 1[FW11(T,t) (9.24)
196 Гл. 2. Алгебраические и дифференциальные уравнения где матрица W[1^-{w21(T,t) W22(T,t) является матрицей Коши системы уравнений Qi(t) -R(t)\(x P(t) Q2(t)){P)> в которой х и р — n-мерные векторы. Теорема 9.2. Пусть X^t), X2(t), X3(t) u X4(t) — решения задачи (9.23) с начальными условиями Xi(T)=Fi, г = 1,2,3,4, (9.27) где матрицы Fi перестановочны с блочными матрицами Wi2(T,t) и W22(T,t) матрицы Коши (9.25). Тогда эти решения функционально зависимы и связаны соотношением (ангармоническим отношением) {F^-X^ - F2-11X21) {F^iFsXs - F2X2) - F^(F2X2 - F.X,)) ~X = \\2) где Fij = Fi- Fj, Xij = Xi- Xj. Доказательство. Пусть Xi, i = 1,2,3,4, — решения задачи (9.23) при F = F^ Используя первые два решения Х\ и Х2, непосредственно из формулы (9.24) легко получить W22(T,t)X21 = F21Wn{T,t) + W11(T,t)(F2X2 - FM. (9.29) Аналогично находим, что W22(T,t)X32 = F12Wu(T,t) + W12(T,t)(F3X3 - F2X2). (9.30) После исключения И/ц(Т, t) из соотношений (9.29) и (9.30), получаем равенство F2-11W22(T,t)X21 - W12(T,t)F^11(F2X2 - РгХг) = = F^W22(T, t)X12 - W12(T, t)F^-(F3Xz - F2X2). (9.31) Аналогичное равенство можно записать, заменив в (9.31) Х2 на Х^\ F^W22(T,t)X41 - W12(T,t)F^11(F4X4 - FrXr) = = F^W22(T, t)X34 - W12(T, t)Fu\F3X3 - F4X4). (9.32) Исключая из (9.31) и (9.32) Wi2(T, t) и умножая полученное равенство слева на И/221(Г, t), ПОЛуЧИМ - F-11X2i)F-21(F3X3 - F2X2) - F-11(F2X2 - i№))-\ (9.33) Полученное равенство выражает зависимость четырех решений задачи (9.23) с начальными условиями вида (9.27). Следствие 9.1. Пусть P(t), Qi(t), Q2{t) uR(t) —постоянные матрицы. Тог- Тогда любые четыре решения задачи (9.23), перестановочные в начальный момент времени с матрицами коэффициентов, функционально зависимы. Следствие 9.2. Любые четыре решения Xi(t), X2(t), X3(t) и X±(t) с началъ-
§ 2.10. Уравнение Риккати в методе прогонки 197 ными условиями вида Xi(T) = к{Е, где ki — скалярные постоянные, а Е — единичная матрица, функционально зависимы. § 2.10. Уравнение Риккати в методе прогонки Как уже отмечалось во введении, метод прогонки решения краевых задач для систем дифференциальных и разностных уравнений приводит к необходимости решать матричное дифференциальное или разностное уравнение Риккати. Здесь мы изложим основные этапы решения задач методом прогонки как для одного уравнения, так и для систем [7]. 1. Краевая задача для скалярного дифференциального уравнения. Рассмотрим уравнение еУ" = p(x)y + F(x), 0<х<1, A0.1) где е > 0, р(х) > 0, с граничными условиями /30, (Ю.2) у'A)=фоуA)+шо. (Ю.З) Эту задачу можно рассматривать как самостоятельный объект исследования. Однако, она появляется и при решении разностными методами смешанных за- задач для линейного уравнения теплопроводности и для волнового уравнения. В частности, если решается краевая задача для уравнения теплопроводности, то коэффициент г в уравнении A0.1) следует рассматривать как малый параметр при старшей производной. Он пропорционален шагу сетки по времени. Метод прогонки основан на том, что левое граничное условие A0.2) рассмат- рассматривается как ограничение на множество решений уравнения A0.1), с помощью которого выделяется семейство решений этого уравнения, зависящее от одного параметра. Тем самым в каждой точке х Е [0,1] индуцируется линейная зависи- зависимость между у(х) и у'(х), а именно, у'(х)=а(х)у(х)+/3(х). A0.4) При этом функции а(х) и /3(х) однозначно определяются уравнением A0.1) и граничным условием A0.2). Таким образом, левое граничное условие A0.2) переносится на все точки х из отрезка [0,1]. Этот перенос граничного условия обычно называют прямой прогон- прогонкой. Для определения функций а(х) и /3(х) продифференцируем обе части соотно- соотношения A0.4) и в правой части полученного равенства производную у'(х) заменим ее значением из A0.4). В итоге получим у"(х) = («' + а2)у(х) + (/3' + а/3). A0.5)
198 Гл. 2. Алгебраические и дифференциальные уравнения Так как соотношения A0.1) и A0.5) определяют одно и то же множествофункций у = 2/(ж), то отсюда получаем уравнения {3> + af3=^. A0.7) Первое из этих уравнений является уравнением Риккати. Его решение следу- следует искать с учетом граничного условия A0.2), из которого следует, что функция а(х), определяемая уравнением A0.6), должна удовлетворять начальному усло- условию а@) = ао. (Ю.8) Решив задачу A0.6), A0.8) и подставив полученное решение а(х) в A0.7), по- получим линейное уравнение относительно /3(х). Его нужно решать также с учетом условия A0.2), из которого следует, что функция /3(х) должна удовлетворять на- начальному условию /?@) = А>. (Ю.9) Определив таким образом функцию /3(х), как решение задачи Коши A0.7), A0.9), завершаем прямую прогонку. Ее результатом является тот факт, что в точке х = I получено еще одно граничное условие, «пригнанное» из точки х = 0: Теперь для определения функции у(х) можно решать уравнение A0.1) с допол- дополнительными условиями A0.3) и A0.10). Однако, такой путь приводит к резкой потере точности. Решение очень «чувствительно» к изменениям малого парамет- параметра. Поэтому у(х) целесообразно находить из более простого уравнения A0.4) с учетом условия A0.3). Определение у(х) из уравнения A0.4) называется обрат- обратной прогонкой. Таким образом, метод прогонки решения краевой задачи A0.1)—A0.3) сводит ее к последовательному решению трех задач: а'(х) + а2(х) = ^, а@) = а0, A0.11) /З'(х) + а(хЩх) = ^, C(о) = /30, A0.12) у'{х) - а(х)у(х) = /3(х), у\1) - фоу{1) = "о- (Ю-13) Этот способ решения задачи корректен, если только ао существенно больше, v чем величина —, где постоянная v определяется условием р(х) > v2 > 0. A0.14) Изложенный метод применим к построению приближенного решения уравне- уравнения теплопроводности ^=/*20, n = n(t,x), 0<t<T, 0<х<1, A0.15)
§ 2.10. Уравнение Риккати в методе прогонки 199 с дополнительными условиями и@,х)=<р(х), A0.16) A0Л7) Как известно, для приближенного решения этой задачи часто приходится поль- пользоваться неявными разностными схемами. Одна из схем такого типа определя- определяется соотношениями т = 1,...; п = 0,1,..., где г — шаг по оси ?, a h — шаг по оси х. Рассмотрим наименее благопри- благоприятный для устойчивости случай бесконечно малого шага по пространственной переменной. Тогда в пределе соотношения A0.18) обращаются в систему диффе- дифференциальных уравнений л2 п+1/г\ H2{tn,x)r dx2 = ип+1{х) - ип(х), п = 0,1,..., A0.19) относительно функций ип+1(х) с малым параметром т при старшей производной. К этой системе добавляются граничные условия, которые получаются из сис- системы A0.17) согласно формулам A0.18): dx u dun+1(l) _ +] dx Таким образом, при каждом конкретном п мы получаем задачу уже рас- рассмотренного типа. Зная ип(х), изложенным выше способом можно определить ип+1(х). На нулевом слое, т.е. при п = 0, функция и°(х) определяется на- начальным условием A0.16). Чтобы отметить особенности получаемого при этом результата, повторим прямую и обратную прогонки применительно к рассмат- рассматриваемой здесь задаче. Левое граничное условие в A0.20) вместе с уравнением A0.19) индуцирует во dun+1(x) всех точках отрезка 0 < х ^ I линейное соотношение между ип+1(х) и : ах = а(х)ип+1(х) + C{х). A0.21) ах Коэффициенты этого соотношения а{х) и C{х) определяются из следующих диф- дифференциальных уравнений: af(x)+a2(x) = -ш —, LL2{tn.X)r (З'(х) + а(хЩх) = ^ [Х) , и начальных условий а@) = «о+1' ^(°) = /^о+1-
200 Гл. 2. Алгебраические и дифференциальные уравнения Определив таким образом а(х) и /3(х), находим ип+1(х) из системы уравнений , a(l)u(l) A0 23) 1(/) ^gu@ + ^- ах Зная un+1(l), определяем ип+1(х), 0 ^ x ^ l, из уравнения A0.21). Тем са- самым формальная процедура решения задачи полностью завершена. Далее сле- следует провести обоснование корректности описанного метода. В литературе по численным методам решения краевых задач подобные обоснования приводятся. Однако, здесь делать этого не будем, поскольку такая проблема выходит за рамки рассматриваемой нами темы об уравнениях Риккати и их применениях. 2. Краевая задача для векторного дифференциального уравнения. Проиллюстрируем применение метода прогонки для решения краевой задачи у"{х) + Q(x)y(x) = /(ж), а < х < C, A0.24) у'(а)+<ру(а) =а, A0.25) y'(l3)+il>y@)=b, A0.26) где матрица Q(x) порядка п и вектор f(x) размера п — известные непрерывные функции. Квадратные матрицы риф имеют порядок п, векторы а = {ai,..., ап} и Ъ = {6i,..., Ьп} также заданы. Так же, как и в случае скалярного уравнения, можно считать, что граничное условие на левом конце отрезка [а, /3] выделяет из общего решения уравнения A0.24) многообразие, которое можно описать зависимостью у'(х)=Ф(х)у(х)+А(х), A0.27) где матрица Ф(х) и вектор А(х) однозначно определяются уравнением A0.24) и граничным условием A0.25). Продифференцировав обе части соотношения A0.27) и исключив из получен- полученного равенства вторую производную с учетом уравнения A0.24), приходим к уравнению —Q(x)y(x) + f(x) = Ф(х)у/(х) + Ф/(х)у(х) + А'(х), из которого ис- исключаем производную у'(х), вычислив ее по формуле A0.27). В итоге получаем равенство —Q(x)y + f(x) = Ф(х) \Ф(х)у + А(х)] + Ф1 (х)у + А'(х), которое должно выполняться при любых значениях у. Поэтому матрицы Ф{х) и А{х) должны удовлетворять уравнениям Ф'{х) + Ф2(х) + Q{x) = 6>, A0.28) А'(х) + Ф(х)А(х) = /(ж). A0.29) Так как искомая функция у = у(х) должна удовлетворять граничному условию A0.25), то, в соответствии с формулой A0.27), должны выполняться условия ф(а) = -(?, A0.30) А(а) = а. A0.31) Таким образом, для определения матрицы Ф{х) имеем матричное уравнение РиккатиA0.28) с начальным условием A0.30). Определив эту матрицу, А(х) на-
§ 2.10. Уравнение Риккати в методе прогонки 201 ходим из уравнения A0.29) с начальным условием A0.31). Этим завершается прямая прогонка в решении краевой задачи A0.24)—A0.26). Обратную прогонку можно выполнить теми же рассуждениями, которые приведены выше при реше- решении скалярной краевой задачи. Их приводить не будем. Чтобы сделать более естественным переход к следующей задаче, преобразуем уравнение A0.24) с краевыми условиями A0.25) иA0.2б), вводя вспомогательные переменные: у\ = у, у2 = у[. Тогда краевая задача A0.24)—A0.26) может быть записана в виде Г 2/2+ Q(*J/i =/(*)> 2/1-2/2 = 0, [ (pyi(a) + 2/2(а) = «, ipyi(P) + 2/2(Ь) = Ъ. Таким образом, мы имеем краевую задачу для системы уравнений первого порядка и процедура прогонки в этом случае начинается с того, что вместо зави- зависимости A0.27) теперь (в новых переменных) мы берем следующее соотношение 2/2(х) = Ф(х)у\(х) + А(х), и в процессе решения вновь придем к задаче Коши для уравнения Риккати A9.28). Ситуация подобного типа возникает при рассмотрении возмущенной системы телеграфных уравнений ^+Y(x)V = Ф(х), ^ + ?(ж)/ = Ф(ж), а<х</3, A0.33) ах ах с граничными условиями V(a) = wol(a) + a, V(C) = ил J(/3) + Ъ. A0.34) Здесь / = {ii,..., in} и V = {i?i,..., vn} — векторы токов и напряжений в цепи, Y(x) и Z(x) — заданные матрицы, характеризующие параметры цепи, а вектор- функции Ф{х) и Ф(ж) определяют внешние возмущения. Второе граничное условие в A0.34) порождает в каждой точке х отрезка [а,/3] многообразие М{х) частных решений системы A0.33), которое можно задать уравнением V(x) = W(x)I(x) + B(x). A0.35) Для построения многообразия М(х) достаточно определить матрицу W(x) и век- вектор В(х). Это можно сделать стандартным способом, который применялся в рассмотренных выше задачах. Однако, в данном случае проще ведет к цели иной путь. Значение V(x) из A0.35) подставляем во второе уравнение системы A0.33) и из dl(x) полученного соотношения исключаем вектор с помощью первого уравнения ах из A0.33). В итоге получаем результат, который сформулируем в виде теоремы. Теорема 10.1. Матрица-функция W(x) в A0.35) не зависит от возмущений телеграфных уравнений и граничных условий и удовлетворяет матричному диф- дифференциальному уравнению Риккати —— = VFF^VF — Z{x) с начальным усло- условием W(/3) = wi, а вектор-функция В{х) определяется линейным уравнением — = W(x)Y(x)B — ]У(х)Ф(х) + Ф(ж) с начальным условием В(/3) = Ъ. ах
202 Гл. 2. Алгебраические и дифференциальные уравнения Аналогичный результат можно получить, рассматривая двухточечную гра- граничную задачу для векторного дифференциального уравнения второго порядка d2Y l_ p(T)Y — F(r) n < т < Я ПО ^ft) dxz Здесь также методом прогонки задача сводится к решению матричного диффе- дифференциального уравнения Риккати. Граничное условие при х = /3, /3 —> оо может состоять в ограниченности иско- искомого решения. В этом случае также вводится многообразие всех частных реше- решений, ограниченных на бесконечности. B.C. Биргером и Н.Б. Ляликовой [3] доказана следующая Теорема 10.2. Пусть в уравнении A0.36): 1) матрица-функция Р(х) является симметрической, положительно опреде- определенной и при х —У оо справедливы асимптотические разложения оо р оо у-, k=0 X k=0 X 2) все собственные значения матрицы Ро не лежат на отрицательной ве- вещественной полуоси. Тогда условие ограниченности решения уравнения A0.36) при х —У оо эквива- эквивалентно при достаточно больших х условию —— = W(x)Y + А(х), где dx г^ Wk dx k=o dA m/ ч . _ ч л Здесь Wo = y^—Po имеет отрицательные вещественные части всех собственных значений и Ао = W^^. Таким образом, и в этом случае ключевую роль играет матричное уравнение Риккати. § 2.11. Уравнение Риккати в теории управления В этом параграфе мы рассмотрим некоторые задачи теории управления, при решении которых появляются матричные уравнения Риккати. В каждой такой задаче уравнение обладает некоторой спецификой и оно имеет те или иные до- дополнительные свойства, которых нет у общего уравнения Риккати. Поэтому при необходимости мы будем формулировать эти свойства. В одних случаях с дока- доказательствами, в других — будем приводить лишь результат. 1. Задачи об аналитическом конструировании регуляторов и об оп- оптимальной стабилизации [27]. Будем рассматривать управляемый процесс, который описывается векторным дифференциальным уравнением х = A(t)x + B(t)u, to<t<T, A1.1)
§ 2.11. Уравнение Риккати в теории управления 203 в котором х = {xi,... ,хп} Е Еп — фазовый вектор, и = {ui,... ,ur} Е Ег — вектор управлений. Матрицы A(t) и B(t) предполагаются непрерывными. Первая из них имеет размерность п х п, а вторая — п х г. Причем допусти- допустимыми управлениями считаются произвольные кусочно-непрерывные управления и = u{t), все точки разрыва функции и = u{t) (если таковые имеются) первого рода. Каждому такому допустимому управлению соответствует единственное решение задачи Коши t), to<t<T, A1.2) x(to)=x°. A1.3) В прикладных задачах особое значение имеют допустимые управления в форме и = u(t,x), когда управление зависит не только от времени, но и от текущего состояния системы. В этом случае для описания процесса вместо A1.2), A1.3) мы получаем другую задачу: + B(t)u(t,x), to<t<T, A1.4) x(to)=x°, A1.5) в которой допустимым управлением считается функция и = u(t,x) такая, что задача A1.4), A1.5) имеет единственное решение при любом заданном векторе х° из некоторой окрестности О@) начала координат. На таких управлениях определен функционал J[u] = x*(T)Fx(T) + / [x*(t)Q(t)x(t) + u*(t)R(t)u(t)] dt, A1.6) который рассматривается как критерий качества системы A1.1). В нем F — не- неотрицательная постоянная матрица, Q(t) — неотрицательная непрерывная мат- матрица, R(t) — положительная непрерывная матрица. Не нарушая общности, можно считать, что все эти матрицы симметричны. Этот функционал ограничен сни- снизу. Поэтому представляется естественной следующая задача об оптимальном управлении, которая называется задачей об аналитическом конструировании ре- регуляторов. Задача 1. Требуется найти допустимое управление и = u(t, x) такое, чтобы на соответствующем ему решении уравнения A1.4) функционал J достигал своего наименьшего возможного значения при любом начальном векторе х° в условии A1.5). Ее решение можно получить многими различными способами. Здесь мы при- приведем результат, который получается применением метода динамического про- программирования (см., например, [35]). Этим методом получается следующий результат. Если ввести вспомогатель- вспомогательную функцию S(t,x)= min x*(T)Fx(T)+/ [x*(t)Q(t)x(t) + u*(t)R(t)u(t)] dt , A1.7) u(s) \ it ) то оптимальное управление и = u°(t,x) и эта функция образуют решение урав-
204 Гл. 2. Алгебраические и дифференциальные уравнения нения Беллмана - ;' } = min x*Q(t)x + u*R(t)u + Ol и \_ (dS(t x)\ * 1 + (—tt^ ) {A(t)x + 5(t)ix} , t0 ^ t < Г, A1.8) с дополнительным условием 5(Г,ж) =x*Fx, A1.9) <95(t,x) _ fdS(t,x) dS(t,x)\ дх \ dx\ ' ' 9жп J Решение задачи A1.8)—A1.9) ищем следующим образом. Сначала находим элемент и = и0, на котором достигается минимум в правой части уравнения A1.8). Необходимое условие экстремума можно представить в виде и = —R~1(t)B*(t)—7--^—. A1.10) Подставляя найденное значение и из A1.10) в правую часть уравнения A1.8), получим уравнение dt »u,dS(t,x) из которого следует найти функцию S(t,x), удовлетворяющую, кроме того, еще и условию A1.9). Решение этой задачи ищем в виде квадратичной формы S(t,x) =x*K(t)x, A1-12) где K(t) — подлежащая определению симметричная матрица. Из A1.12) следует, что f»?)=rf-w*, «^ = «(«),. (^)* = 21.ед. (п.Ц) Последнее равенство в A1.13) следует из того, что, по предположению, матрица К симметрична. Подставляя значение 5 и ее производных из A1.12) и A1.13) в уравнение A1.11), получаем -х*Кх = x*Q(t)x + x*KA(t)x + x*A*(t)Kx - x*KB(t)R-1(t)B*(t)Kx. Это равенство должно выполняться при любых значениях х из достаточно малой окрестности начала координат. Поэтому матрица К должна удовлетворять следующему уравнению Риккати К + Q(t) + KA(t) + A*(t)K - КВ^Я^^ВЦ^К = в, (И-14) где в — нулевая матрица. Так как функция S(t,x) должна удовлетворять условию A1.9), то К(Т) = F. A1.15) Таким образом, для определения матрицы К = K(t) мы имеем задачу Ко- ши A1.14), A1.15). Эта матрица определяет вспомогательную функцию Беллма-
§ 2.11. Уравнение Риккати в теории управления 205 на S(t,x) по формуле A1.12). Согласно определению (см. A1.7)), эта функция неотрицательна. Поэтому матрица K(t) также должна быть неотрицательной. Значит, требуется найти неотрицательную симметричную матрицу, удовлетво- удовлетворяющую уравнению A1.14), «начальному» условию A1.15) и определенную на отрезке времени [?о,Т]. Предположим, что эта задача имеет решение, определенное на отрезке времени to ^ t ^ Т. Тогда по формуле A1.12) находим функцию S = 5(?,ж), а затем по формуле A1.10) получаем управление u(t,x) = -R-i^B^^K^x, A1.16) которое удовлетворяет необходимому условию оптимальности управления (в за- задаче минимизации функционала J), сформулированному в виде уравнения Бел- лмана A1.8). Изложенная процедура построения оптимального управления сводится, в ко- конечном счете, к решению уравнения Риккати. При этом нас интересует лишь неотрицательное решение уравнения. Все остальные этапы решения задачи до- довольно просты и не требуют применения каких-либо специальных методов. Замечание 11.1. Поскольку уравнение A1.14) является нелинейным, то не яс- ясно, будет ли при заданном начальном условии A1.15) существовать его решение, определенное на всем отрезке [?о,Т]. Более того, если даже решение существу- существует на некотором интервале времени, примыкающем к точке to- то оно может перестать существовать на более широком временном интервале. Чтобы проиллюстрировать типичные трудности, возникающие при решении уравнения Риккати, рассмотрим простой Пример 11.1. Пусть управляемый процесс описывается скалярным уравнени- уравнением и соответствующая ему задача A1.14)—A1.15) имеет вид к = к2 + 1, к@) = 0. Решением этой задачи является функция k(t) = tgt. Это решение стремится к бесконечности при t ->• тг/2 - 0 и оно существует на отрезке 0 ^ t ^ 1, но не существует на отрезке 0 ^ t ^ 2. Поэтому, применяя изложенный прием решения задачи об оптимальном управ- управлении, мы вынуждены предполагать, что задача A1.14)—A1.15) имеет решение, определенное на всем рассматриваемом отрезке времени to ^ t ^ Т. Если это предположение выполнено, то возникает вопрос о практических ме- методах построения матрицы K(t), удовлетворяющей всем перечисленным требо- требованиям. Общий подход к решению этой задачи был изложен выше. Здесь мы рассмотрим ее с учетом того, что уравнение Риккати рассматривается не само по себе, а в связи с решением задачи минимизации функционала J[u] на решениях уравнения A1.1). Поэтому представляет интерес следующая вспомогательная задача. Найти та- такое преобразование координат в уравнении A1.1) z = P(t)x, A1-17) при котором бы уравнение Риккати приводилось к специальному каноническому виду. Оказывается, такое преобразование существует.
206 Гл. 2. Алгебраические и дифференциальные уравнения В самом деле, вводя замену A1.17) в уравнение A1.1), преобразуем его к виду z = [P(t)A(t) + Р^Р-1^ + P(t)B(t)u, A1.18) а критерий J[u] принимает вид J[u] = z*(T)P*-1(T)FP-1(T)z(T) 1(t)^(t) + u*(t)R(t)u(t)} dt. A1.19) Поэтому задачу Коши A1.14)—A1.15) для уравнения A1.18) с критерием A1.19) можно записать в виде К + Q1 + #Ai(t) + Al(t)K - KB^R^^Bl^K = 0, A1.20) K(T) = FU A1.21) где Qi(t) = p-\t)Q(t)p-\t\ A^t) = [P(t)A(t) 1 ?i(*) = P(t)B(t), Pi = P*-1(T)FP~1(T). Из второй формулы в A1.22) следует, что если матрицу P(t) выбрать так, чтобы выполнялось тождество P(t) + P(t)A(t) =6>, A1.23) то получим A1(t)=Al(t)=0. A1.24) Как известно, матрица Коши W(t,s) уравнения х = A(t)x A1.25) обращает его в тождество. Она определяется через матрицу X(t) линейно неза- независимых решений этого уравнения по формуле W(t,s) = X(t)X~1(s) и, следова- следовательно, W(s,t) = X(s)X-1(t). Из того, что X(t)X~1(t) = Е, получаем *-1(T)FP~1(T) -Ht) = в. d[x(t)x-Ht)] Поэтому X~1(t) = —X~1(t)X(t)X~1(t). Отсюда следует, что W(s,t) = -Wis^XtyX-1^). A1.26) Так как X(t) — матрица решений уравнения A1.25), то X(t) = A(t)X(t), и dW(s t) из A1.26) находим, что —-— = —W(s,t)A(t), т.е. матрица W(s,t) является О V решением уравнения z = —zA(t). Подводя итог, полученный результат можно сформулировать следующим об- образом. Теорема 11.1. Если в уравнении A1.1) сделать замену переменной z = W(T,t)x, A1.27) то: 1) уравнение A1.1) приводится к виду z = W(T,t)B(t)u;
§ 2.11. Уравнение Риккати в теории управления 207 2) критерий оптимальности A1.6) принимает вид J[u] = z*(T)Fz(T) + [ [z*(t)Q2(t)z(t) + u*(t)R(t)u(t)]dt, где Q2(t) =W*(t,T)Q(t)W(t,T); 3) уравнение Риккати A1.14) в этом случае принимает вид К = KW(T,t)B(t)R-1(t)B*(t)W*(T,t)K - Q2(t). A1.28) Рассмотрим теперь задачу об оптимальной стабилизации. Она формулирует- формулируется следующим образом. Пусть управляемый процесс описывается уравнением A1.1), в котором мат- матрицы A(t) и B(t) непрерывны при to ^ t < oo. Допустимыми управлениями являются функции и = u(t), которые определены при to ^ t < oo и кусочно- непрерывны на каждом ограниченном отрезке времени [г, Т] при to ^ т < Т. Каждому такому управлению поставим в соответствие решение х = x(t), удов- удовлетворяющее начальному условию A1.3) при достаточно малой величине |ж°|. Это решение может оказаться ограниченным или неограниченным на полуоси to ^ t < оо. Может также оказаться, что выполнено условие lim \x(t)\ =0. A1.29) В этом последнем случае на управлении u(t) определим функционал гоо J0[u] = / [x*(t)Q(t)x(t) + u*(t)R(t)u(t)] dt, A1.30) в котором Q(t) и R(t) — непрерывные ограниченные симметричные матрицы, причем Q(t) предполагается неотрицательной, a R(t) — положительной. На кон- конкретном управлении этот функционал может принимать конечное значение или быть неограниченным. Так же, как и в задаче об аналитическом конструировании регуляторов, осо- особый интерес представляют управления в форме и = u(t,x). Тогда соответствую- соответствующие фазовые траектории определяются задачей Коши х = A(t)x + B(t)u(t,ж), t0 < t < oo, A1.31) x(to)=x°. A1.32) Для нас особый интерес представляет случай, когда на каждом управлении и = u(t,x) уравнение A1.31) имеет тривиальное решение x(t) = 0. Задача 2. В классе допустимых управлений и = u(t, x) требуется найти управ- управление такое, чтобы: 1) соответствующее ему тривиальное решение уравнения A1.31) было асимп- асимптотически устойчивым; 2) на любом решении х = x(t) задачи A1.31), A1.32) при этом управлении и достаточно малых значениях х° функционал A1.30) принимал наименьшее воз- возможное значение. Решение этой задачи получается тем же методом, что и решение задачи об ана- аналитическом конструировании регуляторов. В итоге задача сводится к решению того же уравнения Риккати A1.4) с дополнительным условием A1.15). Един-
208 Гл. 2. Алгебраические и дифференциальные уравнения ственное отличие состоит здесь в том, что решение должно быть определено на полуоси to ^ t < оо. Особенность в решении задачи получается в одном частном случае, когда урав- уравнение A1.1) стационарно, т.е. когда матрицы А и В постоянны. В критерии оптимальности A1.30) матрицы Q и R тоже должны быть постоянными. Речь идет о следующей задаче. Задача 3. Пусть управляемый процесс описывается уравнением х = Ах + Ви, A1.33) где х Е En, u Е Ег, а матрицы А и В постоянны. Критерием оптимальнос- оптимальности служит функционал A1.30), в котором Q и R — постоянные симметричные матрицы, причем Q неотрицательна, a R положительна. В остальном задача об оптимальном управлении формулируется точно так же, как и задача 2. При решении этой задачи методом динамического программирования мы вновь можем получать уравнение вида A1.11). Однако, все известные в нем матрицы оказываются постоянными. Поэтому его решение можно искать в виде S(t, x) = S(x) = x*Kx, A1.34) где К — подлежащая определению неизвестная симметричная постоянная мат- матрица. Если теперь повторить последующие за формулой A1.12) рассуждения, то относительно матрицы К получим алгебраическое уравнение Риккати (ср. с A1.14)) Q + К А + А* К - КВВГХВ*К = 0. 2. Оптимальный фильтр Каллмана-Бьюси. Рассмотрим линейную сис- систему, поведение которой описывается дифференциальным уравнением х = A(t)x + B(t)w(t). A1.35) Предполагается, что состояние системы х — n-мерный вектор, A(t) и B(t) — заданные непрерывные матрицы размерностей пхпипхг, соответственно. w(t) — r-мерный векторный случайный процесс, определяющий неконтролируемые помехи. Результаты наблюдения за поведением x(t) определяются т-мерным вектором z(t) = C{t)x{t)+v{t), A1.36) в котором v(t) — m-мерный векторный случайный процесс, определяющий по- помеху в измерительном устройстве. Матрица С(?), имеющая размерность т х п, задана и непрерывна. Предполагается, что процессы w(t) и v(t) являются гауссовыми случайными процессами типа белого шума с нулевыми средними значениями. Их корреляци- корреляционные матрицы имеют вид cov[w(t)',w(s)] =M[w(t)w*(s)] = Q(t)S(t-s), cov[v(t);v(s)] =M[v(t)v*(s)] = R(stM(t - s), A1.37) cov[w(t);v(s)] = M[w(t)v*(s)] = 6>, где M — символ математического ожидания. Кроме того, предполагается, что x(to) является n-мерным случайным гауссо-
§ 2.11. Уравнение Риккати в теории управления 209 вым вектором с нулевым средним значением M[x(t0)] = 0 A1.38) и корреляционной матрицей M[x(to)x*(to)] = Ko, A1.39) причем матрица Ко считается известной и неотрицательной. Помехи w(t) и v(t) считаются независимыми. Систему, описываемую уравнением p = F(t)p + G(t)z(t) A1.40) с начальным условием p(t0) = 0, A1.41) называют фильтром системы A1.35), A1.36). Фильтр называется оптимальным, если матрицы F(t) и G(t) в нем подобраны так, чтобы величина J(t) = M[e*(t)e(t)], e(t) = x(t) - p(t) A1.42) принимала наименьшее возможное значение при любом t Е [?о,оо). Здесь x(t) — решение уравнения A1.35), у которого начальный вектор x(to) подчинен условию A1.39). Согласно теории фильтрации Винера, оптимальная матрица F(t) находится в виде F(t) = A(t) - G(t)C(t). A1.43) Этот результат получается без использования уравнения Риккати. Поэтому до- доказательство приводить не будем. Для определения оптимальной матрицы Q(t) требуется решать дифференци- дифференциальное уравнение Риккати. Покажем это. Через K(t) обозначим корреляционную матрицу ошибки фильтра K(t) = M[e(t)e*(t)]. A1.44) Так как по предположению оптимальная функция p(t) должна удовлетворять на- начальному условию A1.41), то, учитывая соотношение A1.39), получаем K(to)=Ko. A1.45) Покажем, что для оптимального фильтра матрица K(t) удовлетворяет диффе- дифференциальному уравнению Риккати. С этой целью сначала покажем что опти- оптимальная матрица G(t) определяется по формуле G(t) = К'(t)C*^)Я~г(t). Так как матрица F(t) определяется по формуле A1.43), то соответствующая оптимальная функция p(t) должна удовлетворять уравнению р = [A(t) - G(t)C(t)]p + G(t)z(t) A1.46) и начальному условию A1.41). Пусть к,(?) — матрица линейно независимых решений соответствующего однородного уравнения. Тогда его матрицу Коши Ф(?,з) можно представить в виде Ф(?,з) = K,(t)K,~1(s) и, следовательно, записать следующим образом: f A1.47) p(t)= f 4>(tj Jto
210 Гл. 2. Алгебраические и дифференциальные уравнения Полагаем, далее, a(t,s) = V(t,s)G(s). A1.48) В теории Винера доказывается, что оптимальная функция a(t,s) удовлетворяет ft следующему уравнению Винера M[x(t)z*(r)] = / a(t,s)'M.[z(s))z*(r)]ds. Jt0 Решение уравнения A1.34) можно представить в виде w(s)dsJ A1.49) где Ф(?,з) — матрица Коши. Поэтому <$>(tjS)B(s)M[w(s)v*(T)]ds. Так как случайные процессы w(t) и v(t) независимы и независимы также x(to) и и(?), то отсюда следует, что M.[x(t)v* (s)] = в. В соответствии с уравнением наблюдателя A1.36) и формулой A1.50) имеем M[x(t)z*(s)] = M[x(t)x*(s)]C*(s). A1.50) Аналогично из A1.36) и A1.37) получаем M[z(t)z*(r)] = M[z(t)x*(r)]C*(r) + R(tM(t - г). A1.51) Поэтому из уравнения Винера и из соотношений A1.50) и A1.51) следует, что M[x(t)x*(T)]C*(r)- / а(М)М[;ф)ж*(т)]С*(т)бк - Jt0 - a(t,T)R(sM(s-T)ds = 0, t0 ^ т < ?, ^t0 или a(t,r)R(r) =M[x(t)x*(r)]C*(r) - f a(t,s)M[z(s)x*(r)]C* (r) ds. A1.52) Так как обе части соотношения A1.52) — непрерывные функции от г, то это со- соотношение остается справедливым и при т = t. Поэтому, учитывая, что a(t,t) = G(t), будем иметь G(t)R(t) = М[ж(?)ж* (?)]<?*(?) - / a(t, s)M[z(s)x*(t)]C*(t) ds. Если, кроме того, учесть формулу A1.47), то получим x(t) - / a(t,s)z(s)ds)x*(t)C*(t)\ = = M{[x(t) - p(t)]x*(t)}C*(t) = M[e(t)x*(t)]C*(t). A1.53) Так как x(t) = e(t) + /?(t), то M[e(t)x*(t)] = M[e(t)(e(t) + p(*))*] = M[e(t)e*(t)] + M[e(t)p*(t)]. Согласно соотношениям A1.37) и A1.47), выполняется ~M.[e(t)p(t)] = ^. Учитывая, наконец, соотношение A1.44), получаем М[е(?)ж*(?)] = K(t). Следо- Следовательно, из A1.53) будем иметь G(t)R(t) = K(t)C*(t). Так как, по определению матрица R(t) положительна, то отсюда получаем G(t) = K(t)C*(t)R-\t). A1.54)
§ 2.11. Уравнение Риккати в теории управления 211 Покажем теперь, что матрица K(t) удовлетворяет уравнению Риккати. Непо- Непосредственно из определения ошибки фильтра имеем e(t) = x(t) — p(t) и, следова- de(t) dx(t) doit) тельно, —-— = — —. В соответствии с уравнениями системы A1.35) и CLV CLV CLV фильтра A1.40) получаем de — = [A(t) - G(t)C(t)]e + B(t)w(t) - G(t)v(t). A1.55) at Поскольку w(t) и v(t) — случайные процессы с нулевыми средними значениями, то из уравнения A1.55) следует, что e(t) также является случайным процессом с нулевым средним значением. de Через Ф(?, s) обозначалась матрица Коши уравнения — = [A(t) — G(t)C(t)]e и CLV поэтому решение уравнения A1.55) можно записать в виде e(t) = Ф(?, to)e(to) + / [Ф(?, s)[B(s)w(s) - G(s)v(s)] ds. A1.56) Jt0 Так как по определению сигналы w(t) и v(t) не коррелированы с е(?о) = x(to), то будем иметь K(t) = M[e(t)e*(t)] = Ф(Мо)М[х(*о)**(*о)]Ф*(Мо) + + М / V(t,s)[B(s)w(s) - G(s)v(s)]ds / [w*(s)B*(s) - v*(s)G*(s)]V*(t, s) ds . Uto Jto 1 В соответствии с формулами A1.37) это соотношение можно переписать в виде + [ 9(t,s)[B(s)Q(s)B*(s)+G(s)R(s)G*(s)]9*(t,s)ds. A1.57) Jt0 При этом следует иметь в виду, что, в соответствии с ранее полученной формулой (см. A1.54)), G(t) = КфС+фЯ-1®. Таким образом, A1.57) представляет собой нелинейное интегральное уравне- уравнение относительно неизвестной матричной функции K(t). Если его продифферен- продифференцировать почленно по переменной ?, то после несложных преобразований получим следующее уравнение Риккати ^ = A(t)K + KA*(t) + KC^^R-i^C^K + B(t)Q(t)B*(t). A1.58) Подводя итоги в приведенных рассуждениях можно сформулировать получен- полученный результат. Теорема 11.2. В линейной системе, определяемой уравнением движения A1.34) и уравнением наблюдателя A1.35) с условиями A1.37), параметры оп- оптимального фильтра A1.40), A1.41) с критерием оптимальности A1.42) опре- определяются по следующим формулам (см. A1.43) и A1.54)) F(t) = A(t) — G(t)C(t), G(t) = K(t)C*(t)R~1(tI в которых матрица К = K(t) является решением урав- уравнения Риккати A1.58) с начальным условием (см. A1.45)) К (t0) = K0 = M[x(to)x*(to)]. A1.59) Итак, мы рассмотрели несколько задач из теории управления, при решении которых встречаются уравнения Риккати. Во всех случаях эти уравнения об-
212 Гл. 2. Алгебраические и дифференциальные уравнения ладают одной особенностью. Она состоит в том, что в линейных относительно неизвестной матрицы слагаемых входят матрицы A(t) и A*(t). Это типичная ситуация в теории управления. Отмеченная особенность полученных уравнений имеет далеко идущие последствия. Такие уравнения обладают рядом чрезвычай- чрезвычайно полезных свойств. Приведем некоторые из них. При этом будем пользоваться обозначениями К > О, если х*Кх > 0 при \х\ Ф О, V ' ' ^ ' A1.60) К > 0, если х*Кх > 0 при |ж| ф 0. Теорема 11.3. Решение К = K(t) уравнения A1.58) с начальным условием A1.58), в котором матрица Ко неотрицательна, удовлетворяет для всех t ^ to условиям 0 ^ K(t) ^ W(t,to)KoW(t,to)+ / W(t,s)B(s)Q(s)B*(s)W*(t,s)ds, где Jt0 W(t, s) — матрица Коши уравнения х = A(t)x. Теорема 11.4. Если в условии A1.59) матрица Ко положительна (Ко > 0), то решение К = K(t) задачи A1.58), A1.59) положительно при t > to- Следующее утверждение требует дополнительных обозначений. Введем мат- матрицы N(to,t)= f W(to,s)B(s)B*(s)W*(to,s)ds, % (П-61) M(to,t)= / W*(s,to)C*(s)C(s)W(s,to)ds. Jt0 Теорема 11.5. Пусть система A1.1) —A1.2) такова, что матрицы (8.61) не особенны при всех t G [?о,оо). Тогда решение K(t,to) уравнения Риккати A1.58) с начальным условием A1.59), в котором Ко = в имеет при to —> — оо предел lim K(t,to) = K(t), который существует при всех t. § 2.12. Приближенное решение матричных уравнений Риккати Завершая анализ матричных уравнений Риккати, рассмотрим вопрос о при- приближенных методах их решения. Литература по нему достаточно обширна и рассматривать все принципиально различные методы здесь не представляется возможным. Поэтому ограничимся лишь изложением одного метода [37] реше- решения алгебраического уравнения и одного [35] — дифференциального уравнения, не вдаваясь в их качественную характеристику. Заинтересованный читатель может углубить анализ рассматриваемого вопроса, привлекая дополнительную литературу. 1. Решение алгебраического уравнения методом Шура. Будем рас- рассматривать матричное уравнение XGX - А*Х -XA-F = 0, A2.1) где G, А и F — заданные n-мерные вещественные матрицы, причем F = F*,
In § 2.12. Приближенное решение матричных уравнений 213 G = G*, и так называемая сопровождающая матрица М=[Ар _*,) A2.2) имеет вещественный простой спектр. Для этого случая опишем метод Шура численного решения алгебраических уравнений с некоторой модификацией, заключающейся в блочном приведении сопровождающей матрицы к форме Шура. Использование гамильтоновой струк- структуры матрицы М на начальном этапе позволяет, по мнению автора статьи [37], более чем вдвое сократить вычислительную работу и при эквивалентных затра- затратах памяти сохранить матричные коэффициенты уравнения, чтобы при необхо- необходимости выполнить итерационное уточнение. Чтобы подчеркнуть порядок той или иной матрицы, будем использовать со- соответствующие индексы. Например, через вп и 1п будем обозначать нулевую и единичную матрицы n-го порядка, соответственно. Через сг(А), как обычно, бу- будем обозначать спектр матрицы А, а через С~ — левую открытую полуплоскость комплексной плоскости С. Введем также обозначение J = V t Далее напомним некоторые необходимые в дальнейшем сведения об употреб- употребляемых ниже специальных матрицах. Вещественные матрицы М, N и S называются, соответственно, гамильтоно- гамильтоновой, J-симметричной и симплектической, если J*MJ = —М*, J*NJ = TV*, S*JS = J. Матрица М, определяемая равенством A2.2), очевидно, является гамильтоновой. Спектры указанных классов матриц обладают той или иной симметричной структурой. В частности, справедливы следующие утверждения. Теорема 12.1. Пусть матрица М порядка 2п является J -симметричной. Ес- Если X е сг(М), то и -X е а(М) и оба числа X и -X имеют одинаковую кратность алгебраическую и симплектическую. Теорема 12.2. Пусть матрица N порядка 2п является J -симметричной. Тог- Тогда в системе ее элементарных делителей каждый встречается четное число раз {т.е., в частности, спектр N состоит из пар (Л, Л)). Теорема 12.3. Пусть матрица S порядка 2п-симплектическая. Тогда ес- если М гамилътонова, то и S~1MS гамилътонова, если матрица N является J-симметричной, то J-симметрична и S~1NS, если А симплектическая, то S~1AS симплектическая. Для разработки численных методов особый интерес представляют симплекти- ческие матрицы, которые, в то же время, являются ортогональными. Непосред- Непосредственно из определения вытекает Утверждение 1. Симплектическая и ортогональная матрица U порядка 2п имеет следующую блочную структуру: где матрицы 11ц, i = 1,2, имеют порядок п.
214 Гл. 2. Алгебраические и дифференциальные уравнения В дальнейшем нам понадобятся три типа матриц указанного класса: 1) симплектическое отражение R = diag^, Я), где R — обычная матрица отражения порядка п; 2) двойное вращение R = diag(it^j, Rij), где R — обычное вращение с опорным квадратом (г, j); 3) симплектическое вращение Rn^n+i = ( ), где , если г = j = к, i в противном случае; с2 + s2 = 1. Завершает сводку теоретико-матричных результатов Теорема 12.4. Пусть А и В — перестановочные матрицы порядка т, причем А имеет блочно-треуголъную структуру: А = О 0 ... AkkJ и а(Ац) П a(Ajj) = 0 гс/ж 1 ^ i,j ^ /с, г ф j. Тогда В — верхняя блочно- треугольная матрица, причем ее блочное строение совпадает со строением А. Рассматриваемый здесь метод Шура решения уравнения Риккати основан на вычислении для матрицы A2.2) n-мерного инвариантного подпространства, со- соответствующего устойчивой части его спектра и состоит из следующих этапов. Этап 1 (приведение матрицы М к форме Хессенберга). Вычислить матрицы H,Qi порядка 2п такие, что Q^MQi = Я, где Qi — ортогональная, а Я — верхняя хессенбергская, т. е. hij = 0 при г > j + 1. Этап 2 (вычисление вещественной формы Шура матрицы Я). Найти матрицы Т, Q2 порядка 2п такие, что Q\HQ<z — Т, где Qi — ортогональная, а Т — верхняя блочная треугольная с диагональными блоками 1 х 1 и 2 х 2. Блоки порядка 1 соответствуют вещественным собственным значениям матрицы Т, а порядка 2 — комплексным собственным сопряженным парам. Матрицу Т такой структуры называют вещественной формой Шура матрицы Я. Этап 3 (переупорядочение вещественной формы Шура). Вычислить ортого- ортогональную матрицу Qs такую, что QtTQs = f={T^ T?), A2.4) где fij,i,j = 1,2; <т(Тц) С С". Этап 4 (получение решение X уравнения A2.1) из матричного уравнения XxUu = U21, A2.5)
§ 2.12. Приближенное решение матричных уравнений 215 где U\\ и U21 являются п-мерными блоками ортогональной матрицы) Ортогональные преобразования Qi, Q2 и Q% не вычисляются порознь, а на- накапливаются в матрице U. Замечание 1. Теорема 12.1 и сделанные в отношении коэффициентов уравне- уравнения A2.1) предположения гарантируют отсутствие у матрицы М чисто мнимых собственных значений и, как следствие, существование формы Шура A2.4) и однозначную разрешимость уравнения A2.5). Весьма эффективный метод Шура обладает тем недостатком, что игнорирует гамильтонову структуру матрицы A2.2). Это влечет за собой как существенное увеличение трудоемкости, так и возможную из-за ошибок округления потерю свойства симметричности спектра сопровождающей матрицы A2.2). На послед- последнее указал создатель алгоритма Лауб [42]. Все это послужило причиной появления в последние годы целой серии работ двух направлений. Первое связано с разработ- разработкой неортогональных алгоритмов решения алгебраического уравнения Риккати, способных составить конкуренцию методу Шура. Это Sit^-алгоритм из работы Бунсе-Гартнера и Мерманна [43] и метод знаковой функции, модифицированной Байерсом [41]. Исходной точкой для работ второго направления стала доказанная Пэйге и Ван Лоаном [44] Теорема 12.5. Если М — гамилътонова матрица порядка 2п, не имеющая чисто мнимых собственных значений, то существует ортогональная симплек- тическая матрица S такая, что ) A2.6) где Ti2 = Т^, Тц — верхняя вещественная матрица Шура и сг(Гц) С С~. Последующие публикации были связаны с разработкой гамильтонова QR-алго- ритма, который приводил бы произвольную гамильтонову матрицу, не имеющую чисто мнимых собственных значений, к виду A2.6), используя симплектические ортогональные преобразования и сжатую форму типа хессенберговой. Излагаемый здесь метод блочного приведения матрицы A2.2) к форме A2.4) не дает исчерпывающего ответа на поставленную задачу. Однако, его исполь- использование на начальных этапах излагаемого алгоритма построения гамильтоновой структуры матрицы A2.2) позволяет достичь, по сравнению с методом Шура, существенной экономии вычислительной работы и памяти. После этого предварительного (далеко не полного) анализа метода Шура и его дальнейшего развития несколько подробнее обсудим алгоритм Ван Лоана вычис- вычисления спектра гамильтоновой матрицы. 2. Метод блочного приведения гамильтоновой матрицы к форме Шура. Идея алгоритма такова: для матрицы N = М2(М гамильтонова), являю- являющейся J-симметричной в силу определения, вычисляются собственные значения, а затем из них извлекаются квадратные корни. При этом берутся оба значения
216 Гл. 2. Алгебраические и дифференциальные уравнения корня, поскольку спектр М составляют пары (Л,—Л). Спектральная же зада- задача для J-симметричной матрицы конечным процессом редуцируется к проблеме вдвое меньшей размерности. Приведем описание этого процесса. В С ВХОД. J-симметричная матрица N = [ ,С = -С*, D = —D*. \D В ) ВЫХОД. J-симметричная матрица размерности 2п N=A ?), К=-К: A2.7) Матрица N, называемая J-хессенберговой, будет получена применением к N конечного числа симплектических ортогональных подобий. Процесс состоит из п — 1 шагов. Результатом k-то шага является J-симмет- J-симметричная матрица Nk = ( ), где при к < п — 1 ведущая главная подматрица \Vk Вк) размерности к + 2 блока Вк имеет верхнюю форму Хессенберга, а все ненулевые элементы блока Dk сосредоточены в его хвостовой подматрице размерности п — к. Рассмотрим более подробно (к + 1)-й шаг процесса, к < п — 1. Сначала выпол- выполним симплектическое отображение ?/^+1, аннулирующее элементы (к + 3, к + 1), (к + 4, & + 1), ..., (n, fc + 1) блока Dk: Nk = t/^+17V/ct/^+1. Затем симплектичес- ким вращением R с опорным квадратом (к + 2) х (п + & + 2) обращаем в нуль элемент (fc + 2,fc + 1) блока B,1) матрицы Д/&: А/& = R*NkR. Завершает шаг симплектическое отражение ?/|+1, приводящее (fc + 1)-й столбец блока A,1) к форме Хессенберга: Nk+1 = U%+1NkU%+1. Разумеется, реальному хранению и перевычислению подлежат лишь блок A,1) и половинки внедиагональных блоков. На последнем (п — 1)-м шаге процесса нет необходимости в симплектических отражениях. Он состоит в аннулировании элемента (п,п + 1) блока B,1) симплек- тическим вращением с опорным квадратом (п,2п). В результате (п — 1) шагов алгоритма получаем J-хессенбергову матрицу A2.7). Следовательно, алгоритм Ван Лоана вычисления спектра гамильтоновой мат- матрицы состоит из следующих этапов. Этап 1. Вычислить J-симметричную матрицу N-M2_( A2 + GF AG-GA* N~M -\FA-A*F (A2 + GF)* Этап 2. Привести N к J-хессенберговой форме посредством симплектической ортогональной матрицы U: Этап 3. Применить (ЗЛ-алгоритм к матрице Н. Вычислить cr(N) = <т(М) = Замечание 2. Существует и неявная реакция алгоритма. Оба варианта можно найти в работе Ван Лоана [44].
§ 2.12. Приближенное решение матричных уравнений 217 Перейдем теперь к описанию метода блочного приведения. Для успешного за- завершения его работы необходимо потребовать (и мы сделаем это), чтобы гамиль- тонова матрица М не имела кратных собственных значений. Кроме того, для краткости изложения предположим, что все собственные значения вещественны. Анализ незначительных изменений в работе метода в случае невещественного спектра матрицы М обсуждается ниже, после полного описания метода. Там же приведены соответствующие примеры. ВХОД. Блоки A, F и G гамильтоновой матрицы М размерности 2п. ВЫХОД. Вещественная форма Шура A2.4) матрицы М и приводящая к ней ортогональная матрица U размерности 2п. Матричные коэффициенты уравнения Риккати A2.1) при этом сохраняются. Первые три шага метода — не что иное, как алгоритм Ван Лоана с накоплением симплектического ортогонального сомножителя и с некоторым видоизменением последнего этапа. ШАГ 1. Формирование J-симплектической матрицы N = М2. ШАГ 2. Приведение N к J-хессенберговой форме A2.9) и вычисление орто- ортогональной симплектической матрицы U, которая осуществляем это приведение: N := U*NU (символ присвоения := употреблен с целью сохранения одного и того же обозначения за исходной и преобразованной матрицами). ШАГ 3. Вычисление J-формы Шура матрицы N с накоплением в U симплек- симплектического ортогонального преобразования: N := diag(V*, У*) х N х diag(V, У), A2.10) ?/:=?/xdiag(V,V). A2.11) Здесь матрица V формируется явно как результат вычисления (ЗЛ-алгоритмом формы Шура блока N\\. В соответствии с соотношением A2.9), кососимметрич- ный блок К матрицы N преобразуется по формуле К := V*KV. A2.12) В итоге N принимает вид {1 ?) A2ЛЗ) где К = -К*, R —вещественная матрица Шура. ШАГ 4- Переупорядочение N к обычной форме Шура. Введем матрицы Р = {ei,... ,еп}, где е& — к-й единичный координатный вектор в п-мерном пространстве, и Р = diag(/n,P). Применим к N подобие матрицей Р: N:=PNP=U PRP)- A2Л4) Так как, по предположению, собственные значения матрицы N вещественны, то полученная таким образом матрица является верхней треугольной с диагональю (гц,... ,Tnn,rnn,rn_i5 ...,тц). Ортогональный сомножитель будет пересчитан по формуле U := U х Р. Последний шаг нуждается в пояснениях. На первых трех шагах, сохраняя свой- свойство симплектичности ортогональных преобразований, мы построили J-форму Шура матрицы N = М2. Однако, для получения решения уравнения Риккати
218 Гл. 2. Алгебраические и дифференциальные уравнения A2.1) необходимо найти не спектр матрицы V, а ее устойчивое инвариантное подпространство. К сожалению, собственные векторы (векторы Шура) матрицы М2, вообще говоря, не являются такими же для М. Тем не менее, свойство пере- перестановочности матриц М и N = М2 вместе с теоремой 12.3 позволяет выбрать среди многих базисов Шура N такой, в котором блочная структура М будет нетривиальной. Дальнейшие шаги блочного приведения направлены как раз на построение под- подходящей формы Шура N и последующее приведение матрицы М к искомому виду A2.4). ШАГ 5. Переупорядочение формы Шура N к блочной матрице с непересе- непересекающимися спектрами диагональных блоков. Здесь вещественная форма Шура N будет переупорядочена следующим образом: N := W*NW, где W — ортого- ортогональная матрица порядка 2n, a N — верхняя треугольная матрица с элементами (Гц, . . . ,ГПП,ГПП). При этом ортогональное преобразование накапливается в U (U := U x W), а полученную матрицу N можно рассматривать как блочную матрицу порядка п, причем спектры диагональных блоков попарно не пересекаются. В рассматрива- рассматриваемом здесь случае вещественного спектра для перестановки двух последователь- последовательных диагональных блоков достаточно единственного преобразования вращения. ШАГ 6. Приведение гамильтоновой матрицы М к блочно-треугольной фор- форме. Применение к М ортогонального подобия с полученной на предыдущем этапе матрицей U: fii М12 ... М1п\ M:=U*MU=\ ° — '" -™ ^ A2.15) в ... Мпп) где диагональные блоки М/сп, к = 1,..., п, имеют порядок 2, а блоки, стоящие ни- ниже главной диагонали, нулевые, так как для матрицы М из A2.15) и вычисленной матрицы N выполнены все условия теоремы 12.5. ШАГ 7. Приведение диагональных блоков М к форме Шура. Нахождение такой ортогональной матрицы Q, что М := Q*MQ — вещественная матрица Шура. Ортогональный сомножитель будет пересчитан по формуле U := U x Q. Этот шаг представляет собой метод блочного «приведения». Так как М подобна гамильтоновой, то справедливо соотношение а(Мкк) — (—y^k^V^k), гДе ^к — соответствующее собственное значение матрицы М. Кроме того, поскольку по- порядки блоков Мкк одинаковы и равны двум, то процесс приведения М к форме Шура будет заключаться в выполнении последовательности п вращений. Их уг- углы выбираются так, чтобы в форме Шура каждого блока Мкк на первом месте стояло устойчивое собственное значение. ШАГ 8. Переупорядочение формы Шура матрицы М к искомой. Найти орто- ортогональную матрицу Z порядка 2п, такую, чтобы матрица М := Z*MZ приобрела искомую форму Шура A2.4). При этом ортогональные преобразования накапли- накапливаются в матрице U (U := U x Z). При этом снова, как и на шаге 5, стоимость процедуры переупорядочения ми- минимальна в силу вещественности спектра матрицы М. На этом и заканчивается
§ 2.12. Приближенное решение матричных уравнений 219 метод блочного приведения. Таким образом, излагаемая здесь модификация метода Шура относится лишь к процедуре вычисления n-мерного устойчивого инвариантного подпространства сопровождающей матрицы A2.2). Поэтому сравнение арифметических затрат и требований к памяти приводим именно для двух таких процедур. При подсчете числа арифметических действий (умножений) будем пренебрегать слагаемыми порядка п2, а в требованиях к памяти линейными по п членами. Результаты расчета трудоемкости метода Шура и метода блочного приведе- приведения дали следующие результаты (см. [37]). По методу Шура требуется 146-п2 о операций. По модифицированному методу блочного приведения — 66.5п2 опера- операций. Таким образом, второй метод позволяет более чем в два раза сократить вы- вычислительные затраты при эквивалентных требованиях памяти. Кроме того, он сохраняет исходные матричные коэффициенты уравнения, в силу чего возможна эффективная организация процедуры итерационного уточнения решения уравне- уравнения A2.1). Однако, следует заметить, что описание метода блочного приведения гамиль- тоновой матрицы к форме Шура сделано в предположении, что она имеет ве- вещественные и попарно различные собственные значения. Первое из них сделано из чисто методических соображений, чтобы освободить изложение от обилия технических деталей. Необходимые уточнения при переходе к комплексным соб- собственным значениям читатель при желании может найти в работе [37]. Предположение об отсутствии кратных собственных значений, напротив, яв- является принципиальным и поэтому ограничивает возможности метода. В качестве иллюстративного примера автор статьи [37] рассмотрел уравнение вида A2.1), в котором коэффициенты уравнения были порядка п = 2к - 1 для к = 5, 7,9 и имели вид F = diag@,10,0,10,..., 0), G = diag(l, 0,10,..., 1), — 1, если г = j и г нечетно, — 1, если г = j — 1 и г четно, 1, если i = j + 1 и i четно, 0 в остальных случаях. Описанный выше (см. § 2.3) метод точного аналитического решения алгебраи- алгебраических уравнений Риккати показывает, что в общем случае оно имеет несколько независимых решений. Однако, предлагаемые здесь численные методы это обсто- обстоятельство никак не учитывают. Поэтому представляется интересным рассмот- рассмотренный здесь пример проанализировать точными аналитическими методами и сравнить получаемые при этом результаты. 3. Итерационный метод решения дифференциального уравнения Риккати. Рассмотрим дифференциальное уравнение ^ = Q(t) + A(t)X + XA*(t) + XR(t)X, A2.16) предполагая, что R(t) = R*(t) и Q(t) = Q*(t). При выполнении этих условий ре-
220 Гл. 2. Алгебраические и дифференциальные уравнения шение X(t) будет симметричным, если симметрична матрица К, определяющая начальное значение X(t): X(to) = К. В дальнейшем матрицы R(t), Q(t) и К обладают указанным свойством. В § 2.6 проанализированы аналитические свойства уравнения A2.16). Там же были изложены методы построения точного его решения. Такие решения можно получить лишь в отдельных, исключительных случаях. Обычно же приходится пользоваться приближенными методами. Литература по этому вопросу доста- достаточно обширна (см., например, [25, 35]). Здесь ограничимся изложением только одного итерационного метода. Последовательные приближения X0(t), Xi(t), ..., Xn(t), ... будем определять из следующих линейных уравнений: = A(t)Xo(t)+Xo(t)A*(t) + Q(t), Xo(to) = К, jt Xn(t)R(t)]Xn+1(t) +Xn+1(t)[A*(t) + R(t)Xn(t)] - - Xn(t)R(t)Xn(t) + Q(t), Xn+1(t0) = K, n = 0,1,... Введем обозначения An=Xn-Xn-1, A2.17) A2.18) Заметим, что так как Xn(t) и Xn-\(t) — симметричные матрицы, то тем же свойством обладает и Ап. Очевидно, что при п ^ 2 функция An(t) является решением следующей задачи Коши ^ = АпАп + АП1* + ДП_1Й(*)ДП_1, A(t0) =0, п > 2. A2.19) at Используя эту задачу Коши, можно утверждать, что последовательные при- приближения Xn(t), n = 1,2,..., удовлетворяют уравнениям dXn = A(t)Xn + XnA*(t) - An(t)R(t)An(t) + dt + Xn(t)R(t)Xn(t) + Q(t), Xn(t0) = K. A2.20) Эти уравнения можно записать в виде [ (8)-Ап(8)Я(8)Ап(8)]Ф*(Ь,8)с18, A2.21) где Ф(Ь, s) =f(t)if~1(s),aif(t) — фундаментальная матрица решений однородного иТГ уравнения — = A(t)x. at Аналогичным образом можно от дифференциального уравнения A2.16) пере- перейти к интегральному уравнению / ФA;,8)[С}(8) + X(s)R(s)X(s)]ds. A2.22) to
2.12. Приближенное решение матричных уравнений 221 Введем обозначение Фп(?,з) = ipn(t)ipri1(s), где фп{Ь) — фундаментальная мат- матрица решений уравнения —-^ = An{t)yn. Учитывая, что An(to) = 0, получаем решение уравнения A2.19) Дп(?)= Г Vn(t,s)An-1(s)R(s)An-1(s)V*(t,s)ds n ^ 2. A2.23) Аналогично, из линейных уравнений, определяющих последовательные прибли- приближения Xn(t), получаем интегральные соотношения Xn(t) = 9n( + / 9n(t,s)[Q(s) - Xn-1(s)R(s)Xn-1(s)]9*n(t,s)ds. A2.24) Jt0 Теорема 12.6. Пусть выполнены условия: 1) матрица R(t) симметрична и неположительна, т. е. R(t) = R*(t) ^ 0; 2) матрица Q(t) симметрична и неотрицательна, т. е. Q(t) = Q*(t) ^ 0; 3) нулевое приближение Xо(?) решения уравнения A2.16) с начальным условием X(to) = К неотрицательно (Xo(t) ^ 0) при всех t, t ^ 0, и дифференцируемо. Тогда на каждом конечном отрезке [?о,Т] имеет место следующее соотноше- соотношение Xn(t) ^ Xn-i(t), п > 1, и при п —У оо последовательность матриц {Xn(t)} равномерно сходится к решению уравнения Риккати A2.16). Доказательство. Согласно определению нулевого приближения X0(t) реше- решения уравнения Риккати A2.16), можно записать X0(t) =Ф(Мо)#?*(Мо)+ / Ф(Ь8)<Э(8)Ф(Ь8)а8, A2.25) а так как Q(t) симметричная неотрицательная матрица, то Xo(t) ^ 0 для всех t G (?о,Т), как это и предполагается в условиях теоремы. Из соотношения A2.23) следует, что An(t) ^ 0 при п > 2 и всех t G (?о,Т). Таким образом, имеем следующую последовательность матриц (К • • • ^ Xn(t) ^ Xn_i(t) ^ • • • ^ Xi(t). (Заметим, что неравенство X0(t) ^ X\(t) может и не выполняться.) Так как из определения последовательных приближений следует, что + [ y^tiS^Qis) - X0(s)R(s)X0(s)]4>l(t,s)ds, A2.26) то sup ||Xl(?)|| ^ M < оо. Отсюда, по теореме о монотонной сходимости по- te[to,T]
222 Гл. 2. Алгебраические и дифференциальные уравнения следовательности операторов в гильбертовом пространстве следует, что сущест- существует предел lim Xn(t) = X(t), t G (to,T), причем матрица X(t) удовлетворяет п—ь-оо интегральному уравнению / <?(t,s)[Q(s) + X(s)R(s)X(s)]<?*(t,s)ds. A2.27) t0 Это уравнение отличается от A2.21), которому удовлетворяет Xn(t), отсут- ствием в правой части слагаемого - / <P(t, s)An(s)i?(s)An(s)^*(t, s) ds, в кото- Jt0 ром An(t)R(t)An(t) неположительная матрица. Как следует из A2.27), матрица X(t) является решением уравнения A2.16). Теорема полностью доказана.
Глава 3 Проблемы разрешимости матричных дифференциальных уравнений Риккати В этой главе рассматриваются некоторые теоремы существования решений матричных дифференциальных уравнений Риккати. Однако, в отличие от преды- предыдущих глав, здесь изучаются уравнения с прямоугольными матрицами. Излага- Излагаемый материал практически полностью повторяет содержание соответствующей главы из книги В.Т. Рида [45]. Сначала введем необходимые понятия и определения. Пусть у = {^/1,... ,Уп} — п -мерный вектор с комплексными компонентами. п Через \у\ будем обозначать длину этого вектора: \у\2 = ^ \Ук\2, а соответству- к = 1 ющее векторное пространство будем обозначать через Еп. В дальнейшем будем рассматривать либо прямоугольные матрицы размерности т х п, либо квадрат- квадратные матрицы. Однако, их размерности будем указывать лишь в исключительных случаях, когда отсутствие таковых может привести к недоразумению. Поэтому обозначение Мшп = {Mij} , г = 1,..., m, j = 1,..., п, означает, что речь идет о матрице размерности т х п. Через М обозначается матрица, комплексно сопряженная с М, т. е. ее элемен- элементы являются комплексно сопряженными с элементами матрицы М, М = {М^}. Через М обозначается матрица, транспонированная с М, т.е. М = {Mji}, где г = 1,... ,m; j = 1,... ,п. И, наконец, через М* обозначается матрица М. Мат- Матрицу размерности т х п, все элементы которой равны нулю, будем обозначать через вшп или, короче, как и выше, в, если отсутствие индексов не вызывает сомнений. Символ v[M] будем использовать для обозначения максимума вектора \Му\ на единичном шаре {у : \у\ ^ 1} G Еп, который, очевидно, является максимумом вектора |M*z| или вектора \Mz\ на единичном шаре {z : \z\ ^ 1} G Еш. Обозна- Обозначение М ^ N (М > N) означает, что М и N — эрмитовы матрицы одной и той же размерности и М — N является неотрицательно (положительно) определенной матрицей. Если М ^ 0, то выражение М1/2 означает единственную неотрицательно опре- определенную эрмитову матрицу такую, что M^I^M^I2 = М. Если М > 0, то, как обычно, под матрицей М/2 понимается матрица, обратная к М1/2. Если эр- эрмитова матричная функция M(t), t G /, такова, что M(s) — M(t) ^ 0(^ 0) для (s, t) G / х /, s < t, то M(t) называется невозрастающей (неубывающей) эрмито- эрмитовой на / матрицей. Если элементы матрицы M(t) являются абсолютно непрерыв- непрерывными на интервале [а, Ъ] функциями, то, как обычно, M{t) представляет собой матрицу, элементами которой являются производные элементов матрицы M(t).
224 Гл. 3. Проблемы разрешимости уравнений Риккати Аналогично определяется интеграл Лебега от матрицы M(t) и эквивалентность матриц M(t) и N(t), которые в дальнейшем рассматриваются как равные, т.е. M(t) = N(t). Следовательно, матрица M(t) является непрерывной, локально интегрируемой, локально дифференцируемой и т. д. в зависимости от того, обладают ли соответ- соответствующим свойством все элементы этой матрицы. Будем, далее, пользоваться следующими обозначениями. Если М = {Maj} и N = {7Vaj}, а = 1,... , m; j = 1,... ,г, то под символом (М; N) понимается матрица размерности 2т х г, чей j-й столбец имеет элементы Mij,..., Mmj, Nij,..., Nmj. Пусть, далее, [а, Ь] — заданный отрезок веществен- вещественной числовой оси. Будем использовать следующие обозначения: Cmn[a,5] — класс матричных функций M(t) размерности т х п, которые яв- являются непрерывными на [а, Ь]; Lmn[a,b] — класс матричных функций,интегрируемых по Лебегу; ^гап\.а-> Ч — класс матричных функций с интегрируемыми по Лебегу матрица- матрицами \M(t)\p; L^n[a, b] — класс матриц Mmn(t), измеримых по Лебегу и ограниченных почти всюду на [а,Ь]; EVrnn[a,b] — класс матриц Mmn(t) ограниченной вариации; %lnr[a,b] — класс матриц Mnr(t), абсолютно непрерывных на отрезке [а,Ь]. Символы Ст[а,Ь], Ьш[а,Ь], L^Ja,&], L^[a,b], EVrn[a,b] и %lnr[a,b] означают соответствующие классы матриц размерности т х 1. Основным объектом исследования в этой главе является матричное дифферен- дифференциальное уравнение Риккати n[W(t)] = W(t) + W(t)A(t) + D(t)W(t) + W(t)B(t)W(t) - C(t) = 6>, A) в котором матрицы A(t), B(t), C(t) и D(t) считаются заданными. Их свойства гладкости могут варьироваться при формулировке различных теорем. Однако, их размерности предполагаются, в основном, стандартными: A(t) имеет размер- размерность п х п; B(t) имеет размерность п х т; C(t) имеет размерность т х п; D(t) имеет размерность т х т. Поэтому искомая матрица W(t) является, вообще говоря, прямоугольной мат- матрицей размерности т х п. Далее отметим некоторые специальные обозначения, постоянно используемые в дальнейших формулах. Будем пользоваться следую- следующими обозначениями: А B) -A(t) -B(t)) ' [Z) G(t, s\W) = exp I"- I [D(a) + W(a)B(a)] da\, C) Г Г* 1 H(t, s\W) = exp - / [A(a) + B(a)W(a)} da , D) L J s J F(t,s\W)= [ H(a,8\W)B(a)G{pL,8\W)doL. E) J s
§ 3.1 Связь уравнений Риккати с линейными системами 225 § 3.1. Связь уравнений Риккати с линейными системами Будем рассматривать следующее уравнение Риккати n[W(t)] = W(t) + W(t)A(t) + D(t)W(t) + W(t)B(t)W(t) - C(t) = 0, A.1) в котором матрицы A(t), B(t), C(t) и D(t) предполагаются заданными на интер- интервале / вещественной оси и удовлетворяющими условиям A(t) Е Lnn[a, Ъ], B(t) Е Lnm[a, Ь], C(t) E Lmn[a, b], D(t) E Lmm[a, b] A.2) для произвольного замкнутого отрезка [a, b] С /. По определению, решением уравнения A.1) является матричная функция W(t) размерности т х п, которая локально абсолютно непрерывна и 7?[W(?)] = в почти для всех t из подынтервала /о из /. Если W(t), t е I — решение уравнения A.1), то через U(t) обозначим матрич- матричную функцию размерности пхп, которая является решением линейного уравне- уравнения U(t) = [A(t)+B(t)W(t)]U(t), U(s) = М, s е /о, A.3) где М — неособенная матрица. Тогда, очевидно, что матрица V(t) = W(t)U(t) размерности тхп является такой, что матрица (U(t);V(t)) является решением на /о соответствующей линейной (гамильтоновой) системы матричных диффе- дифференциальных уравнений Г d[U, V] = -V(t) + C(t)U(t) - D(t)V(t) =в, \ • A.4м) [ C2[U, V] = U(t) - A(t)U(t) - B(t)V(t) = 0. Справедливо и обратное утверждение. Если матрица (U(t);V(t)) является ре- решением системы уравнений A.4м) с невырождающейся на подынтервале /о С / матрицей U(t), то матрица W(t) = V(t)U~1(t) является решением уравнения A.1) на /о. Ассоциированной с матричной системой дифференциальных уравне- уравнений A.4м) является система векторных дифференциальных уравнений t)O, [ С2[щу] = u(t) - A(t)u(t) - B(t)v(t) =0. Если ввести матричные функции % и $) размерностей (ттг+n) х (ттг+n), определя- определяемые формулами (см.B)) % = ( ™п ш ), S) = ( \/. } { ) и положить \ ьп ипш ) \—А\г) -B[t) J у = {2/1,... ,2/гп+п} с Уг = щ, г = l,...,n, yn+j = Vj, j = 1,...,ш, то систему уравнений A.4^) можно переписать в виде Вводя соответственно матрицу Y = {Yij}, i = 1,..., 2n; j = 1,..., г, систему уравнений A.4м) можно записать в виде ?\Y]=3Y(t)+fi(t)Y(t)=e. A.4) 1. Вспомогательные утверждения. Пусть W(t) и Wo(t) — матричные функции размерности тхп, абсолютно непрерывные на интервале /о С /. Тогда матричная функция Ф(?) = W(t) — Wo(t) удовлетворяет тождеству 1Z[W] - n[W0] = Ф + Ф(А + BWo) + (D + W0BLf + ФБФ. A.5)
226 Гл. 3. Проблемы разрешимости уравнений Риккати Лемма 1.1. Пусть Wo(t),t G /о С /, является решением уравнения A.1), матричные функции (см. C)-E)) G(t) = G(t,s\Wo), H(t) = H(t,s\W$) являются решениями задач Коши 0, G(s)=Em, s e Io, A.6) BW0) = в, H(s) = Enj selo, A.7) t,s\W0)= [ JS F(t,s\W0)= H(T,s\Wo)B(T)G(T,s\Wo)dT. A.8) J S Тогда матричная функция W(t) размерности тхп является решением уравнения A.1) на /о, если и только если постоянная матрица Г = W(s) — Wo(s) является такой, что Еп + F(t,s\Wo)T невырождена на /о и W(t) = W0(t) + G(t, s\W0)T [En + F(t, s\W0)T] "*#(?, e|W0). A.9) Доказательство этого утверждения приводить не будем, так как приведенные в нем факты проверяются непосредственной подстановкой. Гораздо более инте- интересны рассуждения, которые приводят к сформулированным ниже следствиям. В частности, следует отметить, что если Wo(t) является решением уравне- уравнения A.1) на /о и (Uo(t);Vo(t) — решение уравнения A.4) с невырождающейся матрицей Uo(t) такой, что на этом интервале выполняется следующее равенст- равенство Wo(t) = Vb(t)Uq 1 (t), то решение задачи Коши A.7) при некотором s G /о определяется формулой H(t,s\Wo) = Uo(s)Uu1(t). A.10) Если 7^[И/о(^)] = 0 для всех t G /о и для произвольной матричной функции W(t) размерности тхп мы положим Ф(?) = W(t) — Wo(t), то, в силу соотношений A.5)—A.7), получаем, что W(t) — решение уравнения A.1) на /0, если и только если матричная функция R(t) размерности тхп, которая определяется формулой Ф(?) = G(t,s\Wo)R(t)H(t,s\Wo), является решением на /0 задачи Коши R(t) + R[HBG]R = в, R(s) = Г = W(s) - W0(s). A.11) Далее, если R(t) — решение на /о матричной задачи Коши A.11) и матричная функция F(t, s\Wo) определена формулой A.8), то следующая матричная функция Ri(t) = R(t)[En + F(t, s|Wo)T] — Г будет решением задачи Коши R^t) = -[RHBG^!, i?i(s) = в, A.110 и, следовательно, R\(t) = в на /0. Более того, если г G /о и вектор 7? из Еп является решением уравнения [Еп + F(r,s; \Wo)T]n = 0, то 0 = Ri(r)n = — Г77, и, значит, ту = [Еп + F(n,s; \Wo)T]n — F(n,s\Wo)(Tn) = 0. Поэтому матричная функция Еп + F(?, ,§|И/о)Г невырождена при t G /о и Я(?) = Г[?п + F(t, slWo)] при s G /0. A.12) Отсюда следует, что если матрица Г размерности тхп такова, что матрица Еп + F(t, s; И/о)Г невырождена всюду на /о, то матричная функция R(t), опреде- определяемая формулой A.12), является решением задачи Коши A.11) на этом интер- интервале, а матричная функция W(t), заданная формулой A.9), является решением уравнения A.1), удовлетворяющим условию W(s) = Wq(s) - Г.
§ 3.1 Связь уравнений Риккати с линейными системами 227 Из полученных фактов находим, что для произвольных матриц F и Г размер- размерностей п х т и т х п, соответственно, из равенства Т(Еп + FT) = (Еп + TF)T A.13) следует, что матрица Em + TF является невырожденной в том и только том случае, когда матрица Еш + FT невырождена. При этом оказывается, что спра- справедливо равенство [Ет + F(t, ^|И/о)]~1Г = Т[Еп + FT]'1. Поэтому утверждение о невырожденности матрицы Еп + F(t,s\Wo)T при t Е /о эквивалентно утверж- утверждению о невырожденности матрицы i?m + TF(t,s\Wo) ПРИ ? ? ^о- Приведенные рассуждения доказывают справедливость следующего утверждения. Следствие 1.1. При выполнении условий леммы 1.1 матричная функция W(t) размерности тхп является решением уравнения A.1) на /о тогда и только тог- тогда, когда постоянная матрица Г = W(s) — Wo(s) является такой, что матрица Еш + TF(t, s; | Wo) невырождена при t e Io и W(t) = W0(t) + G(t, s\ Wo^Em + TF(t, slWo^THit, s\W0). A.97) Из A.9) или A.9') непосредственно следует, что при произвольном t G /о ранг матрицы W(?) — VFo(?) совпадает с рангом матрицы Г и поэтому справедлив следующий результат. Следствие 1.2. #а/ш матрицы W(t) и Wo(t) являются решениями уравнения A.1) на интервале /о С /, то матрица W(t) — Wo(t) имеет постоянный ранг на интервале /о. Отсюда следует, что в случае, когда т = п и матрица Г = W(s) — Wo(s) неосо- неособенная, выполняется равенство Т[Еп + F(t, s; (И^Г] = [Г + F(t, slWo)]? и получаем, что справедливо следующее утверждение. Следствие 1.3. Если m = n, aff(t) i/ VFo(^) являются решениями уравнения A.1) , причем такими, что матрица W(s) — Wo(s) невырождена при всех sG/o, mo матрица Г + F(?, slVFo) также невырождена при tG/o u W(t) = W0(t) + G(t, s| Wo)^-1 + F(t, s| Wo)]"^(t, s|Wb). A.9") Как утверждается в следующей лемме, справедлив более общий результат. Лемма 1.2. Если Wo(t), Wa(t), a = 1,...,&, —решения уравнения A.1) на интервале /о С / при sG/o мГа = VFa(t) — Wo(t), то справедливы соотношения Wa(t) - W0(t) = G(t,s\W0)[Em +Tf3F(t,s\W0)]-1(Ta- - Tp)[En + F(t, slWo^al^Hit, s\W0). A.14) при a,/3 = 1,... ,k. Из леммы 1.1 получаем: матричные функции G = G(t,s\Wo), H = H(t,s\Wo), F = F(?, s|Wo) и VFa — VFo = Wa(t) — Wo(t), определенные при t G /о, таковы, что Wa -Wo = GT^En + FTa]-1!! = С[Ем+Га^]ГаЯ, и для заданных а и /3 уравнение A.14) является непосредственным следствием соотношения Га - 1> = [Е - тп + ВДГа - Г>[?п + FTa] = = [Em + Т^]{Та[Еп + Fr,] - [Em + ВД^}^ + Fra]. A.15) Утверждение следующей леммы может быть проверено непосредственно.
228 Гл. 3. Проблемы разрешимости уравнений Риккати Лемма 1.3. Пусть (U(t);V(t)) является решением системы A.4м) с невы- невырожденной на подынтервале /о С / матрицей U(t) и W(t) = U~1(t). Тогда при s Е /о и при выполнении равенств ((a) K(t,s\W)=H-1(t,s\W)F(t,s\W), \(b) L(t,s\W) = W(t)K(t,s\W)+G(t,s\W) фундаментальная матрица решений системы A.4м), нормальная при t = s, име- имеет вид (U(t)U-1(s)-K(t,s\W)W(s) K(t,s\W)\ ( , V V(t)U-1(s) - L(t, s\W)W(s) L(t, s\W) ) ' [ } Лемма 1.4. Пусть (Vo(t);Uo(t)) является решением системы A.4м) с неосо- неособенной на /о матрицей Uo(t) и Wo(t) = Vb(t)U$ 1 (t). Тогда для любого решения (U(t);V(t)) системы A.4м) и (tjs) ? ^о х ^о справедливы равенства Г V(t) - W0(i)?7(i) = G(t, s\W) [V(s) - W0(s)U(s)], [ U(t) = U0(t)UQ1(s){U(s) + F(t, s|VFo) [F(s) - W0(s)U(s)] }. Справедливость соотношения A.18) является непосредственным следствием того факта, что матрица M(t) = V(t) — Wo(t)U(t) удовлетворяет уравнению M(t) + [D(t) + VF0(tM(t)]M(t) = в, так что M(t) = G(t,s\W0)M(s). Аналогично, матрицу N(t) = U(t) + F(t, s|H/o)[^(^) — Wo(t)U(t)] можно рассматривать как решение матричного дифференциального уравнения N(t) = [A(t) + B(t)W0(t)]N(t), t e /о, A.19) так что N(^Uo^U^1 (s)N(s) = Uo(t)U^'1(s)U(s), которое можно рассматривать как соотношение A.18) с переставленными t и s. При рассмотрении дифференциального уравнения Риккати A.1) целесообраз- целесообразно отметить следующий важный факт. Если матричные функции, являющи- являющиеся коэффициентами уравнения, удовлетворяют предположениям A.2), то при к, превосходящем пит, матрица M(t) может рассматриваться как компонента матрицы размерности кхк, которая удовлетворяет уравнению, соответствующе- соответствующему уравнению A.1), коэффициенты которого являются матричными функциями также размерности к х к. В самом деле, рассмотрим при п < т матричные функции A°(t), B°(t), C°(t) и D°(t) размерности т х т, определяемые следующим образом: l°(*) = diag{A(*),0}, D°(t)=D(t), a = l,...,n; C = 1,...,ш, A.20) Тогда матричная функция Q(t) размерности т х т является решением матрич- матричного дифференциального уравнения Риккати (l(t) + u(t)A°(t) + D°(t)u(t) + u(t)B°(t)u(t) - C°(t) = 0 A.21) на отрезке /0, если и только если существуют матричная функция Wo(t) раз-
§ 3.1 Связь уравнений Риккати с линейными системами 229 мерности т х т и матричная функция R(t) размерности т х (т — п) такие, что верно Q(t) = [Wo(t),R(t)], где W = Wo(t) — решение уравнения A.1) на /о, a R(t) удовлетворяет следующему линейному дифференциальному уравнению R(t) + [D(t) — Wo(t)B(t)]R(t) = в. Следовательно, если s Е /о, то справедливо Д(?) = G(t,s\Wo)R(s), где G(?, s|Wo) является решением задачи Коши A.6). В частности, если существует s Е /о такое, что i2(s) = в, то Д(?) = в на /о, а матрица fi,(t) имеет вид [Wo (?)?#]• Аналогично, при т < п определим функциональные матрицы A°(t), B°(t), C°(t) и D°(t) размерности п х п следующим образом. A°(t)=A(t), D°(t) = dmg{D(t),0}, Baj3(t), C$a(t)=C0a(t), l,...,n; /3 = 1,. ..,m, A.22) a = l,...,n; /3 = m + 1,... ,n. Отсюда следует, что матричная функция fi,(t) является решением дифференци- дифференциального уравнения Риккати u(t) + Q(t)A°(t) + D°(t)u(t) + u(t)B°(t)u(t) - C°(t) = в, A.23) на интервале /о С / тогда и только тогда, когда существуют матричная функция Wo(t) размерности т х п и матричная функция 5(t) размерности (п — т) х п такие, что u(t) представима в виде u(t) = ( С°Д ), где W = Wo(t) является решением уравнения A.1) на /о, а 5(t) удовлетворяет линейному дифференци- дифференциальному уравнению S(t) + S(t)[A(t) + 5(t)VF0(t)] = 0. Следовательно, если s G /о, то 5(t) = S(s)H(t, s\Wo), где i?(t, slVFo) — решение задачи Коши A.7). В частности, если существует s G /о такое, что 5(s) = в, то = в на /0 и П(*) = f^ \ ^ / Здесь уместно отметить, что дифференциальные уравнения A.6) и A.7) явля- являются довольно близкими к уравнению в вариациях для уравнения A.1). Пред- Предположим, что условия A.2) выполняются на открытом интервале / и при всех t G / и заданной матрице М = {/ла/з}5 а — 1,...,га; /3 = 1,...,п, матрица W = VFo^; т, Л/f) является решением уравнения A.1), удовлетворяющим началь- начальному условию W(t) = М. Максимальный подынтервал на /, на котором сущест- существует W(t]r,M) обозначим через 1{т,М}: 1{т,М} = {t\a(r,M) < t < Ь(т,М)}. При фиксированных т° G / и М° и при ? G /{т°, М} П /{т°, М0} справедливо равенство W(t]T°,M) = VF(t;ro,M°) + + G(t, t°\W(.; T°\M°))N(t; т°,М°, M)H(t; t°\W(.; т°,М0)), A.24) где N(t; т°,М°, M) = AM[En + F(t, r°\W(.; r°, М°))ЛМ], Л = M - M°. A.25) Более того, если 1\ — замкнутый подынтервал в /{т°,т0}, то, согласно следст- следствию 1.1 из леммы 1.1, существует постоянная к > 0 такая, что если и[ЛМ] ^ к,,
230 Гл. 3. Проблемы разрешимости уравнений Риккати то /i С 1{т°,М} и, следовательно, матрица Еп + F(t; r°\W(.; т°, M°))AM не- невырождена при t G Д. Поэтому элементы матрицы N(t; т°, М°, М) , заданные формулой A.25), имеют непрерывные частные производные по собственным ком- компонентам /Пар матрицы М в окрестности точек /i^ матрицы М° и частные про- dW(t; т°, M) изводные —- - матрицы W(t;r°,M) существуют при т = т°, М — М°, Фа/3 tG/{r°,M0}. При этом ^ ( где Г>а/3 = {Z}^3}, г = l,...,m; j = l,...,n, является матрицей размерности m x п, у которой Z}^/3 = 1, если (i,j) = (а,/3), Df? = 0, если (а,/?) ^ (*?Л- dW(t;r°,M°) Кроме того, матрица T(t) = ^—¦ является решением линейного диффе- дифференциального уравнения / t(t) - T(t)[A(t) + B(t)W0(t)] + [?>(«) + W0(t)B(t)]T(t) = в, |wo(t) = W(t;r°,M°), удовлетворяющим начальному условию T(r°) = Daf3. A.28) Уравнение A.27), очевидно, является уравнением в вариациях для уравнения A.1) в окрестности решения W = VF^t^M0). Если т = т°, М = М° являются такими, что матричная функция S(t,W) = -WA(?) - D(t)W - WB(t)W + C(t) I rr°+h удовлетворяет условию lim — / S(t,M°) dt = 5(r°,M°), то можно устано- h->o h JTo вить, что в точке т = т°, ттг = М° матричная функция W(t, r, M) имеет частную производную по г, определяемую формулой 2. Вариация решений. Пусть матрицы A(t), B(t), C(t) и B(t) заданы и положим N = m + п. Определим матричные функции Д(?), 23(?), C(t) и V(t) размерности N х N следующими формулами , , Ясно, что эти матричные функции принадлежат классу Ьдгдг[а,6] для произволь- произвольного замкнутого отрезка [а, 6], принадлежащего интервалу /, так что они удовле- удовлетворяют предположениям A.2). Более того, можно непосредственно проверить, что матричная функция W(t) размерности N х М является решением уравнения Риккати 1l[W(t)] = W(t) + W(t)A(t) + V(t)W(t) + W(t)B(t)W(t) - C(t) = в A.30)
§ 3.1 Связь уравнений Риккати с линейными системами 231 в подынтервале /о тогда и только тогда, когда (W(t) G(t)\ \H(t) -F(t))' [ ' где W(t), G(t), H(t) и F(t) являются матричными функциями соответствую- соответствующих размерностей, которые на том же подынтервале образуют решение системы дифференциальных уравнений (a) -W(t) = W(t)A(t) + D(t)W(t) + W(t)B(t)W(t) - C(t) = в, (b) G(t) + [D(t) + W(t)B(t)]G(t)=0, (c) H(t)+H(t)[A(t)+B(t)W(t)]=0, k (d) F(t) - H(t)B(t)G(t) = 0. В частности, если W = Wo(t) — решение уравнения A.1) на подынтервале /о, a G(t,s\Wo), H(t,s\Wo), определяются формулами A.6), A.7) и A.8) на /о, то решение W(t) уравнения A.30), удовлетворяющее условию -(Wo® Go{t)) A33) определяется формулой (**W -F(t,s\W0))- (L34) Более того, для этого решения дифференциального уравнения A.30) матричные функции G(t,s\Wo), l-L(t,s\Wo) и Jr(t,s\WH, определяемые соответствующими уравнениями A.6)—A.8), могут быть вычислены по формулам _ ( G(t,s\W0) 0nrn Еп (b) n(t,slW0)=(H^ Р^Л, A.35) Если матричная функция Wo(t), определяемая формулой A.34), является ре- решением уравнения A.30) на /0 и W(t) — другое решение того же уравнения на том же подынтервале /о, удовлетворяющее начальному условию то ассоциированное уравнение A.9) относительно W(t) и Wo(t) с Т=(Г втп), r = W(a)-W0(a), A.37) \ "пт "mm / порождает соотношение A.9) относительно W(t) и Wo(t) и, значит, справедлив следующий результат. Теорема 1.1. Пусть W(t) и Wo(t) являются решениями уравнения Риккати A.1) на подынтервале /0 отрезка I и s e Iq. Тогда при t e /о, в дополнение к
232 Гл. 3. Проблемы разрешимости уравнений Риккати соотношению A.9), справедливы соответствующие тождества ((a) G(t,s\W) = G(t,s W0)[Em+rF(t,s\W0}-\ (b) H(t,s\W) = [?n 1 A 38) (с) F(t,s\W) = [En-- "" l"^-1-1-" |TT^ v* } = F(t,s\W0)[Em + Следствие 1.4. Пусть W(t) и Wo(t) являются решениями уравнения Риккати A.1) на /о С /, причем такими, что для заданного s Glo матричная функция F(t,s\Wo) является невырожденной при t Е Io,t ф s. Тогда матричная функция F(t,s\W) также несингулярна и \ ^ [W(s) - W(sM)} A.39) при tG/o,t/s. Пусть точка s,s G / задана и W(t) = W(s : t) — решение матричного диффе- дифференциального уравнения Риккати (а) системы A.32), удовлетворяющее началь- начальному условию W(s) = вшп. Обозначим через G(t) = G(s : ?), H(t) = H(s : t) и F(t) = F(s : t) соответствующие решения уравнений (b), (с) и (б?) системы A.32), удовлетворяющие начальным условиям G(s) = Еш, H(s) = Еп и F(s) = ^nm- Это означает, что матричные функции W(t), G(t), H(t) и F(t) удовлетворяют следующей системе дифференциальных уравнений W(e : t)B(t)W(e : t) + C(i) = в, W(s : s) = втп, (b) 3G{Sm f) + [?>(*) + W(s : t)B(t)]G(s :t)=6, G(s : s) = Em, A40) (c) ЭЯ^ : *} + H(s : t)[A(t) + B{t)W{s : t)] = в, H(s : s) = En, Jd) dF^f) -H(s:t)B(t)G(s:t)=e, F(s : s) = 9nm. Сопоставляя полученный результат с уравнениями A.9) и A.38), убеждаемся в справедливости следующей теоремы. Теорема 1.2. Пусть 10 с I и для (t,s) е /о х /о решения W(t) = W(s : t) и W(t) = W(t : T) существуют на Iq. Тогда при t G /о матричные функции Ет + W(t : s)F(s : t) и Еп + F(s : t)W(r : s) несингулярны и справедливы соотношения при (т, s, t) G Iq x Iq x Iq (ai) W(t : t) = W(s : t) + + G(s : t)W(r : s)[En + F(s : t)W(r : з^Щз : t), (o2) W(t : t) = W(s :t)+ + G{s : t)[Em + W{t : s)F(s : 1)}-гШ{т : s)H{t : t); (b) G(t : t) = G(s : t)[Em + W(t : s)F(s : *)]-1С(т : s); A.416) (c) H(t : t) = H(t : s)[En + F(s : t)W(r : s)]'1!!^ : t); A.41c)
§ 3.1 Связь уравнений Риккати с линейными системами 233 (di) F(r:t) =F(t:s)+H(t:s) + + H(r : s)F(s : t)[Em + W(r : s)F(s : ^"^(r : s), (d2) F(r : t) = F(r s)+ ( ' j + H(r : s)[En + F(s : t)W(r : s)]^ : t)G(r : s). Уравнения A.41а) следуют из A.9) и A.9') при условии Wo(t) = W(s : t) и (?) = W(t : ?). Причем в каждом случае , s|W(s : .)) = G(s : ?), Я(?, s|VF(s : .) = H(s : t), F(s : .)) =F(s:t) Г = VF(r, s) - W{s : s) = W(r, s). Уравнения A.416) и A.41с) могут быть получены из уравнений (а) и (Ь) системы A.28) и из соотношений G(t, s\W(r : .)) = G(r : t))G(r : s), *, s\W(t : .)) = Я^ : s)H(r :t). Соответственно, матричная функция F(t) = F(t,s\W(r : .)) является решением задачи Коши: F(t) = H(t,s\W(r : .))B(t)G(t, s\W(r : .)), F(s) = 0. В силу A.42), мы находим, что матричная функция Fo(t) — H(r : s)F(t)G(r : s) является решением задачи Коши: Fo(t) = Н(т : t)B(t)G(r : t), i^o(s) = ^ и, следовательно, F(r : t) = Fo(t)-F(r : s). Поэтому из (с) системы A.38) получим: F(t) = F(s : t)[Em + W(r : s)F(r : t)] = [En + F(s : t)W(r : s)]^ : t). Это вместе с уравнениями F0(t) = Я (г : s)F(t)G(r;s) и F(r : s) = F0(t) - F(r : t') приводит к соотношениям A.41d). Очевидно, что система уравнений A.41a)-A.41d) может быть переписана в следующей эквивалентной форме (a) W(r : t) - W(s : t) = G(r : t)VF(r : s)H~1(r : s)#(r : t), (b) Еш + W(r : s)F(s : t) = G(r : s)G-\r : t)G(s : t), (c) En + F(s : t)W(r : s) = H(s : ^Я^ : *)Я(г : s), A.410 (di) F(r : t) - F(t : s) = Я(г : s)F(s : ^G^ : t)G(r : t), { (d2) F(r : t) - F(r : s) = Н(т : ^Я^ : t)F(r : t)G(r : s). Имея в виду, что матричные функции W, G, Я и F образуют решение системы уравнений A.40), введем следующие обозначения Qi(s : t) = W(s : ?)Pi(s : ?), A.43) }2(s : t) = Qi(s : t)F(s : t) + G(s : t) = VF(s : t)P2(s : t) + G(s : t). Для краткости обозначим через Q(s : t) матричную функцию Основываясь на уравнениях A.40), можно получить следующий результат.
234 Гл. 3. Проблемы разрешимости уравнений Риккати Лемма 1.5. Матрица Q(s : t) является решением задачи Коши для линейного дифференциального уравнения СЩа : t)] = Z9U{Sm l) + SjU(s :t)=9, Q(s : s) = Em+n. A.45) Более того, матрица fl~1(s : t) определяется формулой o_i, .. fFG^W + H -FG~1 П (« = *)=( _G-iw G-i где 3 i/ # находятся из формул B). Обозначим через *И открытую окрестность на плоскости (s,t) такую, что если точка (so, to) принадлежит *И, то отрезки с концевыми точками (so, so)? (so,to) и (so,^o)? (to, to) расположены в *И. Для заданной точки (so, to) выберем t\ и t2 такие, что отрезок s = so, ti < t < t2 находится в 9^ и содержит замкнутый отрезок с концевыми точками (so, so) и (so, to). Обозначим через S положительное число такое, что S < min(t2 — so,so — t\) и замыкание прямоугольной области 9\о с опорными векторами (so — S,ti) и (so + <Мг) принадлежит 9\. Так как на 9\о следующая матричная функция uo(s : t) = П($о : ?)П-1(8о : s) является решением задачи Коши для линейно- линейного дифференциального уравнения : t)} = в, Vo(so,s) = ?m+n, A.47) то получаем важное базовое соотношение u(s : t) = П(^о : t)^^ : s), при |s - so| ^ ^ и t G [tbt2]. A.48) Так как матрица uo(so : t) абсолютно непрерывна по t на отрезке [ti,^2], а матрица П-1(?о : s) абсолютно непрерывна по s при |s - so| ^ 8, то матричная функция u(s : t) абсолютно непрерывна на % по s и t. В самом деле, так как ¦— = п 1(^о : s) —¦—О, 1(so : s) при us us ~ so\ ^ 8, то ^—— = u(s : tK*#(s) (^,t)G^H. A.49) В силу произвольности точки (so, to) в *И, отсюда следует, что Q(s : t) является непрерывной в любой точке (s,t) G ?Н и локально абсолютно непрерывна в этой области по каждому из аргументов. В терминах компонент матриц Pa(s : t), Qa(s :t), a = 1,2, векторное диффе- дифференциальное уравнение A.49) можно представить в виде = -P1(s:t)A(t)-P2(s:t)C(s), = -P1(s:t)B(t)+P2(s:t)D(s), A.50) = -Qi(s : t)A{t) - Q2(s : t)C(s), ds dP2(s : dQ2(s : t) 8s
§ 3.1 Связь уравнений Риккати с линейными системами Отсюда следует, что система A.43) эквивалентна системе уравнений fjvs . -f-\ — p-ifg : f\ V(s :t) = Qi(s :t)P^1(s :t), 235 G(s : t) = Q2(s : t) - Qi(s : t)P^{s : t)P2(s : t) и, если учесть A.50), то приходим к следующему результату. Теорема 1.3. Если *И представляет собой область, в которой выполняются указанные выше условия и матричные функции W(s : t), G(s : t), H(s : t) и F(s : t) образуют решение системы дифференциальных уравнений A.50) в 9\, то во всей области 9\ эти матричные функции являются непрерывными, локально абсолютно непрерывными по каждому из аргументов s и t и образуют решение следующей системы матричных дифференциальных уравнений Л dW(s : t) (Ъ) (с) (d) ds dG(s : t) ds 8H(s : t) ds dF(s : t) ds G(s:t)C(s)H(s:t)=6, - G(s : t)[D(s) + C(s)F(s : t)] = в, - [A(s) + F(s : t)C(s)H(s : t)} = в, -F(s :t)D(s) -A(s)F(s : t) - A.52) - F(s : t)C(s)F(s : t) + B(s) = 0. Следует отметить, что функциональные уравнения A.41а)-A.41с) и (di) из A.41с?) могут быть использованы для характеристики решений систем матрич- матричных дифференциальных уравнений A.40). Докажем следующий результат. Теорема 1.4. Пусть 9\ — указанная выше область изменения переменных s и t и в этой области матрицы W{s : ?), G(s : ?), H(s : t) и F{s : t) имеют размерности m x n, m x ттг, п х п и п х m, соответственно, причем G(s;t) и H(s;t) несингулярны при (s,t) G 9t. Кроме того, предположим, что эти матрицы удовлетворяют функциональным уравнениям A.41а)-A.41с) и уравнению (di) из A.41d) или уравнениям (а)-(с) и уравнению @I2) из системы A.41') во всех точках (s,t), (r,t), (r,s) области 9\ и W(s : t) = ешп, G(s : s) = Еш, H(s : s) = En, F(s : s) = 0nrn, A.53) так что частные производные 8W(s : t) 8G(s : t) 8H(s : t) 8F(s : t) л ' л ' л л сущест- OS OS OS OS вуют и конечны в точках линии t = s области 9\. Тогда всюду в 9\ матричные функции W(s : t), G(s : t), H(s : t) и F(s : t) имеют конечные непрерывные част- частные производные первого порядка по переменным s и t и существуют матричные функции A(t), B(t), C(t) и D(t), при которых справедливы соотношения A.40) и A.52). Доказательство. В приведенной теореме не делается никаких специальных предположений о непрерывности рассматриваемых матриц. Однако, существо-
236 Гл. 3. Проблемы разрешимости уравнений Риккати вание частных производных Ws, Gs, Hs и Fs в точках линии t = s области 9^ подразумевает непрерывность W(s : ?), G(s : ?), H(s : t) и F(s : ?), как функ- функций переменной t в таких точках, а соотношения A.41a)-A.41d) требуют, чтобы всюду в 9^ эти матричные функции были непрерывными по t при каждом фик- фиксированном s. В самом деле, так как F(s : t) —> F(s : s) = 0nrn и i?(s : t) —> H(s : s) = En при ? —> s, то из A.41с) следует, что Н(т : t) —У Н(т : s) при t —у s для произвольной точки (г, s) G ?Н. Легко показать, что каждая из матриц W, G, Н и F непрерывна по t при фиксированном s всюду в области УК. Ниже будет показано, что результат сформулированной теоремы означает так- также, что _ dH(s : t) _ dF(s : t) dt ' dt ' A54) для произвольного s, подчиненного лишь условию, что (s, s) E SR. В дальнейшем через М(т : s,t) будем обозначать отношение (t — s)~1[M(r,t) — M(r,s)] при условии, что матричная функция M(s,t) определена в точках (s,t) G 91, а точки (г, t) и (г, s) также принадлежат 9^ и t ф s. Если (s, s) G !lH, то соотношения A.54) эквивалентны следующим предельным (при t —> s) соотношениям -A(s), F(s : s,t) -+ B(s), C(s), G(s :s,t)^ -D(s). ' Пусть матричная функция N(t) несингулярна всюду в окрестности линии dN(s) t = s и имеет конечную производную —-^- = lim(t - s)~1[7V(t) - N(s)]. Tor- as t y s да матричная функция N(t) = 7V~1(t) удовлетворяет следующему соотношению ~ - - - dN(s) N(t) - N(s) = N(t)[N(s) - N(t)]N(s) и, следовательно, производная —-— сов- as - dN(s) - падает с матрицей —N(s) — iV(s). ds _ _ Отсюда следует, что если H(s : t) = H~1(s : t) и G(s : t) = G~1(s : ?), то соотношенияA.54), содержащие i?(s : t) и G(s : ?), могут быть представлены в виде Аналогично, можно определить матрицу G(r : s,t) = (t - s)~1[G(r, t) - G(r, s)] и установить ее свойства. Так как F(s, s) = в, то из (di) системы A.41с?) следует, что если (г, s) и (г, t) являются точками из 9^1, то F(t :s,t) = Н(т : s)F(r : s,t)G(s : t)G(r : t). 9F(r,t) Следовательно, переходя к пределу при t -> s, находим, что производная —^—- существует в точке t = s и определяется соотношением S) = Н(т : s)B(s)G(t : а), A.55)
§ 3.1 Связь уравнений Риккати с линейными системами 237 которое эквивалентно дифференциальному уравнению (Ь) системы A.40). Урав- Уравнение A.55) можно достаточно просто получить из (cfe) системы A.41<i). Можно также показать, что соотношение (с) из системы A.41') эквивалентно уравнению Н(т : t) = H(s : t)[En + F(s : t)W(r : s)]H(r : s), которое совпадает с уравнением H(r :s,t) = [Н(т : s,t) + Я(« : t)F(s : s,t)W(r : «)]Я(т : s). Переход к пределу при t —У s с учетом соотношений A.54") и A.55) приво- приводит к тому, что Н(т, s) имеет частную производную по t при t = s и значение ^ таково, что Н^ : ^ = [A(s) + ?(s)VF(r : s)]H(r : s). Так как по определению Н(т : ?) = Я^ : ?), д~~~^ = ^(г : *) 1 ' Н(т '• *)» гДе 9Я(г : t) дН(т : t) существует, то также существует и при этом справедливо оъ оъ соотношение -—^ \- Н(т : s)[A(s) + B(s)W(r : s)] = в, которое эквивалентно дифференциальному уравнению (с) из A.40). Из (Ь) системы A.43/) следует, что матричная функция G(r : Г) = G^ : t) такова, что G(r : t) = G(r : s)[EmH/(r : s)F(s : t)]G(s : t) и легко можно показать, что G(s : t) имеет частную производную по переменной t в точке t = s и при этом G(r : s) удовлетворяет уравнению 'S) = G(t : s)[D(s) + W(t : s)B(s)}, A.56) которое эквивалентно дифференциальному уравнению (b) из A.40). С помощью A.56) подобно тому, как это делалось выше относительно H(s : . - - <9G(r:s) t), устанавливается существование частной производной ^- и строится ot дифференциальное уравнение относительно G(r : s), которое вместе с A.56) и прямым дифференцированием уравнения (а) из A.41') приводит к уравнению, эквивалентному уравнению (а) из A.40). Тем самым мы установили, что в предположениях теоремы всюду в 9^ мат- матричные функции W(s : ?), G(s : ?), H(s : t) и F(s : t) имеют конечные частные производные по t и при матричных функциях А, В, С и В, определяемых со- соотношениями A.54), удовлетворяют дифференциальным уравнениям и дополни- дополнительным условиям A.40) при (s,t) G ?Н. Здесь следует отметить, что в процессе доказательства теоремы не делалось предположения о том, что коэффициенты матричного уравнения Риккати удовлетворяют условиям A.2) или что матрицы W{s : ?), G(s : ?), H(s : t) и F(s : ?), рассматриваемые как функции переменной s, локально абсолютно непрерывны. Однако, если матричные функции Pi(s :t), P2(s :t), Qi(s :t),Q2(s: t) опреде- определяются соотношениями A.43) и матрица u(s : t) является такой, как в A.56), то всюду в УК матричная функция u(s : t) имеет конечную частную производную по t и при этом функция u(s : t) удовлетворяет уравнению A.45). Более того, матри- матрица Q(s : t) несингулярна (неособенная) и П-1(8 : t) определяется формулой A.46). Следовательно, матричная функция П^ : t) в области У\ имеет частные произ- производные по t и дП (S:t^ = -u~1(s : t)9n(8:t)n-i(g . t) = n-i(s . t)Tfi(t).
238 Гл. 3. Проблемы разрешимости уравнений Риккати Предположим, что 9^о — подобласть такого типа, который был описан при обсуждении предыдущей теоремы и что матричная функция п = u(s : t) имеет в 9\ конечную производную по ?, обладающую свойством A.45). Тогда в этой подобласти выполняется тождество = 0 и поэтому матричная от функция u(s : t) на *Но совпадает с матрицей u(s : ?), элементы которой заданы соотношениями A.43) в терминах матриц W(s : ?), G(s : ?), H(s : t) и F(s : ?), удовлетворяющих соответствующей системе A.42). Пусть Ct(so : t)Ct~1(so : s) является такой матричной функцией Q(s : t) и поэ- поэтому fi(s : t) = П(^о : t)Ct~1(so : s) при (s,t) G 9^o- Следовательно, в силу того, что подобласть 9^о выбиралась произвольно, находим, что матричная функция ll(s : t) имеет в 9а ограниченные производные и . Отсюда сле- ot os дует, что матричная функция Q(s : t) непрерывна в 9^. Продолжая рассуждения, которые использовались в продолжение теоремы 1.3, получаем, что матричные функции P\{s : ?), P2(s : ?), Qi(s : t) и Q2(s : t) удовлетворяют системе диффе- дифференциальных уравнений A.50) и на основании соотношений A.51) получаем, что матричные функции W(s : ?), G(s : ?), H(s : t) и F(s : t) удовлетворяют системе A.53) в области 9\. 3. Преобразование уравнения A.1) и системы A.4м)- Предположим, что матрицы T(t) и S(t) размерностей п х п и m x m, соответственно, являют- являются несингулярными и локально абсолютно непрерывными на /. Если матричная функция W(t) размерности п х m локально абсолютно непрерывна на подынте- подынтервале /о С /, то матричная функция W°(t) = S^^W^Tit) A.57) локально абсолютно непрерывна на /о. Более того, справедливо равенство nW°(t) = S(t)n°[W°(t)]T-\ A.58) где n°[W°(t)] = ^Г^ + W°(t)A°(t) + at + D°(t)W°(t) + W°(t)B°(t)W°(t) - C°(t), A.59) в котором введены обозначения Г A°(t) = Т-г[АТ - Г], B°(t) = T^BS, { C°(t) = S-1CT, D° = S~1[S + DS]. Если положить U°(t) = Т-ги(г), V°(t) = ^-^(t), A.61) то, в соответствии с преобразованием A.57), будем иметь тождества °(^°(i)L
§ 3.1 Связь уравнений Риккати с линейными системами 239 где <i[U°(t), U°(t)] = - dV ^ + C°(t)U°(t) - D°(t)V°(t), t) ^ - A°(t)U°(t) - B°(t)V°(t), %[U(t),V{t)] 7 CLl а коэффициенты А°, B°, С0 и D° определяются формулами A.50). Отсюда, в частности, следует, что матричная функция W(t) является реше- решением уравнения A.1) на подынтервале /о, если и только если соответствующая функция W°(t), определяемая формулой A.57), будет решением уравнения n°[W°(t)]=0 при?е/0. A.1°) Если W° = Wo°(t) является решением уравнения A.1°) на /о и функции G°(t) = G°(t,s\W0°), H°(t) = H°(t,s\W0°) и F° = F°(t,s\W0°) определяются уравнениями G° + H° + F°(t, (D° + Wo°Bo)G0 = 9, H°(A° + B°W0°) = e, s\W0°)= [ H°(t,s\W J Я G°(s) H°(s) ^o)BO(r)^ — Еш, — En, \r,s\W0)dr, A.6°) A.7°) A.8°) a Wo(t) является решением уравнения B.1) на /о, причем таким, что справедливо W0°(t) = S~1(t)W0(t)T(t), то можно показать,что (a) H°(t,s\W0°)=T-1(s)H(t,s\W0)T(t), (b) G0(t,s\W0°) = S-1(t)G(t,s\W0)S(s), A.64) (c) F°(t, s\W0°) = T-1(s)F(t, s\W0)S(t). В частности, если T(t) и S(s) являются фундаментальными матричными реше- решениями соответствующих однородных матричных дифференциальных уравнений (a) Г - A(t)T = 0, V . У) A.65) (b) S + D(t)S = 0, то матричные функции A.60) определяются соотношениями А°=в, B°=T~1BS, C° = S~1CT, D° = 0. A.66) Для того чтобы установить дополнительные свойства специальных преобразо- преобразований A.4м), докажем следующий вспомогательный факт. Лемма 1.5. Если M(t) является непрерывной матричной функцией размернос- размерности п х п, которая удовлетворяет неравенству v[M(t)\ ^ 1 при t G [а, Ъ] С /, то матричная функция t) A.67) k = l с коэффициентами с\ — 1/2, с& = [1.3 ... Bfc - 3)]/(k\2k), k = 2,..., такова, что
240 Гл. 3. Проблемы разрешимости уравнений Риккати 1) F(t) непрерывна на [а,Ь]; 2) F2(t) =E-M(t); 3) если матрица M(t) эрмитова и M(t) ^ 0 при t Е [а, Ь], то F(t) ^ 0 при te [а, Ь]; 4) если М(?) < 1 я/ж ? G [a, b] и M(t) непрерывно дифференцируема почти всюду на [а, Ь], mo F(t) также непрерывно дифференцируема почти всюду на этом отрезке. Доказательство. Условие 1) леммы является следствием того, что ск > 0, оо к = 1, 2,..., и что ряд V^ с& сходится. Поэтому ряд A.67) сходится равномерно к = 1 на [а, Ь]. В самом деле, как легко видеть, сходимость этого ряда является равно- равномерной на классе матриц U(t), которые удовлетворяют неравенству v[U(t)] < 1 на отрезке [а, Ь]. оо Условие 2) следует из того, что если f(z) = ^ ckzk, то 1 - f(z) представляет к = 1 собой степенной ряд Маклорена функции A - zI/2, которая в точке z = 0 равна з единице. Если ск > 0, к = 1, 2,..., Kj(t) = 2^ akMk(t) и справедливо равенство к = 1 г+&(г\ M(t) + K2(t) ^^ /(z) = , то справедливо —J- = ^ dkjM*(t), когда dkj = ск к = 1 при к = 1,..., j — 1, поскольку 0 < dkj < ск при j + 1 < & ^ 2j и g^j = 0 при к > 2j. Следовательно, I k=j + l для произвольных матричных функций M(t), удовлетворяющих z/[M(?)] ^ 1. Если теперь матрица M(t) является эрмитовой и M(t) ^ 0 при t G [а, Ь], то, оо очевидно, что Kj(t) ^ 0 при j = 1, Более того, так как ^ ск = /A) = 1, к = 1 то 0 ^ Kj(t) ^ Е и F(t) ^ 0, что соответствует утверждению 3) доказываемой леммы. Если матрица M(t) непрерывно дифференцируема на [а, Ь], то матричные функ- функции Mk(t) при к = 2,3,... также непрерывно дифференцируемы на том же ин- интервале и Mk(t) представляет собой сумму слагаемых вида Ма (t)M(t)M@ (t), где /3 = к- 1 -а, а = 0,1,..., к- 1, и поэтому i/[M*(*)] ^ ^(^[М^)])*5!/^^)], для /с = 1,2,... Следовательно, если z/[M(?)] < 1 при t G [а, Ь], то равномерная непрерывность M(t) не отрезке [а, Ь] влечет за собой существование постоянной г, 0 < г < 1, такой, что v[M(t)} ^ г < 1 при ? G [а, Ь], а из равномерной сходимости оо бесконечного ряда V^ kckzk~1 в области {z : 0 ^ \z\ ^ г} следует равномерная к = 1 оо сходимость ряда 2_^ ckM(t) на отрезке [а, Ь]. Так что матрица F(t) непрерывно к = 1
3.1 Связь уравнений Риккати с линейными системами 241 оо 2 дифференцируема на отрезке [а, Ь] и F(t) = — 2_^ Mk(t). Если M(t) всего лишь /с = 1 абсолютно непрерывна на отрезке [а, Ъ] и v[M(t)] ^ г < 1 при t Е [a,b], то легко оо устанавливается, что v[Kj(t)} ^ v[M(t)} V^ кс^-\гк~1, j = 1, 2,..., почти всюду к=1 на [а, 6] и, следовательно, матричная функция F(t) абсолютно непрерывна на от- отрезке [а, Ь] и ее производная F(t) существует почти всюду на [а, Ь] и почти при оо всех t из [а, Ь] совпадает с рядом — V^ CkMk(t). k = l Лемма 1.6. Предположим, что N(t) является квадратной матрицей размер- размерности пх п и непрерывной на замкнутом отрезке [а, Ъ] из I и существует непре- непрерывная скалярная, не обращающаяся в нуль на [а,Ъ] функция K,(t), причем такая, что у[Е - K,(t)N(t)] ^ 1 при t е [а, Ь]. A.68) Тогда существует непрерывная на [а, Ь] матричная функция G(t) такая, что G2(t) = N(t) и, более того, если у\Е - K,N(t)] < 1 при t е [а, Ъ], A.69) в то время как каждая из функций к,(?) и N(t) непрерывно дифференцируема (аб- (абсолютно непрерывна) на [а,Ъ], то G(t) можно выбрать непрерывно дифференци- дифференцируемой (абсолютно непрерывной) на [а,Ь]. Доказательство. При выполнении условий этой леммы матричная функция M(t) = E — K,(t)N(t) удовлетворяет условиям леммы 1.5 и, следовательно, сущест- существует непрерывная матричная функция F2(t) = E — M(t) = K,(t)N(t). Так как K,(t) является непрерывной скалярной функцией, отличной от нуля на [а, Ъ], то сущест- существует также отличная от нуля непрерывная функция Л такая, что А2(?) = K,(t). От- Отсюда следует, что матричная функция G(t) = [l/X(t)]FG(t) удовлетворяет всем условиям доказываемой леммы. Лемма 1.7. Если непрерывная на [а,Ь] эрмитова матричная функция H(t) удовлетворяет условию H(t) > 0 на этом интервале, то положительно опре- определенный квадратный корень P(t) из матрицы H(t) непрерывен на [а,Ъ]; более того, если H(t) непрерывно дифференцируема (абсолютно непрерывна) на [а,Ъ], то матричная функция P(t) также непрерывно дифференцируема (абсолютно не- непрерывна) на этом отрезке. Доказательство. Если H(t) — непрерывная эрмитова матричная функция, удовлетворяющая условию H(t) > 0 на [а,Ь], то существует постоянная к > О такая, что 0 < k2H(t) < Е на [а,Ь]. Следовательно, следующая эрмитова мат- матрица M(t) — Е — k2H(t) удовлетворяет условиям леммы 1.5, а матрица F(t), определяемая соотношением A.67), такова, что P(t)(l/k)F(t) является положи- положительно определенным эрмитовым квадратным корнем из матрицы H(t), который непрерывно дифференцируем или абсолютно непрерывен всякий раз, когда этим свойством обладает матрица H(t). Как известно, существует единственный неотрицательно определенный эрми-
242 Гл. 3. Проблемы разрешимости уравнений Риккати тов квадратный корень из эрмитовой неотрицательно определенной матрицы. Поэтому P(t) = (l/k)F(t) является единственным таким корнем из H(t). В част- частности, если H(t) > 0 на отрезке / и H(t) локально абсолютно непрерывна на /, то положительно определенный эрмитов квадратный корень из H(t) являет- является также локально абсолютно непрерывным на /. Полученный результат можно сформулировать следующим образом. Теорема 1.6. Предположим, что B(t) является положительно определенной эрмитовой матричной функцией, которая локально абсолютно непрерывна на I. Если T(t) = 51/2(t) — положительно определенный квадратный корень из мат- матрицы B(t), то преобразованием (u\t) = T-\t)u(t) = в-^т®, \ V°(t) = T*(t)V(t) = B^2(t)V(t) система A.4м) преобразуется в систему гО[ттО т/От л /•OrrrO т/От л /i 7T1 определенную соотношениями A.63), в которых матрицы A°(t), B°(t), C°(t) и D°(t) определяются формулами A°(t) = B- B°(t) = E, C°(t) = B^2(t)C(t)B^2(t), A.72) D°(t) = [B^2(t)D(t) - B-^2(t)}B^2(t). Пусть теперь A1=l[A0 + A°*], A2 = i[A°-A0*], A.72') так что A0 = Ai + A2, A0* = Ai — A2. Если матричная функция A\(t) ло- локально абсолютно непрерывна, то следующим преобразованием U^~(t) = U°(t) и y+(t) = V°(t) + Ai(t)U°(t) система A.71) преобразуется к виду { U+(t) - A2(t)U+(t) -V+(t) = в, где Ci = C° + Ai A2 + D°Ai + Ai, ©I = 23° - Ai. A.73) Пусть M(t) — решение задачи Коши -A2M(t), M(to) = E, A.74) где to — некоторая фиксированная точка из /. Так как А2 (?) = — А?, то матрич- матричная функция М(?) унитарна на /, так что М(?)М* (?) = Е. С помощью замены U+(t) = M(t)U(t), V+(t) = M(t)V(t) A.75)
§ 3.2. Свойства решений 243 система A.717) преобразуется в систему ) - D(t)V(t) = в, \ - V(t) = О, где С = М*СМ, Ш) = М* [Ai + ID)i]A. A.77) В частности, (U(?),V(?)) является решением системы A.76), если и только если U(?) является решением линейного дифференциального уравнения второго поряд- порядка U(?) + IB)(?)U(?) - C(t)U(t) = 6> A.760 и V(t) =U(t). Если, кроме того, справедливо равенство D = А*, то в A.72) D0 = А0*. В применении к системе A.73) получаем IDi = D° — Ai = А0* — Ai = А2 и, следовательно, из A.77) можно получить, что в A.76) мы имеем Ш)(?) = #, а эта система принимает вид Г -v(t) + c(t)u(t) = #, ^ W W A.78) Полученная система эквивалентна дифференциальному уравнению второго по- порядка Этот результат можно сформулировать в виде следующей теоремы. Теорема 1.7. Предположим, что п = m, B(t) является положительно опреде- определенной эрмитовой матричной функцией на /, причем B(t) и Ai (?) являются абсо- абсолютно непрерывными на этом интервале. Если A(t) — решение системы A.74), то (U(t);V(t)) образует решение системы A.4м), если и только если матрица U(?) = M* (tM1/2t/(t) является решением линейного дифференциального уравне- уравнения второго порядка A.760, причем t(t) = М* (ЩВ1/2 (t)V(t) + Ai (t)M(t)U(t); более того, если D(t) = A*(t) при t e /, то Ш)(?) = О на этом интервале и уравнение A.760 преобразуется в A.76")• § 3.2. Свойства решений 1. Ассоциированные дифференциальные уравнения Риккати. Вектор- Векторную систему дифференциальных уравнений, присоединенную к A.4^), запишем в виде e B.1) или, что то же самое, Г -«(«) + С* (t)u(t) - A* (t)v(t) = О, { u(t)-D*(t)u(t)-B*(t)v(t)=O, ['' где u(t) и v(t) — векторные функции размерностей тип, соответственно. Мат- Матричное дифференциальное уравнение Риккати, соответствующее системе урав-
244 Гл. 3. Проблемы разрешимости уравнений Риккати нений B.1) относительно матрицы W(t) размерности п х т, имеет вид n+[W(t)] = W(t) + W(t)D*(t) + A*(t)W(t) + + W(t)B*(t)W(t) - C*(t) = 0. B.3) Следует отметить, что вектор y(t) является решением уравнения B.1) тогда и только тогда, когда ( = y(t) будет решением системы ?+[<(«)] = -5с(*) = 5(*)С(*) = о, B.1') или, соответственно, векторы ?(?) = й(?), ??(?) = v(t) образуют решение системы Г = 0, = о. Короче говоря, W(?) будет решением уравнения B.3), если и только если мат- матрица Q(t) = VF(?) является решением матричного дифференциального уравнения Риккати П+[п(Ь)] = u(t) + u(t)D(t) + A(t)u(t) + u(t)B(t)u(t) - C(t) = 6>. B.30 В силу этих простых соотношений, существующих между решениями уравнений B.17), B.2'), B.37) и B.1), B.2), B.3), специфическую формулировку результатов можно приводить лишь относительно решений систем B.1), B.2) и B.3). Легко устанавливаются следующие результаты. Лемма 2.1. Если y(t) = (u(t);v(t)) и y(t) = (u(t);v(t)) являются решениями систем A.4^) и B. 2), соответственно, то функция у* (tKi/(t) = v* (t)«(t) - u* (t)v(t) B.4) также постоянна. Аналогично, если y(t) = (u(t);v(t)) и ((t) = (?(t);r)(t)) явля- являются решениями уравнений A.4b) и B.2), соответственно, то функция постоянна. 2. Нормальность и анормальность решений. Два различных значения t\ и t2 из отрезка / называются (взаимно) сопряженными относительно систе- системы A.4^), если существует решение (u(t);v(t)) этой системы дифференциальных уравнений с u(t) ^ 0 на подынтервале с концевыми точками t\ и ?2, в то вре- время как u(t\) = u(t2) = 0. Система уравнений называется несопряженной на подынтервале /о С /, при условии, что на этом подынтервале нет различных сопряженных значений. Система A.4^) называется несопряженной для больших значений ?, если существует подынтервал (а, оо) С /, на котором эта система несопряженна. Аналогичные понятия используются в вариационном исчислении применительно к присоединенным системам дифференциальных уравнений, ко- которые там называются тождественно нормальными на I или нормальными на каждом подынтервале. Пусть /о — невырожденный подынтервал из /, а Л(/о) представляет собой линейное пространство m-мерных векторных функций, которые являются реше- решениями векторного дифференциального уравнения v(t) + D(t)v(t) = 0 и удовлетво- удовлетворяют условию B(t)v(t) = 0 при t G /о- Ясно, что v(t) G Л(/о), если и только если (u(t) = 0; v(t)) является решением уравнения A.4^) на /0. Если Л(/о) — нульмер-
§ 3.2. Свойства решений 245 ное пространство, то система A.4^) называется нормальной на /о или имеющей порядок анормальности, равный нулю на /о. Тогда как если Л(/о) имеет размер- размерность d, d > 0, система A.4^) называется анормальной порядка анормальности d на /о. Символом Л+(/о) будем обозначать линейное пространство векторов v(t), которые являются решениями уравнения v + A*(t)v(t) = 0 и удовлетворяют усло- условию B*(t)v(t) = 0 на /о. Размерность Л+(/о) будем обозначать через d+(/o). Ес- Если /о = [s,t], то для краткости будем пользоваться обозначением d+(/o) = d+[s,?] или просто d[s,?]. Подобные обозначения будут использоваться и в тех случаях, когда /0 будет представлять собой [s,?), (s,i\ или (s,t). В дальнейшем любой из интервалов [s,?], (s,t) и т.д. мы будем считать невырождающимся. Ясно, что 0 ^ d[s,t] ^ т для любого подынтервла /0 из /. Более того, если s е /, то d[s,t] будет монотонной функцией переменной ?, s < ?, с не более чем т точками разрыва, в каждой из которых она непрерывна слева. В частности, если [s,bo) С /, то d[s,bo) является минимумом d[s,t), при s < t < bo и do{I} является максимумом функции d[s,bo) при s Е /. Кроме того, очевидно, что если в точке а выполняется равенство d[a,bo) = bo, то d[b,bo) = do для произвольного b G [a, bo) и существует b G (a, bo) такое, что d[a,t] = do при t G [Ь, bo). Если d[s,r] = б? > 0, a G [s,r] и А = Д(а) является матрицей размерности т х d такой, что решение (U(t); V(t)) системы A.4м), определенное начальными условиями U(s) = в, V(s) = А, обладает свойством U(t) = в при t G [s,r] и столбцы компоненты V(?) образуют базис для A[s,r], то для краткости будем писать А (а) ~ A[s,r]. Если выполняется условие А* А = Ed, то будем записывать А (а) « A[s,r]. Для B.1) будем писать Д+(а) ~ A+[s,r] и Д+(а) « A+[s,r], соответственно. Если [а, 6] = /, то через По[&54 будем обозначать пространство (т + п)- мерных векторных функций (u(t);v(t)), которые образуют решение системы диф- дифференциальных уравнений A.4^) и удовлетворяют краевым условиям и (а) = О, v(b) = 0. Соответствующее пространство для уравнения B.1) будем обозначать через п+0[а,Ь]. Если к[а,Ь] является размерностью пространства По[а, Ь], то, оче- очевидно, что k[a,b] ^ d[a,b] и k[a,b] > d[a,b] тогда и только тогда, когда а и b являются сопряженными; в этом случае целое число k[a,b] - d[a,b] называется порядком точки b {а} сопряжения относительно а {Ь}. Если k+[a,b] — размер- размерность пространства П+[а,6], то классические результаты теории двуточечных краевых задач, в частности, означают, что т + к+[а, Ь] = п + к[а, Ь] и для заданных n-мерных векторов иа,иь решение (u(t);v(t)) системы A.4^), удовлетворяющее условиям и (а) = иа, и(Ъ) = иъ существует, если и только если v+ (а)иа - v+ (b)ub = 0 B.5) для произвольного вектора (u(t);v(t)) G fi+[a, Ь]. Если п < т. то ясно, что для произвольного подынтервала [a, b] G / существует не тождественно равное нулю решение (u(t);v(t)) системы A.4^), удовлетворяю- удовлетворяющее краевым условиям и (а) = 0, v(b) = 0. Это означает, что размерность П[а,6] положительна и, если система A.4^) нормальна на [а, Ь], то а и b являются сопря- сопряженными точками относительно этой системы. Соответственно, если т < п, то размерность П+0[а,6] положительна и, если уравнение B.1) нормально на [а, 6],
246 Гл. 3. Проблемы разрешимости уравнений Риккати то а и Ъ являются сопряженными точками относительно уравнения B.1). Если п = т и система A.4^) является несопряженной и тождественно нор- нормальной на подынтервале /о, то соотношение &+[а,6] = к[а,Ь], справедливое для любого [a, b] Е /, влечет за собой тот факт, что уравнение B.1) также сопря- сопряженное и тождественно нормальное на /о. В частности, в случае, когда п = т, предположение о том, что обе системы A.4^) и B.1) несопряженны на подын- тервле /о слабее гипотез о том, что A.4^) и B.1) сопряжении и тождественно нормальны на /о. Прежде, чем представлять некоторые общие утверждения относительно систем дифференциальных уравнений с учетом концепции о нормальности и анормаль- анормальности, рассмотрим кратко специальный случай. Пусть В — постоянная матрица размерности г х m, a P(t) — матричная функция размерности п х г такая, что матрица B(t) = P(t)B имеет тот же ранг, что и В на всем интервале /. Этот факт запишем в следующей форме {v\v Е 0m, B(t)v = 0} = {v\v G 0m, Bv = 0}. В том случае, когда это условие выполняется, будем записывать B(t) = В и будем говорить, что матрица «B(t) нуль-пространственно эквивалентна матрице В поч- почти всюду на /». Отметим два важных специфичных требования, которые имеют место в соотношении B(t) = В: 1) B(t) = P(t)B, где P(t) — матричная функция размерности п х г, невырож- дающаяся почти всюду на /; 2) т = п и ??(?) = B*Q(t)B, где Q(t) — эрмитова матричная функция размер- размерности п х п, которая определена почти для всех ? из /. Здесь уместно подчеркнуть, что в последнем случае не требуется, чтобы мат- матричная функция Q(t) была положительно определенной (или отрицательно опре- определенной) почти всюду на /. Однако, она должна быть определена почти всю- всюду на /. Если существуют постоянные матрицы В и D размерностей г х т и т х т, соответственно, такие, что B(t) = В и D(t) = D на невырождаю- щемся подынтервле /о С /, то ясно, что y(t) = (?/(?); г>(?)) является решением уравнения A.4^), в котором u(t) = 0 на невырождающемся подынтервле [а, Ь] из /0, если и только если v(t) = {ехр[-,Ш]}/я, где р — постоянный ш-мерный вектор, и p*{exp[-D*t]}B* = 0 на [а, Ь]. Так как в соответствии с теоремой Гамильтона-Кэли AD(D) = в, где А^(А) — характеристический полином матри- матрицы D, то р удовлетворяет этим последним условиям, если и только если р*В* = 0, p*D*b* = 0,... ,^*D*m~1.B* = 0 и, следовательно, х * t (может быть отличным от тождественного нуля тогда и только тогда, когда матрица {iT^ir,...,!}*™-1!?*} B.60 размерности т х гт имеет ранг меньше, чем т. Короче говоря, если существуют постоянные матрицы А и В\ размерностей п х п и п х s, соответственно, такие, что А(?) = А и B*(t) = 5* на невырождаю- невырождающемся подынтервале /о G /, то у(?) = (u(t); v(t)) при u(t) = 0 является решением уравнения B.1), определенном на невырождающемся подынтервле [a, b] G /о , ес- если и только если v(t) = [ехр(—A*t)]a, где сг — постоянный n-мерный вектор и сг*[ехр(—Ab)\B\ = # на [а, 6]. В соответствии с полученным результатом, нахо- находим, что вектор v(t) может быть не тождественно равным нулю на [а, Ъ] в том и
§ 3.2. Свойства решений 247 только том случае, когда матрица {В1,АВ1,...,Ап-1В1} B.6") размерности nxns имеет ранг меньший, чем п. Более того, так как у(?) является решением уравнения B.1), если и только если ?(?) = у(?) является решением уравнения B.1'), и нормально на подынтервле [а, Ь], если и только если уравнение B.1') также нормально на этом подынтервале. В частности, отсюда получается следующий результат. Лемма 2.2. Если существуют постоянные матрицы D и В размерностей т х т и г х т, соответственно, такие, что D(t) = D и B(t) = В на I, то <шс- тема A.4^) тождественно нормальна на I, если и только если матрица B.6') имеет ранг т. Соответственно, если существуют постоянные матрицы А и В\ размерностей п х п и п х s, соответственно, такие, что A(t) —Аи B*(t) = 5* на /, то каждая из систем B.1) и A.1') тождественно нормальна на I, если и только если матрица B.6") имеет ранг п. В частности, если существуют постоянные матрицы А, В, D такие, что A(t) = A, B(t) = В и D(t) = D на I, то В и В\ могут быть заменены на В в каждой из матриц B.6') и B.6"), соответственно, и, следовательно, эти соотношения можно переписать в виде {?*,?*?*,...,Я*™-1^*}, B.6@ {В,АВ,...,Ап~1В}. B.6@ Пусть для заданного интервала [a,b] 1)'[а,Ь} обозначает класс n-мерных век- векторных функций f](t), для каждой из которых существует соответствующая век- векторная функция C(t), которая измерима по Лебегу, причем B(t)((t) G Ln[a,b] и (см. A.4М)) C2[r](t),C(t)] = rj(t) - A(t)r](t) - B(t)?(t) = 0 на [а, Ь]. Для краткости пары таких функций будем обозначать через Т] G 2)' [а, Ь] : ?. Соответствен- Соответственно, класс m-мерных векторных функций f](t), ассоциируемых с системой B.1) и удовлетворяющих дифференциальному уравнению rj(t) — D*(t)rj(t) — B* (t)((t) = 0, будем обозначать через т] G 2)^_[а, Ь] : (. Следующий факт легко получается как следствие приведенных выше общих результатов и приводится здесь для непо- непосредственного использования в следующем параграфе. Здесь и всюду на протяжении этой главы используется очевидная модифика- модификация, основанная на удалении некоторых матриц в случае, когда некоторые про- пространства имеют нулевую размерность или размерность, равную максимальному из чисел пит. Сформулированные ниже леммы непосредственно следуют из приведенных вы- выше рассуждений и в специальном доказательстве, очевидно, не нуждаются. Лемма 2.3. Если [a,b] E /, то решение (u(t);v(t)) системы A.4^), удовле- удовлетворяющее условиям и (а) = иа, v(b) = vb существует тогда и только тогда, когда выполняется условие B.5). Если r\ G Q'[a,b] : ? и v(t) G Л+[а,6], то функция v*(t)r)(t) постоянна на [а,Ь]; более того, если a ub сопряженны относи- относительно уравнения B.1), то решение системы A.4^), удовлетворяющее условиям и(а) = иа, и(Ь) = 0, существует, если и только если v*(a)ua = 0 для произволъ-
248 Гл. 3. Проблемы разрешимости уравнений Риккати ного вектора v(t) Е Л+[а,6]. Лемма 2.4. Если A.4^) сопряжений на I, то т + d+[a,b] ^ п + d[a, b] для произвольного [а, Ь] С /; если т + d+[a, b] < n + d[a, b], то а и b являются сопря- сопряженными точками для B.1). В частности, если A.4^) является сопряженной на I, то т + d+[a, b] = n + d[a, b] для всех [а, Ь] С /, если и только если B.1) также сопряжений на I. Лемма 2.5. Пусть [а, Ь] С I u с принадлежит [а,Ь], причем d[a,t] = d[a, b] = d при t G (с, b], A (a) ~ A[a, Ь] и Q — матрица размерности т х (m — d) та- такие, что [A(a)Q] несингулярны. Если (C/i(?); Vi(?)) является решением системы A.4м), удовлетворяющим начальным условиям U\(a) = в, V\(a) = Q, то зна- значение ti e (c,b) является сопряженным с а относительно системы A.4^), ес- если и только если Ui(ti) имеет ранг, меньший, чем т - d. Если, кроме того, т + d+[a,b] = п + d[a,b], А+(а) ~ Л+[а,6] и (U2(t);V2(t)) — решение системы A.4м), удовлетворяющее начальным условиям С/2 (a) = A+(a), V2(a) = в, то зна- значение t\ G (с, Ь] является сопряженным с а относительно системы A.4^), если и только если матрица {C/i (ti); C/2(?i)} размерности пхп невырождена. Пусть [а, Ь] —- заданный подынтервал из / с d = d[a, b] > 0, причем s G [a, b] с A(s) ~ A[a,b] и матрица W{t) является решением уравнения A.1) на [a,b]. Тогда из системы B.5) и из определения А[а,Ь] следует, что столбцы векторов G(t,s\W)A(a) образуют базис для Л[а,6]. Соответственно, если Д+(з) ~ Л+[а,6], то столбцы векторов G+(t, s\W*)A+(s) = H*(t, s\W)A+(s) образуют базис для Лемма 2.6. Если [s,r] С /, A(s) ~ A[s,r] и W(t) является решением уравнения A.1) на этом интервале, то F(t,s\W)A(s)=0 npute[s,r], B.70 и матрица F(t,s\W) размерности (n+d)xm имеет ранг меньше, чем т, если и только если г является сопряженной точкой к s для системы A.4^). Соотношение B.7') легко получить из A.8) и того факта, что столбцы векторов G{t, s\W)A(s) образуют базис для A(s,r). Последующие выводы из леммы 2.6 следуют из того факта, что лемма 1.3 , в частности, утверждает, что постоянный вектор ф, удовлетворяющий условию F(r,s\W)ip = 0 существует тогда и только тогда, когда (u(t);v(t)) = (K(t, s\W)ip; L(t, s\W)\jj) является решением системы A.4^), удовлетворяющим краевым условиям u(s) = 0,u(r) = 0; и u(t) = 0 на [s,r], если и только если F(t,s\W)ip = 0 при t G [s,r], причем в этом случае 0 = Ft{t,s\W)^ = H{t,s\W)B{t)G{t,s\W)^, и вектор v(t) = G{t,s\W)^ является элементом A(s,r). Лемма 2.7. Предположим, что [s,r] С /, с G (s,r) причем d[s,i\ = d[s,r] = d для t > с, A(s) и A[s,r] и W(t) является решением уравнения A.1) на [s,r]. Если для системы A.4^) нет точки на [s,r], которая является сопряженной с s, то
§ 3.2. Свойства решений 249 существует матрица Ф(?, s) размерности пх (n — m + d), не зависящая от W(t), и такая, что V(t,s)F(t,s\W)=e, V*(t,s)y(t,s) = En_m+d, te(c,r], B.8) и матрица F(t,8\W) Д*(*) в размерности (п + d) х (п + d) неособенна при t е (с, г]. Если для системы A.4^) нет точки на {с, г], которая является сопряженной с s, то из леммы 6.6 следует, что матрица F(t, s\W) является постоянной и имеет ранг m—d на (с, г]. Следовательно, существует матричная функция Ф(?, s) размерности п х (п — т + d), которая непрерывна на {с,г] и удовлетворяет условию B.8), а неособенность матричной функции B.9) следует тогда из B.8) и из того факта, что B.7') имеет ранг, равный т на этом интервале. Более того, если W(t) и Wi(t) являются решениями уравнения A.1) на (s,r] и Fi = W\(s) - W(s), то с учетом соотношений (с) из A.38) можно показать, что F(t, s\W!) = [En + F(t, slW^^Fit, s\W) = = F(t, s\W)[Em + riF(t, s\W)]-1 B.10) и, следовательно, матричная функция Ф(?,з), которая обладает свойством B.8) при любой матрице W(t), также обладает этим свойством и при любом решении уравнения A.1) на [s,r]. Обратная к B.9) матрица имеет вид где F# — обобщенная по Муру, обратная к F матрица. Если W(t) и VFi(t) —решения A.1) на [s,r] и F = F(t,s\W), F* =F#(t,s\W), Fi = F(?,s|Wi), Ff = Ff(t,s\W!), A = A(s), Ф = Ф(*,в), то факт, что B.9) и B.11) являются взаимно обратными уже установлен для t G (с,г]. На этом интервале Ff - F* + Ff(Fi - F)F* = 6>. B.12) Из B.10) следует, что F1 - F = -FiTiF = -FT1F1, где Г1 = F1 - F, так что справедливо соотношение Ff - F* = Ff/iriFF@ = (?m - AA*)ri(en - ФФ*). B.12') Пусть (U(t);V(t)) — решение системы A.4м), У которого U(t) — невырож- невырожденная на [s,r] матрица, причем W(t) = V(t)U~1(t) и V(t,s) = G(t, s\W)A(s) являются матричными функциями размерности т х d, столбцы векторов кото- которых образуют базис для A(s,r). Тогда для произвольной постоянной матрицы N размерности d x n матрич- матричная функция (Г\(е); V\{t)) = (U(t);V(t) + V(t,s)N) является решением системы A.4м) на (s,r] с соответствующей матричной функцией W\{t) = V\{t)U\{t) та- такой, что Ti = W!(s) - W(s) = A(s)NU-1(s). Более того, так как F(t,s\W)Ti = в при t e [s,r], то из A.38) следует что
250 Гл. 3. Проблемы разрешимости уравнений Риккати справедливы соотношения G(t, a\Wx) = G(t, s\W)[Em + Г^г, s^)], H(t,s\W1)=H(t,s\W), B.13) F(t,s\W1)=F(t,s\W). В частности, если выбрать матрицу N такой, что A*(s)Wi(s) = в, то W\(t) окажется решением уравнения A.1), которое определяется начальным условием W1(s) = [Em-A(s)A*(s)]W(s). Если системы A.4^) и B.1) одновременно являются сопряженными на [s,r] и A+(s) = A+[s,r], то можно показать, что Ф(?,з) = A+(s) и, комбинируя приве- приведенные выше результаты для обеих систем A.4^) и B.1), можно сформулировать следующий результат. Теорема 2.1. Пусть обе системы A.4^) и B.1) сопряжении на [s,r], причем A(s) и A(s,r], A+(s) и A+[s,r] u VF(?) является решением уравнения A.1) на [s,r]. Тогда решение W1(t) уравнения A.1), определяемое начальным условием W7(s) = [Sm - A(s)A*(s)]W(s)[^ - A+(s)A;(s)] B.14) существует на [s,r] и A*(s)VF7(s) =6>, VF7(s)A+(s) =6>, B.15) F(*,s|W7) =F(t,s|VF) npi/ t G [s,r]. B.16) Решение W7(t) уравнения A.1) которое удовлетворяет условию B.15) будем называться решением, которое нормализовано по переменной s G [s,r]. Используя соотношения A.11) можно установить следующий результат. Следствие 2.1. Пусть обе системы A.4^) и B.1) несопряженны на подын- подынтервале [s,r] С /, причем точка с G [s,bo) такова, что d[s,t] = d[s,bo] и d_j_[s,?] = d+[s,bo) nPu t G (с, bo), а матричные функции W\(t) и Wo(t) явля- являются решениями уравнения A.1) на [s, Ьо)? каждое из которых нормализовано по переменной s. Тогда F#(t,s\W!) - F#(t,s\W0) =W!(s) -W0(s), te[c,b0). B.17) В частности, если F#(t,s\Wo) стремится к некоторому пределу при t ->• Ьо? то F#(t, slT^i) при этом также стремится к некоторому пределу и эти два предела различаются не более, чем на W\(s) — Wo(s). Теорема 2.2. Пусть система A.4^) несопряженна на [s,bo) uW(t) —решение уравнения A.1) на этом интервале такое,что F#(t,s\W) —> в при t —> bo- Если с е [s,bo), причем d[s,c] = d[s,bo) и d[c, bo) = do, mo F#(t,s\\W) ->• в при всех si е [с, bo). Доказательство. Если A(s) и A[s,oo), to, согласно лемме 6.7, существует матричная функция Ф(?,з) размерности п х (п — m + d), которая непрерывна по t и удовлетворяет соотношениям B.10) при t G [с, bo), в то время как матрица B.9) невырождена на этом интервале. Если si —У [с, bo), то d[si,bo) — d[c,bo) = do и существует матрица A(si) и А[с, bo) размерности т х do- Если fi(t,s) означает минимум выражения |F(?, s|W)?| на следующем множес- множестве J2(s) — {^1^ ? вт, |^| = 1, A*(s)^ = 0} и /i(si) означает минимум выра-
3.2. Свойства решений 251 жения |F(t,Si|W0f| на множестве ?(Sl) = {? | f G 0m, |?| = 1, Д*Ы? = 0}, то утверждение теоремы 2.2 эквивалентно следующему: если /i(?, s) —У оо npi/ ? —у bo, то /i(t, si) —>¦ oo npi/ ? —у bo для всех si G [с, Ьо). Обоснование этого утверждения приводить не будем. Из определения F(t,s\W) следует, что F(t, s\W) = F(s, S!\W) + H(s, S!\W)F(t, s\W)G(s, s^W). B.18) Поэтому условие о том, что F(t, s\W)A(s) = 0 при t G [s,bo) означает, в част- частности, что F(t, s\W)G(s, S!\W)= F(t, s\W)[Em - A(s)A*(s)]G(s, si|W) и следова- следовательно, если ? G XXsi)> то справедливо F(t, s\W)G(s, si\W)? = F(t, s|VF)^°, где ?° = [Em - A(s)A*(s)]G(s,s1\W)^ Поэтому A(s)A(s)?° = 0 и если ^° = 0, то имеет место ? = G(s,si\W)p, где ^ = A*(s)G(s, si|W)? и так как справедливо , s|W), то G(t,s1\W)G{s,Sl\W)A(s)p = G(t,s\W)A(s)p e A[s,b0). Так как из этого соотношения следует, что G(t, si\W)? G A[si, Ьо)? a это означает существование б?0-мерного вектора а, такого, что ? = A(s)p. С другой стороны, из условия ? G XXsi) следует, что 0 = A(si)? = о и поэтому противоречит тому, что ? = 0. Следовательно, ?0 Ф 0 и поэтому существует k(s,si) > 0 такое, что \[Ет - A(s)A*(s)]G(s,s1\W)^\ ^ k(s,Sl) при ? G EEi)- Если Ы*,*1) и fe(^,<si) — положительные постоянные такие, что верно |F(s,si|WO7| ^ fci(s,si) и |i?(s,si|W)| ^ &2(s,si) ПРИ ^ ^ ^т5 и |^| = 1? т° из соотношения B.18) следует, что справедливо неравенство |F(s,si|VF)?| ^ —fci(s,si) + fe(s, si)i(T(s, si)/a(t, s) ПРИ ^ ^ S(si)- Следовательно, справедливо /i(t, si) ^ —fci(s, si) + fe(^, si)/i(s, si) и, если /Ji(t,s) —У оо при ? —>¦ Ьо и si G (с, Ьо), то также /a(t,si) —у оо при t —У оо. В силу приведенных выше рассуждений, этот вывод означает справедливость утверждения теоремы. 3. Особенные решения матричного дифференциального уравнения Риккати. Пусть система A.4^) несопряженна на полуинтервале (ао,Ьо). Реше- Решение Yb0 = (Ubo]Vbo(t)) этой системы будем называть главным решением в точке Ьо, если существует интервал [а, Ьо), на котором матрица Ubo(t) не вырождена, и для Wbo(t) = Vbo(t)Ubo(t) существует не менее одного значения s из (а, Ьо) такого, что F#(t, s\Wb0) —У 0 при t —У bo- Соответственно,Wb0 (t) называется особым в точке Ьо решением уравнения A.1). Из теоремы 2.2 следует, что если Ybo(t) является главным в Ьо решением сис- системы A.4^), то существует подынтервал (ai,bo) такой, что F#(t, sWb0) —У О при t —у Ьо для любого s G (ai,bo). Более того, в силу следствия из теоремы 2.1, находим, что если обе системы A.4^) и B.1) несопряженны на (ао,Ьо), то уравнение A.1) допускает не более одного особого в точке Ьо решения, которое нормализовано в точке s. Предположим, что система A.4^) невырождена на (ао,Ьо) и пусть для точки s этого интервала A(s) ~ A(s,bo). Выберем с G [s,bo) таким образом, что верно ф,Ь] = d[s,bo) = d, dm[s,b] = d[s,bo) = dm при t G (c,bo). Пусть г G (c,bo) и Ysr(t) = (Usr(t); Vsr(t)) — матрица размерности (n + m) x (n + d — m), столб- столбцы векторов которой образуют fc+ = d + п - т линейно независимых реше-
252 Гл. 3. Проблемы разрешимости уравнений Риккати ний (u(t);v(t)) уравнения B.1), удовлетворяющих краевым условиям u(s) = 0 и v(r) = 0. В соответствии с предыдущими преобразованиями, получаем, что ес- если fc+ = 0, то утверждение относительно существования матрицы Ysr(t) и ее свойствах становятся бессмысленными. Ниже будет показано, что этот базис для П+0[з,г] может быть выбран таким образом, чтобы V*r(s)Vsr(s) = Е^+. Обозначим через Q(s,r) матрицу размер- размерности п х (п — fc+) = п х (т — d) такую, что для нее выполняются равенст- равенства Q*(s,r)Vsr(s) = 0, Q*{s,r)Q{s,r) = Еш-^. В силу леммы 2.3, для любого г е (с, bo) существует единственное решение Ysr(t) = (Usr(t)]Vsr(t)) системы A.4м) такое, что U8r(r) = 0, Usr(s) = в, A*(s)V8r(s) = 0. B.19) Теорема 2.3. Предположим, что система A.4^) несопряженна на (а,Ьо); бо- более того, для описанных выше матриц Ysr(t) = (Usr(t); Vsr(t)) и A(s) при s e (a,bo) матрица Ysr(t) = (Usr(t)]Vsr(t)) является решением системы A.4м), удовлетворяющим условиям B.19). Если W(t) — решение уравнения A.1) на (а,Ьо) такое, что A*(s)W(s) = в и F#(t,s\W) —> в при t —> bo, то для лю- любой последовательности {rj} С (а, Ьо) такой, что rj —> bo и последователь- последовательность {Q(s,rj)} сходится к предельной матрице Q(s) при j —> оо, последова- последовательность Vsrj (t) также сходится к предельной матрице P(s) и если матрица Ysb0(t) = (Usb0(t); Vsb0(t)) является решением системы уравнений A.4м), опре- определяемым начальными условиями Usbo(s) = Q(s), Vsbo(s) = P(s), B.20) то Vsbo(t) = W(t)Usbo(t). B.21) Если Q2(t) — матрица размерности п х fc+ такая, что матрица (Q(t)Q2(t)) размерности п х п неособенная, причем P2(s)W(s)Q 2 (s) uYS2(t) = (US2(t)] VS2(t)) является решением системы A.4м), определяемое начальными условиями Us2(s) = Q2(s), Vs2(s) = P2(s), B.22) то матричная функция VS2(t) совпадает с W(t)US2(t) на (а,Ьо). Более того, Y(t) = (U(t);V(t)), где U{t) = (U8bo{t);US2{t)), V(t) = (Vsbo(t);Vs2(t)) B.23) является решением системы A.4м) с неособенной матрицей U(t) и W(t) = VifyU'1^) при t e (a, bo). B.24) Из A.19) при г е (с,Ь0) следует, что F(t, s\W)[Vsr(s) - W(s)Q(s,r)} = -Q(s,r) и так как A*(s)[Vsr(s) ~ W(s)Q(s,r)] = в, то VSr(s) - W(s)Q(s) = -F*{r, s\W)Q(s, r). B.25) Так как матричная функция Q(s,r) ограничена, то из того, что F#(r, s\W) —> в при г —У Ьо, следует, что Vsr(s) — W{s)Q{s,r) —> в при г —> Ьо. Более того, существует последовательность {rj} такая, что {Q(s,rj)} сходится к предель- предельной функции Q(s), когда rj —У Ьо при j —у оо, и для любой такой последо- последовательности оказывается, что {Vsrj} —У P(s) = W(s)Q(s) при j —У оо. Если матрица Ysb0(s) = (Usb0(s); Vsb0(s)) является решением системы A.4М), опре-
§ 3.2. Свойства решений 253 деленное начальными условиями B.20), то справедливо равенство B.21) при t = s и, следовательно, при всех t G (a, bo), в силу A.16), матричная функ- функция YS2(t) = (US2(t);VS2(t)) является решением системы A.4м), определенным условиями B.22) и обладающим свойством VS2(s) = W(s)US2(s). Поэтому для матричной функции Y(t) = (U(t);V(t)), определяемой условиями теоремы, име- имеем V(t) = W(t)U(t) при t G (a, b0). Если U(b)? = 0 при b G (а,Ь0), то У(Ь)? = 0 и (U(t)?;V(t)?) является нулевым решением системы B.14^), тогда как U(s) явля- является ненулевой матрицей и, следовательно, ? = 0. Поэтому U(t) — неособенная матрица на (а, Ьо) и соотношение B.24) справедливо всюду на этом интервале. Пусть обе системы A.4^) и B.1) несопряженны на (а, Ьо) при s G (a, bo), d[s,b0) = do, где d0 — максимум d[t,b0) при t G (a,b0), d+[s,b0) = d+0, где d+0 — максимум функции d+[t,bo) при ? G (a, bo)? A(s) ~ A[s,bo), A+E) ~ A[s,bo)- Тогда в качестве матрицы Vsr(s) можно взять A+(s), а в качестве матрицы Q(s,r) размерности п х (п — б?+0) = п х (т — do) можно взять матрицу Q(s) независимо от г такую, что A+MQO0 = в, Q4s)Q(s) = Em_do. B.26) Если точка с G (a, bo) такая, что D[s,t] = d[s,bo) при t G (с, Ьо), то начальные условия B.19), определяющее решение Ysr(t) = (Usr(t)]Vsr(t)) системы A.4м) при г G (с, Ьо)? принимают вид Usr(s) = в, Usr(s) = Q(s), A*(s)Vsr(s) = в. B.27) Если теперь существует решение W(t) уравнения A.1), определенное на [s,bo) и такое, что F#(t, s\W) ->• 0 при t ->• Ьо, то, в силу теоремы 2.2, соответствующее решение Ws(t), определяемое условием B.14), удовлетворяет соотношениям B.15) и B.16) и, поэтому F#(t,s\Ws) ~^ @ ПРИ t —> bo- Тогда из теоремы 2.4 следует, что решение Ysb0(t) = (Usb0(t); Vsb0(t)), определяемое условиями B.20), таково, что Vsb0(t) = Ws(t)Usb0(t) на [s,bo). В качестве матрицы Q2(t), фигурирующей в теореме 2.4, можно выбрать Д+(з) и если YS2(s) = (US2(s);VS2(s)) — решение системы A.4м), определяемое начальными условиями Us2(s) = A+(s), Vs2(s)=e, B.28) а Y(t) = (U(t);V(t)) определяется условиями B.23), то последнее заключение теоремы 2.4 означает, что матрица U(t) является неособенной на [s,bo) и верно соотношение V(t)U~1(t) = W(t) на всем этом интервале. С другой стороны, предположим, что решение Ysr(t) = (Usr(t); Vsr(t)) системы A.4м), определяемое условиями B.27) таково, что Vsr(s) сходится к матрице P(s) при г —у Ьо. Пусть Ysbo(t) = (Usbo(t);Vsbo(t)) и Ys2(t) = (US2(t);VS2(t)) являются решени- решениями системы A.4м), определяемые условиями B.19) и B.28), соответственно, и определим Y(t) = (U(t);V(t)) формулами B.23). Поскольку A*(s)Vsr(s) = в при г G (с, Ьо) порождает условие A*(s)P(s) = 0, то отсюда следует справедливость соотношения A*(s)V(s) = в. Более того, поскольку V(s)U~1(s) = P(s)Q*(s), то решение W(t) = VtyU1^) уравнения A.1) удовлетворяет A*(s)W(s) = в и = 6>. Следовательно, если матрица U(t) является неособенной на
254 Гл. 3. Проблемы разрешимости уравнений Риккати (s,bo)j T0 W(t) является решением уравнения A.1) на том же интервале, норма- нормализованное по s. Таким образом, так как верны соотношения Usr(s) = Q(s) и W(s)Usr(s) = P(s)Q*(s)Q(s) = P(s), то из A.19) следует, что F(r, s\W)[V8r(s) - P(s)} = -Q(s) при г е (с, Ьо) B.29) и Vsr(s) — P(s) ~^ @ ПРИ т —> Ьо- Если теперь положить то для ? Е X]+(s) будем иметь 1 = |?| = |Q*(s)?| и из соотношения B.29) по- получаем: 1 = \[V;r(s) - P*(s)]F*(r,s\W)?\ ^ e(r)\F*(r,s\W)?\, где е(г) -> 0 при г —у Ьо. Следовательно, если /л+(г, s) означает минимум выражения \F*(r, s\W)?\ на X]+(sM то А^+(Г58) ~^ °° ПРИ т ~^ ^о и это последнее условие эквивалентно условию E#(r, s\W) -У в при г -у Ьо- Таким образом, мы получаем следующий результат. Теорема 2.4. Предположим, что обе системы A.4^) и B.1) несопряженны на (а, Ьо) *i пусть матрицы A(s), A+(s) w Q(^) определены указанным выше спо- способом при s e (а, Ьо). Тог^а необходимое и достаточное условие существования решения W(t) уравнения A.1) на [s,bo), которое является особым в точке Ьо, состоит в том, что решения Ysbo(t) = (Usbo(t)]Vsbo(t)), Ys2(t) = (Us2(t);Vs2(t)I Y(t) = (?/(?); V(?)) системы A.4М), определяемые условиями B.20), B.28) и B.23), соответственно, причем U(t) является неособенной на [s,bo). Более то- того, в этом случае W§(t) = V(t)U~1(t) удовлетворяет на [s,bo) соотношению F(t,s\Ws) — F(t,s\W) и Ws(t) является единственным особым в точке Ьо реше- решением A.1), удовлетворяющим условиям A*(s)Ws(s) = в, Ws(s)A+(s) = в. Следует отметить, что система A.4^) может быть несопряженной на интер- интервале [а, Ьо), которое не является главным решением в точке Ьо. Такой феномен возможен хотя бы тогда, когда т = п, а система A.4^) является эрмитовой. § 3. 3. Обобщенные системы дифференциальных уравнений и матричные интегральные уравнения Риккати В большей части настоящего параграфа будем предполагать, что задан интер- интервал /, матричные функции А, В, С, и D удовлетворяют следующим условиям A(t) G Lnn[a, Ъ], B{t) e Ща, Ъ], C(t) ? Lmn[a, b], D(t) G Lmm[a,b], M(t) G EVmn[a,b] (Sjr) для произвольного компактного подынтервала из / Отметим, что требования (#') относительно матриц А, С, и D не отличаются от тех, что указаны в A.2). Однако требования к В фактически иные и проявляются в приведенной ниже формуле C.8), основанной на использовании гильбертова пространства. При U(t) e Cnk[a,b], V(t) е Ьш^[а,Ъ], где [а,Ъ] — заданный подынтервал из /, определим интегральный оператор П(с, t\U, V) формулой u(c,t\U,V) = f [C(s)U(s)-D(s)V(s)]ds+ Г [dM(s)]U(s), C.1) J с J с
§ 3.3. Матричные интегральные уравнения Риккати 255 где t Е /, а последний интеграл является интегралом Лебега-Стилтьеса. Будем рассматривать следующее обобщение матричного дифференциального уравнения Г DL![U(t), V(t)] = -dV + [CU - DV] dt + [dM]U = в, \ L2[U(t),V(t)] = U-AU-BV = 0, tel. Решая систему C.2M), определим пару матричных функций (U(t), V(t)), где U(t) e %lnk[a,b], V(t) e EVmk[a,b], на произвольном замкнутом подынтервале [а, Ь] такую, что A(c,t\U(t),V(t)) = -V(t) + Q(c,t\U,V) = -V(t) при (c,t)elxl C.3) и L2[U(t),V(t)] = в на /. Следует заметить, что справедливость C.3) может оказаться эквивалентной существованию со G / и постоянной матрицы Vo Раз~ мерности т х s таких, что A(co,t\U,V) =-Vo при tel. C.30 В частном случае, когда к = 1, система C.2м) сводится к векторной обобщенной системе дифференциальных уравнений Г dLiKt), ?;(?)] = -dv + [Cia - Dv] dt + [сШ> = 0, [ L2[u(t),v(t)] = it - Аи - Bv = 0 при t e I. Если uo и vo — заданные векторы размерностей пит, соответственно, а с G /, то существует единственное решение системы C.2) такое, что и (а) = uo,v(a) = vo и этот результат, очевидно, порождает соответствующую теоре- теорему существования и единственности для системы C.2м)- В силу приведенной ниже теоремы 3.2, это утверждение для системы C.2) является следствием соот- соответствующего факта для системы обыкновенных дифференциальных уравнений. Это утверждение можно также установить из существования и единственности решения интегрального уравнения Лебега-Стилтьеса. Пусть, в частности, Uo(t) и Vo(t) являются решениями задач Коши if = A(t)U, U(c) = Еп и V = D(t)V, V(a) = Em, соответственно. Тогда (u(t);v(t)) является решением системы C.2), удовлетворяющим началь- начальным условиям и(а) = щ, v(a) = ^о, в том и только том случае, когда справедливо u(t) = Uo(t)uo(t), v(t) = Vo(t)vo(t), где uo(t) — единственное решение интеграль- интегрального уравнения \ j =ио+ \f B0(s)ds\v0+ j B0(s)(f [dM0(r)]i/0(r) j ds, C.4) rt a vo(t) = vo + [dMo(s)]uo(s), где обозначены B0(t) = U^~1(t)B(t)Vo(t) и J с M0(t)= f Vo-1(t)C(t)Uo(t)dt+ f V0-1(s)[dM(s)]U0(s). J с J с Через V[a, b], где [a, b] — замкнутый подынтервал из /, будем обозначать класс векторных функций rj(t) G 2ln[a, Ь], для каждой из которых существует соответ- соответствующая функция ((t) G L^[a,b] такая, что L2[f](t)X(t)] = 0 на [a, b] и такая ассоциация rj(t) и ((?) обозначается соотношением rj(t) G V[a,b] : С-
256 Гл. 3. Проблемы разрешимости уравнений Риккати Подкласс векторных функций из V[a,b], которые удовлетворяют условиям rj(a) = rj(b) = 0, будем обозначать через Т>о[а,Ь] и использовать соответствующее обозначение rj(t) G Vo[a,b] : ((t) для ассоциированных вектор-функций. Ана- Аналогично через ?>_|_[а, Ь] обозначается класс вектор-функций p(t) G 2lm[a, Ь], для каждой из которых существует ассоциированная вектор-функция a{t) G L^[a,b] такая, что верно L+[p(t),a(t)] = p(t) - D*(t)p(t) - B*(t)a(t) = в на [a, b] и 2)_1_0[а, b] = {р | р G 1)-|_[а, Ь], ^(а) = ^о(Ь) = 0}. И, наконец, положим J[ri,t;p,<T] = J[ri,t;p,<T\a,b] = = f {v*(t)B(t)at)+p*(t)C(tMt)}dt+ [ p*(t)[dM(t)]<n(t) C.5) J a J a при (r](t)X(t)) G 2ln[a, b] x L^[a, Ь] и (p(t),a(t)) G 2lm[a, Ь] х L^[a, Ь]. В этих обозначениях мы имеем следующий результат. Теорема 3.1. Если [a,b] G / и (u(t),v(t)) G Cn[a,b] x L^a^b], mo следующие два условия эквивалентны (а) J[u,v;p, а] = 0 при р G Т>+0[а, Ь] : сг; (б) существует постоянный вектор 7 м вектор-функция C.6) г?о(?) G i?Vm[a,6] такие, что B(t)[v(t) — vo(t)] = 0 на [a,b] и A[a, *|гх, г;0] =7 при t e [а, Ь]. Доказательство. Если (u(t),v(t)) G Cn[a,6] x L^[a,Ь] и выполняется условие ) из C.6), то р G Р+0[а,6] : а мы имеем J[u,v;p,<r)= / J a = 0, так что (а) из C.6) выполняется. Обратно, если (u(t),v(t)) G Cn[a,b] x L^a^b] и выполняется условие (а) из C.6) при w(t) = Ct(a,t\u,v) имеем u(t) G EVm[a,b] и если р G ?>+0[а, Ь], то 0= / {p*(t)v(t)+p*(t)dw(t)} = = p*(t)w(t)t=b+ [ p*(t)[v(t)-w(t)]dt= f p(t)[v(t)-w(t)]dt. t=a Ja Ja Если Y(t) является решением задачи Коши Y(t) = D*(t)Y(t), Y(a) = Ym-> to (p,a(t)) G Лш[о,6] x Ь^[а,Ь] с L2~[^(t), cr(t)] = 0 на [a, b] и p(a) = 0, если и только если rb p(t) = - / F^F-1^)^*^)^^)^ при t G [a, b]. C.8) Ja Следовательно, p(t) G P+0[a,6] : cr(t), если и только если a(t) G L^[a, Ь], удовлетворяет условию C.8) и f J a Y-1(s)B*(s)a(s)ds = 0. C.9) Вектор-функция F = и - v является такой, что /(?) G L^Ja, Ь] и из соотношений
§ 3.3. Матричные интегральные уравнения Риккати 257 C.7)-C.9) следует, что если р Е V+0[a,b] : а, то следующая вектор-функция rt g(t) = -F*^) / Y*(s)D(s)f(s) ds + f(t) такова, что д е ?^[a, b] и Ja rb / <r*(t)B(t)g(t)dt = Q, C.10) J a rb если cr(t) e L2n[a,b] и / a*(tM(t)F* (?) d? = 0. Из условия C.10) следует существование постоянного m-мерного вектора Л такого, что B(t)g(t) = B(t)Y*~1(t)X. Поэтому h(t) = B(t)Y*~1(t)X таково, что e Ь2ш[а,Ь], B(t)h(t) = 0 на [а, Ь] и s)D(s)/(s)^ = /i(t)+F*-1(t) C.11) при t G [a, 6]. Это означает, что f(t) определяется как решение векторного ин- dY*(s) тегрального уравнения C.11) с ядром Y*~1(t)Y*(s)D(s) = Y~1(t) , опре- ds деленном при s,t G [a, b]. Можно проверить непосредственно, что резольвентой этого матричного ядра является —D(s) при s,t G [a, b] и, значит, справедливо со- rt отношение/(?) = /i(t)+ F*(t)A+ / D(s)[ft(s) -У*(в)А] (is, t G [a, Ь]. Так как «/a dY*~1(t) D(t)F*~1(t) = , то отсюда следует, что v(t) — w(t) = f(t) удовлетво- CLV rt ряет уравнению v(t) - w(t) = h(t) + / D(s)h(s)ds + 7, где 7 = -У*-1(а)А. J a Следовательно, если вектор-функция vo(t) определяется следующей формулой vo(t) =w(t)+ Г D(s)h(s)ds--y,te [a,b], то vo(t) e EVm[a,b],B(t)[v(t)-v0(t)] =0 J a на [a, b] и ft vo(t) = П(а, t|ix, v) + I D(s)h(s) ds — 7 = П(а, t|ix, г; — h) — 7 = П(а, t|ix, г?о) — 7- «/a Из последнего соотношения следует, что Д[а, ?|г&,17о] = 7? что и доказывает тео- теорему. Как непосредственное следствие результатов предыдущей теоремы имеем те- теорему существования решения системы C.2), которую можно сформулировать следующим образом. Теорема 3.2. Если u(t) E 2ln[a, Ь], то вектор-функция v(t), обладающая тем свойством, что (u(t);v(t)) является решением уравнения C.2), существует тог- тогда и только тогда, когда существует вектор-функция v\(t) такая, что справед- справедливы соотношения и G V[a,b] : v\ и Z[u,v\\p, а] = 0 при р G U+0[a,b] : a. Если (г],ф)) е ате[а,Ь] х Ь2ш[а,Ь] и (p(t),a(t)) G 2lm[a,b] x L2n[a,b], то Ш(;р^} = I {<r*(t)B(t)t(t) - ^й p*(t)M(t)ri(t)\t=b C.12)
258 Гл. 3. Проблемы разрешимости уравнений Риккати и, следовательно, если r\ Е V[a,b] : ?, а р Е ?>+0[а, Ь] : сг, то справедливо соотно- соотношение = / {(a-M*p)*B((;-Mr})+p*[C-DM-Ma-MBM]rj}dt. C.13) Введем обозначения А = А + ВМ, В = В, C.14) С = С - DM -MA- MBM, D = D + MB, и определим как V[a,b], Т>0[а,Ь], ?>+[а, Ь], ?>+0[а, Ь] определенные выше классы V[a,b], T>o[a,b], ?>+[а, Ь], ?>+0[а, Ь], когда матричные функции А(?), B(t), C(t) и ?>(?) заменены на A(t), B(t), C(t) и D(t). Легко показать, что т] G V[a,b] : ? или т] G ?>о[я?Ь] : С? если и только если функция ? = ? — М77 является такой, что 77 G V[a,b] : ? или 77 G Х>о[я?Ь] : ?• Аналогично, р G Р+[а,6] : сг или р G P+ о [а, Ь] : а в том и только том случае, когда функция a(t) = a(t) - M+(t)p(t) такова, что p(t) G T>+[a,b] : a(t) или P^0[fl,4:a(t). Более того, если и G ?>[а, Ь] : г;, то скалярное произведение (u,v) = (u,v — Mv) таково, что и G P[a, b] :v и условие C.6а) выполняется, если и только если = «/а = O при р eV^0[a,b] : д. C.15) Таким образом, вычисляя по частям интеграл / [dM(s)]U(s) в соотношении J а C.1), получаем результат, который можно сформулировать следующим образом. Теорема 3.3. Вектор-функция (u(t);v(t)) является решением системы C.2), если и только если присоединенная вектор-функция (u(t);v(t)) = (u(t);v(t) - M(t)u(t)) локально абсолютно непрерывна на I и является при t G / решением системы обыкновенных дифференциальных уравнений ~ ~ (ЗЛ6) _ A{t)u(t) - B(t)v(t) = 0. at Следует подчеркнуть, что для того чтобы система C.16) была определена и имела коэффициенты, заданные формулами C.14), которые удовлетворяют усло- условиям A.2) и (#')? необходимо, чтобы матрица M(t) имела локально ограниченную вариацию на /. В частности, коэффициенты C.16) удовлетворяют условиям A.2) и (#')? если матричные функции A(t), B(t), C(t) и D(t) удовлетворяют тем же со- соответствующим условиям ( A.2) или (#')) и M(t) G Ь^п[а,Ь] для произвольного замкнутого отрезка [а, Ь] С /. Для матричных функций A(t), B(t), C(t), D(t) и M(t), удовлетворяющих уело-
§ 3.3. Матричные интегральные уравнения Риккати 259 виям (#'), обобщенная векторная система дифференциальных уравнений Г dL+[u(?), v(?)] =~dv + [C*u - A*v] dt + [dM*]u = 0, \ L+[u(?),v(?)] =u-L>*u-?*v = 0 при t G / называется присоединенной к C.2). В соответствии с приведенными выше обозначениями fi+(c, t|u,v) и А+(с, ?|u,v) определяются формулами П+(с,*|и, v) = J\c*(s)u(s) - A*(s)v(s)] ds + J[dM*(s)]u(s), является таким, что В частности, система C.17) получается из C.2) заменой А, В, С, D и М на D*, В*, С*, А* и М*, соответственно, так, что система C.2) является присоединен- присоединенной к C.17) в смысле введенного определения. При такой замене классы V[a,b] и Vo[a,b] в случае замкнутого отрезка [а,Ь] преобразуются в классы V+[a,b] и U+0[a,b], соответственно. Более того, для (??(?), ?(?)) G Cn[a,b] x L^a^] и {p{t),a{t)) G Crn[a,b] x L^[a,b] функционал rb C.18) a, b] и Д_|_ [/о, сг; 77, С1а? Ч комплексно сопряжены. Следовательно, результаты для системы C.17), соответствующие теоремам 3.1, 3.2 и 3.3, сформулированные для системы C.2), могут быть установлены в терминах функционала %[г], ?; р, а] = %[г], ?; р, а\а, Ь], определенного в C.5). Теорема 3.4. Если [а,Ь] с I и (u(t),v(t)) G Cm[a,b] x L^[a,b], то следующие два условия эквивалентны ' (а) Д[?7, С; U5v] = 0 72/ж ?7 G Vq [a, b] : ?; существует постоянный вектор 7+ ^ вектор-функция vo(t) ограниченной вариации на [а,Ь] такие, что Д+[а,?|и, vo] = 7+ u ?+(?)[v(?) - vo(t)] = 0 при t G [a,b]. Теорема 3.5. Если u(t) G 2lm[a,6], mo вектор-функция v(t) такова, что (u(t);v(t)) —решение системы C.17), существует, тогда и только тогда, когда существует вектор-функция vi(t) такая, что справедливо u(t) G D+[a,6] : vi, sJ[r], С; u, vi] =0 при r\ G T>o [a, b] : (. Теорема 3.6. Вектор-функция y(t) = (u(t);v(t)) является решением систе- системы уравнений C.17) в том и только том случае, когда присоединенная вектор- функция y(t) = (u(t);v(t)) = (u(t);v(t) — M*(t)u(t)) локально абсолютно непре- непрерывна на I и является при t G / решением системы векторных дифференциальных уравнений C.20)
260 Гл. 3. Проблемы разрешимости уравнений Риккати Следствие 3.1. Если y(t) = (u(t);v(t)) и y(t) = (u(t);v(t)) — решения урав- уравнений C.2) и C.17), соответственно, то v*(t)u(t) — u*(t)v(t) = const на [a,b]. Чрезвычайно важным для изучения свойств решений уравнений C.2) и C.17) является результат, приведенный в следующей теореме. Теорема 3.7. Предположим, что [а,Ь] С /, Я„[а,Ь] х L2m[a,b], (p(t);a(t)) G Ят[а,Ь] х ^[а,Ь] и существуют функции (U(t);V(t)) G Япр[а,Ь] х L^p[o,b], (U(t); V(t)) G Ягод[а,Ь] x L*g[a,b] u h(t) G 2lp[a,6], &(t) G %[a,b] такие, что t](t) = V(t)h(t) и p(t) = V(t)k(t) на C.21) Тогда при а ^ с < d ^ b значение функционала с равно каждому из следующих выражений \(сг- Vfc)*B(C - Bh) - (L+ - 2[р, a])*Vh k*V*(L2[U, V]h - L2[ri, С]) d C.22) {(a-Vh)*B(a-Vh)-k*V*L2[ri,C] + +[U, V]}* - {/+[^,a]Y)Vh + fe*(U*y - V*t//i)} dt d C.23) Доказательство. Тот факт, что 3[/у,С;^5 сг|с, d] определяется соотношением C.22), можно проверить сравнением подынтегральных функций. Заключение о том, что C.21) совпадает с C.23) является следствием заключительного ре- результата, относящегося к функционалу 3+[/я, a; rj, C|c, d] и того, что справедливо соотношение Z[r), С; Р, ^|с, d] = Д+ [р, сг; 77, C|c, d]. Приведенные выше факты при замене k(t) и h(t) произвольными постоянными векторами приводят к следующему важному утверждению. Следствие 3.2. Если [а,Ь] С I и (U(t),V(t)) е %пр[а,Ъ] х L2mp[a,b\, (U(t),V(t)) G Slmg[a,b] x L2nq[a,b\,
§ 3.3. Матричные интегральные уравнения Риккати 261 в то время как L2[U(t),V(t)] = 0 и Z/2~[U(?), V(t)] = 0 на [а, 6], то Z[U,V;U,V\a,t} = - f W(s){dA[a,s\U,V}} + U*l/|*a ; C.24) J a ,V]}) . C.25) *y- v*c/ = В силу теорем 3.3 и 3.6, результаты, относящиеся к системам уравнений C.2) и C.17), эквивалентны соответствующим результатам для систем C.16) и C.20). Если матричные функции А, В, С и D определяются соотношениями C.14) и F(t] W) = C(t) - WA(t) - D(t)W - WB(t)W, C.26) то при [a, b] С / существует матрица W(t) G 21тп[я?Ь], которая является решени- решением матричного дифференциального уравнения Риккати K[W(t)} = -^ - F(t; W{t)) = в C.27) на [а, 6], если и только если существует решение (U(t);V(t)) системы дифферен- дифференциальных уравнений Т C.28) riV(t) —U. _ A(t)U(t) - B(t)V(t) = в с невырожденной на [a, b] матрицей U(t), причем такой, что W(t) = V(t)U~1(t) на этом интервале. В самом деле, в соответствии с замечанием, сделанным после теоремы 3.3, справедливость приведенного выше утверждения не зависит от матрицы M(t), которая должна иметь ограниченную вариацию на [а, Ь], и это утверждение спра- справедливо при следующем очевидном предположении A(t),B(t),C(t),D(t) удовлетворяют предположениям (#')? M(t) e L^n[a,b] произвольного замкнутого (й'о) подынтервала [a, b] С /. Для А, В, С и D, определяемых через А, В, С и D формулами C.14), и F(t; W) = C(t) - WA(t) - D(t)W - WB(t)W C.29) легко можно установить, что если матричные функции W(t) и W(t) удовлетво- удовлетворяют условию W(t) = W(t) - M(t) C.30)
262 Гл. 3. Проблемы разрешимости уравнений Риккати на [а, Ь] С /, то F(t; W(t)) = F(t; W(t)) при t e [a, b]. Следовательно, W(t) являет- является решением уравнения C.27), удовлетворяющим начальному условию W(s) = Ф при s e [a, b], если и только если W(t) = W(t) + M(t) является решением матрич- матричного интегрального уравнения Риккати W(t) - / F(r; W(t)) dr = M(t) + Ф, te [a, b]. C.31) J s Отсюда, в частности, получается следующий результат. Теорема 3.8. Если выполнены условия (#о) и s e [a, b], то матрица Ф размер- размерности тхп такова, что уравнение C.31) имеет решение на [а, Ь], если и только если решение (U(t);V(t)) системы C.28), определяемое начальными условиями U(s) = En, V(s) = Ф, является таким, что матричная функция U(t) не вырож- вырождается на [а,Ь], и в этом случае W(t) = M(t) + V(t)U~1(t). Если M(t) имеет ограниченную вариацию на [а,Ь], то эквивалентное условие существования ре- решения состоит в том,что решение (U(t);V(t)) системы C.2м), определенное начальными условиями U(s) = En, V(s) = M(s) + Ф таково, что U(t) не вырож- вырождается на [а,Ь] и в этом случае W(t) = V(t)U~1(t).
Глава 4 Уравнения Риккати в задачах управления системами с распределенными параметрами В предыдущих главах были рассмотрены различные типы матричных уравне- уравнений Риккати. При этом каждый раз предполагалось, что коэффициентами та- таких уравнений являются также матрицы. Результатом анализа были различные утверждения о существовании решений и их свойствах. Значительное внимание было уделено также практическим методам построения решений таких уравне- уравнений. Эти же вопросы можно рассматривать и в более общей форме, оставаясь в рамках теории матриц и предполагая, что, например, в уравнении Q + АХ + ХВ + ХПХ = 0, A) где А и 1Z — линейные операторы, отображающие матрицы в матрицы, а X, Q и В - матрицы. Иначе говоря, представляет определенный интерес изучение опе- операторных уравнений Риккати в конечномерных пространствах. Следующий шаг на пути обобщения изложенных выше результатов состоит в том, что уравнение A) рассматривается в банаховой алгебре. Такие уравнения представляют не только теоретический интерес. В частнос- частности, операторные уравнения встречаются при решении различных задач в теории управления системами с распределенными параметрами (см., например, [2, 10, 28]). В этой главе анализируются различные прикладные задачи, которые при- приводят к уравнениям Риккати в бесконечномерных пространствах. В каждом конкретном случае описывается способ получения таких уравнений. Отмечают- Отмечаются различные их особенности. Однако этим все и ограничивается. Исследование полученных уравнений (существование решений, их свойства и т. д.) не приво- приводится. Нет также конкретных рекомендаций по классификации таких уравнений (например, с помощью группового анализа). Вместе с тем, приведенные в первой главе сведения из теории банаховых алгебр и групп Ли могут служить базой для изучения этого круга проблем. § 4.1. Уравнения Риккати в математической физике Анализ рассматриваемых здесь проблем начнем с описания тех краевых задач для уравнений математической физики, которые в терминах функционального анализа можно рассматривать как операторные уравнения Риккати. В ряде слу- случаев для описания таких задач можно использовать аппарат банаховых алгебр В (см. § 1.4). При этом зачастую в качестве элементов В целесообразно брать линейные операторы, определяемые краевыми задачами математической физи- физики. Поэтому сначала напомним некоторые определения и факты из теории опе- операторов, относящиеся к уравнениям математической физики и необходимые в
264 Гл. 4. Бесконечномерные уравнения Риккати дальнейшем как при рассмотрении теоретических вопросов, так и, особенно, при анализе различных примеров. 1. Краевые задачи и операторы. Начнем с описания процессов, в которых искомые величины не изменяются с течением времени. Характеризующие их функции зависят только от пространственных координат. В линейном прибли- приближении такие процессы можно обычно описать уравнениями эллиптического типа с граничными условиями первого, второго или третьего рода. Простейшим из таких уравнений является уравнение Лапласа относительно функции u(x,y,z) д2и д2и д2и л , ч ^ Типичные граничные условия для него имеют вид u\s = f(x,y,z) (условие Дирихле), A.2) = f(x,y,z) (условие Неймана), A-3) du dn s du -—\- аи an = f(x,y,z) (условие третьего рода), A.4) 5 в которых S — граница области G, а функция / характеризует влияние внешней среды на рассматриваемый процесс. В других случаях уравнение и граничные условия могут быть более сложными. Уравнения могут быть более высокого порядка, как это имеет место при описании изгиба пластин и балок. Изгиб пластины можно описать уравнением четвертого порядка A2u = f(x,y), (x,y) eD, A.5) где А - оператор Лапласа, и(х,у) — величина прогиба пластины в точке (х,у). Если при этом края пластины жестко закреплены, то этот факт математически определяется граничными условиями ди ди и(х,у) = — = — = 0 при (ж,2/) G S, A.6) ох оу где S — граница области D. Если края пластины свободно оперты, то вместо A.6) следует брать граничные условия СУ11 и = 0, Аи + а—=0 при (х,у) е 5, A.7) где а — некоторая постоянная, a v — внешняя к D нормаль в точке (х,у) G S. В более сложных ситуациях процесс удобно описать краевыми задачами для систем уравнений в частных производных. Однако, пока эти случаи рассматри- рассматривать не будем. С каждой краевой задачей математической физики можно связать некоторый оператор —«оператор краевой задачи», действующий в подходящем функциональ- функциональном пространстве. Этот оператор выбирается так, чтобы краевую задачу можно было бы записать в виде одного уравнения Ли = /, A.8) где Л — оператор краевой задачи, и и / — элементы выбранного функционального
§ 4.1. Уравнения Риккати в математической физике 265 пространства. Наиболее просто эту процедуру получения уравнения A.8) можно выполнить для краевой задачи1 -Au = f(P), PeD, A.9) u(P)\s = 0. A.10) Здесь D — область в n-мерном евклидовом пространстве, Р — переменная точка этой области, a S — ее граница. Заданная функция f(P) предполагается непре- непрерывной в замкнутой области D = D + S. Введем в рассмотрение пространство непрерывных функций2 C(D). Очевидно, что функция f(P) принадлежит этому пространству. Будем также предполагать, что этому же пространству принадлежит искомое решение краевой задачи A.9), A.10). Обозначим через М множество функций из L2(D), обладающих следую- следующими свойствами: 1) они непрерывны в D вместе со своими первыми и вторыми производными; 2) они обращаются в нуль на границе S. На множестве М зададим оператор Л, определяемый формулой Аи = -Аи. A.11) Ясно, что задачу A.9), A.10) можно записать в виде A.8). Аналогично можно строить операторы и выписывать соответствующие опера- операторные уравнения для других краевых задач, если их краевые условия однород- однородны. В случае неоднородных краевых условий эта процедура несколько усложня- усложняется. Один из путей использования операторного представления краевой зада- задачи в этом случае основан на том, что сначала ищется функция ср°(Р), которая определена и непрерывна на D, внутри области D имеет непрерывные вторые производные, а на границе S удовлетворяет неоднородному граничному условию рассматриваемой краевой задачи. Например, если речь идет об уравнении A.9) (при п = 3) с краевым условием A.2), то эта вспомогательная функция (р°(Р) должна обладать таким свойством: (р°(Р) = f(P) при Р е S. Вводя затем замену переменной v = и - (р°(Р), при- приходим к тому, что функция v должна удовлетворять однородной краевой задаче A.9)—A.10), которую можно представить в виде операторного уравнения A.11). В других случаях операторное представление A.11) неоднородной краевой за- задачи (с неоднородным граничным условием) можно получить иным способом. Однако, сейчас для нас эти детали не представляют особого интереса. Важен лишь сам факт, что краевой задаче можно поставить в соответствие некото- некоторое функциональное пространство и определенный на нем оператор, с помощью которых краевая задача представляется в виде операторного уравнения A.11). Знак минус перед оператором Лапласа, очевидно, не имеет принципиального зна- значения. Однако, его обычно пишут для того, чтобы получаемый при этом оператор А был положительным в том смысле, в каком это определяется вариационными методами математической физики. В рассматриваемой ситуации выбор пространства непрерывных функций не явля- является принципиальным. Вместо него можно взять LP(D) или какое-либо другое про- пространство функций. Однако, в дальнейшем при рассмотрении уравнения Риккати в функциональных пространствах базовое пространство должно быть банаховой алгеброй.
266 Гл. 4. Бесконечномерные уравнения Риккати Пример 1.1. Рассмотрим обыкновенное дифференциальное уравнение ~ix и^Э+г^и=-^ а < х < ъ' ^*12^ с краевыми условиями {аи'(а) -/Зи(а) = к, \1 [ ' } где а, /3, j и S, к и I — постоянные. Сначала определяем функцию ip° (х) удовлетворяющую неоднородным гранич- граничным условиям A.13). Считая, что аб + /З7 Ф О, в качестве ip°(x) берем полином Чр{х) = px + q. A.14) Подставляя этот полином в условия A.13), получаем систему уравнений относи- относительно коэффициентов р и q. Ее определитель отличен от нуля. Поэтому функция A.14) определяется однозначно. Теперь вводим замену v = u-ip°(x). A.15) В результате вместо A.12)—A.13) получаем краевую задачу Uv'(a)-/3v(a)=0, \ 7«'(Ь) + Sv{b) = 0, где Ых) = f(x) - г(х)<р°(х) - ? (р(^)^^) ¦ A-18) Теперь вводим множество М дважды непрерывно дифференцируемых при а < х < Ъ и непрерывных при а ^ х ^ Ъ функций, удовлетворяющих одно- однородным условиям A.17). На этом множестве определяем оператор Л следующим соотношением Av = —-г\р(х)— ) +r(x)v. Тогда краевая задача A.16)—A.17) ах \ ах J может быть представлена в виде операторного уравнения A.8). Завершая анализ стационарных процессов математической физики, отметим, что описывая его операторным уравнением вида A.8), мы считаем, что в нем и является элементом того или иного функционального пространства. Этот факт определяет совершенно естественный переход к операторному описанию неста- нестационарных процессов. Если процесс нестационарный, т.е. функция u(t,P), характеризующая состо- состояние системы (объекта), зависит от времени ?, то операторное уравнение полу- получается дифференциальным. Для определенности рассмотрим краевую задачу ^ = (p(x)^)+r(x)u + f(t,x), 0<t<T, a<x<b, A.19) at ox \ ox J ^^ ^Ml )=Mt), A-20)
§ 4.1. Уравнения Риккати в математической физике 267 в которой а, C, ^ и S — постоянные, удовлетворяющие условию аб + /З7 Ф О, а функции /(?,ж), ip°(t) и ^i(t) заданы и непрерывны. Сначала определяем аб- абстрактные функции u = u(t) со значениями в L/2(a,b). Выбираем, далее, ска- скалярную функцию ip°(t,x), удовлетворяющую неоднородным граничным услови- условиям A.20). Ее можно однозначно определить в виде cp°(t,x) = p(t)x + q(t), где p(t) и q(t) получаются непосредственной подстановкой cp°(t,x) в краевые усло- условия A.20). Эту функцию можно рассматривать как абстрактную функцию u°(t), принимающую значения в пространстве L2(a,b). Затем так же, как и в примере 1.1, введем множество М функций w(x), непрерывных на отрезке а ^ х ^ b и дважды непрерывно дифференцируемых на интервале а < х < Ь. Кроме того, требуется, чтобы эти функции w(x) удовлетворяли однородным гранич- граничным условиям A.17). На функциях w(x) e M определим оператор Л, положив d Aw = —— p(x)—— + r(x)w. dx \ dx J Множество М будем рассматривать как область значений абстрактных функ- функций u°(t). Их совокупность обозначим через Mf. Решение исходной краевой задачи A.19)—A.20) определяет абстрактную функцию u(t). Тогда, очевидно, что функция v(t), определяемая формулой v(t) =u(t) -u°(t) A.21) принадлежит множеству Mf. Отсюда следует, что уравнение di = Av + f{t) A.22) является операторным представлением краевой задачи для уравнения A.19) с однородными граничными условиями /-, Решив уравнение A.22) и воспользовавшись формулой A.21), находим аб- абстрактную функцию u(t), соответствующую решению исходной краевой задачи A.19)—A.21) с неоднородными граничными условиями. Приведенные рассуждения показывают, что операторное дифференциальное уравнение ставится в соответствие нестационарному процессу, описываемому краевой задачей для уравнения в частных производных лишь с однородными граничными условиями. 2. Операторное уравнение Риккати в математической физике. Ана- Анализ различных типов уравнений Риккати в математической физике начнем с того, что выпишем общее уравнение такого типа в произвольной банаховой ал- алгебре В. Пусть Q — некоторый элемент из В, а Л, В и 1Z — линейные (ограничен- (ограниченные или неограниченные) операторы, действующие из В в В, с общей областью определения. Тогда стационарное (алгебраическое) уравнение Риккати можно
268 Гл. 4. Бесконечномерные уравнения Риккати записать в виде Q + AX + ХПХ = <9, A.24) где в — нулевой элемент алгебры В. В том случае, когда оператор В является элементом алгебры В3, вместо урав- уравнения A.24) получаем более общую форму уравнения Риккати Q + АХ + ХВ + ХПХ = 0. A.25) Если банахова алгебра В является пространством значений абстрактных функ- функций X(t), то можно выписать дифференциальное уравнение Риккати ^ = Q{t) + A(t)X + XB(t) + XU(t)X. A.26) Пример 1.2. В качестве банаховой алгебры возьмем пространство С(а,Ь) функций ср(х), непрерывных на отрезке [а, Ь]. На этих функциях определим ин- тегральный оператор Kip = / K(s,a)cp(a) da, где ядро K(s,a) предполагается J а непрерывным при а ^ s,a ^ Ъ. Тогда интегро-дифференциальное уравнение dx(t,s) dt rb = q(t, s) + a(t, s)x(t, s) + x(t, s) / K(t, a)x(t, a) da A.27) J a можно рассматривать как операторное уравнение Риккати. Для этого нужно ввести абстрактные функции X(t) со значениями в С (а, Ь). Это означает, что при каждом конкретном значении t = г х(т) представляет собой некоторую функцию (p(s) e С (а, Ь). Аналогично определяем абстрактную функцию Q(t) со значениями q(t,s) при каждом значении t G [а, Ь] и функцию A(t) со значениями a(t,s). При этом A(t) можно рассматривать как оператор A(t). В этих обозначениях уравнение A.27) можно представить в виде ^J = Q(t) + A(t)X + XKX, A.28) at в котором оператор /С не зависит от времени t. Пример 1.3. Пусть заданы непрерывные на отрезке 0 ^ t ^ Г функции Qij(t)i alJ/W' Hi(t) и r^z(t),i, j, k,l = l,...,n. Соотношениями yij ijj = l,...,n, определяются операторы Д(?), >B(t), отобража- ющие матрицы X = {ж^/} в матрицы Y = {^//с/} и Z = {^j}, соответственно. Если теперь ввести абстрактные функции x(t) со значениями на матрицах X, то систему уравнений при г, j = 1,..., п, q=l kl 3Именно это имеет место при рассмотрении матричного уравнения Риккати.
§ 4.2. Краевая задача Риккати в управляемых системах 269 можно представить в виде операторного дифференциального уравнения х = Q(t) + A(t)x + xB(t) + xll(t)x. A.29) Пример 1.4. Рассмотрим краевую задачу для нелинейного уравнения тепло- теплопроводности ди д и D(t)+(t) + f(t) 0<<1 «>0 =D(t)u^+a(x,t)u + f(t,s), 0<ж<1, «>0, A.30) Qft^0)_^(t>0) = 0> 7^i)+MM) = o. A.31) Введем множество М дважды непрерывно дифференцируемых функций ip(x), 0 < х < 1, удовлетворяющих однородным граничным условиям A.31). На этих функциях определяем для 0 < х < 1, t > 0, следующие линейные операторы ^ A(t)ip = a(t,x)ip. Введем теперь абстрактные функции и = u(t) со значениями на М. Тогда краевую задачу A.30)—A.31) можно представить в виде операторного дифферен- (jil циального уравнения Риккати — = u7Z(t)u + A(t)u + f(t), где /(?) — абстрактная OjL функция, принимающая значение f(t,x) при каждом конкретном t,t > 0. § 4.2. Краевая задача Риккати в управляемых системах с распределенными параметрами Изучая матричные уравнения Риккати, мы отмечали различные прикладные задачи, при исследовании которых приходится рассматривать такие уравнения. Там же особо отмечалось, что они встречаются при исследовании многих задач теории управления для систем, поведение которых можно описать обыкновенны- обыкновенными дифференциальными уравнениями (см.§ 2.10). В этой главе будем рассматри- рассматривать аналогичные прикладные задачи теории управления, но для так называемых систем с распределенными параметрами. В системах этого типа процессы описы- описываются дифференциально-разностными уравнениями, бесконечными системами обыкновенных дифференциальных уравнений или краевыми задачами для урав- уравнений с частными производными (см., например, [10, 25, 28]). Используя представления краевых задач для уравнений математической физи- физики в виде операторных уравнений, можно применять аппарат функционального анализа и для постановки, и для решения различных задач теории управления, ис- исходя непосредственно из операторного уравнения, описывающего поведение сис- системы. Однако, можно идти классическим путем, формулируя и решая задачу в терминах теории краевых задач для уравнений математической физики. Каж- Каждый из этих способов имеет свои достоинства и слабые стороны. Поэтому здесь рассмотрим оба способа, по крайней мере, при анализе некоторых из задач. 1. Задачи об оптимальном распределенном управлении. Рассмотрим управляемый процесс, который описывается уравнением ди д2и +p(t,x), 0<t<T, 0<х<1, B.1)
270 Гл. 4. Бесконечномерные уравнения Риккати с краевыми условиями ф= MM) 0< a = const>0. B.2) ОХ ОХ Здесь р(?, x) — управление. Рассматриваемая здесь задача об оптимальном управлении состоит в следующем. Среди всех функций p(t,x) е L2(Q), Q = {(t,x) : 0 < t < T,0 < x < 1} тре- требуется найти такую, чтобы на этой функции и соответствующем ей решении u(t,x) уравнения B.1) с граничными условиями B.2) и начальным условием и@,х) =?°(х) B.3) с произвольной функцией ip°(x) функционал J[p] = Г и2(Т,х) dx + pff p2(t,x) dxdt, /3 = const > 0, B.4) io J Jq достигал бы своего наименьшего возможного значения.4 Эта задача является модельной. Однако, способы ее решения, основанные на использовании метода динамического программирования или принципа максиму- максимума, являются достаточно универсальными, чтобы исследовать различные более общие, в том числе и прикладные задачи (см., например, [10]). Оптимальное управление будем строить методом динамического программи- программирования. Для его использования вводится вспомогательный функционал S[t,u] = mini u2(T,x)dx + f3 / p2(t,x) dxdt\. B.5) p Uo it io J Как доказывается в теории оптимального управления (см., например, [10], с. 282-286), этот функционал удовлетворяет нелинейному уравнению Беллмана ^ B<б) в котором v(t,x) — градиент функционала B.5). Если это уравнение рассматривать в гильбертовом пространстве 1/2@,1), то градиент dS[t,u] функционала S определен также на 1/2@,1) и является линей- линейным. В соответствии с теоремой Рисса, имеем связь между S(t,u) и v(t,x): dS[t,u;Au]= v(t,x)Au(t,x)dxJ B.7) где Аи — произвольный элемент из L2@,1). Следовательно, уравнение B.6) является нелинейным уравнением в функциональных производных. Непосредственно из определения функционала B.5) следует, что он должен удовлетворять дополнительному условию S[T,x]= Г io = / u2(T,x)dx. B.8) Это наименьшее значение, очевидно, зависит от функции ip (х), входящей в на- начальное условие B.3). Сама же функция ср (х) считается произвольной. Однако, в дальнейшем предполагается, что она удовлетворяет тем минимальным требованиям, при выполнении которых каждому допустимому управлению р = p(t, x) соответствует единственное классическое или обобщенное решение краевой задачи B.1)—B.3).
§ 4.2. Краевая задача Риккати в управляемых системах 271 Тем самым задача об оптимальном управлении сводится к решению задачи B.6), B.8), из которой нужно определить две неизвестные переменные. Одна из них яв- является функцией (это управление p(t,x)), а вторая — функционалом (это S[t,u]). При этом оказывается, что S является вспомогательной переменной. Она не ис- используется в окончательном решении. Интересующее нас уравнение Риккати получается в процессе решения задачи B.6), B.8) следующим образом. Сначала определяем функцию р(?, х) из условия минимума правой части урав- уравнения B.6): p(t,x) = -—v(t,x). B.9) Полученное значение p(t,x) подставляем в уравнение B.6). В итоге приходим к уравнению 2. Интегро-дифференциальная краевая задача Риккати. Решение урав- уравнения B.10) ищем в виде квадратичного функционала S[t,u]= / K(t,x,8)u(t,x)u(t,8)dsdx, B.11) Jo Jo в котором K(t,x,s) — подлежащая определению неизвестная симметричная по х и s, т.е. удовлетворяющая условию K(t,x,s) = K(t,s,x), функция. В соответ- соответствии с определением дифференциала Фреше, из B.11) находим, что dS[t, щ Аи] = 2 / / K(t, ж, s)u(t, s)Au(t, x) ds dx. Jo Jo Сопоставляя это соотношение с B.7) получаем: v(t,x)=2 K(t,x,s)u(t,s)ds. B.12) Подставляя значения 5[t,ix] и v(t,x) из B.11) и B.12) в уравнение B.10), получим соотношение, которое можно привести к виду Г1 Г1Г 11 / / \-Kt(t,x,s) -Kxx(t,x,s) -Kss(t,x,s) + -ifi(?,x,s) x Jo Jo I Pi x u(t,x)u(t,s) dxds + / [Kx(t, l,s) + aK(t, l,s)]u(t,s) ds + + / [Kx (?, ж, 1) + aK(t, ж, 1)] u(t, x) dx - Jo - f [Kx(t,0,s) + Kx(t,x,O)]u(t,s)ds = 0, B.13) Jo е K1(t,xJs)= f K(tJyJs)K(tJxJy)dy. B.14) Jo Равенство B.13) должно выполняться тождественно по переменной и. Поэтому
272 Гл. 4. Бесконечномерные уравнения Риккати из него следует, что ядро K(t,x,s) должно удовлетворять уравнению Kt(t,x,s) + Kxx(t,x,s) + Kss(t,x,s) = -K-i^x.s) B.15) и граничным условиям j Kx(t,0,s) = 0, Kx(t,l,s) + aK(t,l,s)=Q, 0 < ? < Г, 0< s < 1, \кз(Ь,х,0) = 0, ifs(?,x, 1) +aK(t,x, 1) = 0, 0 < ? < Г, 0 < х < 1. Кроме того, из соотношений B.8) и B.11) следует, что K(T,xjS) =S(x-s), B.17) где S(x) — ^-функция Дирака. Полученная задача B.15)—B.17) называется интег- ро-дифференциальной краевой задачей Риккати. Ниже показано, что она может быть представлена в виде операторного дифференциального уравнения Риккати. 3. Задача оптимизации с управляющей функцией, зависящей только от времени. Несколько иная краевая задача Риккати получается при мини- минимизации того же функционала B.4), но при условии, что управляющая функция зависит только от времени, т.е. функция p(t,x) в уравнении B.1) представима в виде p(t,x)=q(x)r(t), B.18) где q{x) — заданная функция, r(t) — управление. В этом случае критерий опти- оптимальности B.4) можно записать в виде f1 fT J[r]= u2(T,x)dx + j r2(t)dt, 7 = const>0. Jo Jo B.19) Применение метода динамического программирования приводит к тому же урав- уравнению Беллмана B.10) с единственным отличием: вместо p(t,x) нужно брать функцию B.18) и минимизацию выполнять по переменной r(t). Следовательно, теперь уравнение Беллмана можно представить в виде dS\t,u] Г 9/ ч , ч Г1 , ч , ч = mm<7r(t)+r(t) / q{x)v(t,x) ax — at r{ Из условия минимума правой части этого уравнения находим, что 1 Г1 r(t) = / q(x)v(t,x)dx B.21) 27 Jo и, следовательно, в этом случае уравнение B.20) можно записать в виде ал \ "? q(x)v(t,x) dx ) . B.22) Кроме того, непосредственно из определения функционала S[t,u] следует, что (см. B.5)) и в этом случае должно выполняться условие B.8). Решение уравнения B.22) будем искать тем же методом, который использо- использовался в предыдущем случае. Положим S[t,x]= / K(t,x,s)u(t,s)u(t,x)dsdx, B.23) Jo Jo
§ 4.2. Краевая задача Риккати в управляемых системах 273 где K(t,x,s) — подлежащая определению, симметричная относительно х и s функция. Вычисляя дифференциал Фреше, находим, что f1 f1 dS[t,u;Au] = 2 / K(t,x,s)u(t,s)Au(t,x) dsdx Jo Jo и, следовательно, градиент v(t,x) функционала B.23) имеет вид v(t,x)=2 K(t,x,s)u(t,s)ds. B.24) Jo Подставляя в уравнение B.22) вместо функции v(t,x) ее значение из B.24) и приравнивая в полученном соотношении коэффициенты при одинаковых степенях u(t,x), получим уравнение dK(t,x,s) d2K(t,x,s) d2K(t,x,s) 1 + + = 7 х (' ' } ( } и граничные условия dK(t,0,s) dK(t,l,s) = о = о Ь аЛЦ*, ж, 1) = О, as os где i^i(?,x,s) = K(t,x,y)K(t,z,s)q(y)q(z)dydz. Из B.8) и B.23) следует, Jo Jo что выполняется «начальное» условие K(T,x,s) =5(x-s). B.27) Поэтому интегро-дифференциальная краевая задача Риккати B.25)-B.27) не- несколько отличается от задачи Риккати в случае произвольных управлений вида р = p(t, x). Однако, это незначительное отличие приводит к тому, что появляются значительные сложности при ее решении. Здесь мы рассмотрели две задачи об оптимальном управлении процессом, ког- когда он описывается краевой задачей для уравнения теплопроводности, причем управляющая функция входит в уравнение. Аналогичным образом можно по- получить краевые задачи Риккати, когда процесс управляется по границе, т. е. когда управляющая функция входит в граничные условия. В результате полу- получатся краевые задачи Риккати с некоторыми иными свойствами. Можно также рассмотреть управляемые процессы с распределенными параметрами, которые описываются уравнениями иного типа ( например, волновым уравнением) или системой уравнений. В каждом случае получится своя краевая задача Риккати (см., например, [10]). 4. Бесконечные системы дифференциальных уравнений Риккати. Полученные краевые задачи Риккати можно решать различными методами. Оста- Остановимся лишь на одном из них. С его помощью краевая задача сводится к бес- бесконечной системе дифференциальных уравнений Риккати. Пусть {Хп(х)}, {Хп} — полная ортонормированная система собственных функ- функций и собственных значений задачи Штурма-Лиувилля Х"{х) + Х2Х(х) = 0, 0 < х < 1, Х'@) = Х'A) + аХ(\) = 0. B.28)
274 Гл. 4. Бесконечномерные уравнения Риккати Нетрудно показать, что числа Лп, п = 1,2,..., являются положительными кор- корнями трансцендентного уравнения Xtg X = а и поэтому обладают свойством Т П 1 lim — = 1. п—юо П7Г B.29) Jo B.30) B.31) Собственные функции Хп(х), очевидно, удовлетворяют условию rl ( 1 при п = т, /о к 0 при пфт. Ядро K(t,x,s) будем искать в виде оо K(t,x,s)= ^2 Knrn(t)Xn(x)Xrn(s). n,m=l Сначала будем решать уравнение B.15) с «начальным» условием B.17). Ядро B.31), очевидно, удовлетворяет граничным условиям B.16). Так как Хп(х) является собственной функцией задачи Штурма-Лиувилля, соответствую- соответствующей ее собственному значению Ап, то непосредственная подстановка ряда B.31) в уравнение B.15) приводит к бесконечной системе дифференциальных уравнений Риккати n(t), n,m,= 1,2,... B.32) at p Из условияB.17) следует, что при п = т, 0 при п ф т, п,?тг = 1, 2,... Если ввести обозначения (\\ 0 ... О О \Ъ ... О А = О О \ 7 К = An Ai2 if 21 if 22 if in .-A ^nl кп2 \ то уравнения B.32) можно переписать в виде K(t) = AK(t) + K(t)A + ^K2 (t). B.33) B.34) B.35) Это уравнение является уравнением Риккати относительно бесконечномерной матрицы K(t). Условие B.33), очевидно, можно записать в виде if (Г) = Е, B.36) где Е — бесконечномерная матрица тождественного преобразования. Аналогично решаем уравнение B.35). Подставляем ряд B.31) в обе части этого уравнения и, приравнивая коэффициенты при одинаковых Хп(х)Хт(х) в обеих частях полученного равенства, приходим к следующей бесконечной системе диф- дифференциальных уравнений Риккати: Knrn{t) = 1 \2шКпш + - 7 5Z 7 ij = п,т = 1,2,..., B.37)
§ 4.2. Краевая задача Риккати в управляемых системах где qn = / q(x)Xn(x)dx. Jo Если теперь в дополнение к матрицам К и Л ввести еще и матрицу 275 #11 #12 #21 #22 #ln #2n #nl #n2 #nn \ 7 — QnQrm то систему уравнений B.37) можно переписать в матричной форме следующим образом: B.38) 1 K(t) = AK(t) + K(t)A + -K(t)QK(t), 0 < t < Г. При этом решение должно удовлетворять условию К{Т) = Е, B.39) в котором Е — бесконечномерная единичная матрица. Очевидно, что уравнение B.35) является частным случаем уравнения B.38). Если к обеим частям уравнения B.38) применить операцию транспонирова- транспонирования, то оно перейдет само в себя. Поэтому если матрица K(t) является решением уравнения B.38) с начальным условием B.39), то K*(t) — также решение той же задачи B.38), B.39). В силу теоремы единственности, отсюда следует, что K*(t) = K(t), т.е. решением задачи B.38), B.39) является симметричная мат- матрица. Используя результаты решения матричных уравнений Риккати, изложенные в предыдущей главе (см. § 2.6), можно строить приближенные решения полу- полученных бесконечномерных уравнений B.35) и B.38), ограничиваясь конечным числом слагаемых в представлении B.31). Если предполагать, что приближения берутся в виде5 к12 К2\ К22 K1N О K2N О \ к N1 к N2 KNN О о о \ то для определения TV-го приближения вновь получаем уравнение Риккати. В частности, если решается уравнение B.35), то получаем уравнение NKN KN(t) = ANK KNAN B.40) Матрицу К (t) целесообразно брать бесконечномерной, чтобы удобно было сравни- сравнивать ее с исходной бесконечномерной матрицей K(t).
276 Гл. 4. Бесконечномерные уравнения Риккати где (Я 0 0 0 V ... 0 . Al . 0 . 0 . .. 0 .. 0 • • Ajy .. 0 0 .. 0 .. 0 .. 0 .. AN = Вместо начального условия B.39) теперь должно выполняться условие KN(T) = EN, где EN = / Уравнение B.40) можно рассматривать как уравнение Риккати вида ^> дг ^ дг ^ дг ^ J. ^ дг дг ^ дг dt ~ + + ~в B.41) A 0 0 0 0 1 0 0 ... 0 ... 0 ... 1 ... 0 0 .. 0 .. 0 .. 0 .. B.400 в котором KN, AN и EN — TV-мерные матрицы; полученные из KN, AN и EN отбрасыванием окаймляющих нулей. Для его решения можно использовать методы, изложенные в предыдущей главе (см. § 2.6). В дальнейшем мы не будем различать уравнения B.40) и B.40'), поскольку в скалярной форме они определяют одну и ту же систему дифференциальных урав- уравнений. По тем же соображениям, в зависимости от обстоятельств, матрицу KN будем рассматривать как бесконечномерную матрицу или как конечномерную матрицу KN. Аналогичным образом получаем TV-мерное матричное уравнение, аппроксими- аппроксимирующее уравнение B.38). Оно имеет следующий вид 1 1 где / <Ш qi2 ••• Qin 0 ...\ Q2N 0 KN{t) = ANKN NAN KNA -KNQNKN, B.42) При этом матрица KN должна удовлетворять начальному условию B.41). 5. Построение формального решения краевой задачи Риккати. Бу- Будем рассматривать уравнение B.42). Если в матрице KN отбросить окаймляю- окаймляющие нули, то получим конечномерную матрицу (размерности N х JV), которую обозначим через KN. Тогда, очевидно, матрица X = KN является решением
4.2. Краевая задача Риккати в управляемых системах 277 уравнения X = ANX + XAN + -XQNX 7 и удовлетворяет начальному условию Х(Т) = EN, B.43) B.44) в котором Е^ — матрица тождественного преобразования в TV-мерном евклидо- евклидовом пространстве. Решение этого уравнения получим методом, описанным в § 2.4. Предположим Y = Х~г. Умножив обе части уравнения B.43) слева и справа на X, получим Х^ХХ-1 = Х-1!* + Л^Х + -QN. B.45) 7 Так как Y = — Х~1ХХ~1, то уравнение B.45) можно переписать в виде Y + YAN + ANY + ^QN = 6>, B.46) где в — нулевая матрица, и решение должно удовлетворять начальному условию У(Г) = Я^. B.47) Решение задачи B.4б)-B.47) имеет вид (см. § 2.4) Y(t) = exp{-2AiV(t - Т)}Е + 1 Г - / Р it Так как - s)}QN 0 ... - s)} ds. B.48) О \ О 0 то решение B.48) можно представить в скалярной форме: Г 1D) Р it Теорема 2.1. PemenueY{t) задачи Коши B.46)—B.47), определяемое формулой B.49), является невырожденной матрицей при любом натуральном N. Доказательство. В 1/2@,Т) возьмем множество Н^ функций h(t), пред- N ставимых в виде h(t) = 2^0Lie^it• ^то множество образует конечномерное г=1 (TV-мерное) векторное пространство. Скалярное произведение в нем введем фор- формулой (Л1№,Л2№) = 5>?а?е2Л?(т-*> + J2 Ч /TaJa?e(A»+A-)(e-t)de. B.50) г=1 i,j = l ^ ^* Покажем, что (h(t),h(t)) ) Ои при этом равенство выполняется лишь при
278 Гл. 4. Бесконечномерные уравнения Риккати h(t) = 0. В соответствии с формулой B.50) имеем iV N пТ Так как по определению qij = дед, то отсюда следует, что (h(t),h(t)) = 2 Е а?Л? f1 ЙО0. B.51) причем равенство здесь достигается лишь в том случае, когда а\ = ... = а^ = 0, поскольку функции eAi*,..., exnt линейно независимы. Из формул B.49) и B.50) следует, что упш = (еп,ет), еп = ехп(Т~г\ где п,тп = 1,...,7V. Поэтому матрицу У, определяемую формулой B.48), можно представить в виде (ebei) (еье2) ... (ei,ejv) \ (e2jei) (e2,e2) ... (e ( ... (eN,eN)J Следовательно, Y(t) является матрицей Грама линейно независимых функций и поэтому она является невырожденной (неособенной). Теорема полностью дока- доказана. 6. Управление системой с неконтролируемыми возмущениями. До сих пор мы предполагали, что управляемый процесс описывается краевой задачей Однако, более интересной является проблема минимизации функционала B.4), когда процесс описывается краевой задачей ди д2и +(t)+f(t,x), 0<t<T, 0<ж<1, B52) =0, Щ + au{t,0} = 0, 0<t<T, a = const>0, OX OX в которой функция f(t,x) характеризует неконтролируемые внешние возмуще- возмущения, действующие на рассматриваемый объект. В этом случае процесс решения уравнения Беллмана относительно функцио- функционала S[t,u] несколько изменяется. Если, в частности, рассматривать задачу при допустимых управлениях р = p(t,x), то вместо B.6) получим уравнение = minf С W(t,x) +p(t,x)v(t,x) - ^ + f(t,x)v(t,x)] dx - -au(t,l)v(t,l)l B-53) которое содержит слагаемое с f(t,x). Оптимальное управление в этом случае определяется той же формулой B.9). Однако, функционал S[t,u] теперь следует
§ 4.3. Полугруппы линейных операторов 279 искать в виде S[t,u]= / K(t,x,s)u(t,x)u(t,s)dsdx + Ф(?, s)u(t, s) ds + ф), B.54) Jo Jo Jo где K(t,x,s), Ф(?, s) и rj(t) подлежат определению. Если воспользоваться той же процедурой, которая была использована выше, то для определения K(t,x,s) получим ту же краевую задачу B.15), B.16) Kt(t,x,s) +Kxx(t,x,s) + Kss(t,x,s) = -K!(t,x,s), Kx(t, 0, s) = 0, Kx(t, 1, s) + aK(t, 1, s) = 0, B.55) Ks (t, x, 0) = 0, Ks (t, x, 1) + aK(t, x, 1) = 0, 0<t<T, 0 < ж < 1. Кроме того, из соотношений B.8) и B.11) следует, что K(T,x,s) = 8{х — s). Функции Ф(г,х) и rj(t) определяются из более простых уравнений6. § 4.3. Полугруппы линейных операторов Этот параграф содержит вспомогательный материал, необходимый для кор- корректного изложения вопросов, относящихся к решению дифференциальных урав- уравнений в банаховых пространствах. Их анализ нам потребуется при получении операторных уравнений Риккати. 1. Определения и основные свойства полугруппы. Пусть T(t),t ^ 0, — семейство линейных ограниченных операторов, отображающих банахово про- пространство В в себя. Будем говорить, что это семейство образует полугруппу линейных операторов или полугруппу, если 1) Т@) — оператор тождественного преобразования; 2) T(h +12) = T(ti)T(t2) = T(t2)T(ti). Эта полугруппа называется сильно непрерывной в начале координат, если для каждого х из В справедливо равенство \\T(t)x - х\\-> Q при?-^0. C.1) Из свойства 2 непосредственно следует, что сильная непрерывность в начале координат влечет за собой сильную непрерывность справа при любом t ^ 0. Что- Чтобы в этом убедиться, достаточно заметить, что для А > 0 имеет место равенство Tit + А)х - T(t)x = T(t)[T(A)x - х]. Для того, чтобы установить непрерывность слева, воспользуемся принципом равномерной ограниченности. Пусть t > 0. Для любого х е В по свойству C.1) можно найти А > 0 такое, что ||Т(?)ж|| ^ С при t ^ А. Для всякого t ^ L справедливо равенство t = кА + г, где к ^ I//A, г < А. Следовательно, верно ^Подробный их вывод см. [10, с. 287-290].
280 Гл. 4. Бесконечномерные уравнения Риккати ||Г(?)ж|| ^ \\Т(А)кТ(г)х\\ <С \\Т(А)к\\С < оо, или sup ||Г(?)ж|| < оо. Отсюда, O^t^L в силу принципа равномерной ограниченности следует, что sup ||Т(?)|| < М < оо.Поэтому \\T(t)x - Tit - А)х\\ = \\Tit - А)(Г(А)х - х)\\ ^ М\\Т(А)х - х\\ -+ О при всех t из полуинтервала @,L]. Более того, можно найти плотное подпространство в В, на котором абстракт- абстрактная функция z = T(t)x бесконечно дифференцируема. Для фиксированного эле- t ~" ч ' "" очевид- мента х и фиксированного числа t > 0 положим7 у = / T(s)xds. Тогда, но, справедлива следующая цепочка равенств: ft ft+A ft Т(А)у-у= / (T(s + A)x-T(s)x)ds= / T(s)xds- / T(s)xds = Jo Jo Jo /t + A rA rA rA T(s)xds- T(s)xds= T(s)(T(t)x)ds- T(s)xds. Jo Jo Jo Так как для любого х rA 1 Г 1 Г — / T(s)xds — х = — / [T(s)x — х\ ds A Jo A Jo Т(А)у - у sup \T(s)x — х\, то 2 Пусть V — множество всех тех элементов ж, для которых [Т(А)х — х]/А схо- сходится, и определим на D оператор Л, называемый инфинитезималъным произво- производящим оператором, или просто генератором, с помощью равенства ~X. C.2) t Ясно, что А — линейный оператор. Покажем, что множество D плотно в ft В. Оно, очевидно, содержит элементы / T(s)xds и, следовательно, не является пустым и содержит подпространство, порождаемое этими элементами. Отсюда ч' •* Jo следует, что lim - / T(s)xds = х. Значит, D плотно в В. Более того, если t-ю t Jo х G D, то абстрактная функция T(t)z сильно дифференцируема по t и имеет dT(t)x место равенство ^— = T(t)Ax = AT(t)x. dt Семейству линейных ограниченных операторов Tit), t ^ 0, поставим в со- соответствие число ujo = inf —^-^-. Величина ujo может оказаться конечной t^o t или равной —оо. В функциональном анализе доказывается (см., например, [2], с. 210-211), что справедливы следующие оценки. Если величина ujo конечна, то для произвольно заданного е > 0 выполняется оценка экспоненциального типа ||T(t)||^MeexP(t(wo + e)). C.3) в которой г — произвольно малое положительное число, а М? — постоянная, зависящая от г. При этом в общем случае эта оценка не может быть улучшена, 7Интеграл понимается по Риману.
§ 4.3. Полугруппы линейных операторов 281 т.е. она не может быть уточнена до ||Т(?)|| ^ Mexp(fojo). Если же ujq = —оо, то для любого натурального N найдется константа Мдг такая, что \\T(t)\\^MNexp(-Nt). C.4) Пример 3.1. Рассмотрим множество непрерывных скалярных функций /(?), определенных на отрезке [0,1] и обращающихся в нуль в точке t = 0. Это множес- множество является банаховым пространством с нормой ||/|| = sup |/(?)|. Определим полугруппу T(t) равенством //(* + *), еслиО^в + ^1, T(t)f = g, g(s) = < [О, в противном случае. Легко проверить, что множество операторов T(t) образует полугруппу, а аб- абстрактная функция Т(?), 0 ^ t ^ 1, непрерывна и ||Т(?)|| = 0 при t > 0. От- Отсюда, в частности, следует, что для рассматриваемой полугруппы выполняется равенство и о = —оо. Каждой полугруппе Т(?) и комплексному числу Л такому, что Re Л > сс?о, мож- но поставить в соответствие интеграл / e~xtT(t)xdt. Он определен корректно, поскольку из C.3) следует, что е-^еЛ*||Г(?)ж|| ^ ||x||M?exp(-ReA)?, C.5) где г > 0 произвольно. Таким образом, можно определить линейный ограни- ограниченный оператор 7^(Л,Л), отображающий банахово пространство В в себя по формуле8 7г(Л,Л)ж=/ e-xtT(t)xdt. C.6) Этот оператор называется резольвентой оператора Л. Очевидно, что если имеет место иоо = -оо, то оператор 1Z определен для всех Л, а из неравенства C.5) следует, что при конечном иоо и любом г > 0 справедлива оценка ||7г(Л,Л)|| ^М?(Ке\-и0-е), C.7) если Re Л > иоо + г. Если же иоо = -оо, то, как следует из C.4), имеет место оценка где N — произвольное положительное число. Из полученных оценок приходим к следующему важному выводу. Свойство 1. Для всех комплексных Л таких, что Re Л достаточно велико, опре- определен оператор 7^(Л, Л) и при этом lim ||7^(Л, Л)|| = 0. Re Л—юо Другие свойства этого оператора приведем без доказательства9. Как будет видно из дальнейшего, удобно подчеркивать зависимость оператора 1Z от генератора Л. 9С доказательствами можно ознакомиться, например, по книге [2, с. 212—214].
282 Гл. 4. Бесконечномерные уравнения Риккати Свойство 2. Множество значений оператора 7Z(X,A) для каждого Л, принад- принадлежащего множеству Re Л > ио, совпадает с областью определения генератора А. При этом выполняется X7Z(X, А)х — A7Z(X, А)х = х. Свойство 3. Оператор 7?(А, Д), определяемый формулой C.6), является ре- резольвентой замкнутого оператора Д, спектр которого находится в полуплоскости Re A ^ ujo. Как известно, резольвентным множеством линейного оператора А называется множество всех тех комплексных значений параметра Л, не являющихся собст- собственными значениями этого оператора, таких, что множество значений оператора XX — А совпадает со всем пространством, X — оператор тождественного преоб- преобразования. Свойство 4. Резольвентное множество оператора А содержит полуплоскость Re Л > ujq. Более того, если Л принадлежит этой полуплоскости, то оператор (XX — А)~1 определяется формулой C.6) и lim 7?(А, Л)х = ж, х Е В. Re А —юо Свойство 5. Множество всех элементов вида Л(Х,А)х, где х принадлежит области определения оператора Л, т.е. х Е D(A), образует подпространство, плотное в D(A), а, следовательно, и в В. Свойство 6. Справедливо равенство lim (X27Z(X, A)x - Хх) = А для всех Re A—>>oo х е D(A). Свойство 7. Справедливо резольвентное равенство тг(А, А) - тг(/х, А) = (а - /х)тг(/х, л)?г(А, А). Свойство 8. Имеет место оценка \\ЩХ, А)п\\ ^ 7 Л ч , Re А > и > и0. (Re А — uj)n До сих пор мы рассматривали вопросы, относящиеся непосредственно к иссле- исследованию свойств полугрупп ограниченных линейных операторов T(t). Однако не менее интересным является вопрос о построении полугруппы по ее генератору (инфинитезимальному производящему оператору). На него дает ответ сформу- сформулированная ниже теорема 3.1. Полугруппа T(t) = —e~xtT(t) является сильно непрерывной для любого А > uj > ujo, а ее генератор, определяемый формулой C.2), равен А = XX — А, где X — оператор тождественного преобразования. Очевидно, что А определен на том же множестве D(A), что и оператор А. Кроме того, имеет место неравенст- неравенство ||Т(?)|| ^ Me~xteu;t ^ M. В дальнейшем, полугруппу Т(?), удовлетворяющую условию ||Т(«ЖМ, C.9) будем называть ограниченной. В этом случае, очевидно, что ujq ^ 0 и резольвента 7?(А, А) существует для всех тех А, для которых Re A ^ 0, и при этом ||?г(А,Л)пКМАп, А>0. C.10) Полугруппа, для которой выполняется условие C.9) при М = 1, называется сжи- сжимающей. Кстати отметим, что почти все полугруппы, имеющие практические приложения, являются сжимающими и для них справедливо следующее важное
§ 4.3. Полугруппы линейных операторов 283 утверждение, позволяющее ответить на фундаментальный вопрос: в каких слу- случаях оператор порождает сжимающую полугруппу? Теорема 3.1. Пусть А — замкнутый линейный оператор с областью опреде- определения D(A), плотной в банаховом пространстве В. Для того чтобы этот опера- оператор был генератором некоторой сильно непрерывной полугруппы T(t), необходимо и достаточно, чтобы каждое Л > 0 содержалось в резольвентном множестве оператора А и \\И(\,А)\\ ^ 1/А, Л > 0. Замечание. Условия этой теоремы можно ослабить, заменив требование «каж- «каждое Л > 0» требованием «каждое достаточно большое Л». Комментарий. Доказательство необходимости приведено выше, а доказатель- доказательство достаточности сводится, в конечном счете, к получению обратного преоб- преобразования Лапласа для функции 1Z(\,A), определяемой формулой C.6). Нам не требуются все детали этого доказательства, Однако, окончательный результат будет полезен при построении полугрупп для конкретных примеров. Он состоит в следующем. Оператору А ставим в соответствие резольвентный оператор И(\, А), который определяется формулой (см. свойство 2 оператора 1Z) X1Z(\, А)х — A7Z(\, А)х = х. При этом оказывается, что X21Z(X, А)х — Хх —> Ах при А —у оо и всех х Е D(A). Оператору В(Х,А) = \27Z(\,A) - XI поставим в соответствие полугруппу S\(t) = etx Щх,А)-м^ КОТОруЮ5 очевидно, можно представить в следующем виде о Sx(t) = е*А2тг(А,Д)-А* = e-xt J2 А К^Л) 1 , При этом оказывается, что п п=о п' lim S\(t) =T(t). C.11) А—>>оо Нахождение этого предела и является конечной целью в построении искомой полугруппы T(t). 2. Полугруппы над гильбертовым пространством. Диссипативные полугруппы. Рассмотрим теперь случай гильбертова пространства В = Н, скалярное произведение элементов иеНиуеНв котором обозначим через (u,v). В этом случае справедлива следующая Теорема 3.2. Пусть А — генератор сильно непрерывной ограниченной полу- полугруппы T(t). Тогда T*(t) — сильно непрерывная ограниченная полугруппа с гене- генератором А*. Замечание. Условие ограниченности полугруппы T{t) в этой теореме не яв- является существенным и его можно опустить. Определение 3.1. Замкнутый линейный оператор А с плотной в Н областью определения называется диссипативным, если верно (Ах, х) + (ж, Ах) ^ 0 для всех х G D(A). Полугруппа называется диссипативной, если диссипативен ее генератор. Из этого определения, в частности, следует, что при диссипативном операторе А оператор Л*, вообще говоря, таковым не является. Отметим важнейшие факты, относящиеся к диссипативным полугруппам.
284 Гл. 4. Бесконечномерные уравнения Риккати Теорема 3.3. Если T{t) — сжимающая полугруппа на гильбертовом простран- пространстве Н', то она является диссипативной. Теорема 3.4. Пусть А — диссипативный оператор и множество значений оператора X—А совпадает со всем пространством. Тогда оператор А порождает сжимающую полугруппу. Теорема 3.5. Пусть А — замкнутый оператор с плотной в Н областью опре- определения и оба оператора А и А* диссипативны. Тогда каждый из них порождает сжимающую полугруппу. Каждая из этих теорем имеет содержательное и интересное доказательство. Кроме того, они имеют многочисленные и разнообразные приложения. Однако, весь этот круг проблем выходит далеко за рамки задач, имеющих непосредст- непосредственное отношение к уравнениям Риккати. Поэтому на них останавливаться не будем. Ограничимся анализом примеров. Пример 3.2. Рассмотрим задачу Коши % + |=°' *>0' -°°<^<00' CЛ2) где ер (у) — заданная дифференцируемая функция из класса Ь2(-оо,оо), т.е. та- гоо кая, что / \(р(у)\2 dy < оо. J — оо Вводя дифференциальный оператор Л, положив Af = — —, находим, что об- ду ластью определения оператора А в этом случае можно взять класс функций из гильбертова пространства Ь2(—оо,оо), производная каждой из которых также принадлежит этому пространству. В этом случае А является замкнутым ли- линейным оператором с плотной областью определения D(A), а первостепенный интерес для нас представляет его спектр. Поэтому займемся изучением уравне- уравнения ^- + \f = 9, g€L2(-oo,oo), f€D(A). C.13) F) -р Так как из C.13) следует, что при любом Л > 0 уравнение ——\- Л/ = 0 имеет ду единственное решение f(y) = e~Xyf(O), то точечный спектр оператора А пуст. Для решения неоднородного уравнения C.13) удобно воспользоваться преоб- разованием Фурье: f(u) = — / e~iujy f(y) dy, f(y) = / f(u)eiujydu. Тогда 27rJ-oo ^ J-oo из уравнения C.13) следует, что f(uS) = —, так что число Л принадлежит Л + iuj резольвентному множеству, если его вещественная часть не равна нулю. С другой стороны, поскольку резольвентное множество должно быть открыто, мнимая ось действительно является спектром оператора А. Из сказанного выше
§ 4.3. Полугруппы линейных операторов 285 следует, что для Л > О ||7?(А, Д)#||2 = / тъ ~^ duj ^ ЛО , и, следовательно, У_оо X2 + и2 X2 Значит, условия теоремы 3.1 полностью выполнены, а поэтому оператор А по- порождает полугруппу сжимающих операторов. Структуру этой полугруппы опи- описывать не будем. Она нам в дальнейшем не потребуется. пример 3.3. Рассмотрим уравнение теплопроводности с начальным условием /@, ж) = д(х), в котором функция д(х) задана и принад- принадлежит 1/2( — 00, ОО). В качестве базового гильбертова пространства возьмем L2(—00,00). Будем рассматривать случай, когда область определения оператора Л, определяемого d2f формулой Af = ~тг~2~5 состоит из функций /(ж), принадлежащих L2(—00,00), для которых /'(ж) и /"(ж) также принадлежат L2(—00,00). В частности, каждая такая функция удовлетворяет условиям /(—оо) = /(оо) = /'(—сю) = /'(оо) = 0. Ясно, что эта область определения оператора Л плотна в L2(—оо, оо). Кроме того, этот оператор симметричен и диссипативен, что нетрудно показать интегриро- интегрированием по частям. Отсюда следует, что он порождает сжимающую полугруппу. В соответствии с комментариями к теореме 3.1, для ее построения вводим вспо- вспомогательную полугруппу (см. C.14)) S\(t) = etx Щх^)~хгг Уравнение (XX — A)f = g в этом случае имеет вид Xf(y) + f"(y) = 9(у), д(у) Е 1/2(—оо, оо). Так же, как и в предыдущем примере, находим, что опера- оператор А не имеет точечного спектра. Применяя к этому уравнению преобразова- преобразование Фурье, получаем: f(uS) = ^(uj), и, следовательно, в рассматриваемом А + uoz случае Л(Х,А) = «. Поэтому очевидно, что преобразование Фурье для сле- А + и 2 ^ A T^CA A)ntn дующего соотношения ех 7г^л¦' ^f(y) = У^ f(y) дает равенство 77/! / °° \2ntn \ - 2 2 - ( ^~^ — 2 )/(^) — е±Х /^л+а; ' f(u). Таким образом, преобразование Фу- рье для функции T(t) имеет вид lim е /(Л+^ ) f(u) = eu f(uo). Отсюда, в Л—юо гоо соответствии с теоремой свертки, получаем: T(t)f = / G(t,y - t)f(y)dy, где J — оо (? Отметим, что эта полугруппа сохраняет свойство положительности в том смыс- смысле, что если / — неотрицательная функция, то таковой же будет и функция T(t)f. Далее, если функция f(y) неотрицательна и принадлежит классу L2(-oo,oo), a гоо гоо д = T(t)f, то д G L2(-oo, оо) и / д(х) dx = f(x) dx. J— оо J— оо
286 Гл. 4. Бесконечномерные уравнения Риккати Пример 3.4. Простейшая задача Коши для волнового уравнения ставится сле- 82f d2f дующим образом: найти решение уравнения —— = тг-^, при t > О, —оо < х < оо, at2 ох2 <Э/@ x) удовлетворяющее начальным условиям /(О,х) = /i(x), —^р—- = /2(ж). от Предположим что fi(x), f2(x) G L<i(—00,00), и введем следующие обозначения , ч df(t,x) , ч <Э/(?,ж) rji[t,x) = — , f]2{t,x) = — . Тогда исходное уравнение можно записать „ дщ дт]2 дт]2 дщ в виде системы уравнении ——- = ——, ——- = ——. Ьсли теперь обозначить через at ox at ox rj(t,x) вектор с компонентами rji(t,x) и rj2(t,x), то полученную систему уравне- дп ( 0 — ний можно записать в виде одного уравнения — = Arj(t, ж), где Л = I q д^ Значит, оператор Л определен на классе функций f](t,x) = {rji(t,x),rj2(t,x)} из гильбертова пространства Н = Ьг(—оо,оо) х L2(—00,00), первые производные которых также принадлежат Н. Оператор Л диссипативен: (Л/, /) + (/, Af) ^ О, поскольку, интегрируя по частям, получаем: (Л/,/) = ( ~^,J2 ) + ( ^т~^/1 )• \ ох ) \ ох ) Операторное уравнение (XX — A)f = g можно представить как систему ска- скалярных уравнений Dfi = Л/2 - ^2, Df2 = АД - gi, где D = —. Ясно, что эта ох система имеет единственное решение при любом А и, в частности, образ опера- оператора XI — А совпадает со всем пространством. Отсюда следует, что оператор А порождает сильно непрерывную сжимающую полугруппу (см. теорему 3.4). Полугруппу T(t) (на самом деле в рассматриваемом случае она является груп- группой) можно построить, применяя формально оператор еЛг. В результате для произвольного вектора г] будем иметь T(t)n = +rn(x-t) rj2(x + t) -rj2(x-t) 2 2 3. Компактные полугруппы и операторы. До сих пор рассматривались полугруппы операторов в довольно общих ситуациях. Если уточнить характер рассматриваемых полугрупп, то можно получить более сложные результаты. На- Например, можно потребовать, чтобы соответствующие операторы были компакт- компактными. Сильно непрерывную полугруппу операторов T(t) называют компактной, если для каждого t > 0 оператор T(t) компактен. Опуская доказательства, приведем важнейшие факты теории компактных по- полугрупп. Теорема 3.6. Компактная полугруппа T(t) обладает свойствами: 1) полугруппа T(t) равномерно непрерывна при t > 0; 2) ее генератор имеет чисто точечный спектр, образованный счетным мно- множеством значений {Ап} с соответствующими собственными векторами {^п}5 причем последовательность {\п} не имеет конечных предельных точек;
§ 4.3. Полугруппы линейных операторов 287 гоо 3) 1Z(X,A) = / e~xtT(t) dt, А > ujq, и этот интеграл сходится в равномер- ной операторной топологии; 4) T(t)<pn = eA-Vn5 5) резольвента TZ(X,A) компактна для любого X ф Хп и имеет место соотно- соотношение ?г(Л, A)ipn = ^п/(А - Лп). Некоторым дополнением к сформулированной теореме является следующее за- замечание. Из того, что оператор А имеет чисто точечный спектр, следует компактность полугруппы T(t). Если оператор А с областью определения в бесконечномерном пространстве является ограниченным, то оператор еЛг может и не быть компакт- компактным. Теорема 3.7. Пусть сильно непрерывная полугруппа оператора над гильбер- гильбертовым пространством Н является компактной и самосопряженной. Тогда про- пространство Н сепарабелъно. Более того, если оно бесконечномерно, то существу- существует последовательность действительных чисел {Хп} такая, что Хп —> — оо при п —У оо; спектр оператора А является чисто точечным и совпадает с {Лп}, а спектр оператора T(t) имеет вид {eXnt} U {0} и ujq = sup An. Одним из основных результатов, вытекающих из этой теоремы, является пред- оо ставление T(t)x = 2^ еЛгг*(^п?ж)(^п, которое справедливо для любого х G Н. 71=1 Пример 3.5. Пусть Н = 1^ — бесконечномерное гильбертово пространство оо последовательностей а = {ап}, удовлетворяющих условию ^ о?п < оо. Пусть, 71=1 далее, T(t) — компактная самосопряженная полугруппа. Тогда ее можно пред- оо ставить в виде T(t)a = V^ eXnt((pn,a)(pn, где {(fn} — ортонормированный базис 71=1 в ^2, а Ап, п = 1, 2,..., — вещественные числа. Так как Ап —у —оо при п —у оо, то для любого t > О n=l где ci,C2,7 — положительные постоянные. Следовательно, для каждого t > 0 элемент T(t)a принадлежит области опреде- определения оператора Л, так что абстрактная функция T(t) сильно дифференцируема для всех t ^ 0 и, в частности, AT является линейным ограниченным оператором, норма которого обладает свойством ||ДТ|| = O(l/t) при t —> 0. Теорема 3.8. Если оператор А порождает полугруппу T(t) и резольвента Л(Х, А) является компактным и самосопряженным оператором для некоторо- некоторого X > иоо, то само пространство является сепарабельным и полугруппа T(t) является компактной и самосопряженной.
288 Гл. 4. Бесконечномерные уравнения Риккати Пример 3.6. В качестве Н возьмем пространство 12 последовательностей а = оо {ап}, каждая из которых удовлетворяет условию 2^ ап < °°- Подгруппу T(t) п=1 t определим соотношением T(t)a = {(exp(—n2t + ien t))an}. Эта формула, очевидно, определяет компактную полугруппу. В соответствии с формулой C.2) генератор А этой полугруппы можно определить соотношением Аа = {(-п2 + геп )ап}. Поэтому АТа = {(-п2 + геп ) exp(-n2t + геп г)ап}, и сумма ряда ^ (п4 + е2п )еп *а2 не обязательно конечна при всех а из 12. п=1 Следовательно, T(t)a не обязательно принадлежит области определения оператора А для всех а е Н. Поэтому функция T(t)a , вообще говоря, не является сильно дифференцируемой по t. Завершая анализ компактных полугрупп, отметим следующий важный факт. Построение компактных полугрупп операторов, исходя из уравнений с частными производными, сопряжено с большими трудностями. Для построения полугрупп в этом случае прежде всего необходимо, чтобы область определения уравнения была компактным множеством. Для определенности рассмотрим конкретную задачу. Пример 3.7. Пусть Н = 1/2@, 2тг) и рассмотрим уравнение теплопроводности ди д и — = -7—tт, 0 ^ х ^ 2тг, t > 0, при краевых условиях и@) = иBтт), и'@) = и/Bтг). ot oxz д2 Введем оператор Л = —^, областью определения которого является множест- множество D(A) = {и : и',и" е L2@,2tt), и@) = Ц2тг), ^@) = и/Bтг)}. При этом имеем л2тг л2тг (Ли, и) = / и"(х)и(х) dx = — / uf(x)uf(x)dx = (и, Ли) ^ 0 для любой функ- Jo Jo ции и(х) из D(A). Следовательно, оператор является диссипативным и легко также проверяется, что он является симметричным. Он порождает сжимающую полугруппу самосопряженных операторов (см. теорему 3.4). Для любой функции д(х) из 1/2@,2тг) построим следующую последователь- 1 [27Т ность дп = — / д(х)е inxdx. Непосредственной проверкой можно убедиться, 27Г Jo оо что функция, определенная равенством и(х) = 2^ ^—^е1ПХ принадлежит п= — оо области определения оператора А и имеет место равенство и — Аи = д. Далее, функции (рп(х) = егпх принадлежат D(A) и T(t)(pn = е~п tipn. Поэтому они являются собственными функциями оператора А. 4. Расширение операторов. При решении различных задач для уравнений с частными производными часто приходится рассматривать незамкнутые опера- операторы. Их незамкнутость создает ряд неудобств в аналитическом исследовании задач. Вместе с тем оказывается, что при подходящем расширении области опре- определения оператора, он становится замкнутым. Такая ситуация возможна и при исследовании интегро-дифференциальных краевых задач Риккати, которые выше
§ 4.3. Полугруппы линейных операторов 289 были получены при решении задач об оптимальном управлении для уравнения теплопроводности. Независимо от источника возникновения ситуации с незамкнутым операто- оператором, имеются некоторые общие закономерности расширения области определения оператора и свойств соответствующих расширенных операторов. Здесь мы отметим некоторые факты теории операторов, относящиеся к этому кругу вопросов. Однако, сначала введем строгое определение понятия расшире- расширения оператора. Пусть оператор А имеет область определения D(A) в банаховом пространстве В. Оператор В с областью определения D(B) называется расширением оператора А, если выполнены следующие условия: 1) D(A) С D(B); 2) Ах = Вх при всех х из D(A). Пример 3.8. Пусть Н = 1/2@,1). Обозначим через Do пространство беско- бесконечно дифференцируемых функций с компактным носителем на @,1). Опреде- Определим оператор А равенством А = —, D(A) = Do. Этот оператор, очевидно, ах незамкнут. Обозначим через Dmax множество абсолютно непрерывных на отрез- отрезке [0,1] функций. Тогда, как известно, из того, что f(x) Е Dmax, следует, что f'{x) Е ?2@,1). Поэтому оператор В = —, D(B) = Dmax является замкнутым. Тем не менее, этот оператор не порождает полугруппу. Поэтому естественной становится задача о построении такого расширения (или сужения) оператора А которое бы, кроме свойства замкнутости, допускало еще полугруппу. В общем случае эта задача довольно сложна. Однако, в рас- рассмотренном примере она решается достаточно просто введением дополнительного граничного условия, которому должны удовлетворять функции из Dmax- Можно ограничиться граничным условием а/@) + bff(O) = 0, \а\ + \Ь\ ф 0. Если теперь обозначить через Z^ax множество функций из Dmax, удовлетворяющих этому граничному условию, то можно показать, что оператор С — —, D(C) = ?^ах является замкнутым и допускает полугруппу. Следующую теорему приведем с доказательством, поскольку в нем излагается способ построения минимального расширения оператора. Теорема 3.9. Пусть А —линейный оператор, удовлетворяющий условию: если хп ->• 0, хп е D(A), и последовательность {Ахп} сходится, то Ахп ->• 0. Тогда оператор А имеет замкнутое расширение. Доказательство. На самом деле мы опишем наименьшее расширение опера- оператора А. Обозначим через G(A) график оператора Л, а через G(A) — его замы- замыкание в прямом произведении Н х Н. Положим Ах = у, если (х,у) G G(A). Сначала покажем, что это определение корректно. Это действительно так, если (ж, у) е G(A). Предположим теперь, что (х,у) ? G(A), но (х,у) е G(A). Тогда существует последовательность {хп} такая, что хп G D(A) и хп —У ж, а Ахп —У у. Предположим, что х = 0. Тогда у = Ах = 0. Следовательно, оператор А определен корректно и, очевидно, линеен. Его замкнутость следует из равенст-
290 Гл. 4. Бесконечномерные уравнения Риккати ва G(A) = G(A). Так как график всякого замкнутого расширения оператора Л должен содержать G(A), то оператор Л является наименьшим замкнутым рас- расширением оператора Л. Следующие две теоремы приведем без доказательств. Теорема 3.10. Предположим, что оператор А линеен, имеет плотную об- область определения и диссипативен на своей области определения. Тогда он имеет диссипативное замкнутое расширение. Теорема 3.11. Предположим, что операторы А и А* имеют плотную область определения (Л может принимать значения в другом гильбертовом пространст- пространстве). Тогда оператор А* А имеет наименьшее замкнутое расширение и наимень- наименьшее замкнутое расширение оператора (—А^А) порождает диссипативную само- самосопряженную полугруппу операторов. Пример 3.9. Пусть G — открытое (не обязательно ограниченное) множество в Еп. Обозначим через Cq° линейное пространство бесконечно дифференцируемых на G функций, каждая из которых равна нулю вне некоторого компакта на от- п гл л . ( ди ди \ крытом множестве G. Определим оператор Л равенством Аи = < ——,..., —— >, I A1*-\ A1* I D(A) = Cq°. Этот оператор принимает значения в гильбертовом пространстве L2 (G), элементами которого являются n-мерные векторные функции с компо- компонентами из Cq° . Положим Н = L,2(G). Тогда Л является линейным оператором на Н с плотной областью определения. Согласно теореме 3.11, оператор А^А имеет замкнутое расширение и его наименьшее замкнутое расширение порождает диссипативную полугруппу. Сначала рассмотрим оператор Л*. Если Л/ — д, то (f,Ah) = (g,h) для всех h Е Cq° . Поэтому каждый элемент / из Cq° принадлежит области опре- определения оператора Л* (Л*, конечно, замкнут) и является оператором обобщенного п дифференцирования: Л*/ = (-l)^^Dif, где через Di обозначена обобщенная г=1 д производная, соответствующая операции ——. Более того, имеет место соотноше- ние D(A*A) = {/ : / G D(A), A G D{A*)} = {/ : / G Co°°, Af G D{A*) = Co°°}, 71 d2 f и для элемента / G Cq° выполнено A*Af = — V^ —^ — ~^f • Таким образом, наименьшим замкнутым расширением оператора (—А^А) яв- является наименьшее замкнутое расширение оператора Лапласа с областью опре- определения Cq° . Это расширение порождает самосопряженную диссипативную по- полугруппу операторов. Рассмотрим теперь область определения наименьшего за- замкнутого расширения оператора (—А*А). Ясно, что D(A) = Hq(G). Согласно теореме 4.11, наименьшее замкнутое расширение представляется в виде АА, где Л — наименьшее замкнутое расширение оператора Л.
§ 4.4. Уравнения в функциональных пространствах 291 § 4.4. Дифференциальные уравнения в функциональных пространствах В этом параграфе рассматриваются основные вопросы разрешимости «абстра- «абстрактных» дифференциальных уравнений вида x(t) = Ax(t), ?>0, D.1) где Л является порождающим инфинитезимальным оператором (генератор полу- полугруппы). 1. Стационарное уравнение. Сначала будем предполагать, что оператор Л не зависит от времени. Так как по построению полугруппа T(t) обладает свойством (см. C.2)) = AT(t)x@), то формула at x(t) = T(t)x@) D.2) представляет одно из решений уравнения D.1). Если дополнительно потребо- потребовать непрерывность решения, то эта формула определяет единственное решение. Именно, справедлива следующая Теорема 4.1. Абстрактная задача Коши x(t) = Ax(t), 0<?<oo, х@) = х° е D(A) ' имеет единственное решение, удовлетворяющее условиям: 1) x(t) Е D(A) при t ^ 0; 2) x(t) абсолютно непрерывна при t > 0; 3) \\x(t) - х°\\ -> 0 при t -> 0. Доказательство. Как было отмечено выше, функция x(t) = T(t)x@) является решением задачи Коши D.3). Предположим, что существует еще другое решение. Тогда, очевидно, что их разность x(t) - y(t) также удовлетворяет уравнению D.1). Введем вспомогательную функцию z(s) по формуле z(s) = T(t - s)y(s), 0 ^ s ^ t, где t рассматривается как параметр. Тогда функция z(s) сильно дифференцируема (абсолютно непрерывна) и z(t) — z(A) = / ds, 0 < А < t. JA as При этом —— = T(t - s)y(s) - T(t - s)Ay(s) = 0. OjS Следовательно, z(t) = y(t) = z(A) = T(t — A)y(A). Так как у (А) —> 0 при A ->• 0, то z(t) = y(t) = 0. Поскольку это верно при всех t > 0, то функция y(t) тождественно равна нулю. Рассмотрим теперь неоднородное уравнение x(t) = Ax(t) + a(t), t > 0, D.4) с заданным начальным условием х@)=х°. D.5) По аналогии с конечномерным случаем следует ожидать, что решение этой задачи
292 Гл. 4. Бесконечномерные уравнения Риккати представимо в виде rt x(t) = T(t)x° + / Tit- s)a(s) ds, t ^ 0. D.6) Jo Оказывается, что решение D.6) понимается по-разному в зависимости от глад- гладкости функции a(t) и начального состояния х°. Теорема 4.2. Пусть точка х° в начальном условии D.5) принадлежит облас- области определения оператора А, т.е. х° е D(A), а функция a(t), принимающая значения в банаховом пространстве В, сильно непрерывно дифференцируема на @, Г) и ее производная допускает непрерывное продолжение на [0,Г]. Тогда урав- уравнение D.4) имеет единственное решение, удовлетворяющее условиям: 1) x(t) абсолютно непрерывна на @,Г); 2) x(t) е С (А) при t > 0; 3) \\x(t) - х°\\ -+ 0 при t -+ 0. Доказательство этой теоремы приводить не будем. Для нас значительно более интересен случай, когда х° ? D(A) или когда функция a(t) не является гладкой. В этих случаях требуется несколько расширить понятие решения задачи Коши. Можно доказать следующие два варианта существования решения. Теорема 4.3. Предположим, что a(t) e W = Ь2(@,Т);Н). Тогда для каждого х° Е В существует единственная функция x{t), 0 ^ t ^ T, такая, что для каждого у Е D(A*) функция (x(t),y) абсолютно непрерывна и: 1) = (x(t),A*y) + (a(t),y) почти всюду на @,Г); 2) lim (x(t),y) = (х°,у), у Е D(A). Более того, эта функция представима формулой D.6). Из этой теоремы вытекает важное Следствие 4.1. Если функция a(t) удовлетворяет условиям предыдущей тео- теоремы, то существует единственная слабо непрерывная функция x(t),0 < t < Т, со значениями в В такая, что ft ft (x(t),y) = (T(t)x°,y)+ (x(s),A*y)ds+ (a(s),y)ds, O^t^T, D.7) Jo Jo и эта функция определяется формулой D.6). Пример 4.1. Рассмотрим уравнение -J- + -J- = u(t,у), t > 0, -оо < у < оо, D.8) в предположении, что функция u{t,y) измерима по Лебегу по совокупности пере- переменных t и у и удовлетворяет условию гТ гоо / / \u(t,y)\2dy<cx. D.9) Jo J — оо Тогда функция u(t,y) слабо непрерывна, как функция от t со значениями в гТ пространстве В = L<i{—оо,оо) и, более того, / \u(t,y)\2dt < оо. Каждую та- J о кую функцию u(t,y) можно рассматривать как элемент банахова пространства
§ 4.4. Уравнения в функциональных пространствах 293 1/2(—оо, оо; В). Чтобы уравнение D.9) представить в виде D.4), вводим оператор Л = —d/dy, D(A) = Li{—оо, оо). Порождаемая им полугруппа T(t) представляет собой семейство операторов сдвига на L/2(—oo,oo): T(t)f = /(—?,.), t > 0. Для решения f(t,y) = / Т(? - s)u(s,y) ds имеем следующее представление ./о П T(t-s)u(s,y)ds,x(yyj = J (T(t-s)u(s,y),x(y))ds = rt roo roo I rt \ = ds u(s, у + s - t)x(s — t)dy= / u(s, у + s - t) ds\ x(y) dy, JO J — oo J — oo y«/0 J ft так что функция f(t,y) = / T(t — s)u(s,y) ds почти всюду совпадает с интегра- f лом / u(s, у + s — t) ds, —oo < у < oo. Тем не менее, эта функция может не удовлетворять дифференциальному урав- уравнению D.8), если не налагать дополнительные условия гладкости на функцию u(t,y) по переменной у (такие как дифференцируемость и ограниченность про- „ 9u(s,y) изводнои — по совокупности переменных s и у. ду Отметим, что равенство = / T(t - s)u(s) ds D.10) Jo определяет линейный ограниченный оператор на 1/2(@,Т),??) для каждого Т > 0. Более того, класс функций u(s) из L2(@,T),5), для которых функция v(t) удовлетворяет дифференциальному уравнению D.8) в сильном смысле, является плотным множеством (в качестве такого класса можно взять, например, Cq°). Более того, можно показать, что оператор ?, определяемый формулой D.10) не является, вообще говоря, компактным. 2. Задачи с неоднородными граничными условиями. До сих пор, рас- рассматривая краевые задачи для уравнений в частных производных, приводящие- приводящиеся к абстрактным дифференциальным уравнениям, мы предполагали граничные условия однородными. Однако, как показано в предыдущем параграфе, особый интерес представляют задачи, приводящие к уравнениям Риккати, когда управ- управляющий параметр входит в граничные условия. В этом случае процесс описы- описывается краевой задачей с неоднородными граничными условиями и для его опи- описания с помощью абстрактного дифференциального уравнения требуется иная абстрактная формулировка задачи. В общем случае на этом пути возникают разнообразные трудности и здесь не представляется возможным дать достаточно полную характеристику абстракт- абстрактного описания рассматриваемой задачи. Мы ограничимся более или менее под- подробным описанием лишь в одном достаточно частном примере. Пусть G = {х = {xi,X2J G Е2 : 0 ^ xi,^2 ^ 1}, т.е. G представляет собой квадрат на плоскости x\Ox<z с центром в точке A/2,1/2). Границу этого квадрата
294 Гл. 4. Бесконечномерные уравнения Риккати обозначим через Г. Рассмотрим неоднородную краевую задачу Ц- = Д/, *>0, xeG, f\r=<p(t,x), D.11) где А — оператор Лапласа, a ip(t,x) — заданная функция. Будем предполагать, что f(t,y) является элементом пространства L^(G) почти для всех t > 0. Прежде всего, следует решить вопрос о том, как следует понимать значение функции f(t,x) на границе Г. В случае произвольных областей это довольно сложный вопрос. Здесь же мы воспользуемся достаточно простой структурой рассматриваемой области G. Ясно, что если функция f(t,x) непрерывна на за- замыкании G, то ее значение на границе определено корректно. Более того, ее сужение на границу области является непрерывной функцией. При расширении класса рассматриваемых функций следует исходить из того, что всякое опреде- определение граничного значения должно согласовываться с соответствующим опреде- определением для непрерывных функций. Следует также отметить, что граница Г может быть параметризована точками из некоторого подмножества из Е1. Введем обозначение Нь = ^(Г) и пусть ip(t,.) Е Н — Ъ. Удобно разбить множество Г на четыре гладких сегмента 1\, где г = 1,... ,4, каждый из которых соответствует определенной стороне квадрата. Определим функцию cpi следующим образом: она равна cpi на Г^ и равна нулю на остальных Tj. Будем говорить, что cpi является граничным значением функции / Е 1/2(G) на Fi, если для любой последовательности {ж2п}5 сходящейся к нулю, справедливо lim / |/(xi,X2n) — ipi(x)\dx = 0, где Fi = ({xi,0} : 0 ^ x\ ^ 1). Аналогичным образом определяется граничное значение / на других участках границы. Тем самым определяется граничное значение функции / на всей гра- границе квадрата. После этого можно рассмотреть задачу Дирихле: найти функцию / G 1/2 (G) такую, что / принадлежит области определения оператора Лапласа А, выполняется тождество А/ = 0, х G D(A), и ее граничное значение равно д G ?/2(Г). Такая задача имеет единственное решение, которое можно получить, например, в виде ряда Фурье. Вводя необходимые обозначения, это решение можно записать в операторной форме / = Т>д, где V — линейный, ограниченный оператор, отображающий Нь в D(A). Этот оператор в дальнейшем будем называть оператором Дирихле. Имея этот результат, можно рассматривать исходную неоднородную краевую задачу D.11). Обозначим через Л наименьшее замкнутое расширение оператора Лапласа , определенного на Cq° . Предположим также, что граничное значение (f(t,x) искомого решения f(t,x) принадлежит Нь. Кроме того, предположим, что функция u(t) = (p(t,.) сильно дифференцируема на [0, оо]. Решение «расширенной» краевой задачи будем искать в виде x(t) =xo(t) +Vu(t), D.12) где xo(t) — решение неоднородного уравнения x(t) = Ax(t)+z(t), D.13) в котором функция z(t) — специально подобранная функция. Она определена ниже.
§ 4.4. Уравнения в функциональных пространствах 295 Дифференцируя функцию D.12), находим, что x(t) = xo(t) + Vii(t) = Axo(t) + z(t) + Vii(t) = = A(x(t) - Vu(t)) + z(t) + Vii{t) = Ax(t) + z(t) + Ш(?). Следовательно, чтобы функция D.12) была решением неоднородной задачи D.13), необходимо положить z(t) = —Vii{t). Более того, в этом случае решение D.12) можно представить в виде fsit Jo x(t)=S(t)x@)-Vu@))- / S(t-s)Vu(s)ds + Vu(t), D.14) Jo где S(t) — полугруппа операторов, порожденная оператором А. Можно показать, что формула D.14) определяет единственное решение, удовлетворяющее услови- условиям: 1) \\x(t) -x@)\\ ->0 при t ->0; 2) граничным значением x(t) является u(t)\ 3) (x(t),y) = (x@),y) + f*(x(s),Ay)ds для любого у из С$°. Несмотря на то, что формула D.14) дает удобное представление решения неод- неоднородной задачи D.11), она имеет тот недостаток, что функция u(t) должна быть сильно непрерывно дифференцируемой. В ряде случаев это ограничение является нежелательным, а для задач теории управления оно просто неприемлемо. Покажем, что от этого недостатка можно избавиться, если отказаться от по- поточечного определения решения и подходящим образом ввести его интегральное определение, т. е. ввести подходящее обобщенное решение. Используя тот факт, что образ оператора S{t) содержится в области определения оператора Л при каждом t > 0, можно доказать справедливость равенства rt-S rt-S / S(t - s)Vu(s) ds = S(t - s^uis)^'6 + / AS(t - s)Vu(s) ds D.15) Jo Jo для 0 < S < t. Отсюда, в частности, следует ограниченность оператора AS(t) для любого t > 0. rt-5 Оказывается, что существует предел y{t) = lim / AS(t—s)Vu(s) ds для лю- ?->о Jo бой функции и(.) из пространства Wb = Ь(@, Т),Въ), а оператор ?, определяемый ft формулой Cu(t) = y(t), y(t) = / AS(t — s)Vu(s) ds, отображает пространство Wb Jo в пространство Ws = Z/2(@,T), L(G)) и является линейным и ограниченным. Дальнейшее построение обобщенного решения можно получить двумя различ- различными способами. 1-й способ [секвенциальный подход). Считая, что функция и{.) непрерывно диф- дифференцируема, перейдем к пределу в равенстве D.15) и полученный результат используем для преобразования формулы D.14) к виду x(t) =S(t)x@) - f ASVu(s)ds. D.16) Jo Теперь воспользуемся тем фактом, что произвольную функцию и(.) из Wb можно аппроксимировать последовательностью сильно непрерывно дифферен-
296 Гл. 4. Бесконечномерные уравнения Риккати цируемых функций {ип(.)}. Каждой функции ип(.), очевидно, соответствует rt Хг Г xn(t) = S(t)x(jS) — I AS(t — s)Vun(s) ds. Так как С — линейный ограничен- ограниченно ный оператор, то последовательность {Сип} сходится к Си, а последовательность {xn(t)} сходится в пространстве Ws к некоторой функции x(t). При этом пре- предельная функция x(t) не зависит от выбора аппроксимирующей последователь- последовательности {ut(t)}. Этот предел, по определению, называется обобщенным решением неоднородной краевой задачи D.11). Оно определяется той же формулой D.16). Однако, теперь в правой ее части и(.) Е Wb- 2-й способ. То же самое решение можно определить другим способом. В си- силу существования интеграла в правой части последнего равенства, имеет место rt rt А / S(t-s)Vu(s) ds = / AS(t-s)Vu(s) ds. Следовательно, формулу D.16) мож- Jo Jo ft но записать в виде x(t) = S(t)x@) — Ay(t), y(t) = / S(t — s)Vu(s) ds. Послед- Jo rt rt няя формула определяет решение (y(t),x) = / (y(sO, Л*ж) ds + / (Vu(s),x)ds Jo Jo для всех х е ?>(Д*), или обобщенное решение задачи Коши y(t) = Ay(t) + V(t), у@) = 0. 3. Эволюционное уравнение. До сих пор мы рассматривали уравнения вида x(t) = Ax(t) в предположении, что оператор А не зависит от времени. Не меньший интерес представляет уравнение того же типа, но с оператором вида А = A(t). Уравнение вида x(t) = A(t)x(t) D.17) называется эволюционным уравнением. Оказывается, что точно так же, как и в конечномерном случае, решение уравнения D.17), определенное подходящим образом, представимо в виде x(t) = , 1 <?(?)() t ^ s ^ 0, где операторная функция Ф(?, s) обладает свойством #(t,s) =Ф(*,<т)Ф(<7,$). D.18) Это свойство является обобщением соответствующего полугруппового свойст- свойства для стационарного случая, когда оператор А не зависит от времени. Однако, в нестационарном случае не удается построить столь же стройную теорию, как это получается при постоянном операторе А. Для анализа задач управления, при- приводящих к уравнениям Риккати, нам достаточно будет следующего результата. Теорема 4.4. Предположим, что оператор А является генератором сильно не- непрерывной полугруппы S{t), определенной в гильбертовом пространстве Н. Пред- Предположим, далее, что для каждого t из отрезка [0,Т] оператор V(t) линейно и непрерывно отображает пространство Н в себя и что семейство {V(t)} сильно непрерывно на [0,Г]. Тогда уравнение d(x(t),y) dt = (x(t),(A + V*(t))y), D.19)
§ 4.4. Уравнения в функциональных пространствах 297 где х@) задано, имеет единственное непрерывное решение x(t), 0 ^ t ^ Т. При этом x(t) = Ф(г, s)x(s), t ^ s ^ 0, D.20) где оператор Ф(г, s) линейно и непрерывно отображает пространство Н в себя. Кроме того, операторная функция Ф(г, s) сильно непрерывна при 0 ^ s ^ t ^ Г, справедливо равенство <?>(t,s) = Ф(?, сг)Ф((сг, s), t ^ сг ^ s, и Ф(г,г) является оператором тождественного преобразования. Эта теорема важна не только сама по себе, но и двумя своими следствиями, которые оказываются полезными при анализе различных задач для уравнений в частных производных. Следующие две теоремы играют принципиальную роль в рассматриваемых нами приложениях. Поэтому приведем их с полными доказательствами. Теорема 4.5. Предположим, что для некоторого х G D(A) и всех t G [0,Т] выполняется неравенство ((А + V(t))x,z) + (ж, (A + V)) < 0. Тогда rll < \\т\\ / ъ. П (АУЛ^ \\ \ 5 \ / Доказательство. Очевидно, что для любого а > 0 справедливы равенства Ф(в + a, s)x = S(a)x + / 5(s + а — а)Т(а)Ф(а), s)x(s) da = Jt pa ¦ / (S(a)Ax + S(a - a)V(a + вЩв + a,s))xda, Jo = x pa = (x,x) + / ((S(a)Ax + S(a - a)V(cr + s)<?(s + a,s)x,x) + Jo + (ж, S(a)Ax + 5(a - a)Va + s)#(s + a, s)x,))) + O(a2). Интеграл в этой сумме представляется в виде a(Ax+V(s)x, x) + (ж, Ах+Тх) -\-2ea, если только а — достаточно малое число. Таким образом, имеем \\S(g)x - Ах\\ + ||5(ai - a)V((J + в)Ф{а + s, s)x - T(s)x\\ < г для всех а\ G @, а). Следовательно, существует ао > 0 такое, что для 0 < а < ао имеет место ||Ф(з + a, s)x\\2 < \\x\\2. Оценка D.21) следует из D.18). Теорема 4.6. Пусть А является инфинитезимальным производящим опера- оператором сильно непрерывной полугруппы S(t) и пусть V — произвольный линейный ограниченный оператор, отображающий пространство Н в себя. Тогда оператор А + V порождает сильно непрерывную полугруппу и она является компактной, если S(t) — компактная полугруппа. Доказательство. Поскольку в рассматриваемом случае решение эволюцион- эволюционного уравнения D.17) удовлетворяет уравнению f J s x(t) = S(t - s)x(s) + f S(t- a)x(a) da, D.22) J
298 Гл. 4. Бесконечномерные уравнения Риккати а оператор V не зависит от параметра ?, то из соотношения D.22) и определения оператора Ф(?, s) следует, что в рассматриваемом случае Ф(?, s)x = <P(t — s)x. Положим T(t)x = Ф(?, 0)х. Правая часть этого равенства непрерывна по ?, потому что непрерывна левая. Более того, Используя предыдущую теорему, можно показать, что генератором полугруппы T(t) является оператор Л + V. § 4.5. Общая задача об аналитическом конструировании регуляторов Используя результаты по теории дифференциальных уравнений в банаховых пространствах, приведенные в предыдущем параграфе, можно с достаточной пол- полнотой рассмотреть абстрактную задачу об аналитическом конструировании регу- регуляторов, решение которой сводится к уравнению Риккати в банаховых простран- пространствах. В этом параграфе излагается решение задач об оптимальном управлении, которые приводят к абстрактным уравнениям Риккати (дифференциальным и «алгебраическим»). Эти уравнения получаются в процессе решения задач и поэ- поэтому излагаемый материал не содержит прямого указания на вывод уравнений. Затем менее подробно рассматривается вопрос о существовании и единственнос- единственности решений полученных уравнений. 1. Постановка задачи и ее предварительный анализ. Пусть А — гене- генератор (инфинитизимальный производящий оператор) сильно непрерывной полу- полугруппы операторов S(t), определенной на вещественном гильбертовом простран- пространстве Н. Рассмотрим управляемый процесс, который описывается дифференциальным уравнением x(t) = Ax(t) +Bu, 0 < t < Г, E.1) где оператор В линейно и непрерывно отображает гильбертово пространство Ни в Н. В качестве допустимых управлений берутся элементы u(t) из пространст- пространства Wu = 1/2(@,Т),Я^). Решение уравнения E.1) при конкретном управлении и = u(t) и с заданным начальным условием х@) = х0 E.2) определяется однозначно и понимается в интегральном смысле, как это было определено в предыдущем параграфе (см. формулу D.7)). На каждом допустимом управлении и соответствующем ему решении задачи Коши E.1), E.2) функционал J[u] = / (Qx(t),x(t)) dt + f3 (u(t),u(t)) dt E.3) Jo Jo принимает конечное значение. Здесь Q — линейный неотрицательно определен- определенный ограниченный оператор, отображающий Н в себя, а C — положительный числовой параметр.
§ 4.5. Аналитическое конструирование регуляторов 299 Задача об аналитическом конструировании регуляторов в этом случае форму- формулируется следующим образом. Требуется определить элемент и°(.) Е Wu такой, чтобы при любом началь- начальном состоянии E.2) системы E.1) функционал E.3) достигал бы своего наимень- наименьшего возможного значения при и = и°(.). Прежде всего представим функционал E.3) как квадратическую функцию, определенную явным образом на элементах пространства Wu. Для этого положим w(t) = S(t)x(Q), 0 ^ t ^ Г. Пусть W = L((Q,T),H). Обозначим через С линей- линейный ограниченный оператор, отображающий пространство Wu в пространство W в соответствии с равенствами Cf = 9, 9= [ S(t- s)Bf(s) ds, 0 ^ t <C Г, / G Wu. E.4) Jo Тогда функционал E.3) можно представить в виде J[u] = (Q(C(u + w),C(u + w))w + P(u,u), E.5) где первое скалярное произведение берется в пространстве W, что и отмечено соответствующим индексом10. Формулу E.5) перепишем в виде J[u] = ((I + rQ?)w,w) +2(u,C*1lw) + Alw,u). Так как оператор Z+C* QC имеет ограниченный обратный оператор, то можно положить и0 = -A + СQC)'1 СQw. E.6) Тогда находим, что J[u] — J[u°] = ((T+?*Q?)(u-u°), (и-и0)), и, следовательно, функционал J[u] достигает минимального значения в единственной точке и = и0. Само же наименьшее значение этого функционала равно J[u°] = (Qw,Cu° + w). Обозначим через x°(t) решение задачи E.1)—E.2), соответствующее допусти- допустимому управлению u°(t). Тогда очевидно, что x°(t) можно представить в виде x°(t) = Си0 + w, и, согласно E.6), можно записать: и0 + ?*Q?u° + ?*Q = 0. Тогда и0 = ?*ж°, или, более точно, u°(t) = -В* / S(s - t)Qx°(s) ds, O^t^T. E.7) Jt Положим z(t) = / 5*(s — t)Qx°(s)ds. Тогда формально функция z(t) удов- летворяет уравнению z(t) — A*z(t) — Q(t)x°, 0 < t < T, и начальному условию z(T) = 0, или, более точно, ^у'^ = -(z(t),Ax) - (Qz(t),x), 0 < t < Г, для Сии В последующих формулах этот индекс опускается, а параметр C принимается рав- равным единице.
300 Гл. 4. Бесконечномерные уравнения Риккати каждого х из области определения оператора А. Это уравнение имеет единствен- единственное решение, обращающееся в нуль при t = Т. Действительно, если имеется два решения, то их разность y(t) удовлетворяет уравнению E.8) и, безусловно, является непрерывной функцией, обращающейся в нуль при t = Т. Далее для любого t > 0 и любого х из области определения оператора А имеем - ([S*(t + s + a)y(s + а) - 5*(t + s)y(s),x\) = - [y(s + а) - y(s),S(t + s)rr] + + - (y(s + a), S(t + s + а)ж - <S(? + s)ar). E.9) Если x G D(A), то 5(t + s)x G 1)(Д). Поэтому, в силу равенства E.8), первое слагаемое в правой части равенства E.9) сходится к —(y(s),AS(t + s)x) при а —> 0, в то время как второе слагаемое при этом сходится к (y(s),AS(t + s)x). Следовательно, из E.9) в пределе получаем равенство s)y(s),x) )УК h > =о, 0 < s < Т. 5.10 as Так как у(Т) = 0, то из E,10) следует, что (S(t)y@),x) = 0. Из того, что область определения оператора А плотна, следует, что S(t)y(O) = 0 для всех t > 0. Следовательно, у@) = 0. Заменим теперь в равенстве E.10) функцию y(s) на d(S(t + s)y(s + а), х) y(t + а). Тогда получим — =0, 0 < s + а < Т. Следовательно, as (S(t)y(a),x) = 0 для всех t > 0, или у (а) =0, 0 ^ а ^ Г. Таким образом, оптимальная траектория определяется решением следующей двухточечной краевой задачи: = (x°(t),Ay) - (Bz(t),y), t G D(A*), ,x) = -(z(t),Ax) - (Qx°(t),x), x -+ DA), E-n) При этом оптимальное управление u°(t) определяется как решение «интегрально- «интегрального» уравнения в пространстве Wu u°+?*Q?u° = -?*Qw, E.12) или, вводя замену и0 = ?*v°, получаем уравнение г;0 +H??*v° = — Qw в про- пространстве W. Полученная форма представления оптимального управления (в виде функции от времени) не всегда пригодна для практических приложений. Гораздо более удобна форма, когда в оптимальном управлении указывается непосредственная зависимость его от текущего состояния x°(t) системы.
§ 4.5. Аналитическое конструирование регуляторов 301 Решение задачи в такой форме называется синтезом оптимального управления. Построение именно этого решения, как показано ниже, приводит к уравнению Риккати. 2. Синтез оптимального управления. Покажем, что оптимальное управ- управление u°(t), определяемое интегральным уравнением E.12), можно представить в виде u°(t) = -B*lC(t)xo(t). E.13) С этой целью попробуем определить семейство линейных ограниченных опера- операторов V(t), действующих в пространстве Н так, чтобы выполнялось равенство z(t) = V(t)x°(t) или, что эквивалентно, u°(t) = B(t)V(t)x°(t). Если такое семейство операторов удастся найти, то для каждого у из D(A) функция x°(t) должна удовлетворять уравнению d(g°ff'g) = (*°(t), (Л - BB*V(t)yy), E.14) где ж°@) задано (см. E.2)). Это эволюционное уравнение имеет единственное решение (см. § 4.4), которое представимо в виде x°(t) = Ф(Ь, s)x°(s), 0 ^ s ^ t ^ Г, E.15) причем Ф(?, s) = Ф(?, а)Ф(а, s) при s ^ a < t. Следовательно, используя формулу E.7), можно записать u°(t) = -Б* / 5* Jt E.16) Поэтому достаточно, чтобы функция V(t) удовлетворяла равенству следую- Г щему V(t) = / S*(s — t)T^{s^t)xds^ x G Н. Из этого представления следует, Jt что функция V(t)x сильно дифференцируема, если х е D(A). Остается только отметить, что из формулы E.16) получается равенство (V(t)x, V) = jt] {КФ(з, t)x,S(s - t)y) ds = -(Qx, y)- - / (W(s,t)x,S(s-t)y)ds- / ^(s,t)(A-BB*V(t))x,S(s-t)Ay)ds, или {V(t)x,y) = -(Qx,y) - (V(t)x,Ay) - {V(t)Ax,y) + + (V(t)BB*V(t)x,y) =0. E.17) Последнее равенство можно переписать в следующей эквивалентной форме: (P(t)x, у) = -(Qx, у) - (P(t)x, (Л - BB*P(t))) - -(Л- BB*V{t)x, P(t)y) - (P(t)BB'P(t)x, у), E.18)
302 Гл. 4. Бесконечномерные уравнения Риккати с начальным условием V(T) = 0. E.19) Соотношение E.17) (а, следовательно, и E.18)) можно рассматривать как урав- уравнение относительно неизвестной функции V(t). Оно является непосредственным бесконечномерным обобщением конечномерного уравнения Риккати и поэтому оно называется операторным дифференциальным уравнением Риккати. Пример 5.1. Рассмотрим управляемый процесс, описываемый уравнением (см. пример 4.1) Tj~ + 7j~ — u(t, ж), 0 < t < Т, —оо < х < оо, в предположении, что ОЪ (УХ допустимыми управлениями являются функции u(t,.) Е Z/2(@,T), L<2,{—оо, оо)). Критерием оптимальности возьмем функционал j[u]=[Г lf2{t'x)+{^d^J+u2{t'x)]dxdt На классе Cq° функций ср(х) из пространства L<2,{—оо, оо), имеющих непрерыв- непрерывные вторые производные, определим операторы А и Q следующими соотношени- 2 . dip(x) _ д(р(х) . ч ями Лю — ;—, Qip = ^—^ \- <р(х), -оо < х < оо. Тогда уравнение, ах oxz описывающее процесс, можно записать в виде —-— = Af(t) + u(t). Поскольку at для любой функции (р(х) G Cq° справедливы равенства то критерий оптимальности можно представить в виде J[u}= [ (Qf(t),f(t))dt+ [ (u(t),u(t))dt. Jo Jo Расширяя операторы А и Q на все пространство L2(-oo,oo) и сохраняя при этом прежние обозначения, получаем стандартную задачу об аналитическом кон- конструировании регуляторов для процесса E.1) с критерием оптимальности E.3). Как отмечалось в примере 4.1, оператор А является генератором (инфинитези- мальным порождающим оператором) полугруппы сдвига: T(t)f = /(., —t) и ре- решение уравнения, описывающего процесс, можно представить в следующем виде f(t) = T(t)f(O) + f T(t-s)u(s)ds. Jo Уравнение Риккати в форме E.17) относительно оператора T(t) можно перепи- переписать, используя конкретное представление скалярного произведения в простран- пространстве L2(-oo,oo): , &p{x)dil){x) , ох
§ 4.5. Аналитическое конструирование регуляторов 303 с начальным условием V(T) = 0. При этом предполагается, что оператор V(t) обладает полугрупповыми свойствами. Это непосредственно следует из способа вывода уравнения E.17). Некоторое представление о его структуре дает фор- формула E.16). Однако, в ее правой части содержится оператор Ф(?,з), который определяется уравнением E.14), содержащим неизвестный оператор V(t). 3. Задача об оптимальной стабилизации. Рассмотрим теперь ту же динамическую систему E.1), но в предположении, что Т = оо, т.е. будем пред- предполагать, что процесс протекает на бесконечном временном интервале 0 < t < оо. Итак, будем рассматривать управляемый процесс, который описывается урав- уравнением x(t) = Ax(t) + Bu(t), 0 < t < оо, E.20) с начальным условием E.2). Ясно, что в этом случае мы должны ограничиваться лишь теми управлениями, для которых критерий оптимальности гоо гоо J[u}= (Qx(t),x(t))dt + (u(t),u(t))dt E.21) Jo Jo принимает конечные значения. Поэтому в качестве множества допустимых уп- управлений можно брать Wu = Z/2(@, оо), Ни), где Ни — гильбертово пространство. В первую очередь следует решить вопрос о конечности функционала E.21) для каждого управления и(.) Е Ни при любом выборе начальной точки х° в условии E.2). В теории дифференциальных уравнений доказывается, что для этого достаточно потребовать, чтобы выполнялось неравенство / (QS(t)x, S(t)x) dt < оо. E.22) Выполнением этих условий мы и ограничимся в решении рассматриваемой за- задачи минимизации функционала E.21). При этом будем пользоваться следую- следующим определением. Полугруппу операторов S(t) будем называть экспоненциаль- экспоненциально устойчивой, если ио < 0, где (см. § 4.3) ио = inf . Одним из наглядных примеров экспоненциально устойчивой полугруппы операторов явля- является полугруппа, порожденная оператором Лапласа. Отметим, что диссипатив- ная компактная и самосопряженная полугруппа операторов будет экспоненциаль- экспоненциально устойчивой, если число нуль не является собственным значением генератора (инфинитезимального производящего) оператора. Ясно, что экспоненциальная устойчивость не является необходимым условием, при котором выполняется не- неравенство E.22). Теорема 5.1. Предположим, что полугруппа S(t) экспоненциально устойчи- устойчива. Тогда оптимальное управление u°(t) (минимизирующее функционал E.21)) единственно и представимо в виде U°(t) = -BVx°(t), E.23)
304 Гл. 4. Бесконечномерные уравнения Риккати где x°(t) — единственное решение уравнения (x°(t),y) = (xo,y)+ I (x°(s),(A + V)*y)ds, yeD(A). E.24) Jo Здесь линейный ограниченный оператор V, отображающий пространство Н в себя, является единственным решением «алгебраического» уравнения Риккати (Qx, у) + (Vx, Ay) + (Ах, Ту) - (B*Vx, B*Vy) = 0. E.25) Доказательство. Каждому управлению и(.) е Wu поставим в соответствие функцию = / S(t- Jo g(t) = / S(t- s)Bu(x) dsw, 0 < t. E.26) Jo Так как полугруппа S(t) экспоненциально устойчива, то существует постоянная Л < 0 такая, что ||5(t)|| < Mext. Следовательно, dt = roo roo / rt / Ш||2^||Б||2М2 / / ex^-^\\u(s)\ Jo Jo \Jo ) = \\B\\2M2 f°° I f ext\\u(t-s)\\ds) dt = = \\B\\2M2 f°° f°° f°° eXaeXs\\u(t - a)\\\\u(t - s)\\dadsdt. Jo Jo Jo Полагая ||ia(s)|| = 0 при s < 0, можно продолжить эту цепочку равенств: оо \\В\\2М2 / / eXaeXa\\u(t-a)\\\\u(t-s)\\dtdsda. Jo Jo J max(a,) Применяя неравенство Шварца, находим, что полученное выражение не пре- роо roo \\jg\\2 j^j-2 восходит величины ||Б||2М2 / / eXaeXs dads\\u\\ = -^ 1М|2- Следова- Следовало Jo * тельно, равенство E.26) определяет линейный непрерывный оператор, отобража- отображающий пространство Wu в пространство W = L2(@, оо), Я). Более того, критерий оптимальности E.21) можно переписать в виде J[u] = (QCu,Cu) + (и,и). Тогда точно так же, как и в задаче об аналитическом конструировании ре- регуляторов (см. первый пункт настоящего параграфа), получаем, что оптималь- оптимальное управление единственно и представимо в виде и0 = -(C*QC +T)~1C*w, и0 = ?*Qx°, x° = Си0 + w, или roo u°(t) = -B* S*(t-s) Qx° ds. E.27) ./о
§ 4.5. Аналитическое конструирование регуляторов 305 Докажем теперь, что оптимальное управление можно представить в виде u°(t) = -B8Vx°(t), E.28) где V — линейный ограниченный оператор, отображающий пространство Н в се- себя. Для этого воспользуемся соответствующими результатами в решении задачи об аналитическом конструировании регуляторов. Пусть V{t) — решение уравне- уравнения Риккати E.18) с дополнительным условием E.19). Введем новый оператор, положив Vf{t) = Т(Т — t). Тогда оператор Vf{t) будет удовлетворять уравнению {Vf(t)x,y) = (Pf(t)X,Ay) + {Ax,rf(t)y) + (Qx,y)-(rf(t)BB*rf(t)x,y) E.29) и начальному условию ?7@) = 0. E.30) Важной особенностью решения задачи E.29)-E.30) является тот факт, что оно не зависит от Г. Можно показать, что минимальное значение функционала E.3) равно (Vf(T)x,x). Так как на оптимальном управлении функционал E.3) прини- принимает наименьшее возможное значение, то легко доказывается следующий факт. Пусть Т2 > Гь a u%(t), 0 ^ t ^ 7\ и u%{t), 0 ^ t ^ Т2 — соответствующие оптимальные управления в задаче минимизации функционала E.3) при Т — Т\ и Т = Т2, соответственно. Тогда можно считать, что Ui(.) и ^2(.) принадлежат пространству L2(@,T2), H). Если при выборе этих управлений начальное состо- состояние E.2) системы E.1) берется одним и тем же, то справедливо J[u^\ ^ Jf^?], и, следовательно, (Vf(T2)x,x) ^ (P/(Ti)x,x). E.31) С другой стороны, из уравнения E.29) и начального условия E.30) следует, что Vf(t)x= f S*(t-s)QS(t-s)xds- Jo - f S*(t - s)Vf(s)BB*Vf(s)(t - s)xds. E.32) Отсюда следует, что (Vf(t)x,x) ^ [ (US*(t-s)x,S*(t-s)x)ds^ Jo (t-s)x,S*(t- s)x) ds = (9Ъ, x), / S(a)US*(a)da. Jo В силу условия экспоненциальной устойчивости рассматриваемой полугруппы операторов, последний интеграл сходится и определяет линейный ограниченный оператор, отображающий пространство Н в себя. Этот оператор, кроме того,
306 Гл. 4. Бесконечномерные уравнения Риккати самосопряжен и является неотрицательно определенным. Следовательно, моно- монотонно возрастающая функция (V(t)x,x) имеет конечный предел при t —> оо, а так как 2(Vf(t)x,y) = {Vf(t)(x + у),х + у) - (Vf(t)x,x) - {Vf(t)y,y), то для всех х,у Е Н функция (Vf(t)x,y) имеет предел при t —> оо. Отсюда следует существование сильного предела Vf(t) при t —у оо, и тем самым определен ли- линейный ограниченный оператор (кроме того, он является самосопряженным и неотрицательным): lim x = Тх. Из оценки 117^/(^I1 ^ \\V\\ и экспоненциальной устойчивости полугруппы сле- следует, что интеграл, стоящий слева в равенстве rt rt / \\B*Vf(s)S(t - s)x\\2ds =/ \\B*Vf(t-s)S(s)x\\2ds, Jo Jo roo сходится к / \\B*VS(s)x\\2 ds при t —У оо. Jo Таким образом, переходя к пределу в равенстве E.32), получим гоо Vx = V\x- 5* (s)VBB*VS(s) ds, E.33) Jo из которого следует, что для всех х и у из области определения оператора Л оператор V удовлетворяет «алгебраическому», уравнению Риккати E.25). Согласно теореме 4.6, оператор Я = A — BB*V порождает сильно непрерывную полугруппу. Обозначим ее через T(t). Тогда для любого х G D(A) выполняется ^-(PT(t)x,r(t)x) = (VT(t)x,(A - BB*V)T(t)x) = ((A-BB*P)T(t)x,PT(t)x). Из уравнения Риккати E.25) следует, что правая часть последнего равенства равна -(QT(t)x,T(t)x) - (B*VT(t)x,B*VT(t)x). Следовательно, (Vx,x)-(VT(t)x,T(t)x) = rt rt = / (QT(t)x,T(t)x)dt+ / (B*VT(t)x,B*VT(t)x)dt. E.34) Jo Jo Значит, правая часть этого равенства не превосходит (Vx,x). С другой сторо- стороны, она не убывает с возрастанием t. Поэтому она имеет предел при t —У оо. Значит, функция (VT(t)x,T(t)x) также имеет предел при t —У оо. Сам факт существования предела правой части равенства E.34) означает, что функция u(t) = -B*Vx(t), x(t) = T(t)x0 E.35) принадлежит пространству Wu. Но, как было показано в предыдущем параграфе, ft функция / S(t — s)Bu(s) ds + S(t)xo = x(t), 0 ^ t < оо, является элементом Jo пространства W и, следовательно, (Vx(t),x(t))dt < оо. E.36) I" Jo
§ 4.5. Аналитическое конструирование регуляторов 307 Из равенства E.34) следует, что функция (Vx(t),x(t)), где x(t) = T(t)x, имеет предел при t —> оо. В силу E.36), этот предел должен быть равен нулю. Остается показать, что управление u(t), определяемое формулой E.35), может быть представлено в виде E.27), Так как / S*(s-t)QT(s)xods= f S*(s-t)QT(s-t)T(t)xods = it io = / S*(s)QT(s)T(t)xods, io то для этого достаточно показать, что оператор V представляется в следующем гоо видеРж= / S*{s)QT{s)xds. io Оператор, определенный правой частью этого равенства, обозначим через Л. Каждое управление и(.) из 1/2(@, оо), Ни), очевидно, является элементом про- пространства 1/2(@,Т),Я^) для любого Г > 0 и поэтому критерий оптимальности E.21) не меньше (Vf(T)x,x). Следовательно, для оптимального управления и°(.), определенного на полуоси [0, оо), имеем J[u°] ^ sup(Vf(T)x,x) = (Vx,x). Значение критерия оптимальности на управлении, определенном соотношени- соотношением E.35), равно (Vx,x). Поэтому равенство E.35) определяет оптимальное управ- управление, которое представляется формулой E.27). Следовательно, В*Пх = B*Vx. E.37) Так как / ||T(s)x||2(is < оо для любого элемента ж, то при Л > 0 выполняется (гоо \ гоо гоо / e~xt\\T(t)x\\dt) ^ e~2Xtdt \\T(t)\\2dt < оо. Отсюда io J io io следует существование резольвенты полугруппы T(t) для каждого Л > 0. Отсюда, в частности, следует, что ujq ^ 0 или, что то же самое, lim e~At||T(t)|| = 0 для t—^oo любого Л > 0. Таким образом, для произвольных х,у G D(A) интегрированием по частям получим Пх.Ау) = j \QT(s)x, ^-sS(s)u) ds = J (QT(s)x,S(s)y) ds- - П(QT(s)Sx,S(s)y) ds = -(Qx,y) - (ПЯх,у), E.38) где Я = Л - BB*P. Положим 7Zo —71 — V. Тогда «алгебраическое» уравнение Риккати E.25) вмес- вместе с соотношением E.38) приводит к равенству (TZox,Ay) + 7ZoAx,y) = 0. Сле- Следовательно, GZoS(t)x,AS(t)y) + (yoAS(t)x,S(t)y) = 0 и поэтому имеет мес- место — (TZoS(t)x,S(t)y) = (lloS(t)x,S(t)y) + (lloAS(t)x,S(t)y) или справедли- справедливо (TZoS(t)x,S(t)y) = (iZox,y). Но ||5(t)|| —> 0 при t —у оо. Следовательно, (Пох,у) =0 или 7l = V.
308 Гл. 4. Бесконечномерные уравнения Риккати В заключение отметим, что единственность решения «алгебраического» урав- уравнения Риккати E.25) следует из того, что если оператор V является решением, то управление u(t) = —B*Vx(t) будет оптимальным и соответствующее ему зна- значение критерия оптимальности равно (Vxo,xo). Завершая анализ уравнений Риккати в бесконечномерных пространствах, сле- следует еще раз подчеркнуть, что приведенные результаты свидетельствуют о важ- важной роли этих уравнений при решении различных задач математической физики и теории управления. Кроме того, в каждом из рассмотренных случаев урав- уравнение Риккати может быть описано в терминах функционального анализа и для его исследования можно применять мощный аналитический аппарат банаховых алгебр и теории групп Ли.
СПИСОК ЛИТЕРАТУРЫ 1. Андреев Ю.А. Управление конечномерными линейными объектами. — М.: Наука, 1976. — 424 с. 2. Балакришнан А.В. Прикладной функциональный анализ. — М.: Наука, 1980. — 383 с. 3. Биргер Е.С. и Ляликова Н.Б. О нахождении для некоторых систем обыкновенных дифференциальных уравнений решений с заданными условиями на бесконечности. I // ЖВМиМФ. — 1965. — Т. 5, № 6. — С. 979-990; II // ЖВМиМФ. — 1966. — Т. 6, № 3. — С. 446-453. 4. Бреховских Л.М. Волны в слоистых средах. — М.: Изд-во АН СССР, 1957. — 520 с. 5. Гантмахер Ф.Р. Теория матриц. — М.: Наука, 1967. — 576 с. 6. Гайшун И.В. Линейные уравнения в полных дифференциалах. — Минск: Наука и техника, 1989. — 254 с. 7. Гельфанд И.М. и Локуциевский О.В. Метод прогонки для решения разностных уравнений // Годунов С.К., Рябенький B.C. Введение в теорию разностных схем. — М.: Наука, 1962. — 340 с. 8. Гюнтер Н.М. Интегрирование уравнений первого порядка в частных производных. — М.: ГТТИ, 1934. — 360 с. 9. Джонсон Б.Л., Вендлинг Д.Е. Передаточные функции и входные импедансы систем трубопроводов, находящихся под давлением // Теор. основы инж. расчетов. — 1967. — Т. 2. — С. 291-303. 10. Егоров А.И. Оптимальное управление тепловыми и диффузионными процессами. — М.: Наука, 1978. — 464 с. 11. Егоров М.А. Некоторые свойства матричных уравнений Риккати. — М., 1990. — 20 с. — (Препр. / Ин-т прикл. мат. АН СССР; №147). 12. Егоров М.А. Об одном критерии линеаризуемости матричного уравнения Риккати и некоторых свойствах его решений // Диф. уравнения. — 1993. — № 10. — С. 1684- 1688. 13. Егоров М.А. Уравнение Риккати в функциональных пространствах и некоторые его свойства // Труды международного семинара «Современный групповой анализ». — Уфа, 1991. 14. Егоров М.А. О матричных уравнениях Риккати // Диф. уравнения. — 1995. — № 1. — С. 23-29. 15. Егоров М. A. On group analysis of Riccati equations // Proc. of the International Conference MOGRAN 2000. — Ufa, 2000. 16. Егоров М.А. Integration of matrix Riccati equations // Proc. of the International Conference MOGRAN 2000. — Ufa, 2000. 17. Егоров М. A. Matrix and operator Riccati equations: symmetries, solutions, linea- linearization // Abstracts of the International Conference MOGRAN 2000. — Ufa, 2000. — P. 28.
310 Список литературы 18. Еругин Н.П. Книга для чтения по общему курсу дифференциальных уравнений. — Минск: Наука и техника, 1970. — 570 с. 19. Журавлев В.Ф., Климов В.М. Прикладные методы в теории колебаний. — М.: Наука, 1988. — 326 с. 20. Захар-Иткин М.Х. Методы численного решения граничных задач для матричных телеграфных уравнений // Электричество. — 1971.— Т. 2. — С. 33-37. 21. Захар-Иткин М.Х. Матричное дифференциальное уравнение Риккати и полу- полугруппа дробно-линейных преобразований // УМН. — 1973. — Т. XXVIII, вып. 3 A7/1). — С. 83-120. 22. Ибрагимов Н.Х. Азбука группового анализа // В серии «Математика и киберне- кибернетика». 8. — М.: Знание, 1989. — 46 с. 23. Ибрагимов Н.Х. Опыт группового анализа обыкновенных дифференциальных уравнений // В серии «Математика и кибернетика». 7. — М.: Знание, 1991. — 48 с. 24. Колмогоров А.И., Фомин СВ. Элементы теории функций и функционального анализа. — М.: Наука, 1968. — 496 с. 25. Красовский И.И. Теория управления движением. — М.: Наука, 1968. — 476 с. 26. Лаппо-Данилевский И.А. Применение функций от матриц к теории линейных систем обыкновенных дифференциальных уравнений. — М.: ГИТТЛ, 1957. — 456 с. 27. Летов A.M. Аналитическое конструирование регуляторов // Автоматика и теле- телемеханика. — 1960. — Т. 21, № 4-6; 1961. — Т. 22, № 2, 4; 1962. — Т. 23, № 11. 28. Лионе Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. — М.: Мир, 1972. — 414 с. 29. Люстерник Л.А., Соболев В.И. Краткий курс функционального анализа. — М.: Высшая школа, 1982. — 272 с. 30. Мальцев А.И. Основы линейной алгебры. — М.: ГИТТЛ, 1956. — 340 с. 31. Марчук Г.И. Методы расчета ядерных реакторов. — М.: Атомиздат, 1961. — 576 с. 32. Овсянников Л.В. Групповой анализ дифференциальных уравнений. — М.: Наука, 1978. — 398 с. 33. Овсянников Л.В., Ибрагимов Н.Х. Групповой анализ дифференциальных уравне- уравнений механики. // Итоги науки и техники. Общая механика. 2. — М.: ВИНИТИ, 1975. — С. 5.-52. 34. Понтрягин Л.С. Избранные научные труды. Т. 3. — М.: Наука, 1988. — 342 с. 35. Ройтенберг Я.Н. Автоматическое управление. — М.: Наука, 1978. — 551 с. 36. Рудин У. Функциональный анализ. — М.: Мир, 1975. — 443 с. 37. Сагитов М.С. Об одной модификации метода Шура решения матричного алгеб- алгебраического уравнения Риккати // ЖВМиМФ. — 1992. — Т. 32, № 3. — С. 348-357. 38. Степанов В.В. Курс дифференциальных уравнений. — М.: ГТТЛ, 1953. — 468 с. 39. Треногий В.А. Функциональный анализ. — М.: Наука, 1980. — 496 с. 40. Bunse-Gerstner A., Mehrmann V. A symplectic GR like algorithm for the solution of the real algebraic Riccati equation // IEEE Trans. Automat. Control. — 1986. — V. 31. — P. 1104-1111. 41. Byers R. A Hamiltonian-Jacobi algorithm // IEEE Trans. Automatic. Control. — 1990. — V. 35. — P. 566-570.
Список литературы 311 42. Laub A.L. A Schur method for solving algebraic Riccsti equations // IEEE Trans. Automat. Control. — 1979. — V. 24. — P. 913-921. 43. Mycieski J., Paszkowski S. Sur une probleme du calcul de probabilite // Studia Math. — 1956. — V. 15, № 2. — P. 134-144. 44. Paige Ch., Van Loan Ch. A Shur decomposition for Hamiltonian matrices // Linear Algebra and its Appl. — 1981. — V. 41. — P. 11-32. 45. Reid W.T. Riccati differential equations. — Academpress: New York London, 1972. 46. Sternberg R.L. Application of the theory of systems of differntial equations to vibrating bims // Portugaliae Mth. — 1954. — V 13, № 3.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Алгебра 84 — банахова 51 — комплексная 51 — Ли 84, 86, 167, 185 Ангармоническое отношение 143, 196 Антисимметрия (косая симметрия) 180 Вектор управлений 203 — присоединенный 20 Генератор 280 Гомеоморфизм 73 Гомоморфизм 52 — комплексный 52 Градиент (производная сильная) 45 Граничное значение функции 294 Группа Ли 67 — эквивалентностей 93 — многопараметрическая 85 — основная 92 — продолженная 82 Групповой параметр 67 Действие локальное 67 Делитель инвариантного множителя 16 — матрицы элементарный 16 Дифференциал Гато 46 — слабый 46 — Фреше (сильный дифференциал) 45 — n-го порядка 49 Дифференцирование инвариантное 91 Допустимое управление 203 Задача Фробениуса 100 — об аналитическом конструировании регуляторов 203 оптимальной стабилизации 207 оптимальном распределенном управлении 269 Задача об оптимальном управлении 203, 270 Закон умножения преобразований 85 Значение функции на спектре матрицы 30 Идемпотент 63 — нетривиальный 63 — тривиальный 63 Инвариант 93 — группы 69, 89 — дифференциальный 91 — универсальный 71 Индекс нильпотентности 110 — точки 55 Инфинитезимальный оператор 167 Касательная к орбите 67 Клетка Жордана 16 Кольцо 58 Коммутатор 65, 84, 167, 179 — векторных полей 86 — вектор-операторов 179 — матриц-операторов 179 Компоненты матрицы 30 Константы структурные 167 Краевая задача Риккати 272, 273 Критерий качества 203 — эквивалентности матриц 13 Логарифм 62 Матрица Грама 278 — Коши 135 — гамильтонова 213 — идемпотентная 103 — каноническая диагональная 10 — многочленная 9 — невозрастающая 223 — неотрицательно определенная 223 — неубывающая 223
Предметный указатель 313 Матрица перестановочная 21 — правильной треугольной формы 97 — положительно определенная 223 — регулярная 13 — резольвентная 30 — симплектическая 213 — сопровождающая 213 — J-симметричная 213 — J-хессенберговая 216 — А-матрица 9 Матрица-оператор 179 Матрицы подобные 13 — скалярно эквивалентные 13 — эквивалентные 9 Мера 58 — борелевская 59 Метод Шура 213 — прогонки 197 Многообразие дифференциальное инвариантное 91 — дифференцируемое 91 — инвариантное 73, 89 — неособое 90 — особое 90 — регулярно заданное 89 Многочлен минимальный 15 Множество резольвентное 41, 54 Множитель инвариантный 11 Норма билинейного оператора 48 Область сходимости ряда 40 Окрестность матрицы 24 Оператор билинейный 48 — Вольтерра интегральный 42 — Дирихле 294 — диссипативный 283 — дифференцируемый 45 — инфинитезимальный 71, 176, 178 векторный 179 производящий 280 — краевой задачи 264 — линейный 37 — полилинейный 73 — «полного» дифференцирования 79 Оператор продолженный 83, 178 Оператор-функция аналитическая в точке 43 Операторы усеченные 80 Орбита точки 67 Остаток левый 14 — правый 14 Отображение спектров 61 — полилинейное симметричное 74 — п-линейное 49 Поле векторное 67, 86 — касательное векторное 67 Полином Лагранжа 29 — Лагранжа-Сильвестра 29 — аннулирующий 15 Полугруппа диссипативная 283 — компактная 286 — линейных операторов 279 — ограниченная 282 — сжимающая 282 — сильно непрерывная 279 — устойчивая экспоненциально 303 Полукольцо 58 Порядок сопряжения 245 Постоянные структурные 85, 185 Преобразование локальное 67 — пространства 85 — точечное 77 — эквивалентности 93 — элементарное 9 Принцип максимума 270 Прогонка обратная 198 — прямая 197, 198 Продолжение оператора к-е 83 — пространства 75 Произведение (^-произведение) 156 Производная Гато 46 — Ли 87 — сильная (градиент) 45 — слабая 46 — Фреше 64 Пространство матриц интегрируемых по Лебегу 224 — непрерывных матриц 224
314 Предметный указатель Пространство параметрическое 85 — Vmn[a,b] 224 — Япг[а,Ь] 224 Псевдогруппа бесконечная 87 Радиус спектральный 41, 54 Размерность алгебры 185 Разность разделенная 64 Расширение оператора 289 Резольвента 41, 281 Решение главное 251 — инвариантное 190 — инвариантное 190 — неособенное 135 — нормализовано 250 — обобщенное 296 — особое в точке 251 Ряд матриц степенной 25 — Тейлора 40 Сильный дифференциал (Фреше) 45 Символ «полного» дифференцирования 76 Симметрия косая 167, 180 Синтез оптимального управления 301 Система анормальная 245 — несопряженная 244 — определяющих уравнений 168 — решений фундаментальная 171 — уравнений Риккати бесконечная 274 нормальная 245 присоединенная 259 — частных решений фундамен- фундаментальная 171 Системы с распределенными парамет- параметрами 269 — эквивалентные 93 Собственный элемент 41 Спектр оператора 41 — точечный 63 — элемента 54 Спектральный радиус 41 Специализация элемента 93 Сходимость операторов равномерная 38 Сходимость последовательности матриц 24 — степенного ряда матриц 25 — сильная 38 Теорема Ли 68 Тождество Якоби 84, 167, 180 Точка регулярная 41 Точки сопряженные (взаимно) 244 Тройка диссипативная консервативная 157 Уравнение Беллмана 204, 270 — Бернулли 139 — Винера 210 — Ли 68 — Риккати алгебраическое 105, 208, 304 бесконечномерное 274 операторное 268, 269 дифференциальное 302 — определяющее 87, 181 — полиномиальное 104 — скалярное 103 — эволюционное 296 Фазовый вектор 203 Фильтр 209 — оптимальный 209 Форма вещественная Шура 214 Формула конечных приращений 47 — Коши 29, 139 — Лагранжа-Сильвестра 29 — продолжения 78 — Тейлора 50 Формулы продолжения поля 83 Функция абстрактная 40 — абстрактная аналитическая 40 — голоморфная 25 — сильно (слабо) голоморфная 55 Цепочка жорданова 112 Частное левое 14 — правое 14 Элемент обратимый 52 — собственный 41
ОГЛАВЛЕНИЕ Предисловие 3 Введение 5 Глава 1. Матрицы, операторы и группы 9 § 1.1. Матричные многочлены 9 1. Эквивалентные матрицы и инвариантные множители 9 2. Каноническая форма Жордана 15 3. Преобразование матриц 18 4. Перестановочные матрицы 21 § 1.2. Функции от матриц 24 1. Мажорантные матрицы. Ряды матриц 24 2. Представление функций от матриц 28 3. Аналитическое продолжение функции от матрицы 32 4. Некоторые свойства функций от матриц 33 § 1.3. Операторы и абстрактные функции 37 1. Линейные операторы 37 2. Пространство линейных операторов 38 3. Обратные операторы 39 4. Абстрактные функции числового аргумента 40 5. Резольвентный оператор R\(A) 40 6. Нелинейные операторы и их дифференцирование 45 7. Производные и дифференциалы высших порядков. Формула Тейлора 47 § 1.4. Банаховы алгебры 50 1. Основные определения и примеры 51 2. Основные свойства спектра 54 3. Функциональное исчисление на банаховых алгебрах 58 4. Дифференцирование 63 § 1.5. Группы Ли 66 1. Основные определения и примеры 66 2. Теория продолжения 73 3. Продолжение группы и инфинитезимального оператора 82 4. Коммутаторы 83 § 1.6. Многопараметрические группы в конечномерных пространствах .... 85 1. Группы, векторные поля и алгебры Ли 85 2. Определяющее уравнение и производная Ли 87
316 Оглавление 3. Продолженные группы и их инварианты 90 4. Вычисление основной группы 91 5. Групповая классификация и инвариантные решения 92 Глава 2. Матричные алгебраические и дифференциальные уравнения Риккати 95 § 2.1. Матричные многочленные уравнения 95 1. Уравнение АХ - ХВ = 0 95 2. Перестановочные матрицы 100 3. Решение линейного неоднородного уравнения 102 4. Скалярное уравнение 103 5. Полиномиальные уравнения 104 § 2.2. Квадратный корень из матрицы 105 1. Уравнение с жордановой матрицей 105 2. Уравнение с особенной матрицей 109 § 2.3. Алгебраическое уравнение Риккати 114 1. Общий анализ. Примеры 114 2. Уравнение вида Y2 + AY + YB + Р = 0 120 3. Связь уравнений Риккати с линейными уравнениям 125 § 2.4. Линейные дифференциальные уравнения 134 1. Однородное уравнение 134 2. Неоднородное уравнение 137 3. Частное решение неоднородного уравнения. Формула Коши 138 4. Уравнение Бернулли 139 § 2.5. Скалярное уравнение 140 1. Общие свойства решений 141 2. Примеры интегрируемых уравнений Риккати 143 3. Свойства решений 146 4. Существование решений 153 5. Некоторые дополнительные свойства уравнения Риккати 154 § 2.6. Матричное дифференциальное уравнение Риккати 158 1. Простейшие свойства уравнения 158 2. Уравнение с постоянными коэффициентами 160 3. Существование решения 163 § 2.7. Групповой анализ уравнения Риккати 166 1. Группы, допускаемые уравнениями. Фундаментальные решения 166 2. Скалярное уравнение Риккати 171 3. Уравнение Риккати на плоскости 174 § 2.8. Групповой анализ матричного уравнения Риккати 175 1. Однопараметрические группы преобразований и их операторы 175
Оглавление 317 2. Многопараметрические группы и их операторы 178 3. Определяющее уравнение. Алгебра Ли 180 4. Интегрирование уравнения Риккати заменой переменных 185 5. Инвариантные решения 190 § 2.9. Линеаризация матричного уравнения Риккати 192 1. Условия линеаризуемости 192 2. Ангармоническое отношение решений уравнения A) 195 § 2.10. Уравнение Риккати в методе прогонки 197 1. Краевая задача для скалярного дифференциального уравнения 197 2. Краевая задача для векторного дифференциального уравнения 200 § 2.11. Уравнение Риккати в теории управления 202 1. Задачи об аналитическом конструировании регуляторов и об оптимальной стабилизации [27] 202 2. Оптимальный фильтр Каллмана-Бьюси 208 §2.12. Приближенное решение матричных уравнений Риккати 212 1. Решение алгебраического уравнения методом Шура 212 2. Метод блочного приведения гамильтоновой матрицы к форме Шура 215 3. Итерационный метод решения дифференциального уравнения Риккати .... 219 Глава 3. Проблемы разрешимости матричных дифференциальных урав- уравнений Риккати 223 § 3.1. Связь уравнений Риккати с линейными системами 225 1. Вспомогательные утверждения 225 2. Вариация решений 230 3. Преобразование уравнения A.1) и системы A.4м) 238 § 3.2. Свойства решений 243 1. Ассоциированные дифференциальные уравнения Риккати 243 2. Нормальность и анормальность решений 244 3. Особенные решения матричного дифференциального уравнения Риккати . . . 251 § 3.3. Обобщенные системы дифференциальных уравнений и матричные ин- интегральные уравнения Риккати 254 Глава 4. Уравнения Риккати в задачах управления системами с распре- распределенными параметрами 263 § 4.1. Уравнения Риккати в математической физике 263 1. Краевые задачи и операторы 264 2. Операторное уравнение Риккати в математической физике 267 § 4.2. Краевая задача Риккати в управляемых системах с распределенными параметрами 269
318 Оглавление 1. Задачи об оптимальном распределенном управлении 269 2. Интегро-дифференциальная краевая задача Риккати 271 3. Задача оптимизации с управляющей функцией, зависящей только от времени . 272 4. Бесконечные системы дифференциальных уравнений Риккати 273 5. Построение формального решения краевой задачи Риккати 276 6. Управление системой с неконтролируемыми возмущениями 278 § 4.3. Полугруппы линейных операторов 279 1. Определения и основные свойства полугруппы 279 2. Полугруппы над гильбертовым пространством. Диссипативные полугруппы . . 283 3. Компактные полугруппы и операторы 286 4. Расширение операторов 288 § 4.4. Дифференциальные уравнения в функциональных пространствах ... 291 1. Стационарное уравнение 291 2. Задачи с неоднородными граничными условиями 293 3. Эволюционное уравнение 296 § 4.5. Общая задача об аналитическом конструировании регуляторов .... 298 1. Постановка задачи и ее предварительный анализ 298 2. Синтез оптимального управления 301 3. Задача об оптимальной стабилизации 303 Список литературы 309 Предметный указатель 312
Научное издание ЕГОРОВ Александр Иванович УРАВНЕНИЯ РИККАТИ Редактор Е.Ю. Ходан Оригинал-макет автора ЛР № 071930 от 06.07.99. Подписано в печать 30.08.01. Формат 70x100/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 20. Уч.-изд. л. 28,2. Тираж 400 экз. Заказ тип. № Издательская фирма «Физико-математическая литература» МАИК «Наука/Интерпериодика» 117864 Москва, Профсоюзная ул., 90 Отпечатано с готовых диапозитивов в ППП «Типография «Наука» 121099 Москва, Шубинский пер., 6 ISBN 5-9221-0159-5 9 785922 101592
A.I. EGOROV RICCATI EQUATIONS PHYSICS AND MATHEMATICS PUBLISHERS International Academic Publishing Company «Nauka» Russian Academy of Sciences Moscow, 2001, 320 pages Abstract. Scalar, matrix and operator Riccati equations are considered. Theoretical questions and practical methods of solution of this equations are expounded. Necessa- Necessary auxiliary facts from algebra, functional analysis and Lie group analysis are given. Theoretical facts are illustrated with solution of numerous examples. The matrix Riccati equations are presented completely. Lie groups on matrices theory have been advanced for the analysis of this equations. Theoretical questions on matrix and operator equations are expounded on the base of variety applied problems from mathematical physics and optimal control of finite dimensional systems and distribu- distributed parameters systems. Author. Alexander Ivanovich Egorov, born 1930. Education: Kirgizian State University, D. Sc. (Phys. & Math.). Professor at Moscow Institute of Physics and Technology, leading scientific researcher in Program Systems Institute RAS. Over 100 papers in the theory of optimal control and 3 monographs: Optimal control by heat and diffusion processes. — Moscow: Nauka, 1978; Optimal control by linear systems. — Kiev, 1988; Mathematical methods of the optimization of heat and diffusion processes (with R.R. Rafatov). — Frunze, 1990.