Автор: Гантмахер Ф.Р.  

Теги: математика  

Год: 1967

Текст
                    Ф.Р. Гантмахер
ТЕОРИЯ МАТРИЦ


Содержание Предисловие автора к первому изданию 7 Предисловие редактора ко второму издания 10 ЧАСТЫ ОСНОВЫ ТЕОРИИ Глава I. Матрицы и действия над ними 13 § 1. Матрицы. Основные обозначения 13 § 2. Сложение и умножение прямоугольных матриц 15 § 3. Квадратные матрицы 24 § 4. Ассоциированные матрицы. Мниоры обратной матрицы 30 § 5. Обращение прямоугольных матриц. Псевдообратная матрица 32 Глава II. Алгоритм Гаусса и некоторые его применения 41 § 1. Метод исключения Гаусса 41 § 2. Механическая интерпретация алгоритма Гаусса 45 § 3. Детерминантное тождество Сильвестра 47 § 4. Разложение квадратной матрицы на треугольные множители 49 § 5. Разбиение матрицы на блоки. Техника оперирования с блочными 55 матрицами. Обобщенный алгоритм Гаусса Глава III. Линейные операторы в н-мериом векторном пространстве 65 § 1. Векторное пространство 65 § 2. Линейный оператор, отображающий «-мерное пространство в т- 70 мерное § 3. Сложение и умножение линейных операторов 71 § 4. Преобразование координат 73 § 5. Эквивалентные матрицы. Ранг оператора. Неравенства Сильвестра 74 § 6. Линейные операторы, отображающие «-мерное пространство само в 79 себя § 7. Характеристические числа и собственные векторы линейного 82 оператора § 8. Линейные операторы простой структуры 84 Глава IV. Характеристический и минимальный многочлены матрицы 87 § 1. Сложение и умножение матричных многочленов 87 § 2. Правое и левое деление матричных многочленов. Обобщенная теорема 89 Безу § 3. Характеристический многочлен матрицы. Присоединенная матрица 92 § 4. Метод Д. К. Фаддеева одновременного вычисления коэффициентов 96 характеристического многочлена и присоединенной матрицы § 5. Минимальный многочлен матрицы 98 Глава V. Функции от матрицы 103 § 1. Определение функции от матрицы 103 § 2. Интерполяционный многочлен Лагранжа—Сильвестра 108
§ 3. Другие формы определения j(A~). Компоненты матрицы^! 111 § 4. Представление функций от матриц рядами 115 § 5. Некоторые свойства функций от матриц 119 § 6. Применение функций от матрицы к интегрированию системы 124 линейных дифференциальных; уравнений с постоянными коэ ффициеитами § 7. Устойчивость движения в случае линейной системы 130 Глава VI. Эквивалентные преобразования многочленных матриц. 135 Аналитическая теория элементарных делителей § 1. Элементарные преобразования многочленной матрицы 135 § 2. Канонический вид Л-матрицы 139 § 3. Инвариантные многочлены и элементарные делители многочленной 143 матрицы § 4. Эквивалентность линейных двучленов 148 § 5. Критерий подобия матриц 149 § 6. Нормальные формы матрицы 151 § 7. Элементарные делители матрицы J(A) 155 § 8. Общий метод построения преобразующей матрицы 159 § 9. Второй метод построения преобразующей матрицы 162 Глава VII. Структура линейного оператора в я-мерном пространстве 171 (геометрическая теория элементарных делителей) § 1. Минимальный многочлен вектора пространства (относительно 171 заданного линейного оператора) § 2. Расщепление на инвариантные подпространства с взаимно простыми 173 минимальными многочленами § 3. Сравнение. Надпространство 175 § 4. Расщепление пространства на циклические инвариантные 177 подпространства § 5. Нормальная форма матрицы 182 § 6. Инвариантные многочлены. Элементарные делители 184 § 7. Нормальная жорданова форма матрицы 188 § 8. Метод акад. А. Н. Крылова преобразования векового уравнения 190 Глава VIII. Матричные уравнения 199 § 1. Уравнение АХ=ХВ 199 § 2. Частный случай: А = Б. Перестановочные матрицы 203 § 3. Уравнение АХ—ХВ = С 207 § 4. Скалярное уравнение J(X)=0 207 § 5. Матричное многочленное уравнение 209 § 6. Извлечение кория m-й степени из неособенной матрицы 212 § 7. Извлечение кория m-й степени из особенной матрицы 215 § 8. Логарифм матрицы 219 Глава IX. Линейные операторы в унитарном пространстве 222 § 1. Общие соображения 222
§ 2. Метризация пространства 222 § 3. Критерий Грама линейной зависимости векторов 225 § 4. Ортогональное проектирование 227 § 5. Геометрический смысл определителя Грама и некоторые неравенства 229 § 6. Ортогонализапия ряда векторов 233 § 7. Ортонормированный базис 237 § 8. Сопряженный оператор 239 § 9. Нормальные операторы в унитарном пространстве 243 § 10. Спектр нормальных, эрмитовых, унитарных операторов 245 §11. Неотрицательные и положительно определенные эрмитовы 248 операторы § 12. Полярное разложение линейного оператора в унитарном 249 пространстве. Формулы Кэли § 13. Линейные операторы в евклидовом пространстве 254 § 14. Полярное разложение оператора и формулы Кэли в евклидовом 260 пространстве § 15. Коммутирующие нормальные операторы 263 § 16. Псевдообратный оператор 265 Глава X. Квадратичные и эрмитовы формы 267 § 1. Преобразование переменных в квадратичной форме 267 § 2. Приведение квадратичной формы к сумме квадратов. Закон ниерции 269 § 3. Метод Лагранжа приведения квадратичной формы к сумме квадратов. 271 Формула Якоби § 4. Положительные квадратичные формы 276 § 5. Приведение квадратичной формы к главным осям 279 § 6. Пучок квадратичных форм 281 § 7. Экстремальные свойства характеристических чисел регулярного пучка 286 форм § 8. Малые колебания системы с п степенями свободы 293 § 9. Эрмитовы формы 297 § 10. Ганкелевы формы 301 ЧАСТЬ II СПЕЦИАЛЬНЫЕ ВОПРОСЫ И ПРИЛОЖЕНИЯ Глава XI. Комплексные симметрические, кососимметрические и 313 ортогональные матрицы § 1. Некоторые формулы для комплексных ортогональных и унитарных 313 матриц § 2. Полярное разложение комплексной матрицы 317 § 3. Нормальная форма комплексной симметрической матрицы 319 § 4. Нормальная форма комплексной кососимметрической матрицы 322 § 5. Нормальная форма комплексной ортогональной матрицы 327 Глава XII. Сингулярные пучки матриц 331 § 1. Введение 331
§ 2. Регулярный пучок матриц 332 § 3. Сингулярные пучки. Теорема о приведении 335 § 4. Каноническая форма сингулярного пучка матриц 340 § 5. Минимальные индексы пучка. Критерий строгой эквивалентности 342 пучков § 6. Сингулярные пучки квадратичных форм 345 § 7. Приложения к дифференциальным уравнениям 348 Глава XIII. Матрицы с неотрицательными элементами 352 § 1. Общие свойства 352 § 2. Спектральные свойства неразложимых неотрицательных матриц 354 § 3. Разложимые матрицы 365 § 4. Нормальная форма разложимой матрицы 372 § 5. Примитивные и импримитивные матрицы 377 § 6. Стохастические матрицы 381 § 7. Предельные вероятности для однородной цепи Маркова с конечным 385 числом состояний § 8. Вполне неотрицательные матрицы 394 § 9. Осцилляционные матрицы 398 Глава XIV. Различные критерии регулярности и локализации 406 собственных значений § 1. Критерий регулярности Адамара и его обобщения 406 § 2. Норма матрицы 409 § 3. Распространение критерия Адамара на блочные матрицы 412 § 4. Критерий регулярности Фидлера 414 § 5. Круги Гершгорниа и другие области локализации 415 Глава XV. Приложения теории матриц к исследованию систем 419 линейных дифференциальных уравнений § 1. Системы линейных дифференциальных уравнений с переменными 419 коэффициентами. Общие понятия § 2. Преобразование Ляпунова 422 § 3. Приводимые системы 423 § 4. Каноническая форма приводимой системы. Теорема Еругина 426 § 5. Матрицант 429 § 6. Мультипликативный интеграл. Инфинитезимальное исчисление 433 Вольтерра § 7. Дифференциальные системы в комплексной области. Общие свойства 437 § 8. Мультипликативный интеграл в комплексной области 439 § 9. Изолированная особая точка 443 § 10. Регулярная особая точка 448 §11. Приводимые аналитические системы 461 § 12. Аналитические функции от многих матриц и их применение к 465 исследованию дифференциальных систем. Работы И. А. Лаппо- Данилевского
Глава XVI. Проблема Рауса — Гурвица и смежные вопросы 468 § 1. Введение 468 § 2. Индексы Коши 469 § 3. Алгоритмы Рауса 472 § 4. Особые случаи. Примеры 476 § 5. Теорема Ляпунова 479 § 6. Теорема Рауса— Гурвица 483 § 7. Формула Орландо 488 § 8. Особые случаи в теореме Рауса — Гурвица 490 § 9. Метод квадратичных форм. Определение числа различных 493 вещественных корней многочлена § 10. Бесконечные ганкелевы матрицы конечного ранга 495 §11. Определение индекса произвольной рациональной дроби через 498 коэффициенты числителя и знаменателя § 12. Второе доказательство теоремы Рауса — Гурвица 504 § 13. Некоторые дополнения к теореме Рауса — Гурвица. Критерий 508 устойчивости Льенара и Шипара § 14. Некоторые свойства многочлена Гурвица. Теорема Стильтьеса. 512 Представление многочленов Гурвица при помощи непрерывных дробей § 15. Область устойчивости. Параметры Маркова 518 § 16. Связь с проблемой моментов 521 § 17. Связь между определителями Гурвица и определителями Маркова 525 § 18. Теоремы Маркова и Чебышева 526 § 19. Обобщенная задача Рауса — Гурвица 533 Добавление. Неравенства для собственных и сингулярных чисел 535 (В.Б.Лидский) Литература 560 Предметный указатель 572
ПРЕДИСЛОВИЕ АВТОРА К ПЕРВОМУ ИЗДАНИЮ В настоящее время матричное исчисление широко применяется в различных областях математики, механики, теоретической физики, теоретической электротехники и т. д. В то же время ни в советской, ни в иностранной литературе нет книги, которая достаточно полно осве- освещала бы как вопросы теории матриц, так и разнообразные ее приложения. Данная книга представляет собой попытку восполнить этот пробел в математической литературе. В основе книги лежат курсы лекций по теории матриц и ее приложениям, читанные автором в разное время на протяжении последних 17 лет в Московском Государственном уни- университете им. М. В. Ломоносова, в Тбилисском Государственном универ- университете и в Московском физико-техническом институте. Книга рассчитана не только на математиков (студентов, аспирантов, научных работников), но и на специалистов в смежных областях (физи- (физиков, инженеров-исследователей), интересующихся математикой и ее при- приложениями. Поэтому автор стремился сделать изложение материала возможно более доступным, предполагая у читателя только знакомство с теорией определителей и курсом высшей математики в объеме про- программы втуза. Лишь отдельные параграфы в последних главах книги требуют дополнительных математических знаний у читателя. Кроме того, автор старался сделать изложение отдельных глав возможно более неза- независимым друг от друга. Так, например, глава V «Функции от матрицы» не опирается на материал, помещенный в главах II и III. В тех же местах главы V, где впервые используются основные понятия, введенные в главе IV, имеются соответствующие ссылки. Таким образом, читатель, уже знакомый с элементами теории матриц, имеет возможность непо- непосредственно приступить к чтению интересующих его глав книги. Книга состоит из двух частей, содержащих 15 глав. В главах I и III приводятся первоначальные сведения о матрицах и линейных операторах и устанавливается связь между операторами и матрицами. В главе II излагаются теоретические основы метода исключения Гаусса и связанных с ним эффективных методов решения системы п линей- линейных уравнений при большом п. В этой же главе читатель знакомится с техникой оперирования с матрицами, разбитыми на прямоугольные «клетки» или «блоки». В главе IV вводятся имеющие фундаментальное значение «характе- «характеристический» и «минимальный» многочлены квадратной матрицы, «при- «присоединенная» и «приведенная присоединенная» матрицы. В главе V, посвященной функциям от матрицы, даются самое общее определение и конкретные способы вычисления / (А), где / (%) — функция скалярного аргумента К, а А — квадратная матрица. Понятие функции от матрицы используется в §§ 5, 6 этой главы для нахождения и полного
8 ПРЕДИСЛОВИЕ АВТОРА К ПЕРВОМУ ИЗДАНИЮ исследования решения системы линейных дифференциальных уравнений первого порядка с постоянными коэффициентами. Как понятие о функ- функции от матрицы, так и связанное с ним исследование системы линейных1 дифференциальных уравнений с постоянными коэффициентами первого порядка опираются только на понятие о минимальном многочлене мат- матрицы ft не используют (в отличие от обычного изложения) так называемой «теории элементарных делителей», которая излагается в последующих главах VI и VII. Первые пять глав охватывают некоторый цикл сведений о матрицах и их применениях. Более глубокие вопросы теории матриц связаны с приведением матрицы к нормальной форме. Это приведение проводится на основе теории элементарных делителей Вейерштрасса. Ввиду важ- важности этой теории в книге даны два ее изложения: аналитическое — в главе VI и геометрическое — в главе VII. Обращаем внимание чита- читателя на §§ 7 и 8 главы VI, в которых рассматриваются эффективные методы нахождения матрицы, преобразующей данную матрицу к нор- нормальной форме. В § 8 главы VII подробно исследуется метод акад. А. Н. Крылова для практического вычисления коэффициентов характе- характеристического многочлена. В главе VIII решаются матричные уравнения некоторых типов. Здесь же рассматривается задача об определении всех матриц, переста- перестановочных с данной, и детально изучаются многозначные функции от мат- т рицы У A, In A. Главы IX и X посвящены теории линейных операторов в унитарном пространстве и теории квадратичных и эрмитовых форм. Эти главы не опираются на теорию элементарных делителей Вейерштрасса и исполь- используют из предыдущего материала лишь основные сведения о матрицах и линейных операторах, изложенные в первых трех главах книги. В § 9 главы X дается приложение теории форм к исследованию главных коле- колебаний системы с п степенями свободы. В § 10 этой же главы приведены тонкие исследования Фробениуса по теории ганкелевых форм. Эти иссле- исследования применяются в дальнейшем в главе XV при рассмотрении особых случаев в проблеме Рауса — Гурвица. Последние пять глав составляют вторую часть книги. В главе XI определяются нормальные формы для комплексных симметрических, косо- симметрических и ортогональных матриц и устанавливаются интересные связи этих матриц с вещественными матрицами тех же классов и с уни- унитарными матрицами. В главе XII излагается общая теория пучков матриц вида А + KB, где А и В — произвольные прямоугольные матрицы одних и тех же размеров. Подобно тому как исследование регулярных пучков матриц А -\~КВ проводится на основе теории элементарных делителей Вейер- Вейерштрасса, изучение сингулярных пучков опирается на теорию минималь- минимальных индексов Кронекера, которая является как бы дальнейшим разви- развитием теории элементарных делителей Вейерштрасса. С помощью теории Кронекера (автору кажется, что ему удалось упростить изложение этой теории) в главе XII устанавливается каноническая форма пучка матриц А + KB в самом общем случае. Полученные результаты применяются к исследованию системы линейных дифференциальных уравнений с посто- постоянными коэффициентами. В главе XIII излагаются замечательные спектральные свойства мат- матриц с неотрицательными элементами и рассматриваются две важные
ПРЕДИСЛОВИЕ АВТОРА К ПЕРВОМУ ИЗДАНИЮ 9 области применений матриц этого класса: 1) однородные цепи Маркова в теории вероятностей и 2) осцилляционные свойства упругих колебаний в механике. Матричный метод исследования однородных цепей Маркова получил свое развитие в работах В. И. Романовского [29] и опирается на тот факт, что матрица переходных вероятностей в однородной цепи Маркова с конечным числом состояний является матрицей с неотрица тельными элементами специального типа («стохастическая матрица»). Осцилляционные свойства упругих колебаний связаны с другим важ- важным классом неотрицательных матриц — с «осцилляционными матри- матрицами». Эти матрицы и их приложения были исследованы М. Г. Крейном совместно с автором настоящей книги. В главе XIII изложены только некоторые основные результаты из этой области. Подробное же изложе- изложение всего этого материала читатель найдет в монографии [7]. В главе XV собраны приложения теории матриц к системам диф- дифференциальных уравнений с переменными коэффициентами. В этой главе центральное место (§§ 5—9) занимают теория мультипликативного инте- интеграла и связанное с ним инфинитезимальное исчисление Вольтерра. Эти вопросы почти совсем не освещены в советской математической литера- литературе. В первых параграфах и в § 11 изучаются приводимые (по Ляпу- Ляпунову) системы в связи с задачей об устойчивости движения и приводятся некоторые результаты Н. П. Еругина. §§ 9—11 относятся к аналитиче- аналитической теории систем дифференциальных уравнений. Здесь выясняется оши- ошибочность основной теоремы Биркгоффа, которую обычно используют для исследования решения системы дифференциальных уравнений в окрест- окрестности особой точки, и устанавливается канонический вид решения в слу- случае регулярной особой точки. В § 12 главы XV в обзорном порядке излагаются некоторые резуль- результаты фундаментальных исследований И. А. Лаппо-Данилевского по ана- аналитическим функциям от многих матриц и их применениям к дифферен- дифференциальным системам. Последняя глава (XVI) посвящена применениям теории квадратичных форм (и, в частности, ганкелевых форм) к проблеме Рауса — Гурвица об определении числа корней многочлена, лежащих в правой полупло- полуплоскости (Re z > 0). В первых параграфах этой главы приводится класси- классическая трактовка вопроса. В § 5 дана теорема А. М. Ляпунова, в которой устанавливается критерий устойчивости, эквивалентный критерию Рау- Рауса — Гурвица. Наряду с критерием устойчивости Рауса — Гурвица в § 11 этой главы выводится сравнительно мало известный критерий Льенара и Шипара, в котором число детерминантных неравенств при- примерно вдвое меньше, нежели в критерии Рауса — Гурвица. В конце главы XVI показана тесная связь с задачами устойчивости двух замечательных теорем А. А. Маркова и П. Л. Чебышева, которые были получены знаменитыми авторами на основе теории разложения в ряд по убывающим степеням аргумента некоторых непрерывных дробей спе- специального типа. Здесь же дается матричное доказательство этих теорем. Таков краткий перечень содержания настоящей книги. В заключение автор приносит свою искреннюю благодарность Д. К. Фаддееву, В. П. Потапову и Д. М. Котелянскому, прочитавшим рукопись книги и сделавшим много существенных замечаний, которые были учтены автором при подготовке книги к печати. Автор выражает также свою благодарность М. Г. Крейну и А. И. Узкову за ценные советы, использованные автором при написании книги.
ПРЕДИСЛОВИЕ РЕДАКТОРА КО ВТОРОМУ ИЗДАНИЮ Среди существующей литературы по теории матриц монография Ф. Р. Гантмахера занимает общепризнанно одно из лучших мест. Это объясняется систематичностью, широтой рассмотренных вопросов и чет- четкостью изложения. Первое издание этой книги, вышедшее в 1953— 1954 гг., было затем переведено на немецкий и английский языки. В последние годы своей жизни Ф. Р. Гантмахер очень много времени уделил пересмотру и расширению этой книги. Изменения, сделанные им, частично касаются стиля (приведение некоторых терминов в соответствие с новыми традициями, улучшение отдельных доказательств и т. д.). Однако помимо этого было добавлено много нового материала, главным образом во второй, специальной, части книги. Отдельная новая глава XIV («Различные критерии регулярности и локализация собственных значе- значений») посвящена различным методам приближенного отыскания собствен- собственных значений. Добавлены также § 5 гл. V («Некоторые свойства функций от матриц»), § 17 гл. XVI («Связь между определителями Гурвица и опре- определителями Маркова») и два параграфа (§ 5 гл. I, § 16 гл. IX) о псевдо- псевдообратных операторах и матрицах. Известно, что автор был намерен включить в свою книгу ряд недавно разработанных вопросов, связанных с комбинаторикой собственных значений в алгебре матриц. К этим вопросам относится, в частности, задача о распределении собственных значений суммы и произведения двух матриц, а также известные неравенства Вейля и их обобщения. В настоя- настоящем издании соответствующее добавление было написано В. Б. Лид- ским, которому принадлежит одна из первых работ в этом направлении. В. Б. Лидский также принимал участие в подготовке и редактировании второго издания этой книги. Можно надеяться, что некоторое увеличение объема книги не затруднит ее чтения, но, напротив, доставит читателям много интересной и ценной информации. Д. П. Желобенко
ЧАСТЬ ПЕРВАЯ ОСНОВЫ ТЕОРИИ
ГЛАВА I МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ § 1. Матрицы. Основные обозначения 1. Пусть дано некоторое числовое поле К1). Определение 1. Прямоугольную таблицу чисел из поля К '11 Я12 • • • aii aml A) будем называть матрицей. Если т = п, то матрица называется квад- квадратной, а число т, равное п, —ее порядком. В общем же случае матрица называется прямоугольной (с размерами тхп) или т X п-матри- цей. Числа, составляющие матрицу, называются ее элементами. Обозначения. При двухиндексном обозначении элементов первый индекс всегда указывает номер строки, а второй индекс—номер столбца, на пересечении которых стоит данный элемент. Наряду с обозначениями матрицы A) будем употреблять и сокра- сокращенное обозначение: II«г*II (г" = 4' 2, ..., m; Л = 1, 2, ...,п). Часто матрицу A) будем обозначать также одной буквой, например матрица А. Если А—квадратная матрица порядка п, то будем писать: -4 = || aik ||™. Определитель квадратной матрицы А = || aik ||n будем обозна- обозначать так: | aik |™ или | А |. Введем сокращенные обозначения для определителей, составленных лз элементов данной матрицы: B) x) Под числовым полем понимают любую совокупность чисел, в пределах кото- которой всегда выполнимы и однозначны четыре операции: сложение, вычитание, умно- умножение и деление на число, отличное от нуля. Примерами числовых полей могут служить совокупность всех рациональных чи- чисел, совокупность всех действительных чисел или совокупность всех комплексных чисел. Предполагается, что все встречающиеся в дальнейшем числа принадлежат дан- данному исходному числовому полю.
14 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I Определитель C) называется минором р-то порядка матрицы А, если I<^i-<i2< •-. <О'р<»г и 1 <^ /с± -<1 Л:2 -< </cp<!n. тп X n-матрица А = || щк || имеет СтСп миноров jd-го порядка <2> iii8...ip\ /1<ч<12< ... <iP<m \ *.** — *,/ \1<к1<кш<...<кр<п* р<т'п)- Миноры B'), у которых г± = /cj, i'2 = /c2, ..., ip = /cp, называются главными. В обозначениях B) определитель квадратной матрицы А = || ath [|™ запишется так: 2... п\ Наибольший из порядков отличных от нуля миноров, порождаемых матрицей, называется рангом матрицы. Если г — ранг прямоугольной матрицы А с размерами тхп, то, очевидно, r<!/n, п. Прямоугольную матрицу, состоящую из одного столбца х2 мы будем называть столбцевой и обозначать так: (хи х2, ..., Хп). Прямоугольную матрицу, состоящую из одной строки || Zlt Z2, . . ., Zn\\, мы будем называть строчной и обозначать так: [zu z2, ..., zn]. Квадратную матрицу, у которой все элементы, расположенные вне главной диагонали, равны нулю, «1 0 0 0 d2 0 ... 0 ... 0 ... d мы будем называть диагональной и обозначать так: Ц^бглЦ) или {dt, d2, ..., dn}. Введем еще специальные обозначения для строк и столбцов mxn-матрицы Л = ||агь||. Будем обозначать i-ю строку матрицы А через at., a j-й столбец—через а.у. C) Щ. = [ан, ai2, ... a.j = \aij, a^j, ..., amj\ (i = l, .-.., m; y = l, ..., n). f 1 (*=fc), Здесь 6jft—символ Кронекера: &ik— 1 о ti ф к).
§ 2] СЛОЖЕНИЕ И УМНОЖЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ 15 Пусть т величин уи уг, ..., ут выражаются линейно л однородно через п других величин х±, х2, ..., хп: У1 = а,их± +а12х2 f ... у2 = a2^Xi -t- a22x2 -j- ... -f- Ут = в-тЛ + ат2х2 + ... + атпХп или, в сокращенной записи, п Уг = 2j aik%h \l = lj ^i • • • > W). D ) т Преобразование величин xlt x2, ..., жп в величины уи у2, ..., у при помощи формул D) называется линейным преобразованием. Коэффи- Коэффициенты этого преобразования образуют т X п-матрицу A). Задание линейного преобразования D) однозначно определяет матрицу A) и наоборот. В следующем параграфе, исходя из свойств линейных преобразо- преобразований D), мы определим основные операции над прямоугольными матрицами. § 2. Сложение и умножение прямоугольных матриц Определим основные операции над матрицами: сложение матриц, умножение матрицы на число и умножение матриц. 1. Пусть величины уи у2, ..., ут выражаются через величины Xi, х2 ..., хп при помощи линейного преобразования г» Vi= 2 aikxk (i = l, 2, .... то), E) а величины zt, z2, ..., zm—через те же величины хи х2, ..., хп при помощи преобразования zt= libtkxn (г = 1, 2, ..., т). F) Тогда п yi-\rZi=^ (aik + bik)xk (« = 1, 2, ..., т). G) ft—1 В соответствии с этим мы устанавливаем Определение 2. Суммой двух прямоугольных матриц А = || а^ \\ и В = || fejft || одинаковых размеров тхп называется матрица С = \\ сгь || тех же размеров, элементы которой равны суммам соответствующих элементов данной матрицы: если cm = aik -¦}- bik (i = 1, 2, ..., m; к =¦ 1, 2, ..., n). Операция нахождения суммы данных матриц называется сложением матриц.
16 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I Пример. II 1 2 3 |( || 1 2 Согласно определению 2, складывать можно только прямоугольные матрицы одинаковых размеров. В силу этого же определения матрица коэффициентов в преобра- преобразовании G) есть сумма матриц коэффициентов в преобразованиях E) и F). Из определения сложения матриц непосредственно следует, что эта операция обладает * переместительным и сочетательным свойствами: Г А + В = В + А, Здесь А, В, С — произвольные прямоугольные матрицы одинаковых раз- размеров. Операция сложения матриц естественным образом распространяется на случай любого числа слагаемых. 2. Умножим в преобразовании E) величины yi3 y2, ..., ут на неко- некоторое число а из К. Тогда п aj/i = 2 (o-ath) %h (г = 1, 2, ..., т). В соответствии с этим имеет место Определение 3. Произведением матрицы A = \\aih\\(i = l, 2, ..., т; к = 1, 2, ..., и) на число а из isT называется матрица С—\\ с^ || (г —1, 2, ..., т; к = 1, 2, ..., п), элементы которой получаются из соответствующих элементов матрицы А умножением на число а: С = аА, если cih = aaik (i = 1, 2, ..., т; &= 1, 2, ..., n). Операция нахождения произведения матрицы на число называется умножением матрицы на число. Пример. «2 Й3 || ||аа1 аа2 ааЗ | Легко видеть, что 2° ( 3° (ар) Л ==а(рА). Здесь А, В—прямоугольные матрицы одинаковых размеров, а, р—числа из поля К. Разность А —В двух прямоугольных матриц одинаковых размеров определяется равенством А — В = А + (—1)В. Если А—квадратная матрица порядка п, а а—число из К, то1) х) Здесь символы \А\ и \аА\ обозначают определители матриц А и аА (си. стр. 13).
§2] СЛОЖЕНИЕ И УМНОЖЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ 17 3. Пусть величины zl7 z2, -. •, zm выражаются через величины Уи Уъ • • • > Уп при помощи преобразования п Zi=~Zaikyk (i = l, 2, ..., т), (8) ь=1 а величины уи ..., уп выражаются через величины х%, х2, ..., xq при помощи формул i (ft = l, 2, ...,п). (9) Тогда, подставляя эти выражения для i/ft (& = 1, 2, ..., п) в формулы (8), мы выразим %, z2, ..., zm через хи х2, ..., xq при помощи «составного» прео бразования: Ь1 2B =2B й^&«) ^ (i = l,2,..., т). A0) В соответствии с этим имеет место Определение 4. Произведением двух прямоугольных матриц й12 ... а1п Ъи о12 ... blq а21 • ¦ • а 2 • • •  unq называется матрица с= Си С12 ... Clq С21 С22 ... С2д у которой элемент Сц, стоящий на пересечении i-й строки и j-ro столбца, равен «произведению» i-й строки первой матрицы А на у-й столбец второй матрицы В1): п CU= 2 ot (i = l, 2, ..., m; / = 1, 2, ...,g). A1) Операция нахождения произведения данных матриц называется умножением матпиц. Пример. Cj d^ e^ fi <?2 d% ?2 /2 «2 % Ъ2 Ь3 «з /з г) Под произведением двух рядов чисел а1г а2, , ап и bj, Ъ2, , Ъп мы п понимаем сумму произведений соответствующих чисел этих рядов: 2 аФг- i=l 2 Ф. р. Гантмахер
18 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I По определению 4 матрица коэффициентов в преобразовании A0) равна произведению матрицы коэффициентов в (8) на матрицу, коэффи- коэффициентов (9). Заметим, что операция умножения двух прямоугольных матриц выполнима лишь в том случае, когда число столбцов в первом сомно- сомножителе равно числу строк во втором. В частности, умножение всегда выполнимо, если оба сомножителя — квадратные матрицы одного и того же порядка. Обратим внимание читателя и на то, что даже в этом частном случае умножение матриц не обладает переместительным свойством. Так, например, 8 18 — 2 —4 2 3 0 j 1 3 2 4 2 0 4 2 Если АВ = ВА, то матрицы А и В называются перестановочными или коммутирующими между собой. Пример. Матрицы . || 1 2 || II -2 0 || перестановочны между собой, так как и 23= —3 —2 2 —4 АВ = \ —7 —6 6 —4 ВА=\ -7 —6 6 —4 Легко проверяется сочетательное свойство умножения матриц, а также распределительное свойство умножения относительно сложения: (АВ)С =А{ВС), 2° 3° A2) А(В + С) = АВ + АС. Операция умножения матриц естественным образом распространяется на случай нескольких сомножителей. 4. Если воспользоваться произведением прямоугольных матриц, то линейное преобразование yt = апх% + а12х2 + ... + атхп, у2 = а2пхп, A3) Ут ~~ ^ml^-l "Г ®т.2Х2 -4- . . . можно записать одним матричным равенством ап Й12 • • • ат Уг Уг, Й21 #22 или в сокращенной записи: = Ах. A3') Здесь x = (xt, x2, ..., хп), у = {уи Уг,...., уп)—столбцевые матрицы, = j| aift ||—прямоугольная матрица размеров тхп.
2] СЛОЖЕНИЕ И УМНОЖЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ 19 Равенства A3) выражают собой тот факт, что столбец у является линейной комбинацией столбцов матрицы А с коэффициентами ...+хпа.п = A3") Вернемся теперь к равенствам A1), которые эквивалентны одному матричному равенству] С = АВ. A4) Эти равенства могут быть записаны в виде C,-=SM-h G = 1.2, ...,q) A4') A4") или в виде Таким образом* любой ;-й столбец матрицы-произведения С = является линейной комбинацией столбцов первого сомножителя, т. е. матрицы А, причем коэффициенты этой линейной зависимости образуют /-й столбец во втором сомножителе В. Аналогично, любая г'-я строка в матрице С является линейной комбинацией строк матрицы В, а коэф- коэффициентами этой линейной зависимости являются элементы i-й строки матрицы А1). Остановимся еще на том частном случае, когда в произведении С = АВ второй сомножитель является квадратной и притом диагональной матрицей B = {du d2, -.-, dn}. Тогда из формул A1) следует: ci3 = Oijdj (i = 1, 2, ..., т; /=.1,2, ..., n), т. е. a12 ... aln -d,- 0.,. О 0 d2 ... 0 0 0 ...dn «22^2 Аналогично di 0 0 0 . d2. 0 . .. 0 .. 0 • • dm an «21 «ml «12 «22 атг ... aln ... «2n • • • «mn "m«ml Таким образом, при умножении прямоугольной матрицы А справа (слева) на диагональную матрицу {dt, d2, ...} все столбцы (соответ- (соответственно строки) матрицы А помножаются на числа dit o, ... х) Следовательно, матричные уравнения АХ=С, где А и С—заданные соот- соответственно тхп- и т X g-матрицы, а X—искомая п х g-матрица, имеет решение в том и только в том случае, когда столбцы матрицы С являются линейными комбинациями столбцов матрицы А. Для уравнения ХВ=С необходимое и доста- достаточное условие существования решения X состоит в том, что строки матрицы С" должны быть линейными комбинациями строк матрицы В.
20 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I 5. Пусть квадратная матрица С = ||сг_,-||™ является произведением двух прямоугольных матриц А = || alh || и В = || bkj || соответственно размеров тхп и пхт: 'и •¦• Ь1т Clm ап ai2, ... й1п ат1 атп Ь2т ЬП1 т. е. ct=l (i, /=1, 2, ..., /и). A5) A5') Установим важную формулу Бине—Кош и, выражающую опре- определитель | С | через миноры матриц А и В: . . . Стт • 2 O-mh Ч»т- A6) или в специальных обозначениях (см. стр. 13): /1 2 ... т /12...ш\ , „ I = \lZ...mJ A2 /и \ /к к к \ к к'" к lB\i V" J) -A6'> Согласно этой формуле определитель матрицы С равен сумме произведений всевозможных миноров максимального (пг-го) порядка1) матрицы А на соответствующие миноры того же порядка матрицы В. Вывод формулы Бине—Кош и. На основании формулы A5') определитель матрицы С можно представить в виде с1т СГО1 • • • СП , u^mbV | «1=1 __ у атЬатГ1 п М ~аь...,ат=1 [а! A6") Если т>п, то среди чисел аи a2, ...,am всегда найдутся равные между собой числа и, следовательно, каждое слагаемое в правой части равенства A6") будет равно нулю. Значит, в этом случае | С \ = 0. Пусть теперь /и<!п. Тогда в сумме, стоящей в правой части равенства A6"), будут равны нулю те слагаемые, у которых хотя бы два из индексов а1; а2, ..., ат равны между собой. Все же остальные слагаемые этой суммы можно разбить на группы по т\ слагаемых !) Если т>га, то матрицы Л и В не имеют миноров m-го порядка. В этом случае правые части формул A6) и A6') следует заменить нулями.
СЛОЖЕНИЕ И УМНОЖЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ ¦ 21 в каждой, объединяя в одну группу те слагаемые, которые отличаются друг от друга только порядком индексов at, а2, ...,0т (индексы at, a2, ..., am в пределах каждой группы слагаемых имеют одну и ту же совокупность значений). Тогда в пределах одной такой группы сумма соответствующих слагаемых будет равна1) ' /1 2 ... т \ >j e(atl a2, . „., ат)A L ft I bailbaz2 ¦ ¦ ¦ &am™ = = А 1 2 ... те к1к2 k 1 2 m bamm = i k2 ... km 2 ... Поэтому из A6") получаем A6'). Пример 1. Oj a2 an b1b2...bn Поэтому форилула A6) дает так называемое тождество Коши С1 • • • + апсп = 2 «ft Полагая в этом тождестве aj=cj, bj=dj (i = l, 2, .... и), получим: a1b1 + a2b2+...-{-anbn a2b2+...+anbn = 2 ct dt aft В случае, когда at и bt (i==l, 2, ..., и)—вещественные числа, отсюда следует известное неравенство 2 < (af? При этом знак .равенства имеет место тогда и только тогда, когда все числа at про- пропорциональны соответствующим числам 6, (? = 1, 2 и). Пример 2. ... ancn-\-bndn пп Ьп ... cn Поэтому2) при п > 2 = 0. x) Здесь fej < fc2< • • • < &m—нормальное расположение индексов щ, a2, ..., cim, a e(a!, a2, .... am)=(—1)^, где N—число транспозиций индексов, необходимых для преобразования перестановки а1? а2, .... От к нормальному расположению ^ < & < < Ь 2 < • • • < т. 2) См. сноску на стр. 20.
22 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ 1ГЛ. I Рассмотрим частный случай, когда А и В — квадратные матрицы одного и того же порядка п, и положим в A6') т = п. Тогда приходим к известной теореме об умножении определителей: или в других обозначениях: \ = \А\-\В\. A7) Таким образом, определитель произведения двух квадратных мат- матриц равен произведению определителей перемножаемых матриц. 6. Формула Бине — Коши дает возможность в самом общем случае выразить миноры произведения двух прямоугольных матриц через ми- миноры сомножителей. Пусть и Рассмотрим произвольный минор матрицы С: i = l, 2, ...,т; k = l, 2, ..., п; j = h h 1p Матрица, составленная из элементов этого минора, представляет собой произведение двух прямоугольных матриц %2 - • • %n Поэтому, применяя формулу Бине—Коши, получаем: 7i 72 •••1р1 ,^и.^.^ <-ъ <« \К1К2---Кр/ \7i 7г - • • 7р/ При jo = 1 формула A8) переходит в формулу A1). При р>\ фор- формула A8) является естественным обобщением формулы A1). Отметим еще одно следствие из формулы A8). Ранг произведения двух прямоугольных матриц не превосходит ранга любого из сомножителей. Если С = АВ и 7-д, rs, rc — ранги матриц А, В, С, то гс<гА, гв. 7. Если X—решение матричного уравнения АХ=С (размеры матриц А, X и С соответственно гах», п х g и т х д), то rx ^ i"o Покажем, что среди решений мат- матричного уравнения АХ—С существует решение Xq минимального ранга, для которого х)Из той же формулы Бине—Кошиследует, что миноры р-го порядка матрицы С при р^>п (если миноры таких порядков имеются) все равны нулю. В этом случае правую часть формулы A8) следует заменить нулем. См. сноску на стр. 20.
§ 2] СЛОЖЕНИЕ И УМНОЖЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ 23 Действительно, пусть г==гс. Тогда среди столбцов матрицы С имеется г ли- линейно независимых!). Пусть для конкретности первые г столбцов C.j, , С.т линейно независимы, а остальные столбцы C.r+i, ..., C.q являются линейными комбинациями первых г: Пусть X—произвольное решение уравнения АХ=С. Тогда (см. стр. 19) AX.h=C.h _(* = 1,...,г). Определим столбцы Х.г+1, ..., X.q равенствами A9) B0) 2 fe=i Умножая эти равенства слева почленно на А, в силу равенств A9) и B0) находим: AX.J = C.J (,=r+l,...,q). B0') Система из q равенств B0) и B0') эквивалентна одному матричному равенству АХ0=С, где Х0=(Х.1, ...,Х.Г, X.r+l, ...,X.q)—матрица ранга г 2). Решение Xq минимального ранга г с матричного уравнения ЛХ=С всегда пред- ставимо в виде XQ = VC, где V—некоторая п х т-матрица. Действительно, из равенства АХо — С следует, что строки матрицы С явля- являются линейными комбинациями строк матрицы Xq. Поскольку как среди строк матрицы С, так и среди строк матрицы Хо имеется одно и то же число гс линейно независимых 3), то и, обратно, строки матрицы Хо являются линейными комбина- комбинациями строк матрицы С, а отсюда уже следует равенство Xo=VC. Докажем теперь следующее предложение 4). Матричное уравнение АХВ=С, B1) где А, В—заданные, а X—искомая прямоугольная матрица^), имеет решение е том и только том случае, когда одновременно имеют решения матричные уравнения AY=C, ZB=C, B2) т. е. когда столбцы матрицы С являются линейными комбинациями столбцов мат- матрицы А, а строки матрицы С являются линейными комбинациями строк матрицы В. В самом деле, если матрица X—решение уравнения B1), то матрицы Y=XB и Z—AX являются решениями уравнений B2). Обратно, пусть существуют решения У, Z уравнений B2). Тогда первое из этих уравнений имеет решение Уо минимального ранга гс, которое по доказан- доказанному представимо в виде Y0=VC. Поэтому Тогда матрица X=VZ будет решением уравнения B1). г) Мы ссылаемся на хорошо известное положение: ранг матрицы равен числу линейно независимых столбцов (строк) матрицы. Доказательство этого положения приведено в гл. III, стр. 68. 2) В матрице Хо последние п—r столбцов являются линейными комбинациями первых г; первые же г столбцов X.i, ...,X.r линейно независимы, так как линей- линейная зависимость между этими столбцами в силу равенств B0) повлекла бы линей- линейную зависимость между столбцами С.\, , С.Т. 3) См. сноску на стр. 19. 4) См. [232], [199]. 5) Предполагается, что размеры матриц А, X, В, С таковы, что произведение АХВ имеет смысл и имеет размеры матрицы С.
24 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I § 3. Квадратные матрицы 1. Квадратную матрицу n-го порядка, у которой на главной диаго- диагонали стоят единицы, а все остальные элементы равны нулю, будем называть единичной матрицей и обозначать через /?<п> или просто Е. Название «единичная матрица» связано со следующим свойством мат- матрицы Е: для любой прямоугольной матрицы ^4 = 1КьII (i"=l, 2, ...,т; к=1, 2, ...,п) имеют место равенства Eim)A Очевидно, Пусть Л = |[йгл||5г — квадратная матрица. Тогда степень матрицы определяется обычным образом: Ар = АА...А (р = 1,2,...); А° = Е. V рае Из сочетательного свойства умножения матриц следует: Здесь р, q — произвольные целые неотрицательные числа. Рассмотрим многочлен (целую рациональную функцию) с коэффи- коэффициентами из поля К: f (t) = aotn + ем +...+ат. Тогда под f(A) будем понимать матрицу / (А) = а0Ат + аИ" + •.. + атЕ. Так определяется многочлен от матрицы. Пусть многочлен / (t) равен произведению многочленов h{t) и g (t): f(t) = h(t)g(t). Многочлен / (t) получается из h (t) и g (t) путем почленного перемно- перемножения и приведения подобных членов. При этом используется правило перемножения степеней: tptq = tp+q. Так как все эти действия право- правомерны и при замене скалярной вгличины t на матрицу А, то f(A)= (A)g(A). Отсюда, в частности, т. е. два многочлена от одной и той же матрицы всегда перестано- перестановочны между собой. г) Так как каждое из этих произведений равно одному и тому же / (Л), поскольку и g (t) h (t)=/(t). Следует отметить, что подстановка матриц в алгебраи- алгебраическое тождество с несколькими переменными неправомерна. Впрочем, пере- перестановочные между собой матрицы можно подставлять и в этом случае,
3] КВАДРАТНЫЕ МАТРИЦЫ Примеры. Условимся р-й наддиагональю (поддиагоналъю) в прямоугольной матрице .4 = || ajk || называть ряд элементов а^, у которых к—i=p (соответственно i — к=р). Обозначим через Н квадратную матрицу n-го порядка, у которой элементы первой наддиагонали равны единице, а все остальные элементы равны нулю. Тогда О 1 0 ... 0| О 0 1 тт ... " Ч о о о ... 'о В силу этих равенств, если • 0 т . 0 0 0 1 ... . 0 ..." 0 i 0 0 и т. д.; —многочлен относительно t, то а0 ai а2 0 a0 at 0 0 0 а2 а0 Аналогично, если F—квадратная матрица га-го 'порядка, у которой все эле- элементы первой поддвагонали равны единице, а все остальные элементы равны: нулю, то \а0 0 ... 0 . .0 ... ai а0 Предлагаем читателю проверить следующие свойства матриц Н и F: 1° В результате умножения произвольной т х п-матрицы А слева на мат- матрицу Н (матрицу F) т-го порядка все строки матрицы А поднимаются (опускаются) на одно место вверх (вниз), первая (последняя) строка матрицы А исчезает, а послед- последняя (первая) строка произведения заполняется нулями. Так, например, h Ь2 &3 Ь4 С1 С2 С3 С4 0 0 0 0 0 0 0 0 «1 «2 аЗ а4 bj Ь2 ^3 ^4 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 0 0 h ч ч h а2 ъ2 й2 ь2 С2 а3 ъ3 сз «3 h сз ч h Ч ь4 С4 = = 2° В результате умножения произвольной т х п-матрицы А справа на матрицу Н (F) п-го порядка все столбцы матрицы А сдвигаются вправо (влево) на одно место, при этом последний (первый) столбец матрицы А исчезает, а первый
26 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I с, h с, с2 Ь2 С2 «3 ъ3 сз Ч с4 {последний) столбец произведения ааполняется нулями. Так, например, 0 10 0 0 0 10 0 0 0 1 0 0 0 0 0 0 0 0 10 0 0 0 10 0 0 0 10 2. Квадратную матрицу будем называть особенной, если | А \ = 0. В противном случае квадратная матрица А называется неособенной. Пусть .4 = || aik Ц*1—неособенная матрица (| А \ Ф 0). Рассмотрим линейное преобразование с матрицей коэффициентов А с4 а2 а3 с4 = = 0 с 0 1 0 с «2 ъ2 с2 ч ч 1 «3 Ьз ч а2 ъ2 Ч h С4 «3 Ьз сз 0 0 0 п i = l, 2,...,в). B3) Рассматривая равенства B3) как уравнения относительно х^, х2, — ..., хп и замечая, что определитель системы уравнений B3) по усло- условию отличен от нуля, мы можем однозначно по известным формулам выразить xi, x2, ...,xn через уи у2, ...,уп- ХГ-=- «21 ¦ «1, i_i l/i a±,i • «¦ а2, г-1 J/2 «2, i «m •an,i-l Уп «n, i .. .ап 2 fe=i (i = l, 2, ...,п). B4) Мы получили «обратное» преобразование для B3). Матрицу коэффи- коэффициентов этого преобразования мы назовем обратной матрицей для матрицы Л. Из B4) легко усмот- усмотреть, что а^1) = ГХ[" (*' *=1' 2'••••")". B5) где j4fei — алгебраическое дополнение (адъюнкта) элемента ahi в опре- определителе |.4|(?, к=1, 2,...,п). Так, например, если а2 а3 с1 с2 и то ;1 — Ь3с2 а3с2 — а2с3 azb3 — аф2 b3ct — btc3 axc3 — а3с1 «3^1 — а1 ^з b2di a2ct — aiC2 a±b2 — Образуя составное преобразование из данного преобразования B3) н обратного B4) в одном и в друго'м порядке, мы в обоих случаях
¦§ 3] КВАДРАТНЫЕ МАТРИЦЫ 27 получаем тождественное преобразование (с единичной матрицей коэф- коэффициентов); поэтому АА-1 = А-Ы = Е. B6) В справедливости равенств B6) можно убедиться и непосредствен- лым перемножением матриц А и А'1. Действительно, в силу B5)г) 2 = щИ а*А* = Ьч (*. / = 1. 2, ...,в). ft=t k=i Аналогично п я [А-Ы]и = 2 «&U«V = At S ^'«^ = б« (*• /= 1, 2, ..,, в). h=i fe=i Нетрудно видеть, что матричные уравнения АХ^Е и ХА = Е (\А\ФО) B7) никаких других решений, кроме решения Х = А~г не имеют. Действи- Действительно, умножая обе части первого уравнения слева, а второго — справа на А'1 и используя сочетательное свойство произведения матриц, а так- также равенства B6), мы в обоих случаях получим2): Этим же способом доказывается, что каждое из матричных урав- уравнений АХ = В, ХА = В (\А\фО), B8) где X и В — прямоугольные матрицы равных размеров, А — квадратная матрица соответствующего размера, имеет одно и только одно ре- решение: Х = А~гВ и соответственно Х = ВА~1. B9) Матрицы B9) являются как бы «левым» и «правым» частными от «деле- «деления» матрицы В на матрицу А. Из B8) и B9) следует соответственно (см. стр. 22) гвКгх и гх-*Сгв, т. е. гх = гв. Сопоставляя с B8), имеем: При умножении прямоугольной матрицы слева или справа на неосо- неособенную матрицу ране исходной матрицы не изменяется. Заметим еще, что из B6) вытекает (ЛЦЛ^!, т. е. Для произведения двух неособенных матриц имеем: . C0) г) Здесь мы используем известное свойство определителя, согласно которому сумма произведений элементов какого-либо столбца на их адъюнкты равна вели- величине определителя, а сумма произведений элементов столбца на адъюнкты соот- соответствующих элементов другого столбца равна нулю. 8) Если А—особенная матрица, то уравнения B7) не имеюз решений. Дейст- Действительно, если бы какое-либо иэ этих уравнений имело решение Х=|| -э^гй ||"» |то тогда [было бы в силу теоремы об умножении определителей [см. формулу A7)] |Л||Х| = |?| = 1, что невозможно при |Л|=0.
28 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ ?гл. 3. Все матрицы n-го порядка образуют кольцо г) с единичным элементом Е. Поскольку в этом кольце определена операция умножения на число из поля К и существует базис из rfl линейно независимых матриц, через которые линейно выражаются все матрицы n-го порядка 2), то кольцо матриц я-го порядка является алгеброй 3). Все квадратные матрицы n-го порядка образуют коммутативную группу отно- относительно операции сложения4). Все неособенные матрицы n-го порядка образуют (некоммутативную) группу относительно операции умножения. Квадратная матрица А = || aih ||J» называется верхней треугольной (нижней треугольной), если равны нулю все элементы матрицы, распо- расположенные под главной диагональю (над главной диагональю): А-- аи О • ат О 0. . . A) ап 0 ... 0 Й21 ^22 • • • " • • • ап B) Диагональная матрица является частным случаем как верхней, так и нижней треугольной матрицы. Так как определитель треугольной матрицы равен произведению ее диагональных элементов, то треугольная (и, в частности, диагональ- диагональная) матрица является неособенной только тогда, когда все ее диаго- диагональные элементы отличны от нуля. Легко проверить, что сумма и произведение двух диагональных (верхних треугольных, нижних треугольных) матриц есть диагональная (соответственно верхняя треугольная, нижняя треугольная) матрица и что обратная матрица для неособенной диагональной (верхней треугольной, нижней треугольной) матрицы является матрицей того же типа. Поэтому 1° Все диагональные, все верхние треугольные, все нижние треугольные мат- матрицы n-го порядка образуют три коммутативные группы относительно операции сложения. 2° Все неособенные диагональные матрицы образуют коммутативную группу относительно умножения. 3° Все неособенные верхние (нижние) треугольные матрицы составляют группу (некоммутативную) относительно умножения. *) Кольцом называется совокупность элементов, в которой определены и всегда однозначно выполнимы две операции: «сложение» двух элементов (с перемести- тельным и сочетательным свойствами) и «умножение» двух элементов (с сочета- сочетательным и распределительным относительно сложении свойствами), причем сло- сложение обратимо. См., например, [20], стр. 15, 25 и 100 или [39], стр. 333. 2) Действительно, произвольная матрица -4=|| а^ ||™ с элементами из К пред- ставима в виде А= aihEikt гДе E-ih—матрица n-го порядка, у которой на пере- сечении i-й строки и к-то столбца стоит 1, а все остальные элементы равны 0. 3) См., например, [20], стр. 101. 4) Группой называется всякая совокупность объектов, в которой установлена операция, относящая любым двум элементам о и Ъ совокупности определенный третий элемент о ^< Ъ той же совокупности, если 1) операция обладает сочетатель- сочетательным свойством [(с^<Ь) >К с=а^. (Ъ Jfce)], 2) существует в совокупности единичный элемент е (о ^<е=е ^< а—а) и 3) для любого элемента а совокупности существует обратный элемент о" (a>fc ari^ar1 ^<o=e). Группа называется коммутативной или абелевой, если групповая операция обладает переместительным свойством. Отно- Относительно понятия группы см., например, [20], стр. ЗЮг и далее.
$ 3] КВАДРАТНЫЕ МАТРИЦЫ 29 4. В заключение этого параграфа укажем на две важные операции над матрицами — транспонирование матрицы и переход к сопряженной матрице. Если i4 = ||ojft|| (i = l, 2, ..., т; к= 1, 2, ..., п), то транспониро- транспонированная матрица А' определяется равенством -<4' = || aifc ||, где аы — щъ (i = l, 2, ..., т; к = 1, 2, ..., п). Сопряженная же матрица -4* = || а*ь||, где аи = аьг = ягй (г = 1, 2, ...,т; Л=1, 2, ..., пI). Если матрица А имеет размеры тхп, то матрицы А' и А* имеют размеры пхт. Легко проверяются свойства8): 4° (A'1)' = (A')'1, (A'1)* = (A*)'1. 5° (A')' = A, . (A*)* = A. Если квадратная матрица S — \\ sih ||™ совпадает со своей транспо- транспонированной (S' — S), то такая матрица называется симметрической. Если же квадратная матрица H = \\hiu\\ совпадает со своей сопряженной (Н* = Н), то она называется эрмитовой. В симметрической матрице элементы, симметрично расположенные относительно главной диагонали, равны, а в эрмитовой они комплексно сопряжены между собой. Диаго- Диагональные элементы эрмитовой матрицы всегда вещественны. Заметим, что произведение двух симметрических (эрмитовых) матриц, вообще говоря, не является симметрической (эрмитовой) матрицей. В силу 3 это имеет место только в том случае, когда данные две симметрические или эрмитовы матрицы перестановочны между собой. Если А—вещественная матрица, т. е. матрица с вещественными элементами, то А* = А'. Эрмитова вещественная матрица всегда является симметрической. С каждой прямоугольной матрицей А = \\ а^ || размеров тхп связаны две эрмитовы матрицы АА* и А*А размеров тхт и пхп. Любое из равенств АА* = 0 или А*А — О влечет за собой3) равенство А -¦- 0. Если квадратная матрица 1? = || kis\^ отличается множителем — 1 от своей транспонированной (К' = —К), то такая матрица называется кососимметричеспой. В кососимметрической матрице любые два эле- элемента, расположенные симметрично относительно главной диагонали, отличаются друг от друга множителем —1, а диагональные элементы равны нулю. Из 3° следует, что произведение двух перестановочных между собой кососимметрических матриц является симметрической матрицей4). г) Чертой обозначается переход к комплексно сопряженной величине. 2) В формулах 1°, 2°, 3° и 5° А, В—произвольные прямоугольные матрицы, для которых соответствующие операции выполнимы, а а—произвольное комплекс- комплексное число. В формуле 4° А—произвольная квадратная неособенная матрица. 3) Это следует из того, что сумма диагональных элементов в каждой из матриц т п АА* и А*А равна 2 2 I °» I2- i=i fe=t 4) Относительно представления квадратной матрицы А в виде произведения Двух симметрических (A=SiS2) либо двух кососимметрических матриц (-4=ЙЖ) см. [247].
30 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I § 4. Ассоциированные матрицы. Миноры обратной матрицы Пусть дана матрица ^4. = || atk ||". Рассмотрим всевозможные миноры р-то A <:/?<; #г) порядка матрицы А: i2... ip \ h...kp) Число этих миноров равно N2, где N = Cn—число сочетаний из п по р. Для того чтобы расположить миноры C1) в квадратную таблицу, зану- занумеруем в определенном (например, лексикографическом) порядке все сочетания по р из п индексов 1, 2, ..., п. Если сочетания индексов it < i2 < ... ¦< ip и kt < Л2 < ... < кр при этой нумерации будут иметь номера а и E, то минор C1) будем обоз- обозначать и так: . / «1 к ... ip \ йаР = Л U к к Г Давая аир независимо друг от друга все значения от 1 до Nr мы охватим все миноры р-го порядка матрицы А = \\ aik j|j\ Квадратная матрица N-vo порядка называется р-й ассоциированной матрицей для матрицы А —1| ащ р может принимать значения 1, 2, ..., п. При этом У11 = А, а матрица состоит из одного элемента, равного | А |. Замечание. Порядок нумерации сочетаний индексов фиксируется раз навсегда и не связан с выбором матрицы А. Пример. Пусть с„ с12 с,з а14 Я21 Я22 Я23 Я24 Я31 Я32 Я33 Я34 Я41 Я42 Я43 а44 Перенумеруем все сочетания из четырех индексов 1, 2, 3, 4 по два, расположив, их в следующем порядке: A 2) A 3) A 4) B 3) B 4) C 4). Тогда GO G» GO GO GO GO GO GO GO GO GJ) ':о GO GO GO 12 13 а а GO GO /3 44 In; 2 4 3 4 2 4 3 4 GO GO GO GO GO GO Отметим некоторые свойства ассоциированных матриц: 1° Из С = АВ следует ©р = Яр95р (р=1, 2, ..., и).
§ 4] АССОЦИИРОВАННЫЕ МАТРИЦЫ. МИНОРЫ ОБРАТНОЙ МАТРИЦЫ 31 Действительно, выражая миноры р-го порядка A<р<п) матрицы- произведения С через миноры того же порядка матриц-сомножителей по формуле A8), будем иметь: h i2 • • • iP \ -^ I h i2 • • • г'р \ / 'i l2 • • ¦ lp\ /I 17/ 1 I \k к к I ¦*-" \tj 12 •.. tp/ \fi-i H2 . . . ftp/ '<A;22<'"<1P<R)- C2> Очевидно, в обозначениях этого параграфа равенство C2) может быть записано так: (здесь а, р, К — номера сочетаний индексов it <. i2 <L • • • < *'р; kt < Л2 <... ... < кр; Z, < 12 < ... < Zp). Отсюда ©р = Ир«р (р=1, 2, ...,п). 2° /f3 В = Л следует: S5P = Stp1 (p=l, 2, ...,п). Это предложение непосредственно вытекает из предыдущего, если там положить С = Е и обратить внимание на то, что (?р — единичная матрица порядка N = С^. Из предложения 2° вытекает важная формула, выражающая миноры, обратной матрицы через миноры данной матрицы: Если В = А'1, то при любых A <;) ^i i X1 ь (-i)v=1 v=1 в' " " """'"' . . . К ft- 6...П\ \l 2... J где ч < г2 < ... < гр вместе с i\ < г; < ... < i'n_p, а к±<.к2<. ... < fcp. вместе с &j < к'2 < ... < /е^-р составляют полную систему индексов 1,2, ...,п. Действительно, из АВ = Е следует: ШрЯ5р = @р или в более подробной записи: Равенства C4) могут быть записаны еще так: v 1, если 2 (/v-uvJ=0r ^ /W2 • • • /р \ в I hh •-• iP \, 2 v=l О, если 2 Gv—fcvJ>0 v=i C4')
МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I С другой стороны, применяя к определителю | А | известные разло- разложения Лапласа, получаем: 2 ••• h \А\, если 2 Ov— /cvJ = C5). О, если 2 O'v — l 2 v=l где i't < ^ < ... < г'п-р вместе с it < г2 < ... < гр, а к[ < /с^ < ... < к'п_р вместе с к1 < Л2 < ... < Лр образуют полную систему индексов 1,2, ...,п. Сопоставление C5) с C4') и C4) показывает, что равен- равенства C4) удовлетворятся, если вместо Ь„р взять не В I, , , I , a \kik2 ... Кр/ VI 2 ... nJ Так как из системы C4) элементы Ь„р обратной матрицы для Sip определяются однозначно, то имеет место равенство C3). § 5. Обращение прямоугольных матриц. Псевдообратная матрица Если А — квадратная и неособенная матрица, то для нее существует обратная матрица А. Если же А — не квадратная, а прямоугольная т х n-матрица (т ^ь п) или квадратная, но особенная, то матрица А не имеет обратной и символ А'1 не имеет смысла. Однако, как будет показано далее, для произвольной прямоугольной матрицы А существует «псевдообратная» матрица А+, которая обладает некоторыми свойствами обратной матрицы и имеет важные применения 'при решении системы линейных уравнений. В случае, когда А — квадратная неособенная мат- матрица, псевдообратная матрица А+ совпадает с обратной А~г1). 1. Скелетное разложение матрицы. В дальнейшем мы будем пользоваться представлением произвольной прямоугольной т х n-матрицы Л = ||агй|| ранга г в виде произведения двух матриц В и С, имеющих соответственно размеры ту. г и гхв: ьи 6 ml... bmr crl cr2 C6) !) Приведенное далее в этом параграфе определение псевдообратной матрицы было дано в 1920 г. Муром, указавшим на важные применения этого понятия [214]. Позже независимо от Мура в несколько иной форме псевдообратная матрица опре- определялась и исследовалась в работах Бьерхаммара [159], Пенрозе [227] и других авторов.
§ 5] ОБРАЩЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ. ПСЕВДООБРАТНАЯ МАТРИЦА 33 Здесь ранги сомножителей В л С обязательно равны рангу произведе- произведения A, rB — rc=^r. Действительно (см. стр. 22), г^гв, гс- Но ранги гв и г с не могут превосходить г, так как г — один из размеров матриц В и С. Поэтому rB = rc = r. Для того чтобы получить разложение C6), достаточно в качестве столбцов матрицы В взять любые г линейно независимых столбцов матрицы А, либо любые г линейно независимых столбцов, через кото- которые линейно выражаются столбцы матрицы А1). Тогда произвольный /-й столбец матрицы А будет линейной комбинацией столбцов матрицы В с коэффициентами с17-, с^-, ...,сг^; эти коэффициенты и образуют j-й столбец матрицы С G = 1, ...,п, см. стр. 19J). Поскольку матрицы В и С имеют максимально возможный ранг г, то квадратные матрицы В*В и СС* являются неособенными: ]В*В\?=0, \СС*\^0. C7) Действительно, пусть столбец х— произвольное решение уравнения В*Вх = 0. C8) Помножим это уравнение слева на строку х*. Тогда х*В*Вх = (Вх)* Вх — 0. Отсюда3) следует Вх = 0 и (поскольку Вх — линейная комбинация линейно независимых столбцов матрицы В; ср. с формулой A3")) х = 0. Из того, что уравнение C8) имеет только нулевое решение х = 0, выте- вытекает, что \В*В\=^=0. Аналогично устанавливается второе неравен- неравенство C7L). Разложение C6) будем называть скелетным разложением матри- матрицы А. 2. Существование и единственность псевдообрат- псевдообратной матрицы. Рассмотрим матричное уравнение А. C9) Если А — квадратная неособенная матрица, то это уравнение имеет единственное решение Х = А~\ Если же А — произвольная прямоуголь- прямоугольная т х n-матрица, то искомое решение X имеет размеры пхт, но не определяется однозначно. В общем случае уравнение C9) имеет бес- бесчисленное множество решений. Ниже будет показано, что среди этих решений имеется только одро, обладающее тем свойством, что его строки и столбцы являются линейными комбинациями соответственно строк и столбцов сопряженной матрицы А*. Именно это решение мы будем называть псевдообратной матрицей для А и обозначать через А+. х) Мы исходим из известного положения: в матрице А ранга г имеется г линейно независимых столбцов, через которые линейно (т. е. в виде линейных комбинаций с числовыми коэффициентами из данного поля) выражаются все осталь- остальные столбцы. Аналогичное утверждение имеет место и для строк. Подробнее об этом см. гл. III, § 1. 2) Совершенно так же строками матрицы С могут быть любые г строк, через которые выражаются в виде линейных комбинаций все строки матрицы А. Тогда коэффициенты этих линейных комбинаций образуют строки матрицы В. 3) См. конец § 3. 4) Неравенства C7) также непосредственно следуют из формулы Бине—:Коши. Согласно этой формуле определитель | В*В \ (| СС* |) равен сумме квадратов модулей всех миноров r-го порядка матрицы В (соответственно С). 3 Ф. Р. Гантмахер
34 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I Определение 5. Матрица А+ размеров и X то называется псевдо- псевдообратной для т X n-матрицы А, если выполняются равенства1) А, D0) A*V, D1) где U и V — некоторые матрицы Докажем сначала, что для данной матрицы А не может существо- существовать двух различных псевдообратных матриц А* и А*. Действительно, из равенств полагая D — A\ — A\, U — Uz—Uu V — V2—Vi, найдем: ADA = 0, D = UA* = A*V. Отсюда (DA)* DA = A*D*DA = A*V*ADA = 0 и, следовательно (см. конец § 3), Но тогда DD* = DAU = 0, т. е. Я = Л+-Л+ = 0. Для того чтобы установить существование матрицы А+, мы восполь- воспользуемся скелетным разложением C6) и будем искать сначала псевдооб- псевдообратные матрицы В+ и С+2). Так как по определению должны иметь место равенства ВВ+В = В, B+ = fjB*, D2) где U — некоторая матрица, то Умножая слева на В* и замечая, что В*В — неособенная квадратная матрица, найдем: Но тогда второе из равенств D2) дает искомое выражение для 2?+: 5+ = E*5)-x5*. D3) Совершенно аналогично найдем: С+ = С*(СС*)~1. D4) Покажем теперь, что матрица А+ = С*В+ = С* (СС*)-1 (В*В)~1 В* D5) удовлетворяет условиям D0), D1) и, следовательно, является псевдо- псевдообратной матрицей для А. х) Условия D1) означают, что строки (столбцы) матрицы Л+ являются линей- линейными комбинациями строк (столбцов) матрицы А* (см. сноску к стр. 19). Усло- Условия D1) могут быть заменены одним условием A+—A*WA*, где W—некоторая матрица (см. конец § 2). 2) Из определения 5 сразу следует, что если А=0, то и .4+=0. Поэтому в дальнейшем предполагается, что А Ф 0, и потому г==гА >0.
§ 5] ОБРАЩЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ. ПСЕВДООБРАТНАЯ МАТРИЦА 35 В самом деле, А А+А = ВСС* (СС*)-1 (В*В)-г В*ВС = ВС = А. С другой стороны, из равенств D3), D4) и D5) с учетом равенства = С*В*, полагая K=(CC*)-i(B*B)~\ находим А+ = С*КВ* = С*К (СС*)-1 СС*В* = UC*B* = VA*, А+ = С*КВ* = С*В*В (ВЩ-1 KB* = C*B*V = A*V, где U = С* KB*. Таким образом доказано, что для произвольной прямоугольной матрицы А существует одна и только одна псевдообратная матрица А+, которая определяется формулой D5), где В и С—сомножители в скелетном разложении А = ВС матрицы А1). Из самого определения псевдообрат- псевдообратной матрицы непосредственно следует, что в случае квадратной неосо- неособенной матрицы А псевдообратная матрица А+ совпадает с обратной А~х. Пример. Пусть 1—1 2 0 А= —1 2—3 1 0 1 11 Здесь г=2. Примем в качестве столбцов матрицы В первые два столбца матрицы А. Тогда л.*- _! ~l \\i' ; ;| 0 1 'I0 * —1 *!' В*В=\ СС*= 2 —3 — 3 6 13 01| |о з|Г Поэтому согласно формуле D5) 2 (В*В)~1= О Vs 1 I v.l Чз 0 i/з 1 || II 1 -1 01| 1/9 У& 2/9 »/«1111-1 2 l|| 2/9 -VB Х/9 4/9 V9 5/9 3. Свойства псевдообратной матрицы. Отметим следую- следующие свойства псевдообратной матрицы: 1 0 1 1 0 1 —1 1 2° 3° 4° (АА+J = !) Разложение C6) не определяет однозначно сомножителей ВС. Однако поскольку, как'было доказано, существует только одна псевдообратная матрица А+, формула D5) при всех скелетных разложениях матрицы А дает одно и то же зна- значение для А+. В гл. II, § 5 будет изложен другой метод вычисления псевдообрат- псевдообратной матрицы, использующий разбиение исходной матрицы на блоки (см. фор- формулу A01) на стр. 64). 3*
36 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I Первое свойство означает, что операции перехода к сопряженной и к псевдообратной матрице перестановочны между собой. Равенство 2° выражает собой взаимность понятия псевдообратной матрицы, так как согласно 2° псевдообратной матрицей для А+ является исходная матрица А. Согласно равенствам 3° и 4° матрицы АА+ и А+А являются эрмитовыми и инеолютиеными (квадрат каждой из этих матриц равен самой матрице). Для вывода равенства 1° воспользуемся скелетным разложением C6): А = ВС. Тогда равенство А* = С*В* дает скелетное разложение матрицы А*. Поэтому, заменяя в формуле D5) матрицу В на С*, а матрицу С на В*, получим: (А*)+ = В (В*В)~1 (СС*)-1 С = [С* (СС*)-1 (ВЩ-1 В*]* = (А+)*. Равенства А+ = С+В+, В+= (В*В)-г В*, С+ = С*(СС*)~1 являются скелет- скелетными разложениями. Следовательно, С+)+ = (В*)+ В*ВСС* (С*)+. Используя свойство 1°, а также выражения для В+ и С+, найдем: В (ВЩ-1 В*ВСС* (СС*)'1 С = ВС = А. Справедливость равенств 3° и 4° проверяется непосредственно путем подстановки в эти равенства вместо А* соответствующего выражения из формулы D5). Заметим, что в общем случае, когда разложение А=ВС не является скелет- скелетным, не всегда имеет место равенство А+=С+В+. Так, например, л=|1И|=1|о iii^ |=вс. Здесь 1111 = C+=||J|+=(|j|-||lll)+=lllll-ll21|-l||l 1|I = 1IV8 Vail- Поэтому C+B+=||1/21/2||S|II|=I|1/2II?=^+- 4. Наилучшее приближенное решение (по методу наимень- наименьших квадратов). Рассмотрим лроизвольную систему линейных уравнений = 1/27 .,„. umi%l + ««2^2 + • • • + Omn%n = Ут, или в матричной записи Ах = у. D6') Здесь уи у2» • • •> Ут—заданные числд, a xlt х2, ..., хп—искомые. В общем елучае система D6) может быть и несовместной. Столбец & = (х\х1, ...,а?) D7)
§ 5] ОБРАЩЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ. ПСЕВДООБРАТНАЯ МАТРИЦА 37 называется наилучшим приближенным решением системы D6), если при значениях хг = х\, хг = х1, ..., хп = х„ «квадратичное отклонение» т п | А |2 VI I VI 12 (A.R) достигает своего наименьшего значения и среди всех столбцов х, для которых это отклонение имеет минимальное значение, столбец х° имеет наименьшую «длину», т. е. для этого столбца величина п 1 12 * \1 I |2 l/Q\ t=i имеет наименьшее значение. Покажем, что система D6) всегда имеет одно и только одно наилуч- наилучшее приближенное решение и это приближенное решение определяется по формуле E0) где А+ — псевдообратная матрица для матрицы А. Для этого рассмотрим произвольный столбец х и положим у— Ax — u-\-v, где и = у — Ах° = у — АА+у, v = A(x°^-x). E1) Тогда | у — Ах |2= (у—Ах)*(у—Ах) = = (ц + у)* (и + v) = и*и + y*u + u*v + v*v. E2) Но v*u = (х° — х)*А* (у—АА+у) = (х°~ х)* (Л* — А*А А*) у. E3) Исходя из разложения C6) и формулы D5), найдем: А*АА+ = С*В*ВСС* (СС*)-1 (ВЩ-1 В* = С*В* = А*. Поэтому из равенства E3) следует v*u = 0, E4) но тогда и ц*у = (у*ц)* = 0. E4') Поэтому из равенства E2) находим: \у — Ax\2 = \u\2 + \v\*=\y — Ax°\2 + \A{x°—x)J, E5) и, следовательно, для любого столбца х \у-Ах\>\у-Аз*\. E6) Пусть теперь \у-Ах\ = \у—Ах°\; тогда согласно равенству E5) Az = 0, E7) где Z = X — Х°.
38 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. I С другой стороны, | х |2 = (x°+z)*(x° + z) = | х° |2 +1 z|2 + (ж0)* z+z*x°. E8) Вспоминая, что A+ = A*V (см. определение 5), получим в силу E7): (ж0)* z = (А+у)* z = (A*Vy)* z = y*V*Az = 0. E9) Но тогда и Поэтому из равенства E8) находим: и, следовательно, 12 -,. I „О 12 причем знак == имеет место только при z = 0, т. е. при х = х°, где х° = А+у. Пример. Найти наилучшее приближенное решение (по методу наименьших квадратов) системы линейных уравнений: =3, Здесь Но тогда (см. пример на стр и потому х = Следовательно, А = 35) А+ = *} xl х% А 1 - — 1 0 Чз V« 2/9 4/й У* 2/9 4/9 -1 2 2 —3 1 —1 0 V9 ч1 0 i/g -Чя Чв 0 1 1 1/3 2/9 5/9 V» 2/д 1/9 S/9 О О f> О г\ и При этом очевидно, что а:° = 1 ж° = 1 ж°=0 а:°^2 Определим норму || А || m х n-матрицы А = || aift || как неотрицательное число, задаваемое формулой F1) F1') fe=i i=i " Рассмотрим матричное уравнение AX = Y, F2) где Л и У—заданные тхп- и /ft X /ьматрицы, а X — искомая пхр- матрица.
$ 5] ОБРАЩЕНИЕ ПРЯМОУГОЛЬНЫХ МАТРИЦ. ПСЕВДООБРАТНАЯ МАТРИЦА 39 Определим наилучшее приближенное решение Х° уравнения F2) из условия причем в случае, когда требуется, чтобы Из соотношений = S \Y.h-AX.h\\ F3) ft=i 2 II х II2 =2 следует, что к-й столбец искомой матрицы Х\ должен быть наилучшим приближенным решением системы линейных уравнений Поэтому Поскольку это равенство справедливо при любом к = 1, ..., р, то X°-=A+Y. F5) Таким образом, уравнение F2) всегда имеет одно и только одно наилуч- наилучшее приближенное решение, определяемое формулой F5). В частном случае, когда Y — E — единичная матрица то-го порядка, имеем Х° = А+. Следовательно, псевдообратная матрица А+ является наилучшим приближенным решением (по методу наименьших квадратов) матричного уравнения АХ=Е. Это свойство псевдообратной матрицы А+ может быть принято в качестве ее определения. 5. Метод Гревилля последовательного нахождения псевдообратной матрицы состоит в следующем. Пусть щ — А-й столбец в т х n-матрице A, Ah = (au ...,ah) — матрица, образо- образованная первыми А столбцами матрицы A. bh — последняя строка в мат- матрице А% (А = 1, ..., п, А1 = а±, Ап = А). Тогда1) F6) ж для к > 1 имеют место рекуррентные формулы At = (B*h),Bh = AU-dhbh, dk = AUah; F7) яри этом, если ch = ah — Ah^ldh=^Q, то h = c? = (ah-Ah^dhy; F8) Если A1=ai=0, то и А\ =0.
40 МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ [ГЛ. 1 если же ch = 0, т. е. аь = А^^, то Предлагаем читателю проверить, что матрица Г ,h J является псевдо- псевдообратной для матрицы А%, если матрица Ви и строка bh определяются формулами F1) —F4). Этот метод не требует вычисления детерминантов и может быть использован для вычисления обратной матрицы. Пример. Пусть 1—1 О л- -1 2 * А— 2 —3 —1 ,011 Заметим, что для каждой вещественной матрицы М мы можем писать М' вместо М*. Тогда t=(AiAd-iAL=-LAi = \\4e, -1/6. Ч* 0 || , =^ta2=— 3/г> 02=0%—Ajd2 = V2 о 1 2=с+=(с^2)-1С2=т4=1|1/з. Чз, 0, 2=Л+-Й262 = || 2/з, Vb. Vb. Ill- Таким образом, Далее Поэтому л+_1|2/з Vb V» 1 2~llV3 Vb 0 2/» и 03=03—^24= = llVe, Veil^t=?H Vb Vs 4b 5/Bl| г/з Vb 1 Vs 0 «/, V3 2/9 VB e/ Vs 2/B Vo 5/ V3 VB 2/9 */9 0 1/g -1/9 VB Vb 2/B Vq 5/B V» VB 2/9 4/9 0 i/B -VB Vg
ГЛАВА II АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ § 1. Метод исключения Гаусса 1. Пусть дана система п линейных уравнений с п неизвестными хи х2, ..., хп и правыми частями уи у2, ..., уп- atl Xi + al2xz + . ¦ . + alnxn — yt, = y2, an2x2 + ... + annxn = yn. В матричной форме эта система может быть записана так: Ах = у. A') Здесь х = (х1,х2,...,хп), у^=(у1,у2,...,уп) — столбцы и A = \\aih\\?— квадратная матрица коэффициентов. Если А — неособенная матрица, то можно написать: или в развернутом виде: *,= Safcuifc (i = l, 2,...,n). B') Таким образом, задача вычисления элементов обратной матрицы Л-1= = llaihl)|ir эквивалентна задаче решения системы уравнений A) при любых правых частях yt, уъ, . - •, Уп- Элементы обратной матрицы определяются формулами B5) главы I. Однако фактическое вычисление элементов матрицы А'1 по этим формулам при большом п весьма затруднительно. Поэтому большое практическое значение имеют эффективные методы вычисления элементов обратной матрицы и, следовательно, решения системы линейных уравнений1). В настоящей главе мы изложим теоретические основы некоторых из этих методов, представляющих собой разновидности метода исключе- исключения Гаусса, знакомство с которым у читателя началось еще в курсе- алгебры средней школы. х) Для подробного ознакомления с этими методами мы рекомендуем обратиться к книге Фаддеевых [33], а также к циклу статей, напечатанных в «Успехах мате- математических наук», т. 5, вып. 3 A950).
42 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II 2. Пусть в системе уравнений A) ап Ф 0. Мы исключим х± из всех уравнений, начиная со 2-го, для чего ко второму уравнению почленно прибавим первое, помноженное на' — , к третьему почленно прибавим аи первое, помноженное на ——, и т. д. После этого система уравнений A) .заменится эквивалентной системой ... + а1пхп = C) Коэффициенты при неизвестных и свободные члены в последних (п — 1) уравнениях определяются формулами * = aV - C') Пусть а?" Ф 0. Тогда таким же образом мы исключим х2 из послед- последних п — 2 уравнений системы C) и получим систему уравнений anXi + а12х2 + al3x3 „B) „ „B) I Лппхп — Уп • ) D) При этом новые коэффициенты и правые части связаны с предыдущими •формулами: а%=а%-!^<Ъ уГ^уГ-^у? Р. / = з,..., п). E) Продолжая этот алгоритм далее, мы на (п — 1)-м этапе приведем исходную систему A) к треугольной рекуррентной системе + а13х3 + . ..+ атхп = уи = К F) Это приведение выполнимо в том и только в том случае, если в процессе приведения все числа а1и а™, а^', . .., a^ifn_! оказываются -отличными от нуля. Изложенный нами алгоритм Га у с с а состоит из однотипных операций, которые легко выполняются на современных счетных машинах. 3. Выразим коэффициенты и правые части приведенной системы через коэффициенты и правые части исходной системы A). При этом мы не будем предполагать, что в процессе приведения все числа •Яш а22}> • • ¦> an"i?n-i оказываются отличными от нуля, а рассмотрим общий случай, когда первые р из этих чисел отличны от нуля: аи Ф 0, <' ФО, ..., а*"» Ф 0 (р < п -1), G)
МЕТОД ИСКЛЮЧЕНИЯ ГАУССА 43 что дает возможность (на р-м этапе приведения) привести исходную систему уравнений к виду рп (8) Матрицу коэффициентов этой системы уравнений обозначим через Gp: (9) Переход от матрицы А к матрице Gp совершался следующим образом: к каждой строке матрицы А, начиная со 2-й и кончая п-й, последова- последовательно прибавлялись какие-то предыдущие строки (из числа первых р), помноженные на некоторые коэффициенты. Поэтому у матриц А и Gp одинаковы все миноры р-то порядка, содержащиеся в первых р строках, а также все миноры (/?-{-1)-го порядка, содержащиеся в строках с номе- номерами 1, 2, ..., р, i (i>p): 2 . р . кг = Gr A К 2 кг Р кг, 2 ... ч,Р1 [ki кг ¦ ¦ ¦ [</i;2< ... </ср<гс), 2 Р Ч-р+1 A0) Из этих формул, учитывая структуру (9) матрицы Gp, найдем: И 2 ... 1 2 ... р i 1 2 ... v к (И) ,...,»)• A2) Деля почленно второе из этих равенств на первое, получим основные формулы1) 2 ... р к I 2... (г, A3) См. [88], стр 89.
44 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II Если условия G) выполнены для данного значения р, то такие же условия выполнены для любого меньшего значения р. Поэтому фор- формулы A3) имеют место не только для данного значения р, но и для всех меньших значений р. То же можно сказать и о формуле A1). Поэтому вместо этой формулы можно написать равенства 1 2 1 2 \i 2 3/- A4) Таким образом, условия G), т. е. необходимые и достаточные условия выполнимости первых р этапов алгоритма Гаусса, могут быть записаны в виде следующих неравенств; = 0, ..., 2...p 2...p = 0. A5) Тогда из A4) находим: VI 2У ¦G") pp -D = (О ' A6) Для того чтобы в алгоритме исключения Гаусса можно было после- последовательно исключить хи х2, ..., хр, нужно, чтобы все величины A6) были отличны от нуля, т. е. чтобы выполнялись неравенства A5). В то же время формулы для aip имеют смысл, если выполняется только последнее из условий A5). 4. Пусть матрица коэффициентов в системе уравнений A) имеет ранг г. Тогда надлежащей перестановкой уравнений и изменением нуме- нумерации неизвестных можно добиться выполнения неравенств 2...J 2 ... / = 0 (/=1,2, ..., A7) Это позволяет последовательно исключить систему уравнений +alnxn = х%, ..., хт и получить A8) Здесь коэффициенты определяются по формулам A3). Из этих формул, поскольку ранг матрицы А = \\ aih Ц*1 равен г, следует, что о*2 === U (t, /с =
§ 2] МЕХАНИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ АЛГОРИТМА ГАУССА 45 и матрица Gr, получающаяся из матрицы А = || aih \\™, после применения r-этапного алгоритма исключения Гаусса, имеет вид alz а1т , г+1 0 0 0 0 a(r_l rr ... 0 ) flfr r, 0 -1) r+1 " • rn .. 0 A9) о о ... о о ... о Последние п — г уравнений A8) сводятся к условиям совместности , ...,n). B0) Заметим, что столбец свободных членов при алгоритме исключения подвергается таким же преобразованиям, как и любой столбец коэффи- коэффициентов. Поэтому, дополняя матрицу .4 = ||агй||" (п + 1)-м столбцом из свободных членов, мы получим: (»" = 1, 2 п; р = 1,2,...,г). B1) В частности, условия совместности B0) сводятся к известным условиям II ... г r+j\ [I ...r n + lj=° /•=!, 2, ...,»-г). B2) Если г = п, т. е. матрица Л = |] а^ ||^ неособенная, и 2 ... /\ 12 -. | (/=1,2, ...,и), то при помощи алгоритма Гаусса можно последовательно исключить хи хг, ..., Хп-! и привести систему уравнений к виду F). § 2. Механическая интерпретация алгоритма Гаусса Рассмотрим произвольную упругую статическую систему S, закрепленную на краях (например, струну, стержень, многопролетный стержень, мембрану, пластину или дискретную систему), и возьмем на ней п точек A), B), ..., (п). Мы будем рассматривать переме- перемещения (прогибы) yi, г/2, ..., уп точек A), B), ..., (п) системы S под дейст- действием сил Fi, F2, ..., Fn, приложенных в этих же точках. Мы будем предпо- предполагать, что силы и перемещения Рис. 1. параллельны одному и тому же на- направлению и потому определяются своими алгебраическими величинами (рис. 1). Кроме того, мы примем, что имеет место принцип линейного нало- наложения сил: 1° При суммарном налоокении двух систпем'сил соответствующие прогибы скла- складываются. 2° При умножении величин всех сил на одно и то же вещественное число все прогибы умножаются на это число.
46 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II Обозначим через aik коэффициент влияния точки (к) на точку (г), т. е. прогиб в точке (г) под действием единичной силы, приложенной в точке (к) (i, &=1, 2, ..., п) (рис. 2). Тогда при совместном действии сил Fu F2, ¦¦-, Fn прогибы ylt у2, ..., уп определятся по формулам atkFh=Vi (i = l, 2, ri). B3> Сопоставляя B3) с исходной системой A), мы задачу отыскания решения системы уравнений A) можем интерпретировать так: Даны прогибы yi, у2, ..., Уп- Ищутся соответствующие силы Fu F2, ..., Fn. Обозначим через Sp статическую систему, получающуюся из S введением р неподвижных шарнирных опор в точках A), B) ..., (р) {р^п). Коэффициенты влияния дл-я оставшихся подвижных IP ¦it . л точек (р+1)> значим через Лр) ., (") системы Sp обо- (i, k= ri) •Чк Рис. 2. (см. рис. 3 для р=1). Коэффициент а[^ можно рассмат- рассматривать как прогиб в точке (?) системы S при действии единичной силы в точке (к) и сил реакций Rlt R2, ..., Rp в закреп- закрепленных точках A), B), ..., (р). Поэтому + 4*. B4> С другой стороны, при этих же силах прогибы системы S в точках A), B), ..., (р) равны нулю: B5> Если то мы можем из B5) определить Rit R2, ..., Rp и полученные выражения подставить в B4). Это исключение Л4, R2, ..., Rp можно сделать и так. К системе равенств B5> прибавим равенство B4), записанное в виде р , i т> Д-/7. о^) О f24'Y Рассматривая B5) и B4') как систему p+i однородных уравнений, имеющую р () ( ненулевое решение Rit R2, системы равен нулю: у Rv, Rp+i = l, получаем, что определитель этой alp aih api арр aip aph Отсюда /I2...pi\ VI 2...pkJ l2...P =0. =p + l, ..., n). B6) По этим формулам коэффициенты влияния «опорной» системы Sp выражаются через коэффициенты влияния исходной системы <S". Но формулы B6) совпадают с формулами A3) предыдущего параграфа. Поэтому для любого р «п —1) коэффициенты о^> (i, к=р+1, ..., ri) в алгоритме Гаусса являются коэффициентами влияния опорной системы Sp.
§ 3] ДВТЕРМИНАНТНОВ ТОЖДЕСТВО СИЛЬВЕСТРА 47 В справедливости этого основного положения можно убедиться из чисто меха- механических соображений, не опираясь на алгебраический вывод формул A3). Для этого- рассмотрим сначала частный случай одной опоры: р=1 (рис. 3). В этом случае^ коэффициенты влияния системы <S"i определятся по формулам [полагаем р=1 в B6)]: (i, k = i, 2, ..., n). чо ail Эти формулы совпадают с формулами C'). Таким образом, если коэффициенты aik (i, /c=l, 2, ..., п) в системе уравне- уравнений A) являются коэффициентами влияния статической системы S, то коэффициенты aife ('• ^ =2, , ге) в алгоритме Гаусса являются коэффициентами влияния системы <S"i. Применяя эти же соображения к системе St и вводя в ней вторую опору в точке B), получим, что коэффициенты af? (?, /с=3, ..., п) в системе уравнений D) являются коэффициентами влияния опорной системы S2, и вообще для любого р«« —1> коэффициенты а^ (i, k=p-\-l, ...,n) вал- горитме Гаусса являются коэффициентами влияния опорной системы Sp. Из механических соображений оче- очевидно, что последовательное введение р опор равносильно одновременному введению этих опор. Замечание. Обращаем внимание на то, что при механической интерпретации алгоритма исключения не было необходимости предполагать, что точки, в которых: рассматриваются прогибы, совпадают с точками приложения сил Fit F%, , Fn. Можно считать, что у^, уг, , уп—^прогибы точек A), B), , (ге), а силы Fit F2, ..., Fn приложены в точках A'), B'), ..., (п1). Тогда aik—коэффициент^ влияния точки (к') на точку (Г). В этом случае вместо опоры в точке (/) следует рассматривать обобщенную опору в точках (/), (/'), при которой прогиб в точке (/) поддерживается все время равным нулю за счет надлежащим образом выбранной вспомогательной силы Rj в точке (/'). Условие возможности введения р обобщенных опор в точках A), A'); B), B'); ...; (р), (/>'), т. е. возможность удовлетворить условиям 2/1=0, j/2=0, , Ур=0 при любых Fp+l, , Fn за счет надлежащих i?i=Fi, , Rp=Fp, выражается неравенством Рис. 3. § 3. Детерминантное тождество Сильвестра В § 1 путем сопоставления матриц А и Gv мы пришли к равенствам A0) и A1). Эти равенства позволяют сразу получить важное детерминант- детерминантное тождество Сильвестра. Действительно, из A0) и A1) находим: 2 ... 2 ... №) п, р+1 •••«Й? B7) /1 2 ... /Л Введем в рассмотрение окаймляющие минор А I . „ I \1 ^ • • • Pi II 2 ... р i\ Ь* = А\12..рк) &к- определители. Матрицу, составленную из этих определителей, обозначим через
48 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II Тогда согласно формулам A3) Dp+1. р+1 ... ь р+1, п Ь«, р+1 ¦¦• Ьп \в\ К!":: ,...р\-1л-р • ! • •. pj J Поэтому равенство B7) может быть записано так: 2 ... B8) Это и есть детерминантное тождество Сильвестра. Оно выражает определитель | В |, составленный из окаймляющих определителей, через исходный определитель и окаймляемый минор. Равенство B8) было нами установлено для матриц А = ||а№||^, эле- элементы которых удовлетворяют неравенствам /1 2 ...А \12...)) ф() 0 = 1.2,..- ,Р). B9) Однако из «соображений непрерывности» следует, что эти ограниче- ограничения можно отбросить и что тождество Сильвестра справедливо для любой матрицы А = || aih\\™. В самом деле, пусть неравенства B9) не выполняются. Введем матрицу Ае = А + еЕ. Очевидно, ИтАе = е-»0 С другой стороны, миноры представляют собой р не равных тождественно нулю многочленов относи- относительно е. Поэтому можно выбрать •такую последовательность гт —> 0, что /1 2 ... Лт\12... Для матрицы Ает мы можем написать тождество B8). Переходя в обеих частях этого тождества к пределу при т~-> со, мы получим тождество Сильвестра для предельной матрицы А = 1\тАет1). Если мы тождество B8) применим к определителю II 2 ... р it iz ... iq\ I I'j < г2 < ... < гд \ \ 1 2 ... p kt k2 . ¦. kg/ \ kt < kz< ... </сд^ / ' то мы получим удобный для применений вид тождества Сильвестра: 1 2 ... 2 ... p kt kz !) Под пределом (при р~>-со) последовательности матриц Вр- матрицу В=\\ btk Ц", где Ъ^— lim Ъ$ (г, Л = 1, 2, ..., ге). понимают
§ 4] РАЗЛОЖЕНИЕ КВАДРАТНОЙ МАТРИЦЫ НА ТРЕУГОЛЬНЫЕ МНОЖИТЕЛИ 49 § 4. Разложение квадратной матрицы на треугольные множители 1. Пусть дана матрица .4 = ||ajft|||f ранга г. Введем следующие обо- обозначения для последовательных главных миноров этой матрицы: A 2 ... к\ г... к) (Л=1>2> •'"п)" Допустим, что имеют место условия выполнимости алгоритма Гаусса: Обозначим через G матрицу коэффициентов системы уравнений A8), к которой приводится система уравнений 2 методом исключения Гаусса. Матрица G имеет верхнюю треугольную форму, причем элементы ее первых г строк определяются формулами A3), а элементы последних п — г строк все равны нулю1): 0 0 с 0 • • • <-" ... 0 0 " ' * т ... 0 о о о о ... О Переход от матрицы А к матрице G совершался при помощи некото- некоторого числа N операций следующего типа: к i-й строке матрицы при- прибавлялась /-я (/<?) строка, предварительно помноженная на некоторое число а. Такая операция равносильна умножению преобразуемой матрицы слева на матрицу 0) @ 1 ... о ... о ... о о .. о о . 1 ... 0 о C1) В этой матрице на главной диагонали стоят единицы, а все остальные элементы, за исключением элемента а, равны нулю. !) Матрица G совпадает с матрицей GT (стр. 45). 4 Ф. р. Гантмахер
50 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II Таким образов, где каждая из матриц Wt, Wz, ..., WN имеет вид C1) и, следовательно, является нижней треугольной матрицей с диагональными элементами, равными 1. Пусть W = WN ... WJVi- C2) Тогда G = WA. C3) Матрицу W будем называть преобразующей матрицей для матрицы А в методе исключения Гаусса. Обе матрицы, G и W, однозначно опре- определяются заданием матрицы А. Из C2) следует, что W—нижняя тре- треугольная матрица с диагональными элементами, равными 1 (см. стр. 28). Поскольку И'—неособенная матрица, то из C3) находим: A=W~XG. C3') Мы представили матрицу А в виде произведения нижней треугольной матрицы W'1 на верхнюю треугольную матрицу G. Вопрос о разложении матрицы А на множители такого типа полностью выясняется следующей теоремой: Теорема 1. Всякую матрицу A = \\aik\\^ ранга г, у которой пер- первые г последовательных главных миноров отличны от нуля, 1 2 ... к 1 2 ... к (к=1, 2, C4) можно представить в виде произведения нижней треугольной матрицы В на верхнюю треугольную матрицу С /i = DL = Hi О О О Кг ¦ ¦ ¦ Ъпп Си О С12 С22 О 0 ... Спп При этом ЬпСц — Du bzzc22 = -7^-) • - -. brTcrr = Dr A-i ' C5) C6) Первым г диагональным элементам матриц В и С можно дать произвольные значения, удовлетворяющие условиям C6). Задание первых г диагональных элементов матриц В и С определяет однозначно элементы первых г столбцов матрицы В и первых г строк матрицы С. Для этих элементов имеют место формулы 1="Кк Afi2... k-ig\ VI 2... к— 1 к) У1 2 1 2 к—l к к — t g l2 C7) (g = k, k + 1, ..., n; k=l, 2, ..., r). В случае г < n (| A | = 0) в последних n — r столбцах матрицы В можно все элементы положить равными нулю, а в последних п— г стро- строках матрицы С всем элементам дать произвольные значения, либо
$ 4] РАЗЛОЖЕНИЕ КВАДРАТНОЙ МАТРИЦЫ НА ТРЕУГОЛЬНЫЕ МНОЖИТЕЛИ 51 наоборот, последние п — г строк матрицы С заполнить нулями, а послед- последние п — г столбцов матрицы В взять произвольными. Доказательство. Возможность представления матрицы, удовле- удовлетворяющей условию C4), в виде произведения C5) была доказана выше [см. C3')]. Пусть теперь В к С — произвольные нижняя и верхняя треугольные матрицы, произведение которых равно А. Пользуясь формулой для мино- миноров произведения двух матриц, найдем: I12...k-lg\ /1 2 ...ft-lg\ /aia2...aft U / lg\ lft/ 2... ft—lft/ ^ UiOg-.-Oft-i a»/ 1 2 ...k ai<a2<... <aft C8) (g = ft, k+l, .. ., n, /c = l, 2, ..., r). Поскольку С —верхняя треугольная матрица, то первые к столбцов матрицы С содержат только один отличный от нуля минор ft-ro порядка /1 2 ... ft\ С I . Поэтому равенство C8) может быть записано так: \1 Z ... к/ /12...А —lg\ /1 2 ... к—1 g\ /12...ft\ Л\1 2 ... ft-1 fc/=J?\l 2 ... ft-1 k)C\l 2 ... ft/ = = Ьц&22 • - • h-1, k-lbghcllc22 • ¦ ¦ Cftk C9) (g = k, k + l, ..., n; ft = l, 2, ..., r). Положим сначала здесь g — к. Тогда получим: ЬцЬзц ... bhhcuc2z ... ckk = Dk (ft = 1, 2, ..., г), D0) откуда уже вытекают соотношения C6). Не нарушая равенства C5), мы можем в нем умножить матрицу В справа на произвольную неособенную диагональную матрицу М = || fij6;ft ||y, одновременно умножая матрицу С слева на М = || цГхб|й ||у. Это равно- равносильно умножению столбцов матрицы В соответственно на \iu ц2, ..., [х,п и строк матрицы С на [г, [г, ..., jj,^1. Поэтому диагональным элемен- элементам Ьи, ..., brr, си, ..., сгг можно придать любые значения, удовле- удовлетворяющие условиям C6). Далее, из C9) и D0) находим: , ...,n; ft=l, 2, ..., г), А2..7к\ т. е. первые формулы C7). Совершенно аналогично устанавливаются вторые формулы C7) для элементов матрицы С. Обратим внимание на то, что при перемножении матриц В ж С эле- элементы fcftg последних п — г столбцов матрицы В и элементы cgh последних п — г строк матрицы С перемножаются только между собой. Мы видели, что все элементы последних п—г строк матрицы С можно выбрать равными нулю1). Тогда элементы последних п — г столбцов матрицы В можно г) Это следует из представления C3'). При этом диагональным элементам 6ц, ..., ЪТГ, сц, ..., сгг, как было уже показано, можно придать любые значения, удовлетворяющие условиям C6) за счет надлежащих множителей \iit (j,2, ..., цг. 4*
52 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II выбрать произвольными. Ясно, что произведение матриц В и С не из- изменится, если мы последние п — г столбцов матрицы В возьмем нулевыми, а элементы последних п — г строк матрицы С произвольными. Теорема доказана. Из доказанной теоремы вытекает ряд интересных следствий. Следствие 1. Элементы первых г столбцов матрицы В и первых г строк матрицы С связаны с элементами матрицы А рекуррентными соотношениями: h-l aik— 2 (i>k; i=l, 2, ..., n; ft = 1,2, ..., r), hi i = l, 2, = l, 2, ..., n). D1) J Соотношения D1) непосредственно следуют из матричного равенства C5) ими удобно пользоваться для фактического вычисления элементов матриц В ж С. Следствие 2. Если .4 = j[ajft||™—неособенная матрица (г = п), удовлетворяющая условию C4), то в представлении C5) матрицы В и С определяются однозначно, как только диагональные элементы этих матриц выбраны в соответствии с условиями C6). Следствие 3. Если S = \\ sik \\%—симметрическая матрица ранга г и 2 (к = 1, 2, г), то где В = \\Ь1к\\*—нижняя треугольная матрица, в которой Л /12 ••• к!ё\ (g = fc,ft + i, ...,»; * = 1,2, .... г), D2) 0 2. Пусть в представлении C5) у матрицы В элементы последних п—г столбцов равны нулю. Тогда можно положить: О О О О О L, D3) где F — нижняя, a L — верхняя треугольная матрица; при этом первые г диагональных элементов у матриц F и L равны 1, а элементы послед- последних п—г столбцов матрицы F и последних л —г строк матрицы L выбраны совершенно произвольно. Подставляя в C5) выражения D3) для В и С и используя равенства C6), придем к следующей теореме:
§ 4] РАЗЛОЖЕНИЕ КВАДРАТНОЙ МАТРИЦЫ НА ТРЕУГОЛЬНЫЕ МНОЖИТЕЛИ 53 Теорема 2. Всякая матрица А = || aik||p ранга г, у которой представима в виде произведения нижней треугольной матрицы F, диа- диагональной D и верхней треугольной L: 1 ы и 0 1 /п2 ... 0 ... 0 ... 1 D, Дг о i ... О 0 ... 1 D4) 1 2 1 2 к — 1 /с /1 2 ... /с — 1ЯЛ \1 2 ... fc-lgj /12 VI 2 /12 U п; : = 1, 2, .... г), D5) в /gfc> hg произвольны при gr = Л; +1, ..., п', к = г-\-1, ..., п. 3. Метод исключения Гаусса, будучи применен к матрице А = || щк ||™ ранга г, для которой Бкф0 (к — 1, 2, ..., г), дает нам две матрицы: нижнюю треугольную матрицу W с диагональными элементами 1 и верх- верхнюю треугольную матрицу G, у которой первые г диагональных эле- п D9 DT ментов равны Vt, ~, ..., , а последние п—г строк заполнены нулями. G — гауссова форма матрицы A, W—преобразующая матрица. Для конкретного вычисления элементов матрицы W можно реко- рекомендовать следующий прием. Мы получим матрицу W, если к единичной матрице Е применим все те преобразования (задаваемые матрицами Wu ..., WN), которые мы в алгоритме Гаусса делали над матрицей А (в этом случае вместо произведения WA, рабного G, мы будем иметь произведение WE, рав- равное W). Поэтому к матрице А приписываем справа единичную мат- матрицу Е: п ,.. ainl ... О ani. ... ОппО ... 1 D6) Применяя к этой прямоугольной матрице все преобразования алго- алгоритма Гаусса, получим прямоугольную матрицу, состоящую из двух квадратных матриц G и W: (G, W). Таким образом, применение алгоритма Гаусса к матрице D6) дает одновременно и матрицу G и матрицу W.
54 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II Если А — неособенная матрица, т. е. | А \ Ф 0, то и | G \ Ф 0. В этом случае из C3) следует А~х = G~VW. Поскольку матрицы G и W опреде- определены при помощи алгоритма Гаусса, то нахождение обратной матрицы А'1 сводится к определению G и умножению G'1 на W. Хотя нахождение обратной матрицы G, после того как опреде- определена матрица G, не представляет затруднений, поскольку G — треуголь- треугольная матрица, тем не менее можно избежать этой операции. Для этого наряду с матрицами G и W введем аналогичные матрицы Gt и Wt для транспонированной матрицы А'. Тогда A' =W~1Gi, т. е. А = G'^W'-1. D7) Сопоставим между собой равенства C3') и D4): a = fdL Эти равенства могут быть рассматриваемы как два различных разло- разложения вида C5); при этом мы произведение DL рассматриваем как второй множитель С. Поскольку первые г диагональных элементов у первых множителей одинаковы (они равны 1), то первые г столбцов у них совпадают. Тогда, поскольку последние п—г столбцов матрицы F могут быть выбраны произвольными, то выберем их так, чтобы F = W~\ D8) С другой стороны, сопоставление равенств D7) и D4): A = G'1W'1~\ A = FDL показывает, что можно так подобрать произвольные элементы в L, чтобы L = W'-\ D9) Подставляя в D4) вместо F и L их выражения из D8) и D9), получим: A=W-1DW'-\- E0) Сопоставляя это равегаяво с равенствами C3') и D7), мы найдем: G = DW'f1, G; = W~W. E1) Введем в рассмотрение диагональную матрицу Тогда, поскольку D = DDD, то из E0) и E1) следует: A = G[DG. E3) Формула E3) показывает, что разложение матрицы А на треугольные множители может быть получено применением алгоритма Гаусса к мат- матрицам А и А'. Пусть теперь А — неособенная матрица (r — п). Тогда \Б\фО, D = D~X. Поэтому из E0) следует: j E4)
§ 5] БЛОЧНЫЕ МАТРИЦЫ. ОБОБЩЕННЫЙ АЛГОРИТМ ГАУССА 55 Эта формула дает возможность эффективного вычисления обратной матрицы Л путем применения алгоритма Гаусса к прямоугольным матрицам {А, Е) {А', Е). В частном случае, когда вместо матрицы А возьмем симметрическую матрицу S, матрица Gt совпадает с G, а,матрица И^ — с матрицей W, и потому формулы E3) и E4) принимают вид S = G'DG, E5) r E6) § 5. Разбиение матрицы на блоки. Техника оперирования с блочными матрицами. Обобщенный алгоритм Гаусса Часто приходится пользоваться матрицами, разбитыми на прямо- прямоугольные части — «клетки» или .«блоки». Рассмотрению таких «блочных» матриц мы посвящаем настоящий параграф. 1. Пусть дана прямоугольная матрица 4 = ||<Ч*Н (i = l, 2, .... т; А = 1, 2, ..., п). E7) При помощи горизонтальных и вертикальных линий рассечем мат- матрицу А на прямоугольные блоки: E8) Про матрицу E8) будем говорить, что она разбита на st блоков ЛаР размером щ,. X щ (а = 1, 2, ..., s; 0 = 1, 2, ..., t) или что она представлена в виде блочной матрицы. Вместо E8) будем сокращенно писать: A = (Aafi) (а = 1, 2 s; p = l, 2, ..., t). E9) В случае s = t будем пользоваться и такой записью: 4 = (А*I. F0) Действия над блочными матрицами производятся по тем же фор- формальным правилам, как и в случае, когда вместо блоков имеем число- числовые элементы. Пусть, например, даны две прямоугольные матрицы оди- одинаковых размеров и с одинаковым разбиением на блоки: A^(Aafs), B = (Bafi) (о = 1, 2, ..., s; p = l, 2, ..., t). F1) Легко усмотреть, что ) (сс=1, 2, .... s; p = l, 2, ..., t). F2) Подробнее остановимся иа умножении блочных матриц. Известно (см. гл. I, стр. 17), что при умножении двух прямоугольных матриц А и В длина строк в первом сомножителе А должна совпадать с высо- высотой столбцов во втором сомножителе В. Для возможности «блочного»
56 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II умножения этих матриц мы дополнительно потребуем, чтобы при раз- разбиении на блоки все горизонтальные размеры в первом сомножителе совпадали с соответствующими вертикальными размерами во втором: /^ Рг - - • Ри } mt /Blt Biz • ¦ • #L\ } Щ А==\ «я ^22 ... лгг | } ™2, Б = | ^21 522 ... Б2и | } пг _ F3) ... ASJ } тв \ВН Bt2 ¦¦. BtJ } nt Тогда легко проверить, что * /а = 1, 2, ...,s\ АВ = С = (Сар), где Сар=2^аб^бр („ л' о'*""' )' ^^ Отдельно отметим тот частный случай, когда одним из сомножите- сомножителей является квазидиагоналъная матрица. Пусть А — квазидиагональная матрица, т. е. s.= t и Лар = О при а^В. В этом случае формула F4) нам дает: С = А Л fo=l 2 ч' R = 1 2 ii\ /6S^ При умножении блочной матрицы слева на квазидиагоналъную матрицу строки блочной матрицы умножаются слева на соответст- соответствующие диагональные клетки квазидиагоналъной матрицы. Пусть теперь В — квазидиагональная матрица, т. е. t — u иВар = 0 при аф$. Тогда из F4) получаем: (а = 1, 2, ...,si B = l, 2, ...,ц). F6) При умножении блочной матрицы справа на квазидиагоналъную все столбцы блочной матрицы умножаются справа на соответствующие диагональные клетки квазидиагональной матрицы. Заметим, что умножение квадратных блочных матриц одного и того же порядка всегда выполнимо, когда сомножители разбиты на одинаковые квадратные схемы блоков и в каждом из сомножителей на диагональных местах стоят квадратные матрицы. Блочная матрица E8) называется верхней (нижней) квазитреуголъ- квазитреуголъной, если s = t и все Аа$ = 0 при а > В (соответственно все Аа$ = 0 при а<В). Частным случаем квазитреугольной матрипы является квази- квазидиагональная матрица. Из формулы F4) легко усмотреть, что Произведение двух верхних (нижних) квазитреуеолъных матриц является снова верхней (нижней) квазитреуголъной матрицей1); при этом диагональные блоки произведения получаются путем перемножения соответствующих диагональных блоков сомножителей. Действительно, полагая в F4) s = t ж Л.р = 0, ?«р = 0 при а<В, найдем: СаР = 0 при а<В ] и } (а, В = 1, 2 s). При атом предполагается, что блочное умножение выполнимо.
§ 5] БЛОЧНЫЕ МАТРИЦЫ. ОБОБЩЕННЫЙ АЛГОРИТМ ГАУССА 57 Аналогично разбирается случай нижних квазитреугольных матриц. Отметим правило вычисления определителя квазитреугольной мат- матрицы. Это правило можно получить, исходя из разложения Лапласа. Если А — квазитреуголъная {в частности, квазидиагопалъпая) матрица с квадратными диагональными блоками, то определитель этой матрицы равен произведению определителей диагональных блоков: |4[ = |Ail IA2| ••- [A 2. Пусть дана блочная матрица щ п2 ... щ 'Ai A2 • • • AtN • ¦ • An F7) F8) ¦ ¦ ¦ Ast/ } ms Прибавим к а-й блочной строке р-ю строку, предварительно помножен- помноженную слева на прямоугольную матрицу X размером та X тр. Получим блочную матрицу Аи ... Alt \ F9) Введем вспомогательную квадратную матрицу V, представленную в виде следующей квадратной схемы блоков: пц'.:.та...щ...тв /Т... "(F . .. "(Г ... Ъ\ }т1 О ... Е ... X ... О О ... О ... Е ... О }та G0) \0 ... 0 ... 0 ... EJ } тв В диагональных клетках матрицы V стоят единичные матрицы, порядки которых равны соответственно ти т2, .. •, ms; все недиаго- недиагональные блоки матрицы V равны нулю, за исключением блока X, стоя- стоящего на пересечении а-й блочной строки с р"-м блочным столбцом. Нетрудно видеть, что VA = B. G1) Отсюда, поскольку V—неособенная матрица, для рангов матриц А ш В имеем1): гА = гв. G2) См. стр. 22.
58 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II В частном случае, когда А— квадратная матрица, из G1) имеем: \V\\A\ = \B\. G3) Но определитель квазитреугольной матрицы V равен 1: 1. G4) Следовательно, \А\ = \В\. G5) К таким же выводам можно прийти, если к какому-либо столбцу матрицы F7) прибавлять другой столбец, предварительно помноженный справа на прямоугольную матрицу X надлежащих размеров. Полученные результаты могут быть сформулированы в виде сле- следующей теоремы. Теорема 3. Если в блочной матрице А к а-й блочной строке (столбцу) прибавить $~ю блочную строку (столбец), предварительно помноженную слева (справа) на прямоугольную матрицу X соответст- соответствующих размеров, то при этом преобразовании не изменятся ранг матрицы А, а также в случае, когда А—квадратная матрица, и опре- определитель матрицы А. 3. Рассмотрим теперь тот частный случай, когда в матрице А диагональный блок Ап — квадратная и притом неособенная матрица |Л|) а|) К а-й строке матрицы А прибавим первую строку, помноженную слева на —Аа1А~1 (а = 2, ..., s). Тогда получим матрицу G6) где А{$ = - AalA^Alfi + Aafi (а == 2, ...,*; р = 2, ...,«)• G7) Если А™ — квадратная неособенная матрица, то этот процесс можно продолжить. Мы приходим, таким образом, к обобщенному алго- алгоритму Гаусса. Пусть А — квадратная матрица. Тогда G8) A% Формула G8) сводит вычисление определителя | А |, состоящего из st блоков, к вычислению определителя меньшего порядка, состоящего из (s — 1) (f — 1) блоков1). Рассмотрим определитель Д, разбитый на четыре блока: С D где А и D — квадратные матрицы. G9) !) Если А$—квадратная матрица и | А$ | ф 0, то к полученному определи- определителю из (s — l)(t—1)* блоков мы можем снова применить такое же преобразование и т. д.
§ 5] БЛОЧНЫЕ МАТРИЦЫ. ОБОБЩЕННЫЕ АЛГОРИТМ ГАУССА 59 Пусть | А \ Ф 0. Тогда вычтем из второй строки первую, предвари- предварительно помноженную слева на —СА~\ Получим: А 0 В D = \А\ ID- (I) Точно так же, если \Б\фО, то мы вычтем в Д из первой строки вторую, предварительно помноженную слева на —BD'1. Получим: А = l — BD^C 0 С D D\. (И) В частном случае, когда все четыре матрицы А, В, С, D — квад- квадратные (одного и того же порядка п), из (I) и (И) следуют формулы Шура, сводящие вычисление определителя 2/г-го порядка к вычисле- вычислению определителя n-го порядка: = \AD-ACA~1B\ (\А\фО), Aа) (На) Если матрицы А и С перестановочны между собой, то из Aа) следует: & = \AD — CB\ (при условии АС = СА). A6) Точно так же, если С и D перестановочны между собой, то A = \AD — ВС\ (при условии CD = DC). (Иб) Формула A6) была получена в предположении | А | =^= 0, а формула (Иб) при условии | D | Ф 0. Однако, исходя из соображений непрерыв- непрерывности, эти ограничения можно отбросить. Из формул (I) — (Иб) можно получить еще шесть формул, поменяв местами в правых частях А и D и одновременно В и С. Пример. Д= 1 0 Ъх Ъ2 0 1 Ъ3 Ь4 cj c2 di d2 По формуле A6) А = ±—Cjbj—c2b3 d2—сфг—с 4. Установим формулу Фробениуса1) для обращения блочной матрицы. Пусть неособенная квадратная матрица М A М \ Ф 0) разбита на блоки п{ п д С D и пусть А — также неособенная квадратная матрица буется определить М (80) ). Тре- См., например, [44].
60 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II Применим к матрице М обобщенный алгоритм Гаусса. Из второй блочной строки вычтем первую, предварительно помноженную слева на —С А'1. Эта операция равносильна умножению матрицы М слева на матрицу*) | ^ ^ ] , где X = — СА~г. Поэтому Е -СА-^Е}" \0/)-Г'-1' (81> Введем обозначение H = D-CA~1B и заметим, что из равенства (81) следует: \М\ = \А[\П\. (82) Поэтому, поскольку \М\фО, то и |Я|^02). Переходя к обратным матрицам в равенстве (81), получим Е 0\-»/4 В\-^ (83> — СА^Е) \0Н) Обратную матрицу для матрицы I I будем искать в виде ( j • Тогда из равенства АВ\ lA-i U \ = (Е0\ ОН) [О Я-1/ \0 Е) находим, что U = —А^ВН'1. Таким образом, (84) у оп) [о я-1 Но тогда из равенства (83) находим {ОН} [-СА-1 В) \0 Н-1 )\ — СА-1Е} Выполняя умножение блочных матриц в правой части равенства (85), приходим к формуле Фробениуса \ Я-1 ) где H^D-CA'iB. (87) Формула Фробениуса (86) сводит обращение матрицы порядка n к обращению- двух матриц порядка п и q и к операциям сложения и умножения ма*риц с размерами пхп, дхд, пхд и дх п. 1) В первой блочной строке буква Е обозначает единичную матрицу и-го порядка, а во второй—единичную матрицу порядка д. 2) Нам нет необходимости заранее устанавливать неособенность матрицы М, так как это свойство матрицы М следует из того, что | А \ Ф 0 и | Н \ ф 0. Если бы оказалось, что |Я|=0, хо тогда и |Л/|=0, и в этом случае не существует обрат- обратной матрицы Af.
§ 5] БЛОЧНЫЕ МАТРИЦЫ. ОБОБЩЕННЫЙ АЛГОРИТМ ГАУССА 61 Если предположить, что | D | Ф 0 (вместо | А \ Ф- 0) и поменять ролями матрицы А и D, то можно получить другой вид формулы Фробениуса: Д В т* где (89) Пример. Требуется найти элементы обратной матрицы для матрицы 1—1 0 1 —1 2—10 0 2 0 1 2 0 12 Полагаем М= 1 —1 — 1 2 Находим последовательно 12 1 .4-1 = 1 1 12 —1 3 —2 10 2 | 2 0 || 2 2 11 4 2 — II2 1 0 1| — 1 0| 2 1 1 1 С =. 2 211 4 2 : 0 2 2 0 ¦?» = 10 1 1 2 — 1 2 — 1 1 -1 0 0 41- -i о|г 12 — |з — 2 2 || .. ..4 2 || —2 3 —1 1 2 — 111 || 2 2 3 —2 4 2 —2 2 —2 4 0 1 1 2 — 1 211 — 1 11|' II 4 —3 -4 21 -20 0 2 -2 2 12 —1 3 —2 Поэтому по формуле (86) находим: —2 —1 0 2 3 1 —2 —2 —4 —1 2 3 3 1 —1 —2 5. Из теоремы 3 вытекает также Теорема 4. Если прямоугольная матрица R представлена в блоч- блочном виде <А В\ с о) • <90> где А — квадратная неособенная матрица порядка п (|Л[=/=0), то ранг
62 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II матрицы R равен п в том и только в том случае, когда D^CA^B. (91) Доказательство. Вычтем из второй блочной строки матрицы R первую, предварительно помноженную слева на СА~Х. Тогда получим матрицу \А В \ D-CA^BJ ¦ (92) Матрицы R и Т согласно теореме 3 имеют один и тот же ранг. Ранг же матрицы Т совпадает с рангом матрицы А (т. е. с п) тогда и только тогда, когда D — СА~гВ = 0, т. е. когда имеет место (91). Теорема доказана. Из теоремы 4 вытекает алгоритм построения обратной матрицы А~г и вообще произведения СА~гВ, где В, С—прямоугольные матрицы раз- размером п X р, qxn1). Приведем при помощи алгоритма Гаусса2) матрицу / А в\ [-с о) <1Л1*°> <93> к виду G, ВЛ О X • <94> Докажем, что Х=СА-гВ. (95) В самом деле, то же преобразование, которое было применено к матрице (93), приведет матрицу А В к виду (G Bt \ 1q х СА^В) ' Согласно теореме 4 матрица (96) имеет ранг п(п — порядок матри- матрицы А). Но тогда и матрица (97) должна иметь ранг п. Отсюда X—СД-1В = 0, т. е. имеет место (95). В частности, если В = у, где у — столбцевая матрица, и С = Е, то Следовательно, применяя алгоритм Гаусса к матрице А У\ -Е 0 ' !) См. [88]. 2) Здесь мы применяем к матрице- (93) не весь алгоритм Гаусса, а только его первые п этапов, где п—порядок матрицы А. Это можно сделать, если выполняются условия A5) при р=п. Если же эти условия не выполнены, то, поскольку | А \ Ф О, мы можем так перенумеровать первые п строк (или первые п столбцов) матрицы (93), чтобы п этапов алгоритма Гаусса оказались выполнимыми. Такой видоизмененный алгоритм Гаусса иногда применяют и при выполнении условий A5) для р=п.
§ 5] БЛОЧНЫЕ МАТРИЦЫ. ОБОБЩЕННЫЕ АЛГОРИТМ ГАУССА 63 мы получаем решение системы уравнений Далее, если в (93) положить В = С=Е, то после применения алго- алгоритма Гаусса к матрице получим: A, E -E, 0 G, W О, где Проиллюстрируем зтот способ нахождения А~г на следующем примере. Пример. Пусть 2 1 1 1 0 2 3 1 2 Требуется вычислить А~г. Применяем несколько видоизмененный метод исключениях) к матрице 2 *'"¦ ¦?; —1 0 0 1 ¦ о 1 0 —1 0 1 2 . ' -2 0 0 — 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 Ко всем строкам прибавляем вторую строку с некоторым множителем и доби- добиваемся того, чтобы все элементы первого столбца, кроме второго элемента, равня- равнялись нулю. После этого ко всем строкам, кроме второй, прибавляем третью строку с некоторым множителем и достигаем того, чтобы во втором столбце все элементы, кроме второго и третьего, были равны нулю. После этого к последним трем строкам прибавляем первую строку с некоторым множителем и получаем матрицу вида vL-' o^ vl^ vl^ "Г- "Т- "Т- -Т- Поэтому 0 0 0—2—1 2 0 0 0 4 1—3 0 0 0 1 1—1 —2 —1 2 4 1—3 1 1—1 6. Разбиение матрицы на блоки может быть использовано также для нахождения псевдообратной матрицы (см. гл. I, § 5). Пусть снова См. сноску 2) на стр. 62.
64 АЛГОРИТМ ГАУССА И НЕКОТОРЫЕ ЕГО ПРИМЕНЕНИЯ [ГЛ. II прямоугольная матрица R представлена в виде (А [ (98) где А — неособенная квадратная матрица (| А \ ф 0) и rA = rR. Тогда согласно теореме 4 справедливо равенство D — СА~ХВ, и потому (99) Так как эта формула является результатом двух последовательных скелетных разложений (см. гл. I, § 5): , (Е то A00) Применяя формулы D3) и D4) на стр. 34, окончательно найдем: R+ = I 1 (АА* + ВВ*)-1 А (А*А + С*С)"Х (А*С*). A01) Формула A01) дает явное выражение для псевдообратной матрицы i?+ через блоки А, В, С. Пример. 1 —1| 2 0 —1 2i—3 1 0 lj— 1 1 Здесь гд=2 и 1 —II — 1 2 в=\\_1 % c=lio щ, х>=м—1 in, I 2 -ЗЦГ1-!!!5 3| | —3 5\\J ~3 ||3 2\ 2 —ЗМ-1 1_|16 3 —3 6 ~3 3 2 -1 А 9 Тогда по формуле A01) 1 л 2 0 — 1 2 О 1 1115 II 9 811 5II 1 —1 0 — 1 2 1 15 81 9 Ъ\ _1_ 3 _1_ 9 9 _4^ 9 0 1 9 1 9 1 9 1 У 2 9 1 9 5 9
ГЛАВА III линейные операторы в ^-мерном векторном пространстве Матрицы составляют основной аналитический аппарат для изучения линейных операций в /г-мерном пространстве. В свою очередь изучение этих операций дает возможность разбить все матрицы на классы и выя- выявить важные свойства, присущие всем матрицам одного и того же класса. В настоящей главе излагаются наиболее простые свойства линейных операторов в n-мерном пространстве. Дальнейшее исследование линейных операторов в n-мерном пространстве будет продолжено в главах VII и IX. § 1. Векторное пространство 1. Пусть дана некоторая совокупность R произвольных элементов х, у, z, ..., в которой определены две операции: операция «сложения» и операция «умножения на число из поля К»1). Допустим, что эти операции всегда выполнимы и однозначны в R и для любых элементов х, у, z из R и чисел а, р" из К: Г х+у = 2° ( 3° Существует такой элемент 0 в R, что произведение числа О на любой элемент х из R равно элементу 0: 4° 1-х = х. 5е а фх) = (ар) х. 6° ( Т а Определение 1. Совокупность элементов R, в которой всегда выполнимы и однозначны две операции: «сложение» злементов и «умно- «умножение элемента из М на число из К», причем эти операторы удовле- удовлетворяют постулатам 1°—7°, мы будем называть векторным простран- пространством (над полем К), а сами элементы — векторами2). *) Эти операции будем отмечать обычными знаками « + » и «•», причем послед- последний знак иногда не ставится, а только подразумевается. 2) Нетрудно видеть, что из свойств 1° — 7° следуют все обычные свойства операций сложения и умножения на число. Так, например, при любом я> из JB: »+0=1-гв-1-0-гв=A + 0)гв=1-гв=гв, я?+(—я?)=0, где—я?=(—1)-ж и т. п. 5 Ф. Р. Гантмахер
66 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. III Определение 2. Векторы х, у, ..., и из R называются линейно зависимыми, если существуют такие числа а, ($, ..., б из К, не равные одновременно нулю, что 0. A) В случае, если не существует подобной линейной зависимости, векторы х, у, ..., и называются линейно независимыми. Если векторы х, у, ..., и линейно зависимы, то один из векторов может быть представлен в виде линейной комбинации остальных с коэф- коэффициентами из поля К. Так, например, если в A) а фО, то В 6 Определение 3. Пространство R называется • конечно мерным, а число п—числом измерений этого пространства, если в R существует п линейно независимых векторов, в то время как любые п.4-1 векторов из R линейно зависимы. Если же в пространстве можно найти линейно независимую систему из любого числа векторов, то пространство назы- называется бесконечномерным. В настоящей книге в основном изучаются конечномерные пространства. Определение 4. Система из п линейно независимых заданных в определенном порядке векторов еи е2, ..., еп в n-мерном пространстве называется базисом этого пространства. 2. Пример 1. Совокупность обычных векторов (направленных геометрических отрезков) является трехмерным векторным пространством. Часть этого пространства, состоящая из векторов, параллельных некоторой плоскости, является двумерным пространством, а все векторы, параллельные некоторой прямой, образуют одно- одномерное векторное пространство. Пример 2. Столбец из п чисел поля К: х=(х^, х%, ..., хп) назовем вектором («—фиксированное число). Основные операции определим как операции над столбце- выми матрицами: (хъ х2, ..., а;„) + (у1? у2, ..., Уп) а(щ, Х2> ¦••. xn) — (axi, ax2, ..., ахп). Элементом нуль будет столбец @, 0, ..., 0). Легко проверить, что все постулаты 1°—7° выполняются. Эти векторы образуют я-мерное пространство. В качестве базиса этого пространства можно, например, взять столбцы единичной матрицы n-го порядка: A, 0, ..., 0), @, 1, ..., 0), ..., @, 0, ..., 1). Пространство, рассмотренное в этом примере, часто называют численным п-мерным пространством. Пример 3. Совокупность бесконечных последовательностей (х1г х2, ..., хп, ...), в которой операции определены естественным образом, т. е. у2, ..., уп, -•-)= а(*и х2, ..., хп, ...)=(aa:i, ax2, ..., ахп, ...), представляет собой бесконечномерное пространство. Пример 4. Совокупность многочленов ao + ai'+ • •• +an-i'n степени < п с коэффициентами из К представляет собой n-мерное векторное пространство *). Базисом такого пространства является, например, система степеней IP, t, t2, ..., I"--1. Все же такие многочлены (без ограничения степени) образуют бесконечно- бесконечномерное пространство. Пример 5. Все функции, определенные в замкнутом интервале [a, b], обра- образуют бесконечномерное пространство. х) В качестве основных операций берутся обычное сложение многочленов и умножение многочлена на число.
§ 1] ВЕКТОРНОЕ ПРОСТРАНСТВО 67 3. Пусть векторы et, е2, ..., ел образуют базис n-мерного вектор- векторного пространства JS, а х— произвольный вектор этого пространства. Тогда векторы х, е4, е2, ..., еп линейно зависимы (ибо число их равно л + 1): <хоэс + щег + а2е2 + ... -f anen = О, где по крайней мере одно из чисел а0, а4, ..., ап отлично от нуля. Однако в данном случае ао=?О, так как векторы е1г е2, ..., е„ не могут быть связаны линейной зависимостью. Поэтому х = х±е± + х2е2 + ... + a^en, B) где Ж{= — ^_(i = l, 2, ..., п). Заметим, что числа ж1? х2, . -., хп однозначно определяются зада- заданием вектора х и базиса еь е2, ...., е„. В самом деле, если наряду с B) имеется другое разложение для вектора х: х = x'^i + х'2е2 -г ... + х'пеп, B') то, вычитая почленно B) из B'), получим: (х^— Xt) et 4- (ж;—х2) ег -f ... + (х'п — хп) еп = О, откуда в силу линейной независимости векторов базиса следует Х-± Х^ = Х% Х2 ^= ... == Xfi • Хп = U, т. е. Х^ = Х^ Х% ==z Х2у . . . , Хп = Хп. \*->) Числа хи хг, ..., хп называются координатами вектора х в базисе Если п п i=l i=l то яе 4- У = S (жг + Hi) eu ах = 2 а^ег, i=l i=l т. е. координаты суммы векторов получаются почленным сложением соответствующих координат слагаемых векторов и при умножении век- вектора на число а все координаты вектора умножаются на это число. 4. Пусть векторы п xh = 2 xihei (k = l, 2, ..., т) i=i линейно зависимы, т. е. т 2 ckxh = 0, D) ft— X где по крайней мере одно из чисел си с2, ..., ст не равно нулю. Если вектор равен нулю, то все его координаты равны нулю. Поэтому векторное равенство D) эквивалентно следующей системе скаляр- скалярных равенств: CiXu4-с2х12+ ... 4- стхш = О, ctx214- сгх22 4- ¦ • • 4- стх2т = О, 4" • ¦ • 4" СтХпт = 0 5*
68 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. III Эта система однородных линейных уравнений относительно с1г с%, ... . . ., ст, как известно, имеет ненулевое решение тогда и только тогда, когда ранг матрицы коэффициентов меньше- числа неизвестных, т. е. меньше т. Поэтому равенство этого ранга числу т является необходимым и достаточным условием для линейной независимости векторов зси яе2, . . - Таким образом, имеет место следующая Теорема 1. Для того чтобы векторы xt, х2, . . , ж,т были линейно независимы, необходимо и достаточно, чтобы ранг г матрицы, состав- составленной из координат этих векторов в произвольном базисе, 11 Xiz . . . Хт т Хл2 ... Хп был равен т, т. е. числу векторов. Замечани е. Линейная независимость векторов хи яе2. . . ., хт означает линейную независимость столбцов матрицы X, поскольку в k-м столбце стоят координаты вектора яей (к = 1, 2, . . ., т). Поэтому, согласно теореме, если в прямоугольной матрице столбцы линейно незави- независимы, то ранг матрицы равен числу столбцов. Отсюда следует, что в про- произвольной прямоугольной матрице максимальное число линейно незави- независимых столбцов равно рангу матрицы. Кроме того, если мы транспони- транспонируем матрицу, т. е. строки делаем столбцами (и наоборот), то ранг мат- матрицы при этом, очевидно, не меняется. Поэтому в прямоугольной матрице всегда число линейно независимых столбцов равно числу линейно незави- независимых строк и равно рангу матрицы. 5. Если в n-мерном пространстве выбран базис elt ег, . . ., еп, то каждому век- вектору х однозначно отвечает столбец х = (х±, х%, . . ., хп), где х^, х%, . . ., х„ —коорди- —координаты вектора х в данном базисе. Таким образом, задание базиса устанавливает вза- взаимно однозначное соответствие между векторами произвольного n-мерного векторного пространства It и векторами n-мерного численного пространства it', рассмотренного в примере 2. При этом сумме векторов из В отвечает сумма соответствующих векторов из R'. Аналогичное имеет место и для произведения вектора на число а из К. Дру- Другими словами, произвольное гс-мерное векторное пространство изоморфно численному га-мерному пространству и, следовательно, все векторные пространства одного и того же числа измерений п над одним и тем же числовым полем К изоморфны между собой. Это означает, что с точностью до изоморфизма существует только одно n-мерное век- векторное пространство при заданном числовом поле. Может возникнуть вопрос, зачем мы ввели «абстрактное» n-мерное пространство, если с точностью до изоморфизма оно совпадает с n-мерным численным простран- пространством. Действительно, можно было бы определить вектор как систему п чисел, задан- заданных в определенном порядке, и установить операцию над этими векторами, как это было сделано в примере 2. Но при этом смешались бы воедино свойства вектора, не зависящие от выбора базиса, со свойствами специального базиса. Например, равен- равенство нулю всех координат вектора есть свойство самого вектора; оно не зависит от вы- выбора базиса. Равенство между собой всех координат вектора не есть свойство самого вектора, ибо при изменении базиса оно исчезает. Аксиоматическое определение вектор- векторного пространства непосредственно выделяет свойства векторов, не зависящие от выбора базиса. 6. Если некоторая совокупность векторов М', составляющая часть R, обладает тем свойством, что сумма любых двух векторов из R' и про- произведение любого вектора из М' на число а?К всегда принадлежат В?, то такое многообразие М' само является векторным пространством, под- подпространством в R.
§ 1] ВЕКТОРНОЕ ПРОСТРАНСТВО 69 Если даны два подпространства В' и В" в К и известно, что 1° В' и В" не имеют общих векторов, кроме нуля, и 2° любой вектор х из В представляется в виде суммы х = х' + х1г (х'?В', х"?В"), E) то мы будем говорить, что пространство В расщепляется на два под- подпространства В' и В" и будем писать: В^В' + В!'. F) Заметим, что условие 1° означает единственность представления E). В самом деле, если бы для некоторого вектора х мы имели два разных представления в виде суммы слагаемых из В' и В", представление E) и представление , G) то, вычитая почленно G) из E), мы получили бы: /V.' ™' ™." /V." JL/ Л/ *Ю *Kj у т. е. равенство между отличными от нуля векторами х' — х ?Bf и х" — — х"?В", что невозможно в силу 1°. Таким образом, условие 1° можно заменить требованием единствен- единственности представления E). В таком виде определение расщепления непо- непосредственно распространяется на любое число слагаемых подпространств. Пусть и ёх, e'v ..., е'П' и е"х, e'v ..., е"п« — базисы соответственно в В' и В", Тогда читатель без труда докажет, что все эти п'-\-п" векторов линейно независимы и образуют базис в В, т. е. что из базисов слагаемых под- подпространств составляется базис всего пространства. В частности, отсюда будет следовать, что n = n' + n" Пример 1. Пусть в пространстве трех измерений даны три непараллельных одной и той же плоскости направления. Так. как любой вектор в пространстве можно разложить на составляющие по этим трем направлениям, притом единствен- единственным образом, то где jB—совокупность всех векторов нашего пространства, В'—совокупность всех векторов, параллельных первому направлению, R"—второму, В'"—третьему. В данном случае п=3, п'=/г"=п"' = 1. Пример 2. Пусть в пространстве трех измерений даны плоскость и пересе- пересекающая ее прямая. Тогда В=В'+В", где jB—совокупность всех векторов нашего пространства, В' — совокупность всех векторов, параллельных ~~~~ _.-.».. параллельных заданной векторов, параллельных заданной плоскости, и В"—совокупность всех векторов, эй прямой. В этом примере п=3, п'=2, п" = 1. Задание базиса еи е2, ..., еп в пространстве В по существу озна- означает некоторое расщепление всего пространства В на п одномерных подпространств.
70 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. Ill § 2. Линейный оператор, отображающий ?г-мерное пространство в т-мерное 1. Рассмотрим линейное преобразование У1== G-uXi -f- &{2х2 -\-.. щ -\- a,inxn, Уг= <hixi + o^Ph. + • • • (8) Утл — &тп1%1 i &гп2%2 i • • " ""Г ' коэффициенты которого принадлежат числовому полю К, и два вектор- векторных пространства над этим полем: n-мерное В и /n-мерное S. Выберем в В некоторый базис еи е2, ..., еп и в S некоторый базис ди дг, ..., дт. п Тогда преобразование (8) относит каждому вектору х = 2 x%ei из -К т некоторый вектор я/= 2 УиУп из S, т. е. преобразование (8) определяет некоторый оператор А, относящий вектору х вектор у: у — Ах. Нетрудно видеть, что этот оператор А обладает свойством линейности, которое мы сформулируем так: Определение 5. Оператор А, отображающий JB в 8, т. е. относя- относящий каждому вектору ас из В некоторый вектор у = Ах из S, назы- называется линейным, если для любых х, х? из В и а из К (9) Таким образом, преобразование (8) при заданных базисах в М и 8 определяет некоторый линейный оператор, отображающий R в S. Покажем теперь обратное, т. е. что для произвольного линейного оператора А, отображающего R в S, и произвольных базисов еи е2, ..., еп в М ж ди д2, .. •, дт в S существует такая прямоугольная матрица с элементами из поля К ан Gi2 • • • ат A0) что составленное при помощи этой матрицы линейное преобразование A) выражает координаты преобразованного вектора у = Ах через коорди- координаты исходного вектора х. Действительно, применим оператор А к базисному вектору е^ и коор- координаты полученного вектора Ае*. в базисе ди д2, ..., дт обозначим через alh, а2*, ••-, Omh(k = l, 2, ..., п): Aek= = 1, 2, ..., п). A1) Помножая обе части равенства A1) на Xk и суммируя в пределах от 1 до п, получим: п тэт 2 xhAeh = i=l fe=i
3] СЛОЖЕНИЕ И УМНОЖЕНИЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ 71 откуда где п у = Ах = А ( 2 fel i = 1, 2, -••, w), что и требовалось установить. Таким образом, при заданных базисах в Л и S каждому линей- линейному оператору А, отображающему М в S, отвечает некоторая пря- прямоугольная матрица A0) с размерами тхп и, наоборот, каждой такой матрице отвечает некоторый линейный оператор, отображающий Ив S. При этом в матрице А, отвечающей оператору А, k-й столбец состоит из последовательных координат вектора Ае^(к = 1, 2, ...,п). Обозначим через х = (хи хг, ..., хп) и у = (уи Уъ ¦¦¦¦, Уп) столбцы координат векторов ж ж у. Тогда векторному равенству у— Ах соответствует матричное равенство у = Ах, которое является матричной записью преобразования (8). Пример. Рассмотрим совокупность всех многочленов от t степени <J гс — 1 с коэффици- коэффициентами из числового поля К. Эта совокупность представляет собой некоторое п-мер- ное векторное пространство Rn (см. пример 4 на стр. 66). Точно так же много- многочлены от t степени <^п—2 с коэффициентами из К образуют пространство -Rn-i- Оператор дифференцирования -=- относит каждому многочлену из Rn некоторый многочлен из JRn-i. Таким образом, этот оператор отображает Rn в -Вга-1- Оператор дифференцирования является линейным оператором, так как В пространствах Ип и Rn-i выберем базисы из степеней t: «0 = 1, t in~l И @ = 1, (, ..., (П-2. Пользуясь формулой (И), построим прямоугольную матрицу размером (n-l)Xn, соответствующую оператору дифференцирования -=- в этих базисах: 0 1 0 ... 0 0 2 ... 0 0 0 ... и—1 § 3. Сложение и умножение линейных операторов 1. Пусть- даны два линейных оператора А и Б, отображающие R в S, и соответствующие им матрицы Л = IK||, В = \\Ьа\\ (i = i, 2, ..., т; Л = 1, 2, ..., п).
72 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. III Определение 6. Суммой операторов А и В называется опера- оператор С, определяемый равенством . A2) На основе этого определения легко проверяется, что сумма С—А-\-В линейных операторов А я В есть также линейный оператор. Далее, Отсюда следует, что оператору С отвечает матрица C = ||cift||, где cih= = Oih-\-bih (г = 1, 2, ...,m; к = 1, 2, ...,п), т. е. оператору С отвечает матрица С = А + В. A3) К этому же выводу можно прийти из рассмотрения матричного равенства Сх = Ах + Вх A4) (х—столбец координат вектора ас), соответствующего векторному равен- равенству A2). Поскольку х — произвольный столбец, то из A4) следует A3). 2. Пусть даны три векторных пространства R, S и Т соответ- соответственно д, п и m измерений и два линейных оператора А и В, из кото- которых В отображает К в 8, а А отображает 8 в Т; в символической записи: Определение 7. Произведением операторов А и В называется оператор С, для которого при любом х из .R С5с = 4.(Взс) (зс€-Е). A5) Оператор С отображает М в Т: Из линейности операторов .А и ? вытекает линейность оператора С. Выберем в пространствах R, S, Т произвольные базисы и обозначим через А, В, С матрицы, соответствующие операторам А, В, С при этом выборе базисов. Тогда векторным равенствам в = Ау, у = Вх, z = Cx, A6) будут соответствовать матричные равенства z — Ay, y = Bx, z = Cx, где х, у, z — столбцы координат векторов ас, у, «. Отсюда находим: и в силу произвольности столбца х С = АВ. A7) Таким образом, произведению С = АВ операторов А я В отвечает матрица С = ||су|| (г = 1, 2, ..., т; ; = 1, 2, ..., д), равная произведению матриц А и В. *¦) ж С -В означает, что элемент ж принадлежит совокупности R. Предпола- Предполагается, что равенство A2) имеет место при любом ж из jB.
§ 4] ПРЕОБРАЗОВАНИЕ КООРДИНАТ 73 Предоставляем читателю самому доказать, что оператору отвечает матрица Таким образом, мы видим, что в главе I действия над матрицами были определены так, что сумме линейных операторов А + В, произве- произведениям АВ и а А отвечают соответственно матрицы А~\-В, АВ и аА,. где А и В — матрицы, соответствующие операторам Л а Б, а а — число из К. § 4. Преобразование координат Рассмотрим в re-мерном векторном пространстве два базиса: е4, е2, ..., еп («старый» базис) и el5 е2, ...,еп («новый» базис). Взаимное расположение векторов базиса определится, если задать координаты векторов одного базиса относительно другого. Мы положим: +tn2en, или в сокращенной записи: ек = 2 tikei (Л = 1, 2, ..., п). A8') Установим связь между координатами одного и того же вектора в различных базисах. Пусть хихъ ...,хп и хи х2, ...,хп — координаты вектора х соот- соответственно в «старом» и «новом» базисах: п Подставим в A9) вместо векторов eh их выражения из A8). Получим: п п п п X = 2 xh 2 tihCi =2B ^ft^ft) ei- h=l i=i i=l fe=l Сопоставляя это равенство с A9) и учитывая, что координаты вектора однозначно определяются заданием вектора и базиса, находим: ж*=2 hhxh (i = l, 2, ...,n), B0> То есть оператору, для которого Сж=аАж
74 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. III или в подробной записи: х2 = i2lxi-+- 122Х2-т ¦ ¦ ¦ + t2nXn, \ B1) Формулы B1) определяют преобразование координат вектора при переходе от одного базиса к другому. Они выражают «старые» координаты через «новые». Матрица Г = ||«* ИГ B2) называется матрицей преобразования координат или преобразующей матрицей. В ней /с-й столбец состоит из «старых» координат k-то «нового» базисного вектора. В этом можно убедиться из формулы A8) или непо- непосредственно из формул B1), положив в последних xh — l, xt = 0 при гфк. Заметим, что матрица Т неособенная, т. е. \Т\ФО. B3) Действительно, положив в B1) х^ — ж2 = ... = хп = 0, получим систему п линейных однородных уравнений с п неизвестными хи ж2, ..., ?„ и с определителем \Т\. Эта система может иметь только нулевое реше- решение «4 = 0, ж2 = 0, ..., ж„ = 0, так как в противном случае из A9) следо- следовала бы линейная зависимость между векторами е±, е2, . • •, е„. Поэтому Введем в рассмотрение столбцевые матрицы ж = (а;1, х2, ..., х„) и х = (а?!, ж2, ..., Xjj). Тогда формулы преобразования координат B1) могут быть записаны в виде следующего матричного равенства: х=Тх. B4) Помножая снова обе части этого равенства на Т~г, найдем выраже- выражение для обратного преобразования ж = Гж. B5) § 5. Эквивалентные матрицы. Ранг оператора. Неравенства Сильвестра 1. Пусть даны два векторных пространства JB и 8, соответственно п и m измерений над числовым полем К, и линейный оператор А, отображающий R в S. В настоящем параграфе мы выясним, как меняется матрица А, соответствующая данному линейному оператору А, при изменении базисов в В и S. Выберем вВив произвольные базисы еи е2, ..., еп и ди д2, ..., д В этих базисах оператору А будет соответствовать матрица А = || aih {г = 1, 2, ..., т;.к = 1, 2, ...,п). Векторному равенству B6) т. г) Неравенство B3) вытекает и из теоремы 1 (стр. 68), поскольку элементами ма- матрицы Т являются «старые» координаты линейно независимых векторов е^, е^,..., еп.
« 5] ЭКВИВАЛЕНТНЫЕ МАТРИЦЫ. РАНГ ОПЕРАТОРА 75 ¦соответствует матричное равенство У = Ах, B7) где х и у — координатные столбцы для векторов ж и у в базисах ei,ez,...,enugl,g2,...,gm. ^ _ _ „ _ _ Выберем теперь вйи5 другие базисы elt е2, ..., еп и grb д2, ..., </т. В новых базисах вместо ж, у, Л будем иметь: ж, у, А. При этом у = 1ж. B8) Обозначим через Q и N неособенные квадратные матрицы соответственно порядков пит, осуществляющие преобразование координат в про- пространствах R и S при переходе от старых базисов к новым (см. § 4): x = Qx, y = Ny. B9) Тогда из B7) и B9) получаем: y^N^y^N^Ax^N^AQx. C0) Полагая P — N^, мы из B8) и C0) находим: A^PAQ. C1) Определение 8, Две прямоугольные матрицы А и В одинаковых размеров называются эквивалентными, если существуют две неособенные квадратные матрицы Р и Q такие г), что B^PAQ. C2) Из C1) следует, что две матрицы, соответствующие одному и тому же линейному оператору А при различном выборе базисов в R я S, всегда эквивалентны между собой. Нетрудно видеть, что и обратно, если матрица А отвечает оператору А при некоторых базисах в М и S, а матрица В эквивалентна матрице А, то она отвечает тому же линей- линейному оператору при некоторых других базисах в R и S. Таким образом, каждому линейному оператору, отображающему M в S, соответствует класс эквивалентных между собой матриц с эле- элементами из поля К. 2. Следующая теорема устанавливает критерий эквивалентности двух матриц: Теорема 2. Для того чтобы две прямоугольные матрицы одина- одинаковых размеров были эквивалентны, необходимо и достаточно, чтобы эти матрицы имели один и тот otce ранг. Доказательство. Условие необходимо. Приумножении прямоугольной матрицы на какую-либо неособенную квадратную матрицу (слева или справа) ранг исходной прямоугольной матрицы не может измениться (см. гл. I, стр. 27). Поэтому из C2) следует гА = гв- Условие достаточно. Пусть А—прямоугольная матрица раз- размера тхп. Она определяет линейный оператор А, отображающий пространство М с базисом еи е2, ..., еп в пространство S с базисом !) Если матрицы А и В имеют размеры тхп, то в C2) квадратная матрица Р имеет порядок те, а квадратная матрица Q—порядок п. Если элементы эквивалент- пых матриц А и В принадлежат некоторому числовому полю, то матрицы Р и Q могут быть выбраны так, чтобы их элементы принадлежали тому же числовому полю.
76 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. III ffu 9г> • • ч ffm- Обозначим через г число линейно независимых векторов среди векторов Ае^ Ае2,..., Аеп. Не нарушая общности, можем считать, что линейно независимыми являются векторы Аеи Ае2, ..., Аегг), а остальные, Аег+1, ..., Аеп, выражаются линейно через них: Лек = 2 3=1 (к = г +1, ..., п). Определим новый базис в R следующим образом: ег (t = l, 2, ..., ?•), - S cijeJ ii Тогда в силу C3) Далее положим: (/ = 1, 2, ..., г). C3> C4) C5) C6) Векторы gr1( д2, ..., дг линейно независимы. Дополним их некоторыми векторами gv+1, - - •, дт до базиса дъ дг, ..., дт в 8. Тогда матрица, отвечающая тому же оператору А в новых базисах еь ..., еп; grt, ..., дт, согласно C5) и C6) будет иметь вид 1 0 ... О 0 ... О О 1 ... О 0 ... О О 0 ... 1 0 ... О о о ... о о ... о о о ... о о ... о C7) В матрице 1Г вдоль главной диагонали сверху вниз идут г единиц; все остальные элементы матрицы 1Г равны нулю. Так как матрицы А и 1Т соответствуют одному и тому же оператору А, то они эквива- эквивалентны между собой. По доказанному эквивалентные матрицы имеют один и тот же ранг. Поэтому ранг исходной матрицы А равен г. Мы показали, что произвольная прямоугольная матрица ранга г эквивалентна «канонической» матрице 1Т. Но матрица 1Т полностью- определяется заданием размеров тп х п и числа г. Поэтому все прямо- прямоугольные матрицы данных размеров тхп и данного ранга г эквива- эквивалентны одной и той же матрице 1Т и, следовательно, эквивалентны между собой. Теорема доказана. 3. Пусть дан линейный оператор А, отображающий n-мерное про- пространство В в m-мерное S. Совокупность векторов вида Ах, где х?Му образует векторное пространство 2). Это пространство мы будем обозначать !) Этого можно достигнуть надлежащей нумерацией базисных векторов е±, е2, ..., еп. 2) Совокупность векторов вида Ах(х? R) удовлетворяет постулатам 1°—7° § 1, поскольку сумма двух векторов вида Ах {ас?В) и произведение такого вектора нг число снова дают вектор такого вида.
3 5] ЭКВИВАЛЕНТНЫЕ МАТРИЦЫ. РАНГ ОПЕРАТОРА 77 через АЛ; оно составляет часть пространства S или, как говорят, является подпространством в пространстве S. Наряду с подпространством АЛ в S рассмотрим совокупность всех векторов х?Л, удовлетворяющих уравнению Ах = 0. C8) Эти векторы также образуют подпространство в Л; это подпространство мы обозначим через Na- Определение 9. Если линейный оператор А отображает Л в S, то число измерений г пространства АЛ называется рангом оператора А г), ¦а число измерений d пространства NA, состоящего из всех векторов х?Л, удовлетворяющих условию C8), — дефектом оператора А. Среди всех эквивалентных прямоугольных матриц, задающих данный •оператор А в различных базисах, имеется каноническая матрица 1Т {см. C7)]. Обозначим через elt е2, ..., еп и grb g2, .-., gm соответствую- соответствующие ей базисы в Л и S. Тогда = ди ..., Ает = {/,., Jjer+i = • • • = Аеп = 0. Из определения АЛ и Na следует, что векторы ди ..., дт образуют •базис в АЛ, а векторы ег+1, ..., еп составляют базис в NA. Отсюда вытекает, что г — ранг оператора А и d = n — r. C9) Если А — произвольная матрица, соответствующая оператору А, то она эквивалентна /г и, . следовательно, имеет тот же ранг г. Таким образом, ранг оператора А совпадает с рангом прямоугольной матрицы А ап с12 ... с1п . __ C2i Й22 • • • а2п mi- Яго2 • • • атп •определяющей оператор А в некоторых базисах eit е2, ¦.., еп ? Л и ffl, ff2, ¦ - • > ffm € S- В столбцах матрицы А стоят координаты векторов Aelt Аег, ..., Аеп. п п Так как из х= 2 xiei следует Ах= 2 ZiAet, то ранг оператора А, г=1 г=1 ¦т. е. число измерений Л А, равняется максимальному числу линейно независимых векторов среди Aelt Ае2, ..., Аеп. Таким образом, ранг матрицы совпадает с числом линейно независимых столбцов матрицы. Поскольку при транспонировании строки матрицы делаются столбцами, а ранг не меняется, то число линейно независимых строк матрицы также равно рангу матрицы2). !) Число измерений пространства AR всегда <; числа измерений пространства В, п т. е. r-^п. Это следует из того, что равенство ж= ^ жг-ег- (е1; ег, ..., еп—базис в IS) влечет равенство Ах= ^\ г=1 2) К этим же выводам мы пришли в § 1 из других соображений (см. стр. 68).
78 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. Ill 4. Пусть даны два линейных оператора А, .В и их произведение С^АВ. Пусть оператор В отображает JR в S, а оператор А отображает 8 в Т. Тогда оператор С отображает В в Т: Введем матрицы А, В, С, соответствующие операторам А, В, С при некотором выборе базисов в R, JS и Т. Тогда операторному равенству С = АН будет соответствовать матричное равенство С = АВ. Обозначим через гА, гв, гс ранги операторов А, В, С, или, что то же, ранги матриц А, В, С. Эти числа определяют число измерений под- подпространств AS, ВВ, А (ВВ). Поскольку ВВа S, то A (BB)CZAS1). Кроме того, число измерений А(ВВ) не может превосходить числа измерений ВВ'2). Поэтому гс < гА, г с < гв. Эти неравенства были нами получены в главе I, § 2 из формулы для миноров произведения двух матриц. Рассмотрим оператор А как оператор, отображающий ВВ в Т. Тогда ранг этого оператора будет равен числу измерений пространства А (ВВ), т. е. гс. Поэтому, применяя формулу C9), получим: rC = rB — d1, D0). где d±—максимальное число линейно независимых векторов из ВВ, удовлетворяющих уравнению Ах = 0. D1) Но все решения этого уравнения, принадлежащие 8, образуют подпро- подпространство d измерений, где d = n-rA D2). — дефект оператора А, отображающего S в Т. Поскольку ВВ с: S, то- di < d. D3) Из D0), D2) и D3) находим: Таким образом, мы получили следующие неравенства Силь- Сильвестра для ранга произведения двух прямоугольных матриц А и В с размерами пгхп и пх q: ^Га, гв. D4> Если матричное уравнение АХВ = С, где размеры прямоугольных матриц А, X, B — mxn, nxp, pxq, имеет решение X (см. стр. 23),. то из неравенств Сильвестра легко следует: гА — гв. Можно доказать, что если уравнение АХВ = С имеет какое-либо решение, то оно имеет решение любого ранга г, заключенного между числами ГС И П + р— ГА — ГВ. RCZS означает, что совокупность R составляет часть совокупности $- См. сноску 2) на стр. 22.
§ 6] ОПЕРАТОРЫ, ОТОБРАЖАЮЩИЕ n-МЕРНОЕ ПРОСТРАНСТВО В СЕБЯ 79* § 6. Линейные операторы, отображающие и-мерное пространство само в себя 1. Линейный оператор, отображающий n-мерное векторное про- пространство В само в себя (в данном случае JS = S, п = т), мы будем просто называть линейным оператором в М. Сумма двух линейных операторов в Л, а также произведение такого оператора на число — снова линейные операторы в JS. Умножение двух таких линейных операторов всегда выполнимо, и произведение их есть снова линейный оператор в Л. Таким образом, линейные операторы в И образуют кольцо1). В этом кольце имеется единичный оператор, т. е. оператор Е, для которого Ех = х (х ? В). При этом для произвольного оператора А в R Если А — линейный оператор в R, то имеет смысл» А2 = А3 = ААА, ... и вообще Ат — А А ... А. Кроме того, полагаем А° = Е. т раз Тогда, как легко видеть, при любых целых неотрицательных р и q Пусть /(f) = aoim-{-a1f™~1+-- .+am-i^+am — многочлен относительно скалярного аргумента t с коэффициентами из поля К. Тогда полагаем: / (А) = а0Ат + щА™-1 +...+ ат-±А + атЕ. При этом f (A)g(A) = g (A)f (А) для любых двух многочленов; W) и g(t). Пусть (х, у?В). D5) Обозначим через хи х2, ..., хп координаты вектора х в произвольном базисе et, е2, ..., е„, а через уи у2, ..., уп — координаты вектора у в том же базисе. Тогда п Уг=ЦагкЩ (г = 1, 2, ...,п). D6) В базисе eit е2, ..., еп линейному оператору А отвечает квадратная матрица А = || aik ||J\ 2). Напомним читателю (см. стр. 71), что в к-и столбце этой матрицы стоят координаты вектора Аеъ,(к=1, 2, ..., п), т. е. п Aek = S ашег (к = 1, ..., п). D7). г=1 1 водя координатные столбцы х = (х±, х2, ..., хп) и у = (уиу2, ¦•¦,Уп)т мы преобразование D6) можем записать в матричной форме у = Ах. D8) 1) Это кольцо является алгеброй. Ср. гл. I, стр. 28. . 2) См. стр. 70—71. В данном случае пространства S, и S совпадают; точно- также отождествлены базисы е±, е2, ..., еп и д±, д2, ..., дт в этих пространствах.
SO ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. III Сумме и произведению двух операторов А и В отвечают сумма и про- произведение соответствующих квадратных матриц А = |[ aik ||™ и В = || blh ||™. Произведению аА соответствует матрица аА. Единичному оператору Е отвечает квадратная единичная матрица Е = |[ 6jfe ||™. Таким образом, выбор базиса устанавливает изоморфное соответствие между кольцом линейных ¦операторов в Ни кольцом квадратных матриц п-го порядка с элементами из К. При этом соответствии многочлену / (А) соответствует матрица / (А). 2. Рассмотрим наряду с базисом еи е2, - ¦ ¦, еп другой базис elt е2, ..., ~еп в R. Тогда аналогично D8) D9) где х, у—столбцевые матрицы, составленные из координат векторов х, у в базисе е1? е2, ..., еп, а Л=|| ЯгьН" — квадратная матрица, соответствую- соответствующая оператору А в этом базисе. Запишем в матричной форме формулы преобразования координат х = Тх, у = Ту. E0) "Тогда из D8) и E0) находим: ¦что в сопоставлении с D9) дает: А = Т-ЫТ. E1) •Формула E1) представляет собой специальный частный случай фор- формулы C1) на стр. 75 (в данном случае Р = Т~Х, Q = T). Определение 10. Две матрицы А и В, связанные соотношением E1') где Т — некоторая неособенная матрица, называются подобными1). Таким образом, мы показали, что две матрицы, соответствующие одному и тому же линейному оператору в _В при различных базисах, подобны между собой, причем матрица Т, связывающая эти матрицы, •совпадает с матрицей преобразования координат при переходе от первого базиса ко второму (см. E0)). Другими словами, линейному оператору в It отвечает целый класс лодобных между собой матриц; эти матрицы представляют данный опе- оператор в различных базисах. Изучая свойства линейного оператора в _В, мы тем самым изучаем свойства матриц, присущие одновременно всему классу подобных матриц, т. е. изучаем свойства матриц, остающиеся неизменными инвариантными при переходе от данной матрицы к матрице, ей подобной. Заметим еще, что две подобные матрицы имеют всегда равные опре- определители. Действительно, из E1') следует, что |Л|. E2) Равенство | В \ = | А | является необходимым, но не достаточным условием для подобия матриц А и В !) Матрицу Т всегда можно выбрать так, чтобы ее элементы принадлежали основному числовому полю К, которому принадлежат элементы матриц А и В. Легко проверяются три свойства подобия матриц: рефлексивность (матрица А всегда подобна самой себе), симметричность (если А подобна В, то и В подобна А) и транзитивность (если А подобна В, В подобна С, то А подобна С).
§ 6] ОПЕРАТОРЫ, ОТОБРАЖАЮЩИЕ n-МЕРНОЕ ПРОСТРАНСТВО В СЕБЯ 81 В главе VI будет установлен критерий подобия двух матриц, т. е. будут даны необходимые и достаточные условия для того, чтобы две квадратные матрицы n-го порядка были подобны между собой. Согласно равенству E2) мы можем под определителем линейного оператора А в Л (| А \) понимать определитель любой матрицы, соответ- соответствующей данному оператору. Если | А | = 0 (Ф 0), то оператор А называется особенным (соответ- (соответственно неособенным). Согласно этому определению в любом базисе особен- особенному (неособенному) оператору отвечает особенная (соответственно неособенная) матрица. Для особенного оператора: 1) всегда существует вектор хфО такой, что Ах = 0, 2) AR составляет правильную часть R. Для неособенного оператора: 1) из Ах = 0 следует ас = О; 2) ^J?=JS,T.e. векторывида Ax(x?R) заполняют все пространство JR. Другими словами, линейный оператор в _В является особенным или неособенным в зависимости от того, больше или равен нулю его дефект. 3. Если А — неособенный оператор, то в равенстве у = Ах задание вектора у ? R однозначно определяет вектор ас?В. Действительно, суще- существование вектора х следует из того, что векторы вида Ах(х?1$) заполняют все пространство Л. С другой стороны, из равенств у— Ах' и у = Ах" (ас', ас" ?12) следует: А (ас' — ас") = Ах' — Ах" = 0 и отсюда: х' — ас' = О, т. е. ас' = ас". Поэтому, исходя из равенства у = Ах, можно определить обратный оператор А равенством х = А~~гу. Легко видеть, что обратный оператор А'1 для линейного оператора А в JR также является линейным оператором в Щ при этом где Ц]—единичный оператор. Если в некотором базисе неособенному оператору А отвечает неособенная матрица А, то в этом базисе обрат- обратному оператору А~г, соответствует матрица А~х. Рассмотрим некоторые частные типы линейных операторов в IS. 1°. Оператор J в R называется инволютивным, если J*=^E. Инволютивный оператор неособенный и для него Jr~1=J. Инволютивному оператору в любом базисе соответствует инволютивная матрица J, т. е. матрица /, для которой /2=?. 2°. Оператор JP в IS называется проекционным, если jP2=jP. Пусть дано про- произвольное расщепление пространства R на два подпространства S и Т: R—S-{-T. Тогда для любого вектора x?R имеет место разложение x=xs+x^, где xs?S, Хт <Е Т. Вектор Xs называется проекцией вектора х на подпространство S параллельно подпространству Т!). Рассмотрим оператор JP, осуществляющий проектирование пространства IS на подпространство S параллельно подпространству Т, т. е. опера- оператор в IS, определяемый равенством Px=xs для любого вектора х ? IS. Очевидно, этот оператор является линейным, но он является и проективным, так как Px=xs, />2?c=JPscs=scs и, следовательно, J (JQ>2—JP)aj=a5s—a5s:=0, т. е. JP2=JP. Легко проверяется и обратное утверждение. Произвольный проекционный опера- оператор Р в R осуществляет проектирование всего пространства IS на подпространство S=PR параллельно подпространству Т=(Е—Р) R. Любая натуральная степень проекционного оператора является проекционным оператором. Если Р—проекционный оператор, то и Е—JP—проекционный опера- оператор, так как (E—P)*=E—2P+pz=E—P. Квадратная матрица Р называется проекционной, если Р2=Р. Очевидно, в про- произвольном базисе проекционному оператору соответствует проекционная матрица. !) Аналогично, вектор Xj—проекция вектора х на подпространство Т парал- параллельно подпространству S. 6 Ф. Р. Гантмахер
82 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. Ш § 7. Характеристические числа и собственные векторы линейного оператора При исследовании структуры линейного оператора А в В большую роль играют векторы х, для которых Такие векторы называются собственными векторами, а соответствующие им числа К—характеристическими или собственными числами операто- оператора А (матрицы А). Для нахождения характеристических чисел и собственных векторов опе- п ратора А выберем произвольно базис elt е2, ..., еп в R. Пусть х = 2жге? и 4 = [|aiftj|"—матрица, отвечающая оператору А в базисе е±, е2, ..., еп. Тогда, приравнивая между собой соответственные координаты векторов, стоящих в левой и правой частях равенства E3), получим систему ска- скалярных уравнений filial + ai2x2+ ...+ cln xn = %Xi, aziXi + a22x2 + ... + OznXn = %x2, annxn — E4) которую можно записать и так: (flu — %)xi + а12х2 + . ..+ ainxn = 0, aziXi + (c22 — X) x2 + ... + a2nxn = 0, an2x2+ ... +(ann — %)xn = 0. . E5) Так как искомый вектор не должен быть равен нулю, то среди его коорди- координат хи хг, ..., хп по крайней мере одна координата должна быть отлична от нуля. Для того чтобы система линейных однородных уравнений E5) имела ненулевое решение, необходимо и достаточно, чтобы определитель этой системы был равен нулю: О-Ы «21 = 0. E6) Уравнение E6) представляет собой алгебраическое уравнение n-й сте- степени относительно Я. Коэффициенты этого уравнения принадлежат тому же числовому полю, что и элементы матрицы А = || aih ||", т. е. полю К. Уравнение E6) часто встречается в различных проблемах геометрии, механики, астрономии, физики и носит название характеристического уравнения или векового х) уравнения матрицы А — \\ aik ||" (левую часть этого уравнения называют характеристическим многочленом). х) Такое название связано с тем, что это уравнение встречается при исследо- исследовании вековых возмущений планет.
§ 7] ХАРАКТЕРИСТИЧЕСКИЕ ЧИСЛА И СОБСТВЕННЫЕ ВЕКТОРЫ 83 Таким образом, каждое характеристическое число Я линейного опера- оператора А является корнем характеристического уравнения E6). И наоборот, если некоторое число Я является корнем уравнения E6), то при этом значении Я система E5) и, следовательно, E4) имеет ненулевое решение Xi, х2, ..., хп, т. е. этому числу Я отвечает собственный вектор ос = 2 xtet оператора А. Из сказанного следует, что любой линейный оператор А в R имеет не более чем п различных характеристических чисел. Если К есть поле всех комплексных чисел, то любой линейный опера- оператор в 7? всегда имеет по крайней мере один собственный вектор в It и соот- соответствующее этому собственному вектору характеристическое число Я1). Это следует из основной теоремы алгебры, согласно которой алгебраическое уравнение E6) в поле комплексных чисел всегда имеет по крайней мере один корень. Напишем уравнение E6) в развернутом виде = O; E7) здесь, как нетрудно видеть, Гл.)"-- E8> и вообще Sp равно сумме главных миноров р-то порядка матрицы А = \\ alh ||? (р = 1, 2, ..., пJ). В частности, Sn = \А |. Обозначим через А матрицу, соответствующую тому же оператору А в другом базисе. Матрица А подобна матрице А: Отсюда А — 'кЕ = Т-1{А — 1) Это положение справедливо и в более общем случае, когда К—произвольное алгебраически замкнутое поле, т. е. такое поле, которому принадлежат корни всех алгебраических уравнений с коэффициентами из данного поля. 3) Степень (—%)n~v имеется только в тех членах характеристического опре- определителя E6), которые содержат какие-либо п—р диагональных элементов ЛЯ J2J2 Jn-p'n-p Произведение этих диагональных элементов входит в состав определителя E6) со множителем, равным главному минору где индексы ilt г2, . - -, ip вместе с индексами /1? /2, ..., fn-p образуют полную систему индексов 1, 2, ...,п: Здесь (—%)n~~v умножается на А ( } } ''' .р ) . Перебирая всевозможные сочетания vЧ г2 ••• 1ру /1» /2> •¦•» Jn-p по пР и—3 индексов 1, 2, ..., п, мы получим в качестве коэффи- коэффициента Sp при (—%)n~v сумму всех главных миноров р-го порядка матрицы А. 6*
84 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В п-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. Ш и, следовательно, \А — %Е\ = \А — %Е\. E9) Таким образом, подобные матрицы А ж А имеют один и тот же харак- характеристический многочлен. Этот многочлен иногда называют характеристи- характеристическим многочленом оператора А и обозначают через \А — %Е\. Если х, у, г, ... — собственные векторы оператора А, соответ- соответствующие одному и тому же характеристическому числу К, а а, C, у, ... — произвольные числа из К, то вектор ах + ру + У% + •. • либо равен нулю, либо также является собственным вектором оператора А при том же числе К. Действительно, из Ах = Кх, Ay = ky, Az — %.z, ... следует: Поэтому линейно независимые собственные векторы, отвечающие одному и тому же характеристическому числу %, образуют базис некоторого «собственного» подпространства, каждый вектор которого есть собственный вектор при том же К. В частности, каждый собственный вектор порождает одномерное собственное подпространство, «собственное направление». Однако, если собственные векторы оператора А соответствуют раз- различным характеристическим числам, то линейная комбинация этих соб- собственных векторов, вообще говоря, не будет собственным вектором опера- оператора А. Значение собственных векторов и характеристических чисел при иссле- исследовании линейных операторов будет проиллюстрировано в следующем параграфе на примере операторов простой структуры. § 8. Линейные операторы простой структуры Начнем со следующей леммы. Лемма. Собственные векторы, соответствующие попарно различным характеристическим числам, всегда линейно независимы. Доказательство. Пусть Лг#Яь при гфк; i, к — 1, 2, ...,т) F0) и пусть т %CiXi = 0. F1) Применяя к обеим частям этого равенства оператор А, получим: т = 0. F2) i Умножим обе части равенства F1) на "kt и вычтем почленно F1) из F2). Тогда получим: 2 Ciiki-XJxt^O. F3) i=2 Можно сказать, ут равенство F3) было получено из F1) путем почленного применения оператора A — "kJE. Применяя к F3) почленно операторы А — %%Е, .,., А — Xm-iHJ, мы придем к следующему равенству: — Kn-l) (Кп — Кп-2) • • • (Кп — ^i) ^rh = 0,
§ 8] ЛИНЕЙНЫЕ ОПЕРАТОРЫ ПРОСТОЙ СТРУКТУРЫ 85 откуда ст = 0. Так как в F1) любое слагаемое может быть поставлено на последнее место, то в F1) Ci = с2 = ... = ст = О, т. е. между векторами хъ х2, ..., эст нет линейной зависимости. Лемма доказана. Если характеристическое уравнение оператора имеет п различных корней и эти корни принадлежат полю К, то на основании леммы соб- собственные векторы, соответствующие этим корням, линейно независимы. Определение 11. Линейный оператор А в В называется опера- оператором простой структуры, если А имеет в В п линейно независимых собственных векторов, где п — число измерений. Таким образом, линейный оператор в В имеет простую структуру, если все корни характеристического уравнения различны между собой и принадлежат полю К. Однако это условие не является необходимым. Существуют линейные операторы простой структуры, у которых характе- характеристический многочлен имеет кратные корни. Рассмотрим произвольный линейный оператор А простой структуры. Обозначим через ди дг, . ¦ ¦, дп базис в Ц, состоящий из собственных векторов оператора, т. е. Agk = kkgk (Л = 1, 2, ..., п). Если п п п ж= 2 xkgh, то Ах= 2 xkAgk= 2 Другими словами, воздействие оператора А простой структуры на п вектор эс= 2 %kgk может быть описано следующим образом: hl 2 h=l В п-мерном пространстве В существует п линейно независимых «.направлений», вдоль которых оператор простой структуры А осуще- осуществляет «растяжение» с коэффициентами Kit Kz, , Ял. Произвольный вектор х может быть разложен на компоненты, идущие вдоль этих собственных направлений. Эти компоненты подвергаются соответствую- соответствующим «растяжениям», после чего они в сумме дают вектор Ах. Нетрудно видеть, что оператору А в «собственном» базисе ди {/%, . ¦ ¦, дп соответствует диагональная матрица Если мы через А обозначим матрицу, отвечающую оператору А в про- произвольном базисе е±, е2, ..., е„, то A = T\\Xibik\\nlT-\ F4) Матрицу, подобную диагональной, будем называть матрицей простой структуры. Таким образом, оператору простой структуры в любом базисе отвечает матрица простой структуры и наоборот. Матрица Т в равенстве F4) осуществляет переход от базиса elf ег, ..., е„ к базису ди¦ д2, • • ¦, дп- В fc-м столбце матрицы Т стоят координаты (в базисе еи е2, .. -, еп) собственного вектора дъ, соответствующего харак- характеристическому числу ift матрицы А (к = 1, 2, ..., п). Матрица Т назы- называется фундаментальной матрицей для матрицы А.
86 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В n-МЕРНОМ ВЕКТОРНОМ ПРОСТРАНСТВЕ [ГЛ. III Равенство F4) перепишем так: А = TLT-1 (L = {V К • • ¦, К}). F4') Переходя к р-ы ассоциированным матрицам A *Ср^.п), получим (см. гл. I, § 4): 1; F5) йр — диагональная матрица N-ro порядка (iV = C?), у которой на главной диагонали стоят всевозможные произведения по р из Хи К2, .. -, кп. Сопо- Сопоставление F5) с F4') дает нам теорему: Теорема 3. Если матрица A = \\aik\\™ имеет простую структуру, то при любом р^.п ассоциированная матрица Шр также имеет про- простую структуру; при этом характеристическими числами матрицы Щр являются всевозможные произведения по р Х^Я,^ Kip (I <! it <72 < •< ... <О"р<[п) из характеристических чисел Xit Я2, . - •, hn матрицы А, а фундаментальной матрицей матрицы Stp является ассоциированная ?р для фундаментальной матрицы Т матрицы А. Следствие. Если характеристическому числу Х^ матрицы простой структуры А = \\ а^ ||" отвечает собственный вектор с координатами hh, t2h,-..,tnk (& = 1, 2, ..., п) и J = |]fift||", то характеристическому числу Xki^kz • • • ^fep (l<fti<&2< • • • <^р^п) матрицы Sip отвечает собственный вектор с координатами F6) Произвольную матрицу А = || а^ ||" можно представить в виде предела последовательности матриц Ат{т-^> со), каждая из которых не имеет кратных характеристических чисел и потому имеет простую структуру. Характеристические числа A,im), h(™y, . ¦ •, ^iT0 матрицы Ат в пределе при т—> со переходят в характеристические числа %и %2, ...,%п матри- матрицы А, т. е. ^m) = >* (Л = 1, 2, ...,п). Отсюда lim Я^ТЭД ... *?? = иМг • • • Ч A < h < к2 < ... < Лр < я). т-*оо Так как, кроме того, lim Sl(m) p = Sfp, то из теоремы 3 вытекает 771-VOO Теорема 4 (Кронекера). Если Ки Хц, ...,Кп—полная система характеристических чисел произвольной матрицы А, то полная система характеристических чисел ассоциированной матрицы Жр состоит из все- всевозможных произведений по р из чисел ки Кг, ...,ЯП (/> = 1, 2, ..., п). В зтом параграфе мы исследовали операторы и матрицы простой структуры. Изучение структуры операторов и матриц общего типа будет проведено в главах VI и VII.
ГЛАВА IV ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦЫ С каждой квадратной матрицей связаны два многочлена: характе- характеристический и минимальный. Эти многочлены играют большую роль в различных вопросах теории матриц. Так, например, понятие о функции от матрицы, которое мы введем в следующей главе, будет целиком основы- основываться на понятии о минимальном многочлене матрицы. В этой главе рассматриваются свойства характеристического и минимального многочле- многочлена. Этому исследованию предпосылаются основные сведения о многочле- многочленах с матричными коэффициентами и о действиях над ними. § 1. Сложение и умножение матричных многочленов Рассмотрим квадратную многочленную матрицу А (к), т. е. квадрат- квадратную матрицу, элементами которой являются многочлены относительно к {с коэффициентами из данного числового поля К): А{к) = \\ аЛ (к) ||? = || а^Кт + а^кт~1 + ... + а$Г ||" A) Матрицу А (к) можно представить в виде многочлена с матричными коэффициентами, расположенного по степеням к: B) где ^ = |1<$ИГ (/ = 0,1, ...,т). C) Число т называется степенью многочлена, если А0ф0. Число п называется порядком многочлена. Многочлен A) будем называть регу- регулярным, если | Ао | Ф 0. Многочлен с матричными коэффициентами мы будем иногда называть матричным многочленом. В отличие от матричного многочлена обычный многочлен со скалярными коэффициентами будем называть скалярным многочленом. Рассмотрим основные действия над матричными многочленами. Пусть даны два матричных многочлена одного и того же порядка А (А) и В (к). Обозначим через т наибольшую из степеней этих многочленов. Эти много- многочлены можно записать в виде А (к) = Аокт + AJS1-1 +...+Am, В (к) = Вокт + В,кт^ +...+Вт.
88 ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Тогда А (к) ±В(к) = (Ао ± Во) km + (Ai ± В±) кгп~1+ ...+Ат±Вт, т. е. сумма (разность) двух матричных многочленов одного и того же порядка может быть представлена в виде многочлена, степень которого не превосходит наибольшей из степеней данных многочленов. Пусть даны два матричных многочлена А (к) и В (к) степеней таи р одного и того же порядка п: (А0ф0), (В0ф0). Тогда А (к) В (к) = AoBok™+v + (A oBt + А,В0) кт+^ +...+ АтВр. D) Если бы мы перемножили В (к) на А (к) (т. е. изменили бы порядок сомножителей), то мы получили бы, вообще говоря, другой многочлен. Умножение матричных многочленов обладает еще одним специфичным свойством. В отличие от произведения скалярных многочленов произве- произведение матричных многочленов D) может иметь степень, меньшую т-\-р, т. е. меньшую суммы степеней сомножителей. Действительно, в D) про- произведение матриц А0В0 может равняться нулю при А0ф0 и В0ф0. Однако, если хотя бы одна из матриц Ао и Во неособенная, то из Ао ф- О и В0ф0 следует: АоВофО. Таким образом, произведение двух матрич- матричных многочленов равно многочлену, степень которого меньше или равна сумме степеней сомножителей. Если хотя бы один из двух сомножите- сомножителей регулярный многочлен, то в этом случае степень произведения всегда равна сумме степеней сомножителей. Матричный многочлен га-го порядка А (к) можно записать двояко: А (к) = Аокт+Л А™ +...+Ат E) и E') Обе записи при скалярном к дают один и тот же результат. Однако если мы пожелаем вместо скалярного аргумента к подставить квадрат- квадратную матрицу п-го порядка Л, то результаты подстановок в E) и E') будут, вообще говоря, различны, так как степени матрицы Л могут не быть перестановочными с матричными коэффициентами Ао, Ai, ..., Ат. Положим А (Л) = ЛоД™ + A iA"-1 +...+Am F> А (А) = АтА0 + Л™-*^ +...+Ат F'> и будем называть А (Л) правым, а А (Л) левым значением матричного многочлена А (к) при подстановке вместо к матрицы Л1). Рассмотрим снова два матричных многочлена т р А(к)=Л, Ат-{к\ В (к) = 2 Bp-kkh i=0 fe=0 х) В «правом» значении А (%) степени матрицы Л стоят справа от коэффициен- коэффициентов, а в «левом» — слева.
§ 2] ПРАВОЕ И ЛЕВОЕ ДЕЛЕНИЕ МАТРИЧНЫХ МНОГОЧЛЕНОВ 89s и их произведение т р т р »Ч-Р р&)= 2 2 An-tfBr+v^ S 2 ^m-^p-^i+fe- 2 ( 2 i=0 fe=0 i=0fe=0 j=0 i+ft m p m p m-\-p i=0 fe=0 2=0 fe=0 i=0 i+fe=j G") Преобразования в тождестве G') сохраняют свою силу при замене к матрицей n-го порядка Л, если только матрица Л перестановочна со всеми матричными коэффициентами Бр-ь1). Аналогично в тождестве G") можно заменить скаляр К матрицей Л, если матрица Л перестановочна со всеми коэффициентами Am-i- В первом случае получаем: Р (Л) = А (Л) В (Л), (8'> во втором Таким образом, правое (левое) значение произведения двух матричных многочленов равно произведению правых (левых) значений сомножителей, если матрица-аргумент Л перестановочна со всеми коэффициентами правого (левого) сомножителя. Если S (%) — сумма двух матричных многочленов n-го порядка А (К) и В (Я,), то при замене скаляра К любой матрицей n-го порядка Л всегда справедливы тождества § 2. Правое и левое деление матричных многочленов. Обобщенная теорема Безу Пусть даны два матричных многочлена А(%) т В (X) одного и того же порядка п, причем В (к) — регулярный многочлен: (А0ф0), (\ВО\ФО). Мы будем говорить, что матричные многочлены Q (к) и It (к) являются соответственно правым частным и правым остатком при делении А (к} на В (к), если A(k)Q(k)B(k) R(k) A0) и степень R(k) меньше степени В (к). Совершенно аналогично будем называть многочлены Q (к) и R (к) соот- соответственно левым частным и левым остатком при делении А (к) на В (к), если А (к) - В (к) Q (к) + R (к) A1) и степень R (к) меньше степени В (к). г) В этом случае и любая степень матрицы Л перестановочна со всеми коэф- коэффициентами Bp-h-
90 ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Обратим внимание читателя, что при «правом» делении (т. е. при нахождении правого частного и правого остатка) в E) на «делитель» В (к) частное Q (к) умножается справа, а при «левом» делении в F) на делитель В (к) частное Q (к) умножается слева. В общем случае многочлены Q(k) и R (к) не совпадают с Q (к) и Л (Я,). Покажем, что как правое, так и левое деление матричных много- многочленов одного и того же порядка всегда выполнимо и однозначно, если делитель—регулярный многочлен. Рассмотрим правое деление А (к) на В (К). Если т<Ср, можно поло- положить Q(к) = 0, R (к) — А (к). В случае то> p для нахождения частного Q (к) и остатка R (к) применим обычную схему деления многочлена на многочлен. «Разделим» старший член делимого Аокт на старший член делителя Вокр. Получим старший член искомого частного A0B^\m~li>. Умножим этот член справа на делитель В (К) и полученное произведение вычтем из А (к). Найдем «первый остаток» Aw (к): А (к) = АВД™"Р В (к) + А™ (к). A2) Степень тA) многочлена Аа)(к) меньше т: А™(к) = А™кпт + ... {А™фО, та)<т). A3) Если та)~>р, то, повторяя этот процесс, получаем: \ A™(k)=Afkm + ... (mB)<mA)) J ^ и т. д. Так как степени многочленов А (к), Аа) (к), А™ (к), ... убывают, то на некотором этапе мы придем к остатку R (к), степень которого меньше р. Тогда из A2) — A4) будет следовать: A(k)=Q(k)B(k)+R(k), где Q (к) = АоВ^к™-* + А <»Я Д™ш-р + • •. Докажем теперь однозначность правого деления. Пусть одно- одновременно A(k) = Q(k)B(k) + R(k) A5) A5') где степени многочленов R(k) и R* (к) меньше степени В (к), т. е. меньше р. Вычитая почленно A1) из A2), получим: [Q (к) - Q* (к)\ В (к) = R* (к) -R(k). A6) Если бы Q (к) — Q* (к) ^= 0, то, поскольку | Во | Ф 0, степень левой части равенства A6) равнялась бы сумме степеней В (к) nQ(k) — Q* (к) и потому была бы > р. Это невозможно, так как степень многочлена, стоящего в пра- правой части равенства A6), меньше р. Таким образом, Q(k) — ()*(А,) = 0, а тогда из A6) R* (к) — R (к) ~ 0, т. е. Q*(k), R(k)=R*(k).
S 2] ПРАВОЕ И ЛЕВОЕ ДЕЛЕНИЕ МАТРИЧНЫХ МНОГОЧЛЕНОВ 91 Совершенно аналогично устанавливаются существование и единствен- единственность левого частного и левого остатка 1). Пр имер. 2ХЗ+Х2 ЗХ3+Х А(Х)=\\ 2| -1 3 0 1 2 О 1 О О 1 0 о 1 О — Х2 + 1 II —X2— III I |3 5 2 5 2 -1 —1 1 3 II 1 2 (X) = -2X2— 0 1 —2 0 -з -13 -1 _il| о о |l О W-U Ж l\ — II 1 2II ill ~ II -2 -2||' -X2+ljl || 1 Х2 + 5Ц _2 —2|| II—X2—1 X2+2||~|| — 2X2—4 _6 U1 R (X) ~A<*> (X) —A^B^B (X) = _|| —3X X2 —13ХЦ || 1 X24-5||_ ||— 3X—1 —13X—51| "—2X2—X+l _n^, ~ _2X2—4 — 6 | ~" || — X + 5 — 11Х+б|| 1 2 О О ЗХ + 1 5Х + 2 2^,-2 5Х—2 ||' Предлагаем читателю в качестве упражнения непосредственно проверить, что г) Заметим, что возможность и однозначность левого деления А (X) на В (X) следует из возможности и однозначности правого деления транспонированных матриц А' (X) и В' (X). (Из регулярности В (К) вытекает регулярность В' (X).) Действи- Действительно, из •следует (см. гл. I, стр. 29): Л(Х)=?(Х)<21(Х) + Д;М- A1') В силу этих же соображений левое деление 4(Х)»на В (К) однозначно, так как из неоднозначности левого деления А (X) на В (X) следовала бы неоднозначность правого деления А' (X) на В' (X). Сопоставление A1) и A1') дает: Q(X) =<?(
92 ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Рассмотрим произвольный матричный многочлен п-то порядка F (-к) = F0%m + F^'1 +...+Fm (Fo Ф 0). A7) Разделим его на бином %.Е— А справа и слева: В данном случае правый остаток R и левый остаток R не будут зависеть от Я,. Для определения правого значения F (А) и левого F (А) можно соответственно в тождествах A8) заменить скаляр Я, на матрицу А, поскольку матрица А перестановочна с матричными коэффициентами бинома ХЕ— А (см. § 1): F(A) = Q(A)(A-A)+R = R, ?(A) = (A-A)Q(A) + R = R. A9) Нами доказана Теорема 1 (обобщенная теорема Безу). При правом (левом} делении матричного многочлена F (К) на бином ХЕ — А остаток от деле- деления равен F (А) (соответственно F (А)). Из доказанной теоремы следует.-что многочлен F (%) делится без остатка справа (слева) на бином КЕ — А тогда и только тогда, когда F (А) = О (соответственно F(A) = 0). Пример. Пусть ^ = ||ojft||f и /(Я)—многочлен относительно К. Тогда F(k)=f(k)E-f(A) делится (слева и справа) без остатка на ХЕ—А. Это следует непосредственно из обобщенной теоремы Безу, поскольку в данном случае F(A)=F{A)—0. § 3. Характеристический многочлен матрицы. Присоединенная матрица 1. Рассмотрим матрицу ^4 == |[ <zife j|". Характеристической матрицей для матрицы А называется матрица КЕ — А. Определитель характеристи- характеристической матрицы представляет собой скалярный многочлен относительно Я, и называется характеристическим многочленом матрицы А (см. гл. III, § 7)*). Матрицу В (Я.) = || bih (Я,) ||" , где bik (Я,)—алгебраическое дополнение элемента Яб{й—аы в определителе Д (Я,), мы будем называть присоединен- присоединенной матрицей для матрицы А. Так, например, для матрицы «11 «12 «13 Й21 U22 <^23 «31 «32 «33 !) Этот многочлен отличается множителем (—1)" от многочлена А(Х), введен- введенного в гл. III, § 7.
3] ХАРАКТЕРИСТИЧ. МНОГОЧЛЕН МАТРИЦЫ. ПРИСОЕДИНЕННАЯ МАТРИЦА 93 будем иметь: А, —я» — a12 — 013 kE — A= — Я21 A, — я22 — ^гз — *^31 — *^32 A, — Я33 = \кЕ-А\=№-(ап + Ж > |- Я21^32 — Я22Яз1 Ж 5 Из приведенных определений следуют тождества относительно А,: В (к) (кЕ—А) = Д (к) Е. B0') Правые части этих равенств мы можем рассматривать как многочлены с матричными коэффициентами (каждый из этих коэффициентов равен произведению скаляра на единичную матрицу Е). Многочленную матри- матрицу В (к) можно также представить в виде многочлена, расположенного по степеням к. Равенства B0) и B0') показывают, что Д (к) Е делится слева и справа на кЕ — А без остатка. Согласно обобщенной теореме Безу это возможно лишь тогда, когда остаток Д (А) Е — А (А) равен нулю. Нами доказана Теорема 2 (Гамильтона — Кэли). Всякая квадратная матри- матрица А удовлетворяет своему характеристическому уравнению, т. е. Д (А) = 0. B1) Пример. А= 2 1 —1 3 А 3 —2 1 51 1 || *•—з|| 2 —1 • 1 3 ел : -5а- + 7 1 0 011 1- 0 0 0 0 =0. 2. Обозначим через A,lt А,2, ..., кп все характеристические числа матрицы А, т. е. все корни характеристического многочлена А (к) (каждое из чисел kt повторяется в этом ряду столько раз, какова его кратность как корня многочлена А (А,)). Тогда Пусть дан произвольный скалярный многочлен g (ц). Найдем харак- характеристические числа матрицы g(A). Для этого разложим g(\i) на линей- линейные множители = а0 (ц — (j,j) (jj, — ц2) ... (р.—[li). B3) Подставим в обе части этого тождества вместо \i матрицу А: g (A) ^ao(A- i^E) (A - \h.E) ...(А- цгЕ). B4)
94 ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Переходя к определителям в обеих частях равенства B4) и используя равенства B2) и B3), получим: -VvE\ .. .\А-рцЕ\ = =(-1)пЧП П bk-hd= i=l fe=l Заменив в равенстве \g(A)\ = g(ki)g(K2)...g(K) B5) многъчлен g (\i) на Я— g(n), где Я— некоторый параметр, найдем: B6) Из зтого равенства вытекает следующая Теорема 3. Если Я4, Я2, ..., Яга — все характеристические числа (с учетом кратностей) матрицы A, a g (ц,) — некоторый скалярный много- многочлен, то g(ki), g(K2), , g (Яга)— все характеристические числа матри- матрицы g(A). В частности, если матрица А имеет характеристические числа Я4, Х2, ..., Кп, то матрица Ak имеет характеристические числа Х?, Я^, ..., Х„ (Л = 0, 1,2,3, ...). 3. Укажем эффективную формулу, выражающую присоединенную матрицу В (Я,) через характеристический многочлен А (Я). Пусть Д (Я) = Я" - Я.Г-1 - /72Я"-2 - ... - Рп. B7) Разность А (Я) — A (jj,) делится без остатка на Я — ц. Поэтому дМШ _1 B8> 6(К )(х) = гШ = есть многочлен относительно Яиц,. Тождество |*) B9) не нарушится, если в него вместо Яиц подставить перестановочные между собой матрицы КЕ и А. Тогда, поскольку согласно теореме Гамильтона — Кэли А (А) = О, А (Я) Е = б (Я?, А) (ЯЯ—А). C0) Сопоставляя между собой равенства B0') и C0), из однозначности частного получаем искомую формулу В(к) = 8(КЕ, А). C1) Отсюда в силу B8) В (Я) = Я" + ЯД"~2 + Я^" + • • • + Вп-и C2) где Bi = A-PiE, B2 = A*-PiA—p2E, ... и вообще =l, 2, ...,»—1). C3)
§ 3] ХАРАКТЕРИСТИЧ. МНОГОЧЛЕН МАТРИЦЫ. ПРИСОЕДИНЕННАЯ МАТРИЦА 95 Матрицы Blt B2, . ¦ ¦, #п-1 можно вычислять последовательно, исходя из рекуррентных соотношений Bk^ABk-t-phE (k=U2, ...,n-t;B0 = E). C4) При этом 01). C5) Соотношения C4) и C5) непосредственно получаются из тождества B0), если в обеих частях этого тождества приравнять между собой коэффи- коэффициенты при одинаковых степенях к. Если А — неособенная матрица, то и из C5) следует: C6) Пусть кй — характеристическое число матрицы А, т. е. Д(А,О) = О. Подставив в B0) вместо Я, значение Я,о, найдем: 0. C7) Допустим, что матрица В (к0) ф 0, и обозначим через Ъ любой ненулевой столбец этой матрицы. Тогда из C7) (Яо^ — А)Ь = О. или АЬ = %ф. C8) Следовательно, любой ненулевой столбец матрицы В (Я,о) определяет соб- собственный вектор, соответствующий характеристическому числу Я,о2). Таким образом, если коэффициенты характеристического многочлена известны, то присоединенная матрица может быть найдена по фор- формуле C1). Если данная матрица А неособенная, то по формуле C6) находится обратная матрица А'1. Если Ко—характеристическое число матрицы А, то ненулевые столбцы матрицы В (Я,о) являются собствен- собственными векторами матрицы А для % = %0. Пример. В (Х)=6 (КЕ, А)= г) Из C4) следуют равенства C3). Если в C5) подставить выражение для Bn-i из C3), то получим: A (J)=0. Этот вывод теоремы Гамильтона—Кэли не опирается явным образом на обобщенную теорему Безу, но неявно содержит в себе эту теорему. 2) См. гл. III, | 7. Если характеристическому числу к0 соответствует d0 линейво независимых собственных векторов (п—do—ранг матрицы %qE—А), то ранг матрицы В (Хо) не превосходит do- В частности, если числу ^о ¦ соответствует только одно собственное направление, то в матрице В (к0) элементы любых двух столбцов про- пропорциональны.
96 ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Но --АВ1+5Е = — 1 Далее 2 0 — 1 0 — 1 1 — 1 —3 1 2 + 3 — 1 1 1 —3 —2 —2 2 Л.—2 —3^+3 ^—2 О 1 Т 2 1 3 2 1 ~~2~ — 1 1 Первый столбец матрицы В(-\-1) дает собственный вектор ( + *> +1, 0) для характеристического числа ji,=l. Первый столбец матрицы В (+2) дает собственный вектор @, 1, 1), соответ- соответствующий характеристическому числу Х=2. § 4. Метод Д. К. Фаддеева одновременного вычисления коэффициентов характеристического многочлена и присоединенной матрицы Д. К. Фаддеевх) предложил метод одновременного определения ска- скалярных коэффициентов р4, р2, ..., рп характеристического многочлена д (К) = %п - - -.. - д. C9) и матричных коэффициентов J5j, Б2, ..., Bn-i присоединенной матрицы В (К). Для изложения метода Д. К. Фаддеева2) введем понятие о следе матрицы. Под следом матрицы .4 = || агь ||™ (обозначение: SpA) понимают сумму диагональных элементов этой матрицы: Нетрудно видеть, что _S D0) D1) 1) См. [32], стр. 160. а) С другим эффективным методом вычисления коэффициентов характерис- характеристического многочлена, с методом. А. Н. Крылова, мы познакомим читателя в гл. VII, § 8.
§ 4] МЕТОД Д. К. ФАДДЕЕВА 97 если "ки К2, ..., %п — характеристические числа матрицы А, т. е. hz)...(K-K). D2) Так как, согласно теореме 3, степень матрицы Ah имеет своими характеристическими числами степени Х?, XJ, , Хп {к = 0, 1, 2, ...), то SvAh = sh = jt%i (*=0, 1,2, ...). D3) Суммы Sfc(ft=l, 2, ..., п) степеней корней многочлена C9) связаны с коэффициентами этого уравнения формулами Ньютона1) = l, 2, ..., п). D4) Если вычислить следы sb s2, - • •, sn матриц А, А2, ..., Ап, то затем можно из уравнений D4) последовательно определить коэффициенты р4, р2, .. -, рп- В этом состоит метод Леверрье определения коэффициентов характеристического многочлена по следам степеней матрицы. Д. К. Фаддеев предложил вместо следов степеней А, А2, ..., Ап вычислить последовательно следы некоторых других матриц Ait Az, ..., Ап и с их помощью определить ри р2, ..., рп и Ви В2, ..., Вп следующими формулами: л „_! =-^—-j Sp -РгЕ, D5) Последнее равенство Вп = An — pnE = 0 может быть использовано для контроля вычислений. Для того чтобы убедиться, что, числа рь р2, ..., рп и матрицы Вь В2, ..., Вп^, последовательно определяемые по формулам D5), являются коэффициентами А (К) и В (К), заметим, что иэ D5) вытекают следующие формулы для Ah и Bh (к=1, 2, ..., п): Ак = А к - PlA^ - ... - р^А, Bh = Ah- р,Ак-г - ... - Рк_,А - PhE. D6) Приравняем между собой следы левой и правой частей первой из этих формул; получим: kPh = sh Но эти формулы совпадают с формулами Ньютона D4), по которым после- последовательно определяются коэффициенты характеристического многочлена Д(К). Следовательно, числа ри р2, ..., рп, определяемые по формулам D5), и являются коэффициентами Л (К). Но тогда вторые формулы D6) совпа- совпадают с формулами C3), по которым определяются матричные коэффициенты В±, В2, . .., Bn-i присоединенной матрицы В (К). Следовательно, фор- формулы D5) определяют и коэффициенты Въ В2, ..., Bn_j матричного многочлена В (к). * !) См., например, [20], стр. 224. 7 ф. Р. Гантмахер
ХАРАКТЕРИСТИЧЕСКИМИ МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Пример1) А~ 0 -1 1 2 —3 —1 - 2 . -1 1 2 1 1 0 1 1 1 110 , ft-Spy 2 4 3 4 0—3 -2—2 1 0—2—5 _3— 3— 1 3 —5- А3=АВ2= — 5 1 — 1- 0 1 ' Р2~2 2 0—2 0—2—4 -7—3 4 4—2 — 7 1 >Рз=у ^5—1—7 — 9 Ак-АВ3- 2 0 0 0 1=4, Sp^ БрЛ 0 —2 0 0 #1 2= — 0 0 —2 0 -2, В -5, Я; 0 0 0 о 4?= —2 - 0 - — 1 1 2 =г -^2 Ч~ 2? = = >1з Ч~ 5?=: , р4=-2, -1 -3 1 1 1 1 —3 1 — 1 -1 2 2 0 1 —4 1 4 0—3 0—2 1 0 0—5 -3—3—1 3 0 1 _| 0 2 0—2 5—2 4 7 2 4 4-2—2 1 Д (Х)=*4— 1 Р4 О —1 2 0 2 * 7_ 2 —2 1 Замечание. Если мы хотим определить pit рг, рз, Р4 и только первые столбцы в В4, Bz, В3, то достаточно вычислить в А2 элементы 1-го столбца и только диагональные элементы остальных столбцов, в А3—только элементы 1-го столбца, в Аи—только два первых элемента 1-го столбца. § 5. Минимальный многочлен матрицы Определение 1. Скалярный многочлен /(к) называется аннули рующим многочленом квадратной матрицы А, если Аннулирующий многочлен ij) (Я,) наименьшей степени со старшим коэффициентом, равным единице, называется минимальным многочленом матрицы А. Согласно теореме Гамильтона — Кэли характеристический многочлен Д (К) матрицы А является аннулирующим для этой матрицы. Однако, как будет показано ниже, в общем случае он не является минимальным. *) Для контроля за вычислениями мы под каждой из матриц Л4, Ач, As под- подписываем ее суммарную строку. Произведения суммарной строки первого сомножи- сомножителя на столбцы второго должны дать элементы суммарной строки произведения.
Sj 5] МИНИМАЛЬНЫЙ МНОГОЧЛЕН МАТРИЦЫ 99 Разделим произвольный аннулирующий многочлен f (к) на мини- минимальный: где степень г (к) меньше степени я]з (к). Отсюда имеем: f(A) = y{A)q(A)+r(A). Поскольку / (А) = 0 и тр (А) = 0, то, значит, и г (А) = 0. Но степень г (к) меньше степени минимального многочлена ty(k). Поэтому г(к)^вО1). Таким образом, произвольный аннулирующий многочлен матрицы всегда делится без остатка на ее минимальный многочлен. Пусть два многочлена ty (k) и tyl (к) являются минимальными для одной и той же матрицы. Тогда каждый из них делится на другой многочлен без остатка, т. е. эти многочлены отличаются постоянным множителем. Этот постоянный множитель равен единице, поскольку равны единице старшие коэффициенты в ty(k) и ^(Я,). Мы доказали единственность минимального многочлена для данной матрицы А. Выведем формулу, связывающую минимальный многочлен с харак- характеристическим. Обозначим через ?>„_! (к) наибольший общий делитель всех миноров (п—1)-го порядка характеристической матрицы кЕ — А, т. е. наибольший общий делитель всех элементов присоединенной матрицы В (к) = || bih (к) ||™ (см. предыдущий параграф); при этом старший коэффициент в Dn_y (к) берем равным единице. Тогда D7) где С (к) — некоторая многочленная матрица, «приведенная» присоеди- присоединенная матрица для кЕ — А. Из B0) и D7) находим: Ь(к)Е = (кЕ - А) С (к) Dn_t (к). D8) Отсюда следует, что А (к) делится без остатка на Dn_t(kJ): где г|э (к) — некоторый многочлен. Обе части тождества D8) можно сокра- сократить на ?>„_! (кK): Ц(к)Е = (кЕ-А)С(к). E0) Поскольку ty(k)E делится без остатка слева на кЕ — А, то в силу обобщенной теоремы Безу Таким образом, многочлен я])(Х), определенный формулой D9), является аннулирующим многочленом для матрицы А. Докажем, что он является минимальным многочленом. х) В противном случае существовал бы аннулирующий многочлен, степень которого была бы меньше степени минимального многочлена. 2) В этом можно и непосредственно убедиться, разлагая характеристический определитель Д (X) по элементам какой-либо строки. s) В данном случае наряду с E0) имеет место и тождество [см. B0')] =<?(*,) (КЕ~А), т. е. С (X) является одновременно и левым и правым частным от деления ф (X) Е на %Е—А. 7*
Поскольку я]з* (А) = 0, то в силу обобщенной теоремы Безу матричный многочлен ty* (к) Е делится слева без остатка на кЕ— А: 100 ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Обозначим минимальный многочлен через я]з* (к). Тогда ф (к) делится без остатка на я))* (к): E1) ный E2) Из E1) и E2) следует: тр(к)Е = (кЕ — А)С*(к)%(к). E3) Тождества E0) и E3) показывают, что как С (к), так и С*(к)%(к) являются левыми частными при делении тр(к)Е на кЕ — А. В силу однозначности деления С(к) = С*(к)%(к). Отсюда следует, что % (к) является" общим делителем всех элементов многочленной матрицы С (к). Но, с другой стороны, наибольший общий делитель всех элементов приведенной присоединенной матрицы С (к) равен единице, поскольку эта матрица была получена из В (к) путем деления на Dn_i (к). Поэтому %(к)~ const. Так как старшие коэффициенты вя])(Х) и ty*(k) равны единице, то в E1) %(к) — 1, т. е. я]з(к) = -ф*(к), что и требовалось доказать. Мы установили следующую формулу для минимального многочлена: А(Ь) /с-/ч Для приведенной присоединенной матрицы С (к) имеем формулу, аналогичную формуле C1) (на стр. 94): A), E5) где многочлен \Р (к, ц) определяется равенством ^). E6) Кроме того, (кЕ-А)С(к) = Ц(к)Е. E7) Переходя к определителям в обеих частях равенства E7), получаем: A(k)\C(k)\---[q(k)]\ E8) Таким образом, Д (к) делится без остатка на я]з (к), а некоторая степень ij) (к) делится без остатка на А (к), т. е. совокупность всех различных между собой корней у многочлена Д (к) и я]з (к) одна и та же. Другими словами, корнями я]з (к) служат все различные между собой характеристические числа матрицы А. Если Д (к) = (к - kt)ni (к - к^ ... (к - ks)ns E9) {kt=^kj при iфу, n?>0, i, /¦=!, 2 s), х) Формула E5) выводится совершенно так же, как и формула C1). В обе части тождества ф(Х) — я))((х)-—(А, — (д.) ? (к, \х) вместо X и jx подставляются матрицы %Е и Л и полученное матричное равенство сопоставляется с E0).
§ 5] МИНИМАЛЬНЫЙ 1МНОГОЧЛЕН МАТРИЦЫ 101 то где (к) = (к ... (к-КГ F0) ih<nk (Я = 1, 2, ..., s). F1) Отметим еще одно свойство матрицы С (к). Пусть к0 — какое-либо характеристическое число матрицы Л = Ца^Ц^. Тогда ty(ko) — 0, и потому согласно E7) (к0Е— А)С(ко) = О. F2) Заметим, что всегда С (ко) ф 0. Действительно, в противном случае все элементы приведенной присоединенной матрицы С (к) делились бы без остатка на к — ко, что невозможно. Обозначим через с любой ненулевой столбец матрицы С (ко). Тогда из F2) т. е. Ас = кос. F3) Другими словами, любой ненулевой столбец матрицы С (ко) (а такой столбец всегда имеется) определяет собственный вектор для к = к0. Пример. 1 19 1 /' !<* + (> 10 —6 — 6 У(Х) = -18 22 18 X—3 1 1 12 — 12 — 8 3 Х-5 — 3 +(Х- А= —2 2 X -X -20) -8) 3 — 1 — 1 3 j ^ — 3 5 3 2-1- li — 3 5 3 2 —2 0 +20 2 — 2 0 — 16=(Ь—2J 4), 1 0 1 ¦ г . + 2 X 0 1 0 ) 0 0 1 2Х- 8?Г = -4 Ь2 Все элементы матрицы получим: делятся на Z>2 (/,)=/.—2. Сокращая этот множитель, X—3 —3 2 — 1 X—1 —2 —1 3 X—6
102 ХАРАКТЕРИСТИЧЕСКИЙ И МИНИМАЛЬНЫЙ МНОГОЧЛЕНЫ МАТРИЦ [ГЛ. IV Подставим в С (X) вместо X значение Хо= — 1 —3 С B) = — 1 Л 2 Л 9 3 -4 Первый столбец дает нам собственный вектор A, 1, 1) для Х0 = 2. Второй столбец дает нам собственный вектор (— 3, 1, 3) для того же характеристического числа Xq=2. Третий столбец есть линейная комбинация первых двух. Точно так же, полагая Х—4, из первого столбца матрицы С D) найдем собственный вектор A, — 1, —1), отвечающий характеристическому числу Х0=4. Обратим внимание читателя на то, что тр (X) и С (X) можно было бы определить иначе. Находим сначала D4 (X). D% (к) может иметь своими корнями только числа 1 X— 5 2 и 4. При Х=4 в Д (X) минор второго порядка х О в нуль. Поэтому Z>2 D) =/= 0. При Х—2 столбцы матрицы А становятся пропорци- пропорциональными. Поэтому все миноры второго порядка в Д (X) при Х = 2 равны нулю: ?JB)=0. Так как вычисленный минор имеет первую степень, то Dz (X) пе может делиться на (X—2J. Следовательно, ; —Х-\-2 не обращается к становятся D2(X)=X-2. Отсюда Л)=Л+(Х—6)?'= X—3 —3 2 — 1 X— 1 —2 — 1 3 X — 6
ГЛАВА V ФУНКЦИИ ОТ МАТРИЦЫ § 1. Определение функции от матрицы Пусть даны квадратная матрица А = \\ aih ||™ и функция / (к) скаляр- скалярного аргумента X. Требуется определить, что следует понимать под / [А), т. е. требуется распространить функцию / (X) и на матричные значения аргумента. Решение этой задачи нам известно для простейшего случая, когда / (X) = y0XL -\- Yi^' + ¦ • • + Yi — многочлен относительно X. В этом случае f (A) — y0Al-{-yiA1*1-^ ...-\-yiE. Исходя из этого частного случая, поста- постараемся определить f (А) в общем случае. Обозначим через 1> (К) = (к - а*I (к - л2Г... (X - кГ' A) минимальный многочлен матрицы А1) (здесь Х±, Xz, ..., ks — все раз- различные характеристические числа матрицы А). Степень этого многочлена s т= 2 mh- Пусть два многочлена g(X) и h(X) таковы, что B) Тогда разность d(k) = g(k) — h(k), будучи аннулирующим многочленом для матрицы А, делится на ty(X) без остатка, что запишем так: g(X) = h(X) (modi|)(X)). C) Отсюда в силу A) <*(Л*) = 0, d'(kk) = O, ..., </т*)(Я.*) = 0 (й = 1, 2, ..., в), т. е. g (Xh) = h (Xh), g' (kh) = h' (Xk), ..., /"*-*> (Xk) = h^~l) (lh) (к = 1, 2, ..., s). D) m чисел . /' (Я.л), • • •, /(mft~J) (Я.*) (h:= 1, 2, ..., s) E) См. гл. IV, § 5.
104 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V будем условно называть значениями функции / (к) на спектре матрицы А и совокупность этих значений символически обозначать через / (ЛА). Если для функции / (к) существуют (т. е. имеют смысл) значения E), то мы будем говорить, что функция f (k) определена на спектре матрицы А. Равенства D) показывают, что многочлены g(k) и h(k) имеют одни и те же значения на спектре матрицы А. В символической записи g(AA)--=h(AA). Рассуждения наши обратимы: из D) вытекают C) и, следовательно, B). Таким образом, если задана матрица А, то значения многочлена g (k) на спектре матрицы А вполне определяют матрицу g (А), т. е. все многочлены g(k), принимающие одни и те же значения на спектре матрицы А, имеют одно и то же матричное значение g(A). Мы потребуем, чтобы определение / (А) в общем случае подчинялось такому же принципу: значения функции f(k) на спектре матрицы А должны полностью определять f(A), т. е. все функции f (к), имеющие одни и те же значения на спектре матрицы А, должны иметь одно и то же матричное значение f (A) *). Но тогда, очевидно, для определения / (А) в общем случае доста- достаточно подыскать такой многочлен g (k), который принимал бы те же значения на спектре матрицы А, что и / (кJ), и положить: f(A) = g(A). Таким образом, приходим к следующему определению: Определение 1. Если функция f(к) определена на спектре матрицы А, то где g (к) — любой многочлен, принимающий на спектре матрицы А те же значения, что и / (к): Среди всех многочленов с комплексными коэффициентами, прини- принимающих те же значения на спектре, что и f{k), имеется один и только один многочлен г (к) степени <Ст3). Этот многочлен г (к) однозначно определяется интерполяционными условиями: r(kh)=f(kh), r'(kh) = f (kh), ...,r(mft-1)(Xft) = /(m^1)(^) (Л = 1,2, ...,s). F) Многочлен г (к) называют интерполяционным многочленом Лагранжа- Силъвестра для функции f(k) на спектре матрицы А. Определение 1 можно еще сформулировать так: *) Кроме того, предполагается что общее определение для / (А) в частном случае, когда / (X)—многочлен, должно давать тот же результат, что и непосред- непосредственная подстановка в многочлен вместо X матрицы А. 2) В § 2 будет показано, что такой интерполяционный многочлен всегда суще- существует, и будет дан алгоритм для вычисления коэффициентов интерполяционного многочлена наименьшей степени. 3) Этот многочлен получается из любого другого многочлена, имеющего те же спектральные значения, что и остаток от деления на \р (X).
ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОТ МАТРИЦЫ 105 Определение 1'. Пусть f (к) — функция, определенная на спектре матрицы А, а г(Х) — соответствующий интерполяционный многочлен Лагранжа—Сильвестра. Тогда f(A) = r(A). Замечание. Если минимальный многочлен я]з(X) матрицы А не имеет кратных корней г) [в равенстве A) т1 = т2 = ... = ms = 1; s = m], то для того, чтобы / (Л) имело смысл, достаточно, чтобы функция / (X) была определена в характеристических точках Ки ^2> • • ¦ > Кп- Если же •ф (X) имеет кратные корни, то в некоторых характеристических точках должны быть определены и производные от f (X) до известного порядка [см. FI. Пример 1. Рассмотрим матрицу2) 0 0 0 0 1 0 0 0 0... 1... 0... 0... 0 0 1 0 Для нее минимальным многочленом будет Хп. Поэтому значениями / (X) на спектре Н будут числа /@), /'@), ..., /(п-1)@), и многочлен г (К) будет иметь вид Таким образом, /@) /'@) 1! 0 /@) • ИМ 1! • • /@) Пример 2. Рассмотрим матрицу J= к0 1 0 ... 0 О ко 1 ... О О 0 0... 1 о о о... х( Заметим, что J=k0E+H и, следовательно, J—Х0Е—Н. Минимальным много- многочленом для J, очевидно, будет (к—ко)п. Интерполяционный многочлен г (к) для функции / (к) определится равенством 7 \^о) /1 1! !) В гл. VI будет выяснено, что в этом и только в этом случае матрица А является матрицей простой структуры (см. гл. III, § 8). 2) Свойства матрицы Н разобраны в примере на стр. 24—25.'
106 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Поэтому ±1 (\ \ ^G1—1) (\ 1\ \ / (К0) I (*¦¦ /' (Яд) 1! О 0 . . . ' Отметим три свойства функции от матрицы. 1° Если Xi, Я2, ..., Я„— характеристические числа матрицы п-го порядка А, то /(Я^, /(Я2), .. . ,/(Я„)—полная система характеристичес- характеристических чисел матрицы /(Л). В частном случае, когда /(Я)—многочлен, это предложение было доказано на стр. 94. Доказательство для общего случая сводится к этому частному случаю, поскольку (в силу определения 1') / (А) = г (А) и / (Яг) = = г (^0 (?= 1, ..., п), где г (Я) — интерполяционный многочлен Лагранжа — Сильвестра для функции / (Я). 2° Если две матрицы А и В подобны и матрица Т преобразует А в В: В = Т-ЫТ, то матрицы f (А) и f (В) подобны и та же матрица Т преобразует f(A) в f(B) Действительно, две подобные матрицы имеют одинаковые минималь- минимальные многочлены г) и, следовательно, функция / (Я) принимает одни и те же значения как на спектре матрицы А, так и на спектре матрицы В. Поэтому существует интерполяционный многочлен г (Я) такой, что / (А) = = г (A), f (В) = г (В). Но тогда из равенства г (В) = Т~г г (А) Т (см. сноску) следует: 3° Если А — квазидиагоналъная матрица Л = {ЛЬ А2, ...,Аи}, то f(A) = {f(A1), f(A2),...,f(Au)}. •Обозначим через г (Я) интерполяционный многочлен Лагранжа — Силь- Сильвестра для функции /(Я) на спектре матрицы А. Тогда, как легко видеть, / (А) = г (А) = {г (А,), г (А2), ..., г (Аи)}. G) С другой стороны, минимальный многочлен г[> (Я) для А является аннулирующим многочленом для каждой из матриц Аи А2,...,Аи. Поэтому из равенства следует: ДЛЛ1) = г (ЛЛ1), ..., / (AAJ = г (ЛДц). 1) Из В—Т-ЫТ следует Bh=T-1AhT (fc=0, 1, 2, ...). Отсюда для любого мно- многочлена g(%) имеем g(B)=T~ig(A)T. Поэтому из g (А)=0 вытекает g(B)=0 и на- наоборот.
ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОТ МАТРИЦЫ 107 Поэтому и равенство G) можно записать так: f(A) = {f(A1), f(A2),...,f(Au)}. Пример 1. Если матрица простой структуры то / (Л) =Г{/ (h), f (>.2), ..., / (К)} Т-К f (А) имеет смысл, если функция / (J.) определена в точках к± %2, ..., \п. Пример 2. Матрица J имеет следующий квазидиагональный вид: VI (8) 0 1 0 ... О j A,i 1 ... О i О 0 0 ... 1 О 0 0...>. Хи 1 0 ... О о к ... о io о о...%и 1 |о о о...о ки В недиагональных блоках все элементы равны нулю. Согласно формуле (8) (см. также пример на стр. 105) / V 1/ О 1! (vi-1)! i 1! /' (К) 1! " " • ИМ ' ¦ о . . . (v«—1)! • . f'(M 1! f{M Здесь, как и в матрице J, все элементы в недиагональных блоках равны нулю *). х) В дальнейшем (гл. VI, § 6 или гл. VII, § 7) будет установлено, что произ- произвольная матрицаЛ = || ajfeli" всегда подобна некоторой матрице вида J: A=TJT~1. Поэтому (см. 2° на стр. 106) всегда / (A)=Tf(J) T~K
108 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V § 2. Интерполяционный многочлен Лагранжа — Сильвестра 1. Рассмотрим сначала тот случай, когда характеристическое урав- уравнение \ХЕ — ^4 ) == 0 не имеет кратных корней. Корни этого уравнения — характеристические числа матрицы А—обозначим через Я^ Kz,...,Ki- Тогда и условия F) записываются так: (& = 1, 2, ...,п). В этом случае г (к) является обычным интерполяционным многочле- многочленом Лагранжа для функции / (Я) в точках Xl7 Х2> • • -»кп: Согласно определению 1' 2. Допустим теперь, что характеристический многочлен имеет кратные корни, но минимальный многочлен, являющийся делителем характеристи- характеристического, имеет только простые корни г): В этом случае (как и*в предыдущем) все показатели т^ в A) равны единице, и равенства F) принимают вид г (Я) снова является обычным интерполяционным многочленом Лаг- Лагранжа и m . (Л-Xft-iE) (Л—УцД) ... (А-ХтЕ) , .. . (lh-4i) (Xft-Xft+i) (Я*-Я™) ' К hh ft=l 3. Рассмотрим общий случай: ¦ф (Я) = (Я — Я})™1 (Я — Яг)™2... (Я — Я8) s (ttzj -|- p?2 t~ • • • ~Ь "^s == "^)- Представим правильно-дробную функцию -,h^4- в виде суммы про- простых дробей: -Т^Г+.. °">-7+---+-^7-|. (9) где ау(; = 1, 2, ...,tnk', &=1, 2, ...,s)—некоторые числа. Для определения числителей простых дробей а^- умножим обе части этого равенства на (Я — ^ft)mfe и обозначим через tyh (Я) многочлен — —. &Umh См. сноску !) на стр. 105.
§ 2] ИНТЕРПОЛЯЦИОННЫЙ МНОГОЧЛЕН ЛАГРАНЖА—СИЛЬВЕСТРА 109 Получим: + (я- яйГ"е М (А = 1, 2,...,«), (Ю) где @(Я)— рациональная функция, регулярная при Я = Яьа). Отсюда (ii) Формулы A1) показывают, что числители ay в правой части равен- равенства (9) выражаются через значения многочлена г (Я) на спектре мат- матрицы А, а эти значения нам известны: они равны соответствующим зна- значениям функции / (Я) и ее производных. Поэтому Формулы A2) можно еще сокращенно записать так: После того как все ay найдены, мы определяем г (Я) из следующей формулы, которая получается умножением обеих частей равенства (9) ¦на i|) (Я): S г (Я) = 2 [ай1 + ай2^-^)+...+а,;тй(Я-ЯА)т^1]^(Я). A4) ft=i В этой формуле выражение в квадратных скобках, стоящее в каче- качестве множителя перед iph (Я), в силу A3) равно сумме первых mk членов разложения Тейлора по степеням (Я — Яй) для функции / (Я)/|фь (Я). Пример. ¦$(к) = {к — XiJ(X— X2)8 (m=5). Тогда »¦(>.) « , w I ' _[_ I I ц I Отсюда и, следовательно, г (Л) = [аЕ ~ р (А — XjE)] (Л — к2ЕK + [у? + б (А — Х2Е) + е {А — Х2Е)Ц (А — То есть не обрмдающаяся в со при К = кь.
110 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V а, р, Yi в| е найдем из следующих формул: Примечание 1. Интерполяционный многочлен Лагранжа — Силь- Сильвестра может быть получен предельным переходом из интерполяционного многочлена Лагранжа. Пусть (m = У mk . •ф(Я) = (Я —ЯО™1^ —V2 • • • (^-^ Обозначим через L (Я) интерполяционный многочлен Лагранжа, построен- построенный для т точек (™s) n(l) jB) j,(™i). о,Сi> 5,B) ^(we). . i(*) 1B) Тогда нетрудно показать, что искомый многочлен Лагранжа — Силь- Сильвестра определяется формулой г(Я)= lim ?(Я). ,(i) »(ms) Примечание 2. Пусть Л = ||агй||— вещественная матрица, т. е. матрица с вещественными элементами. Тогда минимальный многочлен ty (Я) имеет вещественные коэффициенты х) и его корни, т. е. характери- характеристические числа Я;, либо вещественны, либо попарно комплексно сопря- сопряжены, причем, если ке — Яь то соответствующие кратности равны: mg = = mh. Условимся говорить, что функция / (Я) вещественна на спектре матрицы А, если для вещественного Я; все ее значения на спектре /(^г)> /' (М» • • - вещественны, а для двух комплексно сопряженных характеристических чисел Я^ и Яё = Я^ соответствующие значения на спектре комплексно сопряжены: /(Яё) = /(Я^), /' (Яе) = /' (Яь),... 2). В этом случае / (А)—вещественная матрица. Действительно, в данном случае согласно формулам A2) аг1, ai2, ... —вещественные числа и аё1 = аЛ1, ag2 = «и. • • •; ПРИ этом Для вещественного Яг многочлен г|){ (Я) = —- ^т имеет вещественные коэффициенты, а коэффициенты многочленов ij)fe (Я) и tpB (Я) (при Яё = Ял) — комплексно сопряжены. Поэтому в силу формулы A4) интерполяционный многочлен г (Я) имеет вещественные коэффициенты. Но тогда г (А), а значит и f(A) = r (А), — вещественная матрица. !) Это следует непосредственно из определения минимального многочлена либо из формулы E4) на стр. 100. 2) Функция, представляемая суммой степенного ряда с вещественными коэф- коэффициентами, вещественна на спектре любой матрицы, характеристические числа которой находятся внутри круга сходимости данного ряда.
§ 3] ДРУГИЕ ФОРМЫ ОПРЕДЕЛЕНИЯ / (А) Ш § 3. Другие формы определения /(А). Компоненты матрицы А Вернемся к формуле A4) для г (Я). Подставляя в нее выражения A2) для коэффициентов а и объединяя члены, содержащие одно и то же зна- значение функции / (Я) или какой-либо ее производной, мы представим г (Я) в виде = 2 [/(Яй)фй1(^) + /'(^)Ф^(^+...+/(тй)(^)ф^ж.(Я)]. A5) fei fi Здесь фу (Я) (у = 1, 2, ..., mh; к = 1, 2, ..., s) — легко вычисляемые мно- многочлены от Я степени <im. Эти многочлены вполне определяются зада- заданием я[> (Я) и не зависят от выбора функции / (Я). Число этих многочле- многочленов равно числу значений функции /(Я) на спектре матрицы А, т. е. равно т[т—степень минимального многочлена 'ф(Я)]. Функция фу (Я) представляет собой интерполяционный многочлен Лагранжа — Сильвестра для функции, у которой все значения на спектре матрицы А равны нулю, за исключением одного ^~^(кь), равного 1. Из формулы A5) следует основная формула для /(.4): s / (А) - ?¦ [/(Яй) Zkl + /' (Яй) ZH + ... + Z* \Kh) Zhm.], A6) ft=i ft где Zkj = фу (A) (j = 1, 2, ..., mk; к = 1, 2, ..., s). A7) Матрицы Zkj вполне определяются заданием матрицы Л и не зависят от выбора функции / (Я). В правой части формулы A6) функция / (Я) пред- представлена только своими значениями на спектре матрицы А. Матрицы Zy(/ = 1, 2,...,mh; к=1, 2, ...,s) будем называть со- составляющими матрицами или компонентами данной матрицы А. Компоненты матрицы А всегда линейно независимы. Действительно, пусть Z1 ckj6hj= Zj Z chj4>hj (Л) = U. (№) ft=l i=l k=i j=l Определим интерполяционный многочлен г (Я) из т условий r(i~V (Ik) = ckj (/= 1, 2, ..., mk; к = 1, 2, . .., s). A9) Тогда, согласно формуле A5), /1 \ V V /1 \ /оп\ Г (А) = ^j ^ Ckjfpkj (Лу. ^^'7 Из сопоставления формул A8) и A9) находим г(Л) = 0.- B1) Но степень интерполяционного многочлена г (Я), задаваемого форму- формулой B0), меньше т, т. е. меньше степени минимального многочлена я)) (Я). Поэтому из равенства B1) следует тождество г(Я) = 0.
112 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Но тогда согласно A9) СЮ = 0 (/ = 1, 2, ..., mh; к = 1, 2, ..., s), что и требовалось доказать1). Из линейной независимости составляющих матриц Zkj следует, между прочим, что ни одна из этих матриц не равна нулю. Заметим еще, что любые две из компонент Zhj перестановочны между собой и с матри- матрицей А, поскольку все они суть скалярные многочлены от А. Формулой A6) для f(A) особенно удобно пользоваться тогда, когда приходится иметь дело с несколькими функциями от одной и той же матрицы А, либо когда функция /(Я) зависит не только от Я, но и от некоторого параметра t. В последнем случае в правой части формулы A6) компоненты Zhj не зависят от t и параметр t входит только в скаляр- скалярные коэффициенты при этих матрицах. В примере на стрЛОЭ, где i))(X) = (X—kjJ (к—к2)8, мы можем г (к) представить в виде г (к) =/ (Xj) фи (к) + /' (ki) ф12 (к) + f (к2) ф21 (к) +/' (Я2) ф22 <Ц + /" (^2) Ф23 W, где (k-kt) (к-к2)з 3(X-kj) I 3 (>Ь- jX-^a^-Xs) Г 2(Х-Х2)П ф22 w - (з?=Х5* L ~ ~*i=xT J ' l + t (^2) Z2i-\-f (k2) Z22~{-f" (k) Z2i. где И Т. Д. Если дана матрица .4, то для конкретного нахождения компонент этой матрицы можно в основной формуле A6) положить /() ^ где Я —некоторый параметр. Тогда получим: B2> где С (К) — приведенная присоединенная матрица для ХЕ — А (гл. IV, § 6J). !) Из доказанной линейной независимости матриц 2^-=ф^-(Л) следует также линейная независимость многочленов <fhj(k)> /=1» 2, ....т^; fc=l, 2, . ..,s. 2) При /(ii)=-t имеем f (А)=(кЕ—А)~1. Действительно, f (A)=r (А), где А — (X г ((i)—интерполяционный многочлен Лагранжа—Сильвестра. Из того, что f (ц) и г ((х) совпадают на спектре матрицы А, следует, что на этом спектре совпадают (Я,—ц)г(A) и (Я,—A)/(ц)=1. Отсюда (ЯЕ—Л) г (А) = (кЕ—A) f(A)=E.
§ 3] 1ДРУГИЕ ФОРМЫ ОПРЕДЕЛЕНИЯ /(А) ИЗ Матрицы (/ —1I Zjy- являются числителями простейших дробей в разложении B2), и потому по аналогии с разложением (9) эти числи- числители могут быть выражены через значения С (к) на спектре матрицы А по формулам, подобным A1): B3) Отсюда Подставляя в A6) вместо составляющих матриц их выражения B2), мы можем основную формулу A6) представить в виде /М)=2-й=гй (я.) »*-»* B4) Пример 1. А= 2 —1 О —1 1 1 1 1 1 21) 2, %Е—А= 1 Х—2 1 —1 0 А,—1 —1 1 —1 А,—1 В данном случае д (X) =] Х?—А\ = (к—IJ (Я,—2), Поскольку минор элемента [1, 2] в %Е—А равен 1, то ?>2(Х)=1, и потому^ )=д (Х)=(Х—1J (Я,—2)=А,з—4Х2+5Я,—2, и 3 — 1 —3 —2 2 2 2 3 1 2 —1 1 О — 1 Основная формула в данном случае имеет вид Полагая здесь / ((i)=- находим: -+ 1 1 1 1 B) Zs. z12 —41+5) 1 0 0 0 1 0 0 0 1 B5) откуда —1 п (Я,—IJ —2 Z1= -С A)-С A), Z2=-C (I), Z3=C B). Пользуясь приведенным выше выражением для CL(A,), вычисляем ставляем полученные результаты в B5): ^, Z2, Z3 и под- под1 0 0 1 0 0 1—11 +] /(!)+/'(!) + /'(!)-/ B) /(!)-/B) F'(i) 1 —1 1 —1 0 0 -/'A) _/'(!)+/B) -/(!) + /B) 1 1 0 / / -Ж2) 'A) 'A) • /A) 0 0 0 — Г 1 G — 1 1 0 х) Курсивом набраны элементы контрольного суммарного столбца. Умножая строки матрицы А на суммарный столбец матрицы В, получаем элементы суммар- суммарного столбца произведения АВ. 8 ф. р. Гантмахер
114 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Пример 2. Покажем, как можно определить / (А), исходя только из основ- основной формулы. Пусть снова 2—11 А= 0 11 —1 11 Тогда / (A)=f (I) Zt+/' (I) Z2+/ B) Z3. B5') Подставим в формулу B5') вместо f(fy последовательно 1, X—1, (Я,—IJ: ZZ+Z3=A—E= 1 0 0 1 0 —1 0 —1 —1 0 1 0 0 1 1 0 0 1 -1 0 1 0 0 0 » 1 1 0 0 0. 0 1, Вычитая из первых двух равенств почленно третье, определим все в B5'), получим выражение для / (А). ft. Подставляя Разобранные примеры иллюстрировали три способа практического нахождения f(A). В первом способе мы находили интерполяционный многочлен г (Я) и полагали / (А) — г (А). Во втором способе мы, пользуясь разложением B2), выражали компоненты Zhj в формуле A6) через зна- значения приведенной присоединенной матрицы С (К) на спектре матрицы А. В третьем способе мы исходили из основной формулы A6) и подставляли в нее вместо / (Я) последовательно некоторые простейшие многочлены; из полученных линейных уравнений определяли составляющие матрицы Zhj. Третий способ является, пожалуй, практически наиболее удобным. В общем виде его можно сформулировать так: В формулу A6) вместо / (К) подставляем последовательно некоторые многочлены gt (к), gz (Я), ..., gm (Ц- [gi (К) ь) Zh2 + ... (t = l, 2, ..., m). l) (kk) Zht B6) Из т уравнений B6) определяем т матриц Zhj и подставляем получен- полученные выражения в A6). Результат исключения Zjy из (m-f-l)-ro равенства B6) и A6) может быть записан в виде 1{A) gx(A) gx gm (A) gm ... / (К) ¦ ¦ ¦ l) (К) (K) = 0.
§ 4] ПРЕДСТАВЛЕНИЕ ФУНКЦИЙ ОТ МАТРИЦ РЯДАМИ Ц5 Разлагая этот определитель по элементам первого столбца, мы получим искомое выражение для / (А). Здесь при / (А) в качестве множителя будет стоять определитель Д == | gift (Яй) | (в г-й строке определителя А стоят значения многочлена gt (Я) на спектре матрицы A; i— 1, 2, ..., т). Для того чтобы можно было определить / (А), нужно, чтобы А Ф 0. Это будет иметь место, если никакая линейная комбинация х) многочленов gift), ?2(^O •••» gm (Я) не обращается сплошь в нуль на спектре матрицы А, т. е. не делится на ip (Я). Условие Д Ф 0 всегда выполнено, если степени многочленов gt (Я), g2 (Я), ..., gm (Я) соответственно равны 0, 1, 2, ..., т — 1 2). В заключение отметим, что большие степени матрицы Ап удобно вычислять по основной формуле A6), заменяя в ней /(Я) на Япз). Пример. Дана матрица А= „ 5 —4 . Требуется вычислить элементы сте- степени Аюо. Минимальный многочлен i]j(X)=(X—IJ. Основная формула Заменяя здесь / (X) на 1, а затем на X—1, получим: Z±=E, ZZ=A—E. Поэтому Полагая /(Я,)=Х1оо, найдем: § 4. Представление функций от матриц рядами Пусть дана матрица А = || агь ||" с минимальным многочленом ty (Я) = ( !)^^) (,)( 2 fe=i ция /(Я) и последовательность функций f±(X), /2(Я), ..., /Р(Я), ... опре- определены на спектре матрицы А. Мы будем говорить, что последовательность функций /Р(Я) при р—> со стремится к некоторому пределу на спектре матрицы А, если существуют пределы lim /р (Яй), lim /р (Яь), ..., lim ^«Чс») (Я*) (к = 1, 2, ..., *). Мы будем говорить, что последовательность функций /Р(Я) стре- стремится при р—> со к функции /(Я) на спектре матрицы А, и будем писать: lim/p(AA) = р-»оо если lim /, (А*) = / (Я,*), lim fv (lh) = /' (Я*), .... lim /J"»"" (Яь) = ?ть~1) (Яй) р->оо р-+со р-+оо х) С не равными одновременно нулю коэффициентами. 2) В последнем примере го=3, gt(X)=l, g2W==^—1, g3М=(Л-т-1J. 3) Формулу A6) можно использовать и для вычисления обратной матрицы А'1, Л полагая f(h)=— или, что то же, полагая Х=0 в формуле B2). 8*
116 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Основная формула Н*)= 2 [/(^)zM+/'(^)zft2+.-.+/(m")(^)ztoft] h=l выражает f(A) через значения f(K) на спектре матрицы А. Если рас- рассматривать матрицу как вектор в пространстве ге2 измерений jRn2, то из основной формулы в силу линейной независимости матриц Zhj следует, что все / (А) (при заданном А) образуют то-мерное подпространство в jRna с базисом Zftj(/ = 1, 2, ..., т^', ft = l, 2, ..., s). В этом базисе «вектор» f(A) имеет своими координатами т значений функции / (К) на спектре матрицы А. Эти соображения делают совершенно прозрачной следующую теорему: Теорема 1. Для того чтобы последовательность матриц /р(А) при р —> со стремилась к некоторому пределу, необходимо и доста- достаточно, чтобы последовательность /р (X) при р —> со на спектре матрицы А стремилась к пределу, т. е. пределы Шп/р(Лд) р-»оо р-кх всегда существуют одновременно. При этом равенство р-к» влечет за собой равенство \imfp(A) = f(A) B8) р-юо и наоборот. Доказательство 1. Если значения /Р(Х) на спектре матрицы А при р —» со стремится к предельным значениям, то из формулы /р (А) = 2 [/Р (К) Ян-ЪГр (Xft) Zft2+ ... +/(pmft-1> (Xft) Zftmft] B9) следует существование предела lim /p (А). На основании этой же формулы р-м» 2 р и формулы A6) из B7) вытекает B8). 2. Обратно, пусть существует limfp(A). Так как т составляющих р матриц Z линейно независимы, то мы можем из B9) выразить (в виде линейных форм) т значений fP(X) на спектре матрицы А через т эле- элементов матрицы fp (А). Отсюда следует существование предела Нт/Р(ЛА), р-»оо и равенство B7) имеет место при наличии равенства B8). Согласно установленной теореме, если последовательность многочле- многочленов gp(^)(p = l, 2, ...) стремится к функции /(X) на спектре мат- матрицы А, то lim gp\A) = f {А). Эта формула подчеркивает естественность и общность данного нами определения / (А). / (А) всегда получается предельным переходом из gp (A) при р~> со, если только последовательность многочленов gp(%) сходится к f(X) на спектре матрицы А. Последнее условие является необходимым для существования предела liva.gp(A) при р—> со. р->оо
§ 4] ПРЕДСТАВЛЕНИЕ ФУНКЦИЙ ОТЦМАТРИЦ! РЯДАМИ 117 оо Условимся говорить, что ряд S\ ир (X) сходится на спектре мат- рицы А к функции /(X), и будем писать: /(ла)=2МЛа), C0) р=0 если все фигурирующие здесь функции определены на спектре матрицы А и имеют место равенства ! 2 J^ р=0 р=0 р=0 (« = 1, Z, ..., s), причем в правых частях этих равенств стоят сходящиеся ряды. Другими словами, если положить *р(*)= 2М^) (Р = 0. 1. 2' •••). Q=0 то равенство C0) равносильно равенству р(ЛА). C1) Очевидно, что доказанной теореме можно дать следующую эквива- эквивалентную формулировку: со Теорема 1'. Для того чтобы ряд ~S\up(A) сходился к некоторой р=0 оо матрице, необходимо и достаточно, чтобы ряд 2 ир (^) сходился на спектре матрицы А. При этом из равенства р=0 следует равенство 2 р=0 ы наоборот. Пусть дан степенной ряд с кругом сходимости | % — %0 \ < R и сум- суммой f(k): 2 C2) р=0 Так как степенной ряд можно почленно дифференцировать любое число раз внутри круга сходимости, то ряд C2) сходится на спектре любой матрицы, характеристические числа которой попадают внутрь круга сходимости. Таким образом, имеет место Теорема 2. Если функция /(%) разлагается в степенной ряд в круге \%—Хо|<г, C3)
118 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V то это разложение сохраняет силу, если скалярный аргумент Я. заменить любой матрицей А, характеристические числа которой лежат внутри круга сходимости. Примечание. В этой теореме можно допустить, чтобы характери- характеристическое число %k матрицы А попало на периферию круга сходимости, но при этом нужно дополнительно потребовать, чтобы ть.— 1 раз почленно продифференцированный ряд C3) в точке % = %ь. сходился. Отсю- Отсюда, как известно, уже следует сходимость j раз продифференцированного ряда C3) в точке %k к fn(Xk) для / = 0, 1, 2, ..., mk — 1. Из доказанной теоремы вытекают, например, следующие разложе- разложения1): р=0 Г>=0 ¦ZJ Bp)! ' "" oo ' M~i= ~y Ap (\ %ъ ] < 1- k = l 2 (здесь под inX мы понимаем так называемое главное значение много- многозначной функции LnX, т. е. ветвь, для которой Lnl=0). Формула B2) на стр. 112 позволяет легко распространить интегральную фор- формулу Коши для аналитических функций на функции от матриц. ^*м Рассмотрим в плоскости комплексного переменного к правильную область, ограниченную замкнутым контуром Г и содержащую внутри себя характеристи- характеристические числа %i, ...,%„, матрицы А. Возьмем произвольную аналитическую функ- функцию f(K), регулярную в этой области {включая границу Г). Тогда по известным формулам Коши2) ш \ -а г г _ (м*—1)» 2ni (*=1, ...,*). Умножая обе части матричного равенства B2) на ' ' ; и интегрируя вдоль Г 3), получим: х) Разложения в первых двух строках имеют место при произвольной матрице Л. 2) См., например, И. И. Привалов, Введение в теорию функций комплекс- комплексного переменного, Физматгиз, 1960, стр. 166. 3) Интеграл от матрицы определяем как результат «поэлементного» интегри- интегрирования. Поэтому •7 где {%Е—А)^ — д-Цг (i, fc=l, ..., и)—элементы матрицы (КЕ— А)~1 (см. гл. IV, § 3).
§ 5] НЕКОТОРЫЕ СВОЙСТВА ФУНКЦИЙ ОТ МАТРИЦ 119 что, согласно основной формуле A6), и дает: E-A)-i f (к) dk. C4) Эти же рассуждения показывают, что интеграл, стоящий в правой части равен- равенства C4), равен нулю (при / (А) Ф 01), если все характеристические числа матрицы А расположены вне контура Г, и равен ft=i h если характеристические числа ki, ..., kq расположены внутри, а Яд+j, ..., кп— вне Г. Формулу C4) можно принять за определение аналитической функции от матрицы. § 5. Некоторые свойства функций от матриц В этом параграфе мы докажем несколько предложений, позволяющих распространить тождества, связывающие функции от скалярного пере- переменного на матричные значения аргумента. 1° Пусть G (щ, и->, ..., щ) — многочлен относительно иищ, ..., щ\ fi{tyi /2 (^). •• •> /г(^) — функции от %, определенные на спектре матри- матрицы' А, и g(K) = G [Д (%), h {Ц, ¦ • •, П (Я,)]. C5) Тогда из следует G[h(A), fi(AI..., Действительно, обозначим через г4 (К), г2(Я,), . ,.,Г|(А.) интерполя- интерполяционные многочлены Лагранжа—Сильвестра для ft (%), /г(Х), •••>/{ (Я.) и положим: h{k) = G[ri(k), r2(%) п(%)}. Тогда из C5) вытекает: Л(АА) = 0. Отсюда следует, что G I/, (А), /2р), ...,/! (А)] - G [г, (А), г2(А),...,п (А)] = А (Л) = 0, что и требовалось доказать. Согласно предложению 1° из тождества следует для любой матрицы А cos2 A+sin2 A = (в данном случае: G{uu u2) = ul + ul— I, /j (A,) = cos X, /2 (X) = sinX). Точно так же для любой матрицы А т. е.
120 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Далее, для любой матрицы А elA = cos A + i sin A. Пусть дана неособенная матрица А ((А \ ф 0). Обозначим через ]/\ однозначную ветвь многозначной функции У К, определенную в области, не содержащей нуля и содержащей все характеристические числа матрицы А. Тогда имеет смысл У А. При этом из (jAXJ — Я, = 0 будет следовать1): Пусть / (Я.) = -^-» и A = \\aik ||"—неособенная матрица. Тогда функ- функция / (Я,) определена иа спектре матрицы А, и потому в равенстве можно заменить Я, на А: A-f(A) = E, т. е. Обозначая через г (Я.) интерполяционный многочлен для функции -j- , мы сможем обратную матрицу 4 представить в виде многочлена от данной: Рассмотрим рациональную функцию р.(Я,) — f ).\ , где g(%) nh(%)-~ ft (л) взаимно простые многочлены относительно X. Эта функция определена на спектре матрицы А в том и только в том случае, если характеристи- характеристические числа матрицы А не являются корнями многочлена h (к), т. е. 3) если \1г(А)\ф0. При выполнении этого условия мы можем в тождестве заменить Я. на А: Q(A)h(A) = Отсюда q (A) = g (A) [h (A)]-i = [h (А)Г* g (A). 2° Если составная функция определена на спектре матрицы А, то g(A)-h[fSA)], т. е. g(A) = h(B), где B — f(A). При доказательстве этого предложения, как и ранее, будем предполагать, что ф (К) = (%- ХО1 (% - J^p ... (X - ls)m* г) В гл. VIII §| 6 и 7 будет дано более общее определение. УА как произ- произвольного решения матричного уравнения Х%=А. 2) Этим положением мы уже пользовались на стр. 112. См. сноску 2) к стр. 112. s) См. B5) на стр. 94.
§ 5] НЕКОТОРЫЕ СВОЙСТВА ФУНКЦИЙ ОТ МАТРИЦ 121 — минимальный многочлен матрицы А. Тогда значения функции g(X) на спектре матрицы А определяются по формулам1) g (Я*) = h (цО, g' (Я*) = h' Ы f (Я*), ..., girnb-l)(%k) = h<m»-l)(lxk)\f(Xk)](nk-*l)+ ... +Л'(|**)/(т*)(Я*), где щ = /(Л*) (к = 1, ...,s). Многочлен будет аннулирующим многочленом для матрицы В. Действительно, каж- каждое число Xft является корнем по крайней мере кратности тк функции q (Ц = % [/ (я.)]=Д Поэтому и согласно 1° Поэтому среди значений ^' (щ), ... *<"•*-" (цЛ) (Л = 1, ..., s), C7) содержатся все значения функции h (\а) на спектре матрицы В. Исходя из значений C7), построим интерполяционный многочлен г (%) для функ- функции h(k). Тогда, с одной стороны, А(?) = г (Я). С другой стороны, как показывают формулы C6), функции *g (X) и gi(ty = r[f (Я,)] будут равны на спектре матрицы А. Поэтому, приме- применяя к разности g (%) — r[f (%)] предложение 1°, получим: g(A)-r[f(A)] = O; но тогда g(A) = r [f (A)] = r(B) = h{B) = h [f (A)], что и требовалось доказать. Комбинируя предложения 1° и 2°, приходим к следующему обобще- обобщению предложения 1°. 3°. Пусть g(%) = G[ft(%), fz(K), ...,/,(Я,)], где функции Д (к), /2 (Я,), .... /г (X) определены на спектре матрицы А, а функция G (щ, и2, ..., щ) есть результат последовательного приме- применения к величинам щ, щ., ..., мг операций сложения, умножения, умно- умножения на число и замены величины произвольной функцией от нее. Тогда из !) Предполагается, что все входящие в эти формулы величины l№k) f/™*"* (Л*), (m~l) имеют смысл.
122 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V следует G\ft(A), f2, (А), ...,/|(Л)]=0. Так, например, пусть А — неособенная матрица (| А | ф 0). Обозна- Обозначим через In % однозначную ветвь многозначной функции Ln %, опреде- определенную в некоторой области, не содержащей числа 0 и содержащей все характеристические числа матрицы А. Тогда в скалярном тождестве можно заменить скалярный аргумент X на матрицу А: elaA—A = 0, т.е. е1пА = Л. Другими словами, матрица X = In А удовлетворяет матрич- матричному уравнению ех — А, т. е. является «натуральным логарифмом» матрицы А. Беря в качестве In % другие однозначные ветви многозначной функ- функции Ln %, мы получим другие логарифмы матрицы А х). Пусть А = \\ о4йЦ"— вещественная неособенная матрица. В главе VIII, § 8 будут установлены необходимые и достаточные условия для того, чтобы вещественная матрица имела вещественный натуральный логарифм. Здесь же мы рассмотрим два частных случая. 1) Матрица А не имеет вещественных отрицательных характери- характеристических чисел. Обозначим через \по% однозначную ветвь функции In X в комплексной ^.-плоскости с разрезом вдоль отрицательной дей- действительной оси, определяемую равенством 1п0 %=In г+*ф» —л < ф < л (X = rei(f). Функция 1п(Д принимает вещественные значения при положительных вещественных X и комплексно сопряженные значения при комплексно сопряженных значениях X. Поэтому функция 1п0 % вещественна на спектре матрицы А (см. стр. 110) п?а0А—вещественная матрица. 2) А —Б2, где В—вещественная матрица2). Наряду с функцией lno X введем в рассмотрение две однозначные ветви функции lnl в ком- комплексной Я-плоскости с разрезом вдоль положительной действитель- действительной оси: 0<ф<2л (X —2л<ф<0 (Я, Пусть матрица В имеет различные характеристические числа Я* (к — 1, ..., s). Выберем круговые окрестности Gh точек Xh (fc=l, ..., s) так, чтобы они не пересекались и не содержали начало Х = 0. В обла- области, составленной из этих окрестностей, определим функцию / (X) равен- равенством 2, если XgGft и 2, если XgGft и ReXft = O, ImXA>0, 2, если a,?Gft и ReXft = O, ImXft<0. г) Однако на этом пути мы не получим все логарифмы матрицы А. Общая формула, охватывающая все логарифмы .матрицы А, будет дана в гл. VIII, § 8. 2) В этом случае матрица А имеет отрицательные характеристические числа, если матрица В имеет чисто мнимые характеристические числа.
§ 5] НЕКОТОРЫЕ СВОЙСТВА ФУНКЦИЙ ОТ МАТРИЦ 123 Тогда функция / (X) представляет собой однозначную ветвь функции 1пХ2, определенную и вещественную на спектре матрицы В. Поэтому / (В)— вещественная матрица и т. е. матрица / (В) является вещественным натуральным логарифмом матрицы А. Примечание 1. Если А—линейный оператор в n-мерном пространстве R, то / (А) определяется совершенно так же, как и / (Л): f(A)=r(A), где г (X)—интерполяционный многочлен Лагранжа—Сильвестра для / (к) на спектре оператора А (спектр оператора А определяется минимальным аннулирующим много- многочленом if (Я) оператора А). Согласно этому ^определению, если оператору А отвечает матрица .4=||<ггь||" в некотором базисе пространства, то оператору / (Л) в том же базисе отвечает матрица / (Л). Все утверждения и формулировки этой главы, в которых фигурирует матрица А, остаются в силе и после замены матрицы А оператором А. Примечание 2. Можно определить1) функцию от матрицы / (Л), исходя из характеристического многочлена заменяя им минимальный многочлен -ф (Х)= jj[ (к—кк) h. При этом полагают f(A)=g(A), где g(k)—интерполяционный многочлен степени <ппо то<1Д(Я) для функции / (к) 2). Формулы A6), B2) и B4) заменяются формулами S /(л)= 2 /Шzfti+/' (kk)zk2+... +rh~ (kh)zh ], A6') (kE—A)~1=-^ ^ 3)»1 B4') где Aft(^)= А(Я)П (* = 1, 2, ..., «). Однако в формуле A6') значения /(mft){кк), /(т*+1) {кк), .... 1(п*~1) (кк) входят лишь фиктивно, поскольку из сопоставления B2) с B2') следует: 1 =... =Zknk=O. !) См., например, В. Д. Мак-Ми л л ан, Динамика твердого тела, ИЛ, М., 1951, стр. 403 и далее. 2) Многочлен g(k) не определяется однозначно равенством f{A)=g(A) и усло- условием «степень <п». 3) Частный случай формулы B4'), когда / (X) = kh, иногда называют формулой Перрона [см. [291, стр. 25—27].
124 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V § 6. Применение функций от матрицы к интегрированию системы линейных дифференциальных уравнений с постоянными коэффициентами 1. Рассмотрим сначала систему однородных линейных дифферен- дифференциальных уравнений с постоянными коэффициентами первого порядка: dxi ~~dT~~ -^ = a2lxt + Й22Ж2 + ... -fa- — Oni^i + an2x2 + • • • C8) здесь t—независимое переменное, хг, х2, ..., хп—неизвестные функции переменной t, aik(i, к = 1,2, ..., п)—комплексные числа. Введем в рассмотрение квадратную матрицу А = Цв^Ць составлен- составленную из коэффициентов, и столбцевую матрицу х = (хи х2, ..., хп). Тогда система уравнений C8) может быть записана в виде одного матричного дифференциального уравнения % = А*. C9) Здесь и в дальнейшем под производной от матрицы мы понимаем матрицу, получающуюся из данной путем замены всех элементов их производными. Поэтому -з-— столбцевая матрица с элементами —j-r, Будем искать решение системы дифференциальных уравнений, удо- удовлетворяющее заданным начальным условиям: #1 |<=0 = #10» Х2 |(=о = Жао, . . . , Хп |(=о — Хп0, или в сокращенной записи: х |<=о = х0. D0) Разложим искомый столбец х в ряд Маклорена по степеням t: mhi.a.J. D1) Но из C9) почленным дифференцированием находим: d?x л dx .a dsx . d2x лЛ A Подставляя в C9) и D2) значение ? = 0, получим: • • • х0 = Ах0, х0 = 425г0, ... Теперь ряд D1) запишется так: х = х0 + ^4ж0+-^- А2х0 + ... = еА%. D3)
§ 6] СИСТЕМЫ ЛИНЕЙНЫХ УРАВ. С ПОСТОЯННЫМИ КОЭФФИЦИЕНТАМИ 125 Непосредственной подстановкой в C9) убеждаемся1) в том, что D3) есть решение дифференциального уравнения C9). Полагая в D3) t = 0, найдем: x\t—o = x0. Таким образом, формула D3) дает нам решение данной системы дифференциальных уравнений, удовлетворяющее начальным условиям D0). Положим в A6) f(K) = eu. Тогда [ = !l0»(*)l|i=2(z*i+z, h2 D4) Теперь решение D3) может быть записано в следующей форме: Х± z= 9ll (v Xffl -f- 9l2 (*/ ^20 ~T~ " • • ~T~ Qln (^/ "^TiOi «2-= 921 @ Xl0 + 922 @ ^20 + • • • + 92П (*) ^„o, = 9m (t) xl0 + qn2 (t) X2o+...+qnn (t) D5) здесь xl0, Xzo, ..., xn0—произвольные постоянные, равные начальным зна- значениям неизвестных функций хи х2, ..., Хп- Таким образом, интегрирование данной системы дифференциальных уравнений сведено к вычислению элементов матрицы eAt. Если в качестве начального значения аргумента взять значение t = t0, то формула D3) заменится формулой х = еА('-'°>з:0. D6) Пример. dx2 dx3 Матрица коэффициентов: A= 3 —1 1 2 0 1 1 —1 2 Составим характеристический определитель А (*,)=- 3-Х —1 2 — % 1 1 — 1 2—J Наибольший общий делитель миноров второго порядка этого определителя D% (Я)=1. Поэтому Основная формула: B)Z3. -... =Ле ,At
126 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Возьмем вместо /(Я.) последовательно 1, К—2, (Я—2J. Получим: —Zi+Z3=A—2E = 1 0 0 0 1 0 1 2 1 0 0 1 > 1 —2 — 1 1 1 0 о —1 —1 0 о Определенные отсюда Z1? Zz и Z3 подставляем в основную формулу: 0 — 1 —1 0 1 1 0 0 0 + /B) 1 1 1 0 0 —1 0 0 1 + f B) 1 1 0 —1 —1 0 1 1 0 Заменяя здесь /(Я.) на е**, будем иметь: 0 1 —1 0 1 1 0 0 0 + е2< 1 1 1 0 0 —1 0 0 1 1 1 0 —1 —1 0 1 1 0 Таким образом, где 2. Рассмотрим теперь систему неоднородных линейных дифферен- дифференциальных уравнений с постоянными коэффициентами: n + /2 (t), „ (f), D7) где /j(?) (i = 1,2, ..., n) — непрерывные функции в интервале ?0^?<^1- Обозначая через / (t) столбцевую матрицу с элементами Д (t), fz(t), ..., fn (t) и снова полагая А = || ац ||", мы систему D7) запишем так: ¦^- = 4a; + /(f). D8) Введем вместо х новый столбец неизвестных функций z, связанный с х соотношением x = eAh. D9) Дифференцируя почленно D9) и подставляя полученное выражение для dx -jj в D8), найдем1): dz л.л ^50) См. сноску1) к стр. 125.
§ 6] СИСТЕМЫ ЛИНЕЙНЫХ УРАВ. С ПОСТОЯННЫМИ КОЭФФИЦИЕНТАМИ 127 Отсюда и потому согласно D9) х = eAt Г с + [ e-A*f (т) dx~\= eAtc + \ ел«-*>/ (т) dx; 'о ~" 'о здесь с—столбец с произвольными постоянными элементами. Давая в E2) аргументу t значение t0, найдем: E1) E2) и, следовательно, решение E2) может быть записано так: х = eA^l~t°^Xo -\~ \ eAW~x)f (x) dx. E3) Полагая eAt = || qtj (t) ||™, мы решение E3) можем записать в развер- развернутом виде так: xi — 9u(t~ to) жю + • • • + Чт (t — t0) Хпо + t + I [?u (*-т) Л (т)+ ¦ • • +?i» (t — r)fn (т)] dt, E4) f ~~ ^0/ -^10 ~t" ¦ • ¦ ~T Qnn (* — *o) -^nO ~b t [9m (« -1) Л (T) + ... + qnn (t- T) /„ (X)] dx. h 3. Рассмотрим в качестве примера движение весомой материаль- материальной точки в пустоте вблизи поверхности Земли с учетом движения Земли. В этом случае, как известно2), ускорение точки, относи- относительно Земли определяется постоянной силой веса тд и инерционной кориолисовой силой —2госо X v (v—скорость точки относительно земли, со—постоянная угловая скорость земли) 3). Поэтому дифференциальное уравнение движения точки имеет вид dv E5) г) Как уже указывалось для частного случая (сы. сноскух) к стр. 118), если дана матричная функция от скалярного аргумента ?(т)=||Ьгд(т) || (i = l, 2, ..., го; к—1, 2, ..., п; <!¦ образом: (г )> то интеграл \ В (т) dx определяется естественным «2 bik(x)dx\\ (? = 1, 2, ...,го; fc=l, 2, ...,п). II B(x)dx= 2) См., например, Г. К. Суслов, Теоретическая механика, Гостехиздат, 1944, стр. 141. 3) Здесь жирные' буквы означают векторы, а символ « х » означает векторное умножение.
128 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Определим линейный оператор А в трехмерном евклидовом пространстве равенством Ах= —2юхж E6) и напишем вместо E5): ^ E7) Сопоставляя E7) с D8), легко найдем по формуле E3): t v=eAtv0+\eAtdt-g (vo=vt==o). Интегрируя почленно, определим радиус-вектор движущейся точки: t t t r=ro+ f ^dt vo+ \dt [ ^dt g, E8) где m=»*fc=o и ®о=»*=о- Подставляя вместо §At сумму ряда и заменяя оператор А его выражением из E6), будем иметь: —<о X («0*2+-| б'*3) +« X [ ю X 0- vofi+^ Считая угловую скорость <в малой величиной (для Земли <вяв7,3-10-5 1/сек.) и отбрасывая члены, содержащие вторую и высшие степени <в, мы для дополни- дополнительного отклонении точки, вызванного вращением Земли, получим приближенную формулу , Возвращаясь к точному решению E8), вычислим ел*. Предварительно уста- установим, что минимальный многочлен оператора А имеет вид Действительно, из E6) находим: А2ав=А@ X (ю Хж)=4 (сода) со—4(й2ж, Asm>=—2axAix=8ai (сохж). Отсюда ,и из E6) следует, что операторы Е, А, А2 линейно независимы, а Минимальный многочлен ty(A.) имеет простые корни 0, 2<ui, —2of. Интерполя- Интерполяционный многочлен Лагранжа для eAt имеет 1-1 2ю ^ 4gj2 Тогда
§ б] СИСТЕМЫ ЛИНЕЙНЫХ УРАВ. С ПОСТОЯННЫМИ КОЭФФИЦИЕНТАМИ 129 Подставляя это выражение для е^1 в E8) и заменяя оператор Л его выражением из E6), найдем: *2 /'I—cos2©< 2юг—sin2cot —шх^—зр "о+ ^ <—sin2w< , — l+2wz<2+cos2w< N 1 ,_.. " +?О)\ E9) Рассмотрим частный-случай vo=O. Тогда, раскрывая тройное векторное про- произведение1,) получим: 2 2ю<—sin2w«, ч cos2w<—1 где ф-—географическая широта в данном месте земли. Член 4w3 представляет собой отклонение, направленное перпендикулярно к плоскости мери- меридиана на восток, а последнее слагаемое в правой части последней формулы дает отклонение, лежащее в плоскости меридиана и направленное от земной оси (пер- (перпендикулярно к ней). 4. Пусть теперь дана следующая система линейных дифференциаль- дифференциальных уравнений второго порядка: 4~ аи%1 -\~ а12ж2 ~~Ь • • • + aln%n = О, dp • • • + а2пхп = 0, F0) где a,ik(i, к= 1, 2, ..., п) — постоянные коэффициенты. Вводя снова столбец х = (хъ х2, ..., хп) и квадратную матрицу А = || aik||", мы перепишем систему F0) в матричном виде d& Рассмотрим сначала случай, когда |4|=^=0. Если п = 1, т. е. х и Л —скаляры и АфО, общее решение уравнения F0) может быть записано в виде /их' где х0 = Xt—Q и Хо = Непосредственной проверкой убеждаемся, что F1) представляет собой решение уравнения F0) при любом п, когда х — столбец, а А — неособенная квадратная матрица2). При этом мы опираемся на фор- формулы 21 "*' F2) х) По формуле »Х (Ьх с)=6(ас)—с{аЬ)\ при этом следует учесть, ?то вектор д направлен к центру Земли, откуда ад=—cog sin ф.—Прим. ред. _ 2) Под ~[/А мы здесь понимаем произвольную матрицу, квадрат которой равен А. заведомо существует при | А \ ф 0 (см. стр. 120). 9 Ф. Р. Гантмахер
130 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Формула F1) охватывает все решения системы F0) или F0'), • поскольку начальные значения х0 и х0 могут быть выбраны произвольно. В формулах F2) правые части имеют смысл и при [ А | = 0. Поэтому F1) представляет собой общее решение данной системы дифференциальных уравнений и в случае, когда | А | = 0, если только под функциями cos(\^At) и (\fAY1 s\n{VAt), входящими в состав этого выражения, понимать правые части формул F2). Предоставляем читателю проверить, что общее решение неоднород- неоднородной системы g F3) удовлетворяющее начальным условиям xt=o — х0 и (~^г ) =х0, может быть записано в виде х = cos (YA t) xo + (V^Y1 sin (]/~A t) x0 -f sin [V A (t - t)] / (t) dx. F4) о Если в качестве начального момента времени берется t = t0, то в формулах F1) и F4) следует заменить cos (]/At) и sin (]/At) t t на cosYA(t—10) и sinY A (t — t0), a \ на \ . 0 to § 7. Устойчивость движения в случае линейной системы Пусть хи хг, ..., хп—параметры, характеризующие отклонение «воз- «возмущенного» движения данной механической системы от исследуемого движениях), и пусть эти параметры удовлетворяют системе дифференци- дифференциальных уравнений первого порядка: -^f- = fi(xt, х2, ..., xn,t) (г = 1, 2, ..., п); F5) здесь независимое переменное t — время, правые части ft (хи хг, ..., хп, t) — непрерывные функции в некоторой области значений хъ хг, ..., хп (содер- (содержащей точку Ж! = 0, ж2 = 0, ...,хп = 0) при всех t^>to (t0 — начальный момент времени). Введем определение устойчивости движения по Ляпунову2). Исследуемое движение называется устойчивым, если для любого числа е > 0 можно указать число б > 0 такое, что при любых началь- начальных (при t = t0) значениях параметров xw, xw, .. ¦, хп0, меньших по мо- модулю числа 6, параметры хи хг, .. ., хп во все время движения {t> t0) по модулю меньше е, т. е. для любого е > 0 можно указать такое 6 > О, что из |а*о1<в (»=1, 2, ...,/г) F6) х) В этих параметрах исследуемое движение характеризуется постоянными нулевыми значениями 2:1=0, Х2=0, ...,хп=0. Поэтому при математической трак- трактовке вопроса говорят об устойчивости нулевого решения системы дифференциаль- дифференциальных уравнений F5). 2) См. [22] стр. 13; [38], стр. 10—11 иди [23], стр. 11 — 12.
§ 7] УСТОЙЧИВОСТЬ ДВИЖЕНИЯ В СЛУЧАЕ ЛИНЕЙНОЙ СИСТЕМЫ 131 следует: |s,(*)|<e (t>t0). F7) Если при этом дополнительно при некотором 60 > 0 всегда Пш ж; (t) = О + (г = 1, 2, ...,п), коль скоро |xio|<;6o (J'=l, 2, ...,п), то исследуемое движение называется асимптотически устойчивым. Рассмотрим теперь линейную систему, т. е. тот частный случай, когда система F5) является системой линейных однородных дифферен- дифференциальных уравнений п *H-=2iPik(t)xh, F8) F8') где pth(t) — непрерывные функции при <>?0 (i, k = l, 2, ...,п). В матричной записи система F8) запишется так: здесь х-—столбцевая матрица с элементами xt, x2, ...,xn, a P(t) = — II Pih (t) l|" — матрица коэффициентов. Обозначим через Qij (t), qZj it), ..., qnj (t) (/=1,2,..., n) F9) n линейно независимых решений системы F8)*). Матрицу Q(t) — \\д^ ||™, столбцами которой являются эти решения, называют интегральной мат- матрицей системы F8). Произвольное решение системы линейных однородных дифференци- дифференциальных уравнений получается как линейная комбинация с постоянными коэффициентами из п линейно независимых решений: п или в матричной записи: x = Q(t)c, G0) где с—столбцевая матрица, элементами которой являются произвольные постоянные си с2, ..., сп. Выберем теперь специальную интегральную матрицу, для которой Q{to)^E; G1) другими словами, при выборе п линейно независимых решений F9) будем исходить из следующих специальных начальных условий2): Тогда, полагая в формуле G0) t = t0, из G1) найдем: хо = с, х) Здесь второй индекс /' обозначает номер решения. 2) Любые начальные условия определяют, и притом одно.значно, некоторое- решение данной системы. 9*
132 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V и потому формула G0) примет вид x = Q(t)x0, G2) или в развернутом виде xi = 2 qti (t) Xj0 (i = i, 2, ..., n). G2') i=l Рассмотрим три случая: 1. Q(t) — ограниченная матрица в интервале (t0, + оо), т. е. суще- существует такое число М, что \qij(t)\<M (t>t0; i,/ = l, 2,...,n). В этом случае из G2') следует: I #i (t) | <I пМ max | xj01. Условие устойчивости выполняется. ( Достаточно в F6), F7) взять 6 < —^гг . Л Движение, характеризуемое нулевым решением ж4 = 0, х% = 0,... ..., Хп = 0, устойчиво. 2. lim <? (t) = 0. В этом случае матрица Q (t) ограничена в интервале (t0, -f oo), и потому, как уже было выяснено, движение устойчиво. Кроме того, из G2) следует, что lim х (t) = 0 при любом Xq. Движение асимптотически устойчиво. 3. Q(t) — неограниченная матрица в интервале (t0, + оо). Это озна- означает, что по крайней мере одна из функций qij(t), например ghh(t), не ограничена в интервале (t0, оо). Возьмем начальные условия ж10 = 0, ... ..., хкофО, ..., хп0 = 0. Тогда Каким бы малым по модулю ни было х^, функция xh(t) будет не огра- ограничена. Условие F7) не будет выполняться ни при одном 6. Движение неустойчиво. Рассмотрим теперь частный случай, когда коэффициенты в системе F8) — постоянные числа: P(f) = P = const. G3) В этом случае (см. § 5) х = ер('-'о)хо. G4) Сопоставляя G4) с G2), находим, что в данном случае ?(*) = eP(*-<o). G5) Обозначим через минимальный многочлен матрицы коэффициентов Р. Для исследования интегральной матрицы G5) воспользуемся фор- формулой A6) на стр. 111. В данном случае / (X) = е% (*.-*о) (t рассматривается
§ 7] УСТОЙЧИВОСТЬ ДВИЖЕНИЯ В СЛУЧАЕ ЛИНЕЙНОЙ СИСТЕМЫ 133 как параметр), /О") (kh) = (t — to)k%^ ('~'о). Формула A6) дает: ер (*-ад = 2 [Zhl + Zla(t-to)+...+ Zhm. (t - t^k-1] Л (*-'0)- G6) Рассмотрим три случая: 1. ReXft^O (A=i, 2, ...,s), причем для тех Xft, для которых Re Xh = 0, соответствующее mft = 1 (т. е. чисто мнимые характеристические числа являются простыми корнями минимального многочлена). 2. ReXft<0 (A=l, 2, ..., s). 3. При некотором к имеем ReXft>0 либо Re Kk = 0, но /% > 1. Из формулы G6) следует, что в случае 1 матрица <? (t) = ep (*-*о) ограничена в интервале (t0, -f- °°)j в случае 2 ер (*-*о) —> 0 при ? —> + °° и в случае 3 матрица еР(*~*°) не ограничена в интервале (t0, -)-oo). Здесь особого рассмотрения требует лишь тот случай, когда в выражении G6) для ep^t~t°^ имеется несколько слагаемых максимального роста (при t—»-+оо), т.е. с максимальным ReA.fc=Oo!>0 и (при данном Re Я.д=а0) с максимальным значе- значением го^=го0. Тогда выражение G6) можно представить в виде ] G7) где plt p2i--чРг—различные вещественные числа, а (>К) обозначает матрицу, стремящуюся к нулю при (—>- +00- И3 этого представления вытекает, что матрица г еР (*-*о) не ограничена при ао+гоо—1>01), поскольку матрица 2 не может стремиться к нулю при *—>- +со. В последнем мы убедимся, если дока- докажем, что функция где Cj—комплексные числа, a Pj—вещественные и различные между собой числа, может стремиться к нулю при t—>- -j-co только в случае /(<) sO. Но, действительно, 770= 2 cje-W. G8') Перемножая почленно равенства G8) [и G8') и интегрируя по t в пределах от О до Т, получим: т г тПш^ -I J | / (f) |2 dt= ^ I cj |". G9) Но из lim / (t) =0 вытекает, что и t->+oo ± lim -i \ |/(i)|»df=O. Поэтому из равенства G9) находим, что с1=с2= ... =сг=0, т. е. |(() = 0. Поэтому в случае 1 движение (ж4 = 0, х2 = 0, ..., хп = 0) устойчиво, в случае 2 — асимптотически устойчиво и в случае 3 — неустойчиво. Иначе говоря, при ао>О либо при ао=О, но гоо>1. —Прим. ред.
134 ФУНКЦИИ ОТ МАТРИЦЫ [ГЛ. V Результаты исследования могут быть сформулированы в виде следую- следующей теоремы1): Теорема 3. Нулевое решение линейной системы F8) при Р — const является устойчивым по Ляпунову, если 1) все характеристические числа матрицы Р имеют отрицательные или нулевые вещественные части, 2) все характеристические числа с нулевыми вещественными частями, т. е. чисто мнимые характеристические числа {если таковые имеются), являются простыми корнями минимального многочлена матрицы Р, и неустойчивым, если хотя бы одно из условий 1), 2) не выполняется. Нулевое решение линейной системы F8) является асимптотически устойчивым в том и только в том случае, когда все характеристиче- характеристические числа матрицы Р имеют отрицательные вещественные части. Приведенные выше соображения позволяют высказать суждение о характере интегральной матрицы ер('~'о) в общем случае при произволь- произвольных характеристических числах постоянной матрицы Р. Теорема 4. Интегральная матрица ер('-'о) линейной системы E8) при Р = const всегда представима в виде t), (80) где 1) lim Z_(?) = 0, 2) Zo(t) либо = const, либо является ограничен- ной матрицей в интервале (t0, + оо), не имеющей предела при t-^ + оо, 3) Z+ (t) либо = 0, либо является неограниченной матрицей в интервале (t0, + со). Доказательство. Разобьем в правой части равенства G6) все т слагаемых на три группы. Обозначим через Z-(t) сумму всех слагаемых, содержащих множитель e%h(t~t}^ с ReXfc<0. Через Zt (t) обозначим сумму слагаемых, у которых либо Re Kh > 0, либо Re k^ — 0 при наличии мно- множителя (t — to)v при v >> 0. Через Zo (t) обозначим сумму всех остальных слагаемых. Приведенные ранее соображения показывают, что lim Z_(?)=0, а функция Z+(t) не ограничена, если только она не равна тождественно нулю. Функция же Zo (t) ограничена. Покажем, что из существования предела lim Zo (t) = В следует, что Zo (t) = const. Действительно, разность Zo (t) — В может быть представлена в виде суммы 2 ^йдаое из Равен~ i=i ства G7). Относительно же суммы такого вида выше было показано, что она может иметь предел 0 при t—> + оо лишь тогда, когда она тожде- тождественно равна нулю. Теорема 4 доказана. х) О том, как уточняются критерии устойчивости и неустойчивости для лине- линеаризованных систем (т. е. нелинейных систем, становящихся линейными после пре- пренебрежения нелинейными членами), см. далее в гл. XIV, § 3.
ГЛАВА VI ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ. АНАЛИТИЧЕСКАЯ ТЕОРИЯ ЭЛЕМЕНТАРНЫХ ДЕЛИТЕЛЕЙ Первые три параграфа настоящей главы посвящены учению об экви- эквивалентности многочленных матриц. На основе этого в последующих трех параграфах строится аналитическая теория элементарных делителей, т. е. теория приведения постоянной (немногочленной) квадратной матрицы А к нормальной форме А (А = ТАТ~г). В последних двух параграфах главы даны два метода построения преобразующей матрицы Т. § 1. Элементарные преобразования многочленной матрицы Определение 1. Многочленной матрицей или к-матрицей назы- называется прямоугольная матрица А {к), элементы которой суть многочле- многочлены от к: Z\\ 2, \\\\ Г); здесь I — наибольшая из степеней многочленов aih(k). Полагая А;Н1«$Ц (i = l,2, ...,m; к = 1,2, ...,п; / = 0, 1, ...,*), мы можем представить многочленную матрицу А (к) в виде матричного многочлена относительно к, т. е. в виде многочлена с матричными коэф- коэффициентами: Введем в рассмотрение следующие элементарные операции над много- многочленной матрицей А (к): 1° Умножение какой-либо, например i-й, строки на число с^=0. 2° Прибавление к какой-либо, например t-й, строке другой, например /-й, строки, предварительно умноженной на произвольный много- многочлен Ъ (к). 3° Перестановка местами любых двух строк, например t-й и /-й строк. Предлагаем читателю проверить, что операции 1°, 2°, 3° равносильны умножению многочленной матрицы А (к) слева соответственно на
136 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI следующие квадратные матрицы порядка т1): (О s' = 1 о 1 о ...(О A) S'" = 1 О (О (/) 1 .'О ..." О ... 1 ... . . . 1 . . .0. . . о т. е. в результате применения операций 1°, 2°, 3° матрица А (К) преоб- преобразуется соответственно в матрицы S'-A (Я), S"-А (К), S"'-А (К). Поэтому операции типа 1°, 2°, 3° называются левыми элементарными операциями. Совершенно аналогично определяются правые элементарные операции над многочленной матрицей (эти операции производятся не над строками, а над столбцами мног^ленной матрицы) и соответствующие им матрицы (порядка пI): 7" = 1 0 .@. г= о 1. . ЦК) • ¦¦(*¦) • ¦¦0)' 1) В матрицах A) все неотмеченные элементы на главной диагонали равны единице, а в остальных местах—нулю.
§ 1] ЭЛЕМЕНТАРНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННОЙ МАТРИЦЫ 137 В результате применения правой элементарной операции матрица- А (Я) умножается справа на соответствующую матрицу Т. Матрицы типа S', S", S'" (или, что то же, типа 7", Т", 7"") мы будем< называть элементарными матрицами. Определитель любой элементарной матрицы не зависит от Я. и отличев от нуля. Поэтому для каждой левой (правой) элементарной операции существует обратная операция, которая также является левой (соответ- (соответственно правой) элементарной операцией 1). Определение 2. Две многочленные матрицы А (Я.) и В (К) называются 1) левоэквивалентными, 2) правоэквивалентными, 3) эквива- эквивалентными, если одна из них получается из другой путем применения соответственно 1) левых элементарных операций, 2) правых элементарных операций, 3) левых и правых элементарных операций2). Пусть матрица В (Я.) получается из A (fr) при помощи левых элемен- элементарных операций, соответствующих матрицам Si, S2, • • ., Sp. Тогда = SpSp_l...S1A(k). B). Обозначая через Р (к) произведение SpSp-i . . . Si, мы равенство B} запишем в виде где Р (К), как и каждая из матриц Si, S2, • ¦ ., Sp, имеет отличный от ну- нуля постоянный3) определитель. В следующем параграфе будет доказано, что каждая квадратная Я,-матрица Р (Я) с постоянным отличным от нуля определителем может быть представлена в виде произведения элементарных матриц. Поэтому равенство C) эквивалентно равенству B) и потому означает левую экви- эквивалентность матриц А (Я.) и В (Я.). В случае правой эквивалентности многочленных матриц А (Я.) и В (Я.) вместо равенства C) будем иметь равенство *) Отсюда следует, что если матрица В (К) получается из А (К) путем примене- применения левых (правых; левых и правых) элементарных операций, то и обратно матрица А (К) может быть получена из В (К) путем применения элементарных операций такого- же типа. Как левые элементарные операции, так и правые образуют группу. 2) Из определения следует, что левоэквивалентными, правоэквивалентными или» просто эквивалентными могут быть только прямоугольные матрицы одинаковых размеров. 3) То есть не зависящий от Я,.
138 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI ¦а в случае (двусторонней) эквивалентности — равенство C") здесь опять Р (к) и Q (к) — матрицы с отличными от нуля и не завися- зависящими от к определителями. Таким образом, определение 2 можно заменить равносильным опре- определением. Определение 2'. Две прямоугольные ^.-матрицы А (к) и В (к) называются 1) левоэквивалентными, 2) правоэквивалентными, 3) эквива- эквивалентными, если соответственно 1) В(к) = Р (к) А (к), 2) В(Ц = А (к) Q (к), 3) В (к) = Р{к) А (к) Q {к), где Р (к) и Q (к) — многочленные квадратные матрицы с постоянными и отличными от нуля определителями. Все введенные выше понятия проиллюстрируем на следующем важ- важном примере. Рассмотрим систему т линейных однородных дифференциальных уравнений l-то порядка с п неизвестными функциями хи хг, . . ., хп аргумента t с постоянными коэффициентами: «и (D) а* + а12 (D)x2+...+ aln(D)хп = О, a2i (Z)) xt -J- а22 (D) х2 -j- ... -\- а2п (D) хп = О, aml (D)Xi + am2 (D) x2 + ... + amn (D) xn = 0; здесь ¦a» (D) = ($Dl 4 e$D1-1 + ... + a|J> (i = 1, 2, ..., m; к = 1, 2, ..., n) ¦— многочлен относительно D с постоянными коэффициентами, D — -jt — оператор дифференцирования. Матрица операторных коэффициентов A(D) = \\aik(D)\\ (i = i, 2, .... m; ft = i, 2, ...,n)l является многочленной матрицей или D-матрицей. Очевидно, что левая элементарная операция 1° над матрицей A (D) означает почленное умножение i-ro дифференциального уравнения системы на число с ф 0. Левая элементарная операция 2° означает почленное прибавление к i-му уравнению /-го уравнения, предварительно подверг- подвергнутого дифференциальной операции Ъ (D). Левая элементарная операция 3° означает перестановку местами i-ro и /-го уравнений. Таким образом, если в системе уравнений D) матрицу операторных коэффициентов A (D) заменить левоэквивалентной ей матрицей В (D), то мы получим новую систему уравнений. Поскольку, обратно, исходная система может быть получена из этой системы при помощи аналогичных операций, то обе системы уравнений равносильные г). Нетрудно проинтерпретировать на данном примере и правые элемен- элементарные операции. Первая из этих операций означает введение вместо -1) При этом принимается, что искомые функции х\, 3%, . . ., хп таковы, что про- производные от этих функций всех порядков, которые встречаются при преобразованиях, «уществуют. Тогда две системы уравнений с левоэквивалентными матрицами A (D) и В (D) имеют одни и те же решения.
2] КАНОНИЧЕСКИЙ ВИД ^.-МАТРИЦЫ 139 одной из неизвестных функций Ж; новой неизвестной функции х\ = —хг; вторая элементарная операция означает введение новой неизвестной •функции x'j = Xj — Ъ (D) xt (вместо ж,); третья операция означает пере- перемену местами в уравнениях членов, содержащих xt и xj (т. е. xt = х), х} = х\). § 2. Канонический вид ^,-матрицы 1. Выясним сначала, к какому сравнительно простому виду можно привести прямоугольную многочленную матрицу А (к) путем применения одних только левых элементарных операций. Допустим, что в первом столбце матрицы А (к) имеются элементы, не равные тождественно нулю. Возьмем среди них многочлен наимень- наименьшей степени и путем перестановки строк сделаем его элементом ап (к). После этого разделим многочлен а.ц на а41 (к); частное и остаток обозна- обозначим через да (Л) и га (к) аи (Я) = fin (к) да (к) + ги (к) (i = 2, .... те). Вычтем теперь из i-й строки первую строку, предварительно умноженную на gtl (к) (i = 2, . . ., т). Если при этом не все остатки rtl (к) равны тождественно нулю, то тот из них, который не равен нулю и имеет наи- наименьшую степень, может быть перестановкой строк поставлен на место йц (к). В результате всех этих операций степень многочлена ап (К) пони- понизится. Теперь мы снова повторим этот процесс и т. д. Так как степень много- многочлена ап (К) конечна, то на некотором этапе этот процесс уже нельзя будет продолжить, т. е. на этом этапе все элементы a2i (к), asl (к), . . . ¦ - •> о-т\ (к) окажутся равными тождественно нулю. После этого возьмем элемент а22 (к) и применим ту же процедуру к строкам с номерами 2, 3, . . ., т. Тогда добьемся того, что и a3Z (Я)= . . . . - .= ат2 (к) — 0. Продолжая так далее, мы в конце концов приведем матрицу А (к) к следующему виду: bn (к) 0 0 biz (Я) b22 (к) 0 ... ьш(к) • ¦ ¦ b2m (к) ¦ ¦ ¦ 6mm (к) ... btn{k) ...Ьгп(к) • • • bmn(к) bn (к) 0 0 0 0 bl2(k) 0 0 0 ...bln(k) ... b2n(k) ... bnn(k) ... 0 ... 0 E) Если многочлен Ъ22 (к) не равен тождественно нулю, то, применяя левую элементарную операцию второго типа, мы сделаем степень эле- элемента Ь12 (к) меньшей, нежели степень Ъ22 (к) (если Ъ22 (к) имеет нулевую степень, то bl2 {к) станет тождественно равен нулю). Точно так же, если Ь33 (к) ф 0, то при помощи левых элементарных операций второго типа мы сделаем степени элементов Ь13 (.к), Ь23 (к) меньшими, нежели степень *зз (^)i не изменив при этом элемента Ь12 (к), и т. д. Мы установили следующую теорему:
140 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. Теорема 1. Произвольная прямоугольная многочленная матрица с размерами т X п при помощи левых элементарных операций всегда может быть приведена к виду E), где многочлены blk (к), b2k (к), • • • . . ., bk-lik (к) имеют меньшую степень, нежели bkk (к), если только bhk (Я) Ф 0, и все равны тождественно нулю, если bkk (к) = const ф О (к = 2, 3, . . ., min (т, n)). Совершенно аналогично доказывается Теорема 2. Произвольная прямоугольная многочленная матрица с размерами т X п при помощи правых элементарных операций всегда может быть приведена к виду Си (Я) С21 (к) Cml (к) 0 ... С22(к) ... cmZ{k)... (m< 0 0 Стт \к) п) о... 0 ... 0 ... и 0 0 Си С21 'сп1 cml (к) (к) (к) (к) 0 Cnzd) cm2 (к) ... 0 ... 0 . ¦:¦ cnil (к) ¦ ¦ ¦ С,пп (к) F) где многочлены сы (к), с^2 (к), . . ., с^^-х (к) имеют меньшую степень,, нежели с^н (к), если только chh(k)=?O, и все равны тождественно нулю, если chu (k) = const Ф 0 (к ~ 2, 3, . . ., min (m, n)). 2. Из теорем 1 и 2 вытекает следующее Следствие. Если определитель квадратной многочленной матрицы Р (к) не зависит от к и отличен от нуля, то эту матрицу можно представить в виде произведения конечного числа элементарных матриц. Действительно, согласно теореме 1 матрицу Р (к) при помощи левых элементарных операций можно привести к виду Ъи(Ц bl2(k) ... bin() О Ь22 (к) ... Ьщ (к) G) 0 0 ...Ьпп(к) где п — порядок матрицы Р (к). Так как при применении элементарных операций к квадратной многочленной матрице определитель этой матрицы умножается лишь на постоянный отличный от нуля множитель, то опре- определитель матрицы G), как и определитель Р (к), не зависит от Я, и отли- отличен от нуля, т. е. Ьц (к) Ь22 (к) ... Ьпп (к) = const ф 0. Отсюда bhh (к) = const ^=0 (fc= I, 2, ..., п). Но тогда в силу той же теоремы 1 матрица G) имеет диагональный вид II bhtfiih ИГ и потому может быть приведена при помощи левых элементар- элементарных операций типа 1° к единичной матрице Е. Тогда и обратно, единич- единичную матрицу Е можно привести к Р (к) при помощи левых элементарных операций с матрицами Si, S2, . . ., Sp. Следовательно, Р (к) = SpSp^ ... SiE = SpSp^ ... iSj, Из доказанного следствия получаем (см. стр. 137 — 138} равносильность двух определений 2 и 2' эквивалентности многочленных матриц.
«2] КАНОНИЧЕСКИЙ ВИД ^.-МАТРИЦЫ 141 3. Вернемся к нашему примеру системы дифференциальных уравне- уравнений D). Применим теорему 1 к матрице операторных коэффициентов •II aik (D) ||. Тогда, как было указано на стр. 138, система D) заменится равносильной системой bu (D) x, + ba (D) x2 + ... + bls (D) xs = = — К s+1 (D) xs+1 — ... — bln (D) xn, ba(D)xz+...+b2e(D)x.= = — b2j s+1 (D) xs+1 — ... xn, xs=— Z (D) xs+l - D') тде s = min (m, n). В этой системе мы функции a;s+1, . . ., х^ можем выбрать произвольно, после чего последовательно определятся функции jcs, xs-u . . ., Xi, причем на каждом этапе этого определения приходится интегрировать одно дифференциальное уравнение с одной неизвестной функцией. 4. Перейдем теперь к установлению «канонического» вида, к кото- которому можно привести прямоугольную многочленную матрицу А. (К), при- тиеняя к ней как левые, так и правые элементарные операции. Среди всех не равных тождественно нулю элементов aik (К) мат- матрицы А (К) возьмем тот элемент, который имеет наименьшую степень относительно Я, и путем соответствующей перестановки строк и столбцов ¦сделаем его элементом Оц (К). После этого найдем частные и остатки от деления многочленов ati (к) и alk (К) на ап (К): ац (Я) = аи (К) ди (К) + rti (К), aih (К) = ап (К) qlk (К) + rlh (Ц (г = 2, 3, ...,т; к = 2, 3, ..., п). Если хотя бы один из остатков гн (К), rlk (к) (i = 2, . . ., т; к = = 2, . . ., п), например rik (К), не равен тождественно нулю, то, вычи- вычитая из к-то столбца первый столбец, предварительно помноженный на gift (к), мы заменим элемент alh (К) остатком rik (к), который имеет меньшую степень, нежели ац (к). Тогда мы имеем возможность снова уменьшить степень элемента, стоящего в левом верхнем углу матрицы, поместив на это место элемент с наименьшей степенью относительно "к. Если же все остатки r2i (к), . . ., rmi (к); г12 (к), . . ., гы (к) равны тождественно нулю, то, вычитая из г-й строки первую, помноженную предварительно на qti (к) (i = 2, . . ., m), а из fc-ro столбца — первый, предварительно помноженный на q^ (к) (к = 2, . . ., п); мы приведем нашу многочленную матрицу к виду ап{к) 0 ... О О «и(к) ... a^ik О ом @) ... атп (к) Если при этом хотя бы один из элементов ащ (к) (i = 2, . - ., т; к = 2, . . ., п) не делится без остатка на ап (к), то, прибавляя к первому ¦столбцу тот столбец, который содержит этот элемент, мы придем к пре- предыдущему случаю и, следовательно, снова сможем заменить элемент «и (к) многочленом меньшей степени.
142 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI Поскольку первоначальный элемент alt (к) имел определенную степень и процесс уменьшения этой степени не может неограниченно продол- продолжаться, то после конечного числа элементарных операций мы должны получить матрицу вида ах(к) О ... О О Ъп(%) ... ЬгпСк 0 bm2(k) ...bmn(k) в которой все элементы bih (к) делятся без остатка на й4 (к). Если среди этих элементов bth (к) имеются не равные тождественно нулю, то, про- продолжая тот же процесс приведения для строк с номерами 2, . . ., т и столбцов с номерами 2, . . ., п, мы матрицу (8) приведем к виду at(k) О 0 ... О О а2(к) О ... О О 0 с33(к) ... сзп(к) О 0 стз(к) ... стп(к) где а2 (к) делится без остатка на ах (к), а все многочлены с^ (к) делятся без остатка на а2 (к). Продолжая этот процесс далее, мы в конце концов придем к матрице вида <ц(к) О ... О 0 ... О О а2(к) ... О 0 ... О (9), 0 0 0 0 . 0 . 0 . .. as (к) .. 0 .. 0 0 ... 0 ... 0 ... 0 0 0 где многочлены at (к), а2 (к), . . ., as (к) (s < m, n) не равны тождественно нулю и каждый из них делится без остатка на предыдущий. Помножая первые s строк на соответствующие отличные от нуля числовые множители, мы сможем добиться того, чтобы старшие коэффи- коэффициенты многочленов at (к), а2 (к), . . ., as (к) были равны единице. Определение 3. Многочленная прямоугольная матрица назы- называется канонической диагональной, если она имеет вид (9), где 1) много- многочлены at (k), а2 (к), . . ., as (к) не равны тождественно нулю и 2) каждый из многочленов а2 (к), . . ., as (к) делится без остатка на предыдущий. При этом предполагается, что старшие коэффициенты всех многочленов «1 (к), а2 (к), . . ., as (к) равны единице. Таким образом, мы доказали, что произвольная прямоугольная мно- многочленная матрица А (к) эквивалентна некоторой канонической диаго- диагональной. В следующем параграфе мы покажем, что многочлены 0-\ (к), а2(к), . . ., as (к) однозначно определяются заданием матрицы А (к), и установим формулы, связывающие эти многочлены с элементами матрицы А (к).
§ 3] ИНВАРИАНТНЫЕ МНОГОЧЛЕНЫ И ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 143 § 3. Инвариантные многочлены и элементарные делители многочленной матрицы 1. Введем понятие об инвариантных многочленах ^.-матрицы А (К).- Пусть многочленная матрица А (к) имеет ранг г, т. е. в этой матрице имеются не равные тождественно нулю миноры r-го порядка, в то время как все миноры порядка > г тождественно относительно к равны нулю. Обозначим через Dj (к) наибольший общий делитель всех миноров j'-to- порядка матрицы А (к) (/ = 1, 2, . . ., г)'1). Тогда, как нетрудно видеть, в ряду Dr (к), TV* (к), ...,?>! (к), Do (к) = 1 каждый многочлен делится без остатка на последующий 2). Соответствую- Соответствующие частные обозначим через i4 (к), i2 (к), . . ., ir (к): Определение 4. Многочлены i4 (Я.), i2 (к), . . ., ir (к), опре- определяемые формулами A0), называются инвариантными многочленами прямоугольной матрицы А (к). Термин «инвариантные многочлены» связан со следующими сообра- соображениями. Пусть А (к) и В (к) — две эквивалентные многочленные мат- матрицы. Тогда они получаются друг из друга при помощи элементарных операций. Но нетрудно непосредственно проверить, что элементарные опе- операции не"изменяют ни ранга г матрицы А (к), ни самих многочленов Dt (к), D2 {к), . . ., DT (к). Действительно, применяя к тождеству C") формулу, выражающую минор произведения матриц через миноры сомно- сомножителей (см. стр. 22), мы для произвольного минора матрицы В (к) полу- получим выражение h /2 ...М /aia2...ap> \ /р, р2...рр ...рр\ (р = 1, 2, ..., min (m, n)). Отсюда следует, что все миноры порядка > г матрицы В (к) равны нулю и, следовательно, для ранга г* матрицы В (к) имеем: Кроме того, из этой же формулы вытекает, что D% (к) — наибольший общий делитель всех миноров р-то порядка матрицы В (к) — делится на Dp (к) нацело (р = 1, 2, . . ., min (m, n)). Но матрицы А (к) и В (к} можно поменять ролями. Поэтому г < г*, и Dp (к) делится без остатка на Dp (к) (р = 1, 2, . . ., min (m, n)). Отсюда 3) г = г*, Р*(к) = Dx (к), ?>* (к) = D2 (к), ...,D*(k) = Dr (к). х) В каждом Dj (К) берем старший коэффициент равным единице. 2) Если к какому-нибудь минору /-го порядка применить разложение Безу по элементам какой-либо строки, то каждое слагаемое в этом разложении будет делить- делиться на Z>j_j (Я,); следовательно, любой минор j'-ro порядка, а тщачит и Dj (%), делится на Dj_t (К) (/ = 2, 3, . . ., г). 3) Старшие коэффициенты у Dv t%) и Dp (К) (р = 1, 2, . . ., /•)" равны единице.
144 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI Поскольку элементарные операции не меняют многочленов Dt (X),D2(k),... ..., Dr (Я), то они не изменяют и многочленов i± (Я), i2 (Я), . . ., ir (К), определяемых формулами A0). Таким образом, многочлены it (Я), i2 (Я,), . . ., ir (Я) остаются неиз- неизменными, инвариантными при переходе от одной матрицы к дру- другой, ей эквивалентной. Если многочленная матрица имеет канонический диагональный вид (9), то, как нетрудно видеть, для этой матрицы А (Я) = «ц (Я), ?>2 (Я) = а, (Я) а2 (Я), ..., Dr (Я) = а, (Я) а2 (Я) ... аг (Я). Но тогда в силу соотношений A0) диагональные многочлены в (9) щ (Я), а2 (Я), . . ., ат (Я) совпадают с инвариантными многочленами Ч (Я) = ат (Я), 12 (Я) = аг_! (К) ir (Я) = ах (Я). (И) Здесь it (Я), i2 (Я), . . ., ir (Я) являются одновременно и инвариантными многочленами исходной матрицы А (Я), поскольку эта матрица эквива- эквивалентна матрице (9). Полученные результаты мы можем сформулировать в виде следую- следующей теоремы. Теорема 3. Многочленная прямоугольная матрица А (К) всегда зквиеалентна канонической диагональной матрице A2) При этом здесь обязательно г — ранг, а ц (Я), i2 (К), . . ., ir (Я) — инва- инвариантные многочлены матрицы А (Я), определяемые формулами A0). Следствие 1. Для того чтобы две прямоугольные матрицы одинаковых размеров А (К) и В (Я) были эквивалентны, необходимо и доста- достаточно, чтобы они имели одни и те же инвариантные многочлены. Действительно, необходимость этого условия была выяснена выше. Достаточность следует из того, что две многочленные матрицы, имеющие одни и те же инвариантные многочлены, эквивалентны одной и той же канонической диагональной матрице и, следовательно, эквивалентны между собой. Таким образом, инвариантные многочлены образуют полную систему инвариантов %-матрицы. Следствие 2. В ряду инвариантных многочленов • /л \ *-^т \ / _* /Т. \ Ut—\ \*у ," /Т. \ х/| \А>) //") С1 \ ¦¦ А \ /Л О\ М 1Л/ — ~г\ /"Г\ * г2 (Л/ — ~Т\ 7тГ\ > • • • * *г 1Л/ "— Т\ 7тГ\ 1*^0 1Л/ = J-/ l-^Ol же . I д 1 fc— \ t мм g\ ш А 1 » ' ¦ 9{\ l#vl л*' * л t (Я) 0 0 0 0 0 ... ir-i (Я) ... 0 ... 0 ... 0 ... 0 0 *1 (Я) 0 0 0 0 0 0 0 ... 0 ... 0 ... 0 ... 0 ... 0 каждый многочлен, начиная со второго, является делителем предыдущего. Это утверждение не вытекает непосредственно из формул A3). Оно «ледуетиз тс^., что многочлены i% (Я), 1г(Ц, . . ., ir (Я) совпадают с мно- многочленами ar\i), ar-i (Я), . . ., at (Я) канонической диагональной мат- матрицы (9).
§ 3] ИНВАРИАНТНЫЕ МНОГОЧЛЕНЫ И ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 145 2. Укажем методы вычисления инвариантных многочленов для ква- квазидиагональных Я-матриц, если известны инвариантные многочлены матриц, стоящих в диагональных клетках. Теорема 4. Если в кеазидиагоналъной прямоугольной матрице (А (к) О \ Л О В(к)) любой инвариантный многочлен матрицы А (к) является делителем любого инвариантного многочлена матрицы В (к), то совокупность инва- инвариантных многочленов матрицы С (к) получается объединением инвари- инвариантных многочленов матриц А (к) и В (к). Доказательство. Обозначим через i[(к), i'^(к), ..., i'r(к) и г"(к), il(k), ...,i'q(k) соответственно инвариантные многочлены Я-матриц А (к) и В (к). Тогда1) A(k)~{i'r(k), ..., i[(k), О, ..., 0}, B(k)~{iq(k), ..., i'i(k), 0, ..., 0} и, следовательно, С (к) ~ {Гг (к), ...,i[ (к), i"q (к), ..., i[ (к), 0, .... 0}. A4) Я-матрица, стоящая в правой части этого соотношения, имеет кано- каноническую диагональную форму. Тогда согласно теореме 3 не равные тождественно нулю диагональные элементы этой матрицы образуют полную систему инвариантных многочленов матрицы С (к). Теорема доказана. Для того чтобы в общем случае при произвольных инвариантных многочленах матриц А (к) и В (к) определить инвариантные многочлены С (к), мы воспользуемся важным понятием об элементарных делителях. Разложим инвариантные многочлены i4 (Я), &'2(Я), ..., ir(k) на непри- неприводимые в данном числовом поле К множители: «1 (Я)=[ф! (k)]ci [ф2 Ч (Я) = [Ф1 (k)]dl [ф2 (k)f* ... [Фв (k)f\ (ch>dh>...>lh>0; Здесь ф}(Я), ф2(Я), . ..,фв(Я) — все различные неприводимые в поле К многочлены (со старшими коэффициентами, равными единице), входящие в состав ii (к), i2 (Я), , гг (Я). Определение 5. Все отличные от единицы степени среди 1ф1 (Я)]С1, ..., [ф8(Я)]?в в разложении A5) называются элементарными дели- делителями матрицы А (Я) в поле К3). Теорема 5. Совокупность элементарных делителей прямоугольной кеазидиагоналъной матрицы (А (к) 0 \ 0 В (к)) х) Знаком ~ мы здесь обозначаем эквивалентность матриц, а фигурными скоб- скобками { }—диагональную прямоугольную матрицу вида A2). 2) Некоторые из показателей ch, dh, ..., lh (&=1, 2, ..., s) могут равняться нулю. 3) Формулы A5) дают возможность не только по инвариантным многочленам определить элементарные делители А (К) в поле К, но и наоборот,—по элементар- элементарным делителям определить инвариантные многочлены. 10 ф. р. гангмахер
146 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ.'Т1 всегда получается объединением элементарных делителей матрицы А (Я.) с элементарными делителями матрицы В (К). Доказательство. Разложим инвариантные многочлены матриц А (Я.) и ?A) на неприводимые в поле К множители1): 1ф2 (*)]** - ¦ ¦ [ [ф2 A)]сг . . . [tps [ф2 (Щ<&... [ф8 Обозначим через c1>d1>...>Z1>0 A6) все отличные от нуля числа среди с'х, d[, ..., h'v с"г, d'v ..., g'[. Тогда матрица С (к) эквивалентна матрице A4), а последняя пере- перестановкой строк и столбцов может быть приведена к «диагональному» виду (toiWfM*)' №iWld4*). •¦•, toiMi'M*), (ЖЖ), ..., (ЖЖ)>, A7) где через (Ж) мы обозначили многочлены, взаимно простые с ф1(Я), а через (>fc>K) — многочлены, взаимно простые с ф1(Я.) либо тождественно равные нулю. Из вида матрицы A7) непосредственно вытекают следую- следующие разложения многочленов Dr(K), Dr-i(k), ... и t'i(A,), i2(^)> ••• для матрицы С (к): к (Я) = к W = Отсюда следует, что [ф1(Я)]С1, [ф1(Я,)] 1, „ единице из степеней и т. д., и т. д. .., [<pi (Я.)]'1, т. е. все не равные являются элементарными делителями матрицы С (Я,). Аналогично определяются элементарные делители матрицы С (Я,), являющиеся степенями ф2(Я.) и т. д. Теорема доказана. Примечание. Совершенно аналогично предыдущему можно построить тео- теорию эквивалентности для целочисленных матриц (т. е. матриц, у которых эле- элементы—целые числа). При этом в 1°, 2° (см. стр. 135) с=± 1, b (Я) заменяется целым числом, а в формулах C), C'), C") вместо Р (Я) и Q (Я) стоят целочисленные матрицы с определителями, равными ± 1. 3. Пусть дана теперь матрица А = \\ aih ||" с элементами из поля К. Составим для нее характеристическую матрицу л т? д__ — а1г Я, — Й12 — ain — «27» A8) а) Если какой-либо неприводимый многочлен щ (к) входит множителем в одни инвариантные многочлены и не входит в другие, то в эти последние многочлены мы вписываем од (К) с нулевым показателем.
ИНВАРИАНТНЫЕ МНОГОЧЛЕНЫ И ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 147 Характеристическая матрица является ^.-матрицей ранга п. Ее инва- инвариантные многочлены (Д, (I) = 1) A9) называются инвариантными многочленами матрицы А, а соответствую- соответствующие элементарные делители в поле К — элементарными делителями в поле К матрицы А. Первый инвариантный многочлен i± (к) совпадает с минимальным многочленом яр (к) матрицы Ах). Знание инвариантных многочленов (а следовательно, и элементарных делителей) матрицы А позволяет исследовать ее структуру. Поэтому представляют интерес практические способы вычисления инвариантных многочленов матрицы. Сами формулы A9) дают алгоритм для вычисления этих многочленов, но этот алгоритм при больших п очень громоздок. Теорема 3 дает другой способ, вычисления инвариантных многочле- многочленов, основанный на приведении характеристической матрицы A8) при помощи элементарных операций к каноническому диагональному виду. Пример. 3 —4 6 -14 1 — 1 1 — 5 0 0 2 —1 0 0 1 0 ХЕ—А = Я—3 —10 0 4 Я+1 0 0 _6 —1 Я—2 —1 14 5 1 ' Я В характеристической матрице ХЕ—А прибавим к четвертой строке третью,' предварительно помноженную на Я: Ь,_3 —10 0 4 Я+1 0 О _6 —1 Я—2 —1 14—6Я 5—Я Я2—2Я+1 О Теперь, прибавляя к первым трем столбцам четвертой, предварительно помножен- помноженный соответственно на —6, —1, Я—2, получим: О О Я—3 4 0 14—6Я — 1 Я+1 0 5—Я 1 0 0 0 -2Я + 1 О К первому столбцу прибавляем второй, помноженный на Я—3: 0—10 О Я2—2Я+1 . Я + 1 О О О 0 0—1 —Я2+2Я—1 5—Я Я2—2Я+1 О Прибавим ко второй и четвертой строкам первую, помноженную соответственно на Я + 1 и 5—Я; найдем: 0 Я2—2Я+1 0 Я2+2Я—1 — 1 0 0 0 0 0 0 Я2—2Я+1 0 0 — 1 0 1) См. формулу D9) на стр. 99; там Д <Я) з Dn (Я). 10*
148 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI Прибавим к четвертой строке вторую, затем умножим первую и третью строки на —1. После перестановки строк и столбцов получим: 10 0 0 0 10 0 0 0 (Я —1J О 0 0 0 (Я—1J Матрица А имеет два элементарных делителя: (Я— IJ и (А,— IJ. § 4. Эквивалентность линейных двучленов В предыдущих параграфах мы рассматривали прямоугольные Я-матрицы. В этом же параграфе мы рассмотрим две квадратные Я-матрицы А (к) и В (к) n-го порядка, у которых все элементы имеют степень не выше единицы относительно к. Эти многочленные матрицы могут быть представлены в виде матричных двучленов: Мы будем предполагать, что эти двучлены имеют первую степень и регулярны, т. е. что |>40|^=0, \В0\ф0 (см. стр. 87). Следующая теорема устанавливает критерий эквивалентности таких двучленов: Теорема 6. Если два регулярных двучлена первой степени Аок-f-Ах и Вок-\-В1 эквивалентны, то эти двучлены строго эквивалентны, т. е. в. тождестве Bok + Bi = P{k){Aok + A1)Q(k) B0) можно Р (к) и Q'(k) — матрицы с постоянными и отличными от нуля определителями—заменить постоянными неособенными матрицами Р и Q1): Bok + B^PiAok + AJQ. B1) Доказательство. Так как определитель матрицы Р (к) не зави- зависит от Я, и отличен от нуля2), то обратная матрица М(к) = Р-1 (к) также будет многочленной. Пользуясь этой матрицей, мы тождество B0) пере- перепишем в виде M(k)(Bok + Bl) = (Aok + Al)Q(k). B2) Рассматривая М (к) и Q (к) как матричные многочлены, разделим М (к) слева на Аок + Аи a Q (к) — справа на Bok-\-Bi: М (к) = (Аок + A,) S (к) + М, B3) <?(Я) = Г(Я)(Бо^ + ?1) + <?; B4) здесь М и Q — постоянные (не зависящие от к) квадратные матрицы !) Тождество B1) равносильно двум матричным равенствам: В0=РА0О В Bi—PAjQ. 2) Эквивалентность двучленов Aq%-\-Ai и Во^-\-В^ означает наличие тож- тождества B0), в котором | Р (Я) |=constTfcO и | Q (Я) |=constgfcO. Однако последние соот- соотношения в данном случае вытекают из самого тождества B0). Действительно, определители регулярных двучленов первой степени имеют степень и: I АпК+Аа |=' = 14,1*,"+ .... J230*. + Bi| = |230|*n+...; \А0\ф0, | Во 1=56=0. Поэтому из \ В0т1+ | = | Р (Я) 11М+Ai 11Q (Я) | следует: т | р (Я) | =const Ф0, \Q (Я) |=const ф 0.
§ 51 КРИТЕРИЙ ПОДОБИЯ МАТРИЦ 149 n-го порядка. Полученные выражения для М (к) и Q (к) поставим в B2). После небольших преобразований получим: (АД + А,) [Т (к) - S (к)] (Вок + В$ = М (Вок + Вх) - (ЛЯ + AJQ. B5) Разность, стоящая в квадратных скобках, должна тождественно равняться нулю, так как в противном случае произведение, стоящее в левой части равенства B5), имело бы степень >2, в то время как в правой части этого же равенства стоит многочлен не выше первой степени. Поэтому S(k) = T(k); B6) но тогда из B5) получим: M(B^ + B0 = (A^ + A0Q. B7) Покажем теперь, что М — неособенная матрица. Для этого разделим Р (к) слева на Вок-^-В^. Р(к) = (Вьк + Вх)и(к) + Р. B8) Из B2), B3) и B8) следует: Е = М(к)Р(к) = М (к) (Вок + Bi) U(k) + M (к) Р = = (Аок + A,) Q(к)U(к) + (Аок + A1)S(k)P + MP = = (Аок + Л) [Q (к) U(k) + S (к) Р] + МР. B9) Так как последняя часть этой цепочки равенств должна иметь нулевую степень относительно к (поскольку она равна Е), то выражение в квад- квадратных скобках должно тождественно равняться нулю. Но тогда из B9) МР = Е. C0) Отсюда следует: | М \ Ф 0 и М'х = Р. Умножая обе части равенства B7) слева на Р, получим: Неособенность матрицы Р следует из C0). Но неособенность матриц Р и Q следует и из самого тождества B1), так как из этого тождества вытекает равенство и потому \ Теорема доказана. Примечание. Из доказательства следует [см. B4) и B8)], что в качестве постоянных матриц Р и Q, которыми мы заменяем Я-матрицы Р (к) и Q (к) в тождестве B0), можно взять соответственно левый и пра- правый остатки от деления Р (к) и Q (к) на Вок + Bt. § 5. Критерий подобия матриц Пусть дана матрица А — || aih ||" с числовыми элементами из поля К. Ее характеристическая матрица кЕ — А является ^.-матрицей ранга тг и потому имеет п инвариантных многочленов (см. § 3) h(k), i2(k), ...,in(k). Следующая теорема показывает, что эти инвариантные многочлены определяют исходную матрицу А с точностью до преобразования подобия.
150 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI Теорема 7. Для тога чтобы две матрицы А = ||aih||"иВ = || bik ||" были подобны (В = Т~1АТ), необходимо и достаточно, чтобы они имели одни и те же инвариантные многочлены, или, что то же, одни и те же элементарные делители в поле К. Доказательство. Условие необходимо. Действительно, если матрицы А и В подобны, то существует такая неособенная мат- матрица Т, что В = Т*АТ. Отсюда КЕ-В = Т~1(КЕ — А)Т. Это равенство показывает, что характеристические матрицы КЕ.— А и КЕ — В эквивалентны и потому имеют одни и те же инвариантные многочлены. Условие достаточно. Пусть характеристические матрицы КЕ — А и КЕ—В имеют одни и те же инвариантные многочлены. Тогда эти Я-матрицы эквивалентны (см. следствие 1 из теоремы 3), и, следо- следовательно, существуют две многочленные матрицы Р (К) и Q (К) такие, что KE — B = P(K)(KE — A)Q(K). C1) Применяя к матричным двучленам КЕ—А и КЕ—В теорему 6, мы можем в тождестве C1) заменить Я-матрицы Р (К) и Q (К) постоян- постоянными матрицами Р и Q: C2) причем в качестве Р и Q можно взять (см. примечание на стр. 124) соответственно левый и правый остатки от деления Р (Я) и Q (Я) на КЕ — В, т. е. на основании обобщенной теоремы Везу можно положить1): Р = Р(В), <? = <?(?). C3) Приравнивая в обеих частях равенства C2) коэффициенты при нулевой и при первой степенях К, получим: B = PAQ, E = PQ, Т G в = т-ыт, где T = Q = P~\ Теорема доказана. Замечание, Попутно нами установлено следующее предложение, которое мы сформулируем как Добавление к теореме 7. Если A = \\aih\\^ и Б = || ?гй||" — две подобные матрицы В = Т~1АТ, C4) то в качестве преобразующей матрицы Т можно взять матрицу , . C5) *) Напоминаем, что Р (В)—левое значение многочлена Р(К), a Q (В)—правое значение многочлена Q (к) после замены Я на В (см. стр. 90—92).
§ 6] НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ 151 где Р (к) и Q(k)—многочленные матрицы в тождестве kE — B = P(k)(kE — A)Q(k), связывающем эквивалентные характеристические матрицы кЕ— А .и кЕ —В; в формуле C5) Q(В) обозначает правое значение матричного многочлена Q (к), а Р (В) — левое значение матричного многочлена Р (к) при замене аргумента к матрицей В. § 6. Нормальные формы матрицы 1. Пусть дан некоторый многочлен с коэффициентами из поля К g (к) = кт + а^™ + ... + ат^к + ат. Рассмотрим квадратную матрицу то-то порядка 0 0 ... О — ат 1 0 ... О -ат^ О 1 ... О -ага_2 Li = О 0 ... 1 — C6) Нетрудно проверить, что многочлен g(k) является характеристиче- характеристическим многочленом матрицы L: к 0 0 . . . О ага -1 Я, 0 ... О am_j О — 1 к ... О ато_2 \кЕ-Ь\ О О С другой стороны, минор элемента ато в характеристическом опре- определителе равен ± 1. Поэтому Dm-i (к) = 1 и it (к) = D ,1ч = Dm (к) = g(k), Таким образом, матрица L имеет единственный отличный от единицы инвариантный многочлен, равный g (к). Матрицу L мы будем называть сопровождающей матрицей для много- многочлена g(k). Пусть дана матрица А = || а^ ||" с инвариантными многочленами к(к), h(k), ..., it (к), iV C7) Здесь все многочлены it (к), i2(к), ..., it (к) имеют степень выше нуле- нулевой, причем каждый из этих многочленов, начиная со второго, является делителем предыдущего. Сопровождающие матрицы для этих многочле- многочленов обозначим через Lt, L2, ..., Lt. Тогда квазидиагональная матрица n-го порядка = {Li, L2, ..., C8) имеет своими инвариантными многочленами многочлены C7) (см. тео- теорему 4 на стр. 145). Поскольку матрицы А и LT имеют одни и те же
152 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI инвариантные многочлены, они подобны, т. е. существует всегда такая неособенная матрица U (| U \ Ф 0), что A^ULjU-1. (I) Матрица Lj называется первой естественной нормальной формой для матрицы А. Эта нормальная форма характеризуется: 1) квазидиагональ- квазидиагональным видом C8), 2) специальной структурой диагональных клеток C6) и 3) дополнительным условием: в ряду характеристических многочленов диагональных клеток каждый многочлен, начиная со -второго, является делителем предыдущего1). 2. Обозначим теперь через Xi (Л), Хг(Я.), ..-, Х»(Я.) C9> элементарные делители матрицы А = Ц а^ |1" в числовом поле К. Соответ- Соответствующие сопровождающие матрицы обозначим через Поскольку %j (А.) — единственный элементарный делитель матрицы (/ = 1, 2, ..., кJ), то согласно теореме 5 квазидиагональная матрица LXI = {L*\L™, ...,?«") D0) имеет своими элементарными делителями многочлены C9). Матрицы 'А и Lu имеют одни и те же элементарные делители в поле К. Поэтому эти матрицы подобны, т. е. существует всегда такая неособенная матрица V (| V \ Ф 0), что A^VLuV-K (II) Матрица Ln Называется второй естественной нормальной формой для матрицы А. Эта нормальная форма характеризуется: 1) квазициа- гональным видом D0), 2) специальной структурой диагональных клеток C6) и 3) дополнительным условием: характеристический многочлен каждой диагональной клетки представляет собой степень неприводимого- в поле К многочлена. Замечание. Элементарные делители матрицы Л в отличие от инва- инвариантных многочленов существенно связаны с данным числовым полем К. Если мы вместо исходного числового поля К возьмем другое числовое поле (которому также принадлежат элементы данной матрицы А), то эле- элементарные делители могут измениться. Вместе с элементарными дели- делителями изменится и вторая естественная нормальная форма матрицы. Так, например, пусть дана матрица А = \\ aih ||" с вещественными элементами. Характеристический многочлен этой матрицы будет иметь вещественные коэффициенты. В то же время этот многочлен может иметь комплексные корни. Если К—поле вещественных чисел, то среди эле- элементарных делителей могут быть и степени неприводимых квадратных *¦) Из условий 1), 2), 3) автоматически следует, что характеристические много- многочлены диагональных клеток в ?/ являются инвариантными многочленами матрицы Li и, следовательно, матрицы А. 2) %J (Ц—единственный инвариантный многочлен матрицы iP* и в то же время есть степень неприводимого в поле К многочлена.
§ 6] НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ 153 трехчленов с вещественными коэффициентами. Если К — поле ком- комплексных чисел, то каждый элементарный делитель имеет вид (к— ko)v. 3. Допустим теперь, что числовое поле К содержит не только эле- элементы матрицы А, но и все характеристические числа этой матрицы1). Тогда элементарные делители матрицы А имеют вид2) Рассмотрим один из таких элементарных делителей (к-к0Г и поставим ему в соответствие следующую матрицу порядка р: ко I 0 ... О О к0 1 ... О 0 0 0 ... 1 О 0 0 ... ко D2) Нетрудно проверить, что эта матрица имеет только один элементар- элементарный делитель (к — ко)р. Матрицу D2) мы будем называть жордановой клеткой, соответствующей элементарному делителю (к — ко)р. Жордановы клетки, соответствующие элементарным делителям D1), обозначим через •М> ^2ч - • •» *и' Тогда квазидиагональная матрица имеет своими элементарными делителями степени D1). Матрицу / можно еще записать так: где Поскольку матрицы А и / имеют одни и те же элементарные дели- делители, они подобны между собой, т. е. существует такая неособенная матрица Т (| Т \ Ф 0), что А = TJT-1 = и к2Ег 2 киЕи + Ни) Т~\ (III) Матрица / называется жордановой нормальной формой или просто жордановой формой матрицы А. Жорданова форма характеризуется квази- квазидиагональным видом и специальной структурой D2) диагональных клеток. *) Это всегда имеет место для любой матрицы А, если К—поле комплексных чисел. 2) Среди чисел %и к2, ..., Хи могут быть и равные между собой.
154 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI На нижеследующей схеме выписана жорданова матрица / при эле- элементарных делителях (Я, —Я^J, (Я,— Х2K, Я,— Я,3, (Я, — Я,4J: А* 1 |0 0 00 0 0 оя^оооооо о "ТТ яГ i oHj ооо J 1 @ 0 О 0 10 @ 0 0 0 0 |0 0 Х2|0 0 0 о о ~о~о~о~[я7| о о ооооо " оТя7Т оооооо|оя,< Если все элементарные делители матрицы А — первой степени (и только в этом случае), жорданова форма является диагональной мат- матрицей, и в этом случае мы имеем: A = T{ki,K,---,K}T+. D4) D3) Таким образом, матрица А имеет простую структуру (см. гл. III, § 8) в том и только в том случае, когда ice ее элементарные делители имеют первую степень1). Иногда вместо жордановой клетки D2) рассматривают «нижнюю» жор- данову клетку р-то порядка К 0 . . . 0. О 1 . 10 . . . О О о . . . . . -к о 0 .... 0 • 1 К Эта матрица также имеет только один элементарный делитель (Я, — Я-о)р- Элементарным делителям D1) соответствует «нижняя» жорданова мат- матрица 2) (Eh = ElVh\ Fh = F(Ph\ Л = 1, 2, .... в). Произвольная матрица А, имеющая элементарные делители D1), всегда подобна матрице /A), т. е. существует такая неособенная матрица Tid^l^O), что Заметим еще, что если Я,о Ф 0, то каждая из матриц *) Часто вместо «элементарные делители первой степени» говорят «линейные элементарные делители» или «простые элементарные делители». кз 2) В отличие от нижней жордановой матрицы J<d матрицу J иногда назы- называют верхней окордановой матрицей.
7] ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ МАТРИЦЫ /(А) 155 имеет только один элементарный делитель: (к — 'ко)р. Поэтому для неосо- неособенной матрицы А, имеющей элементарные делители D1), наряду с (III) и (IV) имеют место представления \ (V) (VI) А = Г3 {^! (?, + F0, Я2 (?2 + F2), ..., К (Еи + Fu)} T;1. § 7. Элементарные делители матрицы f (А) 1. В настоящем параграфе рассмотрим следующую задачу: Даны элементарные делители (в поле комплексных чисел) матрицы ,4 = ||аг-й||™ и дана функция /(Я,), определенная на спектре матрицы А. Требуется определить элементарные делители (в поле комплексных чисел) матрицы f(A). Обозначим через (Х-Я/1, (Х-к/2, ..., (X-Kfu элементарные делители матрицы А *). Тогда матрица А подобна жорда- 'новой матрице / А = TJT1 ж, следовательно (см. 2° на стр. 106), При этом / = {/1? /2, ..., /„}, /, = hElPi) + HiV{i (i = 1, 2, ..., в), D5) где (см. пример 2 на стр. 106) о (Pi—1)! 1! о о D6) Поскольку подобные матрицы / (А) и / (/) имеют одни и те же эле- элементарные делители, то в дальнейшем вместо матрицы f (А) мы будем рассматривать матрицу /(/). 2. Определим сначала дефект d матрицы f(A) или, что то же, мат- матрицы f(JJ)- Дефект квазидиагональной матрицы равен сумме дефектов отдельных диагональных клеток, а дефект матрицы / (/,•) [см. D6)] равен *) Среди чисел Я15 "к%, ..., Хи могут быть и равные между собой. 2) d=n—г, где г—ранг матрицы / (А).
156 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI наименьшему из чисел kt и pi, где kt— кратность Я* как корня /(ЯI)» поскольку f(h) = f'(h)=...=f{kt~i}(U) = O, f(h\-kt)^O (i = l,2, ....в). D6) Мы пришли к теореме: Теорема 8. Дефект матрицы f (А), где матрица А имеет элемен- элементарные делители (Я - Я/1, (Я - Я/2, ..., (Я - К)Ри, D7> определяется формулой и d= S min(ft,, Pi); D8> здесь ki — кратность Яг как корня /(Я) (i = l, 2, ...,и). В качестве приложения доказанной теоремы определим все элемен- элементарные делители произвольной матрицы -4 = ||aift||", соответствующие, характеристическому числу Ко'. К— Яо, ..., Я — Ко; (Я — ЯоJ, ...» (Я — ЯоJ; ...; (Я — Яо)™, ..., (Я — Яо), gi g% grn где gi>0 (г = 1,2, ...,m — 1), gm>0, в случае, когда даны дефекты d±, d2, ..., dm матриц А-КоЕ, (A^KoEf, ..., (Л-Я0Я)т. Для этого заметим, что (Л — Я0?У = /^-(Л), где f} (Я) = (X — ЯоO (/=1г 2, ..., то). Поэтому для определения дефекта матрицы (Л — Я0?У следует в формуле D8) положить kt = / для элементарных делителей, соответ- соответствующих характеристическому числу Яо, и kt = 0 во всех других сла- слагаемых (/=1,2, ..., то). Таким образом, получим формулы D9> Отсюда 2) gj = 2c?j- — d,-_t — dj+1 (/=1,2, ..., m; d0 = 0, dm+1 = un). E0) 3. Вернемся к основному вопросу об определении элементарных дели- делителей матрицы f(A). Как уже отмечалось выше, элементарные делители / (А) совпадают с элементарными делителями / (/), а элементарные дели- делители квазидиагональной матрицы составляются из элементарных делите- х) В общем случае, когда / (X)—не многочлен, под кратностью корня Ki функ- функции / (К) понимают целое число /с;, определяемое из условий D6). kt может и рав- равняться нулю; в этом случае / {Ki) Ф 0. 2) Если задан ряд чисел dt, d2, d3..., где dj—дефект степени (А—K0E)t (/=1, 2, 3 ...), то число т—наибольший из показателей степеней элементарных делителей вида (К—Kq)v—определяется как индекс, при котором dm<dd
71 ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ МАТРИЦЫ / (А) 157 лей диагональных клеток (см. теорему 5). Поэтому вопрос сводится к разысканию элементарных делителей матрицы С, имеющей правильную треугольную форму: ь=о а0 ах О а О О «р-1 а0 E1) Рассмотрим отдельно два случая: 1° (ц тф 0. Характеристический многочлен матрицы С, очевидно, равен Тогда, поскольку Dp (Я) делится на Dp-± (Я) без остатка, то Здесь через Z^p-i (Я) мы обозначили наибольший общий делитель миноров (р—1)-го порядка характеристической матрицы О Я-с0 ' . 0 0 ... Я-а0 Легко видеть, что минор нулевого элемента, отмеченного значком « + », равен (— «iK3 и, следовательно, в нашем случае отличен от нуля. Поэтому здесь g = 0. Но тогда из Др(Я) = (Я-а0)р, ZV4 (Я) = 1 следует, что матрица С имеет только один элементарный делитель (Я — ао)р. 2° а1= .. .= ah-i = 0, aft Ф- 0. В этом случае С = аъЕ + ahHh +...+ a^ilF-1 (Я = Я(р)). Поэтому при любом целом положительном j дефект матрицы (C определится равенством Положим Тогда1) kf при / р при kj>p. E2) E3) !) В данном случае число д+4 играет роль числа т в формулах D9) и E0) (см. сноску2) к стр. 156).
158 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI Поэтому согласно формулам E0) имеем: E4) Таким образом, матрица С имеет элементарные делители (Я - а0У+\ • • •, (Я - ao)e+1, (Я - ао)«, .... (Я - а„)д, h k-h де целые числа д>0 и /г>0 определяются из E2). 4. Теперь мы уже имеем возможность выяснить,, какие элементарные делители имеет матрица /(/) [см. формулы D5) и D6)]. Каждому эле- элементарному делителю матрицы А (Я-Я0)р отвечает в матрице /(/) диагональная клетка i=0 0 / (Яо) 0 0 (Р—1I 1! 7 E5) Очевидно, вопрос сводится к нахождению элементарных делителей клеток вида E5). Но матрица E5) имеет правильную треугольную фор- форму E1), причем здесь Таким образом, приходим к теореме: Теорема 9. Элементарные делители матрицы f (А) получаются из элементарных делителей матрицы А следующим образом: элемен- элементарному делителю (Я-Я0)р E6) матрицы А при р — 1 или при р>1 и f (Яо)ф0 отвечает один эле- элементарный делитель рц р р ментарный делитель матрицы f (А); при д /' (Яо) - . -. =?*-1) (Яо), /( 56 А Ь) E7) (к<р) элементарному делителю E6) матрицы А соответствуют следующие элементарные делители матрицы f (A): fr-fib))9*1, (Я-/(Я0))в, .... (Я-/(Я0))в, E8) k — h где наконец, при />>!,. /' (Яо) = /" (Яо) = ... = /(р 1}(Яо) = О элементарному делителю E6) соответствуют р элементарных делителей первой степени
§ 81 ОБЩИЙ МЕТОД ПОСТРОЕНИЯ ПРЕОБРАЗУЮЩЕЙ МАТРИЦЫ 159 матрицы f (А)г): *,-/(*<,), -•-. *-/(*<,). E9) Отметим следующие частные положения, содержащиеся в этой теореме. 1. Если Я,!, Я2, -.., %п — характеристические числа матрицы А, то /(^г)> •••» /(^п) суть характеристические числа матрицы f (А) (как в перовом, так и во втором рядах чисел каждое характеристическое число повторяется столько раз, какова его кратность как корня харак- характеристического уравненияJ). 2. Если производная f (Я) не равна нулю на спектре матрицы A s), то при переходе от матрицы А к матрице f(A) элементарные дели- делители не «расщепляются», то. е. если матрица А имеет элементарные делители (я - ко*1, (я - я2Л ..., ¦ (я, - яп)Ч то матрица f (А) имеет элементарные делители § 8. Общий метод построения преобразующей матрицы Во многих вопросах теории матриц и их приложений достаточно знать только нормальную форму, к которой приводится данная матрица Л=|| Щь ||™ пре- преобразованием подобия. Нормальная форма вполне определяется инвариантными многочленами характеристической матрицы %Е—А. Для нахождения последних можно воспользоваться определяющими формулами [см. A0) на стр. 143] или при- приведением характеристической матрицы %Е—А при помощи элементарных преобра- преобразований к канонической диагональной форме. В некоторых же вопросах необходимо знать не только нормальную форму А данной матрицы А, но и преобразующую неособенную матрицу Т. Непосредственный способ определения матрицы Т состоит в следующем. Равенство переписывается так: AT—ТА=0. Это матричное уравнение относительно Т равносильно системе п2 линейных одно- однородных уравнений относительно п2 неизвестных коэффициентов матрицы Т. Опре- Определение преобразующей матрицы сводится к решению этой системы из п2 уравне- уравнений. При этом из множества решений необходимо выбрать такое решение, для которого | Т | Ф 0. Существование такого решения обеспечено тем, что матрицы А и А имеют одни и те же инвариантные многочлены4). Заметим, что в то время как нормальная форма определяется однозначно заданием данной матрицы АБ), для преобразующей матрицы Т мы всегда имеем бесчисленное множество значений, охватываемых формулой T=-UTit F0) х) E7) получается из E8), если положить fc=l; E9) получается из E8), если положить к=р либо Л]>р. 2) Предложение 1 было нами отдельно установлено в гл. V, стр. 106. 3) То есть /' (Xj) ф 0 для тех Яг, которые являются кратными корнями мини- минимального многочлена. 4) Из этого факта следует подобие матриц А и А. Б) Это утверждение безоговорочно справедливо в отношении первой естествен- естественной нормальной формы. Что же касается второй нормальной формы или жордановой нормальной формы, то они определяются однозначно с точностью до порядка диагональных клеток.
160 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI где Ti—одна из преобразующих матриц, a U—произвольная матрица, перестано- перестановочная с А1). Предложенный выше способ определения преобразующей матрицы Т очень прост по своей идее, но практически мало пригоден, так как связан с очень боль- большими вычислениями (так, уже при я =4 он требует решения системы из 16 линей- линейных уравнений). Переходим к изложению более эффективного метода построения преобразую- преобразующей матрицы Т. Этот метод опирается на добавление к теореме 7 (стр. 150). Согласно .этому добавлению в качестве преобразующей матрицы можно взять матрицу T=Q (I), F1) коль скоро ХЕ—А=Р (X) (IE—A) Q ft). Последнее равенство выражает собой эквивалентность характеристических матриц ХЕ—А и ХЕ—А. Здесь Р (к) и Q ft)—многочленные матрицы с постоян- постоянными отличными от нуля определителями. Для конкретного нахождения матрицы Q ft) мы приводим к канонической .диагональной форме каждую из Х-матриц ХЕ—А и ХЕ—А при помощи соответ- соответствующих элементарных преобразований2): .{tn ft), in-i ft), •..,»! ft)}=-Pi ft) (IE-A) Qi (X), F2) {in ft), in-i ft), - - -, h ft)}=-P2 ft) (XE-A) Q2 ft), F3) где- Q1ft)=r1r2 ... Tpv Q2(X)=T$n ..• 7p2, F4) •a Ti, ..., TVl, T\, ..., Гр2—элементарные матрицы, соответствующие элементар- элементарным операциям над столбцами Х-матриц ХЕ—А и ХЕ—А. Из F2), F3) и F4) следует: %Е—А—Р (X) (ХЕ—А) Q ft), тде <3ft)=Qift)Q?1 m= tvt*v- F5> Матрицу Q (X) вычисляем, применив последовательно к столбцам единичной матрицы Е элементарные операции с матрицами Ti, ..., TVj, 71*, -.., Г^". После этого [согласно формуле F1)] заменяем в Q (X) аргумент X матрицей А. Пример. 1 0 1 0 1 —1 — 1 —1 1 Введем символические обозначения для левых и правых элементар- яых операций и соответствующих матриц (см. стр. 136 —137): T" = [if\. Читатель легко проверит, что характеристическая матрица Я-1 0 -1 %Е—А= 0 Я-1 1 1 Я-1 Формулу F0) можно заменить формулой тде V—произвольная матрица, перестановочная с А. 2) Здесь существенно лишь то, что обе Я-матрицы ХЕ—А и %Е—А приво- приводятся к одному и тому же виду.. Мы избрали канонический диагональный вид, поскольку существует алгоритм, обеспечивающий приведение к такому виду.
8] ОБЩИЙ МЕТОД ПОСТРОЕНИЯ ПРЕОБРАЗУЮЩЕЙ МАТРИЦЫ 161 приводится к каноническому диагональному виду 1 0 0 0 1 0 (Я 0 0 — 1K с помощью следующих последовательно выполненных элементарных опе- операций: [1 + (Я —1K1, {2 + 1}, {3 + (Я-1I}, {(-1I}, [1-21, [1_(Я,«-2Л+1J], {2 —(Я —1I}, {(-1J}, [13], {23}. W Из канонического диагонального вида матрицы КЕ — А усматриваем, что матрица А имеет только один элементарный делитель (Я— IK. Поэтому соответствующей жордановои формой будет матрица 1 1 0 /=011 0 0 1 Нетрудно видеть, что характеристическая матрица КЕ—/ приво- приводится к тому же каноническому диагональному виду с помощью эле- элементарных операций {3 + (Я-1J}, {3 + (Я2-2Я + 1)Ч}, [2 + (Я-1K], [1 + (Я-1J1, {(-1I} {(-1J}, [13], {12}. (**} Выбрасывая из (*) и (**) левые элементарные операции, обозначенные символом {...}, мы в соответствии с формулами F4), F5) получим <3 (^)=<?i (Я) (?-х (Я) = = [1 + (Я—1) 3] [1-2] [1—(Я*—2Я+1) 21 [13] [13] [1-(Я-1) 2] [2—(Я—1) 3] = = [1 + (Я — 1) 31 [1 — (Я2—Я +1) 2] [2 — (Я — 1) 31. Применим к единичной матрице последовательно эти правые эле- элементарные операции: 1 0 0 0 1 0 0 0 1 1 0 0 0 1 0 Я-1 0 1 Я —1 1 — Я2 + Я — Л —1 о о 1 О О 1 о 1 Таким образом, 0 -1 0 0 0 0 0 0 0 Я2 + 0 0 1 0 0 0 я + -Я + 1 1 1 О О -1 1 О -1 1 1 =<?№¦ Замечая, что 11 Ф. Р. Гантмахер 1 0 0 2 1 0 1 2 1
162 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI находим У = <?(/) = 0 -1 0 0 0 0 0 0 0 Проверка. 1 0 0 2 1 0 1 2 1 + 0 1 1 1 -i 1 — 0 1 1 0 0 1 0 0 1 0 0 0 = 1 0 0 1 — 1 0 1 1 0 0 1 1 с с +1 1 -1 0 l -i l 0 — 1 1 1 -1 0 f 0 0 1 7V = 0 -1 0 1 -1 0 1 -1 1 0 -1 1 Следовательно, AT = = 1. ), т. е. A = TJT~1. § 9. Второй метод построения преобразующей матрицы 1. Мы изложим еще один метод построения преобразующей матрицы, который часто приводит к меньшим вычислениям, нежели метод предыдущего параграфа. Однако этот второй метод применим лишь тогда, когда нормальная форма жорданова и известны элементарные делители F6) данной матрицы А. Пусть A=-TJT~\ где 1 %2 1 ... 0 • 1 0 ... Тогда, обозначая через t^ к-ш столбец матрицы Г Gс = 1, 2, ..., п), мы матричное равенство AT=TJ
§ 9] ВТОРОЙ МЕТОД ПОСТРОЕНИЯ ПРЕОБРАЗУЮЩЕЙ МАТРИЦЫ 163 заменим эквивалентной системой равенств Atpl=kitPl + tPl_i, F7) которую перепишем еще так: D-М) *i=0. (A-KiE) t2=tb . .„{А-ЪЕ) tPl=tPl^, F7') (A—k2E)tPi+1=0, (A—X2E) tPi+2=tPi+1, ...,(A—X2?)*p1+p2 = *p1+p2-i, F8') Таким образом, все столбцы матрицы Т разбиваются на «жордановы цепочки» столбцов: [tu t2, ..., tPi], [tPl+i, *Pl+2. ¦¦¦>tp1+p2] .-•¦ Каждой жордановой клетке в J [или, что то же, каждому элементарному делителю F6)] соответствует своя шор- данова цепочка столбцов. Каждая жорданова цепочка столбцов характеризуется' системой уравнений типа F7), F8) и т. п. Нахождение преобразующей матрицы Т сводится к разысканию жордановых- цепочек, которые в совокупности давали бы п линейно независимых столбцов. Мы покажем, что эти жордановы цепочки столбцов можно определить при* помощи приведенной матрицы С (к) (см. гл. IV, § 5). Для матрицы С (к) имеем тождество (кЕ—А) С (к) =¦$ (к) Е, (Щ где 4J5 (к)—минимальный многочлен матрицы А. Пусть •ф (к)=(к-ко)т X (к) (-/ (к0) ф 0). Продифференцируем почленно последовательно т—1 раз тождество F9): (kE—A)C'(k) + C(k) = ty'№)E, Л I G0> (кЕ — А) С<т-« (к) + (т — 1) С»-»» (к)—^'1* М Е- J Подставляя ко вместо к в F9), G0) и замечая, что правые части при этом обращаются в нуль, получим: (Л — коЕ)С=О, (A—kQE)D=C, {A—koE)F=D {А—к0Е) K=G, где С=С(к0), D=-^C'(k0), F~C'(ko) G= * ) C(ko) G= J Заменим в равенствах G1) матрицы G2) их Л-ми столбцами (fc = l, 2, ..., п). Получим: (А-к0Е) Ch=0, (А-к0Е) Dh=Ch, ..., (А-к0Е) Kh=Gh G3) (*=1, 2, .... п). Поскольку С=С(к0) Ф О1), можно выбрать такое /с«гс), что Ch Ф О. G4) Тогда т столбцов Ch, Dh, Fh, .... Gft, Kh G5> линейно независимы. В самом деле, пусть х) Из С(Хо)=О следовало бы, что все элементы С (к) имеют общий делитель степени выше нулевой, что противоречит определению С (к). 11*
164 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. Помножая обе части G6) последовательно на А-—XqE, ..., (А—%цЕ)т~1, получим: 6СЙ+ ... +y.Gh=O, ..., хСй=0. G7) Из G6) и G7) в силу G4) находим: Поскольку линейно независимые столбцы G5) удовлетворяют системе уравне- уравнений G3), они образуют жорданову цепочку векторов, отвечающую элементарному делителю (X—Х0)т [ср. G3) с F7')]. Если при некотором к Cj,=O, но D^ ф 0, то столбцы D^, ..., G^, K^ образуют жорданову цепочку из т—1 векторов и т. д. 2. Покажем сначала, как построить цреобразукзщую .матрицу Т в том случае, когда матрица А имеет попарно взаимно простые элементарные делители: (л — л^) , (л—Л2) »»««»(л — Лд) (Л; ф^ Xj при i ф1 / j i,7 = 1, 2, ...,?). Элементарному делителю (Х-—Xj) 3 ставим в соответствие жорданову цепочку столбцов С^, D^3\ ..., G"', К^3\ построенную по указанному выше способу. Тогда 5)C(j)=0, (A—I (A G8) Давая / значения 1, 2, ...,«, получим s жордановых цепочек, содержащих в совокуп- совокупности п столбцов. Эти столбцы линейно независимы. Действительно, пусть =0. G9) Помножим обе части равенства G9) слева на произведение Получим: ... {A-XSE) *. (80) Заменяя в (80) m^ — 1 последовательно на го^—2, т-—3, ..., найдем: Yj=ei=...=xj=0 О'=1, 2, ...,s), что и требовалось доказать.. Матрицу Т определим формулой А = Пример. 8 3 —10 —3 3—1—4 2 2 3 — 2—4 2_1 — 3 2 1 2 — 1—3 3 2 2 1 14 0 2 элементарные делители: (X—IJ, (Х-{-1J, (81) Составим первый столбец С1 (X):
ВТОРОЙ МЕТОД ПОСТРОЕНИЯ ПРЕОБРАЗУЮЩЕЙ МАТРИЦЫ 165 Для вычисления первого столбца матрицы А2 мы помножим все строки матрицы А на первый столбец матрицы А. Получим1): f.4aJi = (l, 4, 0, 2). Помножая на этот б А й [Л3] C 6 2 3) П р ц рц у столбец все строки матрицы А, найдем 3 6 2 3 + A 1 4 0 2 + (»-z> 3 to to 1 = C, 6, 2, 3). Поэтому 1 0 0 0 —А—3 2А2 + 4А+2 2А2 — 2 + (a»-2a) Отсюда С!A) = @, 8, 0, 4) и Ci(l) = (8, 8, 4, 4). Поскольку d(—1) = @, 0, 0, 0), то переходим ко вторым столбцам и, действуя аналогично предыдущему, находим: С2(—1) = (—4, 0, —4, 0) и Са(—1)=D, —4, 4, —4). Составляем матрицу: 0 A), ci (I); c2(-i), c;(-i))= —4 0 —4 0 4 —4 4 —4 Сокращаем 2) первые два столбца на 4 и вторые два столбца на —4. Т= 1 0 1 0 —1 1 —1 11 Предлагаем читателю проверить, что 1 1 0 1 о о о о АТ=Т- 0 0 1 0 0 0 1 —1 3. Переходя к общему случаю, будем разыскивать жордановы цепочки векторов, отвечающие характеристическому числу Ао, которому соответствуют р элементарных делителей (А—A0)m, q элементарных делителей (А—Ао), г делителей (А—Ао) и т. д. Установим предварительно некоторые свойства матриц si /in 1 \ /Ч \ /QO\ Тп~с< '(Ао)- К°б) (83) (84) 1° Матрицы (82) могут быть представлены в виде многочленов от А: где В самом деле, где С(А)=?(А?, А), х) Столбец, на который умножаем строки, мы подписываем под строками матрицы А. Курсивом набраны элементы контрольной суммарной строки. 2) При умножении всех столбцов жордановой цепочки на число с ф 0 цепочка остается жордановой.
166 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI Поэтому -?р С<*> (Хо) =±. ?<&> (hE, A), (85) где 0, ц) = Jp Г -^- ф (X, Из (82), (85) и (86) следует (83). 2° Матрицы (82) имеют соответственно ранги р,2р+д, Зр + 2д+г, ... Зто свойство матриц (82) непосредственно получается из 1° и теоремы 8 гл. VI, если положить ранг равным п—d и воспользоваться формулой D8) для дефекта функции от А (стр. 130). 3° В ряду матриц (82) столбец каждой матрицы является линейной комбина- комбинацией столбцов любой последующей матрицы. Возьмем две матрицы hi (А) и h^ {А) в ряду (82) (см. 1°). Пусть i<^k. Тогда из (84) следует: Отсюда /-й столбец ^-(/=1, 2, ...,п) матрицы hi (А) линейно выражается через столбцы 24, Z2, "zn матрицы h^ {A): п У} = 2 a8ze> где ctj, ct2, ..., а„—элементы /-го столбца матрицы {А—X0E)h~~l. 4° Не меняя основных формул G1), можно в матрице С любой столбец заменить произвольной линейной комбинацией всех столбцов, сделав соответствующую замену в D, ..., К. Теперь перейдем к построению жордановых цепочек столбцов для элементар- элементарных делителей Р Q Пользуясь свойствами 2° и 4°, мы матрицу С преобразуем к виду С=(СЪС2 Ср; 0, 0, .... 0), (87) где столбцы Cj, Сг, ..., Ср линейно независимы между собой. При этом ?>=(?>!, D2 Dp; Dp+i, ... Dn), Согласно 3е для любого г A <; i <; р) столбец Ci есть линейная комбинация «толбцов ?>i, 1>2, -.., Dn: Ci=a1?>1+ ... +apDp+ap+,Dp+l+ ... +(!„?»„. (88) Помножим обе части этого равенства на А—%$Е. Тогда, замечая, что [см. G3)] (A-K0E)Ci=0 (f=l, 2, ...,р), (A-X0E)Dj=Cj (/=1, 2, ...,п), получим в силу (87): 0= откуда в (88) a1 = ...=ap=0. Поэтому столбцы Cit Сг, ..., Ср представляют собой линейно независимые комбина- комбинации столбцов ?>р+1, ..., Dn, и потому, согласно 4° и 2°, не меняя матрицы С, можно вместо Dp+i, ..., 1>2р взять столбцы Сь ..., Ср, а вместо I>2p+g+i. .'.., Dn—нули.
§ 9] ВТОРОЙ МЕТОД ПОСТРОЕНИЯ ПРЕОБРАЗУЮЩЕЙ МАТРИЦЫ 167 Тогда матрица D примет.вид D=(A, • • •, Dp, С i, C2, ..., Ср; D2p+1, ..., D2p+q; 0, 0, ..., 0). (89) Таким же образом, сохраняя вид (87) и (89) для матриц С и D, мы следующую матрицу F представим в виде F = (Fi, ..., Fp; ?>!, ..., Dp,. F2p+i, ..., F2p+q; C±, ..., Cp; л Dzp+i> —i D2p+q, F3P+2q+b ¦¦•! F3P+2q+r, 0, ..., 0) J и т. д. Формулы G3) дадут нам жордановы цепочки (сГ . (91) т—1 т—1 q, F2 p+q, Эти жордановы цепочки независимы мемсду собой. Действительно, все столбцы Ci в цепочках (91) независимы, так как они образуют р независимых столбцов матрицы С. Все столбцы Cj, Dj в (91) независимы, так как они образуют 2р+9 независимых столбцов в матрице Сит. д.; наконец, все столбцы в (91) независимы, так как они образуют по=тр-\-(т—1)д-{-... независимых столбцов в матрице К. Число столбцов в (91) равно сумме степеней элементарных делителей, соответствую- соответствующих данному характеристическому числу Хо. Пусть матрица ^ = i|aj/;||" имеет s различных характеристических чисел kj [/=1, 2, ...,«; Д (X)=(X-X1)'11 (l-kz)n* ... (l-ks)ns; f (X)=(X-X1)mi (Х-Х2)тг . ¦. ... (X—^8)ms]. Для каждого характеристического числа Xj составим свою систему независимых жордановых цепочек (91); число столбцов в этой системе будет равно rij (/=1, 2, ..., «). Все полученные таким образом цепочки содержат п—п±-\- + + • • • +гев столбцов. Эти п столбцов линейно независимы и составляют одну из искомых преобразую- преобразующих матриц Т. Доказательство линейной независимости полученных п столбцов проводится следующим образом. Любая линейная комбинация этих п столбцов может быть представлена в виде ЗЯ,=0, (92) 3=1 где Hj—линейная комбинации столбцов в жордановых цепочках (91), соответствую- соответствующих характеристическому числу Xj (/=1, 2, ..., s). Но любой столбец в жордано- ной цепочке, соответствующей характеристическому числу Xj, удовлетворяет урав- уравнению (A—X}E)mjx=0. Поэтому (A—XjE)ni Н3=0. (93) Возьмем фиксированное число } A <;} <; s) и построим интерполяционный мно- многочлен Лагранжа—Сильвестра г (Х\ (см. гл. V, §§ 1, 2) по следующим значениям на спектре матрицы: г (Xt)=r' (Xi) = ...=r(m'~1) (Я.г)=О при i ф j и r(Xj) = l, r' (Xj) = ...=r(mJ-i){Xj)=O. Тогда при любом i Ф} г (X) делится на (X—Х{) ' без остатка; поэтому в силу (93) r(A)Ht=0 AфГ). (94)
168 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI Точно так же разность г (К) — 1 делится на (к— r(A)Hj-=Hj. без остатка; поэтому (95) Помножая обе части (92) на г (А), мы согласно (94) и (95) получим: #/=0. Это справедливо для любого /=1, 2, ..., s. Но Hj есть линейная комбинация независимых столбцов, отвечающих одному и тому же характеристическому числу Xj (/=1, 2, ..., s). Поэтому все коэффициенты в линейной комбинации Hj (/ = 1, 2, , s) и, следовательно, все коэффициенты в (92) равны нулю. Замечание. Укажем на некоторые преобразования над столбцами матри- матрицы Т, при которых она остается преобразующей к той же жордановой форме (при том же расположении жордановых диагональных клеток): I. Умножение всех столбцов какой-либо мсордановой цепочки на произвольное число, отличное от нуля. II. Прибавление к каждому {начиная со второго) столбцу мсордановой цепочки предыдущего столбца той же цепочки, предварительно помноженного на одно и то же произвольное число. III. Прибавление ко всем столбцам мсордановой цепочки соответствующих столбцов другой цепочки, содержащей такое же или большее число столбцов и отвечающей тому же характеристическому числу. Пример 1. 1 0 0 1—1 О 1—2 3—3 0 0—1 2—2 1—110 1 1 _1 1_1 2 Элементарные делители матрицы А =W(KE,A) 1 0 0 0 0 1>( %_ 1 1 0 0 0 К)_ 42- 0 0 1 0 0 к* 0 0 1 1 0 4- 1 0 0 0 0 —1 А 1)А- Е. Вычисляем последовательно столбцы матрицы А* и соответствующие столбцы матриц С (К), С A), С (X), С A), С(—1). Нам нужно получить два линейно незави- независимых столбца матрицы. С A) и один отличный от нуля столбец матрицы С(—1). 1 0 0 2 2 1 = 0 0 1 0 0 1 — 2 2 —2 2 0 0 0 2 2 С 0 0 0 —2 —2 0 0 0 2 2 2 2 0 1 2 Ж 2 ; + (*• 2* 0 ; 2 - (+1) = 2* 2 0 0 1 1 * # >к ж -1) С {X 1 3 2 1 — 1 1 0 0 1 1 == 0 1 0 —1 —1 1 0 0 1 - 1 - 0 —2 1 1 1 0 1 0 -1 -1 С(- 1 3 2 0 —1 0 —2 — 1 1 1 - -1) — 1 3 2 0 -1 0 0 0 0 0 +( * >к 0 0 0 0 0 Я,2—Я, + BХ 0 Ж 4 Ж о >к 0 Ж — 1) — 1) 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1
ВТОРОЙ МЕТОД ПОСТРОЕНИЯ ПРЕОБРАЗУЮЩЕЙ МАТРИЦЫ 169 Поэтому 0 0 0 2 2 2 0 0 1 1 2 2 0 — 2 —2 1 3 2 1 — 1 0 4 4 0 0 c3(-i))= Матрицу Г можно несколько упростить. Последовательно 1) разделим пятый столбец на 4; 2) к третьему столбцу прибавим первый, к четвертому—второй; 3) из четвертого столбца вычтем третий; 4) разделим первый и второй столбцы на 2; 5) вычтем из второго столбца первый, предварительно помноженный на Получим матрицу 0 0 0 1 1 1 0 0 0 0 2 2 0 0 0 1 1 2 2 0 0 1 1 0 0 Предлагаем читателю проверить, что ATl=TjJ и | Тц Пример 2. 1 — 1 1 — 1 — 3 3 — 5 4 — 4 3 — 4 15 —10 11 —И — 110 0 0—1 10 0 0—10 J == Составляем многочлены и матрицы 2) о о 2 —1 0 0 Элементарные делители: 0 0 0—1 0 0 1 —1 о о —2 1 —1 2—1 1 — 1 — 3 4 — 5-4 8 _ 4 4—4 15 —10 11 —10 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 В качестве первых трех столбцов матрицы Т возьмем третьи столбцы этих матриц: Т = (С3, D$, F3, >К)- В матрицах С, D, F из первого столбца вычтем удвоен- удвоенный третий, а ко второму и четвертому столбцам прибавим третий. Получим: /-> 0 0 0 0 0 0 0 0 - 0 1 0 -1 0 0 0 0 0 7 0 7 0 — 1 0 1 1 — 5 4 11 0 1 0 1 10 0 0 0 10 0 —2111 0 0 0 1 обозначает х) Здесь нижний индекс означает номер столбца; например, четвертый столбец матрицы С( + 1). 2) Так как имеется только один элементарный делитель наивысшей степени, то ранг матрицы С должен быть равен единице. Поэтому достаточно, например, вычислить 7 элементов, стоящих в первом столбце и во второй строке матрицы С. Тогда сразу определятся остальные элементы матрицы С.
170 ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ МНОГОЧЛЕННЫХ МАТРИЦ [ГЛ. VI В матрицах D, F к первому столбцу прибавим четвертый столбец, умноженный на 7, а из второго столбца вычтем четвертый. Получим: г* 0 0 0 0 0 0 10 0 0 0 0 0 0—10 0 0 1 0 0—5 0 0 4 0 0 11 0 0 0 10 0 0 1 1 — 1 0 1 В качестве последнего столбца в Т берем первый столбец в F. Имеем: 0 10 1 1—500 0 4 15 Т=(С3, D3, FB, F±) = 11 0 7 Для контроля можно проверить, что AT=TJ и | Т \ ф 0.
ГЛАВА VII СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В п-МЕРНОМ ПРОСТРАНСТВЕ (ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ЭЛЕМЕНТАРНЫХ ДЕЛИТЕЛЕЙ) Изложенная в предыдущей главе аналитическая теория элементарных делителей дала нам возможность для любой квадратной матрицы определить подобную ей матрицу, имеющую «нормальную» или «каноническую» форму. С другой стороны, в главе III мы видели, что поведение линейного опера- оператора в и-мерном пространстве в различных базисах задается при помощи класса подобных матриц. Наличие в этом классе матрицы, имеющей нор- нормальную форму, тесно связано с важными и глубокими свойствами линей- линейного оператора в и-мерном пространстве. Изучению этих свойств посвящена настоящая глава. Исследование структуры линейного оператора приводит нас независимо от содержания предыдущей главы к теории преобразования матрицы к нормальной форме. Поэтому содержание настоящей главы может быть названо геометрической теорией элементарных делителейг). § 1. Минимальный многочлен вектора, пространства (относительно заданного линейного оператора) Рассмотрим n-мерное векторное пространство JS над полем К и линей- линейный оператор А в этом пространстве. Пусть х — произвольный вектор из И. Составим ряд векторов х, Ах, А%х, ... A) В силу конечномерности пространства найдется такое целое число p@^.p^Ln), что векторы ж, Ах, ..., Ар~Лх линейно независимы, &Avx есть линейная комбинация этих векторов с коэффициентами из поля К: Avx=— yiA^x — у2Ар'2х —... — урХ. B) Составим многочлен (p(h)=hp-\-yikp~1-\-...-\-yp_i'k-{-yp. Тогда равен- равенство B) запишется так: ц>(А)х = 0. C) Всякий многочлен ф (Я), для которого имеет место равенство C), мы будем называть аннулирующим многочленом для вектора х 2). Но нетрудно !) В основу излагаемой здесь геометрической теории элементарных делителей положена статья автора [81а]. Другие геометрические построения теории элементар- элементарных делителей см. в [14], §§ 96—99, а также [24] и [426]. 2) Конечно, подразумевается: относительно данного оператора А. Это обстоя- обстоятельство мы для краткости в определении не оговариваем, поскольку на протяжении всей этой главы мы будем иметь дело с одним оператором А.
172 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В n-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII видеть, что из всех аннулирующих многочленов для вектора х построен- построенный нами многочлен является аннулирующим многочленом наименьшей стецени со старшим коэффициентом 1. Такой многочлен мы будем называть минимальным аннулирующим многочленом вектора х или просто мини- минимальным многочленом вектора х. Заметим, что произвольный аннулирующий многочлен q>(X) векторах делится нацело на минимальный многочлен ф (X). В самом деле, пусть D) где v. (X), q (X) — частное и остаток от деления ф (X) на ф (X). Тогда ср (А) х = к (А) ср (А) ж-\-q (А) х = Q (А) зс E) и, следовательно, q(A)x = 0. F) Но степень остатка q (X) должна быть меньше степени минимального многочлена ф (X). Значит, q (X) = 0. Из доказанного предложения следует, в частности, что каждому вектору х отвечает только один минимальный многочлен. Выберем в пространстве В некоторый базис еи е2, ..., еп. Обозначим через Цч(Х), ц>2(Х), ...,<рп(Х) минимальные многочлены базисных век- векторов еи е2, ..., еп, а через ty(X) — наименьшее общее кратное этих много- многочленов (t}> (X) берем со старшим коэффициентом 1). Тогда ф (X) будет аннулирующим многочленом для всех базисных векторов е4, е2, ..., еп. Так как произвольный вектор ж?Н представляется в виде х = х^е^ + + х2е2+...+хпеп, то г|) (А) х = х^ (А) в! + ж2-ф (А) е2 + ... + М3 (-4) е„ = 0, т. е. Ф(^) = 0. G) Многочлен т|з (X) является аннулирующим многочленом для всего про- пространства В. Пусть •ф (X) — произвольный аннулирующий многочлен для всего пространства 1?. Тогда •ф (X) будет аннулирующим многочленом для базисных векторов еи е2, ..., еп. Следовательно, чр (X) должен быть общим кратным для минимальных многочленов ф! (X), ц>2 (X), ..., Ц>п(Х) этих векторов, и потому многочлен •ф (X) должен делиться на наимень- наименьшее общее кратное т|э(&) без остатка. Отсюда следует, что из всех аннулирующих многочленов для всего пространства В построенный нами многочлен •ф(Я) имеет наименьшую степень и старший коэффициент 1. Такой многочлен однозначно определяется заданием пространства R и оператора А и называется минимальным многочленом пространства Л г). Единственность минимального многочлена пространства R следует из установленного выше положения: произвольный аннулирующий много- многочлен т|э (X) пространства В делится нацело на минимальный многочлен •ф (X). Хотя само построение минимального многочлена 'ф (X) было связано х) Если оператору А в некотором базисе ех, е2, ..., еп соответствует матрица .4=||агй!|Р, то аннулирующий или минимальный многочлен пространства R (относи- (относительно А) будет аннулирующим или соответственно минимальным многочленом матрицы А и наоборот. Ср. с гл. IV, § 5.
§ 2] ПЕРВАЯ ТЕОРЕМА О РАСЩЕПЛЕНИИ 173 с определенным базисом еи е2, , еп, однако многочлен ip (К) не зависит от выбора зтого базиса (зто вытекает из единственности минимального многочлена для пространства И). Наконец, отметим еще, что минимальный многочлен пространства R является аннулирующим для ¦ любого вектора х из В, и потому мини- минимальный многочлен пространства делится без остатка на минимальный многочлен любого вектора из этого пространства. § 2. Расщепление на' инвариантные подпространства с взаимно простыми минимальными многочленами Подпространство Ш cr H называется инвариантным относительно дан- данного оператора А, если АН' cz М', т. е. из х?В? следует Ах?Л'. Другими словами, оператор А переводит векторы инвариантного под- подпространства снова в векторы этого же подпространства. В дальнейшем мы будем производить расщепление всего пространства (см. гл. III, § 1) на инвариантные относительно А подпространства. Такое расщепление сводит изучение поведения оператора во всем пространстве к изучению его поведения в отдельных составляющих подпространствах. Докажем теперь следующую теорему: Теорема 1 A-я теорема о расщеплении пространства на инвариантные подпространства). Если для данного линей- линейного оператора А минимальный многочлен пространства г]; (X) представ- представляется в поле К в ¦ виде произведения двух взаимно простых многочле- многочленов %(Я) и г|J(Я) (со старшими коэффициентами, равными единице), Ъ(Ь) = ЫЬ)ЫЬ), (8) то все пространство И расщепляется на два инвариантных подпро- подпространства Ii U 12, В^1, + 1Ъ (9) для которых минимальными многочленами служат соответственно мно- множители tyi (X) и г];2 (X). Доказательство. Обозначим через Г4 совокупность всех векто- векторов зс, удовлетворяющих уравнению tyt (A)x = 0. Аналогично определим 1г с помощью уравнения г]J(-4)ас = О. Определенные таким образом J4 и J2 суть подпространства в М. Из взаимной простоты г)^ (Я,) и г|J (К) вытекаетх) существование таких многочленов %i(^)H%2(A.) (с коэффициентами из К), что имеет место тож- тождество Пусть теперь ж — произвольный вектор из И. Заменим в A0) % на А и применим обе части полученного операторного равенства к вектору х: A1) т. е. х = х' + х", A2) где . A3) См., например, [20], стр. 177.
174 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В и-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII Далее, г]), (А) х' = -ф (А) ъ, (Л) * = 0, ^ (Л) ас" = ф U) Xl (^) ж = О, т. е. ас' ^ Ji и х" ? J2. J4 и 1г не имеют общих векторов, отличных от нуля. Действительно, если жо?1~1 и хо?12, т. е. •ф1(Л)аго = 0 и г);2(^1)ж0 = 0, то в силу A1) х0 = xi С^) % (^) ^о + Х2 (-4) Фа (^) ас0 = 0. Таким образом, доказано, что 12=1"! 4-^2- Пусть, далее, х? 1±. Тогда ¦tyi(A)x = Q. Помножая обе части этого ра- равенства слева на А и переставляя местами А и i|)i( А), получим1^ (А) Ах=0, т. е. Аж ? 1±. Этим доказано, что подпространство 11 инвариантно относи- относительно А. Аналогично доказывается инвариантность подпространства 1г. Докажем теперь, что "ф± (К) есть минимальный многочлен для J4. Пусть i|5i(X) — произвольный аннулирующий многочлен для 1и а х — про- произвольный вектор из В. Используя уже установленное разложение A2),. напишем: % (А) Ц2{Л)х = "ф2 (А) Ь (А) х' + & (A) ife D) аи' = 0. Поскольку х—произвольный вектор из В, то отсюда вытекает, что про- произведение % (Я) фг (X) есть аннулирующий многочлен для В и потому делится без остатка на г]; М = ^i (^) 'Фг (^); другими словами, % (X) делится на tyi (Я). Но %(Я)—произвольный аннулирующий многочлен для 1Ь а %(Я) — один из аннулирующих многочленов (в силу определения 2^). Значит, i|)i (Я) есть минимальный многочлен для 1±. Совершенно ана- аналогично доказывается, что т|э2 (Я) есть минимальный многочлен для инвариантного подпространства 12. Теорема доказана полностью. Разложим многочлен чр (X) на неприводимые в поле К множители: [ф2 (Я)]С2 ... [ф. (^)lCs A4) (здесь ф1 (к), ф2 (^)i • •.» фв (^) — различные неприводимые в jfif многочлены со старшими коэффициентами 1). Тогда на основании доказанной теоремы JB=J1 + J2+...+Js, A5) где Ik — инвариантное подпространство с минимальным многочленом [фй(Я)Г* (* = 1, 2, ...,»). Таким образом, доказанная теорема сводит изучение поведения линейного оператора в произвольном пространстве к изучению поведения этого оператора в пространстве, где минимальный многочлен есть степень неприводимого в К многочлена. Это обстоятельство будет нами использо- использовано для доказательства следующего важного для нас предложения: Теорема 2. В пространстве всегда существует вектор, минималь- минимальный многочлен которого совпадает с минимальным многочленом всего про- пространства. Доказательство. Рассмотрим сначала тот частный случай, когда минимальный многочлен пространства В есть степень неприво- неприводимого в К многочлена ф(Я):
§ 3] СРАВНЕНИЯ. НАДПРОСТРАНСТВО 175 Выберем в В базис eit ez, ¦ ¦ ¦, Вп- Минимальный многочлен вектора et является делителем многочлена •ф (К) и поэтому представляется в виде )г где 1^1 (» = 1, 2, ...,п). Но- минимальный многочлен пространства есть наименьшее общее кратное минимальных многочленов базисных векторов, т. е. •ф (Я) сов- совпадает с наибольшей из степеней [ф (Я)]гг (г = 1, 2, ...,п). Другими словами, г); М ^совпадает с минимальным многочленом одного из базисных векторов ei, е2, ..., е„. Переходя к общему случаю, докажем предварительно следующую лемму: Лемма. Если минимальные многочлены векторов е' и е" взаимно просты, то минимальный многочлен суммы векторов е' + е" равен произ- произведению минимальных многочленов слагаемых векторов. Доказательство. В самом деле, пусть Xi (Я) и %2 (X) — минималь- минимальные многочлены векторов е' и е". По условию XiM и ХгМ взаимно просты. Пусть % (Я) — произвольный аннулирующий многочлен для вектора е = е' + е". Тогда Х2(А)Х {А)е' = Х2(А)%(А)е-%(А)%г(А)е" = О, т- е- Х2(^)х(^) есть аннулирующий многочлен для е'. Следовательно, Хг (М X (^) делится без остатка на Xi (^). и так как 5A M и %2 (К) взаимно просты, то х М делится на Xi (^-)- Аналогично доказывается, что % (^) делится на 5B М- Но %! (Я) и Хг (^) взаимно просты. Следовательно, % (^) делится на произведение %i (^) Хг (^)- Итак, произвольный аннулирующий многочлен вектора е делится на аннулирующий многочлен %, (К) %г (X). Поэтому Xi M Хг (^) и будет минимальным многочленом вектора е = ' " + Вернемся к теореме 2. Для доказательства в общем случае исполь- используем расщепление A5). Так как минимальные многочлены подпространств Ji, J2, ..., Is суть степени неприводимого многочлена, то для этих под- подпространств наше предложение уже доказано. Поэтому существуют такие векторы e'?Ii, е"? 12, ..., е<6>?2~8, минимальными многочленами кото- которых будут соответственно [ф^Я)]0!, [ф2(Я)]с2, ..., [9s(?u)]Cs. В силу леммы минимальный многочлен вектора е = е' + е" + + e(s) равен произведению [ф1 (Я)]С1 [ф2 (Я)]С2... ф6 (X)]°s, т. е. равен минимальному многочлену про- пространства М. § 3. Сравнения. Надпространство Пусть дано некоторое подпространство I cz R. Мы будем говорить, что два вектора х, у из И сравнимы по modj, и будем писать х = у (mod I) в том и только в том случае, если у — х?1. Легко проверя- проверяется, что введенное таким образом понятие сравнения обладает следую- следующими свойствами: для любых х, у, z cz В, 1. х = х (modJ) (рефлективность сравнения). 2. Из х = у (mod I) следует у = зс (mod I) (обратимость или симме- симметричность сравнения). 3. Из xssy, у = z (mod I) следует х = z (mod Г) (транзитивность сравнения). Наличие этих трех свойств сравнения дает нам возможность распре- распределить все векторы пространства на классы, относя в каждый класс век- векторы, попарно сравнимые между собой jjo modj (векторы из разных классов уже будут несравнимы по modJ). Класс, содержащий вектор х,
176 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В и-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII будем обозначать через ас1). Само подпространство I будет одним из этих классов, а именно, классом 0. Обратим внимание, что каждому сравне- сравнению х = у (mod I) отвечает равенство 2) соответствующих классов: х = у. Элементарно доказывается, что сравнения можно почленно склады- складывать и почленно умножать на число из К: 1. Из х = х', 2/= ?/' (modj) следует х + у = х' + у' (modi). 2. Из х = х' (mod I) следует азе = ах' (modi) (а ? К). Эти свойства сравнения показывают, что операции сложения и умно- умножения на число из К не «ломают» классов. Если возьмем два класса х и у и будем складывать элементы х, х', ... первбго класса с любыми элементами у, у', ... второго класса, то все полу- 3 х у х^у ченные таким образом суммы будут принадлежать одному и тому же классу, который мы назовем сум- суммой классов х и у и обозначим через х-\-у. Анало- Аналогично, если все векторы х, х', ... класса х умножим на число а?К, то полученные произведения будут принадлежать одному классу, который обозначим через ах. Таким образом, в многообразии Л всех классов ж, у, ... введены две операции: «сложение» и «умно- «умножение» на число из К. Эти операции, как легко проверить, обладают свойствами, сформулированными в определении векторного пространства (гл. III, § 1) Рис. 4. Поэтому S, как и Л, есть векторное пространство над полем К. Мы будем называть R надпространством по отношению к К. Если п, т, п — числа измерений соответственно пространств Л, I, R, то п = п — т. Все введенные в этом параграфе понятия можно очень хорошо про- проиллюстрировать на следующем примере. Пример. Пусть 11—совокупность всех векторов в трехмерном пространстве, К — поле вещественных чисел. Для большей наглядности будем векторы изобра- изображать в виде направленных отрезков с началом в точке О. Пусть I—некоторая прямая, проходящая через О (точнее, совокупность векторов, идущих вдоль неко- некоторой прямой, проходящей через О; рис. 4). Сравнение ж = ж' (mod Г) означает, что векторы жиж' отличаются на-вектор из I, т. е. отрезок, соединяющий концы жиж', параллелен прямой I. Поэтому класс ж изобразится прямой, проходящей через конец вектора ж и параллельной I, точнее, «щеткой» векторов, исходящих из О, концы которых лежат на этой прямой. «Щетки» можно складывать и умножать на вещественное число (складывая и умно- умножая векторы, входящие в эти щетки). Эти «щетки» и являются элементами над- пространства R. В данном примере n=3, m=l, п=2. Другой пример получим, если в качестве I возьмем плоскость, проходящую через точку О. В этом примере n=3, m=2, n=l. Пусть теперь в R задан линейный оператор А. Предположим, что I есть инвариантное подпространство относительно А. Читатель легко г) Так как каждый класс содержит бесчисленное множество векторов, то в силу этого условия он имеет и бесчисленное множество обозначений. 2) То есть совпадение.
§ 4] ВТОРАЯ И ТРЕТЬЯ ТЕОРЕМЫ О РАСЩЕПЛЕНИИ 177 докажет, что из х = ж' (modJT) следует Ах = Ах' (modJT), т. е. что к обеим частям сравнения можно применять оператор А. Другими сло- словами, если ко всем векторам х, х', ... некоторого класса х применить оператор А, то полученные векторы Ах, Ах',... также принадлежат к одному классу, который мы обозначим через Аос. Линейный опера- оператор А переводит класс в класс и, таким образом, является линейным оператором в Л. Мы будем говорить, что векторы Xi, x2, .. .,хр линейно зависимы по mod I, если существуют такие числа сц, а2, ..., ар в К, не равные одновременно нулю, что сцяс! + а2ас2 + ... + o-qxp = 0 (mod I). A6) Заметим, что не только понятие о линейной зависимости векторов, но все понятия, все предложения и рассуждения, приведенные в предыду- предыдущих параграфах этой главы, могут быть слово в слово повторены с одной лишь заменой всюду знака = знаком = (mod I), где I—некоторое фикси- фиксированное подпространство, инвариантное относительно А. Таким образом, вводятся понятия аннулирующий, минимальный многочлен вектора, пространства по mod J. Все эти понятия мы будем называть «относительными» в отличие от введенных ранее «абсолютных» понятий (имеющих место при знаке =). Обратим внимание читателя на то, что относительный минимальный многочлен (вектора, пространства) есть делитель абсолютного. Пусть, например, ct (к) есть относительный минимальный многочлен вектора х, а с (к) — соответствующий абсолютный минимальный многочлен. Тогда а(А)х = О; но отсюда следует, что и с(А)х = 0 (modi). Поэтому а (к) является относительным аннулирующим многочленом для вектора ос и как таковой делится без остатка на относительный мини- минимальный многочлен Oi (к). Наряду с «абсолютными» предложениями предыдущих параграфов мы имеем и «относительные» предложения. Так, например, имеем пред- предложение: «В любом пространстве всегда существует вектор, относитель- относительный минимальный многочлен которого совпадает с относительным мини- минимальным многочленом всего пространства». Справедливость всех «относительных» предложений обусловлена тем, что, оперируя со сравнениями по mod I, мы по существу имеем дело с равенствами, только не в пространстве R, а в надпространстве Л. § 4. Расщепление пространства на циклические инвариантные подпространства Пусть а (к) = № +'«i^p~1 -(-•••+ a-p-ik + ар — минимальный мно- многочлен вектора е. Тогда векторы A7) линейно независимы, а Аре = -аре-ар^Ае — ... -^А^е. A8) 12 Ф. р. Гантмахер
•178 СТРУКТУРА ЛИНЕЙНОГО -ОПЕРАТОРА В n-MEPHOM ПРОСТРАНСТВЕ [ГЛ. VII Векторы A7) образуют базис некоторого р-мерного подпростран- подпространства I. Это подпространство мы будем называть циклическим, имея в виду специальный характер базиса A7) и равенство A8) *). Оператор А пере- переводит первый из векторов A7) во второй, второй — в третий и т. д. По- Последний же базисный вектор переводится оператором А в линейную комби- комбинацию базисных векторов согласно равенству A8). Таким образом, опе- оператор А переводит любой базисный вектор в вектор из I; значит, он и произвольный вектор из I переводит в вектор из I. Другими словами, циклическое подпространство всегда инвариантно относительно А. Произвольный вектор х ? I представляется в виде линейной комбина- комбинации базисных векторов A7), т. е. в виде ,- A9) где х (^) — многочлен от К с коэффициентами из К степени <; р — 1. Пере- Перебирая всевозможные многочлены % (к) степени <s^p — 1с коэффициен- коэффициентами из К, мы получим все векторы из I, и при этом каждый вектор ж ? I только один раз, т. е. только при одном многочлене % (К). Имея в виду базис A7) либо формулу A9), мы будем говорить, что вектор е порождает подпространство X. Заметим еще, что минимальный многочлен порождающего вектора е будет одновременно и минимальным многочленом всего подпространства I. Сейчас нам предстоит установить основное предложение всей этой теории, согласно которому пространство 1J расщепляется на циклические подпространства. Пусть яр! (К) = я|) (К) = Кт + щК™'1 -)-...-)- ат есть минимальный многочлен пространства В. Тогда в пространстве существует вектор е, для которого этот многочлен является минимальным (теорема 2, стр. 174). Пусть li обозначает циклическое подпространство с базисом е, Ае, ..., А^е. B0) Если п = т, то В = I"i. Пусть п > т и пусть многочлен будет минимальным многочленом В, по mod 1г. Согласно замечанию, сде- сделанному в конце § 3, я|J (^) будет делителем я|)! (К), т. е. существует такой многочлен у. (К), что Ы*) ЫА)(Я). B1) Далее, в ^существует вектор д*, относительный минимальный много- многочлен которого есть я|J (^). Тогда Ы4)Р* = ° (modJi), B2) т. е. существует многочлен % (К) степени < т — 1 такой, что . B3) Применим к обеим частям этого равенства оператор к (А). Тогда слева в силу B1) получим \р1 (А) д*, т. е. нуль, поскольку -ф4 (к) есть абсолютный минимальный многочлен пространства; следовательно, = 0. B4) х) Правильнее было бы называть это подпространство циклическим относительно линейного оператора А. Но, поскольку вся теория строится для одного оператора А, мы для сокращения опускаем слова «относительно линейного оператора Л» (см. ана- аналогичное замечание в сноске 2) к стр. 171).
§ 4] ВТОРАЯ И ТРЕТЬЯ ТЕОРЕМЫ О РАСЩЕПЛЕНИИ 179 Это равенство показывает, что произведение % (k)j (к) является анну- аннулирующим многочленом для вектора е и потому делится без остатка на минимальный многочлен яр4 (к) =х (к) я]J (к), т. е. % (к) делится на я]J (к): %(к) = щ(к)Ц2(к), B5) где %j (к) — некоторый многочлен. Используя зто разложение много- многочлена х (^7 мы равенство B3) сможем записать так: 0, B6) где вектор д определяется равенством 9 = 0*-ъ(А)е. B7) Последнее равенство показывает, что д^д* (modJO. B8) Поэтому я|з2 (к), будучи относительным минимальным многочленом для вектора д*, будет таковым и для вектора д. Но тогда из равенства B6) следует, что я]J (к) является одновременно и абсолютным минимальным многочленом для вектора д. Из того, что я|J (к) есть абсолютный минимальный многочлен век- вектора д, следует, что подпространство 12 с базисом д,Ад,...,А*-*д B9) будет циклическим. Из того, что я|з2 (к) есть относительный минимальный многочлен для д по mod It, вытекает, что векторы B9) линейно независимы по mod J, т. е. никакая линейная комбинация векторов B9) с не равными одно- одновременно нулю коэффициентами не может равняться линейной комбина- комбинации векторов B0). Так как эти последние сами линейно независимы, то последнее наше утверждение означает линейную независимость т -\- р векторов е, Ае, ..., Ат-ге; д,Ад,..., Ар1д. C9) Векторы C0) образуют базис инвариантного подпространства It -f-12 с числом измерений т -\- р. Если п = т -{- р, то Ц = Ii -\- 12. Если же п > т -\-р, то мы рас- рассмотрим jR по mod (Jj -|- 1г) и продолжим далее наш процесс выделения циклических инвариантных подпространств. Так как все пространство R конечномерно, имеет п измерений, то этот процесс должен приостано- приостановиться на некотором подпространстве It, где t < п. Мы приходим к следующей теореме: Теорема 3 B-я теорема о расщеплении про- пространства на инвариантные подпространства). Пространство всегда можно расщепить на циклические относительно данного линейного оператора А подпространства 1и 12, . . ., It с мини- минимальными многочленами ijjj (k), я|J (к), . . ., %(Х), jB^JTi + ^+.-.+J* C1) так, чтобы я|)! (к) совпадало с минимальным многочленом ty (к) всего про- пространства и каждое ij)j (k) было бы делителем tyi-i (к) (i = 2, 3, . . ., t). Отметим теперь некоторые свойства циклических пространств. Пусть В — циклическое n-мерное пространство, яр (к) = кт -\- ... — минималь- минимальный многочлен этого пространства. Тогда из определения циклического пространства следует, что т = п. Обратно, пусть нам дано произвольное 12*
180 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В и-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII пространство В и известно, что т = п. Применяя доказанную теорему о расщеплении, мы представим В в виде C1). Но число измерений цикли- циклического подпространства Ji равно т, так как его минимальный многочлен совпадает с минимальным многочленом всего пространства. Так как по условию т = п, то В= 11, т. е. R есть циклическое пространство. Таким образом, установлен следующий критерий циклич- цикличности пространства: Теорема 4. Пространство циклично тогда и только тогда, когда его число измерений совпадает со степенью его минимального многочлена. Пусть теперь мы имеем расщепление циклического пространства It на два инвариантных подпространства 11 и 12: B = Ii + I2- C2) Обозначим числа измерений пространств М, Xt и 12 соответственно через п, щ и п2, минимальные многочлены этих пространств — через я|) (к), ярл (к) и я|J (к), степени этих минимальных многочленов — через т, mt и т2. Тогда mt<ni, m2<n2. C3) Сложим почленно эти неравенства: C4) Так как я|) (к) есть наименьшее общее кратное многочленов я^ (к)) и 4jJ2 (к), то \ C5) Кроме того, из C2) следует: п = щ + п2. C6) C4), C5) и C6) дают нам цепочку соотношений n. C7) Но в силу цикличности пространства В крайние числа в этой цепоч- цепочке, числа тик, равны между собой. Следовательно, имеет место равенство и в промежуточных звеньях этой цепочки, т. е. т = ту -(- т2 = щ -\~ п2. Из того, что т = mt -{- т2, заключаем, что ij>i (к) и я|J (к) взаимно просты. Из mt + m2 = щ -{- п2, принимая во внимание C3), находим: тЛ = пи т2 = п2. C8) Эти же равенства означают цикличность подпространства It и 12. Таким образом, мы приходим к следующему предложению: Теорема 5. Циклическое пространство расщепляется только на такие инвариантные подпространства, которые 1° сами циклические и 2° имеют взаимно простые минимальные многочлены. Те же рассуждения (проведенные в обратном порядке) показывают, что теорема 5 допускает обращение. Теорема 6. Если пространство расщепляется на инвариантные' подпространства, которые 1° являются циклическими и 2° имеют взаимно простые минимальные многочлены, то само пространство является цик- циклическим.
§ 4] ВТОРАЯ И ТРЕТЬЯ ТЕОРЕМЫ О РАСЩЕПЛЕНИИ 181 Пусть теперь И — циклическое пространство и минимальный много- многочлен его есть степень неприводимого в поле К многочлена: ip (к) = = [ф (к) ]с. В этом случае минимальный многочлен любого инвариант- инвариантного подпространства в Л тоже будет степенью этого неприводимого многочлена ср (к). Следовательно, минимальные многочлены любых двух инвариантных подпространств не могут быть взаимно простыми. Но тогда в силу доказанного предложения М не расщепляется на инвариант- инвариантные подпространства. Пусть, обратно, известно, что некоторое пространство Ц не расщеп- расщепляется на инвариантные подпространства. Тогда В, — циклическое про- пространство, иначе его можно было расщепить с помощью второй теоремы о расщеплении на циклические подпространства; кроме того, минималь- минимальный многочлен И должен быть степенью неприводимого многочлена, так как в противном случае R можно было бы расщепить на инвариантные подпространства в силу первой теоремы о расщеплении. Таким образом, приходим к следующему выводу: Теорема 7. Пространство не расщепляется на инвариантные подпространства тогда и только тогда, когда 1° оно циклическое и 2° минимальный многочлен его есть степень неприводимого в поле К мно- многочлена. Вернемся теперь к расщеплению C1) и разложим минимальные мно- многочлены -ф± (к), я|J (к), . . ., % (к) циклических подпространств 1и 12, ¦ ¦ ¦ . . ., It на неприводимые в поле К множители: = [ф! (*¦)]* [ф2 (Vf2 ¦ ¦ . [ф. (k)fS, C9) |)( (к) = [ф! (к)] * [ф2 (к)\ 2 . . . (Cft ^ Oft !^ ... ^ 'ft ^- U; /с — 1, ^, ..., s) ). Применим к Xi первую теорему о расщеплении. Тогда получим: где Tj, I'i, . . ., JiS) — циклические подпространства с минимальными многочленами [ф! (^)]С1, [фг (^)]С2, • • -, [ф8 (k)]cs. Аналогично расщепим подпространства 12, . . ., It- Тем самым мы получим расщепление всего пространства JJ на циклические подпространства с минимальными мно- многочленами [фй (k)ch, [фй (k)]dh, . . ., [фй (k)]lk(k = 1, 2, . . ., s) (при этом выбрасываются те степени, у которых показатели равны нулю). Из теоремы 7 следует, что зти циклические подпространства уже далее нерасщепимы (на инвариантные подпространства). Приходим к следую- следующей теореме: Теорема 8 C-я теорема о расщеплении прост- пространства на инвариантные подпространства). Пространство всегда можно расщепить на циклические инвариантные подпр остр анства Гт D0) так, чтобы минимальный многочлен каждого из этих циклических под- подпространств был степенью неприводимого многочлена. Некоторые из показателей dfc, . . ., lh при к > 1 могут равняться нулю.
182 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В n-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII Эта теорема дает расщепление пространства на нерасщепимые далее инвариантные подпространства. Замечание. Теорему 8 C-ю теорему о расщеплении) мы полу- получили, применяя первые две теоремы о расщеплении. Однако 3-ю теорему о расщеплении можно получить другим путем, а именно, как непосред- непосредственное (почти тривиальное) следствие из теоремы 7. Действительно, пространство R, если оно вообще расщепляется, всегда можно расщепить на нерасщепимые далее инвариантные подпро- подпространства: Согласно теореме 7 каждое из слагаемых подпространств является цикли- циклическим и имеет в качестве своего минимального многочлена степень неприводимого в К многочлена. § 5. Нормальная форма матрицы Пусть It — m-мерное инвариантное подпространство в В. Выберем в It произвольно базис еи е2, . . ., ет и дополним его до базиса в В: Посмотрим, как будет выглядеть матрица А оператора А в этом базисе. Напомним читателю, что к-й столбец матрицы А заполняется координатами вектора Aeh (к = 1, 2, . . ., п). При к <; т вектор Aeh ? II (в силу инвариантности 14) и, следовательно, последние п — т коор- координат вектора Авъ равны нулю. Поэтому матрица А имеет такую форму: т п — т D1) где Л( и А2 — квадратные матрицы порядка тип — т, а А3 — прямо- прямоугольная матрица. Равенство нулю четвертого «блока» и выражает инва- инвариантность подпространства It. Матрица As задает оператор А в 1у (при базисе elf е2, . . ., ет). Допустим теперь, что em+i, . . ., еп тоже есть базис некоторого инвариантного подпространства 12, т. е. R = Х4 -|- 12 и базис всего про- пространства составлен из двух частей, которые служат базисами в инва- инвариантных подпространствах It и 12. Тогда, очевидно, в D1) и блок А3 будет равен нулю и матрица А будет иметь квазидиагональный вид: D2) где AiH Az — квадратные матрицы порядков тип — иг, задающие опе- оператор в подпространствах Ii и J2 (при базисах соответственно elt е2, . . . . . ., ет и em+i, . . ., еп). Нетрудно видеть, что и, обратно, квазидиаго- квазидиагональному виду матрицы всегда соответствует расщепление пространства на инвариантные подпространства (при этом базис всего пространства составлен из базисов этих подпространств). В силу 2-й теоремы о расщеплении мы можем расщепить все про- пространство ii на циклические подпространства JTi, I2, . . ., It: D3)
§ 5] НОРМАЛЬНАЯ ФОРМА МАТРИЦЫ 183 В ряду минимальных многочленов этих подпространств -ф± (К), я|J (^)i • • . . . ., я|5{ (К) каждый многочлен есть делитель предыдущего (отсюда уже автоматически следует, что первый многочлен есть минимальный мно- многочлен всего пространства). Пусть Я|I {к) = Кт + аД™ + . . . + ат, ..>v). D4) Обозначим через е, д, . . ., I порождающие векторы в подпростран- подпространствах 1±, 12, • . •, It и составим базис всего пространства В из следую- следующих базисов циклических подпространств: е,Ае,..., Ат~Ч\ д, Ад, ..., Av~xg\ ...; l,Al,..., А*Ч. D5) Посмотрим, какова будет матрица Lj, отвечающая оператору А в этом базисе. Как было выяснено в начале этого параграфа, матрица L\ должна иметь квазидиагональную форму О ... 0\ I. D6) . О 0 ... и) Матрица Lt отвечает оператору Ав It при базисе et = е, е2 = Ае, . . . . . ., ет = Ат~1е. Припоминая правило составления матрицы по задан- заданному оператору и заданному базису (гл. III, стр. 71), найдем: 0 0 ... О 1 0 ... О О Г . Аналогично — «m-l 0 О о о 1 О О 1 о 1 о о 'о 'l а2 Рр D7) — Р2 -Pi D8) о о и т. д. Вычислив характеристические многочлены матриц Lt, L2, . . ., Lt, получим: (для циклических подпространств характеристический многочлен опе- оператора А совпадает с минимальным многочленом подпространства отно- относительно этого оператора).
184 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В гг-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII Матрица Li отвечает оператору А в «каноническом» базисе D5). Если А — матрица, отвечающая оператору А в произвольном базисе» то матрица А подобна матрице Ьг, т. е. существует такая неособенная матрица Т, что А = TLJT-\ D9) Про матрицу Li мы будем говорить, что она имеет первую естествен- естественную нормальную форму. Первая естественная нормальная форма харак- характеризуется 1) квазидиагональным видом D6), 2) специальной структурой диагональных клеток D7), D8) и т. п., 3) дополнительным условием: характеристический многочлен каж- каждой диагональной клетки делится нацело на характеристический много- многочлен следующей клетки. Точно так. же, если бы цы исходили не из 2-й, а из 3-й теоремы о рас- расщеплении, то в соответствующем базисе оператору А отвечала бы ма- матрица Z/ц, имеющая вторую естественную нормальную форму, характе- характеризуемую 1) квазидиагональным видом ¦^и = {Li, Lz, ..., Lu), 2) специальной структурой диагональных клеток D7), D8) и т. п., 3) дополнительным условием: характеристический многочлен каж- каждой клетки является степенью неприводимого в поле К многочлена. В следующем параграфе мы покажем, что в классе подобных ма- матриц, отвечающих одному и тому же оператору, существует только одна матрица, имеющая первую нормальную форму *), и только одна 2), имею- имеющая вторую нормальную форму. Более того, мы дадим алгоритм для нахождения многочленов % (к), ф2 (^), • • •» % Щ по элементам ма- матрицы А. Знание этих многочленов даст нам возможность выписать все элементы матриц Li и Ьц, подобных матрице А и имеющих соответ- соответственно первую и вторую нормальную форму. § 6. Инвариантные многочлены. Элементарные делители 1 3). Обозначим через Dp (к) наибольший общий делитель всех мино- миноров р-то порядка характеристической матрицы А% = %Е — А (р = = 1, 2, . . ., п) 4). Так как в ряду Dn(X), Dn^(K), ...,D1 (I) каждый многочлен делится на последующий без остатка, то формулы х) Это не означает, что существует только один канонический базис вида D5). Канонических базисов может быть много, но всем им отвечает одна и та же матрица Lj. 2) С точностью до порядка диагональных клеток. 3) В п. 1 настоящего параграфа повторяются для характеристической матрицы основные понятия гл. VI, § 3, установленные там для произвольной многочленной матрицы. *) В наибольшем общем делителе всегда выбираем старший коэффициент рав- равным единице.
§ 6] ИНВАРИАНТНЫЕ МНОГОЧЛЕНЫ. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 185 определяют п многочленов, произведение которых равно характеристи- характеристическому многочлену b(b) = \№—A\ = Dn(X) = it (к) i2 (к)... in (к). E1) Многочлены ip (к) (р = 1, 2, . . ., п) разложим на неприводимые в поле К множители: ip (к) = [Ф1 (*)]** [ф2 (Х)]6р ... (р = 1, 2, ..., /г), E2) где ф4 (к), Фг (к), • • • — различные неприводимые в поле К многочлены. Многочлены] ц (к), i2 (к), . . ., in (к) называются инвариантными многочленами, а все степени, отличные от постоянной, среди [9i(X)]vp, [ф2 (к)] 6р, . . ., называются элементарными делителями характеристи- характеристической матрицы А% = кЕ — А или просто матрицы А. Произведение всех элементарных делителей, как и произведение всех инвариантных многочленов, равно характеристическому много- многочлену Д (к) = | кЕ - А |. Название «инвариантные многочлены» оправдано тем, что две подоб- подобные' матрицы А и А А = Т-*АТ E3) всегда имеют одни и те же инвариантные многочлены iP(k) = Tp(k) (p = l,2,...,n). E4) Действительно, из E3) следует: A% = LE — A = Т-1 (кЕ — А)Т = Т~ЫкТ. E5) Отсюда (см. гл. I, § 2) получаем соотношение между минорами подоб- подобных матриц Ах и А^: I ц i2 . . . iv А% \ ktk2 ... (/7=1, 2, ...,n). Это равенство показывает, что каждый общий делитель всех миноров р-то порядка матрицы А% является общим делителем всех миноров р-то порядка матрицы А% и наоборот (поскольку матрицы А и А можно по- поменять местами). Отсюда вытекает: Dp (к) = Dp (к) (р = 1, 2, ... , п) и, следовательно, имеет место E4). Поскольку все матрицы, представляющие данный оператор А в раз- различных базисах, подобны между собой и потому имеют одни и те же инвариантные многочлены и, следовательно, одни и те же элементарные делители, то можно говорить об инвариантных многочленах и элемен- элементарных делителях оператора А. 2. Возьмем теперь в качестве А матрицу Ь\, имеющую первую естественную нормальную форму, и вычислим инвариантные многочлены матрицы А, исходя из вида матрицы А^ = кЕ — А (на схеме E7) эта
186 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В n-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII [атр1 -1 0 0 0 0 0 0 0 0 0 0 0 0 и 0 ща 0 X —1 0 0 0 0 0 0 0 0 0 0 0 0 0 выписана 0 0 К J 0 0 0 к 0—1 а 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 для а5 а4 а3 а2 0 0 0 0 0 0 0 0 0 0 0 случая п 0 0 0 0 0 К — 1 0 0 0 0 0 0 X 0-1 0 0 0 0 0 0 0 0 0 — 0 0 0 0 0 0 0 i. = 5, p 0 0 0 0 0 0 0 X IP 0 0 0 0 0 0 0 0 0 0 0 0 р4 Рз р2 j ! ! 0 J о i 0 0 0 = 4, 0 0 0 0 0 0 0 0 0 к — 1 9 = 4, г 0 0 0 0 0 0 0 0 0 0 к 0 — 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 к 0-1 1 0 0 0 0 0 0 = 3): 0 0 0 0 0 0 и 0 0 Y4. ¦Уз Y2 0 0 0 0 0 0 0 0 0 0 0 0 I о ! о 1 о 1 1 0 | X i-1 | 0- 0 0 0 0 0 0 0 0 0 0 0 0 0 0 к -1 0 0 0 0 0 0 0 . о 0 0 0 0 0 - _____ Е2 Ei + K Пользуясь теоремой Лапласа, найдем: Dn (К) = | КЕ — А | = | kE — Li\\XE—L2\...\kE \ = ty1 {k) ife (Я,)—Ф* (X). Перейдем к отысканию Dn—i (К). Обратим внимание на минор эле- элемента ат. Этот минор с точностью до множителя ±1 равен Мы докажем, что этот минор (п — 1)-го порядка будет делителем всех прочих миноров (п — 1)-го порядка и что, следовательно, F0) Для этого возьмем сначала минор элемента, находящегося вне диа- диагональных клеток, и покажем, что такой минор равен нулю. Для получе- получения этого минора нам придется из матрицы E7) вычеркнуть одну строку и один столбец. Вычеркнутые линии в рассматриваемом случае пересе- пересекут две разные диагональные клетки и, следовательно, у каждой из этих двух клеток будет вычеркнуто по одной линии. Пусть, например, у /-й диагональной клетки будет вычеркнута одна из строк. Возьмем в миноре ту вертикальную полосу, в которой содержится эта диагональная клетка. В этой полосе, имеющей s столбцов, все строки, за исключением s — 1 строк, будут состоять сплошь из нулей (здесь через s мы обозначили порядок матрицы Aj). Разлагая рассматриваемый определитель (п — 1)-го порядка на основании теоремы Лапласа по минорам *чю порядка, содер- содержащимся в указанной полосе, мы и убедимся в том, что он равен нулю. Возьмем теперь минор элемента, находящегося внутри одной из диа- диагональных клеток. В зтом случае вычеркиваемые линии «искалечат» только одну из диагональных клеток, например /-ю, и матрица минора
5 6] ИНВАРИАНТНЫЕ МНОГОЧЛЕНЫ. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ 187 снова будет квазидиагональной. Поэтому такой минор будет равен Ч»1 (*-)••• Ь-i (Я.) %+i (Я.) ... 1>* (Я,) х (Я-), F1) где % (К) — определитель «искалеченной» /-й диагональной клетки. В силу того, что ipi(X) делится нацело на i])i+1 (к) (i = 1, 2, . . ., t — 1), произведение F1) разделится без остатка на произведение E9). Таким образом, равенство F0) можно считать доказанным. Аналогичными рас- рассуждениями получим: />„-(+! (Я,) =!%(*,), />„_,(*,) = ...= А (Я.) = 1. (F2)) Из E8), F0) и F2) находим: • • •, 1>* (Я,) = ^g^1 = ** (Я-), it+i (Я,) = ... = in (Я.) = Формулы F3) показывают, что многочлены i^ (X), iJj2 Щ, . . ., tyt (X) совпадают с отличными от единицы инвариантными многочленами опе- оператора А (либо соответствующей матрицы А). Но тогда отличные от еди- единицы [фй (к)]сь, [фЛ (k)]dk, . . ., (к = 1, 2, . . .) в разложении ГC9)у совпадают с элементарными делителями оператора Л (либо соответствую- соответствующей матрицы А). Поэтому задание инвариантных многочленов, или, что то же, задание элементарных делителей в поле К, однозначно определяет элементы нормальных форм L\ и Ьц~ На стр. 185 было установлено, что две подобные матрицы имеют одщг и те же инвариантные многочлены. Пусть теперь, обратно, известно, что две матрицы А и В с элементами из К имеют одни и те же инвариантные многочлены. Так как матрица Li однозначно определяется заданием этих многочленов,"то обе матрицы А и В подобны одной и той же мат- матрице Li ш, следовательно, подобны между собой. Таким образом, при- приходим к следующему предложению: Теорема 9. Для. того чтобы две матрицы с элементами из К были подобны, необходимо и достаточно, чтобы у этих матриц были одни и те же инвариантные многочлены г). Характеристический многочлен Д (к) оператора А совпадает с Dn (К) и потому равен произведению всех инвариантных многочленов: А (Я.) = ^.(Я,) % (Ц ... Ь (Ц. (F4); Но i|>i (к) есть минимальный многочлен всего пространства относи- относительно А; значит, -ф4 (А) = 0 и в силу F4) Таким образом, мы попутно получили теорему Гамильтона — Кэли (см. гл. IV, § 3). Или одинаковые элементарные делители в поле Кш
188 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В и-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII § 7. Нормальная жорданова форма матрицы Пусть все корни характеристического многочлена Д (к) оператора А принадлежат полю К. Это, в частности, всегда будет иметь место, если К есть поле всех комплексных чисел. В рассматриваемом случае разложение инвариантных многочленов на элементарные делители в поле К будет выглядеть так: i, (к) = (к - kt)ci (к - ktf* ...(К- ке)с\ i2 (к) = (к — к^1 (к — k2f2 ...(К — ks)ds, lck > dh > ... > lh > О, U it (к) = (к- ktf1 (К - X2I2... (К - Ks)l U>0; 1, 2, ..., F6) Так как произведение всех инвариантных многочленов равно характери- характеристическому многочлену Д (к), то ки к2, ..., ks в F6) суть все различные между собой корни характеристического многочлена Д (к). • Возьмем какой-либо элементарный делитель {к — ко)р; F7) здесь ко — одно из чисел к%, Х2, ... ks, a p—один из (отличных от нуля) показателей ch, dh, ¦ ¦ ¦ ,lh Ф = 1, 2, ..., s). Этому элементарному делителю в расщеплении D0) отвечает опреде- определенное циклическое подпространство _Г, порождающий вектор которого обозначим буквой е. Для этого вектора (к — ко)р будет минимальным многочленом. Рассмотрим векторы Л /л т. ~gjt\p—1Д Л /л т, тп\Р—2л л л /Ай\ с>1 — ^-aL — AqJI/) о, Cg — ^-Л — AqJtj/ в, . . . , €?р ^^ о. ^^/ Векторы €i, е2, ..., ер линейно независимы, так как в противном случае существовал бы аннулирующий многочлен для вектора е степени <.р, что невозможно. Теперь заметим, что {А — к0Е) et = 0, (А — коЕ) е2 = еи ..., {А — Т^Е) ер = ep_i F9) или Ае^ = koei, Ае2 = Я^е2 + е1; ..., Аер = Я,оер + ep_t. G0) Имея равенства G0), нетрудно выписать матрицу, отвечающую опера- оператору А в I при базисе F8). Эта матрица будет выглядеть так: L 1 0...0 0 о о о о... а* G1) где Е^ — единичная матрица порядка р, а Н&)—матрица порядка р, у которой элементы первой «наддйагонали» равны единице, а все остальные элементы равны нулю. Линейно независимые векторы е±, е2, ..., ер, для которых име- имеют место равенства G0), образуют так называемую жорданову це- цепочку векторов в I, Из жордановых цепочек, взятых в каждом из под-
S 7] НОРМАЛЬНАЯ ЖОРДАНОВА ФОРМА МАТРИЦЫ 189 пространств I', I", ..., Ии\ составляется жорданов базис в R. Если минимальные многочлены этих подпространств, т. е. элементарные дели- делители оператора А, обозначим теперь через (X - КГ*, (Я- - h)P2 ,...,(*- К)Ри G2) (среди чисел К±, Я,2, . -., Ки могут быть и равные), то матрица /, отве- отвечающая оператору А в жордановом базисе, будет иметь следующий квазидиагональный вид: / = {KtE^ + Я(я), ЯвЖпЛ + Ж»), ..., Я^Я03^ + Я№«>}. G3) Про матрицу / говорят, что она имеет нормальную жорданову форму или просто жорданову форму. Матрица J сразу выписывается, если известны элементарные делители оператора А в поле К, содержа- содержащем все корни характеристического уравнения Д (к) = 0. Произвольная матрица А всегда подобна матрице J, имеющей нор- нормальную жорданову форму, т. е. для произвольной матрицы А всегда существует такая неособенная матрица Т(\Т\^ФО), что А = TJT-1. G4) Если все элементарные делители оператора А первой степени (и только в этом случае), жорданова форма является диагональной ма- матрицей, и в этом случае мы имеем: А = Т{ки К2,...,кп}Т-\ G5) Таким образом, линейный оператор А имеет простую структуру {см. гл. III, § 8) в том и только в том случае, когда все элементарные делители оператора А линейны. Векторы elt е2, ...,ер, определяемые равенствами G0), занумеруем в обратном порядке: ffl = вр = е, д2 = ep_t = (А— Х0Е)е, ...,gp = ei = (A — КоЕУ^е. G6). Тогда (А - 92, (Л - откуда 2, = 9з, ¦ ¦ ¦, (Л - VE) 9v = 0. G7) G8) = Xogr2 + 9z, ¦ ¦ ¦, АдР = Векторы G6) образуют базис в циклическом инвариантном подпро- подпространстве I, соответствующем в расщеплении D0) элементарному дели- делителю (К — К0)р. В этом базисе, как легко видеть, оператору А будет «отвечать матрица %о 0 0 ... 0 1 Ко 0 ... 0 0 1 Ко 0 0 G9) Про векторы G6) говорят, что они образуют нижнюю жорданову цепочку векторов. Если мы в каждом из подпространств I', I", ..., jpu> в расщеплении D0) возьмем нижнюю жорданову цепочку векторов, то из этих цепочек составится нижний жорданов базис, в котором оператору А
190 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В «-МЕРНОМ ПРОСТРАНСТВЕ ЕГЛ. VII отвечает квазидиагональная матрица №) () }• (80) Про матрицу /j говорят, что она имеет нижнюю жорданову форму. В отличие от матрицы (80) матрицу G3) мы иногда будем называть верхней жорданоеой матрицей. Таким образом, произвольная матрица А всегда подобна как неко- некоторой верхней, так и некоторой нижней1 жорданоеой матрице. § 8. Метод акад. А. Н. Крылова преобразования векового уравнения 1. Если дана матрица -d=|| од Ilij> то ее характеристическое (вековое) урав- уравнение записывается в виде °и— ^ Я12 ••• ат Д(Я) = (—1)" ап1 ап2 апп — =0. (81) В левой части этого уравнения стоит характеристический многочлен n-й сте- степени Д (Я). Для непосредственного вычисления коэффициентов этого многочлена нужно раскрыть характеристический определитель \А—%Е\, а это связано при больших п с большим объемом вычислительной -работы, поскольку Я входит в диагональные элементы определителя1). Академик А. Н. Крылов в 1937 г. [103] предложил преобразование характе- характеристического определителя, в результате которого Я входит только в элементы одного столбца (или строки). Преобразование Крылова существенно упрощает вычисление коэффициентов характеристического уравнения 2). В этом параграфе мы дадим алгебраический вывод преобразованного характе- характеристического уравнения, несколько отличающийся от вывода самого Крылова3). Введем в рассмотрение ге-мериое векторное пространство JR с базисом et, е2, ..., еп и линейный оператор АвМ, определяемый данной матрицей А—\\ щь |j™ при этом базисе. Выберем в R произвольный вектор х ф 0 и составим ряд векторов х, Ах, А*х, ... (82) Пусть первые р векторов этого ряда ж, Ах, ..., Ар~Чс линейно независимы 1)-й вектор Ai>x есть линейная комбинация этих р векторов: х, (83) или <р (А) аг=О, (84) где Ф (К) =№ + OiW-i + ... 4 аР. (85) Все дальнейшие векторы ряда (82) также линейно выражаются через первые р векторов этого ряда*). Таким образом, в ряду (82) имеется р линейно независимых й| "i г) Напоминаем, что коэффициент при Kh в Д (Я) равен (с точностью до знака) сумме всех главных миноров порядка п—к матрицы А(к=1, 2, ..., п). Таким образом, уже при ге=6 для непосредственного определения коэффициента при Я в Д (Я) нужно вычислить шесть определителей пятого порядка, а для коэффициента при Я2 нужно вычислить 1^ определителей четвертого порядка и т. п. 2) Алгебраическому анализу метода А. Н. Крылова преобразования векового уравнения посвящен ряд исследований [109а, б; 133, 816, 132]. 8) А. Н. Крылов пришел к своему преобразованному уравнению, исходя из рассмотрения системы п линейных дифференциальных уравнений с постоянными коэффициентами. Вывод Крылова в алгебраизированной форме можно найти, напри- например, в [109а, 816], а также в книге [33], § 21. *) Применяя к обеим частям равенства (83) оператор А, мы выражаем линейно А?+\х через векторы Ах, ..., АР~гх, А?х. Но А^х в силу (83) линейно выра- выражается через векторы х, Ах, , А'Р~1х. Поэтому мы получаем аналогичное выра- выражение для Лр+1я5. Применяя к этому выражению вектора Ар+1х оператор А, мы выразим AP+zx через х, Ах, ..., AP~4d и т. д.
8] МЕТОД АКАД. А. Н. КРЫЛОВА 191 векторов, и это максимальное число линейно независимых векторов ряда (82) может быть всегда реализовано на первых р векторах ряда. Многочлен ф (Я) является минимальным (аннулирующим) многочленом вектора ж относительно оператора А (см. § 1). Метод А. Н. Крылова есть метод эффектив- эффективного определения минимального многочлена ф (!) вектора ж. Мы рассмотрим раздельно два случая: регулярный случай, когда р=п, и особый случай, когда p<in. Многочлен ф (к) является делителем минимального многочлена if> (к) всего пространства JK Ц, а я|з (к) в свою очередь является делителем характеристического многочлена Д (к). Поэтому ф (к) всегда является делителем Д (к). В регулярном случае фA)иА (к) имеют одну и ту же степень п, и поскольку старшие коэффициенты у них равны, то эти многочлены совпадают. Таким обра- образом, в регулярном случае Д (к) == ¦ф (к) = ф (к), и потому метод Крылова в регулярном случае есть метод вычисления коэффициентов характеристического многочлена Д (к). В особом случае, как мы увидим ниже, метод Крылова не дает возможности определить ДA)ив этом случае он определяет только многочлен ф (к), являю- являющийся делителем Д (к). При изложении преобразования Крылова мы будем обозначать координаты вектора ж в заданном базисе ei, е2, ..., ел через а, Ъ, ..., /, а координаты вектора Акх через ah, bh, ..., lh (&=1, 2, .... п). 2. Регулярный случай: р=п. В этом случае векторы а?, Аж, ..., An~k)i> линейно' независимы, и равенства (83), (84), (85) принимают вид или где Апх= —алж—ал_1Лж—... — Д (А) ж=0, Условие линейной независимости векторов ж, Аж, аналитически записано так (см. гл. III, § 1): а Ъ ... I » (86) (87) (88) ., Ап-"кс может быть пП-1 Ь71-1 • • " 1П Рассмотрим матрицу, составленную из координат векторов ж, Аж, . а Ъ ... I °л-1 Ьп-1 • • • 'n-i ап "п ••• In (Щ А"ж: (90) В .регулярном случае ранг этой матрицы равен п. Первые п строк этой матрицы линейно независимы, а последняя, (п-|-1)-я, строка есть линейная комбинация предыдущих п. Зависимость между строками матрицы (90) получим, заменяя векторное равен- равенство (86) эквивалентной системой п скалярных равенств а—an-i%—•.. — aian_1=an, —апЪ—a^j (91) —минимальный многочлен матрицы А.
192 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В n-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII Из'этой системы п линейных уравнений мы можем однозначно определить искомые коэффициенты (ц, а2, ..., а„ г) и подставить полученные значения в (88). Это исключение а4, аг, ..., ап из (88) и (91) можно провести в симметричной форме. Для этого перепишем (88) и (91) так: ва„+а1а„_1+...+в„_1а1+ала<) n-i + • • • + Ъп-ЦН + Ьла0 0, 0, na0 n_д =0, (ао=1). Поскольку эта Гсистема из (и + 1) уравнений с (п-f-l) неизвестными а0, а1т ...,ап имеет ненулевое решение (ао=1), то определитель этой системы должен равняться нулю: в Ъ I 1 «i ... h ... h ... I ... «n-i bn-i ln-i an bn In l-n д m =0. (92) Отсюда мы определяем Д (%), предварительно транспонируя определитель (92) относительно главной диагонали: I к 1 К «71 Ъп-1 Ьл (93) где постоянный множитель М определяется формулой (89) и отличен от нуля. Тождество (93) и представляет собой преобразование Крылова. В определи- определителе Крылова, стоящем в правой части этого тождества, Я входит только в эле- элементы последнего столбца; остальные же элементы этого определителя от К не зависят. Замечание. В регулярном случае все пространство JK является цикли- циклическим (относительно оператора А). Если в качестве базиса выбрать векторы ж. Ах, ..., Ап~кс, то в этом базисе оператору А соответствует матрица А, имеющая естественную нормальную форму 0 0 ... 0 —а„ 1 0 ... 0 —а„_! 0 —a2 0 Переход от основного базиса ei, ez, en к базису х, Ах, ществляется при помощи неособенной преобразующей матрицы Т= При этом А=ТАТ-К (94) Av-*x ocy- (95) (96) Определитель этой системы в силу (89) отличен от нуля.
§ 8] МЕТОД АКАД. А. Н. КРЫЛОВА 193 3. Особый случай: р<^п. В этом случае векторы ж, Ая>, линейно зависимы, и потому а Ъ ... I п\ &} ... /| М= ап~1 =0. Равенство (93) было выведено при условии М ф 0. Но обе части этого равен- равенства представляют собой целые рациональные функции от К и параметров а, Ь, ..., I1). Поэтому «из соображений непрерывности» следует, что равенство (93) имеет место и при М=0. Но тогда в определителе Крылова (93) после его рас- раскрытия все коэффициенты окажутся равными нулю. Таким образом, в особом слу- случае (р < п) формула (93) переходит в тривиальное тождество 0=0. Рассмотрим матрицу, составленную из координат векторов ж, Ах, ..., АР& I (97) Яр Dp ... tj Эта матрица имеет ранг р и первые р строк в ней линейно независимы, последняя же (р+1)-я строка есть линейная комбинация первых р строк с коэффициентами —ар, —Ир-i, ..., —ац [см. (83)]. Из п координат а, Ь, ..., I мы сможем выбрать такие р координат с, /, ..., h, чтобы определитель, составленный из этих коорди- координат векторов ж, Ах, ..., АР~1а>, был отличен от нуля: с f ... h М* = Далее, из (83) вытекает: cp-i Ф0. (98) —аре—ap^Ci—.. ¦—apf—ap-i/i— - • —ai/p-i=/pi —aph—(Хр-Л—... — (99) Из этоигсистемы уравнений однозначно определяются коэффициенты щ, ct2, ..., ap многочлена ф (К) (минимального многочлена вектора ж). Совершенно аналогично регулярному случаю (лишь с заменой п на р и букв а, Ь, ..., I буквами с, /, ..., К) мы сможем исключить olt a2, ..., ар из (85) и (99) и получить следующую фор- формулу для ф(Я) М*<р(%) = f h h 1 К A00) Ср fp ¦¦¦ hp KP 4. Остановимся на выяснении вопроса, для каких матриц Л=|| ац,, ||" и при каком выборе исходного вектора ж или, что то же, при каком выборе исходных параметров о, Ъ. ..., I имеет место регулярный случай. ..., п), где а^' (/, к=1, 2, ..., ге)—элементы матрицы A* (i=l, 2, :.., п). 13 ф. р. Гантмахер
194 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В «-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. "VII Мы уже видели, что в регулярном случае Д (к) = ¦ф (к) = ф (к). Совпадение характеристического многочлена Д (к) с минимальным многочленом ч|5(Я) означает, что у матрицы -4=|| а^ ||" нет двух элементарных делителей содним и тем же характеристическим числом, т. е. все элементарные делители попарно взаимно просты. В случае, когда А—матрица простой структуры, это требование равносильно условию, что характеристическое уравнение матрицы А не имеет кратных корней. Совпадение многочлена яр (Я,) с ф (к) означает, что в качестве' вектора ж выбран вектор, порождающий (при помощи оператора А) все пространство JR. Такой вектор согласно теореме 2 § 2 всегда существует. Если же условие Д (к) = ij) (к) не выполняется, то, как бы ни выбрать вектор ж ф 0, мы многочлена Д (к) не получим, так как полученный по методу Крылова многочлен ф (к) является делителем ¦ф (к), который в рассматриваемом случае не совпадает с многочленом Д (к), а является лишь его делителем. Варьируя век- вектор ж, мы можем в качестве ф (к) получить любой делитель ¦ф (к) *). Полученные выводы мы можем сформулировать в виде следующей теоремы: Теорема 14. Преобразование Крылова дает выражение для характеристи- характеристического многочлена Д (к) > матрицы А = \\ац1\\г1 * виде определителя (93) в том и только в том случае, когда выполняются два условия: 1° Элементарные делители матрицы А попарно взаимно просты. 2° Исходные параметры а, Ь, ..., I являются координатами вектора ж, поро- мсдающего (при помогци оператора А, соответствующего матрице А) все п-мерное пространство 2). В общем же случае преобразование Крылова приводит к некоторому делителю ф (к) характеристического многочлена А (к). Этот делитель ф(Я) является мини- минимальным многочленом для вектора ж с координатами а, Ъ, , / (о, 6, ..., I— исходные параметры в преобразовании Крылова). 5. Покажем, как найти координаты собственного вектора у для любого характеристического числа к0, которое является корнем многочлена ф (к), полу- получающегося по методу Крылова3). Вектор у Ф 0 будем искать в виде . + tpAp-1a>. A01) Подставляя это выражение для у в векторное равенство Ау=коу и используя A01), мы получим: =к0 (gja? + \2Аж +...+ tpA7"-1^). A02) Отсюда, | между прочим, следует, что ?р Ф 0, так как равенство |р=0 в силу A02) давало бы линейную зависимость между векторами ж, Ах, ..., Ар~гх. В даль- дальнейшем мы полагаем |р=1. Тогда из A02) получаем: Первые р^ из этих равенств определяют нам последовательно величины |р, ip-i, ..., ii (координаты вектора ж в «новом» базисе ж, Аж, ..., Ар'гж); последнее же равенство является следствием из предыдущих и из соотношения 1 х) См., например, [816], стр. 48. 2) В аналитическом виде это условие означает, что столбцы х. Ах, ..., Ап~гх, где х=(а, Ъ, ..., I), линейно независимы. s) Последующие рассуждения имеют место как для регулярного случая р=п, так и для особого случая р <[ п.
§ 8] МЕТОД АКАД. А. Н. КРЫЛОВА 195 Координаты а', Ь', ..., Г вектора у в исходном базисе могут быть найдены по следующим формулам, которые вытекают из A01): A04) Пример 1. Рекомендуем читателю следующую схему вычислений. Под данной матрицей А выписываем строку из координат вектора х: а, Ь, ..., I. Этими числами задаемся произвольно (при одном лишь ограничении: по крайней мере одно из этих чисел отлично от нуля). Под строкой а, Ъ, , / пишем строку oj, 6j, ..., I], т. е. координаты вектора Ах. Числа ot, bj, , /t получаются путем последовательного умножения строки а, Ь, ...,1 на строки данной матрицы А. Так, например, oi=a11a+a126+... -\-aml, 6i=a2ia + a226 + ... +azn.l и т. д. Под строкой «i, bj, ..., 1г пишем строку о2, Ь2, ..., 12 и т. д. Каждая из приписываемых строк, начиная со второй, определяется путем последовательного умножения пре- предыдущей строки на строки данной матрицы. Над строками данной матрицы выписываем контрольную суммарную строку Л А = ei + e2 Asc А*х А*х А*х 8 3 2 2 1 1 2 3 0 5 ] ° V 1 0 Г-4 * \ , 1 3 — 1 3 —1 2 1 5 5 9 9 8 2 0 0 — 10 —4 —2 — 3 — 1 0 1 2 — 1 4 0 0 —4 1 —3 2 —4 2 О 0 3 2 5 4 4 1 0 0 У -1 -1 1 1 z 1 -1 — 1 1 В данном случае мы имеем регулярный случай, поскольку 11 0 0 М= 2 5 3 5 1 -3 2 2 0 9—15 = —16. Определитель Крылова имеет вид 1 1 2 5 3 5 О 9 5 9 0 о м 1 3 К 2 2 А/ — 1 5 Я 4 4 X' Раскрывая этот определитель и сокращая на—16, найдем: Д (Я)=Х4— 2 Обозначим через 2/=?ise+ ^Лж + ^з^^ + ^^ж собственный вектор матрицы А, соответствующий характеристическому числу Хо=1. Числа Si» - &2t 1з> iu найдем 13*
196 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В n-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII по формулам A03): Контрольное равенство —\-Х0-\-1=0, конечно, удовлетворяется. Полученные числа |t, |2, ?з> 14 располагаем в вертикальном столбце парал- параллельно столбцу векторов х, Ах, Акк, А%х. Помножая столбец |lt |2, |з, ?4 на столбец а1? а2, а3, о4, мы получим первую координату а' вектора у в исходном базисе ei, e%, eg, е^; аналогично получаем Ъ', с', d'. Находим координаты (после сокращения на 4) вектора у: 0, 2, 0, 1. Аналогично определяем координаты 1, 0, 1, 0 собственного вектора z для характеристического числа Хо= — 1. Далее, согласно (94) и (95) 2 где А = 0 0 0 1 0 0 0 10 0 0 1 Т— 12 3 1 5 5 0 1 2 0 3 2 0 9 —1 5 Пример 2. Рассмотрим ту же матрицу А, но в качестве исходных пара- параметров возьмем числа о=1, 6=0, с=0, d=0. Но в данном случае 8 3 2 2 1 a>=el\l Ах |3 1 3 АГ= 3 —1 3 — 1 2 о 2 4 6 10 0 0 3 2 2 1 14 0 2 3 6 2 3 —10 —3 — 4 2 — 2-4 — — 0 2 0 2 3 1 2 —3 0 1 2 3 =0 и р=3. Мы имеем дело с особым случаем. Беря первые три координаты векторов х, Ах, Ако, Аях, определитель Крылова записываем в виде 10 0 1 3 2 2 I 1 4 0 Я.2 3 6 2 № Раскрывая этот определитель и сокращая на —8, получим: Отсюда находим три характеристических числа: Я,1=1, Я,2 = 1,Я$=—-1. Четвертое характеристическое число получим из условия, что сумма всех характеристических чисел равна следу матрицы. Но Sp.4=0. Поэтому Я,4= — 1. Приведенные примеры показывают, что при применении метода Крылова, выписывая последовательно строки матрицы Ъ ... / а2 A05)
§ 8] МЕТОД АКАД. А. Н. КРЫЛОВА 197 нужно следить за рангом получаемой матрицы с тем, чтобы остановиться на цервой 1(Р+1)-й сверху] строке, которая является линейной комбинацией предыдущих. Определение ранга связано с вычислением известных определителей. Кроме того, получив определитель Крылова в виде (93) или A00), для раскрытия его по элемен- элементам последнего столбца следует вычислить известное число определителей (р—1)-го порядка [в регулярном случае (п—1)-го порядка]. Вместо раскрытия определителя Крылова можно определить коэффициенты aii а2? • • • непосредственно из системы уравнений (91) [или (99)], применяя к этой системе какой-либо эффективный метод решения, например метод исключения. Этот метод можно применить непосредственно к матрице а Ъ ... I 1 flj bl /j к fl2 Ь2...12 к* A06) пользуясь им параллельно с получением соответствующих строк по методу Крылова. Тогда мы своевременно обнаружим зависимую от предыдущих строку матрицы A05) без вычисления каких-либо определителей. Поясним это подробнее. В первой строке матрицы A06) выбираем какой-либо ф 0 б й элемент с 0 и 1? вычитая из второй строки первую, помноженную на г. Затем во второй строке его помощью обращаем в нуль стоящий под ним элемент с it с выбираем какой-либо элемент /* ф 0 и с помощью элементов си/* обращаем в нуль элементы с% и /2 и т. д. *). В результате такого преобразования в последнем столбце матрицы A06) степени kh заменятся многочленами к-й степени gft (к) = = kh+...(k=O, 1,2, ...). Так как при нашем преобразовании при любом к ранг матрицы, образован- образованной первыми к строками и первыми п столбцами матрицы A06), не меняется, то (Р + 1)"я строка этой матрицы после преобразования будем иметь вид 0, 0, ..., 0, gp(k). Проведенное нами преобразование не изменяет величины определителя Крылова Поэтому / к ...h ...ht 1 к cp-i /; p-i p-i к v-i A07) т- е. 2) ?р(Ц и будем искомым многочленом ф (к), gp (к) э Ф (Л,). Рекомендуем следующее упрощение. Получив к-ю преобразованную строку в матрице A06) л* h* 1* 0 (i\ tiCfc.1 °ь_1> °ь_1> ••" Ь.,1 и. W, U^e; следующую {к +1)-ю строку следует получать, умножая ряд а;г_1, bIwl, ..., lk_x (а не первоначальный ряд es-i, bfe_i, ..., lk-i) на строки данной матрицы3). Тогда мы найдем (Л+1)-ю строку в виде х) Элементы с17 /J, ... не должны принадлежать последнему столбцу, содер- содержащему степени Я. 2) Напоминаем, что старшие коэффициенты многочленов ф (к) и gp (к) равны единице. 3) Упрмцение заключается в том, что в преобразованной строке A08) к—1 эле- элементов равйы нулю. Поэтому такую строку проще умножать на строки матрицы А.
198 СТРУКТУРА ЛИНЕЙНОГО ОПЕРАТОРА В n-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. VII и после вычитания предыдущих строк получим: at,b*k,...,l*h,gh(l). Рекомендуемое нами небольшое видоизменение метода Крылова (соединение его с методом исключения) позволяет сразу получить интересующий нас многочлен ф G,) [в регулярном случае Д G,)] без вычисления каких-либо определителей и реше- решения вспомогательной системы уравнений *). Пример. A= 4 1 1 — 1 1 2 0 0 0 0 —5 ~—О — 10 0 5 0 4 1 2 2 2 1 0 1 2 —2 —7 0 — 10 0 5 0 1 — 1 — 1 3 1 —1 0 0 3 3 5 5 20 —5 — 15 0 б 1 0 — 1 2 3 0 —1 —4 0 7 0 0 0 —5 0 0 0 1 0 —1 0 1 0. -2 0 0 — 15 о 0 0 1 7, 7,2 [2—-47,] A.2-47,+2 7,3 _47,2 .)_ 27, [5 + 77,] 7.3—47.2 + 9Я + 5 Я.4_47,з+97,2 + 57. [15 —5 (X —2G.3—47.2+ 97.+ 5)] Т.4—67,3 + Ш,2 + 77,—5 7,5 _ 67,4+127,3+77.2— 57. [_ —47,2 + 97, + 5) — 2 (Т,4—67,3 7,5 _ 87,4 + 257.3—217,2 —157, + AW 5— —5)] х) Наряду с методом акад. А. Н. Крылова мы познакомили читателя в гл. IV с методом Д. К. Фаддеева вычисления коэффициентов характеристического многочле- многочлена. Метод Д. К. Фаддеева связан с большими вычислениями, нежели метод Крылова, но метод Фаддеева является более общим, в нем нет особых случаев. Обращаем внимание читателя еще на весьма эффективный метод А. М. Данилевского [88]; см. также [8], стр. 235—239, обзорную статью [79] и книгу [33], § 24.
ГЛАВА VIII МАТРИЧНЫЕ УРАВНЕНИЯ В этой главе мы рассмотрим некоторые типы матричных уравнений, встречающиеся в разнообразных вопросах теории матриц и ее приложений. § 1. Уравнение Пусть дано уравнение АХ = ХВ, A) где А и В — две заданные квадратные матрицы (вообще говоря, разных порядков) A = \\al}\tf, В = || й« И» а X — искомая прямоугольная матрица размером тхп: Х = ||я,*|| (/ = 1. 2. •••.»»; * = 1, 2, ...,п). Выпишем элементарные делители матриц А и В (в поле комплексных чисел): (А): (*,->*)", (К-Х2)^, ..., (K (В): (Я-и)91> (Я-ц2)^, ...,(Я В соответствии с этими элементарными делителями приведем матрицы А и В к нормальной жордановой форме A = UXlT\ B = F5F, B) где U и F—'Квадратные неособенные матрицы соответственно порядка т и п, а Л и Z? — жордановы матрицы: В = {ц!Е(в1) + Я(^l) ^(в») + ff4 Elq^ + HigJ} Подставляя в уравнение A) вместо А и В их выражения B), получим: UAU-iX = XVBV-1. Умножим обе части этого равенства слева на U'1, а справа — на V: AU-+XV = U-1XVB. D)
200 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII Вводя вместо искомой матрицы X новую искомую матрицу X (тех же размеров тХв) E) мы уравнение D) запишем так: АХ = ХВ. F) Мы заменили матричное уравнение A) уравнением F) того же вида, но в котором заданные матрицы имеют нормальную жорданову форму. В соответствии с квазидиагональным видом матриц А и В разобьем матрицу X на блоки: Х = (Х«р) (а=1,2 в; 0 = 1, 2, ..., v) (здесь Хар—прямоугольная матрица размером ра X qf, a = l, 2, ...,щ Р = 1, 2,..., v). Используя правило умножения блочной матрицы на квазидиагональ- квазидиагональную (см. стр. 56), произведем умножение матриц в левой и правой частях уравнения F). Тогда это уравнение распадается на uv матричных уравнений [КЕ^ + Н^] Х«р = Х«р [цр^'Р» + #(9е>] (а = 1, 2, ...,и; р=1, 2, ...,»), которые перепишем еще так: (Ws-^a)Xap = #«X«p-XapGp (а=1, 2, ...,и; р = 1, 2, ...,»); G) при этом мы ввели сокращенные обозначения На^Н^\ Gz = Hlq& (а = 1, 2, ...,и; р = 1, 2, ...,»). (8) Возьмем какое-нибудь из уравнений G). Могут представиться два случая: 1. Я,«^=цр. Проитерируем г—1 раз равенство GI): (9) О+Т=г Заметим, что в силу (8) Я2» = СЦЭ = О. (Ю) Если в (9) взять г>р„ + др — 1, то в каждом члене суммы, стоящей в правой части равенства (9), выполняется по крайней мере одно из соот- соотношений и потому в силу A0) либо На = 0, либо Gp = 0. Так как, кроме того, в рассматриваемом случае Кафц^, то из (9) находим: ХаР = 0. A1) 2. Яа=фр. В этом случае уравнение G) принимает вид A2) х) Обе части равенства G) умножаем на цр—Ка ив каждом члене правой части заменяем (цр—А-а)Хар на НаХа$—XapGp. Этот процесс повторяем г—\ раз.
§ 1] УРАВНЕНИЕ АХ = ХВ 201 В матрицах На и Gp элементы первой наддиагонали равны единице, а все остальные элементы равны нулю. Учитывая эту специфичную структуру матриц На и Gp и полагая = l, 2, ра; k=l, 2, мы заменим матричное уравнение A2) следующей эквивалентной ему системой скалярных соотношений1): = 0; * = 1. 2, ..., =i. 2, ...,gp). A3) Равенства A3) означают: 1) В матрице Х„р на каждой линии, параллельной главной диаго- диагонали, стоят равные между собой элементы, 2) ?г1 = 1з1 = • • • = ?р„1 = ?р„2 = . . . = 1ра,9р-1 = О- Пусть ра = <2р- В этом случае Х„р— квадратная матрица. Из 1), 2) следует, что в матрице Х„р все элементы, расположенные под главной диагональю, равны нулю, все элементы главной диагонали равны неко- некоторому числу с„р, все элементы первой наддиагонали равны некоторому числу Сар и т. д., т. е. 0 Cap о ... о = Т ; A4) здесь сар, сар, . ..|C|S» —произвольные параметры (уравнения A2) не накладывают никаких ограничений на значения этих параметров). Легко видеть, что при = ( 0 , Тр), а при ра>я$ A5) A6) Про матрицы A4), A5) и A6) мы будем говорить, что они имеют правильную верхнюю треугольную форму. Число произвольных параметров в Х„р равно наименьшему из чисел ра и q&. Приведенная ниже схема показывает структуру матрицы Х„р при Ка = цр (произвольные параметры !) Из структуры матриц На и Gp следует, что произведение #aXap получается из Х„р сдвигом всех строк на одно место вверх и заполнением последней строки нулями; аналогично XapGp получается из Хар сдвигом всех столбцов на одно место вправо и заполнением первого столбца нулями (см. гл. I, стр. 25). Для сокращения обозначений мы не пишем при gjft дополнительных индек- индексов а, §.
202 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII здесь обозначены через а, Ъ, с, d): abed 0 а Ь с 0 О а Ъ 0 0 0а О 0 a 6 с О О О a 6 0 0 0 0a а 0 0 0 0 Ъ а 0 0 0 с Ъ а 0 0 а = 5, §р = Для того чтобы при подсчете произвольных параметров в матрице X охватить и случай 1, обозначим через da&(K) наибольший общий делитель элементарных делителей (Я,—Х„)р« и (X — ЩзMр, а через 8аC — степень многочлена d«p(A,) (а = 1, 2, ...,ы; 0=1, 2, ...,у). В случае 1 баР = 0; в случае 2 имеем: 8KP = min(pa, gp). Таким образом, в обоих случаях число произвольных параметров в Хац равно б„р. Число произвольных параметров в X определяется формулой а=1 р=1 В дальнейшем нам удобно будет общее решение уравнения F) обо- обозначить через Xjff (до сих пор мы это решение обозначали буквой X). Полученные в этом параграфе результаты можно сформулировать в виде следующей теоремы: Теорема 1. Общее решение матричного уравнения АХ = ХВ, где А = || aih ||5» = UAU-1 = | aih | В = || bik \\? = задается формулой i = V {ц V'\ A7) Здесь Xj^ —общее решение уравнения АХ — ХВ —имеет следующую структуру: Х-^ разбивается на блоки Ч_ Xi"у" \i / 4 0 ... о л о тЛ« если Ха =^= (д,р, то на месте Хар стоит нулевая матрица, если же А,а = |Лр, то на месте Хар стоит произвольная правильная верхняя треугольная матрица. X-%g, а следовательно, и X зависят линейно от N произвольных параметров си с2, ..., cN: N — Zi cjaj' |(ie) определяется формулой = 2 2 a=ip=l A9)
§ 2] ЧАСТНЫЙ СЛУЧАЙ: А = В. ПЕРЕСТАНОВОЧНЫЕ МАТРИЦЫ 203 [здесь б„р обозначает степень наибольшего общего делителя (К — Ка)Ра и Заметим, что матрицы Xlt Х2, ¦ ¦., XN, фигурирующие в формуле A8), суть решения исходного уравнения A) (матрица Xj получается из X, если параметру cj дать значение единицы, а остальным параметрам— нулевые значения; /=1,2, ...,N). Эти решения линейно независимы, так как в противном случае при некоторых значениях параметров «1, с2, ..., cN, не равных одновременно нулю, матрица X, а следовательно, и Xjg равнялись бы нулю, что невозможно. Таким образом, равенство A9) показывает, что любое решение исходного уравнения представляет собой линейную комбинацию N линейно независимых решений. Если матрицы А и В не имеют общих характеристических чисел {характеристические многочлены | КЕ — А | и | КЕ — В\ взаимно просты), то и v N = 2 X ^«6 = 0 и, следовательно, X = 0, т. е. е этом случае уравнение A) а=1 р=1 имеет только тривиальное нулевое решение X = 0. Замечание. Пусть элементы матриц А и В принадлежат некото- некоторому числовому полю К. Тогда нельзя утверждать, что элементы матриц U, V, X-gg, фигурирующих в формуле A7), также принадлежат полю К. Эле- Элементы этих матриц можно выбрать в расширенном поле Ки которое полу- получается из поля К путем приобщения к последнему корней характеристиче- характеристических уравнений \%Е — Л| = 0 и \%Е — В\ — Ь. С такого рода расширением основного поля всегда приходится иметь дело, когда пользуются приведе- приведением заданных матриц к нормальной жордановой форме. Однако матричное уравнение A) эквивалентно системе тп линейных однородных уравнений, где неизвестными служат элементы жу-й(/ = = 1, 2, ..., т; k — 1, 2, ..., п) искомой матрицы X: т п 2 oijXjh = 2 xihbhk (i = 1, 2, ..., щ *= 1, 2, .... и). B0) ;=1 /1=1 Нами доказано, что эта система имеет N линейно независимых реше- решений, где N определяется формулой A9). Но известно, что базисные линейно независимые решения можно выбрать в основном поле К, которому принад- принадлежат коэффициенты уравнений B0). Таким образом, в формуле A8) матри- матрицы Хи Хг, ..., XN можно выбрать так, чтобы их элементы принадлежали полю К. Тогда, придавая в формуле A8) произвольным параметрам все- всевозможные значения из поля К, мы получим все матрицы X с элемен- элементами из К, удовлетворяющие уравнению (II). § 2. Частный случай: А=В. Перестановочные матрицы Рассмотрим частный случай уравнения A) — уравнение АХ = ХА, B1) где А = || aik\\% — заданная, а Х = || ж^Цу—искомая матрица. Мы пришли к задаче Фробениусгб определить все матрицы X, перестановочные с данной матрицей А. х) Матриды .4= || aij ||™ и ?=||bftj||" определяют линейный оператор F(X) = =АХ—ХВ я пространстве прямоугольных матриц X с размерами тХп. Исследо- Исследование операторов такого типа проведено в работах [85а, б].
204 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIH Приведем матрицу А к нормальной жордановой форме: А = UAU-1 = >) U~\ B2) Тогда, полагая в формуле A7) V = U, B = A и обозначая Х^у сокращенно через Х^, получим все решения уравнения B1), т. е. все матрицы, пере- перестановочные с А, в следующем виде: х=их-хи-\ B3) где Х% обозначает произвольную матрицу, перестановочную с А. Как было выяснено в предыдущем параграфе, Х% разбивается на и2 блоков в соответствии с разбиением на блоки жордановой матрицы А; Х„р— нуле- нулевая матрица либо произвольная правильная верхняя треугольная матрица в зависимости от того, Ха Ф А,р или Ка = А,р. Для примера выпишем элементы матрицы Х-^ для случая, когда ма- матрица А имеет следующие элементарные делители: В этом случае Х-% имеет такой вид: а 0 0 0 0 0 0 0 0 0 ъ а 0 0 h 0 0 0 0 0 с ъ а 0 к h 0 0 0 0 d с Ъ а 1 к h 0 0 0 е 0 0 0 т 0 0 ,о 0 |0 / е 0 0 Р т 0 0 0 0 g f е 0 Ч Р т 0 0 0 0 0 0 0 0 0 0 г 0 0 0 0 0 0 0 0 0 S г w 0 0 0 о 0 0 с t 0 z (a, b, ..., z—произвольные параметры). Число параметров в Х-r равно N, где iV= 2 р 2 а, р=1 в! здесь 8„в обо- значает степень наибольшего общего делителя многочленов (А,— Ка) а И ( А — Ар) . Введем в рассмотрение инвариантные многочлены матрицы A: ii(K), г'г (Я), .. •, Ц (Я); it+i (Я,) = ... = in (А,) = 1. Степени зтих многочленов обо- обозначим через щ > и2 > ... > nt > nt+i = ... = 0. Так как каждый инва- инвариантный многочлен является произведением нескольких попарно взаимно простых элементарных делителей, то формулу для N можно записать и так: t N= 2 «л/. B4) g. i=i где Kgy—степень наибольшего общего делителя многочленов ig(X) и ij(k)
§ 2] ЧАСТНЫЙ СЛУЧАЙ: А = В. ПЕРЕСТАНОВОЧНЫЕ МАТРИЦЫ 205 (g, 7 = 1, 2, ..., t). Но наибольшим общим делителем многочленов ig(K) и ij (X) является один из этих же многочленов и потому xgj = min (ng, rij). Отсюда получаем: Число N является числом линейно независимых матриц, перестано- перестановочных с матрицей А (можно считать, что элементы этих матриц принад- принадлежат основному полю К, содержащему элементы матрицы А; см. замечание в конце предыдущего параграфа). Мы пришли к теореме: Теорема 2. Число линейно независимых матриц, перестановочных с матрицей А = \\ aih ||", определяется формулой N = n1 + 3n2+...+Bt-l)nt, B5) где щ, и2, ..., щ— степени непостоянных инвариантных многочленов ii(K), iz(ty, ...,it(k) матрицы А. Заметим, что n = nl + n2+...+nt. B6) Из B5) и B6) вытекает: N>n, B7) причем знак = имеет место в том и только в том случае, когда t = l, т. е. когда все элементарные делители матрицы А попарно взаимно просты. Пусть g (К) — некоторый многочлен от К. Тогда матрица g (А) пере- перестановочна с А. Возникает обратный вопрос: в каком случае любая матрица, перестановочная с А, может быть представлена как многочлен от А? В этом случае любая матрица, перестановочная с А, была бы линейной комби- комбинацией линейно независимых матриц F А Л2 ЛП1~1 В рассматриваемом случае Ы = щ*Сщ сопоставляя с B7), получаем: N = щ = п. Таким образом, мы получили Следствие 1 из теоремы 2. Все матрицы, перестановочные с А, представляются как многочлены от А в том и только в том случае, когда щ = п, т. е. когда все элементарные делители матрицы А попарно взаимно просты. Многочлены от матрицы, перестановочной с А, также перестановочны с А. Поставим вопрос: в каком случае все матрицы, Перестановочные с А, представляются в виде многочленов от некоторой (одной и той же) матрицы d Допустим, что такой случай имеет место. Тогда, так как матрица С удовлетворяет в силу теоремы Гамильтона—Кэли своему харак- характеристическому уравнению, то любая матрица, перестановочная с С, выразится линейно через матрицы Е, С, С\ ....С". Поэтому в рассматриваемом случае N-<Cn. Сопоставляя с B7), находим N = n. Но тогда из B5) и B6) и щ = п. Следствие 2 из теоремы 2. Все матрицы, перестановочные с А, представляются в виде многочленов от одной и той оке матрицы С в том и только в том случае, когда щ = п, т. е. когда все элементар- элементарные делители у КЕ—А взаимно просты. В этом случае все матрицы, перестановочные с А, представляются и в виде многочленов от А.
206 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII Отметим еще одно очень важное свойство перестановочных матриц. Теорема 3. Если две матрицы Л = ||а№|!™, J5 = ||bjft||" перестано- перестановочны и одна из них, например А, имеет квазидиагоналъный вид А = {%,%}, B8) еде матрицы А^ и А2 не имеют общих характеристических чисел, то и другая матрица имеет такой же квазидиагоналъный вид «1 S2 В = {%,%}. B9) Доказательство. Разобьем матрицу В на блоки в соответствии с квазидиагональным видом B8): В 1% X\ \Y B2J Записывая, что АВ — ВА, получим четыре матричных равенства: 1. А1В1 = В1А1, 2. А1Х = ХА2, 3. A2Y = YAU 4. А2В2 = В2А2. C0) Второе и третье из уравнений C0), как было выяснено в § 1 (стр. 203), имеют только нулевые решения X = 0, У = 0, поскольку матрицы А± и А2 не имеют общих характеристических чисел. Таким образом, наше пред- предложение доказано. Первое и четвертое из равенств C0) выражают пере- перестановочность матриц А^ и Ви А2 и В2. Доказанное предложение в геометрической формулировке гласит: Теорема 3'. Если есть расщепление всего пространства R на инвариантные относительно оператора А подпространства /i и 12 и минимальные многочлены этих подпространств {относительно А) взаимно просты, то эти подпрост- подпространства .Zj и 12 инвариантны относительно любого линейного опера- оператора В, перестановочного с А. Из доказанной теоремы вытекает следующее следствие1): Следствие 1. Если линейные операторы А, В, ...,Х попарно перестановочны, то можно расщепить все пространство Л на инвари- инвариантные относительно всех операторов А, В, ..., L подпространства так, чтобы минимальный многочлен любого из этих подпространств от- относительно любого из операторов A, JB, ..., L был степенью неприводи- неприводимого многочлена. Как частный случай отсюда получим Следствие 2. Если линейные операторы А, В, ...,JL попарно перестановочны и все характеристические числа этих операторов при- принадлежат основному полю К, то можно расщепить все пространство Л на инвариантные относительно всех операторов А, В, ..., Ъ подпро- подпространства 1и 12, ..., Iw, в каждом из которых любой из операторов А, В, .. .,1» имеет равные характеристические числа. См. также теорему 1 гл. VII (стр. 173).
§ 4] СКАЛЯРНОЕ УРАВНЕНИЕ / (X) = О 207 И, наконец, отметим уже частный случай этого предложения: Следствие 3. Если операторы простой структуры А, В, ..., ? (см. гл. III, § 8) попарно перестановочны, то можно составить базис пространства из общих собственных векторов этих операторов. Дадим еще матричную формулировку последнего предложения: Перестановочные матрицы простой структуры можно одновременно, т. е. одним и тем же преобразованием подобия, привести к диагональ- диагональному виду. § 3. Уравнение АХ Пусть дано матричное уравнение АХ-ХВ = С, C1) где А = \\ аи |]™, В = \\ Ъм ||™ — заданные квадратные матрицы порядков тип, C = ||c/fc|| — заданная, a X=||a;jft|| — искомая прямоугольные матрицы размером тхп. Уравнение C1) эквивалентно системе тп ска- скалярных уравнений относительно элементов матрицы X: т п 2 aijXjk— 2 znbih = cik (i = l, 2, ...,m; k = l, 2, ...,n). 3=1 i=l Соответствующая однородная система уравнений т п 2 aijXjh — 2 xnhh = 0 (i = 1, 2, .. ., т; к = 1, 2, .. ., п) i=i г=1 в матричном виде записывается так: АХ-ХВ = 0. C2) Таким образом, если уравнение C2) имеет только нулевое решение, то уравнение C1) имеет одно-единственное решение. Но в § 1 было уста- установлено, что уравнение C2) имеет только нулевое решение тогда и только тогда, когда матрицы А и В не имеют общих характеристических чисел. Следовательно, если матрицы А я В не имеют общих характеристи- характеристических чисел, то уравнение C1) имеет одно и только одно решение; если же матрицы А и В имеют общие характеристические числа, то в зависимости от «свободного члена» С могут представиться два слу- случая: либо уравнение C1) противоречиво, либо оно имеет бесчисленное множество решений, задаваемых формулой Х = Х0-\-Х1, где Хо — фиксированное частное решение уравнения C1), Х± — общее решение однородного уравнения C2) (структура Xt была выяснена в § 1). § 4. Скалярное уравнение Рассмотрим сначала уравнение ?Г(Х) = О, C3) где g (К) = (К - К)а1 (К - Л2Г ... (К - Khfh — заданный многочлен переменной К, а X — искомая квадратная матрица порядка п. Так как минимальный многочлен матрицы X, т. е. первый
208 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII инвариантный многочлен г'1(Л), должен быть делителем многочлена g(X), то элементарные делители матрицы X должны иметь следующий вид: ¦ ¦ ¦ + Piv= п (среди индексов it, i2, . ¦., iv могут быть и равные, п — заданный поря- порядок искомой матрицы X). Искомая матрица X представится в виде X = Т {КЧЕ(Р^ + Н(Рч\ ..., KivEiPiv> + H(Piv>) Т~\ C4) где Т — произвольная неособенная матрица порядка п. Множество реше- решений уравнения C3) с заданным порядком искомой матрицы распадается согласно формуле C4) на конечное число классов подобных между собой матриц. Пример 1. Дано уравнение Хт=0. C5) Если некоторая степень матрицы равна нулю, то матрица называется нилъпо- тентной. Наименьший из показателей, при которых степень матрицы равна нулю, называется индексом нильпотентности данной матрицы. Очевидно, решениями уравнения C5) являются все нильпотентные матрицы с индексом нильпотентности ц ^ т. Формула, охватывающая все решения данного порядка га, выглядит так: H(Pz\ .... Я(р^}Г-1 (Рь Рг (Т—произвольная неособенная матрица). Пример 2. Дано уравнение Х*=Х. C7) Матрица, удовлетворяющая этому уравнению, называется идемпотентной. Эле- Элементарными делителями идемпотентной матрицы могут быть только Я либо %¦—1. Поэтому идемпотентную матрицу можно определить как матрицу простой струк- структуры (т. е. приводящуюся к диагональной форме) с характеристическими числами, равными нулю или единице. Формула, охватывающая все идемпотентные матрицы данного порядка, имеет вид X=Т{1,1, .... 1,0, .... 0} Г-1, C8) п где Т—произвольная неособенная матрица порядка п. Рассмотрим теперь более общее уравнение f(X) = 0, C9) где f(k) — регулярная функция в некоторой области G плоскости ком- комплексного аргумента К. От искомого решения Х=||жгь||1 будем требо- требовать, чтобы характеристические числа его принадлежали области G. Выпишем все нули функции / (X), лежащие в области G, и их кратности: (к, а2, ... Как и в предыдущем случае, каждый элементарный делитель матрицы X должен иметь вид
§ 5] МАТРИЧНОЕ МНОГОЧЛЕННОЕ УРАВНЕНИЕ 209 и потому X = Т {КЧЕ(Р^ + HiPii\ ..., hvE(Viv) + HiViv)) Г'1 D0) (t'i, i2, ..., iv = l, 2, ...; pi^ai^ P G1 — произвольная неособенная матрица). § 5. Матричное многочленное уравнение Рассмотрим уравнения A0Xm + А,Хт^ + ... + Ат = 0, D1) YmA0 + У-1^ + ... + Ат = 0, D2) где Ао, Ах, ..., Ат — заданные, а X и У—искомые квадратные матрицы порядка п. Уравнение C3), рассмотренное в предыдущем параграфе, представляет собой весьма частный (можно сказать, тривиальный) случай уравнений D1), D2) и получается из последних, если положить Ai — щЕ, где щ — число и г' = 1, 2, ...,и. Следующая теорема устанавливает связь между уравнениями D1), D2) и C3). Теорема 4. Каждое решение матричного уравнения удовлетворяет скалярному уравнению g(X) = 0, D3) где g(X)=|^m+^m-X+...+^m|- D4) Этому же скалярному уравнению удовлетворяет и любое решение У матричного уравнения . . + ^ = 0. Доказательство. Обозначим через F(К) матричный многочлен F (К) = А0Хт+АЛ™ + ... + Ат. Тогда уравнения D1) и D2) запишутся так (см. стр. 88): Согласно обобщенной теореме Безу (гл. IV, § 2), если X и У—реше- У—решения этих уравнений, то матричный многочлен F(%) делится справа на КЕ—Х и слева на KE — Y: F{X) = Q (X) (КЕ - X) = (ХЕ — У) Qt (X). Отсюда ^), D5) где А (X) = | ХЕ — X \ и Дл (X) = [ ХЕ — У | — характеристические многочлены матриц X и У. По теореме Гамильтона — Кэли (гл. IV, § 3) Ф. Р. Гантмахер
210 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII Поэтому из D5) вытекает: g(X) = g(Y) = 0. Теорема доказана. Мы доказали, что каждое решение уравнения D1) удовлетворяет скалярному уравнению (степени ^) Но множество матричных решений зтого уравнения с заданным поряд- порядком п распадается на конечное число классов подобных между собой матриц (см. § 4). Поэтому все решения уравнения 'D1) приходится искать среди матриц вида TtDtTi1 D6) здесь Dt — известные матрицы; при желании можно считать, что Dt имеют нормальную жорданову форму; Tt — произвольные неособенные матрицы /г-го порядка; ? = 1, 2, ..., h). Подставим в D1) вместо X ма- матрицу D6) и подберем Тг так, чтобы удовлетворялось уравнение D1). Для каждого Т% получим свое линейное уравнение A0TtDT + A^DT-1 +...+ AmTt = 0 (i = 1, 2, ..., h). D7) Единственный способ, который мы можем предложить для нахожде- нахождения решения 7"г уравнения D7), заключается в замене матричного урав- уравнения системой линейных однородных скалярных уравнений относительно элементов искомой матрицы Tt. Каждое неособенное решение Tt уравне- уравнения D7), будучи подставлено в D6), дает решение данного уравне- уравнения D1). Аналогичные рассуждения могут быть проведены для урав- уравнения D2). В следующих двух параграфах мы рассмотрим частные случаи урав- уравнения D1), связанные с извлечением корня m-й степени из матрицы. Заметим, что теорема Гамильтона — Кэли является частным случаем теоремы 4. В самом деле, любая квадратная матрица А, будучи подста- подставлена вместо К, удовлетворяет уравнению Поэтому в силу доказанной теоремы где А (К) = | ХЕ — А \. Теорема 4 может быть обобщена следующим образом: Теорема 5 (Филлипса)х). Если попарно перестановочные между собой квадратные матрицы п-го порядка Хо, Xlt ..., Хт удовлетворяют матричному уравнению А0Х0 + AiXi + ... + АтХт = 0 D8) (Ао, Аи ..., Ат — заданные квадратные матрицы п-го порядка), то эти же матрицы Хо, Xlt ..., Хт удовлетворяют скалярному уравнению g(Xo,Xi,...,Xm) = 0, D9) где g (to, Si, • • •, S») = 14>So + A& + ...+ Am\m |. E0) !) Cm. [231].
§ 5] МАТРИЧНОЕ МНОГОЧЛЕННОЕ УРАВНЕНИЕ 211 Доказательство. Положимх) F (go, Si, ...,&») = || fth (go, Si, • • -, gm) 111 = ^oSo + A& +...+ AJU; g0, Si, • •-, gm— скалярные переменные. Обозначим через F(g0, Si, •••, Ьп) = II7ih(go, Si, •••, Sm) 111 присоеди- присоединенную матрицу для матрицы F\fih есть алгебраическое дополнение (адъюнкта) элемента fhi в определителе j/(go, Si, ---, Sm)| = l/«|" (i, ft = l, 2, ..., /г)]. Тогда каждый элемент ftk (i, k — 1, 2, ..., п) ма- матрицы/^ есть однородный многочлен относительно g0, gb ..., |m_j степени т— 1, и потому матрицу F можно представить в виде r Zj •• Ml ¦ ¦ ¦ ЗтЪо Si • • - Ът , h+h+ ¦ ¦ ¦ +з'т=п-1 где FjojlM_jm—некоторые постоянные матрицы порядка п. Из определения матрицы F следует тождество tfF = g(b,, Si, ..-, lm)E. Запишем это тождество следующим образом: io+ 71+ - - • = g(So, Si, ..-, S«)^. E1) Переход от левой части к правой части в тождестве E1) осущест- осуществляется путем раскрытия скобок и приведения подобных членов. При этом приходится переставлять местами переменные So, Si, •••, gm между собой и не приходится переставлять местами переменные go, gi, . •., gm с матричными коэффициентами At и Fjojlm_jm. Поэтому равенство E1) не нарушится, если мы вместо переменных So, gi, • • •, gm подставим попарно перестановочные между собой матрицы Хо, Хи ..., Хт: i-Aj + • •. + АтХт) Хв Х1 ... Х^ — = g(X0, Xu ..., Хт). E2) Но по условию А0Х0 + ^jXj + • • • + АтХт = 0. Тогда из E2) находим: g(X0, Хь ..., Хт) = 0, что и требовалось доказать. Замечание 1. Теорема 5 сохраняет свою силу, если уравнение D8) заменить уравнением Х0А0+х1А1+...+ ХтАт = 0. E3) Действительно, теорему 5 можно применить к уравнению и затем перейти в зтом уравнении почленно к транспонированным ма- матрицам. Замечание 2, Теорема 4 получится как частный случай теоремы 5. если в качестве Хо,' Х1у ..., Хт взять Хт, ХПг\ ..., X, Е. /ift(lo, Ii, •--, Im) —линейные формы от |0, li, ..., lm (i, k = i, 2, ..., >.)„ 14*
212 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII § 6. Извлечение корня т-й степени из неособенной матрицы Этот и следующий параграфы мы посвятим уравнению Хт = А, E4) где А — заданная, а X— искомая матрицы (обе порядка и), т—данное целое положительное число. В данном параграфе мы рассмотрим случай, когда | А \ Ф О (А — не- неособенная матрица). В этом случае все характеристические числа ма- матрицы А отличны от нуля (ибо ] А | равен произведению этих характери- характеристических чисел). Обозначим через (X - л/1, (X - Л/2, ..., {Х- Xufu E5) элементарные делители матрицы А и приведем матрицу А к жордановой форме1): А = UAU'1 = U {XiE, + Ни ..., ХиЕи + Ни} U~\ E6) Так как характеристические числа искомой матрицы X при возве- возведении в т-ю степень дают характеристические числа матрицы А, то и у матрицы X все характеристические числа отличны от нуля. Поэтому на этих характеристических числах производная от не обращается в нуль. Но в таком случае (см. гл. VI, стр. 159) элемен- элементарные делители матрицы X не «расщепляются» при возведении матрицы X в m-ю степень. Из сказанного следует, что элементарными делителями матрицы X будут: (X-lf\ (b-g/2, ••-, (А--&УЧ E7) где ?™ = X.j, т. е. |^- является одним из корней т-й степени из Xj (^ = 1=1,2, ..., и). Определим теперь yXjEj + Hj следующим образом. Возьмем в Л-пло- скости круг с центром в точке Xj, не захватывающий нуля. В этом круге ТИ г-— мы имеем т раздельных ветвей функции у X. Эти ветви можно отличать одну от другой по значениям, которые они принимают в центре круга, в точке Xj. Обозначим через у X ту ветвь, значение которой в точке Xj совпадает с характеристическим числом |j искомой матрицы X, и, исходя из этой ветви, определим функцию от матрицы yr%jEj + Hj с помощью обрывающегося ряда .. E8) Так как производная от рассматриваемой функции -\ГХ в точке Xj не равна нулю, то матрица E8) имеет только один элементарный делитель (X — ?,j)Vi, где %j = VXj (здесь /=1, 2, ..., и). Отсюда следует, что квази- 1). Здесь Ej=Eivs\ Hj=E^p^ (/=*. 2, ...,«).
§ 6] ИЗВЛЕЧЕНИЕ КОРНЯ т-й СТЕПЕНИ ИЗ НЕОСОБЕННОЙ МАТРИЦЫ 213 диагональная матрица имеет элементарные делители E7), т. е. те же элементарные делители, что и искомая матрица X. Поэтому существует такая неособенная ма- матрица Т(\Т|^=0), что X = Т {УУ^+Жи УШ+Щ, ..., УкЕи + Ни} Т-К E9) Для определения матрицы Т заметим, что, подставляя в обе части тождества вместо X матрицу KjEj-{-Hj (j = l, 2, ..., и), получим: (/ = 1,2,..., и). Теперь из E4) и E9) следует: А = Т {%& + Ни К2Е2 + #2, ..., КЕи + Ни) ТК F0) Сопоставляя E6) и F0), найдем: T^UX2, F1) где Xj — произвольная неособенная матрица, перестановочная с А (струк- (структура матрицы Х% детально описана в § 2). Подставляя в E9) вместо Т выражение UX-^, получаем формулу, охватывающую все решения уравнения E4): X = 17Х2 {УХЖ+Ж, УЪЕ2 + Н2, .-., УКЕ~?Щ X+U-K F2) Многозначность правой части этой формулы имеет как дискретный, так и континуальный характер: дискретный (в данном случае и конеч- конечный) характер этой многозначности получается за счет выбора различных ветвеи функции у А в различных клетках квазидиагональнои матрицы (при этом даже при h} — Kh ветви -\Г% в j-й и в k-й диагональных клет- клетках могут быть различными); континуальный характер многозначности получается за счет произвольных параметров, содержащихся в ма- матрице Xj. Все решения уравнения E4) мы будем называть корнями тп-й сте- степени из матрицы А и обозначать многозначным символом -\ГА. Обратим внимание на то, что у А в общем случае не является функцией от ма- матрицы А (т. е. не представляется в виде многочлена от А). Замечание. Если все элементарные делители матрицы А попарно взаимно просты, т. е. числа Ки Я2, ..., Ка все различны, то матрица Х^ имеет квазидиагональный вид №> -^2. • • •. Хи), где матрица Xj перестановочна с KjEj + Hj и, следовательно, переста- перестановочна с любой функцией от KjEj + Hj, в частности с у' %jEj + Н}
214 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII (] = 1, 2, ..., и). Поэтому в рассматриваемом случае формула F2) прини- принимает вид Таким образом, если элементарные делители матрицы А попарно взаимно просты, то в формуле для Х=у А имеется только дискретная многозначность. В этом случае любое значение у А можно представить как многочлен от А. Пример. Пусть требуется найти все квадратные корни из матрицы А = 1 0 0 1 1 0 0 0 1 т. е. все решения уравнения В данном случае матрица А уже имеет нормальную жорданову форму. Поэтому в формуле F2) можно положить А=А, U=E. Матрица дит так (см. стр. 204): в данном случае выгля- a 0 0 b a d с 0 e где a, b, c, d, e—произвольные параметры. Формула F2), дающая все искомые решения X, в данном случае принимает следующий вид: а 0 0 Ъ а d с 0 е 8 0 0 е Т е 0 0 0 ч а 0 0 6 а d с 0 е Не изменяя X, мы можем в формуле F2) помножить Х~ на такой скаляр, чтобы |Х—| = 1. В данном случае это приведет к равенству а2е = 1, откуда е=а~2. Вычислим элементы матрицы ние с матрицей коэффициентов Х~: л. i. Для этого выпишем линейное преобразова- у2—ах2, Разрешим эту систему уравнений относительно хи х2, х3. Тогда получим пре- преобразование с обратной матрицей Х~: a?i = а!/! — (а~Ч — cd) y2—асу3, Отсюда находим: a b с О a О О d a- -1 аг1 cd—ar2b —ас 0 а-1 0 — ad a*
§ 7] ИЗВЛЕЧЕНИЕ КОРНЯ те-й СТЕПЕНИ ИЗ ОСОБЕННОЙ МАТРИЦЫ 215 Формула F3) дает: е 8 (е—r\)acd-{--2 аЧ(ц—е) (е-г)) dar1 0 ц е (8— n)vw-{-j 0 8 О (е—т]) w О ц v=a?c; w=a-4). F4) Решение X зависит от двух произвольных параметров v ж w а от двух произволь- произвольных знаков бит). § 7. Извлечение корня m-й степени из особенной матрицы Переходим к разбору случая, когда ]Л| = 0 (А — особенная матрица). Как и в первом случае, приведем матрицу А к нормальной жорда- новой форме: здесь мы через (А.— %i) \ ..., (К — Ки) и обозначили элементарные дели- делители матрицы А, отвечающие ненулевым характеристическим числам, а через К \ К 2, ..., К г — элементарные делители с нулевыми характери- характеристическими числами. Тогда где F6) F7) Заметим, что А\—неособенная матрица (|^i|^=0), а Аг — нильпотвнт- ная матрица с индексом нильпотентности [д. = max (qi, q2, ..., qt) (A2 = 0). Из исходного уравнения EД) следует перестановочность матрицы А с искомой матрицей X, а следовательно, и перестановочность подобных им матриц и-Ыи = {Аи А2} и U-+XU. F8) Как было доказано в § 2 (теорема 3), из перестановочности матриц F8) и из того факта, что матрицы -4j и А2 не имеют общих характери- характеристических чисел, вытекает, что и вторая из матриц F8) имеет соответ- соответственную квазидиагональную форму U-iXU = {XuXz}. F9) Заменяя в уравнении E4) матрицы А и X подобными им матрицами {АиА2} и {Xt,X2}, мы заменим уравнение E4) двумя уравнениями: G0) G1)
216 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII Так как | At | Ф 0, то к уравнению G0) применимы результаты пре- предыдущего параграфа. Поэтому Х^ находим по формуле F2): %. G2) Таким образом, остается рассмотреть уравнение G1), т. е. заняться нахождением всех корней т-ш степени из нильпотентной матрицы А2, уже имеющей нормальную жорданову форму: i^f/'U1'2' /f)}. G3) |j, = max(qt, q2, . ¦., qt) — индекс нильпотентности матрицы A2. Из А% = 0 и из G1) находим: Последнее равенство показывает, что искомая матрица Х2 также является нильпотентной с индексом нильпотентности v, где т (ц — 1) < <v<m|J-. Приведем матрицу Х2 к жордановой форме: Х2 = Т{H{Vl\ H(v*\ ..., HlVg)}T-1 G4) (Vi, V2, ..., ys<V). Возведем теперь обе части последнего равенства в то-ю степень. Получим: А2 = Х% = Т {[#(Ul)r, [HiVz)]n, .... [HiVs)]m} T-\ G5) Выясним теперь, какие элементарные делители имеет матрица [7/(»>]»» 1). Обозначим через Н линейный оператор, задаваемый матри- матрицей Нт в у-мерном векторном пространстве с базисом et, е2, ..., ev. Тогда иэ вида матрицы Нт (в матрице Нт все элементы первой над- диагонали равны единице и все остальные элементы равны нулю) сле- следует, что G6) Эти равенства показывают, что для оператора Н векторы еь е2, ..., во, образуют жорданову цепочку векторов, соответствующую элементарному делителю Я,". Равенства G6) запишем так: Hej = ej-i (/=1,2, ..., v; e0 = 0). Очевидно, что Hmej = ej-m (/ = 1, 2, ..., v, e0 = e_t = ... = e_m+1 = 0). G7) Представим число v в виде г) Ответ на этот вопрос дает теорема 9 гл. VI (стр. 158—159). Здесь мы вынуждены другим методом исследовать этот вопрос, так как нам нужно отыскать не только элементарные делители матрицы [Я<">]т, но и матрицу .PD,m, преобра- преобразующую [Я<">]т к жордановой форме.
§7] ИЗВЛЕЧЕНИЕ КОРНЯ m-й СТЕПЕНИ ИЗ ОСОБЕННОЙ МАТРИЦЫ 217 где к, г — целые неотрицательные числа. Расположим базисные векторы е1г е2, ..., ev следующим образом: еи G8) В этой таблице мы имеем т столбцов: первые г содержат по () векторов в каждом, остальные — по к векторов. Равенство G8) показывает, что векторы каждого столбца образуют жорданову цепочку векторов, относительно оператора JET™. Если вместо последовательной нумерации векторов G8) по строкам занумеровать их по столбцам, то в полученном таким образом новом базисе матрица оператора Нт будет иметь сле- следующую нормальную жорданову форму: и следовательно, , Hik\ ..., H™}P?m, G9> где матрица Pv,m (матрица перехода от одного базиса к другому) имеег вид (см. гл. III, § 4) 1 0 0 0 0 ... 0 ... 0 ... 1 ... 0 0 0 0 0 ... 1 ... m (80> Матрица Нт имеет один элементарный делитель Л". При возведении матрицы Нт в m-ю степень этот элементарный делитель «расщепляется». Как показывает формула G9), матрица [Нт]т имеет элементарные дели- делители: Возвращаясь теперь к равенству G5), положим: i<:m, /сг>0; i = l, 2, .... s). (81) В случае к=0 клетки H<h>, , Шк> отсутствуют, и эта матрица имеет ВИД
;218 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII Тогда в силу G9) равенство G5) перепишется так: \ ..., Hikl+l\ (82) Где г = \*?i, mi -¦ V2, wi, • • •, * vs, то/« Сопоставляя (82) с G3), видим, что клетки Я(*1+1>, ..., Я(*1+1), H™, ..., Я(*1), Я(Й2+1), ..., Н^+1\ ... (83) -с точностью до порядка должны совпасть с клетками Н^\ #(Ч ..., Н(Ч*\ (84) Условимся систему элементарных делителей X1, К2, ..., К s называть возможной для Xz, если после возведения матрицы в то-ю степень эти элементарные делители, расщепляясь, порождают заданную систему эле- элементарных делителей матрицы А2: К1, К2, ..., X '. Число возможных систем элементарных делителей всегда конечно, поскольку max (vu vz, ..., ие)*Стц, vt + vz+ ... + vs = nz (85) {nz — степень матрицы Az). В каждом конкретном случае возможные системы элементарных дели- делителей для Х2 могут быть легко определены путем конечного числа испы- испытаний. Покажем, что для каждой возможной системы элементарных дели- делителей Я S Я 2, ..., % s существуют соответствующие решения уравне- уравнения G1), и определим все эти решения. В этом случае существует пре- преобразующая матрица Q такая, что \ ..., H{hl+i\ H{hl\ ..., Я(ад, Я(йг+1), ...} = Q^AZQ. (86) Матрица Q осуществляет перестановку клеток в квазидиагональной матрице, что достигается надлежащей перенумерацией базисных векторов. Поэтому матрицу Q можно считать известной. Используя (86), мы из •(82) получим: A Отсюда или где Ха2 — произвольная матрица, перестановочная с А2. Подставляя выражение (87) для Т в G4), будем иметь: (87) Xz = Ха&Р-ЦН1^, #(и2>, ..., Я(^} PQriX-^. (88) Из F9), G2) и (88) получим общую формулу, охватывающую все искомые решения: X = U {XAl, XMQP~i) [V^E^ + H^', ..., 7кЕ{Ри) + Н{Ри), }. {ХА\, РО-гХА\) U-\ (89)
S 81 ЛОГАРИФМ МАТРИЦЫ 219 Обратим внимание читателя на то, что корень т-й степени из осо- особенной матрицы не всегда существует. Его существование связано с суще- существованием системы возможных элементарных делителей для матрицы Х2. Легко видеть, например, что уравнение не имеет решений при то>1, Пример. Требуется извлечь корень квадратный из матрицы А = т. е. найти все решения уравнения 0 0 0 1 0 0 0 0 0 В данном случае А=А2, Х=Хг, т=2, 4=2, 9i=2, 92=1- Матрица X может иметь только один элементарный делитель Я3. Поэтому s=l, z;i=3, fci=l,ri=l и [см. (80)] 1 0 0 0 0 1 0 1 0 Кроме того, как и в примере на стр. 214, можно положить в формуле (88): a cd — a~2b —ас О а-1 О О —ad а2 а 0 0 ъ а d с 0 а-2 Мз этой формулы получим: О а р 0 0 О о p-i о где а=са-1—аЗД и р=а3—произвольные параметры, § 8. Логарифм матрицы 1. Рассмотрим матричное уравнение (90) Все решения этого уравнения будем называть логарифмами (нату- (натуральными) матрицы А и обозначать через In A. Характеристические числа %j матрицы А связаны с характеристиче- характеристическими числами |j матрицы X формулой Xj — e^J; поэтому, если уравне- уравнение (90) имеет решение, то все характеристические числа матрицы А отличны от нуля и матрица А является неособенной (| А | =?= 0). Таким образом, условие | А \ Ф 0 является необходимым для существования решения уравнения (90). Ниже мы увидим, что это условие является и достаточным. Итак, пусть | А |^=0. Выпишем элементарные делители матрицы А: (91) 0,
220 МАТРИЧНЫЕ УРАВНЕНИЯ [ГЛ. VIII В соответствии с этими элементарными делителями приведем матри- матрицу А к нормальной жордановой форме: = U {^?(pi> + #(pi>, Я2Я(р2> + в№>, ..., яиЯ(р«> + в№>) U-K (92> Так как производная от функции е? отлична от нуля при всех зна- значениях |, то (см. гл. VI, стр. 159) при переходе от матрицы X к матри- матрице А = ех элементарные делители не расщепляются, т. е. матрица X имеет элементарные делители (я - g,)pi, (я - ЫЧ ..., (я - LL (93) где e^J = Xj (/ = 1, 2, ..., и), т. е. |7- есть одно из значений 1пЯ^(/ = = 1, 2, ..., и). Возьмем в плоскости комплексного переменного Я круг с центром в точке %j радиуса < | %j \ и обозначим через fj (Я) = In Я, ту из ветвей функции In Я в рассматриваемом круге, которая в точке Kj принимает значение, равное характеристическому числу gj матрицы X (/' = 1, 2, ...., и). После этого полагаем: In (KjE^ + #(р^) = fjCkjE^ 4- EPi*) = In Я/Е^ + Я!1^^ + .. . (94> Так как производная от In К нигде не обращается в нуль (в конеч- конечной части плоскости Я), то матрица (94) имеет только один элементар- элементарный делитель (Я — |j)Pj. В силу этого квазидиагональная матрица ipu> + H{pn))} (95) имеет те же элементарные делители, что и искомая матрица X. Поэтому существует такая матрица 7'(|7'|^=0), что X = Т{In(Я^!' + H(VJ), ..., In(Яв^^ + #(Pu>}Т-К (96) Для определения матрицы Т заметим, что А = в* = Т {ЬЕР* + Hipi\ ..., КЕ(Р»> + Н^ Т'1. (97) Сопоставляя (97) с (92), находим: T = UX2, ^ (98) где Х-? — произвольная матрица, перестановочная с матрицей А. Под- Подставляя выражение для Т из (98) в (96), получим общую формулу,, охватывающую все логарифмы матрицы: X =-UX2 {In (Я^^ + Я(р1>), ), ..., In (KuElP^4-Я(р«>)} XzU'1. (99) Замечание. Если все элементарные делители матрицы А взаимно- просты, то в правой части формулы (99) можно выбросить множители Х-^ и Х-1 (см. аналогичное замечание на стр. 213). 2. Выясним, когда вещественная неособенная матрица А имеет вещественный логарифм X. Пусть искомая матрица имеет несколько элементарных делителей, отвечающих характеристическому числу вида q4»i: (Я—q —гя)?1, .. .,(k—Q — in)Qt. Поскольку матрица X вещественна,, то она имеет и сопряженные элементарные- делители: (Я—Q + irt) *, ..., (X—{> + ?я) *. При переходе от матрицы X к матри-
$ 8] ЛОГАРИФМ- МАТРИЦЫ 221 це А элементарные делители не расщепляются, но характеристические числа д + ?я, •Q — in заменяются в них числами ер+гл= — \i, ер~гп=—ц, где fx=ep>0. Поэтому в системе элементарных делителей матрицы А каждый элементарный делитель, соответствующий отрицательному характеристическому числу (если таковые суще- существуют), повторяется четное число раз. Докажем теперь, что это необходимое условие является и достаточным, т. е. что вещественная неособенная матрица А тогда и только тогда имеет вещественный логарифм X, когда у матрицы А либо совсем нет элементарных делителей, соответствующих отрицательным характери- характеристическим числам 1), либо каждый такой элементарный делитель повторяется чет- четное число раз г). Действительно, пусть это условие выполнено. Тогда в квазидиагональной матрице (95) в соответствии с формулой (94) в тех клетках, где X.j вещественно и положительно, возьмем для In Xj вещественное значение; если же в какой-либо клетке имеется комплексное Яп, то найдется другая клетка такого же размера ¦с X.g=An. В этих клетках возьмем комплексно сопряженные значения для In Xn и In Яй. Каждая же клетка по условию повторяется в (98) четное число раз с сохране- сохранением размера клетки. Тогда в половине этих клеток положим 1пЯь=1п | Kf, \-{-in, а в другой половине возьмем 1пЯй=1п|Яй|—in. Тогда в квазидиагональной матрице (98) диагональные клетки либо будут вещественными, либо будут попарно комплексно сопряженными. Но такая квазидиагональная матрица всегда подобна ¦вещественной матрице3). Поэтому существует такая неособенная матрица Ti (I Ti I Ф 0), что матрица вещественна. Но тогда будет вещественной и матрица (P)-\ A00) Сопоставляя формулу A00) с формулой (92), заключаем, что матрицы А и А^ подобны между собой (поскольку они подобны одной и той же жордановой матри- матрице). Но две подобные вещественные матрицы могут быть преобразованы друг в друга с помощью некоторой неособенной вещественной матрицы WQWl^O): А= WAiW-1=WeXlW-1=eWXlW~1. Тогда матрица X=WX1W~1 и будет искомым вещественным логарифмом матрицы А. *) В этом случае существует вещественный In 4= г (А), где г (X)—надлежащий интерполяционный многочлен для lno Я (см. стр. 104). 2) Это условие, в частности, выполняется, когда А=В2, где В—вещест- В—вещественная матрица* 3) Для того чтобы убедиться в этом, достаточно показать, что квазидиаго- квазидиагональная матрица IB 0\ D = - \0 В всегда ;подобна некоторой вещественной матрице. Здесь 2?=I7-f-iF, B—U—iV, где U и V—-вещественные матрицы. Обозначая через Е единичную матрицу тех же размеров, что и В, и полагая легко проверим, что y-i =
ГЛАВА IX ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ § 1. Общие соображения В главах III и VII мы изучали линейные операторы в произвольном л-мерном векторном пространстве. Все базисы такого пространства рав- равноправны между собой. Данному линейному оператору в каждом базисе отвечает некоторая матрица. Матрицы, отвечающие одному и тому же оператору в различных базисах, подобны между собой. Таким образом, изучение линейных операторов в n-мерном векторном пространстве давало возможность выявить свойства матрицы, присущие одновременно всему классу подобных между собой матриц. В начале этой главы мы введем метрику в n-мерное векторное про- пространство, относя специальным образом каждым двум векторам некото- некоторое число — их «скалярное произведение». С помощью скалярного про- произведения определяется «длина» вектора и «косинус угла» между двумя векторами. Такая метризация приводит нас к унитарному пространству,, если основное поле К — поле всех комплексных чисел, и к евклидову пространству, если К — поле всех вещественных чисел. В настоящей главе мы будем изучать свойства линейных операторов, связанные с метрикой пространства. По отношению к метрике простран- пространства уже не все базисы равноправны. Однако равноправными являются все ортонормированные базисы. Переход от одного ортонормированного базиса к другому осуществляется в унитарном (соответственно евкли- евклидовом) пространстве при помощи специального — унитарного (соответ- (соответственно ортогонального) — преобразования. Поэтому две матрицы, отве- отвечающие одному и тому же линейному оператору в двух различных базисах унитарного (евклидова) пространства, унитарно-подобны (ортого- (ортогонально-подобны) между собой. Таким образом, изучая линейные опера- операторы в w-мерном метризованном пространстве, мы изучаем те свойства матрицы, которые остаются инвариантными при переходе от данной матрицы к матрице унитарно- или ортогонально-подобной. Это приводит нас естественным образом к исследованию свойств специальных классов матриц (нормальных, эрмитовых, унитарных, симметрических, косо- симметрических, ортогональных). § 2. Метризация пространства Рассмотрим векторное пространство R над полем комплексных чисел. Пусть каждым двум векторам х и у из В, заданным в определенном порядке, отнесено некоторое комплексное число, называемое скалярным произведением этих векторов и обозначаемое через (ху) или (ас, у). Пусть при этом имеют место следующие свойства «скалярного умножения».
§ 2] МЕТРИЗАЦИЯ ПРОСТРАНСТВА 223- Для любых векторов х, у, z из В, и любого комплексного числа а 1- (ху) = (ухI), ~\ 2. (ах, у) = а(ху), \ A). 3. (х + у, z) = (xz) + (yz). J В этом случае говорят, что в пространство Л внесена эрмитова метрика. Заметим еще, что из 1, 2 и 3 следует для любых х, у, z из R: 2'. (ас, ау) = а(ху), 3'. (х, y + z) () () Из 1 заключаем, что для любого вектора х скалярное произведе- произведение (хх) является вещественным числом. Если для любого вектора х из Л 4. (хх) > 0, B) то эрмитова метрика называется неотрицательной. Если же при этом 5. (асзе)>0 при хфО, C) то эрмитова метрика называется положительно определенной. Определение 1. Векторное пространство JK с положительно опре- определенной эрмитовой метрикой мы будем называть унитарным простран- пространством 2). В настоящей главе мы будем рассматривать конечномерные унитар- унитарные пространства3). Под длиной вектора х понимают 4) | х [ = |/~(х, х). Из 2 и 5 следует, что каждый вектор, отличный от нуля, имеет положительную длину и лишь вектор-нуль имеет длину, равную нулю. Вектор х называется нормированным (также единичным вектором или ортом), если |ас| = 1. Для «нормировки» произвольного вектора хфО достаточно умножить этот вектор на любое комплексное число %, у которого | Я | = . По аналогии с обычным трехмерным векторным пространством два вектора х и у называются ортогональными (обозначение: х ± у), если (жу) — 0. В этом случае из 1, 3, 3' следует: (х + у, х + у) = (хх) + (уу) т. е. (теорема Пифагора!) = \х\* + \у\* (х±у). Пусть унитарное пространство Л имеет конечное число измерений п. Рассмотрим в В; произвольный базис еи е2, ..., еп. Обозначим через xt и ijt (t = l, 2, ..., п) соответственно координаты векторов х и у в этом базисе: п п 3E = 2 xieh 2/= 2 ytet. ii ii x) Черта над числом означает переход к комплексно сопряженному числу.. 2) Исследование п-мерных векторных пространств с произвольной (не положи- положительно определенной) метрикой проведено в статье [117], а также в книге [24], гл. IX и X. 3) В §§ 2—7 этой главы во всех случаях, когда конечномерность пространства не будет особо оговорена, все рассуждения сохраняют свою силу и для бесконеч- бесконечномерных пространртв. 4) Здесь знаком ~\/~ обозначаем неотрицательное (арифметическое) значение- корня.
224 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Тогда в силу 2, 3, 2' и 3' п (ху)= 2 hhXiyh, D) г, fe=l где hih = (eteh) (i, k = l, 2, ...,п). E) В частности, (жх)= 2 hhXixh. F) i, ft=l Из 1 и E) следует: Аы = Л|к (i, k = l, 2, ...,п). G) п Форма 2 hih%t%h, где hki = hifl(i, к=1, 2, ..., и), называется эрми- z, fe=l товой1). Таким образом, квадрат длины вектора представляется в виде эрмитовой формы его (координат. Отсюда и название «эрмитова метрика». Форма, стоящая в правой части равенства F), является в силу 4 неотрицательной: 2 hikXiXk>0, (8) i, fc=i при всех значениях переменных хи х2, ..., хп. В силу же дополнитель- дополнительного условия 5 эта форма будет положительно определенной, т. е. знак = в (8) будет иметь место только при равенстве нулю всехжг(? = 1, 2, ...,п). Определение 2. Систему векторов еи е2, ..-, еп будем называть ортонормированной, если = 8ih = \ (i, fe = i,2 m). (9) При т — п, где п — число измерений пространства, получаем ортонорми- рованный базис пространства. В § 7 будет доказано, что в каждом п-мерном унитарном прост- пространстве существует ортонормированный базис. Пусть xt и уг (i = l, 2, ...,п) — соответственно координаты векто- векторов ж и у в ортонормированием базисе. Тогда в силу D), E) и (9) n = 2 i=l A0) Фиксируем произвольно некоторый базис в в-мерном пространстве R. При этом базисе каждая метризация пространства связана с некоторой положительно опреде- п ленной эрмитовой формой 2 ^ihxixUi и наоборот, согласяо D) каждая такая форма i й1 г) В соответствии с этим выражение, стоящее в правой части равенства D), называется билинейной эрмитовой формой (относительно величин х^, х2, ..., хп и VI' У%' •••• Уп)-
§ 3] КРИТЕРИЙ ГРАМА ЛИНЕЙНОЙ ЗАВИСИМОСТИ ВЕКТОРОВ 225 определяет некоторую положительно определенную эрмитову метрику в R. Однако все эти метрики не дают существенно различных унитарных п-мерных пространств. Действительно, возьмем две такие метрики со скалярным произведением соответст- соответственно (жу) и (жу)'. По отношению к этим метрикам определим ортонормированные базисы в U: ej и ег (i =1, 2, ..., п). Отнесем друг другу векторы жиж'изВ(ж-у ж'), имеющие в этих базисах одинаковые координаты. Это соответствие является аффин- аффинным1). Кроме того, в силу A0) (жу)=(ж'у')'. Таким образом, с точностью до аффинного преобразования пространства все положительно определенные эрмитовы метризации п-мерного векторного пространства совпадают друг с другом. Если основным числовым полем К является поле вещественных чисел, то метрика, удовлетворяющая постулатам 1, 2, 3, 4 и 5, называется евклидовой. Определение 3. Векторное, пространство В над полем веществен- вещественных чисел с положительно евклидовой метрикой называется евклидовым пространством. Если хг и уг (i — 1, 2, ..., п) суть координаты векторов х и, у в неко- некотором базисе е±, е2, ..., еп n-мерного евклидова пространства, то п п (КУ)= 2 SihXiVk, И2= 2 SlhXiXk. i, fe=l i, fe=l Здесь sih = ski (i, k—1, 2, ..-,«) — вещественные числа2). Выражение n - 2 sihXiXh называется квадратичной формой относительно хи х^, ..., хп. г, k=i Из положительной определенности метрики вытекает, что квадратичная форма 2 sik%i%k, задающая аналитически эту метрику, является поло- i, й=1 п п жительно определенной, т. е. 2 sthXtxh>0, если 2ж?>0. г, fe=l i=l При ортонормированном базисе (аву)=2я^1, |ос|г=24. A1) При п = 3 получаем известные формулы для скалярного произведения двух векторов и для квадрата длины вектора в трехмерном евклидовом пространстве. § 3. Критерий Грама линейной зависимости векторов Пусть векторы хи xz, ..., хт унитарного или евклидова простран- пространства Л линейно зависимы, т. е. существуют такие не равные одновре- одновременно нулю числа сь с2, ..., ст3), что CiXi + сгх2 + ...+ стхт = 0. A2) !) То есть оператор А, относящий вектору ж из R вектор ж' из JR, является линейным и неособенным. г) ^=(егей) (г, ft=l, 2, .... п). 3) В случае евклидова пространства сь с2, ...,ст—вещественные числа. 15 ф. р. Гантмахер
226 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Умножив последовательно обе части этого равенства слева скалярно на хи зе2, .... Хт, получим: (XiXi) Ct + (XiX2) C2 + . . . + (XiXm) Ст = О, . . . + (Х2Хт) Ст = О, (Щ = 0. Рассматривая си с2, ..., ст как ненулевое решение системы линейных однородных уравнений A3) с определителем A4) . . - (ХуХт) (Х2Х2) . . . (Х2Хт) 1 \Х\, Жч, • • •, Хт) —- yXjnXi) \XfyiX2) . . a ваключаем, что этот определитель равен нулю: Г(зеь х2, ..., хт) = 0. Определитель Г(х\, х2, ..., хт) называется определителем Грама, составленным для векторов хи х2, ..., хт. Пусть, обратно, определитель Грама A4) равен нулю. Тогда система уравнений A3) имеет ненулевое решение си с2, ..., ст. Равенства A3) можно записать так: (Хи CtXt + С2Х2 +...+ СтХт) = 0, (Х2, CiXy + С2Х2 + ...+ СтХт) = 0, 13, Умножая почленно эти равенства соответственно на сь с2, ..., ст и складывая, получим: I |/» ry* I /» ^у» ?. . I /» /у* Л|2 ¦ (}• отсюда в силу положительной определенности метрики , = 0, т. е. векторы зс15 х2, ..., хт линейно зависимы. Нами доказана Теорема 1. Для того чтобы векторы хи ж2, ¦ ¦ -, хт были линейно независимы, необходимо и достаточно, чтобы определитель Грама, состав- составленный из этих векторов, не был равен нулю. Отметим следующее свойство определителя Грама. Если какой-либо главный минор определителя Грама равен нулю, то равен нулю и сам определитель Грама. Действительно, главный минор является определителем Грама для части векторов. Из равенства нулю этого главного минора следует линей- линейная зависимость между этими векторами, а значит, и между векторами полной системы. Пример. Даны и комплексных функций fx («), /2 («). ¦¦¦> fn («) вещественного аргумента t, кусочно непрерывных в замкнутом интервале [а, |3]. Требуется опре- определить, при каком условии они будут линейно зависимы. Для этого мы в прост-
§4] ОРТОГОНАЛЬНОЕ ПРОЕКТИРОВАНИЕ 227 ранстве кусочно непрерывных в [а, р] функций введем положительно определенную метрику, полагая Э Тогда критерий Грама (теорема 1) в применении к данным функциям даст искомое условие ... \ =0. е 5 fn (t) /l (*) dt ... ^ fn (t) fn (t dt § 4. Ортогональное проектирование Пусть в унитарном или в евклидовом пространстве JB даны произ- произвольный вектор х и некоторое m-мерное подпространство S с базисам хъ х2, • • •, жт. Мы покажем, что вектор ж можно (и притом единственным способом) /к представить в виде суммы х/ ixn где J_ S (знаком J. мы обозначаем ортогональность векторов; под ортогональностью к подпро- Рис 5. странству понимаем ортогональность ко всем векторам из этого подпространства); xs—ортогональная проекция вектора х на подпространство 8, Жя—проектирующий вектор1). Пример. JB—трехмерное евклидово векторное пространство, а т=2. Все векторы будем строить из фиксированной точки О. Тогда S—плоскость, проходя- проходящая через О; acs—ортогональная проекция вектора се на плоскость S; се^—пер- се^—перпендикуляр, опущенный из конца вектора се на плоскость S (рис. 5); /г=|ж^| расстояние конца вектора х от плоскости S. Для установления разложения A5) искомое Xs представим в виде Xs = СуЖ! + С2Х2 + . • • + СтХт, A6) где сх, с2, ..., Ст — некоторые комплексные числа2). Для определения этих чисел будем исходить из соотношений (gp /jC« gp,\ -_ Q /^__| 2 in) СП\ Подставляя в A7) вместо зеЛ- его выражение из A6), получим: (ж±жу) су + ... + (aw»!) ст + (ххх) • (— 1) = О, A8) ...+ (хтхт) ст + (ххт) ¦ (— 1) = 0, ...+ хтст+ xs-{ —1) = 0. 1) В данном случае а?5—проекция вектора ж на подпространство S парал- параллельно подпространству Т, состоящему из всех векторов из В, ортогональных к S (см. стр. 69). 2) В случае евклидова пространства с4, с2 ст — вещественные числа. 15*
228 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Рассматривая эту систему равенств как систему линейных однородных уравнений, имеющую ненулевое решение сь с2, ..., ст, — 1, приравниваем определитель этой системы нулю (предварительно транспонировав его относительно главной диагоналиI): . . . (ХтХт) ... (ххт) = 0. A9) Выделяя из этого определителя член, содержащий xs, получим (в легко понятных условных обозначениях): а?! B0) где Г = Г(ж1, зе2, ..., хт) — определитель Грама для векторов хи ж2, ... ..., хт (в силу линейной независимости этих векторов Г =^ 0). Из A5) и B0) находим: у = Х-Хд= W-W * . B1) Формулы B0) и B1) выражают проекции Xs вектора х на подпро- подпространство S и проектирующий вектор Жу через данный вектор х и базис подпространства #. Обратим внимание еще на одну важную формулу. Обозначим через h длину вектора xN. Тогда в силу A5) и B1) h2 = (хтх) . . . <ХХт) (XX) т. е. Г(а?1, ж2, ..., хт, х) хг, ... B2) Величину h можно еще интерпретировать следующим образом: Построим векторы Xi, зс2, ..., хт, х из одной точки и построим на этих векторах, как на ребрах, {т-\-\)-мерный параллелепипед, h будет 1) Определитель, стоящий в левой части равенства A9), представляет собой вектор, i-я координата которого получается, если в последнем столбце все векторы a?i,..., xm, xs заменить их г-ми координатами (t=l, 2, ..., и); координаты берутся в некотором произвольном базисе. Для оправдания перехода от A8) к A9) доста- достаточно в последнем равенстве A8) и в последнем столбце в A9) заменить векторы a>i, ..., хт, xs их i-ми координатами.
§ 5] ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ОПРЕДЕЛИТЕЛЯ ГРАМА 229 высотой этого параллелепипеда, опущенной из конца ребра х на основа- основание 8, проходящее через ребра жи х2, ..., хт- Пусть у — произвольный вектор в 8, а х — произвольный вектор в В. Если все векторы построить из начала координат n-мерного точечного пространства, то | ас — у \ и | х — Xs \ будут соответственно равны величи- величинам наклонной и высоты, проведенным из конца вектора х к гиперплос- гиперплоскости 8 *). Поэтому, записывая, что высота короче наклонной, будем иметь 2): h—\x — Xs\^\x — y\ (знак равенства лишь при y = Xs). Таким образом, среди всех векторов у ? 8 вектор зс« наименее уклоняется от заданного вектора х?И. Вели- Величина /г=|/\ж— Xs, x — Xs) является квадратичной погрешностью при приближении х да xs3). § 5. Геометрический смысл определителя Грама и некоторые неравенства 1. Рассмотрим произвольные векторы а?ь х2, ...,хт. Допустим сна- сначала, что эти векторы линейно независимы. В этом случае определитель Грама, составленный для любых из этих векторов, будет отличен от нуля. Тогда, полагая согласно B2) Т (хи хг, ..., хр+1) /*|,>0 (р = 1, 2, ...,т — 1) B3) x2,...,xp) и перемножая почленно эти неравенства и неравенство Г (xi) — CCi3Ci) > 0, B4) получим: Г(Ж1, х2, ...,хт)>0. Таким образом, определитель Грама для линейно независимых векто- векторов положителен, для линейно зависимых равен нулю. Отрицательным определитель Грама никогда не бывает. -Обозначим для сокращения Гр = Г (хи х2, ..., хр) (р = 1, 2, ..., т). Тогда из B3) и B4) где V2—площадь параллелограмма, построенного на xt и х2. Далее, где V3 — объем параллелепипеда, построенного на векторах xt, хг, х3. Продолжая далее, найдем: и, наконец, /r^F^An-i-F^. B5) Естественно Vm назвать объемом m-мерного параллелепипеда, пост- построенного на векторах хи х2, ..., хт, как на ребрах 4). 1) Ср. с примером на стр. 227. 2) |*|+|*| 3) Относительно использования метризованных функциональных пространств в задачах аппроксимации функций см. [2]. 4) Формула B5) дает индуктивное определение объема m-мерного параллеле- параллелепипеда.
230 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Обозначим через %&, x2k, ...,xnh координаты вектора Хь. {к = 1,2,... ..., т) в некотором ортонормированием базисе в R, и пусть Х = || s,k|| (i = l, 2,...,n; Л = 1, 2, ...,т). Тогда на основании A4) и потому [см. формулу B5)] = Тт = mod %im2 ¦ • * Ximm B6) Это равенство имеет следующий геометрический смысл: Квадрат объема параллелепипеда равен сумме квадратов объемов его проекций на все координатные т-мерные подпространства. В част- частности, при т — п из B6) следует: Vn = mod Хц Ж12 . . #22 • • • Х2п «711 B6') При помощи формул B0), B1), B2), B6), B6') решается ряд основ- основных метрических задач n-мерной унитарной и евклидовой аналитической геометрии. 2. Вернемся к разложению A5). Из него непосредственно следует: что в сочетании с B2) дает неравенство (для произвольных векторов Г (хи х2, . ¦ ¦, х,п, х) < Г {хи х2, -.., хт) Г (ж); B7) при этом знак равенства имеет место тогда и только тогда, когда век- вектор ж ортогонален к векторам жь х2, ...,хп. Отсюда нетрудно получить так называемое неравенство Адамара Г (xlt xz, ..., эст)<Г (acj) Г (х2)... Г (хт), B8) где знак равенства имеет место тогда и только тогда, когда векторы хи х2,, ...,Жт попарно ортогональны. Неравенство B9) выражает собой сле- следующий геометрически очевидный факт: Объем параллелепипеда не превосходит произведения длин его ребер и равен этому произведению лишь тогда, когда параллелепипед прямо- прямоугольный. Неравенству Адамара можно придать его обычный вид, полагая в B8) иг = п и вводя в рассмотрение определитель Л, составленный из координат х^, x2k, ...,Xnk векторов ас^(/с = 1, 2, ...,п), в некотором ортонормированием базисе: Жи . . . Х1п . . . Хп
§ 5] ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ОПРЕДЕЛИТЕЛЯ ГРАМА 231 Тогда из B6') и B8) следует: I а Г< 21 хн |" 2 Ы1 • • • SI ж« I2- B8') il ii fcl 3. Установим теперь обобщенное неравенство Адамара, охватываю- охватывающее как неравенство B7), так и неравенство B8): Г (зеь х2, ..., зет)<Г (ась ..., хр)Г (зер+1, ..., хт), B9) причем знак равенства имеет место тогда и только тогда, когда каждый из векторов Xi, зе2, ...,хр ортогонален к любому из векторов xp+i, ... ..., хт либо один из определителей Г (acj, ..., зер), Г (хр+1, ..., жт) равен нулю. Неравенство B8') имеет следующий геометрический смысл: Объем параллелепипеда не превосходит произведения объемов двух дополнительных «граней» и равен этому произведению в том и только е том случае, когда эти «грани» взаимно ортогональны либо хотя бы одна из них имеет нулевой объем. Справедливость неравенства B9) установим индуктивно относительно числа векторов жр+1, ..., хт. Неравенство справедливо, когда это число равно 1 [см. формулу B7)]. Введем в рассмотрение два подпространства S и 8t соответственно с базисами хи ..., asm_i и xp+i, ..., acm_i. Очевидно, 8у cr S. Рассмотрим ортогональные разложения хт = xSl + xNl (xSl 6 8it хщ _L S^, Хщ — x's+Xx {x's?8, азу ± 8). Отсюда жто = xs + xN (xs = xSl + x's, хж А. 8). Заменяя квадрат объема параллелепипеда произведением квадрата объема основания на квадрат высоты [см. формулу B2)], найдем:'] Г (хи ..., Хт_и хт) = Г (хи ..., хт_х) Г (асу), C0) Г (xp+i, ..., Хт_и хт) = Г (хр+и ..., Xn^i) Г (ас^л). C0') При этом из разложения вектора Хжх следует: C1) причем здесь знак = имеет место, лишь когда Xwx — vcw- Используя теперь соотношения C0), C0), C1) и предположение индукции, получим: Г(жь .. .,xm) = T(xi, .. .,xm_i) ГCCy)< < Г (ХХ, . . ., Xm_i) Г (Жу,) < Г {Хи ...,Хр)Т (Хр+и ..., 3Cm_i) Г (xNl) = = Г (хи ..., хр) Г (хр+1, ..., хт). C2) Мы получили неравенство B9). Переходя к выяснению, когда в этом неравенстве имеет место знак = , примем, что Г (xlf , хр) Ф 0 и Г (жр+1, ..., хт) Ф 0. Тогда согласно C0') также Г (зер+1, ..., acm-i) Ф 0 и Г (эсу,) Ф 0. Коль скоро в соотношениях C2) всюду имеет место знак равенства, то Хжг = Хж и, кроме того, по предположению индукции, каж- каждый из векторов хр+1, ..., эст_1 ортогонален к каждому из векторов Хи ..., Хр. Этим свойством обладает, очевидно, и вектор
232 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Таким образом, обобщенное неравенство Адамара установлено пол- полностью. 4. Обобщённому неравенству Адамара B9) можно придать и анали- аналитическую форму. 71 Пусть 2 ЫкЗНХк—произвольная положительно определенная эрми- i, k=l това форма. Рассматривая хи xz, ..., хп как координаты вектора ж в n-мерном пространстве R при базисе еи е2, ..., еп, примем форму п 2 hikXiXk за основную метрическую форму в В (см. стр. 224). Тогда i, fc=l R станет унитарным пространством. Применим обобщенное неравенство Адамара к базисным векторам еи е2, ..., еп: Т(еи с2, ...,еп)<Г(е1, ..., ер) Г Полагая H = \\hik\\™ и замечая, что (е^е^) = htk(i, к—I, 2,...,n), мы последнее неравенство сможем записать так: lp + д р /1 2 ...п\ /1 2 ... р\ l при этом знак равенства имеет место в том и только в том случае, когда Неравенство C3) имеет место для матрицы коэффициентов Н — [| hik ||™ произвольной положительно определенной эрмитовой формы. В частности, неравенство C3) имеет место, если Я—вещественная матрица коэффи- п циентов положительно определенной квадратичной формы 2 hih%i%k *)• 5. Обратим внимание читателя на неравенство Буняковского. Для произвольных векторов х, у ? В I (ЖУ) |2<(жх) (уу), C4) причем знак равенства имеет место лишь тогда, когда векторы х и у отличаются скалярным множителем. Справедливость неравенства Буняковского сразу вытекает из уста- установленного уже неравенства (хх) (ху) (уж) (уу) По аналогии со скалярным произведением векторов в трехмерном евклидовом пространстве в n-мерном унитарном пространстве можно ввести «угол» 6 между векторами ж ж у, определив его из соотношения 2) cose= (Я5Я5) Из неравенства Буняковского следует, что 6 имеет вещественное зна- значение. г) Аналитический вывод обобщенного неравенства Адамара приведен в книге [7], § 8. 2) В случае евклидова пространства угол 6 между векторами х а у опреде- определяется из формулы \я\\у\
§ 6] ОРТОГОНАЛИЗАЦИЯ РЯДА ВЕКТОРОВ 233 § 6. Ортогонализация ряда векторов 1. Наименьшее подпространство, содержащее векторы Х\, зе2, ...,зср, будем обозначать через [х±, х2, ...,жр]. Это подпространство состоит из всевозможных линейных комбинаций ciXi-\-c2x2-\- ... -\-СрХр векторов хи х2, .".., Хр (си с2,...,ср—комплексные числаI). Если векторы xif х2, ¦ ¦ ¦, хр линейно независимы, то они образуют базис подпространства [хи х2, ...,хр]. В этом случае это подпространство имеет р измерений. Два ряда векторов X: Xi, х2, ..., Y: у и у2, ..., содержащих одинаковое конечное или оба бесконечное число векторов,, назовем эквивалентными, если для всех возможных р [хи х2, ...,хр] = [у±, у2, ...,ур] (р = 1, 2, ...). Ряд векторов X: Хи х2, ... назовем невырожденным, если при любом возможном р векторы х1г х2, ..., хр линейно независимы. Ряд векторов называется ортогональным, если любые два вектора этого ряда взаимно ортогональны. Под ортогонализацией ряда векторов будем понимать замену этого ряда эквивалентным ортогональным рядом. Теорема 2. Всякий невырожденный ряд векторов можно проорто- гонализироватъ. Процесс ортогонализации приводит к векторам, опре- определенным однозначно с точностью до скалярных множителей. Доказательство. 1. Докажем сначала вторую часть этой тео- теоремы. Пусть два ортогональных ряда ЗГ: у и у2, ... и Z: su z2, ... эквивалентны одному и тому же невырожденному ряду JT: х%, х2, ¦... Тогда ряды Y и Z эквивалентны между собой. Поэтому при любом р существуют числа сп, ср2, ..., срр такие, что Zp=^Cpiy1 + cp2y2+ ...+сРгР_1ур_1 + сРрУр (р = 1, 2,...). Умножая последовательно обе части этого равенства скалярно на yit Уъ, • • • j Ур-i и учитывая ортогональность ряда Y и соотношения «р J- [«1, «2, • • •, ?p-i] = [Уи Уъ ¦ ¦ ¦, Ур-i], получим: Cpi = ср2 = ... = сР) р-1 = 0 и, следовательно, (р = 1, 2, ...). 2. Конкретное осуществление процесса ортогонализации произволь- произвольного невырожденного ряда векторов X: act, x2, • •. дается следующим построением. Пусть 8рш=[хи х2, ...,хр], Гр = Г(ж15 х2,...,хр) (р = 1, 2,...). Спроектируем ортогонально вектор хр на подпространство ^n_i (p = = 1, 2,...)"): жряр_1 6 8P-i, 3CpJF ± Sp_i (р = 1, 2, ...). В случае евклидова пространства эти числа вещественны. Прир = 1мы полагаем: xlSg—0, xiw—xi.
234 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX = 1, 2, ...; жш = хх), Положим где %р (р = 1, 2, ...) — произвольные отличные от нуля числа. Тогда (как легко видеть) ортогональный ряд, эквивалентный ряду X. Теорема 2 доказана. Согласно B1) . . . (XpXp-l) Xp г р-1 = 1, 2,...; Го=1). Полагая 'кр — Тр^ (р = 1, 2, ...; Го = 1), получим для векторов про- ортогонализированного ряда следующие формулы: В силу B2) (УрУр) = rl-i I жрх I = Поэтому, полагая г , ... C5) ¦ • • [p^p^p-i) Жр (р=1, 2, ...;Г0=1). C6) = 1, 2,...), C7) получим ортонормированный ряд Z, эквивалентный данному ряду X. П ример. Определим скалярное произведение в пространстве кусочно непре- непрерывных в интервале [—1, +1] вещественных функций равенством (A g)= \f(x)g(x)dx. Рассмотрим невырожденный ряд «векторов» 1, х, х2, х3, ... Проортогонализируем его по формулам C5): 1 1 ° ° ° J/0 зз 1, Ут= ... 1 г — 1 2 )¦
§ 6] ОРТОГОНАЛИЗАЦИЯ РЯДА ВЕКТОРОВ 235 Эти ортогональные между собой многочлены с точностью до постоянных множителей совпадают с известными многочленами Лежандра1): dxm (« = 1, Тот же ряд степеней 1, х, х2,... при другой метрике ь (/, g)=§ 1(x)g(x)x{x)dx [т:(а)>0 при я< а даст другой ряд ортогональных многочленов. Так, например, при а — — 1, Ь=1 и г(х)=—~==г получаются многочлены Чебышева: 1 Тп (х)— 2n-1 cos (n arccos x). При а=—со, Ь= +оо и x{x)=e~x* получаются многочлены Чебышева— Эрмита и т. д. 2). 2. Отметим еще так называемое неравенство Бесселя для ортонор- мированного ряда векторов Z: zu z2, ... Пусть дан произвольный век- вектор х. Обозначим через |р проекцию этого вектора на орт #р: lp = (xsp) (p=l, 2, ...). Тогда проекция вектора х на подпространство Sp = [*t, «2, • • •, ^р] пред- представится в виде [см. B0)] Но \xs |2 = |li|2 + IS2|a+• • •+|1р12<|зс|г. Поэтому для произвольного р \11\2 + \Ы2+--- + \1Р?<\я\2- C8) Это—неравенство Бесселя. В случае конечномерного пространства п измерений это неравенство имеет совершенно очевидный геометрический смысл. При р = п оно переходит в равенство Пифагора В случае бесконечномерного пространства и бесконечного ряда Z оо из C8) следуют сходимость ряда 2 lifti2 и неравенство Составим ряд оо р-Ш отрезок этого ряда (при любом р) г) См. [19], стр. 77 и далее. 2) Более подробно об этом см. [19], гл. II, § 9, а также [9].
236 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. 1X1 равен проекции Xs вектора х на подпространство Sp = [Zi, z2> ¦¦•, %р] а потому является наилучшим приближением для вектора х в этом под- подпространстве : 1C5-23 Ьь**)|<|(ас- S с*«*)|, где си с2, ..., cp—произвольные комплексные числа. Вычислим соответ- соответствующее квадратичное отклонение 6Р: — \pC Zj Ьк*к> Ж Zj bk%h) — | •* I "~~ Zj I Ък { • Отсюда lim б" = | ас |я-23 l^l2- 2>-*oo k=l Если lim dp = 0, oo то говорят, что ряд Zj \h%k сходится в среднем (сходится по норме) к вектору х. В этом случае для вектора х из Л имеет место равенство (теорема Пифагора в бесконечномерном пространстве!) оо V Если для любого вектора х из В, ряд 2 Еа^а в среднем сходится к вектору х, то ортонормированный ряд векторов *tl «2. ¦ ¦ • называется полным. В этом случае, заменяя в C9) ас на ж + «/ и используя равен- равенство C9) трижды, для векторов х + 2/, ж и з/ мы легко получим: оо = 2 E*4ft IE* = C5«fc),4fc = (у«а); л = !. 2, ... J. D0) fti Пример. Рассмотрим пространство всех комплексных функций / (<) <—вещественный аргумент), кусочно непрерывных в замкнутом интервале [0, 2я]. Скалярное произведение двух функций / (t) и g (t) определим формулой 2я о В частности, 2я о Возьмем бесконечную последовательность функций 1 еШ (*=0, ±1,±2, ...).
S 7] ОРТОНОРМИРОВАННЫЙ БАЗИС 237 Эти функции образуют ортонормированный ряд, так как 2я 2я **е-™ dt = \ г <^> ' Л j I 2n при fx==v. о О Ряд <х> 2Я (^г J *=o, ± i, ± 2,... fc=—оо «сходится в среднем к функции / (t) в интервале [0, 2я]. Этот ряд называется рядом Фуры для.функции / (t), а коэффициенты /&(й=0, ±1, ±2, ...)—коэффициентами •Фурье для f(t). В теории рядов Фурье доказывается, что система функций elhl (&=0, i 1, _? 2,...) является полной1). Условие полноты дает равенство Парсеваля [см. равенство D0)] 2Я +оо 2я 2Я 0 fc=—oo Если /(?)—вещественная функция, то /о вещественно, а /^ и /_^—комплексно •сопряженные числа (&=1, 2, ...). Полагая б еде 2Я 2Я afe = — \ / (t) cos kt dt, fcfc=— \ /(«) sin ktdt (A=0, 1, 2,...), 0 0 ¦йудем иметь: Поэтому для вещественной функции / D) ряд Фурье принимает вид / 2я \ 1 ¦ - \ f +2 К ««в 1 с ah=— \ f(t) cos ktdt, о ft=O, 1, 2,... = — \ / (*) sin Л« di, § 7. Ортонормированный базис Базис любого конечномерного подпространства S в унитарном или «евклидовом пространстве В является невырожденным рядом векторов и потому согласно теореме 2 предыдущего параграфа может быть про- ортогонализирован и пронормирован. Таким образом, в любом конечно- конечномерном подпространстве 8 (и, в частности, во всем пространстве Л, если оно конечномерно) существует ортонормированный базис. Пусть еь е2, ...,еп — ортонормированный базис пространства R. Обозначим через хи х2, ...,хп координаты произвольного вектора ж п этом базисе: п h=i !) См., например, [19], гл. II.
238 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX. Умножая обе части этого равенства справа на е% и учитывая орто- нормированность базиса, легко найдем: xh = (xek) (& = 1, 2, ...,п), т. е. в ортонормированном базисе координата вектора равна скаляр- скалярному произведению его на соответствующий базисный орт п х = 2 (xeh)ek. D1) Пусть хи х2, ..., хп и х\, х'2, ..., х'п суть соответственно координаты одного и того же вектора х в двух различных ортонормированных бази- базисах еи ег, ..., еп и е\, е'2, ..., е'п унитарного пространства Ж Формулы преобразования координат имеют вид п xt= S umx'h (i—U 2, .... п). D2) 1 При этом коэффициенты щь, uzh, ..., unk, образующие k-& столбец матрицы U = || U;ft \\™, являются, как нетрудно видеть, координатами век- вектора e'h в базисе еи е2, .. -, еп. Поэтому, записывая в координатах [см. (Ю)] условия ортонормированности базиса е'и е'2, ...,е'п, получилг соотношения » _ f I k = l, 24««».1 = вы = |(, кф1 D3) Преобразование D2), у которого коэффициенты удовлетворяют усло- условию D3), называется унитарным, а соответствующая матрипа U — уни- унитарной матрицей. Таким образом, в п-мерном унитарном пространстве переход от одного ортонормированного базиса к другому ортонормирован- ному осуществляется при помощи унитарного преобразования координат. Пусть дано /г-мерное евклидово пространство JB. Переход от одного ортонормированного базиса в В к другому осуществляется при помощи преобразования координат п ihXh (i=l, 2, ...,п), D4) коэффициенты которого связаны между собой соотношениями п 2 VikVa^Ski (к, 1 = 1, 2, ...,п). D5) Такое преобразование координат называется ортогональным, а соответ- соответствующая матрица V—ортогональной матрицей. Отметим интересную матричную запись процесса ортогонализации. Пусть 4=11 ад ||"—произвольная неособенная матрица (| А \ Ф 0) с комплексными элемен- элементами. Рассмотрим унитарное пространство R с ортонормированным базисом е±, ez, .--, еп и определим линейно независимые векторы щ, а2, ..., ап равенством: п «А= 2 aihCi (л=1. 2, ..., п). i=l Подвергнем векторы %, а^, ...,ап процессу ортогонализации. Полученный ортонормированный базис в В обозначим через щ, и^, , ип. Пусть при этом п ий- 2 uikei (л=1> 2, ..., п). il
§ 8] СОПРЯЖЕННЫЙ ОПЕРАТОР 239 Тогда [а^г ... «р]=[г*1г*2 ... tip] (р=1. 2, ..., п), т. в. . + CnnUn, где с;? (t, А=1, 2, ..., п; »<^&)—некоторые комплексные^ числа. Полагая с^=0 при i>^ (*» А=1, 2, ...,п), будем иметь: п Л=1> 2 п)' Переходя здесь к координатам и вводя верхнюю треугольную матрицу C=||cjft||" и унитарную матрицу U=\\uih\\'^, получим: п <4h— ^ ЩрСрк («. *=1. 2, .... п), р=1 или A=UC. (*) Согласно этой формуле произвольная неособенная матрица А=\\ ац^ ||" пред- стаеима в виде произведения унитарной матрицы U на верхнюю треугольную С. Так как процесс ортогонализации однозначно определяет векторы щ, uz, •-., «п с точностью до скалярных множителей etl ег, ..., en (j 6j | = 1; t"=l, 2, ..., п), то в формуле (*) множители U и С определяются однозначно с точностью до диаго- диагонального множителя М={е4, ег, ..., еп}: U=UiM, C^M-W^ В этом можно убедиться и непосредственно. Замечание 1. Если А—вещественная матрица, то в формуле (*) множи- множители U и С можно выбрать вещественными. В этом случае U—ортогональная матрица. Замечание 2. Формула (*) сохраняет свою силу и для особенной матрицы А(\А\=0). В этом можно убедиться, полагая А= lim Ат, где | Ат \ Ф О 7П-»ОО <и»=1, 2, ...). Тогда Am=UmCm(m=l, 2, ...). Выделяя из последовательности Um сходя- сходящуюся подпоследовательность Um (lim Um =U) и переходя к пределу, из равенства Р р-*оо Р Ат =Um С при р—=>-со, получим искомое разложение A = UC. Однако в случае Р Р Р \ А | = 0 множители U и С уже не определяются однозначно с точностью до диаго- диагонального множителя М. Замечание 3. Вместо (*) можно получить формулу A = DW, (**) где D—нижняя треугольная, a W—унитарная матрица. Действительно, применяя установленную ранее формулу (*) к транспонированной матрице А' A' = UC и полагая W=V, D=C, получим (**)!). § 8. Сопряженный оператор Пусть в /г-мерном унитарном пространстве Л задан произвольный линейный оператор. Определение 4. Линейный оператор А* называется сопряжен- сопряженным по отношению к оператору А в том и только в том случае, если х) Из унитарности матрицы U следует унитарность и матрицы V, так как условия унитарности D3), записанные в матричном виде: U'W=E, влекут: UU' = E.
240 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. JX для любых двух векторов х, у из И выполняется равенство (Ах,у) = (х, А*у). D6) Мы докажем, что для каждого линейного оператора А существует сопряженный оператор А* 'и притом только один. Для доказательства выберем в К некоторый ортонормированныи базис et, e2. • • •, бп. Тогда {см. D1)] для искомого оператора А* и произвольного вектора у из И должно выполняться равенство п А*у= 2 (А*у, eh)ek. В силу D6) это равенство может быть переписано так: п А*у = 2, (у, Aeh) eh. D7) Примем теперь равенство D7) за определение оператора А*. Легко проверить, что определенный таким образом оператор А* является линейным и удовлетворяет равенству D6) при произвольных векторах ж и у из JR. Кроме того, равенство D7) однозначно опре- определяет оператор А*. Таким образом, устанавливаются существование и единственность сопряженного оператора А*. Пусть А — линейный оператор в унитарном пространстве, а А = ==l|aife||"—матрица, отвечающая этому оператору в ортонормированном базисе еи е2, ...,еп. Тогда, применяя формулу D1) к вектору Ае^ = п = 23 aiheu получим: г=1 fljft = Defe, <?j) \i, к=1, 2, ..., и). D8) Пусть теперь сопряженному оператору А* в этом же базисе отвечает матрица А* = || a*h ||". Тогда по формуле D8) aZk = (A'eh, et) (i, к=1, 2, ..., п). D9) Из D8) и D9) в силу D6) следует: afk = dkt (i, k=l, 2, ..., n), т. е. Матрица А* является транспонированной и комплексно сопряженной для А. Такую матрицу принято называть (см. главу I) сопряженной по отношению к А. Таким образом, в ортонормированном базисе сопряженным операто- операторам отвечают сопряженные матрицы. Из определения сопряженного оператора вытекают следующие его свойства: 1° (А*)* —А, 2° (А+В)* = А* + В*, 3° (аА)* = аА* (а —скаляр), 4° (АВ)* = В*А*.
§ 8] СОПРЯЖЕННЫЙ ОПЕРАТОР 241 Введем теперь одно важное понятие. Пусть 8 — произвольное под- подпространство в В. Обозначим через Т совокупность всех векторов у из В, ортогональных к 8. Легко видеть, что Т есть тоже подпространство в В и что каждый вектор х из В однозначно представляется в виде суммы x — Xs+Хт, где xs(zS, хт?Т, т. е. имеет место расщепление B=S + T, 8±Т. Это расщепление получаем, применяя к произвольному вектору х из В разложение A5) предыдущего параграфа. Т называется ортого- ортогональным дополнением к S. Очевидно, 8 будет ортогональным дополне- дополнением к Т. Мы пишем 8±.Т, понимая под этим то, что любой вектор из S ортогонален любому вектору из Т. Теперь мы сможем сформулировать фундаментальное свойство сопря- сопряженного оператора: 5° Если некоторое подпространство 8 инвариантно относительно А, то ортогональное дополнение Т этого подпространства будет инвари- инвариантно относительно А*. Действительно, пусть х ?8, у?Т. Тогда из Ах ?8 следует (Ах, 2/) = 0 и отсюда в силу D6) (ас, А*у) = 0. Так как х—произволь- х—произвольный вектор из 8, то А*у?Т, что и требовалось доказать. Введем следующее определение: Определение 5. Две системы векторов хи ж2, ..., хт и У и У г, - - -, Ут назовем биортонормированными, если (aw*) = в» (i, к = 1, 2, ..., т), E0) где бы—символ Кронекера. Теперь докажем следующее предложение: 6° Если А—линейный оператор простой структуры, то сопряжен- сопряженный оператор А* также имеет простую структуру, причем можно так выбрать полные системы собственных векторов х±, х%, .. .,хп и 2/i, Х/г, --чУп операторов А и А*, чтобы они были биортонорми- рованы: Axi = Kixi, А*уг = щуи (xiyh) = 8ih (i, k=l, 2, ..., п). Действительно, пусть хи xz, ...,xn — полная система собственных векторов оператора А. Введем обозначение 8к = [хи ...,xh-u xh+i, ...,xn] (k=l, 2, ...,п). Рассмотрим одномерное ортогональное дополнение Th = [уь\ к (и — 1)-мер- ному подпространству 8ь(к=1, 2, ...,п). Тогда Th инвариантно отно- относительно А*: A*yh = VkPk, УпфО (fc=l, 2, ..., п). Из 8h±yh следует: (хкук)ф0, так как в противном случае вектор у и должен был бы равняться нулю. Помножая xh, Уь. (к=1, 2, ..., п) на надлежащие числовые множители, получим: — 8ih (i, А = 1, 2, ..., 16 ф. р. Гантмахер
242 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ ГГЛ. IX Из биортонормированности систем векторов жи х2, ..., жп и У и Уь • •') Уп следует, что векторы каждой из этих систем линейно независимы. Отметим еще такое предложение: 7° Если операторы А и А* имеют общий собственный вектор, то характеристические числа этих операторов, отвечающие общему соб- собственному вектору, комплексно сопряжены. В самом деле, пусть Ах = %х, А*х = \х.ж(жф 0). Тогда, полагая в D6) у = ж, будем иметь К(х, ж) = ц(ж, х), откуда Я, = ц. 8° Пусть у— собственный вектор оператора А*, и пусть S^n~1^ — ортогональное дополнение к одномерному подпространству Т=[у]. Поскольку .4 = (.4*)*, то согласно утверждению 5° подпространство ^'(п~1) инвариантно относительно оператора А. Таким образом, у всякого линей- линейного оператора в п-мерном унитарном пространстве существует (п—1)-мерное инвариантное подпространство. Рассматривая далее оператор А в подпространстве /S*™', мы смо- сможем указать на основании установленного предложения (п — 2)-мерное инвариантное подпространство #(п~2) оператора А, принадлежащее 8^п~1\ Повторяя рассуждение, мы построим цепочку из п последовательно вло- вложенных инвариантных подпространств оператора А (индекс наверху указывает размерность): Пусть теперь et — нормированный вектор, принадлежащий $<*). Выберем в /SB) нормированный вектор е2 такой, что (еь е2) = 0. В /8C) найдем нормированный вектор е3 такой, что (еь е3) = 0 и (ег, е3) = 0. Продол- Продолжая этот процесс, мы построим ортонормированный базис векторов обладающий тем свойством, что каждое подпространство, натянутое на первые к базисных векторов tf(fe) = [ei, e2, ...,ек] (Л=1, 2, ...,/г), инвариантно относительно оператора А. Пусть теперь Цвг.,"!!"—матрица оператора А в построенном базисе. п Мы имеем Aej = 2 ацви где atj = (Aej, ei). Поскольку Ае} принад- г=1 лежит Бф, то при i">/ аи = (Ае}; ег) = 0 и, следовательно, матр1ща оператора является верхней треугольной. Мы пришли к следующей теореме: Для любого линейного оператора А е п-мерном унитарном простран- пространстве можно построить ортонормированный базис, в котором матрица этого оператора является треугольной. Это предложение принято называть теоремой Шура. Разумеется, привлекая общую теорему о приведении матрицы оператора к жордановой форме, легко доказать теорему Шура последовательной ортогонализацией жорданова базиса. Приведенное доказательство по существу использует лишь существование у линейного оператора, действующего в /г-мерном унитарном пространстве, собственного вектора.
§ 9] НОРМАЛЬНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ 243 § 9. Нормальные операторы в унитарном пространстве Определение 6. Линейный оператор А называется нормальным, если он перестановочен со своим сопряженным: АА* = А*А. E1) Определение 7. Линейный оператор Н называется эрмитовым, если он равен своему сопряженному: Н* = Н. E2) Определение 8. Линейный оператор' U называется '.унитарным, если он обратён своему сопряженному: UU* = JS. E3) Заметим, что унитарный оператор можно определить как изометричный оператор в эрмитовом пространстве, т. е. как оператор, сохраняющий метрику. Действительно, пусть при произвольных векторах х и у из It (Ux,Uy) = (x,y). E4) Тогда согласно D6) (U*Ux, у) = (х, у) и, следовательно, в силу произ- произвольности вектора у U*Ux = х, т. е. U*U = JE7 или U* = U. Обратно, из E3) следует E4). Из E3) или E4) вытекает, что 1° произведение двух унитарных операторов есть снова унитарный оператор, 2° единичный оператор Е является унитарным и 3° обратный оператор для унитарного есть также унитарный оператор. Поэтому совокупность всех унитарных операторов является группой1). Эту группу называют унитарной группой. Эрмитов оператор и унитарный оператор являются частными видами нормального оператора. Теорема 3. Произвольный линейный оператор А всегда можно представить в виде A = Hi + iHz, E5) где Нц и Н2— эрмитовы операторы («эрмитовы компоненты}) оператора А). Эрмитовы компоненты однозначно определяются заданием опера- оператора А. Оператор А нормален тогда и только тогда, когда его эрми- эрмитовы компоненты Hi и Н2 перестановочны между собой. Доказательство. Пусть имеет место E5). Тогда E6) Из E5) и E6) находим: H^-iA + A*), H2 = 4rr-(A-A*). E7) Обратно, формулы E7) определяют эрмитовы операторы Hi и Н2, связан- связанные с А равенством E5). Пусть теперь .4 — нормальный оператор: АА*= А*А. Тогда из E7) следует: HiH2 = H2Ht. Обратно, из HiHz = H2Ht в силу E5) и E6) следует: АА* = А*А. Теорема доказана. Представление произвольного линейного оператора А в виде E5) является аналогом представления произвольного комплексного числа z в виде Xi-{-ix2, где Xi и х2 — вещественные числа. См. сноску 6) к стр. 28. 16*
244 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Пусть в некотором ортонормированием базисе операторам А, Н и U отвечают соответственно матрицы А, Н, U. Тогда операторным равенствам = А*А, Н* = Н, UU* = JE E8) будут соответствовать матричные равенства АА* = А*А, Я* = Я, UU* = E. E9) Поэтому мы и определяем нормальную матрицу как матрицу, перестано- перестановочную со своей сопряженной, эрмитову как равную своей сопряженной и, наконец, унитарную как обратную своей сопряженной. Тогда в ортонормироеанном базисе нормальному {эрмитову, уни- унитарному) оператору отвечает соответственно нормальная {эрмитова, унитарная) матрица. Эрмитова матрица Н= \\hut ||™ в силу E9) характеризуется следующими соотношениями между элементами: hhi = hih (г, k = l, 2, ..., п), т. е. эрмитова матрица всегда является матрицей коэффициентов некоторой эрмитовой формы (см. § 1). Унитарная матрица ?7=||мгй]|^ в силу E9) характеризуется следую- следующими сотношениями между элементами: п 2 муку = 6ift {i, к = 1, 2, ..., п). F0) 3=1 Так как из UU* = E следует U*U = E, то из F0) следуют эквивалентные соотношения п 2 ипщк = 8ih {i, к = 1, 2, ..., п). F1) 3=1 Равенства F0) выражают собой «ортонормированность» строк, а равенства F1) — ортонормированность столбцов в матрице U=\\ Щь^1). Унитарная матрица является матрицей коэффициентов некоторого унитарного преобразования (см. § 7). Оператор JP, осуществляющий ортогональное проектирование векторов унитарного пространства В на заданное подпространство S, является эрмитовым проекционным оператором. Действительно, этот оператор является проекционным, т. е. P2 = JP (см. гл. III, § 6). Далее, из ортогональности векторов acs = JPx и у—2/<s = = {JE~JP)y {х,у?Щ следует: , у). Отсюда в силу произвольности векторов ж, у т. е. JP = P*P. Из этого равенства следует, что _Р—эрмитов оператор так как (P*JP)* = P*JP. г) Таким образом, ортонормированность столбцов в матрице U является след- следствием ортонормированности строк и наоборот.
§ 10] СПЕКТР НОРМАЛЬНЫХ, ЭРМИТОВЫХ, УНИТАРНЫХ ОПЕРАТОРОВ 245 § 10. Спектр нормальных, эрмитовых, унитарных операторов Установим предварительно одно свойство перестановочных операторов, сформулировав его в виде леммы. Лемма 1. Перестановочные операторы А и В (АВ = ВА) всегда имеет общий собственный вектор. Доказательство. Пусть х есть собственный вектор оператора А: Ах — Кх, хфО. Тогда в силу перестановочности операторов А и В (& = 0, 1,2, ...). F2) Пусть в ряду векторов х, Вх, В2х, ... первые р векторов линейно независимы, в то время как (р-\~1)-& вектор Врх является уже линейной комбинацией предыдущих. Тогда подпро- подпространство S = [х, Вх, ..., ВР^х] будет инвариантно относительно В и потому в этом подпространстве S будет существовать собственный вектор у оператора В: By = [iy, уфО. С другой стороны, равенства F2) показывают, что векторы х, Вх, ..., Вр~гх являются собственными векторами оператора А, отвечающими одному и тому же характеристи- характеристическому числу X. Поэтому и любая линейная комбинация этих векторов, в частности вектор у, будет собственным вектором оператора А, отвечаю- отвечающим характеристическому числу К. Таким образом, доказано существова- существование общего собственного вектора операторов А и В. Пусть А — произвольный нормальный оператор в /г-мерном эрмитовом пространстве JR. В этом случае операторы А и А* перестановочны между собой и потому имеют общий собственный вектор xt. Тогда (см. § 8, 7°) AXi^liXi, A*xl = lix1 (х1ф0). Обозначим через S± одномерное подпространство, содержащее вектор Xi(Si = [Xi\), а через Ti — ортогональное дополнение для Si в В: Так как S± инвариантно относительно А и А*, то (см. § 8, 5°) Т^ также инвариантно относительно этих операторов. Поэтому перестано- перестановочные операторы А и А* имеют согласно лемме 1 общий собствент вектор х2 в Tt: Очевидно, xt±x2. Полагая 82= [хи х2) и S2±T2, мы аналогичными соображениями установим существование в Т2 общего собственного вектора х3 операторов А и А*. Очевидно, Xi ±х3 и х2 _L ^з- Продолжая этот процесс далее, мы получим п попарно ортогональных общих собственных векторов a?i, х2, ..., жп операторов А и А*: . Axk = hkxh, A*xh = khXh (ХкфО), . 1 (xtxh) = 0 при 1фк ' (*,Л = 1,2, ...,n). J F3) Векторы хи х2, ..., хп можно пронормировать. При этом равенства F3) сохранятся.
246 линейные операторы в унитарном пространстве [гл. IX Таким образом, мы доказали, что нормальный оператор всегда имеет полную ортонррмированнуюх) систему собственных векторов. Так как из кь = %i всегда следует кь = %i, то из равенств F3) вытекает: 1° Если оператор А нормален, то каждый собственный вектор оператора А является собственным вектором сопряженного оператора А*, т. е. если оператор А нормален, то операторы А и А* имеют одни и те же собственные векторы. Пусть теперь, обратно, дано, что линейный оператор А имеет полную ортонормированную систему собственных векторов: Axh = Kkxh, (xtxh) = 8ik (i, к = 1, 2, ..., n). Докажем, что в этом случае А является нормальным оператором. Действительно, положим: Тогда (xkyi) = (xh, A*xt) — %i (xhxt) = (Axk, xt) — = (Яй-ЯгNйг = 0 (к, 1 = 1, 2, ,.., n). Отсюда следует: уi = A*xt —'hiXi = 0 (I = 1, 2, ..., n), т. е. имеют место все равенства F3). Но тогда AA*xh = KhKhxh и A*Axh = Kjihxk (к =1,2, ..., п), откуда Таким образом, мы получили следующую «внутреннюю» (спектральную) характеристику нормального оператора А (наряду с «внешней»: АА* = = А*А): Теорема 4. Линейный оператор тогда и только тогда является нормальным, когда этот оператор имеет полную ортонормированную систему собственных векторов. В частности, нами доказано, что нормальный оператор всегда является оператором простой структуры. Пусть А — нормальный оператор с характеристическими числами %и Я2, . -., К- По интерполяционной формуле Лагранжа определим два многочлена р(К) и q(K) из условий Р(А*) = Л*. q&k) = 4 (ft = l, 2, ...,п). Тогда в силу F3) А*=р(А), A = q(A% F4) т. е. 2° Для нормального оператора А каждый из операторов А и А* представим в виде многочлена от другого из операторов; при этом эти два многочлена определяются заданием характеристических чисел опера- оператора А. г) Под полной ортонормированной системой векторов мы здесь и в дальнейшем понимаем ортонормированную систему из п векторов, где п—число измерении про- пространства.
§ 10] СПЕКТР НОРМАЛЬНЫХ, ЭРМИТОВЫХ, УНИТАРНЫХ ОПЕРАТОРОВ 247 Пусть 8—инвариантное подпространство в R для нормального опера- оператора А и В=8 + Т, 8 А. Т. Тогда согласно § 8, 5° (стр. 241) подпро- подпространство Т инвариантно относительно А*. Но A=q(A*), где q(h)— многочлен. Поэтому Т инвариантно и относительно данного оператора А. Таким образом, 3° Если 8 — инвариантное подпространство относительно нормаль- нормального оператора Т, а Т — ортогональное дополнение к 8, той Т является инвариантным подпространством для А. Остановимся теперь на спектре эрмитова оператора. Так как эрмитов оператор Н является частным видом нормального оператора, то по дока- доказанному он имеет полную ортонормированную систему собственных векторов: Нxh = Khxh, (xhxt) = &ы (ft, I =1, 2, ..., n). F5) Из Н* = Н следует: X* = A* (* = 1, 2, ...,n), F6) т. е. все характеристические числа эрмитова оператора И вещественны. Нетрудно видеть, что и обратно, нормальный оператор с веществен- вещественными характеристическими числами всегда эрмитов. В самом деле, из F5), F6) и H*xh = %hxh (k=l, 2, ..., п) следует: H*xk = Hxk (ft=l, 2, ...,п), т. е. Н* = Н. Таким образом, мы получили следующую «внутреннюю» характери- характеристику эрмитова оператора (наряду с «внешней»: Н* = Н): Теорема 5. Линейный оператор Н является эрмитовым тогда и только тогда, когда он имеет полную ортонормированную систему собственных векторов с вещественными характеристическими числами. Остановимся теперь на спектре унитарного оператора. Поскольку унитарный оператор U является нормальным, то он имеет полную орто- ортонормированную систему собственных векторов Uxh = Kkxk, (xhxi) = 8kl (к, I = i, 2, ..., n). F7) При этом U*xk = lhxh (к = 1, 2, ..., n). F8) Из UV* = JE находим: ?iftlft = l. F9) Обратно, из F7), F8)", F9) следует: 1717* = JE. Таким образом, среди нормальных операторов унитарный оператор выделяется тем, что у него все характеристические числа по модулю равны единице. Мы получили следующую «внутреннюю» характеристику унитарного оператора (наряду с «внешней»: UU* = E): Теорема 6. .Линейный оператор тогда и только тогда является унитарным, когда он имеет полную ортонормированную систему соб- собственных векторов с характеристическими числами, по модулю равными единице. Так как в ортонормированием базисе нормальная (эрмитова, унитарная матрица соответственно определяет нормальный (эрмитов, унитарный) опера- оператор, то получаем следующие предложения:
248 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Теорема 4'. Матрица А является нормальной тогда и только тогда, когда она унитарно-подобна диагональной матрице: А = #||Л,6»|!» С/ (U* = U-i). G0) Теорема 5'. Матрица Н является эрмитовой тогда и только тогда, когда она унитарно-подобна диагональной матрице с вещественными числами на диагонали: H^UWXfia^U-^ (и* = и-\Кг = Кг;1 = 1,2, ...,п). G1) Теорема 6'. Матрица U является унитарной тогда и только тогда, если она унитарно-подобна диагональной матрице с диагональ- диагональными элементами, по модулю равными единице: U = UX\\%Ak|№ (Ut = U?; | h | = 1; i = 1, 2, ..., п). G2) § 11. Неотрицательные и положительно определенные эрмитовы операторы Введем следующее определение. Определение 9. Эрмитов оператор И называется неотрицатель- неотрицательным, если для любого вектора х из В (Нх, х) > 0, и положительно определенным, если для любого вектора х=^=0 из М (Нх, х) > 0. Если задать вектор х его координатами хи Жг, ..., хп в произволь- произвольном ортонормированном базисе, то (Нж, ж), как легко видеть, предста- представится в виде эрмитовой формы от переменных xt, ж2, ..., хп, причем неотрицательному (соответственно положительно определенному) оператору будет отвечать неотрицательная (соответственно положительно определен- определенная) эрмитова форма (см. § 1). Выберем ортонормированный базис ас4, Xz, , ^жп из собственных векторов оператора Н: Hxh = KMh, (xtixi) = bhi (k, I = 1, 2, ..., n). G3) n Тогда, полагая х— 2 iftacft> будем иметь: n Отсюда сразу следует «внутренняя» характеристика неотрицательного и положительно определенного оператора: Теорема 7. Эрмитов оператор тогда и только тогда является неотрицательным (соответственно положительно определенным), если все его характеристические числа неотрицательны (соответственно положительны). Из сказанного вытекает, что положительно определенный эрмитов оператор есть неособенный неотрицательный эрмитов оператор. Пусть Н.—неотрицательный эрмитов оператор. Для него имеют место равенства G3) с Я^>0 (к = 1, 2, ..., п). [Положим ей = |^Я^>0 (к =
§ 12] ПОЛЯРНОЕ РАЗЛОЖЕНИЕ. ФОРМУЛЫ КЭЛИ 249 = 1, 2, ,..., п) и определим линейный оператор F равенствами Fxh = Qhxh (к = 1,2, ...,п). G4} Тогда F будет также неотрицательным оператором, причем JF2 = JT. G5) Неотрицательный эрмитов оператор F, связанный с И равенством G5), будем называть арифметическим корнем квадратным из оператора Н и будем обозначать так: Если Н — положительно определенный оператор, то и F будет поло- положительно определенным. Определим интерполяционный многочлен Лагранжа g(A) равенствами (* = 1, 2, ....л). G6) Тогда из G3), G4) и G6) следует: G7) Последнее равенство показывает, что У И является многочленом от Н и однозначно определяется задйнием неотрицательного эрмитова опера- оператора Н (коэффициенты многочлена g(Z) зависят от характеристических чисел оператора Н). Примерами неотрицательных эрмитовых операторов являются опера- операторы А А* и А* А, где А — произвольный линейный оператор в данном пространстве. Действительно, при произвольном векторе х (АА*х, х) = (А*х, А*х)>0, (А*Ах, х) = (Ах, Ах) > 0. Если оператор А неособенный, то А А* и А* А —положительно опре- определенные эрмитовы операторы. Операторы У А А* и У А* А мы будем называть левым и правым модулями оператора А. У нормального оператора левый и правый модули равны между собой1). § 12. Полярное разложение линейного оператора в унитарном пространстве. Формулы Кэли Докажем следующую теорему2): Теорема 8. Произвольный линейный оператор А в унитарном пространстве всегда представим в виде A^HU, G8) A = UiHu G9) где Н, Hi — неотрицательные эрмитовы, a U, J7 — унитарные операторы. Оператор А нормален тогда и только тогда, когда !) Относительно подробного исследования нормальных операторов см. [826]. В этой работе устанавливается необходимое и достаточное условие для того, чтобы произведение двух нормальных операторов было также нормальным оператором. 2) См. [826], стр. 77.
250 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX ¦в разложении G8) [или в G9)] множители Н и U (соответственно Hi и Ut) перестановочны между собой. Доказательство. Из разложений G8) и G9) следует, что Н и Ht являются соответственно левым и правым модулями оператора А. Действительно, Заметим, что достаточно установить разложение G8), так как, при- применяя это разложение к оператору А*, получим А* = BLU и, следова- следовательно, А = и-гН, т. е. разложение G9) для оператора А. Установим сначала разложение G8) для частного случая, когда А — неособенный оператор (| А | ф 0). Полагаем: #=]/ АА* (при этом \Hf = \Af^% TJ=H~XA и проверяем унитарность оператора U: TJU* = НгАА*НГг = H-iHW = Е. Заметим, что в рассматриваемом случае в разложении G8) не только первый множитель И, но и второй U однозначно определяются заданием неособенного оператора А. Рассмотрим теперь общий случай, когда А может быть и особенным оператором. Заметим прежде всего, что полная ортонормированная Система собственных векторов оператора А*А всегда преобразуется оператором А снова в ортогональную же систему векторов. Действительно, пусть A*Axh = Q\xk [(xkxi) = Ьы, Qh > 0; к, I = 1, 2, ..., п]. Тогда (Axk, Ах{) = (A*Axh, xt) = QhiXkXt) = 0 (к ф I). При этом | Axh [2 = (Axk, Axk) = el (ft = 1, 2, ..., n). Поэтому существует такая ортонормированная система векторов slt zz, ..., sn, "ЧТО Axh = Qkzk [(«й«г) = бйг; к, I = 1, 2, ..., n]. (80) Определим линейные операторы Н и U равенствами Uxh = zft, B.»h = QhZ*. • (81) Из (80) и (81) находим: A^HU. При этом в силу (81) Н—неотрицательный эрмитов оператор, поскольку юн имеет полную ортонормированную систему собственных векторов jgi, s2, ..., «пИ неотрицательные характеристические числа qu qz, ..., Qn, a U—унитарный оператор, ибо он переводит ортонормированную систему векторов scb х2, -.., жп снова в ортонормированную edj zz, ..., zn- Таким образом, можно считать доказанным, что для произвольного линейного оператора А имеют место разложения G8) и G9), причем эрмитовы множители Н и Hi всегда однозначно определяются заданием
$ 12] ПОЛЯРНОЕ РАЗЛОЖЕНИЕ. ФОРМУЛЫ КЭЛИ 251 -оператора А (они суть соответственно левый и правый модули опера- оператора А), а унитарные множители U и TTi определяются однозначно лишь в случае неособенного А. Из G8) легко находим: АА * = Н2, А*А = ТГ^ИЧГ. (82) Если А—нормальный оператор (АА* = А*А), то из (82) вытекает: (83) Поскольку Н = YИ,г == g (Н2) (см. § И), то из (83) следует пере- перестановочность U с Н. Обратно, если Н и IT перестановочны между «обой, то из (82) вытекает, что А—нормальный оператор. Теорема .доказана. Вряд ли необходимо особо отмечать то, что наряду с операторными равенствами G8) и G9) имеют место соответствующие матричные равенства. Характеристические числа оператора Н = YА А* (которые в силу (82) являются также характеристическими числами оператора М% = называют иногда сингулярными числами оператора А1). Разложения G8) и G9) являются аналогом представления ком- комплексного числа z в виде z = ru, где r = [z[, а |в| = 1. Пусть теперь хи xz, ..., хп — полная ортонормированная система •собственных векторов произвольного унитарного оператора ТТ. Тогда Uxk = ef/*ac*, (xhxi) = bkl (к, I = 1, 2 n), (84) тде /ft (к = 1,2, ..., n) — вещественные числа. Определим эрмитов опера- оператор F равенствами Fxh = fkxh (к = 1, 2, ..., п). (85) Тогда2) eiFXh = eifb xh (к = 1, ..., п). (85') Из (84) и (85') следует Г = е№. (86) Таким образом, унитарный оператор U всегда представим в виде (86), где F—эрмитов оператор. Обратно, если F — эрмитов оператор, то 17= = eiF—унитарный оператор. Разложения G8) и G9) вместе с (86) дают следующие равенства: (87) (88) *) Если характеристические числа %и Я2, ..., %п и сингулярные числа Ci> 62. •••> Qn линейного оператора А занумеровать так, чтобы Г*1 I > I ^2 | > • - • > | К |, 61 > 62>•••. то имеют место неравенства Вейля Более подробно об этом см. в Добавлении на стр. 542. {Прим: ред.) 2) elF=r (F), где г (Я)—интерполяционный многочлен Лагранжа для функ- функции etF в точках fit /2, ..., fn-
252 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX где Н, F, Hi, Fi — эрмитовы операторы и притом Н и Hi неотрица- неотрицательны. Разложения (87) и (88) являются аналогом представления ком- комплексного числа z в виде z = reiff, где г>0и <р — вещественные числа. Замечание. В равенстве (86) оператор F не определяется одно- однозначно заданием оператора TJ. Действительно, оператор F определяется при помощи чисел fh(k = l,2, ..., п), а к каждому из этих чисел можш> прибавить произвольную кратность 2зх, не изменяя исходных равенств (84). Выбирая надлежащим образом эти слагаемые, кратные 2зх, мы можем достичь "того, чтобы из efh = efl всегда следовало: fh = fi A<Ж 1^.п). Тогда можно определить интерполяционный многочлен g(k) равенствами g(ei1k) = fh (ft = l, 2, ...,п). (89) Из (84), (85) и (89) будет следовать: F=g(U) = g {(**). (90) Совершенно аналогично можно нормировать выбор F^ так, чтобы Fi = h(Vd = h(J*), (91) где h (К) — некоторый многочлен. В силу (90) и (91) перестановочность Н и JJ (Нх и Uj) влечет пере- перестановочность Н и F (соответственно Ht и Fi) и наоборот. Поэтому согласно теореме 8 оператор А будет нормальным тогда и только тогда, когда в формуле (87) Н и F (или в формуле (88) jffj и Fi) переста- перестановочны между собой, если только характеристические числа опера- оператора F (соответственно Fi) надлежащим образом нормированы. В основе формулы (86) лежит тот факт, что функциональная зави- зависимость \i = eif (92) переводит п произвольных чисел на вещественной оси /ь /2, ..., fn в некоторые числа \iu \iz, •¦•, №п, лежащие на окружности |ц,| = 1, и наоборот. Трансцендентную зависимость (92) можно заменить рациональной зависимостью и — ttll г — i—if ' которая переводит вещественную ось / = / в окружность |[а| = 1; при этом бесконечно удаленная точка на вещественной оси переходит в точку ц=— 1. Из (93) находим: / ? <94> Повторяя рассуждения, которые привели нас к формуле (86), мы из (93) и (94) получим две взаимно обратные формулы: ( > Мы получили формулы Кэли. Эти формулы устанавливают взаимно однозначное соответствие между произвольными эрмитовыми one-
$ 12] ПОЛЯРНОЕ РАЗЛОЖЕНИЕ. ФОРМУЛЫ КЭЛИ 253 раторами F и теми унитарными операторами ZJ, у которых среди харак- характеристических чисел нет — 1х). Формулы (86), (87), (88) и (95), конечно, будут верны и тогда, когда мы в них все операторы заменим соответствующими матрицами. Пользуясь полярным разложением матрицы А ранга г: A=UtHi (Я1=У1*1, U*U=E) (96) ж формулой G1) Я1 = У-Ч1ив»Н"»г (F*F=?,tH>0 tb.>0>tlr+1=...=tln=0), (97) можно произвольную квадратную матрицу А ранга г представить в виде произве- произведения A=UMV, (98) где t/ = Z71F"~1 и V — унитарные матрицы (U*U = V*V—E), a M—диагональная матрица M={lH, ...ltv, 0 0} (щ>0, ...,цг>0), (98') в которой диагональные элементы являются характеристическими числами правого •модуля НХ=~\/А*А (а следовательно, и левого модуля Е=-~\/аА*) матрицы А. Формулу (98) можно записать в виде A=XAY*, (99) где X и У—п х r-матрицы, образованные первыми г столбцами унитарных матриц ¦U и V*, а А—диагональная матрица г-го порядка: A={jH. .-..М (|Ч>0, ...,цг>0). A00) Пусть теперь А—произвольная прямоугольная т х n-матрица ранга г. Примем -сначала, что т^п. Дополним матрицу А нулевыми строками до квадратной мат- матрицы Аи после чего применим формулу Представим п х г-матрицу Xt в виде Тогда из равенства A01) найдем: A=XAY* A02) ,« XAY*=0. A03) Умножим обе части этого равенства справа на У. Тогда, поскольку Y*Y=E, получим: ХД=0, т. е. Х=0. Но тогда столбцы матрицы X, как и столбцы матрицы У, унитарно-ортогональны между собой и нормированы. Случай т ~^- п сводится к случаю пи^п, если применить сначала формулу к матрице А*, а затем из полученного равенства определить матрицу А. Мы уста- установили следующую теорему2): Теорема 9. Произвольная прямоугольная т X п-матрща ранга г всегда пред- ¦ставима в виде произведения А=ХАУ*, A04) !) Особую точку —1 можно заменить любым числом (хо( |[хо|=1)- Для этого вместо J93) надо взять дробно-линейную функцию, отображающую вещественную •ось /=/ на окружность |ц| = 1 и 'переводящую точку /=оо в точку [х=^о- При этом соответствующим образом видоизменятся формулы (94) и (95). 2) См. Lanzoc С, Linear systems in selfadjoint form, Amer. Math. Monthly, v. 65, 1958, стр. 665—779; Schwerdtfeger H., Direct proof of Lanzoc's decom- decomposition theorem; там же, v. 67, 1960, стр. 855—860.
254 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX где X и Y—унитарные по отношению к столбцам прямоугольные матрицы соответ- соответственно размеров тХг и пх'г, а А — диагональная матрица r-го порядка с положи^- тельными диагональными элементами (jij, , [V1). Полагая В=Х, С=АУ, мы приходим к установленному в главе I (стр. 32)^ разложению А=ВС, A05> где матрицы В и С имеют соответствующие размеры тхг и г х п. Однако доказан- доказанная теорема дает уточнение этого разложения. Она утверждает, что множители В а С могут быть выбраны так, чтобы в матрице В все столбцы, а в матрице С все строки были унитарно-ортогональны между собой. § 13. Линейные операторы в евклидовом пространстве Рассмотрим n-мерное евклидово пространство В. Пусть дан произ- произвольный линейный оператор А ъ II. Определение 10. Линейный оператор А' называется транспо- транспонированным оператором для оператора Л, если для любых векторов х и у из .В: (Ах, у) = {х, А'у). A06) Существование и единственность транспонированного оператора уста- устанавливаются совершенно аналогично тому, как это делалось в § 8 для сопряженного оператора в унитарном пространстве. Транспонированный оператор обладает следующими свойствами: Iй (Л')' = Л, 2° (А + В)' = Л' + В', 3е (о.А)' = а А' (а — вещественное число), 4° {АВ)' = В'А'. Введем ряд определений. Определение 11. Линейный оператор А называется нормальным^ если АА' = А'А. Определение 12. Линейный оператор S называется симметри- симметрическим, если 8'=8. Определение 13. Симметрический оператор S называется: неотрицательным, если для любого вектора х из Jt (8х, sc)>0. Определение 14. Симметрический оператор 8 называется поло- положительно определенным, если для любого вектора х =? 0 из R (8х, sc)>0. Определение 15. Линейный оператор К называется кососим-- метрическим, если К'=— К. !) (xi, ..., [хг—отличные от нуля характеристические числа матрицы ~[/АА* (или )
§ 13] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 255 Произвольный' линейный оператор А всегда представим, и притом однозначно, в виде А = 8 + К, A07> где 8 — симметрический, а К—кососимметрический оператор. Действительно, из A07) следует: А'= 8-К. A08> Из A07) и A08) вытекает: 8 = 4" (А + А'), К = ±(А-А'). A09) Обратно, формулы A09) всегда определяют симметрический оператор 8 и кососимметрический К, для которых имеет место равенство A07). 8 и К носят название симметрической и кососимметрической компо- компонент оператора А. Определение 16. Оператор О называется ортогональным, если он сохраняет метрику пространства, т. е. если для любых векторов- х, у из В (Оав, Оу) = {х, у). A10). Равенство A10) в силу A06) можно переписать так: {х, О'Оу) = — (х, у). Отсюда следует: О'О = Ж. A11). Обратно, из A11) вытекает A10) (при произвольных векторах х, уI). Из A11) следует: |О|2 = 1, т. е. |О|=±1. Мы будем ортогональный оператор О называть оператором первого- рода, если | О | = 1, и второго рода, если ] О|== —1. Симметрический, кососимметрический. ортогональный операторы суть частные виды нормального оператора. Рассмотрим произвольный ортонормированный базис в данном евкли- евклидовом пространстве. Пусть линейному оператору А в этом базисе соответ- соответствует матрица Л = ||а^||51 (здесь все щь — вещественные числа). Читатель, без труда покажет, что транспонированному оператору А' отвечает в этом же базисе транспонированная матрица А' = || alh \\™, где а\и = аы (i, k — = 1, 2, ...,п). Отсюда вытекает, что в ортонормированием базисе- нормальному оператору А отвечает нормальная матрица А,(АА' = А'А), симметрическому оператору 8 отвечает симметрическая матрица <5" = = II sih ||? («5" = ?)i кососимметрическому оператору К—кососимметри- ческая матрица ¦йГ=||/с^-||*' (К1——К) и, наконец, ортогональному опе- оператору О — ортогональная матрица О (ОО' = ЕJ). Аналогично тому, как это делалось в § 8 для сопряженного опера- оператора, здесь устанавливается следующее предложение: Если некоторое подпространство 8 в R инвариантно относительна линейного оператора А, то ортогональное дополнение Т к 8 в В инва- инвариантно относительно оператора А'. х) Ортогональные операторы в евклидовом пространстве образуют группу (эту группу называют ортогональной). 2) Исследованию структуры ортогональных матриц посвящены работы [916, 108а, 82а]. Ортогональную матрицу, как и ортогональный оператор, мы будем называть матрицей первого или второго рода в зависимости от того, | О | = -)-1 или [ О| = -^1.
256 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Для исследования линейных операторов в евклидовом пространстве Л мы расширим евклидово пространство Л до некоторого унитарного про- пространства Л. Это расширение проведем следующим образом: 1. Векторы из Л будем называть «вещественными» векторами. 2. Введем в рассмотрение «комплексные» векторы z = ac-\-iy, где .ас и у— вещественные векторы, т. е. х?Л, у?Л. 3. Естественным образом определяются операции сложения комплекс- комплексных векторов и умножения на комплексное число. Тогда совокупность всех комплексных векторов образует тг-мерное векторное пространство Л над полем комплексных чисел, содержащее в себе как часть Л. 4. В В вводится эрмитова метрика так, чтобы в Л она совпадала с имеющейся там евклидовой метрикой. Читатель легко проверит, что искомая эрмитова метрика задается следующим образом: Если s> = x + iy, w = u + iv и (as, у, и, г?Л), то (»w) = (хи) + (yv)+i [(у и) — (xv)]. Полагая при этом & — х — iy и w = u — iv, будем иметь: Если выбрать вещественный базис, т. е. базис в Л, то Л будет пред- представлять собой совокупность всех векторов с комплексными, а Л—с вещественными координатами в этом базисе. Всякий линейный оператор 1 в В однозначно расширяется До линейного оператора в Л: А (х + iy) = Ах + iAy. Среди всех линейных операторов в Л операторы, получившиеся в ре- результате такого расширения из операторов в Л, характеризуются тем, что переводят Л в Л (АЛс Л). Такие операторы будем называть веще- вещественными. В вещественном базисе вещественные операторы определяются веще- вещественными матрицами, т. е. матрицами с вещественными элементами. Вещественный оператор А переводит комплексно сопряженные век- векторы » = x-\-iy и ? = ie — iy (х, у ?Л) снова в комплексно сопряженные: A» = Ax + iAy, An —Ax —iAy (Ax, Ау?Л). У вещественного оператора вековое уравнение имеет вещественные коэффициенты, поэтому вместе с корнем р-й кратности К оно имеет и корень р-ш кратности Я. Из Az=-"kz следует: As — Ks, т. е. сопря- сопряженным Характеристическим числам соответствуют сопряженные собствен- собственные векторы1). Двумерное подпространство [г, ж] имеет вещественный базис: as = 1 — 1 — = -5-(* + *)» 3/ = 2rB —ж)- Плоскость в Л с этим базисом будем называть инвариантной плоскостью оператора А, отвечающей паре характеристи- характеристических чисел Я, Я. Пусть Я = 1) Если характеристическому числу Я, вещественного оператора А отвечают линейно независимые собственные векторы »i, я%, ..., яр, то характеристическому числу X отвечают линейно независимые собственные векторы »j, s%, , zp.
§ 13] линейные операторы в евклидовом пространстве 257 •Тогда, как легко видеть, Ах — цх — vy, Рассмотрим вещественный оператор А простой структуры с характеристическими числами: где ц-h, ^д, щ — вещественные числа, причем vh^0 (&=1, 2, ...,д). Тогда соответствующие этим характеристическим числам собственные векторы %и #2> • • ¦! #п можно выбирать так, чтобы &1 — jui {к — 1, *?, -.., q), yi-*¦?>) (ИЗ) A14) В базисе A13) оператору А соответствует вещественная квазидиагональ- квазидиагональная матрица ( Векторы xi, у и х2, 2/2, . -., хд, yq, as2e+i, ..., хп образуют базис в евклидовом пространстве В. При этом Axh — \ihxh — vhyh, ~ ' '•••t9t |. A15) Таким образом, 9ля каждого оператора А простой структуры в евкли- евклидовом пространстве существует такой базис, в котором оператору А соответствует матрица вида A15). Отсюда следует, что всякая вещест- вещественная матрица простой структуры вещественно-подобна канонической матрице вида A15): Иа ve (Ц6) Транспонированный оператор А' для 1 в В после расширения становится сопряженным оператором А* для А в В. Следовательно, нормальный, симметрический, кососимметрический, ортогональный опе- операторы в R после расширения становятся соответственно нормальным, эрмитовым, умноженным на i эрмитовым, унитарным вещественным операторами в S. Нетрудно показать, что для нормального оператора А в евклидовом пространстве можно выбрать канонический базис — ортонормированный базис (ИЗ), для которого имеют место равенства A14)х). Поэтому вещественная нормальная матрица всегда вещественно- и ортогонально- подобна матрице вида A15): А = О Иа A17) !) Из ортонормированяости базиса A12) в эрмитовой метрике следует ортонор- мированность базиса A13) в соответствующей евклидовой метрике. 17 Ф. р. гантмахер
258 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX У симметрического оператора 8 в евклидовом пространстве все характеристические числа вещественны, так как после расширения этот оператор становится эрмитовым. Для симметрического оператора S в формулах A14) следует положить д = 0. Тогда получим: 8хг = щХ1 [(ackMi) = &hl; к, 1 = 1, 2, ...,п]. A18) Симметрический оператор S в евклидовом пространстве всегда имеет ортонормироеанную систему собственных векторов с веществен- вещественными характеристическими числами1). Поэтому вещественная симметри- симметрическая матрица всегда вещественно- и ортогонально-подобна диагональной матрице: S^Ofa, |ia, ..., fin}^1 (О = О = О). A19) У кососимметрического оператора К в евклидовом пространстве все характеристические числа чисто мнимы (после расширения этот оператор равен произведению i на эрмитов оператор). Для кососимметрического оператора в формулах A14) следует положить: Hi = Иг = • • • = |^g = F2g+1 = . . . = JJt» = О, после чего эти формулы принимают вид Kxh=— xhyh, = vhxk, (* = 1, 2, ...,?; Z = 2?+l, ...,n). A20) Поскольку К является нормальным оператором, базис (ИЗ) можно считать ортонормированным. Таким образом, всякая вещественная косо- симметрическая матрица вещественно- и ортогонально-подобна канони- канонической кососимметрической матрице: 0 Vl —v, 0 О Vg — vo 0 , О, ..., A21) У ортогонального оператора О в евклидовом пространстве все характеристические числа по модулю равны единице (после расширения такой оператор становится унитарным). Поэтому в случае ортогонального оператора в формулах A14) следует положить: |4 + v*=i, w = ±l (ft«l, 2, .... g; Z = 2g + 1, ..., n). При этом базис (ИЗ) можно считать ортонормированным. Формулы A14) можно представить в виде Oxh = cos щхп — sin фйз/й, Оуь = вш<рьХц + совщуц, I = ' .''"'q'\. A22) Oxl=±xl W-24 + 1, ...,»/ Из сказанного следует, что всякая вещественная ортогональная матрица вещественно- и ортогонально-подобна канонической ортогональ- ортогональной: 0=0't sinq>i COS фд Sm фд — БШфд СОБфд ^ A23) ) Симметрический оператор S является неотрицательным, если в A18) все > и положительно определенным, если в A18) все цг ]>0.
§ 13] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 259 Пример. Рассмотрим произвольное конечное вращение вокруг точки О в трехмерном евклидовом пространстве. Оно переводит направленный отрезок ОА в направленный отрезок ОБ и потому может быть рассматриваемо как оператор О в трехмерном векторном пространстве (образованном всевозможными отрезками ОА). Этот оператор линейный и притом ортогональный. Определитель этого оператора равен единице, так как оператор О не изменяет ориентации в пространстве. Итак, О—ортогональный оператор первого рода. Для него формулы A22) будут выглядеть так: Oa;1=cos фа^—sin <pyt, Оух=sin фа?! + cos <pylt Из равенства |О] = 1 следует, что Ох2=х%. Это означает, что все точки прямой, проходящей через точку О в направлении вектора xz, неподвижны. Таким образом, мы видим, что имеет место утверждение: Произвольное конечное вращение твердого тела вокруг неподвижной точки может быть осуществлено конечным поворотом на угол ф вокруг некоторой непо- неподвижной оси, проходящей через ату точку. Рассмотрим теперь произвольное конечное движение в трехмерном евклидовом пространстве, переводящее точку х в точку х'—с+Ох. (*) Движение складывается из поворота О вокруг некоторой оси, проходящей через начало координат, и параллельного сдвига на вектор с. Обозначим через и, %, »2 собственные векторы О, соответствующие характеристическим числам А, = 1, Лф А.2 (при ЭТОМ %?==%!, «2=я&- Ои—и, Ozi=X1z1, О«2=^2»2- Докажем существование такой точки Xq, перемещение которой х'о—Жо параллель- параллельно вектору и (т. е. параллельно оси конечного поворота О). Для этого положим (Y2=Yi. 62=ii) и найдем, что Поэтому, определив координаты ?4 и ?г искомой точки Xq из равенств получим для перемещения точки Хо требуемую формулу х'0—х0=уи. Складывая почленно это равенство с вытекающим из (*) равенством х'— х'о—О (х—хо), получим х'—я>о=0(х—Хо)-{-уи. (**) Эта формула показывает, что при рассматриваемом конечном движении радиус- вектор точки, проведенный из Xq, поворачивается вокруг некоторой оси на фикси- фиксированный угол; затем к нему прибавляется параллельный оси вектор уи. Другими словами, движение представляет собой винтовой сдвиг вокруг оси, проходящей через точку Хо параллельно вектору и. Нами доказана теорема Эйлера— Даламбера: Произвольное конечное движение в трехмерном евклидовом пространстве пред- представляет собой винтовое перемещение вокруг некоторой неподвижной оси. 17*
260 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX § 14. Полярное разложение оператора и формулы Кэли в евклидовом пространстве 1. В § 12 было установлено полярное разложение линейного опера- оператора в унитарном пространстве. Совершенно аналогично получается полярное разложение линейного оператора в евклидовом пространстве. Теорема 9. Линейный оператор А всегда представим в виде произведений А = 8О, A24) А = Oj/Sj, A25) где 8 и 8±— неотрицательные симметрические, а О и О±—ортогональ- О±—ортогональные операторы; при этом 8 = \^АА' = g(AA'), 81 = \^A'A = h(A'A), где g(ty, h(k) — вещественные многочлены. В том и только в том случае, когда А — нормальный оператор, множители 8 и О (множители 8\ и О А между собой перестановочны *). Аналогичное предложение имеет место для матриц. Отметим геометрическое содержание формул A24) и A25). Будем откладывать векторы тг-мерного точечного евклидова пространства из начала координат. Тогда каждый вектор будет радиус-вектором некоторой точки пространства. Ортогональное преобразование, осуществляемое оператором О (или Oi), является «вращением» в этом пространстве, поскольку оно сохраняет евклидову метрику и оставляет на месте начало координат2). Симметрический же оператор 8 (или 8А осуществляет «дилатацию» тг-мер- тг-мерного пространства (т. е. «растяжение» вдоль п взаимно перпендикулярных направлений с различными в общем случае коэффициентами растяжения Oj, og, ..., Qn (Qi> (?2, •••. Qn — произвольные неотрицательные числа). Согласно формулам A24) и A25) произвольное линейное однородное пре- преобразование n-мерного евклидова пространства можно получить, осущест- осуществляя последовательно некоторое вращение и некоторую дилатацию (в любом порядке). 2. Подобно тому как это было сделано в предыдущем параграфе для унитарного оператора, рассмотрим теперь некоторые представления для ортогонального оператора в евклидовом пространстве S. Пусть К—произвольный кососимметрический оператор (К' = — К) и О = ек. A26) Тогда О — ортогональный оператор первого рода. Действительно, О' = ек' = е-к = О'1 и | О ] = 1 3). !) Как и в теореме 8, операторы S и Si определяются однозначно заданием А. Если А—неособенный оператор, то однозначно определяются и ортогональные множители О и О\. 2) В случае | О |=1 это будет собственно вращением; в случае же | О] = — 1 это будет соединение вращения с зеркальным отображением относительно некоторой координатной плоскости. 3) Если ki, &2, ••-, кп—характеристические числа оператора К, то |x1=<?ftl, |x2=efes, ..., [in=ehn—характеристические числа оператора О=еж; при этом • Hn=e1~1 =1' поскольку 2 ki=0.
§ 14] ПОЛЯРНОЕ РАЗЛОЖЕНИЕ 261 Покажем, что любой ортогональный оператор первого рода представим в виде A26). Для этого возьмем соответствующую ортогональную матрицу О. Поскольку |О| = 1, то согласно формуле A23) г) cos ф! sm ф! sin cpi cos ф! cos фе sin фе sin фе cos фе , +1, .... r1 A27) Определим кососимметрическую матрицу К равенством Поскольку О ф1 -Ф1 О II °ф е11 -ф о О ,0...,oJo-\ A28) СОБф Б1Пф БШф СОвф то из A27) и A28) следует: О = ек. A29) Матричное равенство A29) влечет операторное равенство A26). Для представления ортогонального оператора второго рода введем в рассмотрение специальный оператор W, определив его в некотором ортонормированием базисе еи е2, ..., еп равенствами Wei = еи ..., Wen-,. = е„_ь Wen = — еп. A30) W — ортогональный оператор второго рода. Если О — произвольный ортогональный оператор второго рода, то И7"0 и OW'1 суть операторы первого рода и потому представимы в виде ек и eEi, где К и Д4 — косо- симметрические операторы. Отсюда получим формулы для ортогонального оператора второго рода O = WeK = eE^-W A31^ Базис еи е2, ..., еп в формулах A30) можно выбрать так, чтобы он совпадал с базисом xk, Уъ, &i (k=i, 2, ..., о; l=--2q-\-l, ..., п) в фор- формулах A20) и A22). Определенный таким образом оператор W будет пере- перестановочен с И; поэтому две формулы A31) сольются в одну: Остановимся еще на формулах Кэли, устанавливающих связь между ортогональными и кососимметрическими операторами в евклидовом про- пространстве. Формула О = (Е-К) (Е+ К)-\ A33) как легко проверить, переводит кососимметрический оператор К в ортого- ортогональный О. Из A33) можно выразить К через О: A34) х) Среди характеристических чисел ортогональной матрицы О первого рода имеется четное число равных —1. Диагональная матрица может быть II 0 —HI cos ф sin ф — sin i записана в виде при ф=я.
262 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX Формулы A33) и A34) устанавливают взаимно однозначное соответ- соответствие между кососимметрическими операторами и теми ортогональными операторами, которые не имеют характеристического числа — 1. Вместо A33) и A34) можно взять формулы O=—(JE—K)(E+K)-1, A35) O)-K A36) В этом случае роль особой точки будет играть число +1. 3. Полярное разложение вещественной матрицы в соответствии с тео- теоремой 9 позволяет получить основные формулы A17), A19), A21), A23), не прибегая к включению евклидова пространства в унитарное так, как это было сделано ранее. Второй вывод основных формул опирается на следующую теорему: Теорема 10. Если две вещественные нормальные матрицы подобны: (АА' = А'А, ВВ' = В'В, А = А, В = В~), A37) то вти матрицы вещественно- и ортогонально-подобны: В = О~гАО @ = 0 = О'-1). A38) Доказательство. Поскольку нормальные матрицы А и В имеют одни и те же характеристические числа, то (см. 2° на стр. 246) суще- существует такой многочлен g(A), что A' = g(A), B' = g(B). Поэтому вытекающее из A37) равенство может быть записано так: В' = Т-1А'Т. A39) Переходя в этом равенстве к транспонированным матрицам, получим: В = Т'АТ'-\ A40) Сопоставление A37) с A40) дает: ТТ'А = АТТ'. A41) Воспользуемся теперь полярным разложением матрицы Т: T = SO, A42) где S = YTT' = h(TT') [h(k) — многочлен]— симметрическая, а О— вещест- вещественная ортогональная матрица. Поскольку согласно A41) матрица А пере- перестановочна с ТТ', то она же перестановочна с матрицей S = h(TT'). Поэтому подставляя в A37) выражение для Т из A42), будем иметь: В = O-T-S-iASO = О'1 АО. Теорема доказана. Рассмотрим вещественную каноническую матрицу (I — Vj Матрица A43) нормальна и имеет характеристические числа ^ ± ivu ... , |ле ± ivq, |i2s+ii • • •, Й«- Так как нормальные матрицы имеют простую
§ 15] КОММУТИРУЮЩИЕ НОРМАЛЬНЫЕ ОПЕРАТОРЫ 263 структуру, то любая нормальная матрица, имеющая те же характеристи- характеристические числа, подобна (а в силу теоремы 10 вещественно- и ортогонально- подобна) матрице A43). Таким образом, приходим к формуле A17). Совершенно так же получаются формулы A19), A21), A23). § 15. Коммутирующие нормальные операторы В § 10 мы доказали, что два коммутирующих оператора А и В в п-мерном пространстве М всегда имеют общий собственный вектор. Методом индук- индукции можно показать, что это положение справедливо не только для двух, но для любого конечного числа коммутирующих операторов. Действи- Действительно, если даны т попарно коммутирующих операторов А±, Аг, ..., Ат, среди которых первые т — 1 имеют общий собственный вектор зс, то, повто- повторяя дословно рассуждения леммы 1 (стр. 245) [в качестве А берем любое At (i = l, 2, ..., т), а в качестве В — оператор Ат], мы получаем вектор у, который является общим собственным вектором операторов Ai,_ А2, . ¦., Ат- Доказанное положение справедливо и для бесконечного множества коммутирующих операторов, поскольку такое множество может содержать только конечное число (<С/г2) линейно независимых операторов, а общий собственный вектор последних будет общим собственным вектором всех операторов из данного множества. Пусть теперь дано произвольное конечное или бесконечное множество попарно коммутирующих нормальных операторов A, В, С, ... Все они имеют общий собственный вектор asj. Обозначим (п — 1)-мерное подпро- подпространство, состоящее из всех векторов из if, ортогональных к as4, через Т^. Согласно § 10, 3° (стр. 247) подпространство Ti инвариантно относительно операторов А, В, С, ... Поэтому все эти операторы имеют общий собствен- собственный вектор ае2 в Т±. Рассматривая ортогональное дополнение Т2 к пло- плоскости [xlt асг], выделим в нем вектор х3 и т. д. Таким образом, мы по- получим ортогональную систему xlt xz, ..., хп общих собственных векторов для операторов А, В, С, ... Эти векторы можно пронормировать. Нами доказана Теорема 11. Если дано конечное или бесконечное множество по- попарно коммутирующих нормальных операторов A, J8, С, ... в унитарном пространстве В, то все вти операторы имеют полную ортонормирован- ную систему общих собственных векторов zu »2, .. -, &п'- Asi = XiSi, Bzi = k'igi, C%i = K"zt, ... [(Sis*) = 6ife; i, k = l, 2, ..., rc]. A44) В матричной формулировке эта теорема гласит: Теорема 11'. Если дано конечное или бесконечное множество по- попарно коммутирующих нормальных матриц, то все эти матрицы одним и тем же унитарным преобразованием могут быть приведены к диаго- диагональному виду, т. е. существует такая унитарная матрица 11,кчто С = U {К, . • •, К) U-\ ... A7 - U*-1). Пусть теперь даны коммутирующие нормальные операторы в евкли- евклидовом пространстве И. Обозначим через А, В, С, ... линейно независи- независимые среди них (их конечное число). Включим (с сохранением метрики) В в унитарное пространство В, как это было сделано в § 13. Тогда согласно теореме 11 операторы А, В, С, ... будут иметь в R полную общую
264 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX ортонормированную систему собственных векторов &и х2, ..., ?п, т. е. будут выполняться равенства A44). Рассмотрим произвольную линейную комбинацию операторов А, В, С, ... : При любых вещественных значениях а, р, у, ... оператор Р является вещественным (AM CZ Л) нормальным оператором в Л и [(*>**) = вд; U к = 1,2,...,п]. Характеристические числа Aj(j — 1, 2, ..., п) оператора Р являются линейными формами относительно а, Р, у, ... В силу вещественности оператора Р эти формы можно разбить на попарно комплексно сопряжен- сопряженные и вещественные; при надлежащей нумерации собственных векторов будем иметь: A2ft_1 = Mft + iWft, A2h = Mk~iNk, Лг = Мг A47) (ft = 1,2, ...,?; * = 2? + 1, ...,п), где Мй, Nb, Mi — вещественные линейные формы от а, р, у, ... В соответствии с этим мы можем в A46) считать векторы z2k-i и комплексно сопряженными, a Zi — вещественными: z2k = xh — iyh, »l = xi A48) (ft = l, 2, ...,g; Z = 2g + 1, ...,n). Тогда, как легко видеть, вещественные векторы 3ch, Vh, хг (ft = l, 2, ...,?; Z = 2?+l, ...,n) A49) образуют ортонормированный базис в Я Б этом каноническом базисе имеем1): Pxk = Mhxh — Nhyh, P = J' 2';••' 9' ) A50) Pxt = Мгхг Поскольку все операторы данного множества получаются из Р при частных значениях а, р, у, ..., то базис A49), не зависящий от этих параметров, является общим каноническим базисом для всех данных операторов. Нами доказана Теорема 12. Если дано любое множество коммутирующих нор- нормальных линейных операторов в евклидовом пространстве R, то все эти операторы имеют общий ортонормированный канонический базис Хь, у и, 5Гг- A51) Ayk = Равенства A50) следуют из равенств A46), A47) и A48)«
§ 16] ПСЕВДООБРАТНЫЙ ОПЕРАТОР 265 Приведем матричную формулировку теоремы 12: Теорема 12'. Любое множество коммутирующих вещественных нормальных матриц А, В, С, ... при помощи одного и того же веще- вещественного ортогонального преобразования О может быть приведено к каноническому виду А = О — Vi н-i •^••¦¦•M01' ] A52) Примечание. Если какой-либо из операторов Л, Б, С, ... (какая- либо из матриц А, В, С, ...), например А (А), является симметрическим (симметрической), то в соответствующих формулах A51) [соответственно (в 152)] все v равны нулю. В случае косой симметрии все (л равны нулю. В случае, если А—ортогональный оператор (А — ортогональная матрица), то jAft = cos фь, vft = sin фй, \it = ± 1 (k=l, 2, ...,q; l = 2q + l, ..., n). § 16. Псевдообратный оператор Пусть дан произвольный линейный оператор А, отображающий re-мерное уни- унитарное пространство R в m-мерное унитарное пространство S (см. гл. III, § 2). Обозначим через г ранг оператора А, т. е. число измерений подпространства AR. Рассмотрим два ортогональных расщепления пространств R и S: A53) A54) Здесь подпространство R2=NA состоит из всех векторов за g R, удовлетворяющих уравнению Аас=О. Поэтому число измерений подпространства R2 равно d—n—г (см. стр. 78). Следовательно, число измерений ортогонального дополнения Ri равно г. С другой стороны, AR2 = 0 и ARi = AR = S\. Поскольку подпространства jRi и Si имеют одно и то же число измерений г, то линейный оператор А устанав- устанавливает взаимно однозначное соответствие между векторами подпространств Rt и Si. Поэтому однозначно определяетсн обратный оператор А~1, отображающий S± в Bt. Псевдообратным оператором А+ для оператора А назовем линейный оператор, отображающий S в R и определяемый равенствами A55) Псевдообратный оператор А+ однозначно определяется заданием линейного оператора А, отображающего пространство R в S и заданием метрики в простран- пространствах R и S. При изменении метрики в пространствах R я S изменяется и псев- псевдообратный оператор А+ 1). Роль псевдообратного оператора выясняется из следующей геометрической интерпретации. Уравнение Аж=у A56) х) В этом отличие от обратного оператора А~\ определение которого не связано с метрикой. Но зато псевдообратный оператор А+ определяется в общем случае при любых т, п, г, а обратный оператор А~г может быть определен лишь в частном случае, когда линейный оператор А устанавливает взаимно однозначное соответст- соответствие между векторами пространств R и S, т. е. когда т=п=г. В этом частном случае оператор А+ не зависит от метрики пространств R и S и совпадает с обратным оператором А~г.
266 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ [ГЛ. IX при заданном у ? S либо не имеет решений в В (если у не принадлежит подпро- подпространству S=AR), либо имеет решения (если у? AR). В последнем случае все решения уравнения A56) получаются из одного решения х° прибавлением произ- произвольного вектора язг 6 В>2=НЛ. Докажем, что вектор хР=А+у A57) представляет собой наилучшее приближенное решение уравнения A56), т. е, I Ах°—у | =min | Ах—у | A58) и из всех векторов х ? R, для которых этот минимум реализуется, вектор х° имеет наименьшую длину |я5°|. Действительно, пусть y=yi+y2 (Vi €<Sj. Уг € S%) и x°=A+y—A+yi. Тогда yi=Ax° представляет собой ортогональную проекцию вектора у на подпространство S=AR, состоящее из всех векторов вида Ах, где х 6 R. Поэтому имеет место равенство A58). С другой стороны, пусть х' ? R—какой-либо другой вектор (х'фх0), для которого реализуется минимум A58). Тогда Аос'=Ах°=у1 A59) и, следовательно, А(х'— х°)=0, A60) т. е. х'—x°?R2. Поэтому, поскольку х° J. (х'о—as0), то по теореме Пифагора из равенства х'—х°-\-(х'—х°) находим: | х' р=| а>° |2+1 х'—х° Р > | хо Р* A61) Таким образом, существует только одно наилучшее приближенное решение уравне- уравнения A56) и вто решение определяется формулой A57). Выберем в пространствах R^n S ортонормированные базисы. В этих базисах квадрат длины векторов х ? R и у ? S определяется формулами | |] A62) i=l i=l и векторные равенства АХ=у, Х°=А+у переходят в матричные Ах=у, хО=А+у. A63) Поскольку х° при любом у представляет собой наилучшее приближенное решение {в смысле метрики A62)] системы линейных уравнений, то А+—псевдообратная матрица для прямоугольной матрицы А (см. гл. I, § 4). Таким образом, если в про- пространствах R и S выбраны ортонормированные базисы, то операторам А и А+ в этих базисах соответствуют взаимно псевдообратные матрицы А и А+.
ГЛАВА X КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ § 1. Преобразование переменных в квадратичной форме 1. Квадратичной формой называется однородный многочлен второй степени относительно п переменных хи хг, ..., хп. Квадратичную форму всегда можно представить в виде п 2 aikXiZk (aih = ahi; i, k = l,2, ...,n), г, ft=l где А = || alh ||™—симметрическая матрица. Обозначая через х столбцовую матрицу (хи х2, ...,хп) и пользуясь сокращенным обозначением для квадратичной формы п А(х, х) = 2^ aihxtxh, A) мы можем написать1): А(х, х) = х'Ах. B) Если А = || ath ||" — вещественная симметрическая матрица, то форма A) называется вещественной. В этой главе мы будем в основном рассматри- рассматривать вещественные квадратичные формы. Определитель | А | = | ajft |" называется дискриминантом квадратичной формы А (х, х). Форма называется сингулярной, если ее дискриминант равен нулю. Каждой квадратичной форме соответствует билинейная форма п А(х,у)= 2 aihxtyh C) г, ft—1 ИЛИ А(х, у) = х'Ау [х = (хи ...,хп), у*=(уи .... уп)]- D) Если х1, х2, ..., х1, у1, у2, ..., ут — столбцевые матрицы, a clf с2, ..., с/, du d2, ..., dm — скаляры, то в силу билинейности выражения А(х, у) [см. DI 1 m I m ctx\ 2 djyj)= 2 2 ctdjA(x\ у'). E) x) Значок ' означает транспонирование. В формуле B) квадратичная форма представлена в виде произведения трех матриц: строчной х', квадратной А и столб- цевой х.
268 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Если задан некоторый симметрический оператор А в n-мерном евкли- евклидовом пространстве и этому оператору в некотором ортонормированном базисе еи е2, ..., еп соответствует матрица Л = ||а(й|!), то для любых векторов п п имеет место тождество А(х, у) = (Аж, у) = {ж, Ау)% В частности, А (х, х) = (Ах, ж) = (ж, Ах). При этом aih = (Aet, eh) (i, k = l, 2, ..., и). 2. Посмотрим, как изменяется матрица коэффициентов формы при преобразовании переменных: S h i = (l, 2, ...,n). F) R— 1 В матричной записи это преобразование выглядит так: х=П. F') Здесь х и | — столбцевые матрицы: ж = (г,,% ..., хп) и ? = (?ь ?2, ..., ?„), а Т — преобразующая матрица: У = ||?гй]|". Подставляя в B) выражение для х, из F') получим: А(х, х) = 1'т'АП = ?'А1 = Аа, I), где А = Г AT. G) Формула G) выражает матрицу А = \\ aih ||" коэффициентов преобразован- п ной формы Л(^, |)= 2 «jftSj^ft через матрицу коэффициентов первона- i, h=i чальной формы А = || a,ft ||" и матрицу преобразования 71 = || tih ||". Из формулы G) следует, что при преобразовании формы ее дискри- дискриминант умножается на квадрат определителя преобразования: \А\ = \А\\Т\\ (8) В дальнейшем мы будем пользоваться исключительно неособенными преобразованиями переменных (| Т \ Ф 0). При таких преобразованиях, как видно из формулы G), ранг матрицы коэффициентов остается неизменным (ранг матрицы А равен рангу матрицы АK). Ранг матрицы коэффициен- коэффициентов обычно называют рангом формы. (к=1, ..., п); см. стр. 70. 2) В А (х, у) скобки составляют ч^сть условного обозначения; в (Аса, у) я в (ж, Ау) скобки обозначают скалярное произведение. 3) См. стр. 27.
§ 2] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 269 Определение 1. Две симметрические матрицы А ж А, связанные равенством G), в котором | Т \ Ф О, называются конгруэнтными. Таким образом, с каждой квадратичной формой связан целый класс попарно конгруэнтных симметрических матриц. Как было уже отмечено выше, все эти матрицы имеют один и тот же ранг—ранг формы. Ранг является инвариантом для данного класса матриц. В случае вещественной квадратичной формы вторым инвариантом является так называемая «сиг- «сигнатура» квадратичной формы". К введению этого понятия мы и переходим. § 2. Приведение квадратичной формы к сумме квадратов. Закон инерции Вещественную квадратичную форму А (х, х) можно бесчисленным множеством способов представить в виде А(х, z)=iUn (9) где агф0 (? = 1, 2, ...,г) и 2 (» = 1, 2, ..., г) — независимые вещественные линейные формы от переменных хи х2, .....Хп (отсюда г<п). Рассмотрим неособенное преобразование переменных, при котором первые г из новых переменных ?lf g2. . ?п связаны с х±, х2, ..., хп формулами х) 6г-Хг (i = i,2, .... г). Тогда в новых переменных А(х, а) = ?(?,?) =53 а& и, следовательно, матрица А имеет диагональный вид: А = {аи иг, • • •, «г, 0, ..., 0}. Но ранг матрицы А равен г. Следовательно, число квадратов в пред- представлении (9) всегда равно рангу формы. Мы покажем, что неизменным при различных представлениях формы А (х, х) в виде (9) является не только число всех квадратов, но и число положительныха) (а значит, и число всех отрицательных) квадратов. Теорема 1 (закон инерции квадратичных форм). При представлении вещественной квадратщщой формы А(х, х) в виде, суммы г) Нужное преобразование получаем, дополняя систему линейных форм Хь ..., Хг линейными формами Хг+1, ...,Хптяк, чтобы п форм Xj(j = l, 2, ...,п) были независимы, и полагая %j=Xj G=1, 2, ..., п). 2) Под числом положительных (отрицательных) квадратов в представлении (9) мы понимаем число положительных (соответственно отрицательных) коэффи- коэффициентов а%.
270 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X независимых квадратов1) А (х, X) = 2 aiXi число положительных квадратов и число отрицательных квадратов не зависят от способа представления формы в указанном виде. Доказательство. Пусть наряду с представлением (9) имеет место другое представление формы А (х, х) в виде суммы независимых квадратов и пусть , С2>0, . ..,Gfc &i>0, Ь2>0. ...,bg>0, bg+i<0, ..., fcr<0. Допустим, что h=^g, например h<ig. Тогда в тождестве 2 atX\ = 23 btY\ A0) z=i г=1 дадим переменным хи xz, , Хп значения, удовлетворяющие системе г—(g—h) уравнений Х, = 0, Х2 = 0, ...,Xft = 0, Fg+1 = 0, ..., Уг = 0 A1) и не обращающие в нуль хотя бы одну из форм Xh+1, ...,Xr2). При этих значениях переменных левая часть тождества A0) равна а правая равна е Ь=1 Таким образом, допущение h=^=g привело нас к противоречию. Тео- Теорема доказана. Определение 2. Разность с между числом л положительных и числом v отрицательных квадратов в представлении формы А (х, х) называют сигнатурой формы А (х, х). Ранг г и сигнатура о определяют однозначно числа лиг, так как , с = Л — V. Заметим еще, что в формуле (9) положительный множитель ]/] аг \ можно отнести к форме Хг(г = 1, 2, ...,г). Тогда формула (9) прини- принимает вид А(х, х)=Х\ + Х\+ ...+ХЪ-ХЪ+1- .. .-X*. A2) х) Под суммой независимых квадратов мы понимаем сумму вида (9), в кото- которой все oj Ф 0 и формы Xlt Хг, ..., Хг линейно независимы. 2) Такие значения существуют, так как в противном случае уравнения X^+i— = 0, ..., ХТ=0, а значит, и все г уравнений Xj=0, ..., Хг = 0были бы следствием г—(g—h) уравнений A1). Это невозможно, поскольку линейные формы Xit Xz, ..., Xr независимы.
§ 3] МЕТОДЫ ЛАГРАНША И ЯКОБИ ПРИВЕДЕНИЯ К СУММЕ КВАДРАТОВ 271 Полагая ?г = Хг(г = 1, 2, . ...гI), мы форму А (х, х) приводим к кано- каноническому виду A{L Z) = %+?+...+&-&+1-...-%¦ A3) Отсюда на основании теоремы 1 заключаем, что всякая вещественная симметрическая матрица А конгруэнтна диагональной матрице, у кото- которой диагональные элементы равны +1,-1 или 0: , ..., +1, -1, ..., -1, 0, ...,0}7\ A4) В следующем параграфе будет дано правило для определения сигна- сигнатуры по коэффициентам квадратичной формы. § 3. Метод Лагранжа приведения квадратичной формы к сумме квадратов. Формула Якоби Из предыдущего параграфа вытекает, что для определения ранга и сигнатуры формы достаточно каким-либо способом привести эту форму к сумме независимых квадратов. Мы изложим здесь метод приведения Лагранжа. 1. Метод Лагранжа. Пусть дана квадратичная форма п А (х, х) = 2 athxtxh. i, fc=l Рассмотрим два случая: 1) При некотором g(i^g^.n) диагональный коэффициент agg^0. Тогда, полагая п Л (х, х) = -±- С 2 aghzhy+А, (х, х), A5) непосредственной проверкой убеждаемся в том, что квадратичная форма А± (х, х) уже не содержит переменной xg. Этот способ выделения квадрата из квадратичной формы применим всегда, когда в матрице А = || а»'Л" имеются диагональные элементы, отличные от нуля. 2) Коэффициенты agg = 0, ahft = 0, но %/, Ф 0. В этом случае полагаем: A6) Формы п п 2 agkZk, 2 ahhXh A7) k—i ь1 линейно независимы, так как первая содержит Xh, но не содержит хё, а вторая, наоборот, содержит xg, но не содержит хп. Поэтому и формы, стоящие под знаком квадрата в A6), линейно независимы [как сумма и разность независимых линейных форм A7)]. Таким образом, мы выделили в А (х, х) два независимых квадрата. Каждый из этих квадратов содержит xg и хн, в то время как форма Аг (х, х), как легко проверить, этих переменных не содержит. 2) См. сноску1) на стр. 269.
272 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Последовательным комбинированием приемов 1) и 2) можно всегда с помощью рациональных операций привести форму А (х, х) к сумме квадратов. При этом полученные квадраты будут независимы, так как на каждом этапе выделяемые квадраты содержат переменные, которые отсутствуют в последующих квадратах. Заметим еще, что основные формулы A5) и. A6) могут быть запи- записаны так: Пример. А (ж, х)=Ах\~\-х\-\-х%-\-х%—4ж4жг— Применяем формулу A5') (g=l): где А1 (ж, x)=2x^x3-\-2x2,Xik—2ж3ж4. Применяем формулу A6') (g=2, h=3): A(z> x)=±Bx2 + 2x3K—±-B =y(^2+^зJ-у (*8- где А2(х, х)=2х%. Окончательно А (ж, ж)=BЖ1-Ж2-Жз + ж4J + |-(ж2+ж| г=4, о=2. 2. Формула Якоби. Обозначим через г ранг квадратичной формы п А (х, х)— 2 aihxiXk и допустим, что i, fe=l 1 2 ... ft\ 1 2...*)*° (*=*.2,....r). A8) Поскольку аи = />4 ^ 0, то, выделяя по методу Лагранжа из формы А (х, х) один квадрат, получим: А (х, х) = -J— (йц^ + а12х2 + ... + amxnf + At (x, x), A9) где квадратичная форма п не содержит переменной х±. Из тождества A9) следует, что коэффициенты формы А± (х, х) определяются формулами O*ih==aik \l,K = Z, ...,П). (^-l) Но тогда эти коэффициенты совпадают с соответствующими элементами
$ 3] МЕТОДЫ ЛАГРАНЖА И ЯКОВИ ПРИВЕДЕНИЯ К СУММЕ КВАДРАТОВ 273 матрицы О л^ лШ которая получается из симметрической матрицы А = || aih ||™ после приме- применения к ней первого этапа алгоритма исключения Гаусса*) (см. гл. И, § 1). Таким образом, процесс выделения одного квадрата по методу Лагранжа, по существу, совпадает с первым этапом алгоритма Гаусса. Элементы первой строки матрицы Gt являются коэффициентами в выде- выделяемом квадрате; величина, обратная элементу аи, является множителем при квадрате. Остальные элементы матрицы Gt определяют коэффициенты формы At (x, я). Для выделения второго квадрата следует выполнить вто- второй этап алгоритма Гаусса и т. д. Применяя к симметрической матрице А = |[ aysr||i полный алгоритм Гаусса^ состоящий из г этаповя), получим матрицу аи О air 2г 1.Н-1 2, г+1 «In 0 0 0 0 гг ... 0 » д(г-1) г, г-|-1 0 лС-1) т ... 0 G,= о о - ... о о ... о и соответственно представление квадратичной формы А (х, х) в виде суммы квадратов B2) Введем сокращенные обозначения для независимых линейных форм Замечая, что 3) B5) можно тождество B2) записать в виде Ь=1 х) Из формулы B1) и симметричности матрицы Л=[[о{й|[" следует симметрич- симметричность матрицы ^1=||огй112'. 2) Выполнение алгоритма возможно благодаря неравенствам A8). Из зтих неравенств следует, что ои Ф 0, а$ фО, ..., e?j.~f) ф 0 (см. стр. 44). 3) См. стр. 44; формулы B4) получаются приравниванием последовательных главных миноров Dh^ и Dh в матрицах А и Gr; при этом получаем ?>ft=o11a(*)... a^) (A=l, 2, ...,г). 18 ф. р. Гантмахер
274 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Эта формула, дающая представление квадратичной формы А (х, х) в виде суммы независимых квадратов, носит название формулы Якоби1). Для коэффициентов, фигурирующих в формуле Якоби линейных форм Xft, имеют место равенства8) B6) Если через G обозначить произвольную верхнюю треугольную матрицу, у кото- которой первые г строк совпадают с соответствующими строками матрицы Gr, то на основе формулы Якоби можно утверждать, что преобразование переменных п l=Gx (?=(?i, lz, .... In)) переводит квадратичную форму 2 Dh-i/Dkthc диаго- fci ^/1 ... к — 1 к\ ~ /1к1\ ¦ нальной матрицей коэффициентов z5=-{l/ZI, DJDZ, ..., Dr_i/Z)r,0, ..., 0}в квадра- квадратичную форму А (ж, ж). Но тогда [см. G)] справедливо равенство A=G'T)G. Эта формула устанавливает разложение симметрической матрицы А на треугольные множители и совпадает с формулой E5) на стр. 55. Формулу Якоби часто предстаачяют в другом виде. Вместо Xh(k—1, 2, ..., г) вводят линейно независимые формы УП V" /L. .10 -. Г) 4\ /974 Тогда формула Якоби B5) запишется так: V? B8) Здесь s = Cfefe^fe4-Cft)fe+ia;ft+i4--.-+Cftna;n (?=1, 2, ..., г), где ^1 2 ... Л —1 qr/ Пример. А (х, х)-=х\-\-?>х\—Зж|—4 Приводим матрицу п; к=1, 2, . . ., г). B9) C0) к гауссовой форме G= 1 2 1 — 1 1 0 0 0 —2 3 —3 4 —2 — 1 0 0 1 —3 1 —1 0 0 0 1 —1 2 0 0 Отсюда г=2, оц=1, <4!' = — 1. !) Другой вывод формулы Якоби, не использующий алгоритма Гаусса, можно иайти, например, в [7], стр. 43—44. 2) См. формулу A3) на стр. 43.
§ 3] МЕТОДЫ ЛАГРАНЖА И ЯКОБИ ПРИВЕДЕНИЯ К СУММЕ КВАДРАТОВ 275 Формула B2) дает: Из формулы Якоби B8) вытекает Теорема 2 (Якоби). Если для квадратичной формы п ранга г имеют место неравенства 2 к\ ,— I, л, ..., г), C1) то число положительных квадратов л и число отрицательных квадра- квадратов v формы А (х, х) совпадают соответственно с числом знакопо- стоянств Рис числом знакоперемен V в ряду чисел 1, Du D2, ..., Д., C2) т. е. я = РA, A, D2, ..., DT), v = F(l, Du D2, ..., Dr) и сигнатура o = r-2F(l, A, D2, ..., DT). C3) Замечание 1. В случае, когда в ряду чисел 1, Dlt ..., Dr ф 0 имеются нули, но нет трех подряд идущих нулей, для определения сигнатуры можно пользо- пользоваться формулой O=r-2V(\, Du D2, ..., Dr), опуская нулевое D^, если Djl_iD}l^ ф 0, и полагая в случае /)д=/)^+1=0 _1? Dh, Dh+l, Dft+2) = { ft-' C4) h-1 Мы приводим здесь это правило без обоснования х). Замечание 2. Яри наличии трех подряд идущих нулей в ряду Dlt ZJ> ..., Z>j—! сигнатура квадратичной формы не может быть непосредственно определена при помощи теоремы Якоби. В этом случае знаки ненулевых D^ не определяют сигнатуру формы. Следующий пример убеждает нас в этом: А (X, X) = lutXiXb + «2^2 + °3Ж| Здесь ?>i = D2 — D3 =0, Di=— a\a2a3 ф 0. В то зке время 1 при а2 >• 0, оз>0, 3 при о2<0, аз<0. В обоих случаях D4<0. Замечание 3. Если Dl ф 0, ..., Dr_4 ф 0, о Dr=0, mo знаки Du D2, ... ..., -Dr_i не определяют сигнатуру формы. В качестве подтверждающего примера можно привести форму »{ Однако в последнем случае перенумерацией переменных можно достичь того, чтобы имело место и неравенство Dr ф 0. Действительно, пусть s-я строка (s >> г) линейно независима по отношению к первым г—1 строкам. Поменяем между собой г) Это правило было установлено для случая одного нулевого D^ Гундель- фингером и для двух подряд идущих нулевых Dk Фробениусом [182f]. 18 *
276 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X номера переменных хг и xs. После этого в новой матрице коэффициентов А первые г строк, а значит (в силу симметричности матрицы) и первые г столбцов, линейно независимы. Тогда в произвольном миноре r-го порядка Дг каждую строку пред- представим в виде линейной комбинаций первых г строк, а затем каждый столбец— в виде линейной комбинации первых г столбцов. В соответствии с этим, расщеп- расщепляя минор Аг на сумму определителей г-го порядка, мы в конце концов получим, что минор Аг равен произведению главного минора Dr на некоторый числовой множитель: Ar=cDr. Но среди миноров Дг имеются отличные от нуля миноры, так как г—ранг матрицы А. Поэтому Dr Ф 0. § 4. Положительные квадратичные формы В этом параграфе мы остановимся на специальном, но важном классе положительных квадратичных форм. Определение 3. Вещественная квадратичная форма А(х, х) = 2 называется неотрицательной {неположительной), если i, fc=i при любых вещественных значениях переменных А (х, х)>0 (<0). C5) В этом случае симметрическая матрица коэффициентов А называется положительно полуопределенной (отрицательно полу- полуопределенной). Определение 4. Вещественная квадратичная форма А(х, х) = п = У\ dikxi%k называется положительно определенной {отрицательно определенной), если при любых не равных одновременно нулю вещест- вещественных значениях переменных (хфО) А(х, ж)>0 (<0). C6) В этом случае матрица А также называется положительно определенной (отрицательно определенной). Класс положительно определенных (отрицательно определенных) форм является частью класса неотрицательных (соответственно неполо- неположительных) форм. Пусть дана неотрицательная форма А (х, х). Представим ее в виде суммы независимых квадратов: А(х, х)= SfliX?. C7) В этом представлении все квадраты должны быть положительными: ai>0 (i = l,2, ...,г). C8) Действительно, если бы какое-либо аг было <0, то можно было бы подобрать такие значения х±, Х2, . . ., а;л, при которых Xj = . . . = Xj_j = Xj+i = . -. = Xr = 0, Хг Ф 0. Но тогда при этих значениях переменных форма А (х, х) имела бы отри- отрицательное значение, что по условию невозможно. Очевидно, что и обратно, из C7) и C8) следует положительность формы А (х, х). Таким образом, неотрицательная квадратичная форма характери- вуется равенствами а = г (я = г, v = 0). Пусть теперь А (х, х) — положительно определенная форма. Тогда А {х, х) и неотрицательная форма. Поэтому она представима в виде C7),
§4] ПОЛОЖИТЕЛЬНЫЕ КВАДРАТИЧНЫЕ ФОРМЫ 277 где все at (i = 1, 2, . . ., г) положительны. Из положительной опреде- определенности формы следует, что г = п. Действительно, в случае г < п можно подобрать такие не равные одновременно нулю значения xt, х%, ... . . ., Хп, при которых все Хг обращались бы в нуль. Но тогда в силу C7) А (х, х) = 0 при х Ф О, что противоречит условию C6). Легко видеть, что и обратно, если в C7) г = п я все я4, а^, . - ., «л положительны, то А (х, х) — положительно определенная форма. Другими словами, неотрицательная форма тогда и только тогда является положительно определенной, когда она не сингулярна. Следующая теорема дает критерий положительной определенности формы в виде неравенств, которым должны удовлетворять коэффициенты формы. При этом используются уже встречавшиеся в предыдущих пара- параграфах обозначения для последовательных главных миноров матрицы А: Oil «21 «12 «22 «11 «21 «12 «22 ... «in ••• «271 11 «7l2 -.. «7 Теорема З. Для того чтобы квадратичная форма была поло- положительно определенной, необходимо и достаточно, чтобы выполнялись неравенства Z>4>0, А>>0, ..., ?>„>0. C9) Доказательство. Достаточность условий C9) следует непо- непосредственно из формулы Якоби B8). Необходимость условий C9) уста- устанавливается следующим образом. Из положительной определенности формы А {х, х) = i «урезанных» форм1) Ар (ж, х) = { следует положительная определенность (р=1,2, ... ,п). Но тогда все эти формы должны быть несингулярны, т. е. ПР = \АР\ФО (р=1, 2, ..., /г). Теперь мы имеем возможность воспользоваться формулой Якоби B8) (при г = /г). Поскольку в правой части этой формулы все квадраты должны быть положительными, то Ьх>0, DiDz>0, D2D3>0 Dn.lDn>0. Отсюда следуют неравенства C9). Теорема доказана. Поскольку любой главный минор матрицы А при надлежащей пере- перенумерации переменных можно поместить в левый верхний угол, то имеет место Следствие. В положительно определенной квадратичной фор- п ме А (х, х)= у\ i, h=l все главные миноры матрицы коэффициентов *) Форма Ар (х, х) получается из формы А (х, х), если в последней положить = . . .= хп = 0 (р = 1, 2 п).
278 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X положительны г): Al4 Ч ¦:. М>0 (i<l-1<I-2<...<ip<n; p=if 2, ....n). D0) \ii i2 • - • ipl Замечание. Из неотрицательности последовательных главных миноров Я,>0, ZJ>0, ..., ?>п>0 не следует неотрицательность формы А (ж, х). Действительно, форма аих\ + 2a12xlx2 + а&рс^, в которой аи = aiZ = 0, а22 < 0, удовлетворяет условиям ZL > 0, ZJ > 0, но не является неотрицательной. Однако имеет место следующая Теорема 4. Для того чтобы квадратичная форма А{х, х) = п = 2 а1ьх&ь была неотрицательной, необходимо и достаточно, чтобы г, ft=l все главные миноры ее матрицы коэффициентов были неотрицательны: p; p=l, 2, ..., ») Доказательство. Введем вспомогательную форму Ае(х, х) = А(х, x) + ej$ x\ (е>0). Очевидно, lim Ае (х, х) = А (х, х). е->-0 Из неотрицательности формы А (х, х) следует положительная опре- определенность формы Ае(х, х) и, следовательно, неравенства (см. следствие из теоремы 3) 1ч Ч ¦•¦ j \Ч Ч ¦ ¦ ¦ i = l, 2, ...,»). Переходя к пределу при е —> 0, получаем условия D0). Пусть, наоборот, даны условия D0). Из этих условий следует: А1ч Ч ••• 1р\=ер+...>ер>о A <»!<»*<...<*,<»; \it iz ... ipl р=1, 2, ..., п). Но тогда (согласно теореме 3) Ае(х, ж)—положительно определенная форма Ае(х, х)>0 (хф'0). Переходя к пределу при е —> 0, получаем отсюда: А(х, х)>0. Теорема доказана. 1) Таким образом, из положительности последовательных главных миноров вещественной симметрической матрицы следует положительность всех остальных главных миноров.
§ 5] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К ГЛАВНЫМ ОСЯМ 279 Условия неположительности и отрицательной определенности формы получаются соответственно из неравенств C9) и D0), если эти неравен- неравенства применить к форме —А (х, х). Теорема 5. Для того чтобы квадратичная форма А (ж, х) была отрицательно определенной, необходимо и достаточно, чтобы имели место неравенства ZI<0, Z>2>0, Z>3<0, ..., (-l)»Z)n>0, C9') Теорема 6. Для того чтобы квадратичная форма А (х, х) была неположительной, необходимо и достаточно, чтобы имели место нера- неравенства р = 1, 2, ...,»). D0') Ч 12 l § 5. Приведение квадратичной формы к главным осям Рассмотрим произвольную вещественную квадратичную форму п А (х, ж)= 2 alhxtxh. Ее матрица коэффициентов А = || aih ||™ является вещественной сим- симметрической. Поэтому (см. гл. IX, § 13) она ортогонально-подобна неко- некоторой вещественной диагональной матрице Л, т. е. существует такая вещественная ортогональная матрица О, что Л = О~ХАО (Л = ||Я|6|к||?, 00' = Е). D1) Здесь Я4, Я2, ..., %п — характеристические числа матрицы А. Поскольку для ортогональной матрицы О~1 = О', то из D1) следует, что форма А (х, х) при ортогональном преобразовании переменных х = 01 (Оа = Е) D2) или в более подробной записи п п 2 B/ = 6lfc; *'• A = 1» 2' ••" ») D2') переходит в форму Л(?, 6) = ул,а. D3) 4=1 Теорема 7. Вещественная квадратичная форма А] (ж, ж) = п = ^aikXiXk всегда может быть приведена при помощи ортогонального преобразования к канонической форме D3); при этом %it Х2, . . ., Я„ — характеристические числа матрицы А = || aift Hi- Приведение квадратичной формы А (х, х) при помощи ортогональ- ортогонального преобразования к канонической форме D3) называется приведе- приведением к главным осям. Это название связано с тем, что уравнение цен- центральной гиперповерхности второго порядка, п c (с = const Ф 0), f44)
280 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X при ортогональном преобразовании переменных D2) принимает кано- канонический вид п i=l Если мы будем рассматривать xt, xz, . . ., хп как координаты в неко- некотором ортонормированном базисе n-мерного евклидова пространства, то Еи 1г, • • •, in будут координатами в новом ортонормированном базисе того же пространства, причем «поворот»1) осей осуществляется ортого- ортогональным преобразованием D2). Новые оси координат являются осями симметрии центральной поверхности D4) и обычно называются глав- главными осями этой поверхности. Из формулы D3) следует, что ранг г формы А (х, х) равен числу отличных от нуля характеристических чисел матрицы А, а сигнатура а равна разности между числом положительных и числом отрицательных характеристических чисел матрицы А. Отсюда, в частности, вытекает и такое предложение: Если при непрерывном изменении коэффициентов квадратичной формы остается неизменным ее ранг, то при этом изменении коэффициентов остается неизменной и ее сигнатура. При этом мы исходим из того, что непрерывное изменение коэффи- коэффициентов влечет непрерывное изменение характеристических чисел. Сиг- Сигнатура может измениться лишь тогда, когда какое-либо характеристиче- характеристическое число поменяет знак. Но тогда в какой-то промежуточный момент рассматриваемое характеристическое число обратится в нуль, что влечет изменение ранга формы. Из формулы D3) также следует, что вещественная .симметрическая матрица А является положительно полуопределенной (положительно определенной) в том и только в том случае, когда все характеристические числа матрицы А неотрицательны (положительныJ), т. е. когда она представима в виде А = О\\ЯгбгА||»(Г1 [Л,>0 (>0); i = 1 п]. D6) Положительно полуопределенная (определенная) матрица D7) является корнем квадратным из положительно полуопределенной (опре- (определенной) матрицы А: D8) J) Если j О | = —1, то преобразование D5) представляет собой соединение враще- вращения с йеркальным отображением (см. стр. 260). Однако приведение к главным осям можно всегда осуществить при помощи ортогональной матрицы О первого рода (| О | = = 1). Это следует из того, что, не меняя канонической формы, мы можем сделать дополнительное преобразование El=Ei(* = l, 2, .... n-i), ?„ = -?;. 2) Отсюда сразу следует, что в ортонормированном базисе евклидова прост- пространства неотрицательному (положительно определенному), оператору А отвечает положительно полуопределенная (положительно определенная) матрица А. В этом ыожн о убедиться и непосредственно, сопоставляя определения 3 и 4 из § 11 гл. IX.
i'6] ПУЧОК КВАДРАТИЧНЫХ ФОРМ 281 § 6. Пучок квадратичных форм В теории малых колебаний приходится одновременно рассматривать две квадратичные формы, из которых одна задает потенциальную, а вто- вторая— кинетическую энергию системы. Вторая форма всегда является положительно определенной. Изучению системы двух таких форм мы посвящаем этот параграф. Две вещественные квадратичные формы п п А (ж, х) = 21 aikxixk, B{x, х)= 21 bikXiXk I, fc=l i, k=i определяют пучок форм А (х, х) — КВ(х, х) (Я—параметр). Если форма В (х, х) — положительно определенная, то пучок А (х, х) — — KB (х, х) называют регулярным. Уравнение \А—КВ\ = 0 называется характеристическим уравнением пучка форм А (х, х) — KB (ж, х). Обозначим через Яо какой-либо корень этого уравнения. Поскольку матрица А—%0В особенная, то существует столбец z = (%, z2, ...,H такой, что (A — K0B)z — 0 или Число Яо мы будем называть характеристическим числом пучка А(х, х)—KB (x, x), a z—соответствующим главным столбцом или ^глав- ^главным вектором» этого пучка. Имеет место следующая Теорема 8. Характеристическое уравнение регулярного пучка форм А (х, х) — KB (x, х) всегда имеет п вещественных корней Kh(k — 1, 2, ..., /г), которым соответствуют главные векторы zk = (zih, г», .... znh) (k=l, 2, ..., /г): Azh = KhBzk (Л = 1, 2, ..., /г). D9> Эти главные векторы zh могут быть выбраны так, чтобы выполнялись соотношениях) В(*, zh) = blk (i, Л = 1, 2, ..., /г). E0) Доказательство. Заметим, что равенства D9) могут быть запи- записаны так: Br*Azh = Khzh (к = 1, 2, .... п). D9') Таким образом, наша теорема утверждает, что матрица ?> = B-M E1) имеет: 1° простую структуру, 2° вещественные характеристические числа Яь Я2, ..., %п и 3° собственные столбцы (векторы) z1, z2, ..., zn, соот- соответствующие этим характеристическим числам и удовлетворяющие соот- соотношениям E0). !) Иногда говорит, что равенства E0) выражают собой ортонормированность векторов г\ ..., г5» в ^-метрике.
282 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Матрица D, являясь произведением двух симметрических матриц В~г и А, не обязательно сама должна быть симметрической, поскольку D — В'1 A, a D' ±= АВ'1. Однако, полагая F = \^В 1), из равенства E1) легко получаем: D^F^SF, E2) где S = F~1AF~1 E2') — симметрическая матрица. Из того, что матрица D подобна симметри- симметрической матрице S, сразу следуют утверждения 1° и 2°. Обозначая через uh(k = l, ..., п) пронормированную систему собственных векторов сим- симметрической матрицы S: Suk = Xhuk(k = l, ..., п), (uh)'ul^bkl(k, 1 = 1, .... и) E3) и полагая uh = Fzh (A=l, ..., п), E4) мы из равенств E2), E2'), E3), E4) найдем: Dzk = Kkz\ B(zk, zl) = (Zh)'Bzl = 8kl, где к, 1 = 1, ..., п, т. е. доказано утверждение 3°, и теорема 8 дока- доказана полностью. Заметим, что из E0) следует, что столбцы z1, z2, ..., zn линейно независимы. В самом деле, пусть S cftzft = 0. E5) h=l Тогда при любом г (l<!i<:n) согласно E0) Q = B{z\ 2 chzh)= 2 Таким образом, в E5) все a(i = l, 2, ...,п) равны нулю, и никакой линейной зависимости между столбцами z1, z2, ..., zn не существует. Квадратную матрицу, составленную из главных столбцов z1, z2, ..., zn, удовлетворяющих соотношениям E0), Z = (z\ z2, ...,*") = мы будем называть главной матрицей для пучка форм А (х, х) — — KB (х, х). Главная матрица Z—неособенная flZI^O), поскольку ее столбцы линейно независимы. Равенства E0) могут быть записаны так: zi'Bzk = bih (i, к = 1, 2, ..., п). E6) Кроме того, помножив обе части равенств D9) слева на строчную ма- матрицу zv, получим: zilAzh = lkzirBzk = lk6ik (i, к = 1, 2, ..., n). E7) Вводя главную матрицу Z = (z1, z2, ..., zn), мы равенства E6) и E7) можем представить в виде Z'AZ = I) %&h ||Г, Z'BZ^E. E8) Ч F—положительно определенная матрица (см. стр. 280). Поэтому \F\=fc0.
S 6] ПУЧОК КВАДРАТИЧНЫХ ФОРМ 283 Формулы E8) показывают, что неособенное преобразование х = Ъ\ E9) •одновременно приводит квадратичные формы А (ж, х) и В (х, х) к суммам квадратов: 2 2 а*б* и s й- F0) fci fti Это свойство преобразования E9) характеризует главную матрицу Z. Действительно, пусть преобразование E9) одновременно приводит формы А (х, х) и В (х, х) к каноническим видам F0). Тогда имеют место равен- равенства E8), а следовательно, для столбцов матрицы Z, E6) и E7). Из E8) следует неособенность матрицы Z (| Z | ф 0). Равенства же E7) перепи- перепишем так: **' {Azk — ХцВг*) = О (i = 1, 2, ..., n); F1) здесь к имеет произвольное фиксированное значение A-^.к^.п). Систему равенств F1) можно объединить в одно равенство: Z'(Azk — lhBzk) = 0, •откуда, поскольку Z' — неособенная матрица, т. е. при любом к получаем D9). Следовательно, Z — главная матрица. Нами доказана Теорема 9. Если 2 = ||2гь||™—главная матрица регулярного пучка форм А(х, х) — КВ(х, х), то преобразование x = Zl F2) приводит одновременно формы А (ж, ж) и В (ж, ж) соответственно к суммам квадратов 2 я*а, S &. F3) ft=i ft=l «Зе F3) Я,1, ^2. •••» Ki—характеристические числа пучка А(х, ж) — — КВ(х, х), соответствующие столбцам z1, z2, ..., zn матрицы Z. Обратно, если некоторое преобразование F2) одновременно переводит формы А{х, ж) и В (ж, х) к виду F3), mo Z = \\zik\$—главная матрица регулярного пучка форм А(х, х) — KB (х, х). Иногда характерное свойство преобразования F2), сформулированное в теореме 9, используется для построения главной матрицы и доказа- доказательства теоремы 81). Для этого сначала совершают преобразование пере- переменных х — Ту, приводящее форму В (х, х) к единичной сумме квадра- п тов 2 J/fc (чт0 всегда возможно, поскольку В (ж, ж)—положительно опре- деленная форма). При этом форма А (х, ж) переходит в некоторую форму 71 -4i(y. У)- Теперь форму А^у, у) приводят к виду 2 Ь-нШ при помощи ортогонального преобразования у — 0% (приведение к главным осям!). 1) См. [7], стр. 56—57.
284 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X п п При этом, очевидно1), 2 у\— 2 ?ь* Таким образом, преобразование a: = Zg, где Z = TO, приводит данные две формы к виду F3). Посла зтого показывают (как это было сделано на стр. 282), что столбцы z1, z2, ..., zn матрицы Z удовлетворяют соотношениям D9) и E0). В частном случае, когда В (х, х)— единичная форма, т. е. В(х, ж) = п = 2 ж* и> следовательно, В — Е, характеристическое уравнение пучка ь1 1 А (ж, х) — кВ (ж, х) совпадает с характеристическим уравнением матрицы Ау а главные векторы пучка становятся собственными векторами матрицы А. В зтом случае соотношения E0) записываются так: zl'zk = бгь (i, к = = 1, 2, ..., п), и выражают ортонормированность столбцов z1, z2, ..., zn. Теоремы 8 и 9 допускают наглядную геометрическую интерпрета- интерпретацию. Введем евклидово пространство М с базисом е4, е2, ..., еп и основ- основной метрической формой В (х, х). Рассмотрим в jR центральную гиперповерхность второго порядка, уравнение которой п А(х, x)ss 2 aikXiXk = c. F4) После преобразования координат x = Z\, где Z = ||zift||?—главная матрица пучка А (х, х) — ХВ (х, х), новыми базисными векторами являются векторы z1, z2, ..., zn, координаты которых в старом базисе составляют столбцы матрицы Z, т. е. главные векторы пучка. Эти векторы образуют ортонормированный базис, в котором уравнение гиперповерхности F4) имеет вид п AfcSA = С. (DO/ Следовательно, главные векторы пучка z1, zs, ..., zn совпадают по напра- направлению с главными осями гиперповерхности F4), а характеристические числа пучка Я*, Я,2, ..., Я„ определяют величины полуосей: Я* = ±-^~ % (к = 1, 2, ..., п). Таким образом, задача определения характеристических чисел и глав- главных векторов регулярного пучка форм А(х, х)—Ш(х, х) эквивалентна задаче приведения к главным осям уравнения F4) центральной гипер- гиперповерхности второго порядка в том случае, когда уравнение гиперповерх- гиперповерхности задано в обобщенной косоугольной системе координат2), в которой «единичная сфера» имеет уравнение В(х, x) — i. Пример. Дано уравнение поверхности второго порядка 2z2—2y2_3z2— i0yz+2xz—4=0 F6) в обобщенной косоугольной системе координат, в которой уравнение единичной сферы 2z24-3y2+2z2 _|_2жя=1. F7) Требуется уравнение F6) привести к главным осям. *) Ортогональные преобразования не меняют суммы квадратов ^временных, поскольку (Ох)' Ох=х'х. 2) То есть косоугольная система координат с различными масштабами длин вдоль осей.
§6] ПУЧОК КВАДРАТИЧНЫХ ФОРМ 285 2 0 1 0 3 0 1 0 2 В данном случае 2 0 1 0 —2 —5 , В= 1 —5 —3 Характеристическое уравнение пучка \А—Я?|=0 имеет вщ 2— 2Х О 1-Я О —2—ЗЯ —5 =0. 1_Я —5 — 3— 2% F8) Это уравнение имеет три корня: A.i=lt Я2=1, Яз=—4. Координаты главного вектора, соответствующего характеристическому числу 1, обозначим через u, v, w. Величины u, v, w определяются из системы однородных уравнений, коэффициенты которых совпадают с элементами определителя F8) при Я=1: 0-u-\-0-v+0-w=0, 0-и—5v—5u>=0, 0-u—5v—5w=0. Фактически мы здесь имеем лишь одно соотношение v-{-w=0. Характеристическому числу Я=1 должны отвечать два ортонормированных глав- главных вектора. Координаты первого можем выбрать произвольно, лишь бы выпол- выполнялось условие v-\-w=0. Выберем их так: и=0, v, w, где w=—v. Координаты второго главного вектора возьмем в виде и', v', w', где ю'=—v', и запишем условие ортогональности [Biz1, z2)=0]: 2ыи'+3vv'+'2ww' + uw'+u'w=0. Отсюда найдем: и' = 5р'. Таким образом, координаты второго главного вектора u'-=bv', v', w' = — v'. Аналогично, .полагая в характеристическом определителе Я=—4, найдем для соответствующего главного вектора: к", d"=—к" " = —2u". Величины v, v' и и" определяются из условия: координаты главного вектора должны удовлетворять уравнению единичной сферы [В (х, *)==!], т. е. уравне- уравнению F7). Отсюда находим: Поэтому главная матрица имеет вид V? 1/5 31/5 3 - и соответствующее преобразование координат (z=Z?) приводит уравнения F6) и F7) к каноническому виду
286 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Первое уравнение может быть еще записано так: ?2 Е2 Е2 51 I _62 63^ .л 4 "^ 4 1 Это— уравнение однополостного гиперболоида вращения с вещественной полу- полуосью, равной 2, и мнимой, равной 1. Координаты орта оси вращения определяются 112 третьим столбцом матрицы Z, т. е. равны -тг-, -q-, -д-. Координаты ортов других о о о двух ортогональных осей задаются первым и вторым столбцами. § 7. Экстремальные свойства характеристических чисел регулярного пучка форм1) 1. Пусть даны две квадратичные формы: п п А(х, х) = 2 «г/даъ и В(х, ж) = 2 bthXiXh, г, ft=i i, ft=i причем форма В(х, х)—положительно определенная. Характеристические числа регулярного пучка форм А (х, x)—kB(v, x) занумеруем так, чтобы они шли в неубывающем порядке: F9) Соответствующие этим характеристическим числам главные векторы2) по-прежнему будем обозначать через z1, z2, ..., zn: 2=1, 2, ...,П. Л (х x) Определим наименьшее значение (минимум) отношения форм -^7-^—г , В (х, х) рассматривая все возможные значения переменных, не равные одновре- одновременно нулю (хфО). Для этого удобно перейти к новым переменным ii, ?2. • • • > ?п при помощи преобразования x = Zl (xt= 2 ««Б*; * = 1, 2, ..., п), fei 2 fe=i где Z = || Zjfc ||?—главная матрица пучка А (х, х) — КВ(х, х). В новых переменных отношение форм представится в виде [см. F3)] Возьмем на числовой оси п точек Я4, "к^, ...,Кп. Припишем зтим точкам соответственно неотрицательные массы тг = gj, т2 = \\, ..., тп = g?. Тогда согласно формуле G0) отношение р, ж; будет числовой коорди- а ух, X) натой центра этих масс. Поэтому . А(х,х) Отбрасывая временно вторую часть неравенства, выясним, когда в первой части имеет место знак равенства. Для этого выделим в F9) г) При изложении этого параграфа мы следуем книге [7], § 10. 2) Здесь мы употребляем термин «главный вектор» в смысле главного столбца пучка. См. стр. 281. Вообще в этом параграфе, имея в виду геометрическую интер- интерпретацию (см.. стр. 284), мы часто столбец будем называть вектором.
§ 7] ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА СПЕКТРА РЕГУЛЯРНОГО ПУЧКА ФОРМ 287 группы равных характеристических чисел: ^i = • • • = ^р, < Vj+i = • • - = Кг+р2 < • • • G1) Центр масс может совпадать с крайней точкой Xt лишь в том слу- случае, когда все массы вне этой точки равны нулю, т. е. когда В этом случае соответствующее х будет линейной комбинацией главных столбцов z1, z2, ..., z^iг). Поскольку все эти столбцы отвечают характе- характеристическим числам, равным ки то я х будет главным столбцом (векто- (вектором) для А, = А,4. Нами доказана Теорема 10. Наименьшее характеристическое число регулярного пучка А (х, х) — КБ (х, х) является минимумом отношения форм А (х, х) и В(х, х) причем этот минимум достигается только на векторах, являющихся главными для характеристического числа А,4. 2. Для того чтобы дать аналогичную «минимальную» характеристику для следующего характеристического числа Х2, ограничимся рассмотре- рассмотрением всех векторов х, ортогональных к z1, т. е. удовлетворяющих урав- уравнению 2) Biz1, x) = 0. Для этих векторов А(х,х) в(х,х) и, следовательно, При этом знак равенства достигается только на тех векторах, ортого- ортогональных к z%, которые являются главными для характеристического числа "К2- Переходя к дальнейшим характеристическим числам, мы в конце концов получим следующую теорему: Теорема 11. При любом p(l<p<!n) р-е по величине харак- характеристическое число Хр в ряду F9) является минимумом отношения в х) Из x—ZZ, следует: х= 2 lhzk- fe=l 2) Здесь и дальше под ортогональностью двух векторов (столбцов) х, у мы будем понимать ортогональность в .В-метрике, т. е. равенство В(х, у)=0. Это нахо- находится в полном соответствии с геометрической интерпретацией, данной в преды- предыдущем параграфе. Мы рассматриваем величины хи х2, ...,хп как координаты вектора ж в некотором базисе евклидова пространства, в котором квадрат длины п (норма) вектора задается положительно определенной формой В(х, х)= 2 hkxixk- В этой метрике векторы z1, z2, ..., zn образуют ортонормированный базис. Поэтому п если вектор х= 2 bhzk ортогонален к одному из zh, то соответствующее gfc=0.
288 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X форм Л{*х\ G3) В(х, х) при условии, что варьируемый вектор х ортогонален к первым р — 1 ¦ортонормированным главным векторам z1, z2, ..., zv~x\ B(z\x) = 0,...,B(zp-\z) = 0. G4) При этом минимум достигается только на тех векторах, которые удовлетворяют условию G4) и являются одновременно главными векто- векторами для характеристического числа Яр. 3. Характеристика числа Кр, данная в теореме 11, имеет то неудобство, что она связана с предыдущими главными векторами z1, z2, ..., zp-1 и, следовательно, может быть использована только тогда, когда эти век- векторы известны. Кроме того, в выборе этих векторов имеется известный произвол. Для того чтобы дать характеристику числа Кр(р = 1,2, ..., п), сво- свободную от указанных недостатков, мы введем понятие о связях, нало- наложенных на переменные хи х2, • •.-, а^. Пусть даны линейные формы от" переменных хи х2,, ..., Zni Lh (x) = llhxt + l2hx2 + ... + lnhxn (k = 1, 2, ..., h). G4') Мы будем говорить, что на переменные хи х2, ..., х„, или (что то же) на вектор х наложены h связей Lit L2, • • •, Lh, если рассматриваются лишь значения переменных, удовлетворяющие системе уравнений Lk(x) = 0 (&=l, 2, .... Л). G4") Сохраняя обозначения G4') для произвольных линейных форм, мы введем специализированные обозначения для «скалярных произведений» вектора х на главные векторы z1, z2, ..., zn: Lk (x) = B(z\ x) (ft = 1, 2 it) i). G5) Кроме того, в случае, когда на варьируемый вектор наложены связи G4"), будем обозначать шш „,' х]. так: J3 (X, X) ц у~2 ; Lu Lz, ..., LhJ . В этих обозначениях равенство G3) запишется так: ZUL\, ...,Zp_i) (p=l, 2, ...,в). G6) Рассмотрим связи Ьг(х) = 0,...,Ь^(х) = 0 G7) и Ерн(*) = 0, ...,!*(*) = 0. G8) Поскольку число связей G7) и G8) меньше п, то существует вектор ха)ф0, удовлетворяющий одновременно всем этим связям. Так как связи G8) выражают ортогональность вектора х к главным векторам 1) tk (х)=zh'^Bx =Т1даг1 +T2hx2 + ... + Wn. где Tih, T2k, .... Tnk — элементы строчной матрицы zh'B(k=l, 2, ..., п).
S 7] ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА СПЕКТРА РЕГУЛЯРНОГО ПУЧКА ФОРМ 289 zv+1, ..., zn, то соответствующие вектору ха) координаты ?р+1 ==...= |п = 0. Поэтому согласно G0) 65 Но тогда Это неравенство в соединении с G6) показывает, что при варьиро- варьировании связей Lu L2, ..., Lp-i величина ц остается ^Яр и достигает Кр, если взять специализированные связи Lu L2, ..-, Lv-X. Нами доказана Теорема 12. Если мы рассмотрим минимум отношения двух форм , ' х\- при.произвольных р — 1 связях Lu L2, ..., Lp-t и будем варъи- роватъ связи, то максимум этих минимумов будет равен Хр: jf\ Lu Lz, ..., Lp-^ (p = l, .... n). G9) Теорема 12 дает «максимально-минимальную» характеристику числам A,j, %2, • • •, Ki в отличие от «минимальной» характеристики, о которой идет речь в теореме 11. 4. Заметим, что при замене формы А (х, х) в пучке А (х, х) — — КБ (х, х) на форму — А (х, х) все характеристические числа пучка меняют знак, а соответствующие главные векторы остаются неизменными. Таким образом, характеристическими числами пучка — А (х, х) — "кВ (х, х) являются числа —Я„<! —Kn-i ^ ... ^ —^i- Кроме того, обозначая через 44'L"^ ^)enmx5fiHo (80) в случае, когда на варьируемый вектор наложены связи Lu L2, ..., Lh, мы сможем написать: М- ( — -g ; Lu L2, ..., Lh J = — v ( -g-; Lj, L2, ..., Lhj и —-g-; Lx, L2, ..., LhJ= —minv (-g-; Lu L2, .... LhJ . Поэтому, применяя к отношению —^г-1—f- теоремы 10, 11, 12, мы Л (X, X) вместо формул G2), G6), G9) получим формулы (х, х) i-p+l = v ( "Б" i L>nt L'n-i, • • • j Ln-p+2 J , A g-; Lj, L2, ..., Эти формулы устанавливают соответственно «максимальные» и «мини- «минимально-максимальные» свойства чисел Kif A,2, ..., Х„, которые мы сформу- сформулируем в виде следующей теоремы: Теорема 13. Пусть характеристическим числам Л j - 19 ф. р. гантмахер
290 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X регулярного пучка форм А (х, х) — KB (x, х) соответствуют линейна независимые главные векторы пучка z1, z2, , zn. Тогда 1) Наибольшее характеристическое число Кп является максимумом отношения форм причем этот максимум достигается только на главных векторах пучка, соответствующих характеристическому числу %п. 2) р-е (с конца) характеристическое число Яп^р+1 B<:р-<п) является, максимумом того же отношения форм ^? (82) при условии, что на варьируемый вектор х наложены связи: В (zn, х) = 0, В (zn~\ х) = 0, .... В (гп~™, х) = 0, (83) т. ё. ^п-р+1 = v i -g ; Ln, Ln-i, ..., Ьп-р+2) ; (84) этот максимум достигается только на главных векторах пучка, соот- соответствующих характеристическому числу Х„_р+1 и удовлетворяющих связям (83). 3) Если е максимуме отношения форм J ' при связях варьировать связи, то наименьшее значение (минимум) этого максимума равно А^-р-ц: J-; Lu L2, .... L^). (85) 5. Пусть даны h независимых связей1) L\ (x) = 0, L°2 (x) = 0, ..., L°h (x) = 0. (86) Тогда из них можно выразить h из переменных xit х2, ..., хп через осталь- остальные переменные, которые мы обозначим буквами vu v2, , vn^h. Поэтому при наложении связей (86) регулярный пучок форм А (х, х) — %В (х, х) переходит в пучок A°(v, v) — XB°(v, v), причем B°(v, у) —снова положи- положительно определенная форма (только от п—h переменных). Полученный таким образом регулярный пучок имеет п—h вещественных характери- характеристических чисел При наложении связей (86) можно по-разному выразить все перемен- переменные через n—h независимых vu v2, ..., vn-h- Однако характеристические числа (87) не зависят от этого произвола и имеют вполне определенные значения. Это следует хотя бы из максимально-минимальных свойств Ч Связи (86) являются независимыми, когда независимы линейные формы l\{x), lI(x), ..., Lh(x), стоящие в левых частях уравнений связей.
§ 7], ЭКСТРЕМАЛЬНЫЕ СВОЙСТВА СПЕКТРА РЕГУЛЯРНОГО ПУЧКА ФОРМ 291 характеристических чисел и вообще = тахц;Г-рЗ-; Lu Ьг, ..., ; b\, ..., L°h; Llt ..., Lp_^ , (89) при этом в формуле (89) варьируются только связи Lu L2, ..., ?p-i. Имеет место Теорема 14. Если А,4^А,2^ ¦.. ^Кп—характеристические числа регулярного пучка форм А (%, х) — ХВ (х, х), a A,i<A,2< ... <А?_Л— характеристические числа того же пучка при наложении h независимых связей, то lP<K<K±h (p=i, 2, .... n-h). (90) Доказательство. Неравенства А,р<Хр(р= 1, 2, ..., п—h) сразу следуют из формул G9). и (89). Действительно, при добавлении новых связей величина минимума ц ( -=-; Lu ...,[?p_i ) увеличивается или остается прежней.' Поэтому М- ( -g \ Lu ..., LP-1J ^fx f —; L\, ..., Lh;.Lu ..., Отсюда A,p = max[i^-g-; Lu ..., ip_!j<Xp = = max[x(A; il ...,L°h; Lu ...,LP Вторые части неравенств (90) имеют место в силу соотношений Кр = max [i ( -g-; Lj, ...jL/,; Lj, ...,^ " * / A " < max fx ^-g-; Lu ..., L^j, Lp, ..., Здесь в правой насти варьируются не только связи Lu , Ьр_4, но и связи Lp, ..., Lp+h-u в левой же части последние связи заменены фиксирован- фиксированными связями L°i, ..., L°. Теорема доказана. 6. Пусть даны два регулярных пучка форм А (х, х) — КБ (х, х), А(х, х) — IB (x, х) (91) и пусть при любом х Ф 0 А (х, х) А(х, х) В(х, х) ¦"- дB.) ж) Тогда, очевидно, ; Lu Lz, ..., Lp_1^)<maxfx ^-4-; Lu L2, ..., Lp-Л (p=l,-2, ....и). 19*
292 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Поэтому, обозначая через Хг^.Х2^... <Я„ и Xi^.Xz^... . <1Я„ соответ- соответственно характеристические числа пучков (91), будем иметь: Таким образом, доказана Теорема 15. Если даны два регулярных пучка форм А(х, х) — — ХВ (х, х) и А (х, х) — ХВ (х, х) с характеристическими числами соот- соответственно Aj<;X2<I... -<ХП и Ki^.%2^. <!ЯП, то из тождественного соотношения А (х, х) А(х, х) -Щ^Т*)^ В(х, х) следует: К<К (Р = 1,2, ...,п). (93) Рассмотрим частный случай, когда в неравенстве (92) В (х, х) =э В (х, х). В этом случае разность А (х, х) — А (х, х) является неотрицательной квад- квадратичной формой и поэтому может быть представлена в виде суммы неза- независимых положительных квадратов: А(х, х) = А(х, х) + SftW- i=l Тогда при наложении г независимых связей Х1(х) = 0, Х2(х) = 0,...,Хг(х) = 0 формы А (х, х) и А (х, х) совпадают, и пучки А (х, х) — KB {x, х) и А (х, х)— — ХВ (х, х) имеют одни и те же характеристические числа Применяя теорему 14 к каждому из пучков А (х, х) — ХВ (х, х) и А (х, х)—ХВ(х, х), будем иметь: lP<^p<Vr (P = l, 2, ..., п — г). Присоединяя сюда неравенство (93), приходим к теореме: Теорема 16. Если Х1^.Х2^ ... <1Х„ и Xi^.X2^.... <ХП — харак- характеристические числа двух регулярных пучков форм А(х, х) — ХВ(х, х) и А(х, х) — ХВ(х, х), где a Xt(x) (i — l,2, ..., г) — независимые линейные формы, то имеют место неравенства г) К<К<Ьр+г (р= 1, 2, ..., п). (94) Совершенно аналогично доказывается Теорема 17. Если Х1^.Х2^.... <!ХП и Х1^.Х2^.... <!ЯП — харак- характеристические числа регулярных пучков форм А (х, х) — ХВ (х, х), и А (х, х) — Вторые части этих неравенств имеют место только при р << п—г.
§ 8] МАЛЫЕ КОЛЕБАНИЯ СИСТЕМЫ С п СТЕПЕНЯМИ СВОБОДЫ 293 — "KB (х,х), где форма В(х, х) получается из В(х, х) прибавлением г поло- положительных квадратов, то имеют место неравенствах) (Р = 1, 2, ..., и). (95) Замечание. В теоремах 16 и 17 можно утверждать, что при неко- некотором р имеем %р<Скр (соответственно КР<СХР), если, конечно, г^=0а). § 8. Малые колебания системы с п степенями свободы Результаты предыдущих двух параграфов имеют важные приложения в теории малых колебаний механической системы с п степенями свободы. Рассмотрим свободные колебания консервативной механической систе- системы с п степенями свободы вблизи ее устойчивого положения равновесия. Отклонение системы от положения равновесия будем задавать при помощи независимых обобщенных координат qu q2, ..., qn. Само положение равно- равновесия при этом соответствует нулевым значениям этих координат: <7i = 0, q2 = О, ..., qn = 0. Тогда кинетическая энергия системы представится в виде квадратичной формы относительно обобщенных скоростей bik (qu ?2» • • •, qn) Разлагая коэффициенты fc,-ft (gu q2, ..., qn) в ряд по степеням qu q2, ..., qn, bih{qu Яг, ...,qn) = bih+... (i, k = l, 2, ...,n) и сохраняя (ввиду малости отклонений qu q2, ..., qn) только постоянные члены bth, будем иметь: п ^=2 btkqtqk (bik=bM; i, A=l, 2, ...,n). i, fe=l Кинетическая.энергия всегда положительна и обращается в нуль только при нулевых скоростях q± = q2= ... —qn — 0. Поэтому У Ь^д,-о^ — поло- жительно определенная форма. Потенциальная энергия системы является функцией от координат: П (<7i, q2, ..., qn)- Не нарушая общности, можем принять По = = П @, 0, ..., 0) = 0. Тогда, разлагая потенциальную энергию в ряд по степеням qu q2, ..., qn, получим: и it- П = 2 ai4t + 2 Поскольку в положении равновесия потенциальная энергия всегда имеет стационарное значение, то Первые части неравенств имеют место при р > г. 2) См. [7], стр. 71—73. 3) Точкой мы обозначаем производную по времени. ) 3)
•294 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Сохраняя только члены второго порядка относительно qu q2, ..., qn, мы будем иметь: п П = 2 «iftMft («ift = o-ht; i,k = l,2, .... n). i, ft=l Таким образом, потенциальная энергия П и кинетическая энергия Т определяются двумя квадратичными формами: aihqiqh, Г= 2 bihqiqhl (96) i fei причем вторая форма — положительно определенная. Напишем теперь дифференциальные уравнения движения в форме уравнений Лагранжа второго рода1): {ii г п) Подставляя сюда вместо Т и П их выражения из (96), получаем: 2 Ьа'д\ + 2 а*9* = 0 (А = 1, 2, .... п). (98) Вводя в рассмотрение вещественные симметрические матрицы A = \\aik\\r; и B = ||bift|!i и столбцовую матрицу g = (gi, S2. ¦••,?п), мы систему уравнений (98) можем записать в следующей матричной форме: Вд + Ад = 0. (98') Будем искать решения системы (98) в виде-гармонических колебаний q± = vt sin (at -f a), g2 = y2 sin (tof + a), ..., qn = i>n sin (tof + a); в матричной записи g = v sin (tof + a). (99) Здесь v = (vu v2, ..., vn) — постоянный амплитудный столбец («вектор»), со — частота и a — начальная фаза колебаний. Подставляя выражение (99) для q в (98'), получим после сокращения на sin (at + a): Но это уравнение совпадает с уравнением D9). Следовательно, искомый амплитудный вектор является главным вектором, а квадрат частоты Я, = р2—соответствующим характеристическим числом регулярного пучка форм А (х, х) — "кВ (х, х). Мы наложим на потенциальную энергию дополнительное ограниче- ограничение, потребовав, чтобы функция П (qu q2, . ¦., qn) B положении равно- равновесия имела строгий минимум2). х) См., например, Г. К. Суслов, Теоретическая механика, § 191 или Ф. Р. Г а н т м а х е р, Лекции по' аналитической механике, § 6. 2) То есть чтобы значение По в положении равновесия было меньше всех других значений функции в некоторой окрестности положения равновесия.
§ 8] МАЛЫЕ КОЛЕБАНИЯ СИСТЕМЫ С п СТЕПЕНЯМИ СВОБОДЫ 295 Тогда на основании теоремы Лежен-Дирихлех) положение равновесия системы будет устойчивым. С другой стороны, сделанное нами допущение означает, что квадратичная форма П=А(д, q) также является положи- положительно определенной. Согласно теореме 8 pefулярный пучок форм А (х, х) — КБ (х, х) имеет п вещественных характеристических чисел hu Я2, ..., Кп и п соответствую- соответствующих этим числам главных векторов у1, у2, ..., vn [vk = (ylft, v2h, - - -, vnk); к — 1, 2, ..., n], удовлетворяющих условиям В (v\ vk) = 2 b^tvvk = 8ik (i, к = 1, 2, ..., n). A00) Ц, V=l Из положительной определенности формы А (х, х) следует, что все характеристические числа пучка А (х, х) — ХВ(х, х) положительны2): Но тогда существует п гармонических колебаний3) (a* = a*, & = 1,2, ...,n), A01) амплитудные векторы которых vh = (vlh, v^, ...,vnfl) (к=1, 2, ...,n) удовлетворяют условиям «ортонормированности» A00). В силу линейности уравнения (98') произвольное колебание может быть лолучено наложением гармонических колебаний A01): ?= S Лк sin (Okt + ah) vh, A02) fei где Ak, ak(k = l,2, ...... n) — произвольные постоянные. Действительно, при любых значениях этих постоянных выражение A02) является реше- решением уравнения (98'). С другой стороны, за счет произвольных постоян- постоянных можно удовлетворить любым начальным условиям: В самом деле, из A02) находим: п # п ?о= S Ahsinakvh, go= S ®кАк cos akvh. A03) fei fei Поскольку главные столбцы v1, vz, ..., vn всегда линейно независимы, то из равенств A03) однозначно определяются величины /4fesinafe и (Ofe^ftcosccfc (к = 1, 2, ..., п) и, следовательно, произвольные постоянные Ak и ak (ft = l, 2, ..., п). Решение A02) нашей системы дифференциальных уравнений (98) может быть более подробно записано так: 2 ( + )ih. A04) А— 1 Заметим, что к тем же формулам A02), A04) можно прийти, исходя из теоремы 9. Действительно, рассмотрим неособенное преобразование х) См. Г. К. Суслов, Теоретическая механика, § 210; Ф. Р. Гантмахер, Лекпии по аналитической механике, § 33. 2) Это следует хотя бы из представления F3). 8) Здесь начальные фазы аи (fc=l-, 2, ..., п)—произвольные постоянные.
296 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X переменных с матрицей F = ||i;jfe||", приводящее одновременно обе формы Л (х, х) и В (х, х) к каноническому виду F3). Полагая ?i = 2 vihQh (i = 1, 2, .... в) A05) ti.— I или в сокращенной записи g=ve [в=(в1)е2, ...,en)i (Юб) и замечая, что q = VQ, будем иметь: П = А (д, д) = 2 ХМ, Т = B\(q, д) = 2 0|. A07) il fcl Координаты 0i, 02, • • •, ©п. в которых потенциальная и кинетическая энергии представляются в виде A07), называются нормальными коорди- координатами. Воспользуемся уравнениями Лагранжа второго рода (98), подставив в них вместо П и Т их выражения A07). Получим: = 0 (Л = 1, 2, .... в). A08) Поскольку форма A(g,q)—положительно определенная, то все числа К, ^2, •••, кп положительны и могут быть представлены в виде Я* = ©| (tofe>O; Л=1, 2, ...,п). A09) Из A07) и A08) находим: 0fe = Asin(cofef+afc) (Л = 1, 2, ...,п). A10) Подставляя эти выражения для 0^ в равенства A05), получим снова формулы A04) и, следовательно, A02). Величины vih (г, А; = 1,2, ...,п) при обоих выводах будут одни и те же, поскольку согласно теореме 9 матрица F=||i^fc||" в A06) есть главная матрица регулярного пучка форм А (ж, х)—ХВ(х, х). Отметим еще механическую интерпретацию теорем 14 и 15. Занумеруем частоты сй±, <в2, - • •, <вп данной механической системы в порядке неубывания: Этим определится и расположение соответствующих характеристических чисел Яй = со|(А=1, 2, ..., п) пучка А (х, х) — ХВ(х, х): Наложим на данную систему h независимых конечных стационарных связей1). Поскольку отклонения qu q2, ..., qn считаются малыми вели- величинами, то эти связи можно считать линейными относительно qit qz, ..., qn: Li(g) = O, L2(g) = 0, ..., Lh(q) = O. После наложения связей наша система будет иметь п—h степеней свободы. Частоты этой системы х) Конечная стационарная связь выражается уравнением jf(gj, q%, ..., gn)=0r гДе /(9i> 92, •••> Qn)—некоторая функция от обобщенных координат.
§ 9] эрмитовы формы 297 связаны с характеристическими числами AJ^Ag^! ... *CK°n-h пучка А ХВ L L Ь р Jg А(х,х) — ХВ(х,х) при наложении связей Lu L2, ..., Ьн соотношениями Я^ = (о°- (/ = 1,2, ...,п—/г). Поэтому из теоремы 14 непосредственно- еле дует: 5 (/ = 1, 2, ..., n — h). Таким образом, при наложении h связей частоты системы могут только увеличиться, однако при этом величина новой j-й частоты toj не может превзойти величины прежней (/ + /г)-м частоты (о^. Точно так же на основании теоремы 15 можно утверждать, что при увеличении жесткости системы, т. е. при увеличении формы А (д, д)- для потенциальной энергии [без изменения формы В (q, g)], частоты могут только увеличиться, а при увеличении инерции системы, т. е. при увели- увеличении формы B{g, q) для кинетической энергии {без изменения формы A (g, q)], частоты могут только уменьшиться. Теоремы 16 и 17 вносят дополнительное уточнение в это положение.. § 9. Эрмитовы формы1) Все результаты §§ 1 — 7 Этой главы, установленные для веществен- вещественных квадратичных форм, могут быть перенесены на эрмитовы формы. Напомним2), что эрмитовой формой называется выражение п Н(х,х)= 2 hihxtxh (hth = hht; /c = 1, 2, ..., п). i, ft=l Эрмитовой форме A11) соответствует следующая билинейная эрмитова форма: Н(х,у)= 2 hihxtyh; при этом Н(у,х) = Н(х,у) и, в частности, Н(х,х) = Н(х,х), A13') т. е. форма Н (х, х) принимает только вещественные значения. Матрица коэффициентов эрмитовой формы Н = || htu ||" является эрми- эрмитовой, т. е. Н* = Н3). Пользуясь матрицей Н = || Пц,. ||", можно представить Н (х, у) и, в част- частности, Я (ж, х) в виде произведения трех матриц—строчной, квадратной и столбцевой: Н(х, у) = х'Ну, Н(х, х) = х'Нх% A14) !) В предыдущих параграфах все числа и переменные были вещественными.. В этом же параграфе все числа и переменные принимают комплексные значения. 2) См. гл. IX, § 2. 3) Звездочкой * мы отмечаем переход к сопряженной матрице (см. гл. J, § 3). _ *) Здесь х=х(хи хг,...,хп), x=(xlt x2,...,xn), y—{yi, yz Уп), У={У\ + г/2» > Уп)\ значок ' означает транспонирование.
298 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X т х =2<>|И*, »=Ё^, A15) Если где и4, yh — столбцовые матрицы, си dh—комплексные числа (i = l, 2, ... . ..,/га; k=l, 2, ..., р), то т. р н{х, У)= 2 2 сДдк i^). (lie) Подвергнем переменные set, а;2, • • •> %п линейному преобразованию *f=2*u& (i=l, 2, ...,в), A17) fe=i или в матричной записи х=П (Т = Ц*» Ю- A17') После преобразования йрмитова форма Я (ж, а;) примет вид на, а= s л«б&, i, fe=l где матрица новых коэффициентов H=\\hih\\" связана с матрицей старых коэффициентов Н = || hth ||" формулой Н = Т'НТ. A18) В этом непосредственно убеждаемся после замены во второй формуле A14) х на Т\. _ Если положить T = W, то формулу A18) можно еще переписать так: H = W*HW. A19) Из формулы A18) следует, что ранги матриц Я и Я равны, если преобразование A17) — неособенное (| 71=7^=0). Ранг матрицы Я называется рангом формы Н {х, х). Определитель | Я | называется дискриминантом эрмитовой формы Я (х, х). Из A18) следует формула преобразования дискриминанта при переходе к новым переменным: \Н\ = \Н\\Т\\Т\. Эрмитова форма называется сингулярной, если ее дискриминант равен нулю. Очевидно, сингулярная форма остается сингулярной при любом преобразовании переменных A17). Эрмитову форму Н (х, х) можно бесчисленным множеством способов представить в виде H(x,x)=j]aiXiXi, A20) тде а^фО (t = l, 2, ..., г) — вещественные числа, а Хг=2 aikxk (i = l, 2, ...,r) й=1 — независимые комплексные линейные формы от переменных хи хг, ..., хп *). х) Следовательно, г <^ п.
I 9] эрмитовы формы 299 Правую часть в A20) будем называть суммой независимых квадра- квадратов1), а каждое слагаемое в этой сумме—положительным или отрица- отрицательным квадратом в зависимости от того, соответствующее щ > 0 или <0. Как и для квадратичных форм, число г в A20) равно рангу формы Н (х, х). Теорема 18 (закон инерции эрмитовых форм). При представлении эрмитовой формы Н (х, х) в виде суммы независимых квадратов Н(х, х) =S aiXtXi i=l число положительных и число отрицательных квадратов не зависят от способа представления. Доказательство совершенно аналогично доказательству теоремы 1 (стр. 270). Разность а между числом я положительных и числом v отрицательных квадратов в A20) называется сигнатурой эрмитовой формы Н (х, х): а~я — v. Метод Лагранжа приведения квадратичных форм к сумме квадратов может быть использован и для эрмитовых форм, только при этом основ- основные формулы A5) и A6) на стр. 271 должны быть заменены формулами2) п Н (х, х) = ± | ^ hhexh |2 + Н, (х, х), A21) A22) n Пусть теперь для эрмитовой формы Н (х, х)= 2 ЫъР&ь. ранга г i fe1 выполняются неравенства 2 ... Тогда совершенно так же, как и для квадратичной формы (см. стр. 273—274), получаем формулу Якоби в двух видах: %jg- XhXh, Н (х, х) = 2 T^k {Do = f)' ь=1 fc= где = -щ- Yh, Yh = chhxh + cfe) fe+1a:fc + ... + cfena^ (A; = 1 r), A25) = -ffA;"fcZl ft) (? = *.* + * n; ft = l r). A26) x) Эта терминология связана с тем, что произведение XiXi равно квадрату модуля Хг (ХгХг=|Хг|2). 2) Формула A21) применяется в случае, когда hgg фО, а формула A22)—в слу- случае, когда hff—hss=O, a hfg Ф 0.
300 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X В соответствии с формулой Якоби A24) число отрицательных квад- квадратов в представлении формы Н (х, х) равно числу знакоперемен в ряду 1, Du В2, ...,Dr v = F(l, Dit ?>2, ...,DT) A27) и, следовательно, сигнатура о эрмитовой формы Н (х, х) определится формулой <r = r-2F(l, Du D2, ..., Dr). A28) Все замечания относительно особых случаев, которые могут здесь представиться, сделанные для квадратичных форм (§ 3), автоматически переносятся на эрмитовы формы. п Определение 5. Эрмитова форма Н (х, х) — 2 Ыня&к называется i,h=l неотрицательной (неположительной), если при любых значениях пере- переменных Н (х, ж)>0 (соответственно <0). п Определение 6. Эрмитова форма Н(х, х)~ 2 ЫъР&ь называет- i, ft=l ся положительно определенной (отрицательно определенной), если при любых значениях переменных хи xz, ..., Хп, не равных одновременно нулю, Н (х, х) > 0 (соответственно -< 0). Теорема 19. Для того чтобы эрмитова форма Н(х, ж) = п = 2 hihxixh была положительно определенной, необходимо и доста- i, fe=l точно, чтобы имели место неравенства 1 2 ... к\ 2... k)>Q (*=*. 2. •••.«)• A29> Теорема 20. Для того чтобы эрмитова форма Н (х, х)= 2 i, fe=i была неотрицательной, необходимо и достаточно, чтобы все главные миноры матрицы Н — || hih ||? были неотрицательны: Н (J1 !2 '"" ]Р) > 0 (ilf iz, ..., ip = 1, 2, ..., n; p= 1, 2, ..., в). A30) Доказательство теорем 19 и 20 совершенно аналогично доказа- доказательству теорем 3 и 4 для квадратичных форм. Условия отрицательной определенности и неположительности эрми- эрмитовой формы Н (х, х) получаются соответственно из условий A29) и A30), если последние применить к форме —Н (х, х). Из теоремы 5' главы IX (стр. 248) следует теорема о приве- приведении эрмитовой формы к главным осям: п Теорема 21. Эрмитова форма Н(х, х)— 2 НлЩХъ. всегда может i,k=l быть приведена при помощи унитарного преобразования переменных x = U\ (UU* = E) A31)
§ 10] ГАНКЕЛЕВЫ ФОРМЫ 301 к канонической форме 2Шг; A32) 2 при этом Хи А2, .. -, hi — характеристические числа матрицы Н = || hih ||"- Справедливость теоремы 21 вытекает из формулы Н = U 1| kt8ih || U-1 = Г || ХАъ || f (С/' = U-*- = Г). A33) и Пусть даны две эрмитовы формы Н(х, ж) = 2 hutP&k и С(ж, а;) = i fcl n = 2 eihxixh- Рассмотрим пучок эрмитовых форм Я (а;, а;) — XG(x, х) i, fc=l (Я, — вещественный параметр). Этот пучок называется регулярным, если форма G (х, х) — положительно определенная. При помощи эрмитовых матриц Я = ||Лгл||" и G = || gift ||" составим уравнение \Н—XG| = O. Это уравнение называется характеристическим уравнением пучка эрмитовых форм. Корни этого уравнения называются характеристиче- характеристическими числами пучка. Если Хо—характеристическое число пучка, то существует столбец z = [zu z2, ..., zn) Ф 0 такой, что Hz = KoZ. Столбец z мы будем называть главным столбцом или главным век- вектором пучка Н (х, х) — XG(x, x), соответствующим характеристическому числу Хо. Имеет место Теорема 22. Характеристическое уравнение регулярного пучка эрмитовых форм Н (х, х) — XG (х, х) имеет п вещественных корней %i, к2, ..., Кп- Этим корням соответствуют п главных векторов z1, zz, ...,zn, удовлетворяющих условиям «ортонормированности»: G(z\zk) = 8ik (i, Л=1, 2, ...,п). Доказательство совершенно аналогично доказательству теоремы 8. Все экстремальные свойства характеристических чисел регулярного пучка квадратичных форм сохраняют свою силу и для эрмитовых форм. Теоремы 10—17 сохраняют свою силу, если в этих теоремах термин «квадратичные формы» заменить везде термином «эрмитовы формы». Дока- Доказательства теорем остаются при этом неизменными. § 10. Ганкелевы формы Пусть даны 2га—1 чисел s0, su ...,s2n-2- При помощи этих чисел составим квадратичную форму от п переменных S (х, х)= 2 Si+bXiXh- A34) Квадратичная форма A34) называется ганкелевой. Соответствующая ей симметрическая матрица S = \\ s^ Ц" также называется ганкелевой.
302 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Эта матрица имеет вид s = So Si s2 Si s2 S3 s2 - S3 St, . ¦ ¦ Sn-i ... sn • • sn+i sn-i А, Последовательные главные миноры матрицы S будем^обозначать через = | si+h [ (p=l, 2, ..., n). В настоящем параграфе мы установим основные результаты Фробе- ниуса относительно ранга и сигнатуры вещественных ганкелевых форм1). Предварительно докажем две леммы. Лемма 1. Если в ганкелевой матрице S = \\ s^k Ц^ первые h строк линейно независимы, а первые /г + 1 строк линейно зависимы, то Доказательство. Обозначим через [Г^ Г2, ...,Г„, Г/,+1 первые /г + 1 строк матрицы S. По условию теоремы строки Г^, Г2, ..., Г„ ли- линейно независимы, а строка Г/,+1 линейно выражается через эти строкиг h 3=1 или h se= 2 ajsq-j 3=1 = K /г+1, ...,/г + га—1). A35) Выпишем матрицу, состоящую из первых h строк 1\, Г2, , матрицы S: So Sj Sz S3 A36> Эта матрица имеет ранг h. С другой стороны, в силу A35) любой столбец зтой матрицы выражается линейно через h предыдущих столбцов. Следо- Следовательно, любой столбец матрицы выражается линейно через h первых столбцов. Но тогда, поскольку ранг матрицы A36) равен /г, эти первые k столбцов матрицы A36) должны быть линейно независимы, т. е. "* при некотором h(<Cn} = 0 A37) Лемма доказана. Лемма 2. Если для матрицы S *!* = ¦ ...hh+k+lj 1 Dh Sh+h Sh+i A38) 1) Cm. [182fJ.
§ 10] ГАНКЕЛЕВЫ ФОРМЫ 303- || h l то матрица Т = \\ tih ||o h l также еанкелева и все ее элементы, распо- расположенные над второй диагональю, равны нулю, т. е. существуют такие Числа tn-h-l, ¦ • ¦, ^2n-2ft-2. что Доказательство. Введем в рассмотрение матрицы В этих обозначениях T = Tn-h. Мы докажем, что любая из матриц Tp(p=i,2, ...,n—h) является: ганкелевой и что в ней5 f^ = 0 при i-\-k^p—2. Доказательство будем, вести индуктивно относительно р. Для матрицы Ti наше утверждение тривиально, для матрицы Т2 оно- очевидно, так как 00 til [ = ?10 (в силу симметрии S) и [tm = -j~: = O. Допустим, что наше утверждение справедливо для матрицы Tp(p<Zn—h), и докажем его справедливость для матрицы И = || tih \\q. Из допущения следует существование таких чисел tp_4, tp, ..., t2p-2, что при to = • • -. = tp-г — О При этом |Тр|=±^_д. A39) С другой стороны, пользуясь детерминантным тождеством Сильвестра; [см. B8) на стр. 48], найдем: п.. A40) A41) Из сопоставления A39) с A40) получаем: ^p-i¦ Далее из A38): tih — S2h+i+h + ¦ nh Sh+k -I 0 A42). На основании предыдущей леммы из A37) следует, что (h + 1)-я строка ~1 линейно зависит от первых h строк: матрицы o = ||Si+fe||0 h = S ags gsq-g п—1). A43). Пусть i, A<;p-^Li-\-k*C2p— 1. При этом одно из чисел ink меньше р. Не нарушая общности рассуждений,, примем, что i<Zp. Тогда, разлагая с помощью A43) последний столбец в определителе, стоящем в правой:
304 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X части равенства A42), и снова используя соотношения A42), будем иметь: Hh = *2л+г+й -f- Jj 0 ag 2j g=i , k-g — S2h+ii-h-g)- A44) Но в силу допущения индукции имеет место A41), и поскольку в A44) Кр, к — g<Cp и i + k — g<2p—2, то tuh-g = tn-k-g. Следова- Следовательно, при i-\-k<Zp все tlh = 0, а при p<^i-{-k^.2p—1 величина tih в силу A44) зависит только от i-{-k. Таким образом, Тр+1 — ганкелева матрица и в этой матрице все эле- элементы t0, t±, ..., tp-u стоящие над второй диагональю, равны нулю. Лемма доказана. Пользуясь леммой 2, докажем следующую теорему: Теорема 23. Если ганкелева матрица S — Ця^лЦо имеет ранг г и при некотором h(<C.r) то главный минор r-го порядка, образованный первыми h и последними г—h линиями матрицы S, не равен нулю: D(r) 1 ... h, n — r + h+1, n—r + h + 2, ...,n A ... h, n — r A 1 ... /г, n — r Ф0. - + h+l, n — r + h + 2, ...,n Доказательство. На основании предыдущей леммы матрица Г II * nn—ft—1 I = |l*ift||O " i...hh+i+l\ (t. k = 0, есть ганкелева матрица, в которой все элементы над второй диагональю равны нулю. Поэтому | Т\ == ± С другой стороныx), I T | = yr? = O. Следовательно, <о,п-л-1 = О, и матрица Т имеет вид Т = 0 о Un-h-l 0 Un-h-i. иг щ На основании детерминантного тождества Сильвестра [см. B8) на стр. 48].
§ 10] ГАНКЕЛЕВЫ ФОРМЫ 305 Матрица Т должна иметь ранг г—/г1). Поэтому при r<n—1 в матрице Т элементы wr_ft+1 =...== ц„_л+1 = 0 и матрица Т всегда имеет вид 0 о Т = О 0 Но тогда в силу тождества Сильвестра (см. стр. 48) (п—г-\-1 ... п — h\ n-r+l...»-*)- что и требовалось доказать. Рассмотрим вещественную2) ганкелеву форму S (х, х) = 2 i, fc=0 ранга г. Обозначим через я, v, а соответственно число положитель- положительных квадратов, число отрицательных квадратов и сигнатуру этой формы: фгласно теореме Якоби (стр. 275) эти величины могут быть опре- определены из рассмотрения знаков последовательных миноров ?>o = l, A, Dz, .... ?>r-i, A при помощи формул я = РA, А, .... A). v = F(l, A, .... А). A45) A4b) Эти формулы становятся неприменимыми в случае, когда последний член в ряду A45) либо три подряд идущих промежуточных члена равны нулю (см. § 3). Однако для ганкелевой формы, как показал Фробениус, х) Из тождества Сильвестра следует, что все миноры матрицы Т, у которых порядок >г—h, равны нулю. С другой стороны, матрица S содержит некоторый окаймляющий ?>h минор г-го порядка, отличный от нуля. Отсюда следует, что а соответствующий минор порядка г—h матрицы Т отличен от нуля. 2) В предыдущих леммах 1, 2 и теореме 23 в качестве основного поля можно было брать произвольное числовое поле и, в частности, поле всех комплексных чисел или поле всех вещественных чисел. 20 ф. р. Гантмахер
306 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X можно дать правило, позволяющее использовать формулы A46) в самом общем случае: Теорема 24 (Фробениуса). Для вещественной ганкелевой формы п-1 ранга г величины п, v, а могут быть определены из формул A46), если 1) при =...=DT = 0 (h<r) A47> заменить в этих формулах DT на DiT\ еде ... h n—r + h+1 ... п 2) в любой группе из р промежуточных нулевых определителей (Dh ф 0) Dh+1 = Dh+2 = ... = Dh+P = 0 (Z?ft+P+1 ф 0) A48> нулевым определителям приписать знаки по формуле 3C-1) sign Dh+j = (— 1) 2 sign Dh. A49> При этом величины Р, V, Р — V, соответствующие группе A48), получат значения1) Ph, p — * (Phi ^ft+l> • • • i *Jh+p+l) Vh,p — V [Dht ^ft+ij • • •> ^ft+p+i) Ph, p *h, p p нечетно P+l 2 p+l 2 0 p четно p + l + e 2 P + l—e 2 6 A50) 8 = ( —lJSlgn Dh Доказательство. Рассмотрим сначала случай, когда DT В этом случае формы п-1 г-1 S {X, X) = S Si+kXiXk И ST (Х, X) = S St+kXiXh i, fe=0 «, й=0 имеют не только один и тот же ранг г, но и одну и ту же сигнатуру с. 1) Формулы A49) и A50) применимы и к случаю A47), только здесь нужна положить p=r—h— 1 и под Dh+p+i понимать не DT=0, а ?><г> Ф 0.
§ 10] ГАНКЕ ЛЕВЫ ФОРМЫ 307 Действительно, пусть где Zj — вещественные линейные формы, a e*=±l (i= 1, 2, ..., г). Положим жг+1 = ... =жП5=0 Тогда "формы ?(х, х), Z,- перейдут соответст- венно в Sr(x, x), Zi(i=l, 2, ..., г), причем /5"г (х, х) = 2 8iZ?, T- е- «У,, (ж, х) имеет такое же число положительных (отрицательных) независи- независимых квадратов, как и форма S(x, x)х). Таким образом, о есть сигнатура формы.S.T (х, х). Проварьируем непрерывно параметры s0, su ..., s2r-2 так, чтобы при новых значениях параметров so, s*, ..., s*r_22) все члены ряда 1, Dt, Щ, .... D* (tfJHrf+ftlg-1; 9 = 1, 2, ..., г) были отличны от нуля и чтобы в процессе варьирования ни один из отличных от нуля определителей A45) не обратился в нуль3). Так как при варьировании не изменялся ранг формы ST (x, x), tq не изменялась и ее сигнатура (см. стр. 280). Поэтому o = P(l,Dt D*)-V(l,D*lt ...,Df). A51) Если при некотором i Dt^=0, то sign Z)f =¦ sign Di. Позтому весь вопрос сводится к определению перемен знака между теми D*, которым соответствуют Z>j = 0. Точнее, для каждой группы вида A48) требуется определить P(D*h, D*h+u ¦.... D*h+p+i)-V(D*h, D*h+u .... m+p, D*h+p+l). Для этого положим: tih=~k D k. (i, A = 0, 1, ...,p). ¦i-l S2h+i+h Согласно лемме 2 матрица rp II . lip ганкелева и все элементы ее, стоящие над второй диагональю, равны. 1) Линейные формы Zit Z%, ..., ZT линейно независимы, поскольку квадра- тичная форма ST (x, x)= ^ ei^i имеет ранг г (DT ф 0). i=l 2) В этом параграфе значок* не означает перехода к сопряжённой матрице. 8) Такую вариацию всегда можно осуществить, поскольку в пространстве параметров s0, sj S2r_2 уравнение вида jDj=O определяет некоторую алгебраи- алгебраическую гиперповерхность. Если точка принадлежит нескольким таким гиперпо-: верхностям, то она может быть всегда аппроксимирована сколь угодно близкими точками, лежащими вне этих гиперповерхностей. 20*
308 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X нулю, т. е. матрица Т имеет вид Т = О ... О tt О ' • t' * ... A52) Обозначим последовательные миноры матрицы Т через Du D2f • • •, Dp+i: Наряду с матрицей Т введем в рассмотрение матрицу где Sh+k S2h+k~l S 4k = —* Sh+i . . . S2ft+i-l и соответственные определители Е>Ъ = \$ь.\о~1 (9 = 1» 2, ..., p + 1). Согласно детерминантному тождеству Сильвестра Г)*. . 7")*Л* /л 1 9 *-'hJt-q — lJh1Jq \Ц — •*¦> *"» •••» Поэтому ... p)t A53) где о* — сигнатура формы Т*(х, х)= 2j Наряду с формой Т* (х, х) рассмотрим формы V Т (X, X) = 2 ti+hXiXh И Т** (X, X) = tv (XOXP + XtZp-i + .,.+ ХрХ0). i, ft=0 Матрица Т** получается из матрицы Т [см. A52)], если в последней заменить нулями все элементы, стоящие под второй диагональю. Сигна- Сигнатуры форм Т (х, х) и Т** (х, х) обозначим соответственно через а и в**.
§ 10] ГАНКЕЛЕВЫ ФОРМЫ 309 Так как формы Т* (х, х) и Т** (х, х) получаются из формы Т (х, х) таким варьированием коэффициентов, в процессе которого ранг формы не ме- меняется (\Т**\ = \Т\ = ^^-фО, \Т*\= D*+l+i фО), то и сигнатуры форм Т (х, х), Т* (х, х) и Т** (х, х) должны быть одинаковы: A54) Но 2tv (x&th-i + ... + xh^xk) при р = 2к — 1, tр [2 (хохм + ... + хь-iXk+i) + х\\ при р = 2к. J ' Х' 1 Так как каждое произведение вида хах$ при аф§ можно заменить разностью квадратов ( ^-— ) — ( к— ) и таким образом получить разложение Т** (х, х) независимые вещественные квадраты, то ^. f 0 при р нечетном, о**= . t v A55) [ signfp при р четном. х С другой стороны, из A52) A56) Из A53), A54), A55) и A56) следует: Р (Dt D*h+l, .... Dt+v+l)-V(Dt Dt+l, ..., Dt+p+l) = О при р нечетном, A57) e при р четном, где •Dft+p+i Так как P(Dfi+l, Dfi+2, ..., ^^+p+i) + V(D*h+l, DZ+2, ..., D*h+p+l) = p +1, A58) то из A57) и A58) вытекает таблица A50). Пусть теперь Д. = 0. Тогда при некотором й<г Dh?=0, Z?ft+1=...=Z?r = O. В зтом случае согласно теореме 23 A ... h n—г + й + 1 ... п l...hn-r+k + l...n Рассматриваемый случай сводится к предыдущему перенумерацией п— 1 переменных в квадратичной форме S (х, х)= У\ Si+kxtxh. Полагаем: i,k=0 Xr = n-l При ЭТОМ S (X, X)= 2 ift0
310 КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ [ГЛ. X Исходя из структуры матрицы Т на стр. 305 и пользуясь получен- полученными .из детерминантного тождества Сильвестра соотношениями найдем, что ряд 1, Du D2, . ¦ ¦, Dn получается из ряда 1, Du Dz, ..., Dn заменой одного элемента DT на Dm. Таким образом, показано, что во всех случаях можно пользоваться таблицей A50). Заметим, что при р нечетном [д—число нулевых определителей в группе A48)] из формулы A56) следует: t-l)^. A60) Пользуясь этим равенством, читатель легко проверит, что таб- таблице A50) соответствует то приписывание знаков нулевым определителям, которое дается формулой A49). Теорема доказана полностью1). Примечание. При р = 1 из формулы A60) следует: DhDh+2<0. Поэтому имеет место правило Гундельфингера, т. е. при подсчете v (I, Du ..., Dr) можно Dh+l опустить. При р = 2 из таблицы A50) вытекает правило Фробениуса (см. стр. 275). 1 Нетрудно убедиться, что теорема 23, а с ней и теорема 24, сохраняют сипу также при й=0, если считать, как мы условились на стр. 305, jDo=1 (см- Фробе- ниус, [182 !]).
ЧАСТЬ ВТОРАЯ СПЕЦИАЛЬНЫЕ ВОПРОСЫ И ПРИЛОЖЕНИЯ
ГЛАВА XI КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ, КОСОСИММЕТРИЧЕСКИЕ И ОРТОГОНАЛЬНЫЕ МАТРИЦЫ В главе IX в связи с изучением линейных операторов в евклидовом пространстве были исследованы вещественные симметрические, косо- симметрические и ортогональные матрицы, т. е. вещественные квадрат- квадратные матрицы, характеризуемые соответственно соотношениями (здесь ' означает переход к транспонированной матрице). Было выяснено^ что в поле комплексных чисел все эти Матрицы имеют линейные элемен- элементарные делители, и были установлены нормальные формы для этих матриц, т. е. «простейшие» вещественные симметрические, кососимметри- ческие и ортогональные матрицы, которым вещественно- и ортогонально- подобны произвольные матрицы рассматриваемых типов. Настоящая глава посвящена исследованию комплексных симметри- симметрических, кососимметрических и ортогональных матриц. Выясняется, какие элементарные делители могут иметь эти матрицы, и устанавливаются для них нормальные формы. Эти формы имеют значительно более сложную структуру, нежели соответствующие нормальные формы в вещественном случае. Предварительно в первом параграфе устанавливаются интерес- интересные связи между комплексными ортогональными, унитарными и веще- вещественными симметрическими, кососимметрическими и ортогональными матрицами. § 1. Некоторые формулы для комплексных ортогональных и унитарных матриц Начнем с леммы. Лемма I1).!. Если матрица G одновременно является и эрмитовой и ортогональной (G' = G — G~l), то она представима в виде G = /e*«, A) где I — вещественная симметрическая ишолютивная матрица, а К — перестановочная с нею вещественная кососимметрическая матрица: /=/ = /', 12 = Е, К^К=—К'. B) 2. Если дополнительно G является положительно определенной эрми- эрмитовой матрицей 2), то в формуле A) / = Е и G = eiK. C) 1) [81в], стр. 223—225. а) То есть G — матрица коэффициентов положительно определенной эрмитовой формы (см. гл. X, § 9).
314 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI Доказательство. 1. Пусть где S и Т—вещественные матрицы. Тогда G = S—iT и G' = S D) E) Поэтому равенство G — G' влечет: S — S', Г=—Т', т. е. S — симметри- симметрическая, а Т—кососимметрическая матрица. Далее, комплексное равенство GG=*E после подстановки в него выражений для G и G из D) и E) распадается на два вещественных равенства: о -\-1" = л, OJ =1О. \О) Второе из этих равенств показывает, что S и Т коммутируют. Согласно теореме 12' главы IX (стр. 265) коммутирующие нормаль- нормальные матрицы S и Т можно одним и тем же вещественным ортогональным преобразованием привести к квазидиагональной канонической форме. Поэтому г) S = O{SU Su S2, S2, . . ., Sq, Sq, S2q+i, . . ., Sn} O'1 (O = O = O'~1) G) ,t2 о И * •'¦' — tq о о и -и о 0, ..., ¦(числа Si и ti вещественны). Отсюда Si iti —iti Si s2 itz — itz sz sq itq itq sq ,(8) С другой стороны, подставляя выражения G) для S и Т в первое из равенств F), найдем: -±1 Sn=±l. (9) при s2—г Теперь нетрудно проверить, что матрица типа всегда представима в виде s it —it s где = ее* И-9 о||} | s [ = ch ф, e?=sh(p, в = signs. Поэтому в силу (8) и (9) имеем: 0 Фх II „II 0 Фа || ц . ±1, ±1}О-\ A0) т. е. См. также примечание к теореме 12' гл. IX (стр. 265).
§ 1] СВОЙСТВА КОМПЛЕКСНЫХ ОРТОГОНАЛЬНЫХ И УНИТАРНЫХ МАТРИЦ 315 где 1, ±1, .... ±1}0-\ к и f I 0 ffiJI \\ 0 ф0 о (И) Из A1) вытекают равенства B). 2. Если дополнительно известно, что G — положительно определенная эрмитова матрица, то можно утверждать, что все характеристические числа матрицы G положительны (гл. IX, стр. 248). Но в силу фор- формулы A0) этими характеристическими числами являются числа ±еЧЧ, ±е-ч>1, ±еч*, ±e-vs, .... ± ефв, ± ё~%, ±1, ..., ±1 {здесь знаки соответствуют знакам в формуле A0)]. Поэтому в формуле A0) и в последующей формуле A1) всюду, где стоит ±, сохраняется знак +. Следовательно, что и требовалось доказать. Лемма доказана полностью. С помощью леммы мы докажем следующую теорему: Теорема 1. Комплексная ортогональная матрица О всегда пред- ставима в виде A2) где R — вещественная ортогональная, а К—вещественная кососимметри- ческая матрица Я = Л=#'-\ К = К=— К'. A3) Доказательство. Допустим, что формула A2) имеет место. Тогда и 0*0 = eiKR!ReiK = e2iK. Теперь в силу предыдущей леммы искомую вещественную кососим- метрическую матрицу К можно определить из равенства поскольку матрица 0*0 — положительно определенная эрмитова и ортого- ортогональная матрица1). После того как матрица К определена из A4), мы находим R из A2): R^Oe-w. A5) Тогда т. е. R—унитарная матрица. С другой стороны, из A5) следует, что матрица R как произведение двух ортогональных матриц сама х) Комплексная ортогональная матрица О является неособенной, так как из равенства ОО'=Е следует, что |0|=±1.
316 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI ортогональна: R'R = E. Таким образом, R является одновременно уни- унитарной и ортогональной и, следовательно, вещественной ортогональной. Формулу A5) можно записать в виде A2). Теорема доказана1). Установим теперь следующую лемму: Лемма 2. Если матрица D является одновременно симметри- симметрической и унитарной (D = Dr = D~x), то она всегда представима в виде- где S—вещественная симметрическая матрица (S = S — S'). Доказательство. Положим Тогда D = U—iV, D' = U' Комплексное равенство D = D' распадается на два вещественных: U = U', V = V. Таким образом, U и V—вещественные симметрические матрицы. Равенство DD = E влечет: *7» + V» = #, UV = VU. Согласно второму из этих равенств матрицы U и V коммутируют. Применяя к ним теорему 12' (вместе с примечанием) главы IX (стр. 265)^ получим: U = О {sl5 %,..., sn} (Г1, V=O {h, t2, ..., tn) 0r\ A9> Здесь 0 = 0 = 0'^, [a sh и th (k — 1, 2, ..., n) — вещественные числа. Теперь первое из равенств A8) дает: = l (A = l, 2, ...,и). Поэтому существуют такие вещественные числа фй(А;=1, 2, ...,п), чта sk^=cos(ph, th = smyh (Л = 1, 2, ..., п). Подставляя эти выражения для ss и fj в A9) и пользуясь A7), найдем: D = О{е*\ е*\ ..., е1ф"}О'1 = eiS, где «? = 0{<plt «Pa. ..-,Ч>п}О-К B0> Из B0) следует: ^ = ^=,5". Лемма доказана. Пользуясь этой леммой, докажем следующую теорему: Теорема 2. Унитарная матрица U всееда представима в виде U = ReiS, B1) где R — вещественная ортогональная, a S — вещественная симметри- симметрическая матрица: Л = Л = Л'-1, S = S = S\ B2) г) Формула A2), как и полярное разложение комплексной матрицы [в соот- соответствии с формулами (87), (88) на стр. 249], имеет тесную связь с важной теоремой Картава, устанавливающей известные представления для автоморфизмов полу- ростых комплексных групп Ли [81в], стр. 232—233.
$ 2] ПОЛЯРНОЕ РАЗЛОЖЕНИЕ КОМПЛЕКСНОЙ МАТРИЦЫ Доказательство. Из формулы B1) следует: U' = eisR'. B3) Перемножая почленно B1) и B3), получим в силу B2): Согласно лемме 2 вещественную симметрическую матрицу S можно ¦определить из уравнения U'U = e2is, B4) поскольку матрица U'U является симметрической унитарной. После того как матрица S определена, мы определим матрицу R равенством . B5) Тогда R' = e-iSU', B6) и потому из B4), B5) и B6) вытекаетj т. е. R — ортогональная матрица. С другой стороны, согласно B5) R есть произведение двух унитар- унитарных матриц и, следовательно, R — унитарная матрица. Поскольку Я •одновременно является ортогональной и унитарной, R — вещественная матрица. Формулу B5) можно переписать в виде B1). Теорема доказана. § 2. Полярное разложение комплексной матрицы Докажем следующую теорему: Теорема 3. Если А = \\а1ь\\™—неособенная матрица с комплекс- .ными элементами, то A = SO B7) ¦и A = OtSu B8) зде S и Sx — комплексные симметрические, а О и 0^ — комплексные орто- ортогональные матрицы. При этом где /(Я,), /i(X) — некоторые многочлены относительно "к. Как в разложении B7), так и в разложении B8) сомножители S и ¦О (соответственно 0^ и S^ перестановочны между собой в том и только в тот случае, когда матрицы А и А' перестановочны между собой. Доказательство. Достаточно установить разложение B7), так как, применив это разложение к матрице А' и определив из полученной фор- формулы матрицу А, мы придем к разложению B8). Если имеет место формула B7), то и потому = S*. B9)
318 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI Обратно, поскольку АА'— неособенная матрица (|А4'| = | А |2=/=0), то функция У К определена на спектре этой матрицы г), и, следовательно, существует такой интерполяционный многочлен /(Я,), что YAAr=f(AA'). C0) Симметрическую матрицу C0) обозначим через s=уш. Тогда имеет место B9) и, следовательно, | S \ Ф 0. Определяя матрицу О из равенства B7) легко проверяем, что эта матрица является ортогональной. Таким обра- образом разложение B7) установлено. Если в разложении B7) множители S и О перестановочны между собой, то перестановочны и матрицы A = SO и A'^ так как Обратно, если АА' — А'А, то т. е. матрица О перестановочна с S2 = AA'. Но тогда матрица О переста- перестановочна и с матрицей S — f{AA'). Таким образом теорема доказана полностью. Пользуясь полярным разложением, докажем теорему: Теорема 4. Если две комплексные симметрические, либо кососим- метрические, либо ортогональные матрицы подобны В^Т-ЫТ, C1) то эти матрицы ортогонально-подобны, т. е. существует такая орто- ортогональная матрица О, что В = О-*А0. C2) Доказательство. Из условия теоремы следует существование такого многочлена q (К), что A' = q{A), B' = g(B). C3) Этот многочлен д(К) в случае симметрических матриц тождественно равен Я,, а в случае кососимметрических матриц тождественно, равен — К. Если же А и В—ортогональные матрицы, то q (К) — интерполяционный многочлен для -у- на общем спектре матриц А и В. Пользуясь равенствами C3), мы проведем доказательство данной теоремы совершенно аналогично доказательству соответствующей теоремы 10 главы IX для вещественного случая (см. стр. 262). Из C1) следует: !) См. гл. V, § 1. Мы берем однозначную ветвь функции ~\/% в односвязной области, содержащей все характеристические числа матрицы АА' и не содержащей числа 0.
§ 3] НОРМАЛЬНАЯ ФОРМА КОМПЛЕКСНОЙ СИММЕТРИЧЕСКОЙ МАТРИЦЫ 319s или в силу C3) Отсюда ' = Т-1А'Т. B = T'AT'-K Сопоставляя это равенство с C1), легко находим: ТГА-АТГ. Применим к неособенной матриц* Т полярное разложение C4) Поскольку согласно C4) матрица ТТ' перестановочна с А, то и мат- матрица S = f(TT') также перестановочна с А. Поэтому, подставляя [в C1) вместо Т произведение SO, будем иметь: В = O-lS-xASO = О-1 АО. Теорема доказана. § 3. Нормальная форма комплексной симметрической матрицы Докажем следующую теорему. Теорема 5. Существует комплексная симметрическая матрица с любыми наперед заданными элементарными делителями 1). Доказательство. Рассмотрим матрицу Н п-то порядка, у кото- которой элементы первой наддиагонали равны единице, а все остальные эле- элементы равны нулю. Докажем, что существует симметрическая матрица St подобная матрице Н: S =ТНТ-К C5) Преобразующую матрицу Т будем искать, исходя из условия: S = ТИТ'1 = S' = Т'-^Н'Т'. Это условие можно переписать так: VH = H'V, C6) где V—симметрическая матрица, связанная с Т равенством Т'Т=>— 2iV2). C7) Вспоминая свойства матриц Н и F = H' (стр. 25—26), 'мы найдем, что любое решение V матричного уравнения C6) имеет следующий вид: О ... О а0 Со 01 где а0, аи О" й0 — произвольные комплексные числа. C8) !) Относительно содержания настоящего параграфа, а также последующих 4 и 5 см. [256]. 2) Для упрощения дальнейших формул нам удобно здесь ввести множитель —21.
320 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI Поскольку нам достаточно отыскать одну преобразующую матрицу Т, то мы в этой, формуле положим ао = 1, ах= ...=«„_! = 0 и определим матрицу V равенством 1) 0 ... О 1 0 ... 1 0 00 C9) Кроме того, преобразующую матрицу Т будем искать в виде симметри- симметрической матрицы: Г «Г. D0) Тогда уравнение C7) для Т перепишется так: Т*=— 2iV. D1) Теперь неизвестную матрицу Т будем искать в виде многочлена от V. Поскольку V2 = E, в качестве такого многочлена можно взять многочлен первой степени: T — aE + fiV. Из уравнения D1), учитывая равенство F2 = Е, найдем: а2 + р2 = 0, 2ар = — 2г. Этим соотношениям мы удов- удовлетворим, полагая а = 1, Р=—i. Тогда T = E-iV. D2) Т—неособенная симметрическая матрица2). В то же время из D1): T-x = -^(E + iV). D3) Таким образом, симметрическая форма S матрицы Н определится равенством 0 ... 0 ... 1 ... 0 1 0 1 0 0 S = ТИТ1 = -!-(#_ (V) Н(Е + iV), V = Поскольку матрица S удовлетворяет уравнению C6) и равенство D4) может быть переписано еще так: 2S = (Я + Н') + i (HV—VH)=H + H' + i (H—H') V = D4) = E, то 0 1 1 • о о 1 0 +«¦ о о -1 0 -1 о D5) Формула D5) определяет симметрическую форму S матрицы Н. *) Матрица V является одновременно симметрической и ортогональной. 2) Неособенность матрицы Т следует, в частности, из D1), поскольку V—неосо- V—неособенная матрица.
i 3] НОРМАЛЬНАЯ ФОРМА КОМПЛЕКСНОЙ СИММЕТРИЧЕСКОЙ МАТРИЦЫ 321 В дальнейшем, если п — порядок матрицы Н, Н = Н<-п\ то соответст- соответствующие матрицы Т, V и S будем еще обозначать и так: Т<">, F<n> и <S<™>. Пусть даны произвольные элементарные делители: Составим соответствующую жорданову матрицу Для каждой матрицы форму S(pj\ Из следует: Поэтому, полагая будем иметь: введем соответствующую симметрическую G = 1, 2,..., и) D7) D8) • {¦• » ¦• » • • • > ¦• )¦> S — симметрическая форма жордановой матрицы J. Матрица S подобна матрице J и имеет те же элементарные делители D6), что и мат- матрица J. Теорема доказана. Следствие 1. Произвольная квадратная комплексная матрица А. = II aih У$ подобна симметричщской матрице. Привлекая теорему 4, получим: Следствие 2. Произвольная комплексная симметрическая мат- матрица S = || Sjfc ||" ортогонально-подобна симметрической матрице, имею- имеющей нормальную форму S, т. е. существует такая ортогональная мат- матрица О, что S = OSCT1. D9) Нормальная форма комплексной симметрической матрицы имеет квазидиагональный вид ' \ E0) где клетки S№ определяются так [см. D4), D5)]: (p)i _ i(HlP)-, О 1 ... О О l" . . . 1 1 "О 1 О -1 О —1 ... О • E1) 21 Ф. Р. Гантмахер
322 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI § 4. Нормальная форма комплексной кососимметрической матрицы Выясним, какие ограничения на элементарные делители накладывает косая симметрия матрицы. При этом мы будем опираться на следующую теорему: Теорема 6. Кососимметрическая матрица всегда имеет чет- четный ранг. Доказательство. Пусть кососимметрическая матрица К имеет ранг г. Тогда среди строк матрицы К имеется г линейно независи- независимых с номерами ilt «2> • ¦ • > ir', все остальные строки являются линей- линейными комбинациями этих строк. Поскольку столбцы матрицы К полу- получаются из соответствующих строк, если элементы последних помножить на —1, то и любой столбец матрицы /(Тесть линейная комбинация столбцов с номерами ilt iz,...,ir. Поэтому произвольный минор r-го порядка матрицы К может быть представлен в виде где а — число. Отсюда вытекает, что Aл 19 . . . I, . .. ir Но кососимметрический определитель нечетного порядка всегда равен нулю. Следовательно, г — четное число. Теорема доказана. Теорема 7. 1° Если %0 — характеристическое число кососиммет- кососимметрической матрицы К и ему соответствуют элементарные делители (Я - Ко)*, (Я - Ао)/«, ..., (Я - КоУ*, то — Ао также является характеристическим числом матрицы К и этому числу соответствуют элементарные делители матрицы К в том же числе и тех же степеней (Я + Ко)*1, (^ + h)f2, ...,(>¦ + Ъ)и. 2° Если число нуль является характеристическим числом кососим- кососимметрической матрицы К1), то в системе элементарных делителей ма- матрицы К все элементарные делители четной степени, соответствующие характеристическому числу нуль, повторяются четное число раз. Доказательство. 1° Транспонированная матрица К' имеет те же элементарные делители, что и матрица К. Но К''= —К, а элементарные делители матрицы — К получаются из элементарных делителей матрицы К, если в. последних все характеристические числа Ки %%, ... заменить на — %и —^2, ... Отсюда следует первая часть нашей теоремы. 2° Пусть характеристическому числу нуль матрицы К отвечает д± элементарных делителей вида Я, б2—вида Я2 и т. д. Вообще мы через бр обозначим число элементарных делителей вида Яр (р=1, 2, ...). Мы докажем, что б2, б4, ••¦—четные числа. То есть если \К |=0. При и нечетном всегда \К\=0.
§ 4] НОРМАЛЬНАЯ ФОРМА КОСОСИММЕТРИЧЕСКОЙ МАТРИЦЫ 323 Дефект d матрицы К равен числу линейно независимых собственных векторов, соответствующих характеристическому числу нуль или, что то же, числу элементарных делителей вида Я, Я2, Я3, ... Поэтому rf=61 + 62 + 63+... E2) Поскольку согласно теореме 6 ранг матрицы К — четное число, ad = = п — г, то число d имеет ту же четность, что и число п. Такое же утверждение можно сделать относительно дефектов d3, d&, ... матриц Ка, К&, ..., поскольку нечетные степени кососимметрической матрицы снова являются кососимметрическими матрицами. Поэтому все числа d^ = d, d3, d5, ... имеют одну и ту же четность. С другой стороны, при возведении матрицы К в степень т каждый элементарный делитель Яр этой матрицы при р<Ст расщепляется на р элементарных делителей (первой степени), а при р>т — на т элементар- элементарных делителей*). Поэтому число элементарных делителей матриц К, К3, ..., являющихся степенями Я, определится по формулам 2) 4 = 6! + 2б2 + Зб3 + 4б4 + 5 (бв + бв -f ...), E3) Сопоставляя E2) с E3) и помня, что все числа d4 = d, d3, d&, ... имеют одну и ту же четность, легко заключаем, что б2, б4, ...—четные числа. Теорема доказана полностью. Теорема 8. Существует кососимметрическая матрица с любыми наперед заданными элементарными делителями, удовлетворяющими огра- ограничениям 1°, 2° предыдущей теоремы. Доказательство. Найдем сначала кососимметрическую форму для квазидиагональной матрицы порядка 2р: Щ, E4) имеющей два элементарных делителя (Я — А0)р и (к-^КоУ; здесь Е — Е<-р\ Будем искать такую преобразующую матрицу Т, чтобы матрица была кососимметрической, т. е. чтобы имело место равенство или WjV*> + lJft»]'W = O, E5) где W — симметрическая матрица, связанная с матрицей Т равенством8) T'T=-2iW. E6) !) См. гл. VI, теорема 9 стр. 158. 2) Эти формулы были выведены (без ссылки на теорему 9) в гл. VI [см. фор- формулы D9) на стр. 156]. 3) См. сноску 2) к стр. 319. 21*
324 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI Разобьем матрицу W на четыре квадратных блока, каждый по- порядка р: W — \WZ1 W22 Тогда E5) можно переписать так: IWU Wl2 \ lloE + H 0 \W2i W22)\ О -1OE-H 0 \ (Wu Wl2 Выполняя указанные действия над блочными матрицами части матричного уравнения E7), мы заменим это уравнение четырех матричных уравнений: 1) H'WH+W11BK0E + H) = 0, 2) 3) H'W2i-W21H = 0, 4) о =°- E7) в левой системой Уравнение АХ—XB = 0, где А и В — квадратные матрицы без общих характеристических чисел, имеет только нулевое решение X — О Х). Поэтому первое и четвертое уравнения E8) дают: Wli=W22 = 0 2). Что же каса- касается второго из этих уравнений, то, как мы видели при доказательстве тео- теоремы 5, этому уравнению можно удовлетворить, полагая О ... О 1 О ... 1 О 1 . . О О E9) поскольку [см. C6)] VH—ЯТ = Из симметрии матрицы W следует, что Тогда автоматически удовлетворяется и уравнение 3). Таким образом, О V\ ) F0) Но тогда, как уже было выяснено на стр. 320, уравнение E6) удовлет- удовлетворится, если положить: 71 = ?'Bг»_гТBр). F1) При этом Т'1 = -|- (Е№ + iT<2*>). F2) 1) См. гл. VIII, | 1. 2) При %о ф 0 уравнения 1) и 4), кроме нулевых, других решений не имеют. При Х,о=О существуют и другие решения, но мы выбираем нулевые решения.
§ 4] НОРМАЛЬНАЯ ФОРМА КОСОСИММЕТРИЧЕСКОЙ МАТРИЦЫ 325 Следовательно, искомая кососимметрическая матрица найдется по фор- формуле Подставляя вместо из E4) и F0), найдем: Н — Н' 0 0 Н' — Н и g">)] *). F3) соответствующие блочные матрицы 0 Н — Н' -iBl0V- 0 WO FJ\_ —Н—Н'-2Ке) \V 0/ i{210V + HV + VH)\ ^ т'. е. О 1 . — 1 0 • 0|0 . I . ¦ _ ¦ • ; ii i — 1 О 121 2Я0 i О ... -Q——-- 3177 32ЯоГ""— " • " -2Я0, _J 1 0 ' . -2Я0 -г 0 О — 1 1 О F5) Построим теперь кососимметрическую матрицу q-ro порядка , имеющую один элементарный делитель %ч, где q — нечетное число. Оче- Очевидно, что искомая кососимметрическая матрица будет подобна матрице 0 10 0 0 1 0 — 1 О О • о — 1 о о F6) х) Здесь мы используем равенства E5), F0) и равенство [ Ив этих равенств следует, что F<2p>4?p> = — J^'V^^ v. FBp>J^№>FBp>
326 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI единиц, а затем В этой матрице все элементы вне первой наддиагонали равны нулю, F7) F8) F9) а вдоль первой наддиагонали сначала идут элементов, равных —1. Полагая К^ = TJWT'1, из условия косой симметрии найдем: где Непосредственной проверкой убеждаемся в том, что матрица О ... О 1 О ... 1 О 1 О О удовлетворяет уравнению F8). Принимая это значение для Wit мы из F9), как и ранее, находим Т = ?¦(«) — i = -i- [№> + iT«>], G0) G1) Произведя соответствующие вычисления, найдем: 0 — 1 6 1 о • . - • 1 о -1 0 +i о • —1 0 • -1 ' 1 о 1 ¦ . 0 G2) Пусть даны произвольные элементарные делители, удовлетворяю- удовлетворяющие условиям теоремы 7: (X-XjfJ, {X + kjp (/ = 1, 2, ...,ц), j1) Я9^ (А=^1, 2,..., у; gt, q2, - - •, qv — нечетные числа), j Тогда квазидиагональная кососимметрическая матрица f = {Kftn\ ..., Ktfu); KUu, ..., K^) G4) или элементарные делители G3). Теорема доказана. Следствие. Произвольная комплексная кососимметрическая ма- матрица К ортогонально-подобна кососимметрической матрице, имеющей нормальную форму К, определяемую формулами G4), F5), G2), т. е. существует такая {комплексная) ортогональная матрица О, что К = ОКО'1. G5) !) Среди чисел Я1; Яг Я„ могут быть и равные нулю. Кроме того, одно из чисел и к v может равняться нулю, т. е. в частном случае могут быть только элементарные делители одного типа.
§ 5] НОРМАЛЬНАЯ ФОРМА КОМПЛЕКСНОЙ ОРТОГОНАЛЬНОЙ МАТРИЦЫ 327 Замечание. Если К — вещественная кососимметрическая матрица, то она имеет линейные элементарные делители (см. гл. IX, § 13) Я —г'ф1; Я + {'фь . ..Д — i(fu, Я + г'фи, К ---Д (фу — вещественные числа). v раз В этом случае, полагая в G4) все Pj=i и все qh~=l, получим нормаль- нормальную форму вещественной кососимметрической матрицы О ф1 -Ф1 О О фи — фи , о,...,о . § 5. Нормальная форма комплексной ортогональной матрицы Начнем с выяснения, какие ограничения на элементарные делители накладывает ортогональность матрицы. Теорема 9. 1. Если Х0(к1ф1)—характеристическое число орто- ортогональной матрицы О и этому характеристическому числу соответ- соответствуют, элементарные делители (K-Ko)h, (Я-Я0)/2, ..., (Я-ЯсД то -г— также является характеристическим числом матрицы О и этому характеристическому числу соответствуют такие же элементарные делители, как и числу Яо: 2. Если Яо = ± 1 является характеристическим числом ортогональ- ортогональной матрицы О, то элементарные делители четной степени, соответ- соответствующие этому характеристическому числу Хо, повторяются четное число раз. Доказательство. 1. Для любой неособенной матрицы О при переходе от О к (Тх каждый элементарный делитель (Я — КоI заменяется элементарным делителем (к — X~l)fl). С другой стороны, матрицы О и О' всегда имеют одни и те же элементарные делители. Поэтому из условия ортогональности О' = О'1 сразу следует первая часть нашей теоремы. 2. Допустим, что число 1 является характеристическим числом матри- матрицы О, а число —1 не является таковым (\Е — О\ = 0, \Е+ О\ фО). Тогда воспользуемся формулами Кэли (см. гл. IX, § 14), которые сохраняют свою силу и для комплексных матриц. Определим матрицу К равенством К = (Е-О){Е + О)-1. G6) Непосредственной проверкой убеждаемся в том, что К' = — К, т. е. чт<г К — кососимметрическая матрица. Разрешая уравнение G6) относи- относительно О, находим2): Полагая / (к) = -гт^ , имеем /' (К) = — - . 2 Ф 0. Следовательно, при / {К) переходе от матрицы К к матрице О = / {К) элементарные делители 1 1 х) См. гл. VI, § 7. Полагая /(Я)=—, имеем /' (Х)=—irs-ф О. Отсюда следует, А А* что при переходе от матрицы О к матрице О элементарные делители не расще- расщепляются (см. стр. 158). 2) Заметим, что из G6) следует: Е-4-К=2(Е + О)~! и, следовательно, \Е-\-К\ = =2п | Е+О |-i ф 0.
328 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI не расщепляются1). Поэтому в системе элементарных делителей матрицы О элементарные делители вида (К — 1JР повторяются четное число раз, по- поскольку это имеет место для элементарных делителей вида К2Р матрицы К (см. теорему 7). Случай, когда ортогональная матрица О имеет характеристическое число—1, но не имеет характеристического числа +1, сразу сводится к разобранному случаю путем рассмотрения ортогональной матрицы -—О. Переходим к наиболее сложному случаю, когда матрица О одновре- одновременно имеет характеристическое число +1 и характеристическое число — 1. Обозначим через -ф (Я) минимальный многочлен матрицы О. Используя доказанную первую часть теоремы, мы сможем записать 1]) (к) в виде f\i(X-Xjfi{l-l?fJ (ЦФ1; /=1, 2 и). Рассмотрим многочлен g (К) степени <т [т — степень 1}з(^)], у кото- которого g(l) = l, а все остальные т—1 значений на спектре матрицы О равны нулю, и положим2): P = g(O). G7) Заметим, что функции [g (К)]2 и g (у J принимают те же значения на спектре матрицы О, что и функция g(X). Поэтому Р* = Р, р' = ёг@') = ^@-1)^Р, G8) т. е. Р — симметрическая проекционная матрица 3). Определим многочлен Л(Х) и матрицу Q равенствами h(l) = (l-l)g(l), G9) Q = h(O)=;(O-E)P. (80) Поскольку степень [h (к)]™1 обращается в нуль на спектре матрицы О, эта степень делится на г)з(Я) без остатка. Отсюда следует: т. е. Q—нильпотентная матрица с индексом нильпотентности т^ Из (80) находим4): Q' = (O'-E)P. (81) Рассмотрим матрицу R = Q(Q' + 2E). (82) Из G8), (80) и (81) следует: Из этого представления матрицы R видно, что R — кососимметриче- ская матрица. х) См. стр. 158. 2) Из основной формулы (см, стр. 111) S (Лй) Zh2+...] следует, что -Р—^ii- 3) См. гл. III, § 6 (стр. 81). 4) Все фигурирующие здесь матрицы Р, Q, Q', О'=О-г перестановочны между собой и с О, поскольку все они являются функциями от О.
§ 5] НОРМАЛЬНАЯ ФОРМА КОМПЛЕКСНОЙ ОРТОГОНАЛЬНОЙ МАТРИЦЫ 329 С другой стороны, из (82) Rh = Qh(Q'+2E)k (к = 1, 2, ...). (83) Но Q', как и Q, ¦—нильпотентная матрица и, следовательно, Поэтому из (83) вытекает, что при любом к матрицы Rh и Qh имеют один и тот же ранг. Но при к нечетном матрица Rh является кососимметрическои и потому (см. стр. 322) имеет четный ранг. Следовательно, каждая из матриц Q, Qs, Q\ ¦¦¦ имеет четный ранг. Поэтому, повторяя дословно для матрицы Q рассуждения, проведенные на стр. 322 — 323 для матрицы К, мы сможем утверждать, что среди элементарных делителей матрицы Q делители вида К2Р повторяются четное число раз. Но ^каждому элементарному делителю К2Р матрицы Q соответ- соответствует элементарный делитель (Я,— 1JР матрицы О и наоборот1). Отсюда следует, что среди элементарных делителей матрицы О делители вида (А.— 1JР повторяются четное число раз. Аналогичное утверждение для элементарных делителей вида (К + 1JР мы получим, применяя доказанное уже положение к матрице —О. Таким образом, теорема доказана полностью. Докажем теперь обратную теорему. Теорема 10. Любая система степеней вида 0; /= 1, 2, .... и), I -1)9°, I (84) (<7i, ..., qv, tu ..., tw — нечетные числа) является системой элементарных делителей некоторой комплексной ортогональной матрицы О2). Доказательство. Обозначим через [ij числа, связанные с числами Kj{j=l, 2, ..., и) равенствами Xj = <Pi (/=1, 2, ...,в). Введем в рассмотрение «канонические» кососимметрические матрицы (см. предыдущий параграф) <^° G = 1,2 и); KiQ>\ ..., Ki9°\ К™, ..., К™, имеющие соответственно элементарные делители (k-Vj)Pi, fr + VjfJ (/= 1, 2, ..., и); к\ ..., %%; К\ ..., яЧ Если К — кососимметрическая матрица, то 1) Поскольку h A) =0, h' A) ф 0, то при переходе от матрицы О к матриц» Q=h(O) элементарные делители вида (К—1JР матрицы О, не расщепляясь, заме- заменяются элементарными делителями Я2зэ (см. гл. VI, § 7). 2) Некоторые (или даже все) из чисел Xj могут равняться ± 1. Одно число- или два из чисел и, v, w могут равняться нулю. Тогда элементарные делители соответствующего вида отсутствуют у матрицы О.
330 КОМПЛЕКСНЫЕ СИММЕТРИЧЕСКИЕ МАТРИЦЫ [ГЛ. XI является ортогональной (О' = ек' —е~к= О'1). При этом каждому элемен- элементарному делителю (X — ^)р матрицы К отвечает элементарный делитель {К — е»)р матрицы О1). Поэтому квазидиагональная матрица <9 = {/Ч , ..., /"и ; е^\ ..., е'^; - е^\ ...,- е«™} (85) является ортогональной и имеет элементарные делители (84). Теорема доказана. Из теорем 4, 9 и 10 вытекает Следствие. Произвольная (комплексная) ортогональная матрица О всегда ортогонально-подобна ортогональной матрице, имеющей нормаль- нормальную форму О, т. е. существует такая ортогональная матрица Olt что О = О1б<^1. (86) Примечание. Подобно тому как это было сделано для кососим- метрической матрицы К, можно конкретизировать форму диагональных клеток в нормальной форме О2). !) Это следует из того, что при /(Х)=ел имеем: /' (Х)=ел Ф 0 при любом Я 2) См. [256].
ГЛАВА XII СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ § 1. Введение 1. Настоящая глава посвящена следующей задаче: Даны четыре матрицы А, В; Ai, В^ одинаковых размеров т X п с элементами из числового поля К. Требуется найти, при каких усло- условиях существуют две квадратные неособенные матрицы Р и Q соответ- соответственно порядков тип такие, что одновременно PAQ = AU PBQ = B^). A) Вводя в рассмотрение пучки матриц А -{-KB и Ai -\-kBi, два мат- матричных равенства A) можно заменить одним равенством P(A + KB)Q^=A1 + KBi. B) Определение 1. Два пучка прямоугольных матриц А -\-КВ и Ai -\-KBi одних и тех же размеров т X п, связанные равенством B), в котором Р и Q — постоянные (т. е. не зависящие от К) квадратные неособенные матрицы соответственно порядков тип, мы будем назы- называть строго эквивалентными 2). Согласно общему определению эквивалентности Х-матриц (см. гл. VI, стр. 138) пучки А -\- KB и Л4 -f- KBi являются эквивалентными, если имеет место равенство вида B), в котором Р и Q — две квадратные Х-матрицы с постоянными и отличными от нуля определителями. При строгой же эквивалентности требуется дополнительно, чтобы матрицы Р и Q не зависели от К 3). Критерий эквивалентности пучков A -{-KB и At -f- XBi следует из общего критерия эквивалентности Х-матриц и состоит в совпадении инвариантных многочленов или, что то же, элементарных делителей пучков А + KB и Ai -|- KBi (см. гл. VI, стр. 144). В настоящей главе будет установлен критерий строгой эквивалент- эквивалентности двух пучков матриц и для каждого пучка будет определена строго эквивалентная ему каноническая форма. 1) Если такие матрицы Р ш Q существуют, то их элементы могут быть выбраны из поля К. Это вытекает из того, что равенства A) могут быть переписаны в виде РА = AiQ-1, PB = BiQ-1 и потому равносильны некоторой системе линейных одно- однородных уравнений с коэффициентами из поля К относительно элементов матриц Р и Q-1. 2) См. гл. VI, стр. 138. 3) Мы заменили встречающийся в литературе термин «эквивалентные пучки» термином «строго эквивалентные пучки» для того, чтобы резко разграничить опреде- определение 1 от определения эквивалентности из гл. VI.
332 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII 2. Поставленная задача допускает естественную геометрическую интерпретацию. Рассмотрим пучок линейных операторов A -f- КБ, ото- отображающих Бп в Rm. При определенном выборе базисов в этих про- пространствах пучку операторов A -f- KB отвечает пучок прямоугольных матриц А + KB (размером т X п); при изменении базисов в Бп и Rm пучок А + KB заменяется строго эквивалентным пучком Р (А + KB) Q, где Р hQ — квадратные неособенные матрицы порядков тип (см. гл. III, §§ 2 и 4). Таким образом, критерий строгой эквивалентности дает харак- характеристику того класса пучков матриц А + KB (размером т X п), кото- которые описывают один и тот же пучок операторов A -f- KB, отображающих Rn в i?m, при различных выборах базисов в этих пространствах. Для получения канонической формы пучка нужно найти те базисы в Вп и Мт, в которых пучок операторов A -f- KB описывается возможно более простой матрицей. Поскольку пучок операторов задается двумя операторами А и В, то можно еще сказать, что настоящая глава посвящена одновременному изучению двух операторов А и В, отображающих Rn в Rm. 3. Все пучки матриц А + KB размером т X п подразделяются на два основных типа: на регулярные и сингулярные пучки. Определение 2. Пучок матриц A -f- KB называется регу- регулярным, если 1) А и В •¦— квадратные матрицы одного и того же порядка п и 2) определитель | А + KB \ не равен тождественно нулю. Во всех остальных случаях (т Ф п или т = п, но | A -f- KB | = 0) пучок назы- называется сингулярным. Критерий строгой эквивалентности, а также каноническая форма для регулярных пучков матриц были установлены К. Вейерштрассом в 1867 г. [150] на основе его теории элементарных делителей, изложенной нами в главах VI и VII. Аналогичные вопросы для сингулярных пучков полу- получили свое разрешение позже, в 1890 г., в исследованиях Л. Кронекера [133] х). Результаты Кронекера и составляют основное содержание этой главы. § 2. Регулярный пучок матриц 1. Рассмотрим частный случай, когда пучки А + КБ и At -f- KBt состоят из квадратных матриц (т = п) и | В | Ф 0, | Bt | Ф 0. В этом случае, как было доказано в главе VI (стр. 140), два понятия «эквива- «эквивалентность» и «строгая эквивалентность» пучков совпадают. Поэтому, при- применяя к пучкам общий критерий эквивалентности 7,-матриц (стр. 148), приходим к теореме: Теорема 1. Два пучка квадратных матриц одного и того же порядка А + KB и А^ + КВи у которых \В\Ф0и\В1\ф0, являются строго эквивалентными в том и только в том случае, когда эти пучки имеют одни и те же элементарные делители в поле К. Пучок квадратных матриц А + КБ с | В | Ф 0 в главе VI называется регулярным, поскольку он представляет собой частный случай регуляр- регулярного матричного многочлена относительно К (см. гл. IV, стр. 87). В пре- предыдущем параграфе настоящей главы мы дали более широкое определе- определение регулярного пучка. Согласно этому определению в регулярном пучке возможно равенство | В | = 0 (и даже \ А | = | В \ = 0). *) Из дальнейших исследований, в которых по-иному трактуются сингулярные пучки матриц, укажем на [996, 251, 207а].
§ 2] РЕГУЛЯРНЫЙ ПУЧОК МАТРИЦ 333 Для того чтобы выяснить, сохранится ли теорема 1 для регулярных пучков (при расширенном определении 1), рассмотрим следующий пример: А + КВ = 2 3 3 1 2 2 3 5 6 1 1 1 1 1 1 2 2 3 2 1 1 1 2 1 1 1 1 1 1 i l l l l l l C) Нетрудно видеть, что здесь каждый из пучков А + KB и4( -f- КВХ имеет только один элементарный делитель К -\-1. В то же время эти пучки не являются строго эквивалентными, так как матрицы В и Вх имеют соответственно ранги 2 и 1, а иэ равенства B), если бы оно имело место, следовало бы, что ранги матриц В и Вх равны между собой. При этом пучки C) являются регулярными согласно определению 1, так как Разобранный пример показывает, что теорема 1 неверна при расши- расширенном определении регулярного пучка. 2. Для того чтобы сохранить теорему 1, нам придется ввести поня- понятие о «бесконечных» элементарных делителях пучка. Будем пучок А + KB задавать при помощи «однородных» параметров К, ц : \iA + КВ. Тогда определитель Д (К, ц) = | \iA + KB | будет однородной функцией от К, ц. Определяя наибольший общий делитель Dh (К, ц) всех миноров А-го порядка матрицы \iA + KB (к =¦ 1, 2, . . ., п), получим инвариантные многочлены по известным формулам ; п „у при этом все Dk (К, ц) и ij (К, ц) — однородные относительно К и ц мно- многочлены. Разлагая инвариантные многочлены на степени неприводимых в поле К однородных многочленов, получим элементарные делители €а (К ц) (ее = 1, 2, . . .) пучка \iA + KB в поле К. Совершенно очевидно, что, полагая \i = 1 в еа (Я, \i), мы вернемся к элементарным делителям еа (К) пучка А + КВ. Обратно, из каждого элементарного делителя еа (К) степени д пучка А -{-КБ мы получим соответ- соответствующий элементарный делитель еа (К, ц) по формуле еа (К, ц) =[iqeaf — ) . Таким способом могут быть получены все элементарные делители пучка цА + КБ за исключением элементарных делителей вида ц«. Элементарные делители вида ц« существуют в том и только в том случае, когда | В | = 0, и носят название «бесконечных» элементарных делителей для пучка А + КВ. Поскольку из строгой эквивалентности пучков А + KB и Ai -j- KB± следует строгая эквивалентность пучков \iA + KB и ц-Дл + ЯБл, то у строго эквивалентных пучков А -)- KB и к4 + XZ?! должны совпадать не только «конечные», но и «бесконечные» элементарные делители. Пусть теперь даны два регулярных пучка А + KB и А х + КВи у кото- которых соответственно совпадают все (в том числе и бесконечные) элементар- элементарные делители. Введем однородные параметры: \iA -j- KB, \iAv + X^. Преобразуем параметры: В новых параметрах пучки запишутся так: \*,А -f- + где
334 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII В — РИ + otjjB, Bx = $\Ai + ajix. Из регулярности пучков \iA -{-'KB и (-L^i -f~ XjBj вытекает, что можно подобрать числа сц и |3] так, чтобы \В\Ф0 ш \~В,\ФО. Поэтому согласно теореме 1 пучки \х,А -\- кВ и jx^t + ЯБ^ а следо- следовательно, и исходные пучки \ьА + KB и ^y4t + ЯБ4 (или, что то же, A -f- -(- Я73 и ^t Ь Xi5i) строго эквивалентны. Таким образом, мы пришли к следующему обобщению теоремы 1. Теорема 2. Для того чтобы два регулярных пучка А -j- ЯВ к 4, + КВ± были строго эквивалентны, необходимо и достаточно, чтобы эти пучки имели одни и те же («конечные» и «бесконечные») элементар- элементарные делители. В разобранном ранее примере пучки C) имели один и тот же «конеч- «конечный» элементарный делитель Я+1, но отличались «бесконечными» элемен- элементарными делителями (первых! пучок имеет один «бесконечных!» элементарный делитель ц2, а второй — два: (л, \i). Поэтому эти пучки и не оказались строго эквивалентными. 3. Пусть теперь дан произвольный регулярный пучок А-{-КВ. Тогда существует такое число с, что | A -f- сВ \ Ф 0. Данный пучок представим в виде А±-\-{к — с)В, где Ai = A-\~cB и потому [Л^^О. Умножим пучок слева на А^1: Е-\-(Х — с)А~1В. Преобразованием подобия приводим этот пучок к виду Е + (X - с) {/„, /4} =~{Е- cJ0 -f Я/о, E — cJi + XJt} i), D) где {Jo, Ji} — квазидиагональная нормальная форма матрицы А~*В, /0 — жорданова нильпотентная2) матрица, а | /41 Ф 0. Первый диагональный блок правой части D) умножим на (Е — с/о). Получим: EJrlk(E — cJ0)~lJ0. Здесь коэффициент при К — нильпотентная матрица3). Поэтому преобразованием подобия этот пучок можно привести к виду . E) Второй диагональный блок в правой части D) умножением на /~\ а затем преобразованием подобия может быть приведен к виду J-\-\Е, где/ — матрица, имеющая нормальную форму5), а Е — единичная матрица. Мы пришли к теореме Теорема 3. Произвольный регулярный пучок А-\-KB может быть приведен к (строго эквивалентному) каноническому квазидиагональному виду 2\ ...,NiUs), х) Единичные матрицы Е в диагональных блоках правой части D) имеют соот- соответственно те же порядки, что /0 и Ji- 2) То есть /р =0 при некотором целом I ^> 0. 3) Из 4=0 следует: [(Е—е/0)-1/0]'=0. 4) Здесь ?(г1) — единичная матрица порядка и, а #<">—матрица порядка и, у которой элементы первой наддиагонали равны единице, а остальные элементы равны нулю. 5) Поскольку здесь матрицу / можно заменить любой матрицей, ей подобной, то можно считать, что / имеет любую нормальную форму [например, естественную первого рода или второго рода или жорданову (см. гл. VI, § 6)].
§ 3] СИНГУЛЯРНЫЕ ПУЧКИ. ТЕОРЕМА О ПРИВЕДЕНИИ 335 где первые s диагональных блоков соответствуют бесконечным элемен- элементарным делителям ц,"*, \iU2, ..., \x,Us пучка А -\-ХВ, а нормальная форма последнего диагонального блока J-{-kE однозначно определяется конеч- конечными элементарными делителями данного пучка. § 3. Сингулярные пучки. Теорема о приведении Переходим к рассмотрению сингулярного пучка матриц А -\- KB с раз- размерами т X п. Обозначим через 7' ранг пучка, т. е. наибольший из порядков миноров, не равных тождественно нулю. Из сингулярности пучка следует, что всегда имеет место по крайней мере одно из неравенств г <Zn или r<Zm. Пусть j<Zn. Тогда столбцы Х-матрицы А-\-\В линейно зависимы, т. е. уравнение {А + Щх = 0, G) где х — искомый столбец, имеет ненулевое решение. Каждое ненулевое решение этого уравнения определяет некоторую линейную зависимость между столбцами Х-матрицы А + ЯВ. Мы ограничимся только теми реше- решениями х(К) уравнения G), которые являются многочленами относитель- относительно К1), и среди этих решений возьмем решение наименьшей степени е х (I) = хо — Ьх1 + К*х2 _...+(_ If ХехЁ (хЕ^0). (8) Подставляя это решение в G) и приравнивая нулю коэффициенты при степенях К, получим: Ахо = О, Вхо — Ах^О, Bxi — Ax2 = 0, ..., ВхЁ^ — АхЁ = О, Вхв = О. (9) Рассматривая эту систему равенств как систему линейных однородных уравнений относительно элементов столбцов х0, —хи -\-хг, .-., (—1)ехе, заключаем, что матрица коэффициентов этой системы ?+1 Ме = МЕ [А + 1В] = А О В А О В .. о имеет ранг Qe . А О 6 ... В (e -f-1) п. В то же время в силу минимального свойства A0) числа е для рангов q1; QE_t матриц А 0 0 А В А 0 В А А В A0') о .. имеют место равенства q0 = n, Qt = 2п, ..., Qe_i = гп. *) Для определения элементов столбца х, удовлетворяющего уравнению G), приходится решать систему линейных однородных уравнений, у которых коэффициен- коэффициенты при неизвестных линейно зависят от Я. Базисные линейно независимые решения х всегда могут быть выбраны так, чтобы их элементами были многочлены от Я.
336 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII Таким образом, число е есть наименьшее значение индекса к, при котором в соотношении Q& <; (к +1) п имеет место знак <. Теперь мы сформулируем и докажем следующую фундаментальную теорему: Теорема 4. Если уравнение G) имеет решение минимальной сте- степени е м8>0, то данный пучок А-\-KB строго эквивалентен пучку вида Ье О О А + КВ (И) где Е+1 К 1 О О Я, 1 о о о о Я 1 A2) а А-\-КВ — пучок матриц, для которого уравнение, аналогичное G), не имеет решений степени < 8. Доказательство теоремы разобьем на три этапа. Сначала дока- докажем, что данный пучок A-j-KB строго эквивалентен пучку вида LE D + XF О A3) где D, F, А, В — постоянные прямоугольные матрицы соответственных размеров. Затем установим, что уравнение (А-\-КВ)х = 0 не имеет реше- ний х (Я) степени < е. После этого мы покажем, что дальнейшими пре- преобразованиями пучок A3) может быть приведен к квазидиагональному виду A1). 1. Первую часть доказательства облечем в геометрическую форму. Вместо пучка матриц А-\-КВ рассмотрим пучок операторов А-\-КВ, ото- отображающих JBn в JBm, и покажем, что при надлежащем выборе базисов в этих пространствах матрица, соответствующая оператору Л + КБ, будет иметь форму A3). Вместо, уравнения G) возьмем векторное уравнение (А+КВ)х = 0 с векторным решением x(K) = xo—Kxi + K2x2—...+( — 1)еКехе; равенства (9) заменятся векторными равенствами Ниже мы докажем, что векторы Ахи AXz, ..., Ахе A4) A5) = 0. A6) A7)
3] СИНГУЛЯРНЫЕ ПУЧКИ. ТЕОРЕМА О ПРИВЕДЕНИИ 337 линейно независимы. Отсюда легко будет следовать линейная независимость векторов х0, хи ..., хг. A8) Действительно, поскольку Ах0 = 0, из аохо -f- а^ + ...-}- aaxs = О находим: щАхг + ... -}- о,еАхе = 0, откуда в силу линейной независимости векторов A7) а1 = а2= ... =aE = 0. Но х0ф0, поскольку в противном случае -«-ас (Я) было бы решением уравнения A4) степени е—1, что невоз- невозможно. Поэтому и ао = О. Если теперь принять векторы A7) и A8) в качестве первых базисных векторов для новых базисов соответственно в Вт и Вп, то в новых базисах операторам А и В в силу A6) будут соответствовать матрицы (f 0 6 0 0 1 0 6 0 0 e+1 ¦- 1 .. . 0 . 0 .'i . 0 . 0 ж ж ж ж ж .... ж ../ж * ... ж ... ж е+1 , в = 1 0 ... О 0 ж ., О 1 ... О О >К ., о о ... 1 о ж ... О 0... О О Ж ... ж ж О О ... О О ... ж тогда Я-матрица А-\-КВ будет иметь вид A3). Все предыдущие рас- рассуждения будут обоснованными, если мы докажем, что векторы A7) линейно независимы. Допустим противное, и пусть Axh(h^l) — первый в ряду A7) вектор, линейно зависящий от предыдущих векторов: Axh = а^АХь.-! +a2Axh-z+ ... -^ац-^Ах^ В силу A6) это равенство может быть переписано так: Bxh-i = щВХн-2 + azBxh-3 + .. т. е. где Далее, опять в силу A6) Ax%-i = В (acft_2—с^асд-з — ... — aft_2aco) «= Вх%-2, где Продолжая этот, процесс далее и вводя еще векторы ас?_з = ась_3—<xiacA_4 —... — aft_3ac0, ..., x*t = xt — с^асо, xt = x0, 22 ф. р. Гантмахер
338 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII мы получим цепочку равенств A9) Из A9) следует, что х* (Я) = х%- Ъс есть ненулевое решение уравнения A4) степени <:А—1<8, что невоз- невозможно. Таким образом, векторы A7) линейно независимы. 2. Докажем теперь, что уравнение (А -)- KB) х — 0 не имеет решений степени <8. Сначала обратим внимание на то, что уравнение Ley = Ot как и уравнение G), имеет ненулевое решение наименьшей степени е. В этом можно убедиться непосредственно, если матричное уравнение Ley = О заменить системой обыкновенных уравнений = 1, 2, ..., e+i). = (У1, У2, ..-, Уе+i)], откуда уй = (-1)'$-1у1Я'!-1 С другой стороны, если пучок имеет «треугольный» вид A3), то соответствующие этому пучку матрицы Mk(k = O, 1, , е) [см. A0) и A0') на стр. 335] после надлежащей перестановки строк и столбцов также могут быть приведены к треугольному виду Mh[Le] 0 Mk B0) При к = 8—1 все столбцы этой матрицы, а значит, и столбцы мат- матрицы Me-i [Le], линейно независимы г). Но Мг-\ [Ье] — квадратная матрица порядка е(е+1). Поэтому и в матрице Ме_1[Л-)-ЯВ] все столбцы линейно независимы, а это, как было выяснено в начале параграфа, означает, что уравнение (А-]-кВ)х = 0 не имеет решений степени <1е—1, что и требовалось доказать. 3. Заменим пучок A3) строго эквивалентным ему пучком Ei У О Я, LB D + XF О А + ХВ Е3-Х О Et 0 А + КВ , B1) где Еи Е2, Е3, Еь — квадратные единичные матрицы соответственно поряд- порядков е, т — е, 8 + 1 и п — 8—1, а X, Y — произвольные постоянные прямо- прямоугольные матрицы соответствующих размеров. Наша теорема будет пол- полностью доказана, если мы покажем, что матрицы X и У могут быть выбраны так, чтобы имело место матричное равенство LBX = D + KF + У (А + KB). B2) !) Это следует из того, что ранг матрицы B0) при &=е—1 равен еи; ана- аналогичное равенство имеет место для ранга матрицы Me^t [Le].
3] СИНГУЛЯРНЫЕ ПУЧКИ. ТЕОРЕМА О ПРИВЕДЕНИИ 339 Введем обозначения для элементов матриц D, F, X, а также для строк ***** *"*N. матрицы У и для столбцов матриц А, В: 0 = 11**11, F = |l/*l|, X =11**11 (г = 1, 2, ..., е; fc=l, 2, .... п—е-1; / = 1, 2, ..., e + 1), Y = Уе = (au a2, = (Ъи b2 Тогда матричное уравнение B2) можно заменить системой скалярных уравнений, записывая, что элементы к-то столбца в левой и правой частях равенства B2) соответственно равны друг другу (А=1, 2, .... п—г—1): x2k + Kxlk = bk, xe+l, h = l, 2, eah 4- ЯуЕ 8—1). B3) В левых частях этих равенств стоят линейные двучлены относи- относительно Я. Свободный член каждого из первых е—1 этих двучленов равен коэффициенту при Я в следующем двучлене. Но тогда и правые части должны удовлетворять этому условию. Поэтому —уФъ. = hk — Уе-ФЪ. — УеЬк = feh — ^е-1, ft (ft = l, 2, ..., « —8—1). B4) Если равенства B4) имеют место, то, очевидно, из B3) можно определить искомые элементы матрицы X. Теперь осталось показать, что система уравнений B4) относительно эле- элементов матрицы У всегда имеет решение при любых dih и fik (t = 1, 2,..., е; к = 1, 2, ..., п — е — 1). Действительно, матрица, составленная из коэф- коэффициентов при неизвестных элементах строк уи — у2, 4" Уз» — J/4» • • ч может быть записана после транспонирования в виде е-1 А 0. ... О В А. О В • ¦ О 0 ... В 22*
340 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII Но, эта матрица является матрицей Ме_2 для пучка прямоугольных матриц А-\-КВ [см. A0') на стр. 335]. Ранг же этой матрицы равен (е—1) (п—е —1), поскольку по доказанному уравнение (А-\-КВ)х = 0 не^имеет решений степени <С е. Таким образом, ранг системы уравнений B4) равен числу уравнений, а такая система при любых свободных членах является совместной (непротиворечивой). Теорема доказана полностью. § 4. Каноническая форма сингулярного пучка матриц Пусть дан произвольный сингулярный пучок матриц А-\-КВ разме- размеров тхп. Допустим сначала, что как между столбцами, так и между строками этого пучка нет линейной зависимости с постоянными коэф- коэффициентами. Пусть г<и, где г—ранг пучка, т. е. столбцы пучка А + KB линейно зависимы между собой. В этом случае уравнение (А + KB) x = 0 имеет ненулевое решение минимальной степени ё4. Из принятого в начале этого параграфа ограничения следует, что ej > 0. Поэтому согласно тео- теореме 4 данный пучок можно преобразовать к виду 0 где уравнение (Ai-{-kBi)xll'> = 0 не имеет решений ж*1) степени Если это уравнение имеет ненулевое решение минимальной степени е2 (при этом непременно 82>8!), то, применяя к пучку Al-\-KBi теорему 4, мы данный пучок преобразуем к виду /е1 0 0 0 L82 0 0 0 А2+КВ2 Продолжая этот процесс далее, мы приведем данный пучок к квази- квазидиагональному виду 0 B5) 0 где 0 <; 8j ^ 82 <;... ^ ер, а уравнение (Ар + КВР) ж<р) = 0 не имеет ненуле- ненулевых решений, т. е. столбцы матрицы Ар-\-%Вр линейно независимы1). Если строки пучка Ар-\-%Вр линейно зависимы, то транспонированный пучок Ар = КВ'рможет быть приведенк виду B5), где вместо чисел et,е2, ..., ер ^Очевидно, что е!+е2+ ... +ep<m, Bj + e^ ... +вр+р < п. Эти соотно- соотношения могут стать равенствами лишь одновременно. В этом случае блок Ар-\-%Вр будет отсутствовать.
S4] КАНОНИЧЕСКАЯ ФОРМА СИНГУЛЯРНОГО ПУЧКА МАТРИЦ 341 будут фигурировать числа @<C)%<!irJ<^... ^^g1)- Но тогда данный пучок А-\-КВ окажется преобразованным к квазидиагональному виду :~ о B6) О @<Е1<е2<...<8р, 0< где у пучка А0-{-ХВ0 как столбцы, так и строки линейно независимы, т. е. Ао-\-"КВо—регулярный пучок2). Рассмотрим теперь общий случай, когда строки и столбцы данного пучка могут быть связаны линейными зависимостями с постоянными коэффициентами. Обозначим максимальное число постоянных независи- независимых решений уравнений {А -\- KB) х = 0 и {А' -\- KB') у = О соответственно через g и h. Вместо первого ив этих уравнений, подобно тому как мы это делали при доказательстве теоремы 4, рассмотрим соответствующее векторное уравнение (A + hB)x = 0 (А и В—опера- В—операторы, отображающие Мп в Вт). Линейно независимые постоянные реше- решения этого уравнения обозначим через eit е2, ..., eg и примем за пер- первые базисные векторы в Мп. Тогда в соответствующей матрице А-\-КВ первые g столбцов будут состоять из нулей g Совершенно так же в пучке Ai-\-XBi первые h строк можно сделать нулевыми. Тогда данный пучок примет вид h(o, о ^ B8) О, Л°4-Я2?° где строки и столбцы пучка А°-\~кВо уже не связаны линейными зави- зависимостями с постоянными коэффициентами. К пучку А°-\-ХВ° применимо представление типа B6). Таким образом, в самом общем случае пучок !) Так как между.строками пучка А-\-%В, а следовательно, и пучка Ар+КВр нет линейной зависимости с постоянными коэффициентами, то %> 0. 2) Если в данном пучке г=п, т. е. столбцы пучка линейно независимы, то в B6) будут отсутствовать первые р диагональных блоков вида ?е(р=0). Точно так же, если г=т, т. е. в А-\-%В строки линейно независимы, то в B6) будут отсутствовать диагональные блоки вида ?i)(g=0).
342 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII А-\-%В всегда может быть приведен к каноническому квазидиагональ- квазидиагональному виду D0, LSg+i, ..., L8p) L;!ft+i, .... L;!g, А + ЯВо}. B9) Выбор индексов при е и т) связан с тем, что нам удобно здесь считать 6l = 82=... =8g = 0 И Т]1 = ТJ= ... =Tlft = 0. Заменяя фигурирующий в B9) регулярный пучок А0-\-кВ0 его канонической формой F) (см. § 2, стр. 334), получим окончательно следующую квазидиагональную матрицу: ™ ^V }, C0) где матрица / имеет жорданову или естественную нормальную форму, а ЛГ(М) = Я(М) + Ш(М). Матрица C0) представляет собой каноническую форму пучка А + Я2? в самом общем случае. Для того чтобы по данному пучку непосредственно определить его каноническую форму C0), не осуществляя последовательно процесс при- приведения, мы, следуя Кронекеру, в следующем параграфе введем понятие о минимальных индексах пучка. § 5. Минимальные индексы пучка. Критерий строгой эквивалентности пучков Пусть дан произвольный сингулярный пучок прямоугольных матриц А-\-КВ. Тогда к многочленных столбцов xt(k), ж2(Я), ..., xh(K), явля- являющихся решениями уравнения (А + Щх = 0, C1) будут линейно зависимыми, если ранг многочленной матрицы, составлен- составленной из этих столбцов, Х=[ж1(Я), ж2(Я), ...,жй(Я)] меньше к. В этом случае существует к многочленов Pi(h), Pz(ty, •••» Рь(Я), не равных одновременно тождественно нулю, таких, что Р1(Ц*1М + Р2(ЦМЦ + • ¦ .+рк(Цхк(Ц = о. Если же ранг матрицы X равен к, то подобной зависимости не суще- существует, и решения х± (К), х2 (Я), ..., хъ. (Я) линейно независимы. Среди всех решений уравнения C1) возьмем ненулевое решение xi (Я) наименьшей степени 8j. Среди всех решений того же уравнения, линейно независимых от xt (Я), выберем решение х2 (Я) наименьшей степени е2. Очевидно, что e1-^.ez. Этот процесс продолжим, выбирая среди решений, линейно независимых от х^ (Я) и х^ (Я), решение х3 (Я) минимальной сте- степени е3 и т. д. Так как число линейно независимых решений уравне- уравнения C1) всегда <га, то этот процесс должен закончиться. Мы получим фундаментальный ряд решений уравнения C1) ^(Я), Жг(Я), ..., Жр(Я) C2) со степенями e1<82<...<8p. C3) В общем случае фундаментальный ряд решений не определяется однозначно (с точностью до скалярных множителей) заданием пучка А + ^В
$ 5] МИНИМАЛЬНЫЕ ИНДЕКСЫ ПУЧКА 343 Однако два различных фундаментальных ряда решений имеют всегда один и тот же ряд степеней et, е2) ..., ер. Действительно, рассмотрим наряду с C2) второй фундаментальный ряд решений xt (Я), х2 (Я), ... со степенями ei, е2, ... Пуеть среди степеней C3) и аналогично в ряду еи е2, ... е1== ... =е~ <е~+1 = ... =е~ < .., Очевидно, что 8! = ei. Любой столбец xt(K) (i = l, 2, ..., rat) есть линей- линейная комбинация столбцов Xi (Я), х2 (Я), ..., хП1 (Я), так как в противном случае в ряду C2) можно было бы решение жП1+1 (Я) заменить реше- решением xt(K) с меньшей степенью. Очевидно, что и наоборот, любой столбец ж* (Я) (г = 1, 2, ..., щ) является линейной комбинацией столбцов ж4(Я), ж2(Я), ..., ас?1+1 (Я). Поэтому n^Wt и eni+i = e~+1. Теперь ана- аналогичными рассуждениями убеждаемся в том, что М2=п2иеП2+1=8~,1 ит. д. Каждое решение хъ (Я) фундаментального ряда C2) дает линейную зави- зависимость степени ей между столбцами матрицы А-\-ХВ (к = 1, 2, ..., р). Поэтому числа е^ е2, . -¦., ер называются минимальными индексами для столбцов пучка А-\-%В. Аналогично вводятся минимальные индексы %, тJ, , цд для строк пучка А-{-КВ. При этом уравнение (А-\-'кВ)х = 0 заменяется уравнением (А' + hB') z/ = 0 и числа %, т]2, ..., цд определяются как минимальные индексы для столбцов транспонированного пучка А'-]-ХВ'. Строго эквивалентные пучки имеют одни и те же минимальные индексы. Действительно, пусть даны два таких пучка: А + KB и Р (А-\- KB) Q (Р и Q — квадратные неособенные матрицы). Тогда уравнение C0) для пер- первого пучка после почленного умножения слева на Р может быть записано так: Отсюда видно, что все решения уравнения C0) после умножения слева на Q'1 дают полную систему решений уравнения Поэтому пучки А + ХВ и Р (А + KB) Q имеют одни и те же минимальные индексы для столбцов. Совпадение минимальных индексов для строк устанавливается переходом к транспонированным пучкам. Вычислим минимальные индексы для канонической квазидиагональ- квазидиагональной матрицы {МО, LEg+l, ..., Lep; Ь'цш, ..., 1^, Ao + Wo) C4) Ыо + ЯБ0 — регулярный пучок, имеющий нормальную форму F)]. Заметим предварительно, что полная система минимальных индексов для столбцов (строк) квазидиагональной матрицы получается соединением из соответствующих систем минимальных индексов отдельных диагональ- диагональных блоков. Матрица Le имеет только один индекс е для столбцов, а строки этой матрицы линейно независимы. Точно так же матрица L'n имеет только •один индекс г\ для строк, а столбцы этой матрицы линейно независимы. Регулярный пучок Ао + КВ0 совсем не имеет минимальных индексов.
344 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII Поэтому матрица C4) имеет минимальные индексы для столбцов е4 = ... = eg = 0, 8g+i, ..., 6Р, а для строк 0 Заметим еще, что матрица Le не имеет элементарных делителей, так как среди ее миноров максимального порядка е имеется минор, равный единице, и минор, равный Яе. Это же положение, разумеется, верно и для транспонированной матрицы L'e. Так^как элементарные делители квазидиа- квазидиагональной матрицы "получаются путем соединения элементарных делите- делителей отдельных диагональных блоков (см. гл. VI, стр. 146), то элементар- элементарные делители Х-матрицы C4) совпадают с элементарными делителями ее регулярного «ядра» Ао + ХВ0. Каноническая форма пучка C4) вполне определяется заданием мини- минимальных индексов еи . . ., ер, i\u . . ., цд и элементарных делителей этого пучка или (что то же) строго эквивалентного ему пучка А + ХВ. Так как два-лучка, имеющих одну и ту же каноническую форму, строго эквивалентны между собой, то мы доказали следующую теорему: Теорема 5 (К р о н е к е р а). Для того чтобы два произвольных пучка прямоугольных матриц А + ХВ и А\ -f- XBt одних и тех же разме- размеров т X п были строго эквивалентны, необходимо и достаточно, чтобы эти пучки имели одни и те же минимальные индексы и одни и те же («конечные» и «бесконечные») элементарные делители. В заключение для наглядности выпишем каноническую форму пучка А + ХВ, имеющего минимальные индексы et = 0, е2 = 1, е3 = 2, Ц\ = = 0, т]2 = 0, т]3 = 2 и элементарные делители Я2, (Я -\- 2J, ц3; О О Я 1 Я 1 О О Я 1 я о 1 Я О 1 ! 1 Я О 0 1 Я оо 1 % 1 о я Я + 2 1 0 Я + 2 C5) х) Все неотмеченные элементы этой матрицы равны нулю.
§ 6] СИНГУЛЯРНЫЕ ПУЧКИ КВАДРАТИЧНЫХ ФОРМ 345 § 6. Сингулярные пучки квадратичных форм Пусть даны две комплексные квадратичные формы: п п А (х, х) = 2 ЪъР&ъ., В (х, х) = 2 bikXiXk; C6) i, к=1 {, ь=1 они порождают пучок квадратичных форм А (х, х) + KB (х, х). Этому пучку форм соответствует пучок симметричных матриц А + ХВ(А' = А, В' = В). Если мы в пучке форм А (х, х) -\- "KB (x, х) переменные подвергнем неособен- неособенному линейному преобразованию х = Tz (| Т | Ф 0), то преобразованному пучку форм A (z, z) -\- KB (z, z) будет соответствовать пучок матриц C7) здесь Т—постоянная (т. е. не зависящая от Я) неособенная квадратная матрица n-го порядка. Два пучка матриц А+КВ и А + ХВ, связанные тождеством C7), называются конгруэнтными (ср. с определением 1 гл. X, стр. 269). Очевидно, что конгруэнтность представляет собой специальный частный случай строгой эквивалентности пучков матриц. Однако в тех случаях, когда рассматривается конгруэнтность двух пучков симметрических (или кососимметрических) матриц, понятие конгруэнтности совпадает с понятием строгой эквивалентности. Это утверждает Теорема 6. Два строго эквивалентных пучка комплексных сим- симметрических (или кососимметрических) матриц всегда конгруэнтны между собой. Доказательство. Пусть даны два строго эквивалентных пучка симметрических (кососимметрических) матриц Л==А-\-КВ и Л = ^+Я5: Л = РЛ()(Л'=±Л, -Лг=±Л; \Р\Ф0, №\ФО). C8) Переходя к транспонированным матрицам, получаем: A = Q'AP'. C9) Из C8) и C9) найдем: Л?Р'-1 = р-1@'Л- D0) Полагая U = QP'-\ D1) равенство D0) перепишем так: AU = U'A. D2) Из D2) легко следует: AUh = U'kA (k = 0, 1, 2, ...), и вообще AS = S'A, D3) где S = f(U), D4) а /(Я) — произвольный многочлен относительно Я. Допустим, что этот многочлен так выбран, что | S | Ф 0. Тогда из D3) найдем: D5)
346 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII Подставляя полученное выражение для Л в C8), будем иметь: A^PS'AS^Q. D6) Для того чтобы это соотношение было преобразованием конгруэнт- конгруэнтности, нужно, чтобы выполнялось равенство {PS')' = S^Q, которое может быть переписано так: Но матрица S = / (U) удовлетворит этому уравнению, если в качестве / (Я,) взять интерполяционный многочлен ~\/~Х на спектре матрицы U. Это воз- возможно сделать, поскольку многозначная функция У К имеет однозначную ветвь, определенную на спектре матрицы U, так как | U \ Ф 0. После этого равенство D6) станет условием конгруэнтности А = Т'АТ {T = SQ = VQP'-iQ). D7) Из доказанной теоремы и из теоремы 5 вытекает Следствие. Два пучка квадратичных форм А (ж, х) + KB (х, х) и A (z, z) + IB (z, z) могут быть переведены друг в друга преобразованием х = Tz (| Т \ Ф 0) тогда и только тогда, когда пучки симметрических матриц А-\-ХВ и А -\-ХВ имеют одни и те же элементарные делители («конечные» и «бесконечные») и одни и те же минимальные индексы. Примечание. Для пучка симметрических матриц строки и столбцы имеют одни и те же минимальные индексы: /> = g; Ei = %, •-., Ер = т]р. D8) Поставим [Следующий вопрос. Даны две произвольные комплексные квадратичные формы п п А (ж, х) = 2 aibPiXh, В (ж, х) = 2 bthXiXh. г, fe=l i, fe=i При каких условиях неособенным преобразованием переменных x = Tz I T | Ф 0) можно одновременно привести эти формы к суммам квадратов So,*t и 2 ад? D9) Аналогичный вопрос возникает для двух эрмитовых форм А (ж, ж) и В (ж, х), но в этом случае вместо D9) следует писать: п п 2 OjZjZj и 2 fowl, E0) i=i i=l причем здесь аг и Ъг (? = 1, 2, ..., п) — вещественные числа. Допустим, что квадратичные формы А (х, х) и В (ж, ж) обладают указанным свойством. Тогда пучок матриц А-\-ХВ будет конгруэнтен пучку диагональных матриц u аг + lbz, ..., ап + kbn}. E1)
6] СИНГУЛЯРНЫЕ ПУЧКИ КВАДРАТИЧНЫХ ФОРМ 347 Пусть среди диагональных двучленов at-{-kbi имеется ровно () не равных тождественно нулю. Не нарушая общности, можем считать, что Полагая мы матрицу E1) представим в виде Ао + kbn}, E2) Сопоставляя E2) с C4) (стр. 343), мы видим, что в данном случае все минимальные индексы равны нулю. Кроме того, все элементарные делители имеют первую степень. Мы пришли к теореме Теорема 7. Две квадратичные формы А (х, х) и В (ж, х) одно- одновременным преобразованием переменных могут быть приведены к сум- суммам квадратов [D9) или E0)] в том и только в том случае, когда у пучка матриц А-\-КВ все элементарные делители ^конечные и беско- бесконечные) первой степени, а все минимальные индексы равны нулю. Для того чтобы в общем случае одновременно привести две квадратичные формы А (х, х) и В (х, х) к некоторому каноническому виду, нужно заменить пучок матриц А + КВ строго эквивалентным ему «кано- «каноническим» пучком симметрических матриц. Пусть пучок симметрических матриц А-\-кВ имеет минимальные индексы е4 = .. s = eg = 0, eg+1 Ф 0, ..., ер Ф 0 и элементарные делители бесконечные у ?*, ., [Iй* и конечные 30 h ( у, [ ( ) ( ) ) Тогда в канонической форме C0) g = h, p = q и eg+1 = %+i, ..., ер = ЦР- Заменим в C0) каждые два диагональных блока вида LB и L'e одним диагональным блоком I , п ) ' а кажДый блок вида iV(u) = Е( -\- %WU' заменим строго эквивалентным симметрическим блоком 0 0 ... 0 1 0 0 ... 1 Я 1 к ... 0 0 V 0 0 ... 0 1 0 0 ... 1 0 1 0 ... 0 0 E3) Кроме того, вместо регулярного диагонального блока J-\-XE в C0) (J — жорданова матрица) {C) {C)} E4) возьмем строго эквивалентный ему пучок E5)
348 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII где О О F = l,2 t). 1 ... О Пучок А-\-КВ строго эквивалентен симметрическому пучку E6) = О, О L' о l; E7) Две квадратичные формы с комплексными коэффициентами А (х, х)? и В (х, х) преобразованием переменных х = 7У( | Т \ Ф 0) могут быть одно- одновременно приведены к каноническому виду A (z, z) и В (z, z), определяемому равенством E7). § 7. Приложения к дифференциальным уравнениям Рассмотрим приложения полученных результатов к интегрированию системы т линейных дифференциальных уравнений первого порядка с п неизвестными функциями с постоянными коэффициентами1) dxh (*¦•=*.2, ..., E8) или в матричной записи: здесь E9) ^ = 1К-ь1[. .-В —l|bjh|| (i = l, 2, .....тр; A = l, 2, ...,n), Ж = (jCi, Жг, . • • i #„), / = (/4, /2, . . ., fm) 2). Введем новые неизвестные функции zu z2, ..., zn, связанные са старыми a;4, Ж2, • • •» xn линейным неособенным преобразованием с *) Частный случай, когда т=п и система E8) разрешена относительно произ- производных, был подробно исследован в гл. V, § 5. Как известно, система линейных дифференциальных уравнений с постоянными коэффициентами любого s-ro порядка может быть приведена к виду E8), если все- производные от неизвестных функций до (s—1)-го порядка включительно дополни- дополнительно ввести в качестве новых неизвестных функций. 2) Напоминаем, что круглыми скобками обозначается столбцевая матрица. Так, aj=(:Ej, a?2, ..., хп)—столбец с элементами xit x%, ..., a^j.
7] ПРИЛОЖЕНИЯ К ДИФФЕРЕНЦИАЛЬНЫМ УРАВНЕНИЯМ 349 постоянными коэффициентами: x^Qz [« = («!, z2 zn); |Q|ф0]. F0) Кроме того, вместо уравнений E8) можно взять любые т независи- независимых линейных комбинаций их, что равносильно умножению матриц А, В, / слева на квадратную неособенную матрицу m-го порядка Р. Подставляя Qz вместо х в E9) и умножая E9) почленно слева на Р, получим: F1) где 1= PAQ, S = PBQ, 7= Pf = G,, %,..., %). F2) При этом. пучки матриц A -j- KB и А + ЯБ строго эквивалентны друг ДРУгу: 2-\- КБ = Р (Л + hB) Q. F3) Выберем матрицы Р и Q так, чтобы пучок Jt + ЯБ имел канони- каноническую квазидиагональную форму = {0, L g+1, . F4) В соответствии с диагональными блоками в F4) система дифферен- дифференциальных уравнений распадается на v — p — g-\-q—h-\-s-\-2 отдельных систем вида 0-z~7, F5) z = - (" > / d \ (i = l,2, ...,p-g), (/=1,2, ...,q-) f (k=l, 2, ..., s), V V F6) F7) F8) F9) где 1 z 2 Z • V Z . 7= 7 7 V 7 G0) zg). / = (/1, ¦••, /ft). z==(zg+1, ...), / = (/ft+i, • ТГ, если • •)ит. д., G1) G2)
350 СИНГУЛЯРНЫЕ ПУЧКИ МАТРИЦ [ГЛ. XII Таким образом, интегрирование системы E9) в самом общем случае сведено к интегрированию частных систем F5) — F9) такого же типа. В этих системах пучок матриц А-\-кВ имеет соответственно вид 0, LEt L'v, N{u), J+KE. 1) Для того чтобы система F5) не была противоречивой, необходимо и достаточно, чтобы 1 Г=о, т. е. /, = 0, ..., Тн = О. G3) В этом случае в качестве неизвестных функций zu zz, ..., zg, составляю- составляющих столбец z, могут быть взяты произвольные функции от t. 2) Система F6) представляет собой систему вида L ( — ) z=/ или в подробной записи v^feitI). G5) Такая система всегда совместна. Если в качестве ze+1(f) взять произ- произвольную функцию от t, то последовательными квадратурами из G5) опре- определятся все остальные неизвестные функции ze, ze-u ..., z±. 3) Система F7) представляет собой систему вида или в подробной записи ^ -ftW. %i = 7wM*). G7) Из всех уравнений G7), кроме первого, мы однозначно определяем 7 ' J_ J_/ 4\Ч-1 +1 /-7QV — h— dt +•••+( — !) — n_t ¦ . Ge) Подставляя полученное выражение для zt в первое уравнение, получаем условие совместности: х) Мы изменили индексы при z mf для упрощения обозначений. Для того чтобы от системы G5) вернуться к системе F6), нужно в заменить на ег и к каждому индексу при z прибавить g+eg+1+... +eg+i-i + *—I, а к каждому индексу при Jследует прибавить ft+eg+i+...+eg+?_i. 2) Здесь, как и в предыдущем случае, мы изменили обозначения. См. преды- предыдущую сноску.
§ 7] ПРИЛОЖЕНИЯ К ДИФФЕРЕНЦИАЛЬНЫМ УРАВНЕНИЯМ 351 4) Система F8) представляет собой систему вида ** (?)'=? (80> или в подробной записи ^ 7 § = 72, ..-, ^ + *u-l = 7u-l, *u = 7u. (81) Отсюда последовательно однозначно определяем решение z _7 z -7 -^ г_г_^.4-^- 4-f-ir (82) 5) Система F9) представляет собой систему вида § = J. (83) Как было показано в главе V, § 5, общее решение такой системы имеет вид г z = e-J% + J e-J('-t) / (т) dx; (84) о здесь z0 — столбец с произвольными элементами (начальными значениями неизвестных функций при t — 0). Обратный переход от системы F1) к системе E9) осуществляется фор- формулами F0) и F2), согласно которым каждая из функций ж1} . . ., хп является линейной комбинацией функций z±, . . ., г„,, а каждая из функ- функций /i (t), . . ., fm (t) линейно (с постоянными коэффициентами) выра- выражается через функции fi(t), . . ., fm (t). Проведенный анализ показывает, что для совместности системы E8) в общем случае должны выполняться некоторые определенные линейные конечные и дифференциальные зависимости (с постоянными коэффициен- коэффициентами) между правыми частями уравнений. Если эти условия выполнены, то общее решение системы содержит (в общем случае) линейно как произвольные постоянные, так и произ- произвольные функции. Характер условий совместности и характер решений (в частности количество произвольных постоянных и произвольных функций) опреде- определяются минимальными индексами и элементарными делителями пучка А + "KB, поскольку от этих индексов и делителей зависит каноническая форма системы дифференциальных уравнений F5) — F9).
ГЛАВА XIII МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ В этой главе изучаются свойства вещественных матриц с неотрица- неотрицательными элементами. Эти матрицы находят себе существенное примене- применение в теории вероятностей при исследовании цепей Маркова («стохасти- («стохастические матрицы», см. [25]) и в теории малых колебаний упругих систем {«осцилляционные матрицы», см. [7]). § 1. Общие свойства Начнем с определения. Определение 1. Прямоугольную матрицу А с вещественными элементами А = @ik | (^== 1» ^i • • • t w^J к = 1, 2iy • •«9 Т1) мы будем называть неотрицательной (обозначение: Л>0) или положи тельной (обозначение: Л>0), если все элементы матрицы А неотрица- неотрицательны (соответственно положительны): Ojfc>-0 (соответственно >0). Определение 2. Квадратная матрица Л = ||агй||" называется раз- разложимой, если при некотором разбиении всех индексов 1, 2, , п на две дополнительные системы (без общих индексов) ?lt iz, ..., i^; ки к2, ..., kv (ц -\- v = п) .. (а = 1, z, ..., ц; р = 1, Z, ...-, v). В противном случае матрицу А будем называть неразложимой. Под перестановкой рядов в квадратной матрице А = || atk ||? мы будем понимать соединение перестановки строк с такой же перестановкой столбцов матрицы А. Определение разложимой и ^неразложимой матриц может быть сфор- сформулировано так: Определение 2'. Матрица Л = ||агь||" называется разложимой, если перестановкой рядов она может быть приведена к виду В О С D где В и D — квадратные матрицы. В противном случае матрица А назы вается неразложимой. Пусть матрица А = ([ агь ||" соответствует линейному оператору Л в n-мерном векторном пространстве R с базисом eit е2, ..., е„. Пере-
§ 1] ОБЩИЕ СВОЙСТВА 353 становке рядов в матрице А соответствует перенумерация базисных торов, т. е. переход от базиса еи е2, ..., е„ к новому базису ^ = е,-ц е\ = ej2, ..., е'п = ejn, где (Д, j2> . ¦ ¦, fn) — некоторая перестановка индексов 1, 2, ..., п. При этом матрица А переходит в подобную ей матрицу А — Т~1АТ (в каждой строке и в каждом столбце преобразующей матрицы Т один элемент равен единице, а все остальные элементы равны нулю). Под "V-мерным координатным подпространством в И мы будем понимать любое подпространство в В с базисом е^ , е* , ..., е^ A <!&!<; /с2<С ... <С&у<;п). С каждым базисом et, е2, ..., еп простран- пространства Л связаны Си v-мерных координатных подпространств. Определение разлджимой матрицы может быть еще дано в следующей форме: Определение 2". Матрица -4 = ||огь||" называется разложимой в том и только в том случае, если соответствующий этой матрице опера- оператор А имеет v-мерное инвариантное координатное подпространство cv<n. Докажем следующую лемму: Лемма 1. Если А~>0 — неразложимая матрица и п—порядок матрицы А, то (Е + Л)"-1>0. A) Доказательство. Для доказательства леммы достаточно показать, что для любого вектора (столбцаI) i/>0 (уфО) имеет место неравенство Это же неравенство будет установлено, если мы только покажем, что при условии у>0 и уфО вектор z — (E-\-A)y всегда имеет меньше нулевых координат, нежели вектор у. Допустим противное. Тогда век- векторы у и z имеют одни и те же нулевые координаты2). Не нарушая общности рассуждений, можно принять, что столбцы у и z имеют вид3) о о где столбцы и и v имеют один и тот же размер. Полагая соответственно будем иметь: IIм 0 А = || Аи + U2i АА А 12 Ai2 •^22 и 0 V 0 откуда А9.и = 0. 21 !) Здесь и далее в этой главе мы под вектором будем понимать столбец из п чисел. Этим самым мы как бы отождествляем вектор со столбцом его коор- координат в том базисе, в котором данная матрица .<4=||«?fcllp задает некоторый линей- линейный'оператор. 2) Здесь мы исходим из того, что z=y-\-Ay и Ау^-0; поэтому положительным координатам вектора у соответствуют положительные координаты вектора z. 3) К такому виду можно привести столбцы у и z при помощи некоторой (одной и той же для у и z) перенумерации координат. 23 ф. р. Гантмахер
354 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Поскольку и>0, то отсюда вытекает: Это равенство противоречит неразложимости матрицы А. Таким образом, лемма доказана. Введем в рассмотрение степени матрицы А: Тогда из леммы вытекает Следствие. Если А > 0 — неразложимая матрица, то для любой пары индексов A<I)?, k ( <: п) существует целое положительное число q такое, что оЙ?>0. B) При этом число q всегда можно выбрать в пределах ¦ 1, если i^k, } \ C) г, если i — к,- \ v ' где т — степень минимального многочлена ф (к) матрицы А. Действительно, обозначим через г (к) остаток от деления (к -j- I)™ на г]} (к). Тогда в силу A) г (А) > 0. Так как степень г (к) меньше т, то из полученного неравенства вытекает, что при любых A <;) i, k(-^.n) по крайней мере одно из неотрицательных чисел fiift, Oifc, a\h, ..., <2i™~ ) не равно нулю. Поскольку 8th = 0 при i Ф к, то отсюда следует первое из соотношений C). Второе соотношение (для i = к) получается анало- аналогично, если неравенство г (А) > 0 заменить неравенством Аг(А) > О1). Замечание. Это следствие из леммы показывает, что в неравен- неравенстве A) можно заменить число п — 1 числом т — 1, где т — степень минимального многочлена матрицы А. § 2. Спектральные свойства неразложимых неотрицательных матриц 1. Перрон в 1907 г. установил замечательные свойства спектра (т. е. совокупности характеристических чисел и собственных векторов) положительных матриц 2). Теорема 1 (Перрона). Положительная матрице/ А = = II &ih II? всегда имеет вещественное и притом положительное харак- характеристическое число г, которое является простым корнем характеристи- характеристического уравнения и превосходит модули всех других характеристических чисел. Этому «максимальному» характеристическому числу г соответ- соответствует собственный вектор z = (zb Zz, ¦ ¦ -, zn) матрицы А с положи- положительными координатами zt > 0 (i = 1, 2, . . ., п) 3). J) Произведение неразложимой неотрицательной матрицы на положительную всегда представляет собой положительную матрицу. 2) См. [230 а, Ь], а также [7], стр. 100. 3) Поскольку число f является простым характеристическим числом, то соб- собственный вектор z, отвечающий этому числу, определяется с точностью до скалярного множителя. По теореме Перрона все координаты вектора z отличны от нуля, веще- вещественны и одного знака. Умножением вектора z на -±А можно сделать все его коор- координаты положительными. В этом последнем случае вектор (столбец) z = (zj, z2, . . . . . ., г„) будем называть положительным (сравни с определением 1).
§ 2] СПЕКТРАЛЬНЫЕ СВОЙСТВА НЕРАЗЛОЖИМЫХ МАТРИЦ 355 Положительная матрица является частным видом неразложимой неотрицательной матрицы. Фробениус*) обобщил теорему Перрона, исследовав спектральные свойства неразложимых неотрицательных матриц. Теорема 2 (Фробениус а). Неразложимая неотрицатель- неотрицательная матрица А = || aih ||™ всегда имеет положительное характеристи- характеристическое число г, которое является простым корнем характеристического уравнения. Модули всех других характеристических чисел не превосхо- превосходят числа г. «Максимальному» характеристическому числу г соответ- соответствует собственный вектор z с положительными координатами. Если при этом А имеет h характеристических чисел Ко — г, Хи . . . . ., ^п-1) по модулю равных г, то эти числа все различны между собой и являются корнями уравнения Kh-rh = O, D) и вообще совокупность всех характеристических чисел Ко, Я,ь . . ., Xn_4 матрицы А = || а^ \\?, рассматриваемая как система точек в комплексной К-плоскости, переходит сама в себя при повороте этой плоскости на угол -j- . При h > 1 перестановкой рядов можно матрицу А привести к сле- следующему «циклическому» виду: О А12 0 ... О О 0 An ... О 0 О О О О h-l,h 0 E) еде вдоль диагонали стоят квадратные блоки. Поскольку теорема Перрона следует как частный случай из теоремы Фробениуса, то мы будем доказывать только последнюю 2). Предвари- Предварительно условимся относительно некоторых обозначений. Мы будем писать: или ?>>С, где С и D — вещественные прямоугольные матрицы одинаковых размеров т X п = \\dih = l, 2, ...,m;k = l,2, ...,n), в том и только в том случае, когда Cih<dih (i = l, 2, ...,ш;Л = 1, 2, ...,п). F) Если во всех неравенствах F) можно отбросить знак равенства, то мы будем писать: или D>C. В частности, С > О (С> 0) обозначает, что все элементы матрицы С неотрицательны (соответственно положительны). Кроме того, через С+ мы будем обозначать mod С, т. е. матрицу, кото- которая получается, если все элементы матрицы С заменить их модулями. См. [182 d, e]. Непосредственное доказательство теоремы Перрона см. [7], стр. 100 и далее. 23*
356 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII 2. Доказательство теоремы Фробениуса1). Для фиксированного вещественного вектора х = (хи х2, . . ., ж„)> 0 (ж=й= 0) полагаем: п rx= min Ц^ ((Ax)i = У alhxh; i= 1, 2, ..., п) ; при этом при определении минимума исключаются те значения индекса i, для которых xt = 0. Очевидно, гх > 0 и ^ есть наибольшее из веще- вещественных чисел q, для которых имеет место неравенство Мы докажем, что функция гх достигает своего наибольшего значе- значения г на некотором векторе z >• 0: r — rz= max г-ж = max min Из определения гж следует, что при умножении вектора х > 0 (ж =^= 0) на число К > 0 величина гж не меняется. Поэтому при разыскании макси- максимума функции гх можно ограничиться замкнутым множеством М, состоя- состоящим из векторов х, для которых п ж>0, (жх) == 2 ж? = 1- г = 1 Если бы функция гх была непрерывна на множестве М, то существо- существование максимума было бы обеспечено. Однако функция гх непрерывна в любой «точке» х > 0, но в граничных точках множества М, где одна из координат обращается в нуль, может испытывать разрывы. Поэтому мы вместо множества М введем множество N, состоящее из всех векторов У вида 1x (x?M). Множество IV, как и М, ограничено и замкнуто и состоит согласно лемме 1 из положительных векторов. Кроме того, помножая обе части неравенства гхх -< Ах на (Е + А)п~г > 0, получаем: rxy<Ay [y = (E + A)n-lx\. Отсюда, исходя из определения гу, находим: Поэтому при разыскании максимума гх мы можем множество М заменить множеством N, состоящим только из положительных векторов. На ограниченном замкнутом множестве N функция гх непрерывна и поэ- поэтому достигает своего наибольшего значения на некотором векторе z > 0. Любой вектор z > 0, для которого rz = r, (8) будем называть экстремальным. Приведенное здесь доказательство принадлежит Виландту [260].
§ 2] СПЕКТРАЛЬНЫЕ СВОЙСТВА НЕРАЗЛОЖИМЫХ МАТРИЦ 357 Докажем теперь, что: 1) определенное равенством G) число г поло- положительно и является характеристическим числом матрицы А и 2) любой экстремальный вектор z положителен и является собственным вектором матрицы А для характеристического числа г, т. е. r>0, z>0, Az = rz. (9) и Действительно, если и= A,1, . . ., 1), то ru = min 2i ath- Но тогда ' fe=l fu > 0, поскольку ни одна строка неразложимой матрицы не может состоять сплошь из нулей. Следовательно, и г > 0, так как г > ги. Далее, пусть x = (E + A)n~1z. A0) Тогда согласно лемме 1 х > 0. Допустим теперь, что Az — rz Ф 0. Тогда в силу A), (8) и A0) получаем последовательно: Az— Последнее же' неравенство противоречит определению числа г, так как из этого неравенства следовало бы Ах — (г -f- е) х > 0 при достаточно малом е>0, т. е. гх > г -\- е > г. Следовательно, Az = rz. Но тогда 0 < х = (Е + А)п~* z = A + г)" z, откуда вытекает: z > 0. Покажем теперь, что модули всех характеристических чисел не пре- превосходят г. Пусть Ау = ау(уфО). (И) Переходя к модулям в левой и правой частях равенства A1), получим х): |а|гЛ<Лг/+. A2) Откуда Допустим, что характеристическому числу г соответствует какой- либо собственный вектор у: Тогда, полагая в A1) и A2) а — г, заключаем, что у+ — экстремальный вектор и, следовательно, у+ > 0, т. е. у = {уи у2, . . ., уп), где yt фО (i = 1, 2, . . ., п). Отсюда следует, что характеристическому числу г соответствует только одно собственное направление, так как при нали- наличии двух линейно независимых собственных векторов zez, мы смогли бы подобрать числа с и d так, чтобы собственный вектор у = cz -f- dzA имел нулевую координату, а это по доказанному невозможно. Введем в рассмотрение присоединенную матрицу для характеристи- характеристической матрицы %Е — А: В (й.) = || В* <k) ||? = А (й.) (%Е-АУ\ где А (К) — характеристический многочлен матрицы A, a Bih (к) — алгебраическое дополнение элемента A,6fti — ahi в определителе А (к). Из того, что характеристическому числу г соответствует (с точностью до множителя) только один собственный вектор z = (zu z2, . . ., г„),где *) Относительно обозначения j/+ см. стр. 355.
358 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Zj > 0, z2 > 0, . . ., zn > О, вытекает, что В (г) Ф О и что в любом ненулевом столбце матрицы В (г) все элементы отличны от нуля йодного знака. То же положение имеет место и для строк матрицы В (г),поскольку в предыдущих рассуждениях можно матрицу А заменить транспониро- транспонированной матрицей А'. Иэ отмеченных свойств строк и столбцов матрицы А вытекает,что все Bih (r) (i, к = 1, 2, . . ., п) отличны от нуля йодного знака G. Поэтому () 2() г=1 т. е. А' (г) фО и г — простой корень характеристического уравнения Ь(Ц 0 Так как г—максимальный корень многочлена A(k) = kn-{-..., то А (к) возрастает при "к = г. Поэтому А'(г)>0 и 0=1, т. е. Bih(r)>Q (i, k = l, 2 п). A3) 3. Переходя к доказательству второй части теоремы Фробениуса, мы воспользуемся следующей интересной леммой1): Лемма 2. Если ^ = ||ajft||^ и C = ||ciftj]^ — две квадратные матрицы одного и того же порядка п, причем А — неразложимая матрица и С+^А% A4) то между любым характеристическим числом у матрицы С и макси- максимальным характеристическим числом г матрицы А имеет место нера- неравенство A5) В соотношении A5) знак равенства может иметь место в том и только в том случае, когда C^e^DAD-1, A6) где е*ф = —, а D — диагональная матрица, у которой диагональные эле- элементы по модулю равны единице (D+ = E). Доказательство леммы. Обозначим через у собственный вектор матрицы С, отвечающей характеристическому числу у: Су = уу {уфО). A7) Из A4) и A7) находим: \у\у^С+у+^Ау\ A8) Поэтому Разберем теперь подробно случай | у \ = г. В этом случае из A8) сле- следует, что у+—экстремальный вектор для матрицы А и, следовательно, г/+>-0 и у+—собственный вектор матрицы А для характеристического числа г. Поэтому соотношение A8) принимает вид = гу\ гЛ>0. A9) !) См. [260]. 2) С—комплексная матрица, а А > 0.
§ 2] СПЕКТРАЛЬНЫЕ СВОЙСТВА НЕРАЗЛОЖИМЫХ МАТРИЦ 359 Отсюда в силу A4) С+ = Л. B0) Пусть у = (уи у2, ..-,J/n). где Vj=\Vj\ei*i C/ = l, 2, ..-,»). Определим диагональную матрицу D равенством Тогда Подставляя зто выражение для у в A7) и полагая там у = гегч>, легко найдем: Ftf* = ry\ B1) где F^e-^D-^CD. B2) Сопоставляя A9) с B1), получим: Fy+ = C+y+ = Ay+. B3) Но в силу B2) и B0) F+ = C+ = A. Поэтому из B3) находим: Fy+ = F+y+. Поскольку у+ > 0, то это равенство может иметь место лишь тогда, когда т. е. Отсюда Лемма доказана. 4. Вернемся к теореме Фробениуса и применим доказанную лемму к неразложимой матрице Л>0, имеющей ровно h различных характери- характеристических чисел с максимальным модулем г: Тогда, полагая в лемме С = Л и у==Яй, для любого & = 0, 1, ..., h — 1 будем иметь: = ге^, Я, = г&п, ...,**_! = «***-! @ = ф0 < ср, < ср2 < ... < ср^, < 2я). \ B4) где Z)ft — диагональная матрица с Dt — E. Пусть снова z — положительный собственный вектор матрицы А, соответствующий максимальному характеристическому числу г: Az = rz (zj>0). B5) Тогда, полагая B6)
360 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. ХШ из B5) и B6) найдем: (А* = «*"*; Л = 0, 1, ...,Л—1). B7) 0 1 ft-i Последние равенства показывают, что векторы у, у, ..., у, определяемые из B6), являются собственными векторами матрицы А для характе- характеристических чисел Хо, Хи ..., Я/1_й. Из B4) следует, что не только Х0~г, но и каждое из характери- характеристических чисел Хи ..., Я./1-i матрицы А является простым. Поэтому h собственные векторы у, а значит, и матрицы Dh(k = 0, 1, ..., h—1) определяются с точностью до скалярных множителей. Для однозначного определения матриц Do, Du ..., Dh-i мы будем выбирать первые диаго- о нальные элементы этих матриц равными единице. Тогда D0 = E и &» = z > 0. Далее, из B4) следует: А = еч<р1*«>ь>в}П?1АО?1Пу1 (/, fc = 0, 1, ...,й —1). Отсюда аналогично предыдущему заключаем, что вектор есть собственный вектор матрицы А, соответствующий характеристи- характеристическому числу 7>eiD>J±<Pft). Поэтому eiD>i±<;pft) совпадает с одним из чисел еф*, а матрица DjD** — с соответствующей матрицей Di, т. е. при некоторых @^)Zb I2(^h—1) Таким образом, числа ei4>o, е{ф1, ..., ei(t>h-* и соответствующие диа- диагональные матрицы Do, Z)j, , Dh-i образуют две изоморфные между собой мультипликативные абелевы группы. В каждой конечной группе, состоящей из h различных элементов, /г-я степень любого элемента равна единице группы1). Поэтому ei(w, e^i, ..., ei<Pft-i — корни h-й степени из единицы. Так как существует всего h различных корней из единицы и ф0 = 0 < q>i < <p2 <•••<! фл-i < <2я, то и ( е/1 Л = 0, 1 Л-1), B8) Xh = reh (k = 0, i, ...,h—l). B9) Числа %0, Ki, ...,%h-i образуют полную систему корней уравнения D). В соответствии с B8) будем иметь2): Dh = Dh (D = Dt; k = 0, 1, ...,&-!). C0) 1) См., например, [39], стр. 324. 2) Здесь мы опираемся на изоморфность мультипликативных групп е ф0, е ф1,
§ 2] СПЕКТРАЛЬНЫЕ СВОЙСТВА НЕРАЗЛОЖИМЫХ МАТРИЦ 361 Теперь равенство B4) нам дает (при к=1): А = е hDALr1. 2jti Отсюда следует, что матрица А при умножении на е переходит в по- подобную матрицу, и, следовательно, вся система п характеристических чисел матрицы А при умножении на е ^ переходит в самое себя1). Далее, поэтому все диагональные элементы в D — корни /г-й степени из единицы. Перестановкой рядов в А (и соответственно в D) можно добиться того, чтобы матрица D имела следующий квазидиагональный вид: D = {г\0Е0, f\iEu .... r\s-iEs-i), C2> где Ео, Е±, ..., Es-i — единичные матрицы, а iib . 2зх (пр — целое; р = 0, 1, ...,s —I; O = Очевидно, что s<ft. Записывая А в блочном виде [в соответствии с C2)] Ан А12 .. А = . . . А? 'si -"«2 • • • ¦"«« мы равенство C1) заменим системой равенств га, (р, q=\, 2, ..., s; e = C3) C4> Отсюда при любых р и а либо -^— = е, либо" Apq = 0. Чр-1 ' Возьмем р=1. Поскольку все матрицы А12, AiS, ..., Als не могут одновременно обратиться в нуль, то одно из чисел —, ^, ¦По (т]0= должно равняться е. Это возможно лишь при щ=1. Тогда —— = е и Ап = А13 = ... = Als — 0. Полагая в C4) р = 2, аналогично найдем, чтс- и2 = 2 и что A2i = ^22 = -^24 = • • • =A2s — 0 и т. д. В результате получим: 0 А12 0 ... 0 0 0 Ак ... 0 А = 0 0 0 !) Число h есть наибольшее целое число, обладающее этим свойством, поскольку матрица А имеет ровно h характеристических чисел с максимальным модулем г. Кроме того, из C1) вытекает, что все характеристические числа матрицы разби- разбиваются на системы (по h чисел в каждой) вида Цо> Н>ое> •••¦> И'О8'1 и что в преде- пределах каждой такой системы любым двум характеристическим числам отвечают эле- элементарные делители соответственно одинаковых степеней. Одну из таких систем образуют корни уравнения D): к0, А*, ..., Aft-i-
362 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII При этом щ — 1, тг2 = 2, ..., ras_1 = s—1. Но тогда при p = s в правых частях равенства C4) стоят множители Одно из этих чисел должно равняться e = eh . Это возможно лишь, когда s — h и q=l и, следовательно, As2 = ... =ASS = Q. Таким образом, и матрица А имеет вид E). Теорема Фробениуса доказана полностью. 5. Сделаем несколько замечаний к теореме Фробениуса. Замечание 1. При доказательстве теоремы Фробениуса мы попутно установили, что для неразложимой матрицы Л>0, имеющей максималь- максимальное характеристическое число г, присоединенная матрица В (к) при Х = г положительна: В (/•);> 0, C5) т. е. Bth(r)>0 (i, к = 1, 2, ...,п), C5') где Bib (r) — алгебраическое дополнение элемента гбм — ам в определителе \гЕ—А\. Рассмотрим теперь приведенную присоединенную матрицу (см. гл. IV, § 6) В (к) где Dn-iCk) — наибольший общий делитель (со старшим коэффициентом единица) всех многочленов Bih(k) (i, к—i, 2, ..., п). При этом из C5') следует, что Dn-\ (г) =Ф 0. Все корни многочлена X)n-i ft) являются харак- характеристическими числами1), отличными от г. Поэтому все корни Пп^(Х) либо комплексны, либо вещественны, но меньше г. Отсюда Dn-% (г) > 0, что в соединении с C5) дает: ?!W- C6) Замечание 2. Неравенства C5') позволяют определить границы для величины максимального характеристического числа г. Введем обозначения 71 Si=y\aih (? = 1, 2, ..., п), s— min su S= max st. Тогда для неразложимой матрицы А > 0 C7) причем знак равенства слева или справа от г имеет место лишь при !) Dn_, (К) является делителем характеристического многочлена Dn (Я) = = \КЕ—А\. 2) В следующем параграфе будет доказано, что для неразложимой матрицы В (X) > 0, С (Л) > 0 при любом вещественном % ;> г.
§ 2] СПЕКТРАЛЬНЫЕ СВОЙСТВА НЕРАЗЛОЖИМЫХ МАТРИЦ 363 s = S, т. е. когда все «строчные суммы» si, S2, ¦ • •> sn равны между собой1). Действительно, прибавим к последнему столбцу характеристического определителя Д(г) = 0-21 г — а22 • - • — а2п — ап1 — йп2 • •- г—апп все предыдущие столбцы и разложим после этого определитель по эле- элементам последнего столбца. Получим: 2 (г-*.)?„* (г) = 0. h=l Отсюда в силу C5') вытекает неравенство C7). Замечание 3. Неразложимая матрица Л>0 не может иметь двух линейно независимых неотрицательных собственных векторов. Дей- Действительно, пусть помимо положительного собственного вектора z > 0, соответствующего максимальному характеристическому числу г, матрица А имеет еще собственный вектор у > 0 (линейно независимый от z) для характеристического числа а: Ау = ау (уфО; у>0). Поскольку г—простой корень характеристического уравнения \КЕ—А\ = 0, то афг. Обозначим через и положительный собственный вектор транспони- транспониА' К рованной матрицы Тогда 2) г отсюда, поскольку А' "(У, для и) = Я,= = B/ = г: 'и = п , А'и) (У, 1 * (и>0). «) = о, а(уц); а это невозможно при u>-0, j/>0, уфО. Замечание 4. При доказательстве теоремы Фробениуса мы уста- установили следующую характеристику максимального собственного числа г неразложимой матрицы А > 0: r = max rx, 1) Установлению для г интервала, более узкого, нежели (s, S), посвящены работы [207], [222а] и [161, IV]. 2) Если j/=(j/i, У2, ..., уп) и и=(иь и2. •••! Mn)i то под {у, и) мы понимаем п «скалярное произведение» у'и—^ угЩ. Тогда (у, А'и)=у'А'и и (Ау, и)=(Ау)' м=
364 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII где гх—наибольшее из чисел q, для которых имеет место неравенство qx ^ Ах. Другими словами, поскольку rx = min —— , то и ¦ г = max mm Совершенно аналогично можно для любого вектора ж() определить гх как наименьшее из чисел а, удовлетворяющих неравенству ах > Ах, т. е. положить: При этом, если при некотором i имеют место соотношения х% = 0, (Ах)% ^Ф О, то следует считать гх = -)- оэ. Совершенно так же, как и для функции гх, доказывается, что функ- функция гх достигает своего наименьшего значения г на некотором векторе 0. Покажем, что число г, определяемое равенством г = min rx = min max , C8) совпадает с числом г, а вектор у>0 (ьфО), на котором достигается этот минимум, является собственным вектором матрицы А при Я, = г. Действительно, (v>0, v ь з n~1v>0. C9) Допустим, что здесь знак >• нельзя заменить знаком равенства. Тогда согласно лемме 1 Полагая u будем иметь: га> Аи и, следовательно, при достаточно малом е > О (г — г)и что противоречит определению числа г. Итак, Av = rv. Но тогда Поэтому из и>0 следует у В силу замечания 3 отсюда = г.
3] РАЗЛОЖИМЫЕ МАТРИЦЫ 365 Таким образом, мы имеем для числа г двойную характеристику: r = max min-^- = min max -^-, D0) ii xl (О) i xl причем доказано, что max или min достигается только на положительном (ж^О) (ж^О) •собственном векторе для А, = г. Из установленной характеристики числа г вытекают неравенства1) min i^l<r< max -^L (x>0, хфО). D1) Замечание 5. Поскольку в D0) max и min всегда достигаются (жЭ*0) (ж^О) только на положительном собственном векторе неразложимой матрицы -4>0, то из неравенств rzs^Az, z>0, гфО или rz > Az, z > 0, z Ф 0 всегда следует: Az = rz, z > 0. § 3. Разложимые матрицы 1. Установленные в предыдущем параграфе спектральные свойства неразложимых неотрицательных матриц не сохраняются при переходе к разложимым матрицам. Однако, поскольку произвольная неотрицатель- неотрицательная матрица А ;> 0 всегда может быть представлена как предел последо- •вательности неразложимых и даже положительных матриц Ат А = \\тАт (Лт>0, щ=1, 2, ...), D2) т->оо то некоторые из спектральных свойств неразложимых матриц в ослаблен- ослабленной форме имеют место и для разложимых матриц. Для произвольной неотрицательной матрицы А = || aih ||™ мы докажем •следующую теорему: Теорема 3. Неотрицательная матрица А = \\ агн||" (сегда имеет неотрицательное характеристическое число г такое, что ^модули всех характеристических чисел ^матрицы А не превосходят г. Этому «макси- «максимальному» характеристическому числу г соответствует неотрицатель- неотрицательный собственный вектор Ау = гу (у>0, уф% Доказательство. Пусть для матрицы А имеет место представ- представление D2). Обозначим через r<m> и у(т> максимальное характеристическое -число положительной матрицы Ат и соответствующий этому числу нор- нормированный 2) положительный собственный вектор: 0; m = 1, 2, ... ]. D3) См. [167], а также [7], стр. 325 и далее. Под нормированным вектором мы понимаем столбец #=(j/i, уъ, ..., уп), Для п ккоторого (уу) = 2 У* = 1-
366 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Тогда из D2) следует, что существует предел Ит Ит> = г, где г — характеристическое число матрицы А. Из того, что r<m>;>0 и Ит>>|Яот)|, где Я{)т) — любое характеристическое число матрицы Ат (т = 1, 2, ...), предельным переходом получаем: г>0, г>\ко\, D4) где Ао—любое характеристическое число матрицы А. Этот же предельный переход дает нам вместо C5) В(г)>0. D5) Далее, из последовательности нормированных собственных векторов z/(m) (m = l, 2, ...) можно выделить подпоследовательность y("V (p = l, 2, ...), сходящуюся к некоторому нормированному (и, следовательно, не равному нулю) вектору у. Перейдем к пределу в обеих частях равен- равенства D3), давая т последовательность значений тр (р=1, 2, ...). Мы получим: Ау = гу (у>0, уфО). Теорема доказана. Замечание. При предельном переходе D2) неравенства C7) сохра- сохраняются. Поэтому эти неравенства имеют место для произвольной неотри- неотрицательной матрицы. Однако условие, при котором в C7) имеет место знак равенства, для разложимой матрицы уже неверно. 2. Установим ряд важных предложений для матриц с неотрицатель- неотрицательными элементами: 1° Если i4 = ||ojft||!f — неотрицательная матрица с максимальным характеристическим числом г, то -^-{lE—Af14^ 0 при Я>г. D6) Действительно, при Я, > г > 0 справедливо разложение со %^L D7) и, следовательно. ^ D8) э=о 2° Если A = \\ant\\i—неотрицательная матрица с максимальным характеристическим числом г, а В (Я) и С (К) — ее присоединенная и при- приведенная присоединенная матрицы, то В{Х)>0, С(К)>0 при k>r. D9) Поскольку В(К) = {КЕ—А)'1 Д (К), С (Я) = (КЕ- А)'1 ^ (Я) и А (Я) > 0, ф (I) > 0 при Я > г, E0) то из первого неравенства D6) сразу вытекают соотношения D9).
§ 3] РАЗЛОЖИМЫЕ МАТРИЦЫ 367 3° Если Л = || u;ft ||f — неразложимая матрица с максимальным харак- характеристическим числом г, то .4)-1<0 при Я>г, E1) ?(Я)>0, С(Я)>0 при %>г. E2) Действительно, согласно следствию из леммы 1 (стр. 354), в случае неразложимой матрицы А^-0 в соотношениях D7) и D8) можно знак равенства отбросить. Тогда и В (Я) > О, С (Я) > 0 при Я > г. Но, как было показано в § 2, для неразложимой матрицы В (г) > О, С (г) > 0. Следо- Следовательно, справедливы неравенства E2). 4° Максимальное характеристическое число г' любого главного минора (порядка <С п) неотрицательной матрицы А = \\ щь Ц™ не превосходит максимального характеристического числа г матрицы А: г'^г. E3) Если для главного минора (п—1)-го порядка г'<г, то для характери- характеристического определителя А (Я) = | КЕ — А I имеем неравенство Д(Я)<0 при г'<Я<г. E4) Если А — неразложимая матрица, то в E3) всегда знак равенства отпадает. Если А — разложимая матрица, то по крайней мере для одного гласного минора имеет место в E3) знак равенства. Действительно, пусть для конкретности г' — максимальное характери- характеристическое число матрицы -4i = ||Gy,||"~ftLi, имеющей характеристический многочлен Д4 (Я) = Впп (Я). Тогда Впп (г) = 0 и в случае неразложимой матрицы А согласно E2) Впп (Я) > 0 при Я > г. Следовательно, г' < г. Отсюда в случае разложимой матрицы предельным переходом получаем неравенство E3). Пусть г'<ch<Cr. Тогда, разлагая определитель А (Я) по элементам последней строки и последнего столбца, получаем: Д(Я) = А1(Я)(Я-апп)- S A%{k)ainanh, E5) г, ft=l где А$ (Я) — алгебраическое дополнение элемента Яб^ — atk в определи- определителе Aj (Я) = Впп (Я) (i, k — 1, 2, ...,п — 1). Разделим, обе части тож- тождества E5) на Aj (Я): ^ ^ E6) г, fe=l Используя второе неравенству D6) для матрицы А, замечаем, что при Я>/ первый член Я — апп в правой части E6) монотонно возрастает, а второй — не убывает. Следовательно, . отношение А (Я)/А1 (Я) монотонно возрастает при Я > г'. Но тогда это отношение отрицательно при г' < Я<с г, поскольку Д(г) = 0. Но Aj^);>0 при Я>г'. Следовательно, имеет место неравенство E4). Мы установили справедливость неравенства E3) для миноров (п — 1)-го порядка. Постепенным переходом от п—1 к п — 2, от п — 2 к п — 3 и т. д. мы докажем справедливость неравенства E3) (без знака = в случае неразложимой матрицы) для главного минора любого порядка.
368 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Если А — разложимая матрица, то перестановкой рядов она может ¦быть представлена в виде В О С D А = Тогда число г должно быть характеристическим числом одного из двух главных миноров В и D. Предложение 4° доказано. Из 4° вытекает 5° Если Л >- 0 и в характеристическом определителе —" аИ — а12 • • ¦ — а1п какой-либо из главных миноров обращается в нуль (матрица А разло- .&кима\), то обращается в нуль любой «объемлющий» главный минор и, в частности, один из главных миноров (п — 1)-го порядка Вц (Я), i?22 (Я), . . . , Впп (Я). Из 4° и 5° следует: 6° Матрица А^О является разложимой в том и только в том ^случае, когда в одном из соотношений Bit(r)>0 (i=l,2 в) имеет место знак равенства. Из 4° вытекает также 7° Если г—максимальное характеристическое число матрицы А > О, то при любом К^>г все главные миноры характеристической матрицы Ab^sXE — А положительны: \ii i2 . ¦ ¦ i > О (Я> г; 1 <i< ... 1, 2, ..., п). E7) Нетрудно видеть, что, и обратно, из неравенств E7) следует: Я>г. Действительно, k=0 где Sh — сумма всех главных миноров к-то порядка характеристической матрицы А%=%Е — А (к=1, 2, ..^пI). Поэтому, если при некотором вещественном Я все главные миноры характеристической матрицы А я поло- положительны, то при любом [х>0 т. е. всякое число >Я не является характеристическим числом матрицы А. Следовательно, Таким образом, неравенства E7) представляют собой необходимые и достаточные условия для того, чтобы число Я было верхней границей См. стр. 83.
§ 3] РАЗЛОЖИМЫЕ МАТРИЦЫ 369 для модулей характеристических чисел матрицы Аг). Однако не все неравенства E7) независимы между собой. Матрица КЕ—А представляет собой матрицу с неположительными недиагональными элементами2). Д. М. Котелянский показал 3), что для таких матриц, как и для симметрических матриц, положительность всех главных миноров вытекает из положительности последовательных главных миноров. Лемма 3 (Котелянского). Если в вещественной матрице G—WgihW™ все недиагоналъные элементы отрицательны или равны нулю gik<0 (i ФЫ,к = 1,2,..., п), E8) а последовательные главные миноры положительны /1 2 ... п\ то все главные миноры матрицы G положительны: 4 Ч "¦ Л>0 A<г1<г2<...<гр<п; р=1, 2, .... п). \Ч *2 • • - гр/ Доказательство. Будем доказывать лемму индуктивно относи- относительно порядка матрицы п. При п = 2 лемма имеет место, так как из gl2<0 #21 < 0, gu>0, gugsz — gl2g21>0 следует: g22 > 0. Пусть лемма справедлива для матриц порядка < п; докажем ее для матрицы G = ||gife||". Введем в рассмотрение окаймляющие определители /1 i\ tlh==GU k\=gugih—gihgii {i, k = 2, ...,n). Из E8) и E9) следует: *|*<:0 {гфк; I, к = 2, ...,п). С другой стороны, применяя к матрице Т^Ц^Ц^ тождество Сильвестра [гл. II, равенство C0), стр. 48], получаем: 'i к -•• = (gu)K1G I . F0) \i it i2 ... ip/ \ p— i, г, ..., n—i I Отсюда в силу E9) следует, что последовательные главные миноры матрицы Т = || tih ||^ положительны: /2 3\ /2 3 ... )°( Таким образом, матрица (п — 1)-го порядка Т = || tih \\ ™ удовлетворяет условиям леммы. Поэтому согласно допущению индукции все главные 1) См. [123]. ~ 2) Нетрудно видеть, что, и наоборот, всякая матрица с отрицательными или нуле- нулевыми недиагональными элементами всегда может быть представлена в виде ХЕ—А, где А—неотрицательная матрица, а X—вещественное число. 3) См. [97в]. Эта работа содержит ряд результатов, относящихся к матрицам, у которых все не диагональные элементы одного знака. 24 Ф. Р. Гантмахер
370 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII миноры матрицы Т положительны: Ч !2 '" !Р)>0 B<i!<i2< ... < ip^n; р=1, 2, ... п-1). it i2 ... ip/ Но тогда из F0) вытекает, что положительны все главные миноры матрицы G, содержащие первую строку: / Ч12 ... гР]>0B^г-1<{-2< ... <?р<и; р=1, 2, ..., п-1). F1) \l «I i2 ¦ ¦. ip/ Возьмем фиксированные индексы A <) ц < i2 < • • • < *п-2 (< и) и составим матрицу (и—1)-го порядка: («*, ,В = 1, ii, t2, •••, in-г). F2) Последовательные главные миноры этой матрицы в силу F1) положительны: а не диагональные элементы неположительны: g«p<0 (а=#=Р; а, 0=1, ч г2, -.., «п.г)- Но порядок матрицы F2) равен п — 1. Поэтому согласно допущению индукции все главные миноры этой матрицы положительны; в частности, i2 ... ip i i Л>0 B<г1<г2<...<гр<»г; p=l, 2, ..., n — 2). Таким образом, все миноры порядка <!п—2 матрицы G положительны. Поскольку в силу F3) #22 > 0, то мы можем теперь ввести в рас- рассмотрение определители второго порядка, окаймляющие элемент g22 (а не gn, как ранъпю): Оперируя с матрицей Т* = || t*ь || так, как мы ранее оперировали с матри- матрицей Т, мы получим неравенства, аналогичные неравенствам F1): ¦¦¦ <.iP; h, ••-, iP = l, 3, ..,., n; p=l, 2, ..., n—1). Так как любой главный минор матрицы G = || gift ||™ либо содержит б б | || р первую строку, либо содержит вторую строку, либо имеет порядок <: п — 2, то из неравенств ,F1), F3) и F4) следует, что все главные миноры матрицы А положительны. Лемма доказана. Доказанная лемма позволяет в условиях E7) сохранить лишь последовательные главные миноры и сформулировать следующую теорему: Теорема 4. Для того чтобы вещественное число Я было больше максимального характеристического числа г матрицы А = || aih ||">0, необходимо и достаточно, чтобы при этом значении Я все последователь-
§3] РАЗЛОЖИМЫЕ МАТРИЦЫ 371 ные главные миноры характеристической матрицы Ax = hE— А были положительны: Я — ац>0, ¦! — ^21 *^ — ^22 л — — ain ani — ап2 • •. Я — а, >0. F5) Рассмотрим одно приложение этой теоремы. Пусть у матрицы C=)|cife||r* все недиагональные элементы неотрицательны. Тогда при некотором Я > О матрица Л = С + Я?>0. Характеристические числа Я*(i = 1, 2, ...,n) матрицы С расположим в порядке возрастания вещественных частей: Обозначим через г максимальное характеристическое число матрицы А. Поскольку характеристическими числами матрицы А являются суммы Я Я (г = 1, 2, ..., п), то В данном случае неравенство г < Я имеет место лишь при Я„ <; 0 и означает, что у матрицы С все характеристические числа имеют отрицательные вещественные части. Записывая неравенства F5) для матрицы — С=КЕ—А, мы получим теорему1): Теорема 5. Для того чтобы у вещественной матрицы C = |[cjft||" с неотрицательными недиагоналъными элементами ctk>0 (гфк; i, к=1, 2, ..., п) все характеристические числа имели отрицательные вещественные части, необходимо и достаточно, чтобы выполнялись неравенства си < О, Си с12 •О, ...,(-1)" СИ С12 • С21 С22 - С1л F6) Пусть снова А — произвольная неразложимая неотрицательная матрица, а ж>0 (эг,фО) — некоторый вектор2), не являющийся собствен- собственным для максимального характеристического числа г. Тогда в силу замечания 5 на стр. 365 существуют индексы i и j (l<!i, j^n) такие, что выполняются неравенства (Ах)г>гхг и (Ax)j<_rxj. F7) Если же х — собственный вектор матрицы А для характеристиче- характеристического числа г, то в соотношениях F7) знаки неравенств следует заме- заменить знаком равенства. Поэтому для любого вектора х >• 0 существуют !) См. [123, 97в]. Поскольку С—А—ХЕ, А^-0, то %п вещественно (это следует из равенства Кп-\-%=г), и этому характеристическому числу соответствует неотри- неотрицательный собственный вектор матрицы С: Су=%пу (j/!>0, уфО). 2) Обозначение х > 0 означает, что столбцовая матрица х неотрицательна. 24*
372 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII индексы i и к (l^t, k*Cri), при которых (Ax)i>rxi и (Ax)j^rxj. F7') В таком ослабленном виде соотношения F7') остаются в силе и для разложимой матрицы А >• 0, поскольку она может быть представлена в виде предела последовательности неразложимых матриц. Соотношения F7') позволяют установить следующую теорему: Теорема 6. При увеличении любого элемента неотрицательной матрицы А максимальное характеристическое число не убывает. Оно строго возрастает, если А — неразложимая матрица. Эта теорема допускает эквивалентную формулировку. Теорема 6'. Если даны две неотрицательные матрицы А и А1 с максимальными характеристическими числами г и rit то из нера- неравенства A^.Ai {АфА^) следует неравенство г^г^. Если же А —нераз- —неразложимая матрица, то r-Oi- Доказательство. Пусть А — неразложимая матрица. Тогда At — также неразложимая матрица. Обозначим через х собственный вектор матрицы Ai для характеристического числа г^. = Т-jX (ж > 0). Отсюда (rj — г) ж = Ах—гх + (А1—А) х. F7") Но (Af — Л)ж>0. Поэтому, если х не является собственным вектором матрицы А для характеристического числа г, то в силу F7) при неко- некотором индексе i (I ^ i ^. п) (rt—г) xt > (Ax)i — гхг > 0, откуда Г! — г>0, т. e. Если же х — собственный вектор матрицы А при характеристическом числе г, то Ах — гх = 0, и поскольку при некотором индексе i [(Al — A)x]i>0, то из равенства F7") следует: (rt — г) жг = (Ai—A) xt > 0, т. е. снова г < гг. В случае разложимой матрицы введем в рассмотрение матрицы Ае--=А + еВ и Аъ^А^гВ, где В>0, е>0. Тогда Л<Ае и А>0. Поэтому ге<Сг1е, где гЕ и rie — максимальные характеристические числа матриц Ае и А1е. В пределе при е-^0 матрицы Ае и А1е переходят в матрицы А и Аи а неравенство re<Zrle — в соотношение г^.^. Теорема доказана. § 4. Нормальная форма разложимой матрицы Рассмотрим произвольную разложимую матрицу А — \\ aik ||". Переста- Перестановкой рядов ее можно представить в виде В 0 А" С D где В, D — квадратные матрицы. F8)
§ 4] НОРМАЛЬНАЯ ФОРМА РАЗЛОЖИМОЙ МАТРИЦЫ 373 Если какая-либо из матриц В и D разложима, то ее можно также представить в виде, аналогичном F8), после чего матрица А примет вид К О О А= Н L О F G М Если какая-либо из матриц К, L, М разложима, то этот процесс можно продолжить. В результате надлежащей перестановкой рядов мы матрице А придадим треугольную блочную форму: Аи 0 ... О A2i Azz ... О А = F9) где диагональные блоки — квадратные неразложимые матрицы. Диагональный блок Ац A ^ i ^ s) будем называть изолированным, если Aitl = 0 (ft = 1,2, ...,i-l,» + l, ...,s). Перестановкой блочных рядов (см. стр. 352) в матрице F9) можно все изолированные блоки поставить на первые места вдоль главной диаго- диагонали, после чего матрица А примет вид Al 0 0 0 A2 0 1 -^g+l, 2 ... 0 ... 0 ... As ¦ ¦ • Ag+lj g 0 0 0 Ag+l ... 0 ... 0 ... 0 ... 0 А = •"si AS2 • ¦ - Asg здесь Ait A2, ..., As — неразложимые матрицы, а в каждом ряду Ап, Af2, ..., Afif-i (/ G0) по крайней мере одна из матриц не равна нулю. Матрицу G0) будем называть нормальной формой разложимой мат- матрицы А. Покажем, что нормальная форма матрицы А определяется однозначно с точностью до перестановки блочных рядов1). Для этого рассмотрим линейный оператор А, соответствующий матрице А в га-мерном векторном пространстве Ж Представлению матрицы А в виде G0) соответствует расщепление пространства JS на координатные подпространства К= G1) при этом всегда Bs, 2?S_1 + .RS, Bs-z + jBs-i + -Rs, •••—инвариантные коор- координатные подпространства для оператора А, причем между любыми двумя г) Не нарушая нормальной формы, можно произвольно переставить между собой первые g блочных рядов. Кроме того, иногда возможны некоторые пере- перестановки между последними s—g блочными рядами, сохраняющие нормальность формы.
374 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII соседними из этих подпространств не существует промежуточного инва- инвариантного подпространства. Допустим, что наряду с нормальной формой G0) данной матрицы имеется другая нормальная форма, которая соответствует другому рас- расщеплению В на координатные подпространства: B=Bi + Bi+ ... +Be + Bg+l+... + Bt. G1') Однозначность нормальной формы будет показана, если мы докажем совпадение расщеплений G1) и G1') с точностью до порядка слагаемых. Пусть инвариантное подпространство Bt имеет общие координатные векторы с Bh и не имеет таковых с Bh+i, • • •. Bs- Тогда Bt должно целиком содержаться в Bh, так как в противном случае Rt содержало бы «меньшее» инвариантное подпространство — пересечение JBt с Bk + 2?fe+i + + ... + Bs. Далее, Bt должно совпасть с Bh, так как в противном слу- случае инвариантное подпространство Bt + Bh+i + . - • + Bs было бы проме- промежуточным между инвариантными подпространствами Вц -j- Bk+i + ¦ ¦ ¦ ... +BS и Bh+i+ ¦ ¦ - +BS. Поскольку Bk совпадает с Bt, Bk — инвари- инвариантное подпространство. Поэтому без нарушения нормальной формы мат- матрицы Bk может быть поставлено на место Bs. Таким образом, мы можем считать в расщеплениях G1) и G1'): Bs = Bt. Рассмотрим теперь координатное подпространство Bt-i- Пусть оно имеет общие координатные векторы с Bi (I < s), но не имеет таковых с -Rj+i+ • • ¦ ~\-Bs. Тогда инвариантное подпространство Bt-i-\-Bt должно целиком содержаться в Bi-\-Bi+i-{- ¦ ¦. +BS, так как в противном слу- случае существовало бы промежуточное инвариантное координатное подпро- подпространство между Bt и Bt-i + Bt- Поэтому Bt^czBi. Далее, Bt~i = Bi, поскольку в противном случае Bt-i + Bi+i-\-... +Ва было бы промежу- промежуточным инвариантным подпространством между Bi + Вм + • • - + Bs и Bi+i+ ... +BS. Из Bt-i = Bi следует, что Bt + Bs — инвариантное подпространство. Поэтому Вг можно поставить на место Bs-t, после чего будем иметь: Bt-i = Ks_i, Bt = Bs. Продолжая этот процесс далее, мы в конце концов придем к тому, что s = t и что расщепления G1) и G1') совпадают с точностью до порядка слагаемых. Тогда с точностью до перестановки блочных рядов совпадают и соответствующие нормальные формы. Из однозначности нормальной формы следует, что числа g и s являются некоторыми инвариантами для неотрицательной матрицы Аг). Пользуясь нормальной формой матрицы, докажем теорему: Теорема 7. Максимальному характеристическому числу г мат- матрицы А > 0 соответствует положительный собственный вектор в том и только в том случае, когда в нормальной форме F9) матрицы А : 1° каждая из матриц Аи А2, ..., Ag имеет число г своим характеристи- Для неразложимой матрицы g=s=l.
§ 4] НОРМАЛЬНАЯ ФОРМА РАЗЛОЖИМОЙ МАТРИЦЫ 375 ческим числом и (при g<s) 2° ни одна us матриц Ag+U ..., As этим свойством не обладает. Доказательство. 1. Пусть максимальному характеристическому числу г соответствует положительный собственный вектор z>0. В соот- соответствии с разбиениями на блоки в G0) мы столбец z разобьем на части zh (k = 1,2, ..., s). Тогда равенство Az = rz (z>0) G2) заменится двумя системами равенств: А^ = гг* (i = l,2,...,g), G2') Ъ Ajhzh + AjZ} = rzj (/=+1 »). G2") Из G2') следует, что число г является характеристическим числом каждой из матриц Аи А2, ..., Ag. Из G2") находим: V < rz\ AjZj фгг} (j = g +1, ..., s). G3) Обозначим через rj максимальное характеристическое число матрицы Aj 0" = g + l, ..., s). Тогда [см. D1) на стр. 365] из G3) находим: r,-<max—^-<r (j = g + l, ..., s). 1 4 С другой стороны, равенство rj = г противоречит вторым соотношениям G3) (см. замечание 5 на стр. 365). Поэтому О</ (/ = *+!, ...,*). G4) 2. Пусть, теперь, обратно, дано, что максимальные характеристические числа матриц At (i = l, 2, ..., g) равны г, а для матриц Aj (j — g + l, ..., s) имеют место неравенства G4). Тогда, заменяя искомое равенство G2) системой равенств G2'), G2"), мы сможем из G2') определить положи- положительные собственные столбцы гг матрицы At (г = 1, 2, ..., g). После этого из G2") найдем столбцы z' Q — g-^-l, ...,s): i-i zj = (rEj - AjY1 2 Ajhzh {j = g +1, ..., S), G5) fti где Е3-—единичная матрица того же порядка, что и матрица Aj (i=g+i, ...,«). Поскольку rj<Zr(] = g + lt ...,s), то [см. E1) [на стр. 367] (rEj-Aj)-i>0 (у = g +1, ..., s). G6) Докажем индуктивно, что определенные по формулам G5) столбцы z8+1, ..., zs положительны. Мы покажем, что при любом /(g +1 <!]^s) из положительности столбцов z1, z2, ..., z3-1 следует: z3>0. Действи- Действительно, в этом случае
376 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII что в соединении с G6) на основании формулы G5) дает: z1 Таким образом, положительный столбец z = будет собственным вектором для матрицы А при характеристическом числе г. Теорема доказана. Следующая теорема дает нам характеристику матрицы Л>0, кото- которая вместе со своей транспонированной матрицей А' обладает тем свой- свойством, что максимальному характеристическому числу отвечает положи- положительный собственный вектор. Теорема 7'1). Максимальному характеристическому числу г мат- матрицы Л>0 отвечает положительный собственный вектор матрицы А и положительный собственный вектор транспонированной матрицы А' в том и только в том случае, когда матрица А может быть переста- перестановкой рядов представлена в квазидиагональном виде где Ay, Az, ..., As — неразложимые матрицы, каждая из которых имеет число г своим максимальным характеристическим числом. Доказательство. Пусть матрицы А к А' имеют положительные собственные векторы для % = г. Тогда по теореме 7 матрица А предста- вима в нормальной форме F9), где матрицы Аи Az, ..., Ag имеют максимальное характеристическое число г и (при g<i s) матрицы -dg+ь • • •. As имеют максимальные характеристические числа < г. Тогда А'х ... О -4^+i, i — А А' = О О О А'а g+i О ... О 0 ... А'е Поменяем здесь порядок блочных рядов на обратный: A's О 0 ... О A'SlS-i A's_i О ... О А' si А' S-1, 1 А\ G8) Поскольку матрицы A's, A's^i, ..., А'х неразложимы, то из матрицы G8) перестановкой блочных рядов мы получим нормальную форму, поставив См. [182е].
§ 5] ПРИМИТИВНЫЕ И ИМПРИМИТИВНЫЕ МАТРИЦЫ 377 на первые места вдоль главной диагонали изолированные блоки. Одним из таких изолированных блоков является блок A's. Поскольку нормаль- нормальная форма матрицы А' должна удовлетворять условию предыдущей тео- теоремы, то максимальное характеристическое число матрицы А'в должно равняться г. Это возможно лишь при g — s. В этом случае нормальная форма F9) переходит в G7). Если, обратно, дано представление G7) для матрицы А, то тогда А' = {А1,А±,...,А'.}. G9) Тогда из G7) и G9) в силу предыдущей теоремы заключаем, что матрицы А и А' имеют положительные собственные векторы для максимального характеристического числа г. Теорема доказана. Следствие. Если максимальное характеристическое число г мат- матрицы А > 0 является простым и ему соответствуют положительные собственные векторы матриц А и А', то А — неразложимая матрица. Поскольку, обратно, всякая неразложимая матрица обладает свой- свойствами, указанными в этом следствии, то эти свойства представляют собой спектральную характеристику неразложимой неотрицательной матрицы. § 5. Примитивные и импримитивные матрицы Начнем с некоторой классификации неразложимых матриц. Определение 3. Если неразложимая матрица А^>0 имеет всего h характеристических чисел Яь Я2, ..., Aft с максимальным мбдулем r(At = = | А,21 = ... = | А* | = г), то матрица А называется примитивной при h = 1 и импримитивной при /г>1. Число h называется индексом импримитив- импримитивности матрицы А. Индекс импримитивности h сразу определяется, если известны коэф- коэффициенты характеристического уравнения Д (А) = Г + а1Кщ + «гА + ... + atXnt = О матрицы, а именно число h равно наибольшему общему делителю разно- разностей п—пи щ — щ, ..., щ^—щ. (80) Действительно, согласно теореме Фробениуса спектр матрицы А в комплексной А-шгоскости переходит в себя при повороте на угол —г- вокруг точки Я = 0. Поэтому многочлен Д (Я) должен получиться из неко- некоторого многочлена g(\i) по формуле Отсюда следует, что h—общий делитель разностей (80). Наконец, h рав- равняется наибольшему общему делителю d этих разностей, так как спектр не изменяется при повороте на угол —р, а это невозможно при h<Cd. Следующая теорема устанавливает важное свойство примитивной матрицы: Теорема 8. Матрица Л>0 является примитивной в том и только в том случае, когда некоторая степень матрицы А
378 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. ХШ положительна: А*>>0 (р>1). (81) Доказательство. Если Лр>0, то матрица А неразложима, так как из разложимости матрицы А следует разложимость матрицы Ар. Далее, для матрицы А число /г = 1, так как в противном случае поло- положительная матрица Ар имела бы h (> 1) характеристических чисел Я?, Яг, .. -, Я? с максимальным модулем гр, что противоречит теореме Перрона. Пусть теперь, обратно, дано, что А — примитивная матрица. Восполь- Воспользуемся для степени Ар формулой B4) главы V (стр. 113) А* - V 1 А - Ь (mfc-l) где Ч>(Я) = (Л-Я1Г1(>'-Лг)1 ••- (Я-Я.Г«(^*/ при 7 = /) —минимальный многочлен матрицы А, \р(Ц=~ ^— (А = 1, 2, ..., s), а С (Я)—приведенная присоединенная матрица С(Х) = (КЕ — А) 1'ф(Я). В данном случае можно положить: Я1 = /->|Я2|>...>|Я8|, mt = l. (83) Тогда формула (82) примет вид 1 Гсща.П^-1) -l)! *m , , ' Отсюда легко заключить в силу (83) 4---Ш-. (84) С другой стороны, С (г) [см. E3)] и г|/ (г) > 0 в силу (83). Поэтому p-j-oo и, следовательно, начиная с некоторого р, имеет место неравенство (81). Теорема доказана. Замечание. Если матрица А примитивна и Ар^>0, то Ат>0 для всех mZ>p, так как матрица А не содержит нулевых рядов. Следствие. Степень примитивной матрицы всегда неразложима и притом примитивна. Для наименьшего номера р = Ра, начиная с которого выполняется неравенство (81), Фробениусг) указал верхнюю оценку, зависящую только от порядка п матрицы А: Виландт2) отметил (без доказательства), что на самом деле (85) 1) См. [182е]. 2) См. [260].
§ 5] ПРИМИТИВНЫЕ И ИМПРИМИТИВНЫЕ МАТРИЦЫ 379 н эта оценка точна. Она достигается на матрице /О 1 0 0 ... СК О 0 1 0 ... О А= о о о 1... о О 0 0 0 ... 1 U 1 0 0 ... О '' Приводимое ниже доказательство неравенства (85) по существу совпадает с доказательством, принадлежащим Седлачеку1). Лемма. Если А—примитивная матрица, то для любых двух (не обязательно различных) индексов i, k существует такая цепочка индексов i, it, iz, ..., is, k (s>0), что aih>0, ahiz>0, ..., aish>0. О такой цепочке будем говорить, что она ведет в матрице Л из г в к. Число s +1 назовем длиной цепочки. Очевидно, в кратчайшей цепочке, ведущей из i в к, все индексы попарно различны. Для доказательства леммы достаточно взять s>0 так, чтобы было Ц11> Тогда п 2 aiiya,ixiz ... aish = afh > 0, h, h U—i и так как все слагаемые здесь неотрицательны, то по крайней мере одно из них положительно. Оно и дает требуемую цепочку индексов. Перейдем к доказательству неравенства (85). Обозначим через lt наименьшую из длин цепочек, ведущих в матри- матрице А из i в i (i = l,- 2, . .., п), и положим2) 1= min lt. Пусть для определенности «i2>0, а23>0, ..., аи>0. (86) Тогда в матрице А1 будут положительными первые I диагональных элементов: Оц>0, ^>0, ¦••. <№><>• (87) Возьмем произвольный индекс i. Кратчайшая цепочка, ведущая в матрице А из i в какой-нибудь из индексов 1, 2, ..., I, имеет, оче- очевидно, длину, не большую п — I. В силу (86) эту цепочку можно про- продолжить за счет индексов 1, 2, ..., I до цепочки с длиной ровно п — I. Получится некоторая цепочка it г1> г2> •••! in-l-li h где l<y<L г) См. [245]. Другие доказательства были даны в статьях [190], [119], [229]. В работе [110] неравенство Виландта послужило отправным пунктом для обобще- обобщений, относящихся к любым матрицам А ~^- 0. 2) I можно определить как наименьший показатель, для которого матрица А1 имеет положительный диагональный элемент.
380 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Возьмем еще один произвольный индекс к (не обязательно отличный от Г). Так как матрица А1, согласно следствию теоремы 8, тоже прими- примитивна, то найдется цепочка индексов длины, не большей п—1, ведущая в матрице А1 из / в к. В силу (87) эту цепочку можно продолжить / до цепочки с длиной ровно п—1. Получится некоторая за счет индекса цепочка /п-2» Итак, Отсюда a-iii > 0, 41 > 0, > 0, > 0, in_i_w- > 0 Следовательно, aJn-i-H<- Ввиду произвольности индексов i, к оказывается An~l+l{n- Тем самым — 1 + 1 (п — 1) = {п — 2) Заметим теперь, что I <; п — 1. Действительно, в противном случае пив силу определения числа / матрица А оказывается циклической: '0 а12 0 ... 0 а12 0 0 а23 0 0 \ап1 0 0 0 0 0 ) т. е. импримитивной. Таким образом, Ра<{п — 2)(п — что и требовалось доказать. Докажем теперь следующую теорему: Теорема 9. Если А > 0 — неразложимая матрица и некоторая степень Ач этой матрицы разложима, то степень Ач вполне разложима, т. е. перестановкой рядов Ач может быть представлена в виде А* = {АиАь_...,Аа}, (88) где Аи Az, . . ., Ad — неразложимые матрицы. Эти матрицы имеют одно и то же максимальное характеристическое число. При этом число d есть наибольший общий делитель чисел q и /г, где h — индекс имприми- импримитивности матрицы А. Доказательство. Поскольку матрица А является неразло- неразложимой, то согласно теореме Фробениуса максимальному характеристи- характеристическому числу г отвечают положительные собственные векторы матриц А и А'. Но тогда эти же положительные векторы являются собственными для неотрицательных матриц Ач и (Aq)' при характеристическом числе
§ 6] СТОХАСТИЧЕСКИЕ МАТРИЦЫ 381 Я = rq. Поэтому, применяя к степени Aq теорему 7', мы представим (после надлежащей перестановки рядов) эту степень в виде (88), где Аи А2, ... . . ., Ad — неразложимые матрицы с одним и тем же максимальным характеристическим числом г«. Но матрица А имеет h характеристиче- характеристических чисел с максимальным модулем г: г, гг, ..., ге'1~г (е = е h ). Поэтому и матрица Ач имеет h характеристических чисел с максимальным модулем среди которых d чисел равны гч. Это возможно лишь тогда, когда d — наибольший общий делитель чисел q и h. Теорема доказана. Если в формулировке теоремы положить q = h, то получим Следствие. Если А — импримитивная матрица с индексом импримитивности h, то степень Ah разлагается на h примитивных мат- матриц, которые имеют одно и то же максимальное характеристическое число. § 6. Стохастические матрицы Рассмотрим п возможных состояний некоторой системы Su S2, ..., Sn (89) и последовательность моментов времени to, tit t2, ... Пусть в каждый из этих моментов времени система находится в одном и только в одном из состояний (89), причем ри обозначает веро- вероятность нахождения системы в состоянии Sj в момент времени tk, если известно, что в пре- предыдущий момент времени tk-i система находи- находилась в состоянии Тг (i, ]' == 1, 2, . . ., п; к = 1, 2, . . .). Мы будем предполагать, что переходные вероятности p%j (i, / = 1, 2, ... . . ., п) не зависят от индекса к (номера момента времени ffe). Если матрица переходных вероятностей задана, то говорят, что задана однородная цепь Маркова с конечным чис- числом состояний х). При этом очевидно, что Pij>0, 2r/ = 1 (i,/=1,2, ..., в). (90) Определение 4. Квадратная матрица Р = || рц\\* называется стохастической, если матрица Р неотрицательна и сумма элементов каж- каждой строки матрицы Р равна единице, т. е. имеют место соотношения (90) 2). Таким образом, для каждой однородной цепи Маркова матрица переходных вероятностей является стохастической и, наоборот, любая х) См. [96], а также [29], стр. 9—12. 2) Иногда в определение стохастической матрицы включают дополнительное п требование V PU Ф 0 0' = 1> 2, . . ., п). См. [29], стр. 13.
382 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. ХШ стохастическая матрица может быть рассматриваема как матрица пере- переходных вероятностей некоторой однородной цепи Маркова. На этом основывается матричный метод исследования однородных цепей Мар- Маркова *). Стохастическая матрица является частным видом неотрицательной матрицы. Поэтому к ней применимы все понятия и положения предыду- предыдущих параграфов. Отметим некоторые специфические свойства стохастической мат- матрицы. Из определения стохастической матрицы следует, что- эта матрица имеет характеристическое число 1 с положительным собственным векто- вектором z = A, 1, . . ., 1). Легко видеть, что, и обратно, всякая матрица Р > О, имеющая собственный вектор A, 1, . . ., 1) при характеристиче- характеристическом числе 1, является стохастической. При этом единица является макси- максимальным характеристическим числом стохастической матрицы, поскольку максимальное характеристическое число всегда заключено между наи- наибольшей и наименьшей из строчных сумм 2), а для стохастической матрицы все строчные суммы равны единице. Таким образом, нами доказано пред- предложение: 1° Неотрицательная матрица Р > 0 является стохастической тогда и только тогда, когда она имеет собственный вектор A, 1, . . ., 1) при характеристическом числе 1. Характеристическое число 1 является мак- максимальным для стохастической матрицы. Пусть теперь дана неотрицательная матрица А = || aih ||™, имеющая положительное максимальное характеристическое число г > 0 и соот- соответствующий этому числу положительный собственный вектор z =¦-¦- = (zt, z2, . . ., zn) >0: j\aljZj = rZi (г = 1, 2, ...,n). (91) ..7=1 Введем в рассмотрение диагональную матрицу Z = {zt, z2, . . ., zn} и матрицу Р = || ри\\? Тогда л Рч = у z^ujjZj > 0 (г, j = 1, 2, ..., п), и в силу (91) fPij = i (i = l, 2, ...,в). Таким образом, 2° Неотрицательная матрица А >> 0, имеющая положительное макси- максимальное характеристическое число г>0м соответствующий этому числу положительный собственный вектор z = (zu %%, . . ., zn) > 0, всегда подобна произведению числа г на некоторую стохастическую матрицу: А .= ZrPZ-i (Z = fa, г* ..., zn) > 0) 3). (92) 1) Теория однородных цепей Маркова с конечным (и со счетным) числом состоя- состояний была разработана акад. А. Н. Колмогоровым (см. [96]). Последовательное прове- проведение и развитие матричного метода в применении к однородным цепям Маркова читатель найдет в мемуаре [1206] и монографии [29] В. И. Романовского (см. также [4], дополнение 5). 2) См. неравенства C7) и замечание на стр. 366. 3) Предложение 2° имеет место и при г — 0, так как из А ;> 0, z > 0 следует А = 0.
§ 6] СТОХАСТИЧЕСКИЕ МАТРИЦЫ 383 В предыдущем параграфе была установлена (см. теорему 7) харак- характеристика класса неотрицательных матриц, имеющих положительный собственный вектор при К = г. Формула (92) устанавливает тесную связь этого класса матриц с классом стохастических матриц. Докажем теперь следующую теорему: Теорема 10. Характеристическому числу 1 стохастической матрицы всегда соответствуют только элементарные делители первой степени. Доказательство. Применим к стохастической матрице Р = — II PtjWi разложение F9) § 4: At 0 0 0 Ао 0 р __ о Ав Ае 0 l, 1 g+i Asi Аве где А I, А2, . . ., Ав — неразложимые матрицы и Здесь At, Az, . . ., Ag — неразложимые стохастические мат- матрицы, и потому каждая из этих матриц имеет простое характеристиче- характеристическое число 1. Что же касается остальных неразложимых матриц Ag+i, . . . . . ., As, то согласно замечанию 2 на стр. 362 их максимальные харак- характеристические числа <1, поскольку в каждой из этих матриц хотя бы одна строчная сумма меньше единицы 1). Таким образом, матрица Р представима в виде р= ¦¦ ° где у матрицы Qt характеристическому числу 1 соответствуют элемен- элементарные делители первой степени, а для матрицы Q2 число 1 не является характеристическим числом. После этого справедливость теоремы непо- непосредственно вытекает из следующей леммы: Лемма 4. Если матрица А имеет вид О & ' (93) где Qi и Qz — квадратные матрицы, и характеристическое число Ко матрицы А является характеристическим числом матрицы Qi и не является таковым для матрицы Qz, то элементарные делители матриц А и Qu соответствующие характери- характеристическому числу Ко, одинаковы. Эти свойства матриц At, . . ., As вытекают также из теоремы 7.
384 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Доказательство. 1. Рассмотрим сначала случай, когда Qi и Q2 не имеют общих характеристических чисел. Покажем, что в этом случае элементарные делители матриц Q± я Q2 в совокупности образуют систему элементарных делителей матрицы А, т. е. что при некоторой матрице Т (\ Т \?=0) Qi О О (94) Матрицу Т будем искать в виде Ei О U I (разбиение на блоки в Т соответствует разбиению в А; Еу и Е2 — единич- единичные матрицы). Тогда (94') Равенство (94') перейдет в равенство (94), если прямоугольную мат- матрицу U подберем так, чтобы она удовлетворяла матричному уравнению ТАТ'1 = Е, и 0 Е2 Q S 0 Q2 Et —и 0 Е2 Qi о В случае, когда Qt и Q2 не имеют общих характеристических чисел, это уравнение при любой правой части S всегда имеет одно определенное решение (см. гл. VIII, § 3). 2. В случае, когда матрицы Qi и Qz могут иметь и общие характери- характеристические числа, мы заменим в (93) матрицу Qi ее жордановой формой / (в результате этого матрица А заменится матрицей, ей подобной). При этом / = {/i, /2}, где в /4 собраны все жордановы клетки с характеристи- характеристическим числом Ко. Тогда о '22 0 0 С 0 0 /j ( 0 Su ) .... 0 Q* 0 Эта матрица подходит под разобранный уже первый случай, поскольку матрицы /i и (>2 не имеют общих характеристических чисел. Отсюда сле- следует, что элементарные делители вида (к — Я0)р одинаковы у матриц А и /j и, следовательно, одинаковы у матриц А и Qt. Лемма доказана. Если неразложимая стохастическая матрица Р имеет комплексное характеристическое число Хо с | Яо | = 1, то матрица К0Р подобна мат- матрице Р [см. A6) ] и потому из теоремы 10 вытекает, что числу Яо отвечают только элементарные делители первой степени. Пользуясь нормальной формой матрицы и леммой 4, легко распространить это утверждение и на разложимые стохастические матрицы. Таким образом, получаем Следствие 1. Если Яо — характеристическое число стохастиче- стохастической матрицы и | А,о | = 1, то этому числу Ко соответствуют элемен- элементарные делители первой степени матрицы Р. Из теоремы 10 в силу 2° (стр. 382) вытекает также Следствие 2. Если максимальному характеристическому числу г неотрицательной матрицы А отвечает положительный собственный
§ 7] ПРЕДЕЛЬНЫЕ ВЕРОЯТНОСТИ ДЛЯ ОДНОРОДНОЙ ЦЕПИ МАРКОВА 385 вектор, то все элементарные делители матрицы А, соответствующие любому характеристическому числу Яо с | Яо \ = г, имеют первую степень. Укажем на некоторые работы, связанные с расположением характе- характеристических чисел стохастической матрицы. Характеристическое число стохастической матрицы Р всегда лежит в круге | Я | <; 1 Я-плоскости. Совокупность всех точек этого круга, являющихся характеристическими числами каких-либо стохастических матриц га-го порядка, обозначим через Мп. В 1938 г. в связи с исследованием цепей Маркова акад. А. Н. Колмо- Колмогоров поставил задачу определения структуры области Мп. Эта задача была частично решена в 1945 г. Н. А. Дмитриевым и Е. Б. Дынкиным [67а, б] и полностью решена в 1951 г. в работе Ф. И. Карпелевича [72]. Оказалось, что граница Мп состоит из конечного числа точек на окруж- окружности | Я | = 1 и определенных криволинейных дуг, соединяющих в кру- круговом порядке эти точки. Заметим, что в силу предложения 2° (стр. 382) характеристические числа матриц А = || а^ ||™ > 0, имеющих положительный собственный вектор при Я = г, при фиксированном г образуют множество г-Мп г). Поскольку произвольная матрица А — || aik \\™ > 0 может быть рас- рассматриваема как предел последовательности неотрицательных матриц указанного типа, а множество г-Мп замкнуто, то характеристические числа произвольных матриц А = || а^ ||" > 0 с данным максимальным характеристическим числом г заполняют множество г-Мп 2). К этому кругу вопросов относится и работа X. Р. Сулеймановой [100], в которой устанавливаются некоторые достаточные критерии для того, чтобы п заданных вещественных чисел Яь Я2, ..., кп были характери- характеристическими числами некоторой стохастической матрицы Р = \\ pij ||™ 8). § 7. Предельные вероятности для однородной цепи Маркова с конечным числом состояний 1. Пусть Si7 S2, ..., Sn — все возможные состояния системы в однородной цепи Маркова, а Р = Jl^ll"—определяющая эту цепь стохастическая матрица, состав- составленная из переходных вероятностей ptj (г, / = 1, 2, ..., п) (см. стр. 381). Обозначим через pW вероятность нахождения системы в состоянии Sj в момент времени tu, если известно, что в момент времени th-q система находилась в состоянии St (i, / = 1,2, ...,ra; q = l, 2, ...). Очевидно, pW = pi}- (г, / == 1, 2, ..., га). Пользуясь теоремами о сложении и умножении вероятностей, мы легко найдем: /l— 1 или в матричной записи х) г • Мп есть совокупность точек Я-плоскости вида щ, где (г € Мп. 2) На возможность сведения указанной задачи для произвольной матрицы А > 0 к аналогичной задаче для стохастической матрицы было указано А. Н. Колмогоро- Колмогоровым (см. [896], дополнение). 3) См. также [228Ь]. 25 Ф. р. Гантмахер
386 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Отсюда, давая д последовательно значения 1, 2, ..., получим важную формулу *) \\p[f\\ = Pq (e=l,2,...). Если существуют пределы « (i, / = 1,2 п) W или в матричной ваписи то величины р™. (г, j = 1, 2, .,., /г) называются предельными или финаль- финальными переходными вероятностями 2). Для выяснения, в каких случаях существуют предельные переходные вероятности, и для вывода соответствующих формул введем следующую терминологию. Мы будем стохастическую матрицу Р и соответствующую ей одно- однородную цепь Маркова называть правильной, если у матрицы Р нет харак- характеристических чисел, отличных от единицы и равных по модулю единице, и регулярной, если дополнительно единица является простым кор- корнем характеристического уравнения матрицы Р. Правильная матрица Р характеризуется тем, что в ее нормальной форме F9) (стр. 373) матрицы Аи А2, ..., Ag являются примитивными. Для регулярной матрицы дополнительно g—1. Кроме того, однородная цепь Маркова называется неразложимой, разложимой, ациклической, циклической, если для этой цепи стохасти- стохастическая матрица Р является соответственно неразложимой, разложимой, примитивной, импримитивной. Поскольку примитивная стохастическая матрица является частным видом правильной матрицы, постольку ациклическая цепь Маркова является частным видом правильной цепи. Мы покажем, что предельные переходные вероятности существуют только у правильных однородных цепей Маркова. Действительно, пусть if (Я) — минимальный многочлен правильной матрицы Р = || ри ||". Тогда i,k = l,2, ..., и). (95) Согласно теореме 10 можно принять, что Я1 = 1, mi = 1. (95') На основании формулы B4) гл. V (стр. 113) !) Из этой формулы следует, что вероятности р\у, так же как и pi- (?, /=1, 2, ..., п; д=1, 2, ...), не зависят от номера к исходного момента времени t^. 2) Матрица Р°° как предел стохастических матриц также является стохасти- стохастической.
§ 7] ПРЕДЕЛЬНЫЕ ВЕРОЯТНОСТИ ДЛЯ ОДНОРОДНОЙ ЦЕПИ МАРКОВА 387 где С (X) = (кЕ—Р)^ (К) — приведенная присоединенная матрица и при этом Если Р — правильная матрица, то |А*|<1 (к = 2, 3, ...,и), и потому в правой части формулы (96) все слагаемые, кроме первого, при q —> со стремится к нулю. Поэтому для правильной матрицы Р суще- существует матрица Р°°, составленная из предельных переходных вероят- вероятностей, и п00 С A) (СП\ ¦Ф' A) " У > Обратное положение очевидно. Если существует предел Р°° = Km Pq, (97') g~>oo то матрица Р не может иметь характеристического числа Kh, для которого Яй=5^= 1, а |Аь| = 1, так как тогда не существовал бы предел lira Я^. [Этот q~>co же предел должен существовать в силу существования предела (97').] Мы доказали, что для правильной (и только для правильной) одно- однородной цепи Маркова существует матрица Р°°. Эта матрица определяется формулой (97). Покажем, как можно выразить матрицу Р°° через характеристический многочлен А (Я) = (A-A4)ni (Я-Я2)И2... (к-Хи)Пи (98) и присоединенную матрицу В(Х) — (КЕ—Р)~1А(%). Из тождества В {%) _ С (к) Д (X) ~ в силу (95), (95') и (98) вытекает: щВ^П1~^ A) _ ' A) • Поэтому формулу (97) можно заменить формулой *¦*?№¦¦ <97> Для регулярной цепи Маркова, поскольку она является частным видом правильной цепи, матрица Р°° существует и определяется любой из фор- формул (97), (97'). В этом случае щ = 1 и формула (97') имеет вид Д' (\) • 25*
388 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII 2. Рассмотрим правильную цепь общего типа (нерегулярную). Соот- Соответствующую матрицу Р запишем в нормальной форме i О 0 О U g+1,1 Qe 0 • ^g+i,g @g+i и. si Usg .... A00) где Qi, ..., Qe — примитивные стохастические матрицы, а у неразложимых матриц @g+i, ..., Qs максимальные характеристические числа < 1. Полагая us, ... и. , w= Qg+l ... 0 s, g+1 • • • Qs запишем Р в виде . . . 0 0 Тогда О . . . Qe О и w Q* . . . О О .. QI о и„ wq A01) и о ... Q7 о
§ 7] ПРЕДЕЛЬНЫЕ ВЕРОЯТНОСТИ ДЛЯ ОДНОРОДНОЙ ЦЕПИ МАРКОВА 389 Но W°° = lim W9 = О, поскольку все характеристические числа матри- д-»оо цы W по модулю меньше единицы. Поэтому Г ... О О A02) Поскольку Qlt ..., Qg — примитивные стохастические матрицы, то матрицы Q™, ..., 0% согласно формулам (99) и C5) (стр. 362) положи- положительны: и в каждом столбце любой из этих матриц все элементы равны между собой: <fi = \\q$\\i.i=i (й=1,2, ...,g). Заметим, что нормальному виду A00) стохастической матрицы Р соответствует разбиение состояний системы Su Sz, ..., Sn на группы: Каждой группе 2 в (Ю4) соответствует своя группа рядов в A01). По терминологии А. Н. Колмогорова1) состояния системы, входящие в 2ь 227 •••» 2ё> называются существенными, а состояния, входящие в остальные группы 2б+ь •••> Ss — несущественными. Из вида A01) матрицы Рв следует, что при любом конечном числе шагов q (от момента th~q к моменту ?fi) возможен только переход системы а) из существенного состояния в существенное состояние той же группы, б) из несущественного состояния в существенное состояние и в) из несу- несущественного состояния в несущественное состояние той же или пред- предшествующей группы. Из вида A02) матрицы Р°° следует, что в пределе при q —> со пере- переход возможен только из любого состояния в существенное состояние, т. е. вероятность перехода в любое несущественное состояние при числе шагов q —» оэ стремится к нулю. Поэтому существенные состояния иногда называются и предельными состояниями. 3. Из формулы (97) следует: (Е — Р)Р°° = 02). Отсюда видно, что каждый столбец матрицы Р°° является собственным вектором стохастической матрицы Р для характеристического числа X = 1. Для регулярной матрицы Р число 1 является простым корнем харак- характеристического уравнения и этому числу соответствует только один (с точностью до скалярного множителя) собственный вектор A,1, . . ., 1) х) См. [96], а также [29], стр. 37—39. 2) Эта формула имеет место для произвольной правильной цепи и может быть получена яз очевидного равенства Pq — Р-Р11 = 0 предельным переходом q -» со.
390 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII матрицы Р. Поэтому в любом /-м столбце матрицы Р°° все элементы равны одному и тому же неотрицательному числу р™.: р%=р%>0 (/=1,2,..., п; | p*f = 1). A04) 3—* Таким образом, в регулярной цепи предельные переходные вероят- вероятности не зависят от начального состояния. Обратно, если в некоторой правильной однородной цепи Маркова предельные переходные вероятности не зависят от начального состояния, т. е. имеют место формулы A04), то в схеме A02) для матрицы Р°° обяза- обязательно g = 1. Но тогда Hi — 1 и цепь является регулярной. Для ациклической цепи, которая является частным случаем регуляр- регулярной цепи, Р — примитивная матрица. Поэтому при некотором q >> 0 Рч > 0 (см. теорему 8 на стр. 377). Но тогда и Р°° = Р°°Рч > 0 х). Обратно, из Р°° > 0 следует, что при некотором q > 0 Рд > 0, а это по теореме 8 означает примитивность матрицы Р и, следовательно, аци- ацикличность данной однородной цепи Маркова. Полученные результаты мы сформулируем в виде следующей теоремы: Т е о»р е м а 11. 1. Для того чтобы в однородной цепи Маркова суще- существовали все предельные переходные вероятности, необходимо и доста- достаточно, чтобы цепь была правильной. В этом случае матрица Р°°, состав- составленная из предельных переходных вероятностей, определяется формулой (95) или (98). 2. Для того чтобы в правильной однородной цепи Маркова предель- предельные переходные вероятности не зависели от начального состояния, необ- необходимо и достаточно, чтобы цепь была регулярной. В этом случае матрица Р°° определяется формулой (99). 3. Для того чтобы в правильной однородной цепи Маркова все пре- предельные переходные вероятности были отличны от нуля, необходимо и достаточно, чтобы цепь была ациклической 2). 4. Введем в рассмотрение столбцы из абсолютных вероятностей P = U>i,k,'-;Pn) № = 0,1,2,...), A05) h где pt — вероятность нахождения системы в момент tk в состоянии St (?= 1, 2, ..., п; к —0, 1, 2, ...). Пользуясь теоремами сложения и умно- умножения вероятностей, найдем: или в матричной записи p = PhP (Л = 1, 2, ...), A06) где Р' —транспонированная матрица для матрицы Р. х) Это матричное равенство получается предельным переходом т -*¦ со из равен- равенства Рт = рт~ч.рч (то > gj.i300 — стохастическая матрица; поэтому Р°° > О, и в любой строке матрицы Р00 имеются ненулевые элементы. Отсюда Р°*рч > 0. Вместо теоремы 8 можно эдесь воспользоваться формулой (99) и неравенством C5) (стр. 362). 2) Заметим, что из Р°° > 0 вытекает ацикличность, а следовательно, и регуляр- регулярность цепи. Поэтому из Р°° > 0 автоматически следует, что предельные переходные вероятности не зависят от начального состояния, т. е. имеют место формулы A04).
§ 7] ПРЕДЕЛЬНЫЕ ВЕРОЯТНОСТИ ДЛЯ ОДНОРОДНОЙ ЦЕПИ МАРКОВА 391 Все абсолютные вероятности A05) определяются из формулы A06), оо о если известны начальные вероятности ри р2, ..., рп и матрица переход- переходных вероятностей P = \\Pij\\i- Введем в рассмотрение предельные абсолютные вероятности оо к (i=l, 2, ...,п) P fe->oo или оо оо оо оо h Р = (Ри Рг, •¦, Рл) = Нт р. fe-»oo Переходя в обеих частях равенства A06) к пределу при к—>оо, получим: р = Р°°р. (Ю7) Заметим, что существование матрицы предельных переходных вероят- вероятностей Р°° влечет существование предельных абсолютных вероятностей .00 000000 0000 Р — {РиР2, ¦ ¦ • Рп) при любых начальных вероятностях р = (ри р2, ¦ ¦ •, Рп) и наоборот. Из формулы A07) и из вида A02) матрицы Р°° вытекает, что пре- предельные абсолютные вероятности, соответствующие несущественным состояниям, равны нулю. Умножая обе части матричного равенства Р'. р00' = р°°' о справа на р, мы в силу A07) получим: оо оо Р'Р = Р. A08) со т. е. столбец предельных абсолютных вероятностей р является собст- собственным вектором матрицы Р' для характеристического числа Я=1. Если данная цепь Маркова регулярна, то X = 1 является простым корнем характеристического уравнения матрицы Р'. В этом случае столбец предельных абсолютных вероятностей однозначно определяется из A08) оо п „о (поскольку pj>0 (/ = 1, 2, ..., п) и 2 Pj=l)- i=i Пусть дана регулярная цепь Маркова. Тогда из A04) и из A07) следует: со " О "о S Р$ Д Рн = Р$ (/ = 1, 2, ..., п). A09) со оо со В этом случае предельные абсолютные вероятности ри р2, . . ., рп оо о не зависят от начальных вероятностей ри р2, . • ., Рп- со О Обратно, р может не зависеть от р при наличии формулы A07) тогда и только тогда, когда все строки матрицы Р°° одинаковы, т. е. и потому (согласно теореме 11) Р — регулярная матрица.
392 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Если Р — примитивная матрица, то Р°° > 0, а отсюда в силу A09) Pi>0 (/=1,2, .... и). СО Наоборот, если все pj > 0 (/= 1, 2, . . ., п) и не зависят от началь- начальных вероятностей, то в каждом столбце матрицы Р°° все элементы оди- одинаковы и согласно A09) Р°° > 0, а это по теореме 11 означает, что Р — примитивная матрица, т. е. данная цепь ациклична. Из изложенного вытекает, что теорему 11 можно сформулировать так: Теорема 11'. 1. Для того чтобы в однородной цепи Маркова существовали все предельные абсолютные вероятности при любых началь- начальных вероятностях, необходимо и достаточно, чтобы цепь бъуьа правильной. 2. Для того чтобы в однородной цепи Маркова существовали пре- предельные абсолютные вероятности при любых начальных вероятностях и не зависели от этих начальных вероятностей, необходимо и достаточно, чтобы цепь была регулярной. 3. Для того чтобы в однородной цепи Маркова при любых началь- начальных вероятностях существовали положительные предельные абсолютные вероятности и эти 'предельные вероятности не зависели от начальных, необходимо и достаточно, чтобы цепь была ациклической г). 5. Рассмотрим теперь однородную цепь Маркова общего типа с мат- матрицей переходных вероятностей Р. Возьмем нормальную форму F9) матрицы Р и обозначим через hu h2, . . ., hg индексы импримитивности матриц Аи А2, . . ., Ag в F9). Пусть h — наименьшее общее кратное целых чисел ht, h2, . . ., hg. Тогда матрица Ph не имеет характеристических чисел, равных по модулю единице, но отличных от единицы, т. е. Ph — правильная матрица; при этом h — наименьший показатель, при котором Ph — правильная мат- матрица. Число h назовем периодом данной однородной цепи Маркова. Поскольку Ph — правильная матрица, то существуют предел lim Phq = (Р")°°, а значит, и пределы Pr = Pr(Phr (r = 0, I, ...,h — 1). 5->оо Таким образом, в общем случае последовательность матриц Р, Р\ Р\ ... разбивается на h подпоследовательностей с пределами Рг = Рг (Р )°° (г = 0, 1 Л —1). Переходя от переходных вероятностей к абсолютным при помощи формулы A06), мы получим, что последовательность 1 2 3 р, р, р, ... распадается на h подпоследовательностей с пределами lim Г+рФ = (P'YV (r = 0, 1, 2, .... Л-1). *) Вторую часть теоремы 11' иногда называют эргодической, а первую — общей квазиэргодинеской теоремой для однородных цепей Маркова (см. [4], стр. 473 и 476).
§7] ПРЕДЕЛЬНЫЕ БЕРОЯТНОСТИ ДЛЯ ОДНОРОДНОЙ ЦЕПИ МАРКОВА 393 Для произвольной однородной цепи Маркова с конечным числом состояний всегда существуют пределы средних арифметических N И N * ~ о p' (НО) A10') h=l Здесь Р = || pij ||" и р = СРи Рг, - • •, Рп)- Величины pi} (i, / = 1,2, ... ...,п) и pj (j = I, 2, ..., п) называются соответственно средними пре- предельными переходными и средними предельными абсолютными вероят- вероятностями. Поскольку N+l . N ТО и, следовательно, в силу A10') Р'р = р, A11) т. е. р — собственный вектор матрицы Р' для Л=1. Заметим, что по формулам F9) и A10) мы можем матрицу Р пред- представить в виде At 0 ... 0 0 А2 ... 0 Р = 0 0 0 ... Ag и w где 2V N Ae+i 0 0 0 >к * ... ^ Поскольку все характеристические числа матрицы W по модулю меньше единицы, то и, следовательно, W = 0. fe-KO
394 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Поэтому Л, О О А2 . О . О О О и о A12) Поскольку Р — стохастическая матрица, то стохастическими являются здесь и матрицы Аи А2, ..., Ag. Из полученного представления для Р и из A07) следует, что сред- средние предельные абсолютные вероятности, соответствующие несущест- несущественным состояниям, всегда равны нулю. Если в нормальной форме матрицы Р число g = 1, то для матрицы Р' число Я = 1 является простым характеристическим числом. В этом случае р однозначно определяется из A11), и средние пре- предельные вероятности ри р2, ..., рп не зависят от начальных вероятностей ооо „ о Pi, p2, ..., рп- Обратно, если р не зависит от р, то в силу A10') мат- матрица Р имеет ранг 1. Но матрица A12) может иметь ранг 1 только тогда, когда g = l. Полученные результаты мы сформулируем в виде следующей теоремы*): Теорема 12. Для произвольной однородной цепи Маркова с перио- h h дом h матрицы вероятностей Pup при к —> со стремятся к периоди- периодическому повторению с периодом h; при этом всегда существуют средние предельные переходные и абсолютные вероятности Р = \\ рц ||" и р — = (Ри Рг, ¦ • •, Рп), определяемые формулами A10) и A10'). Средние предельные абсолютные вероятности, соответствующие несущественным состояниям, всегда равны нулю. Если в нормальной форме матрицы Р число g = 1 (и только в этом случае), средние предельные абсолютные вероятности ри р2, ..., рп оо о не зависят от начальных вероятностей ри р2, • • •, рп и однозначно определяются из уравнения A11). § 8. Вполне неотрицательные матрицы В этом и следующем параграфах мы рассмотрим вещественные матрицы, у которых не только элементы, но и все миноры любых порядков неот- неотрицательны. Такие матрицы имеют важные применения в теории малых колебаний упругих систем. Подробное исследование этих матриц и их приложений читатель найдет в книге [7]. Здесь же будут даны только некоторые основные свойства этих матриц. 1. Начнем с определения: Определение 5. Прямоугольная матрица = \\<hh\ (i = l, 2, Л=1,2, !) Эту теорему иногда называют асимптотической теоремой для однородных цепей Маркова. См. [4], стр. 479—482.
§ 8] ВПОЛНЕ НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ 395 называется вполне неотрицательной {вполне положительной), если все миноры любых порядков этой матрицы неотрицательны (соответственно положительны): Н h .h :ki h k2 . . . k% <~~- ""J !> О (соответственно > О) >=1, 2, ..., min(m, n) В дальнейшем мы ограничимся рассмотрением только квадратных вполне неотрицательных и вполне положительных матриц. Пример 1. Обобщенная матрица Вандермонда ^И^ПГ (°<ai<a2< ••• <ап; сс1<а2< ... < а„) является вполне положительной. Докажем сначала, что | V | Ф 0. В самом деле, из равенства |F[=0 следовало бы, что можно так определить не равные одновре- одновременно нулю вещественные числа с1г с2, ..., с„, чтобы функция имела бы п нулей в точках xi = ai (i = l, 2, ..., п), где и—число степенных сла- слагаемых. При п—1 это невозможно. Примем индуктивное допущение, что это невоз- невозможно для суммы меньшего, нежели п, числа степенных слагаемых, и докажем, что это невозможно и для данной функция / (х). Допустим противное. Тогда по теореме Ролля функция /i (x) = [x~aif (#)]', состоящая из и — 1 степенных слагае- слагаемых, имела бы п—1 положительных нулей, а это противоречит допущению индукции. Итак, \V\ ф 0. Но при cti = O, а2=1, ..., сс„=тг—1 определитель | V\ перехо- переходит в обычный определитель Вандермонда | а^~11™, который положителен. Так как переход от этого определителя Вандермонда к обобщенному можно осуществить за счет непрерывного изменения показателей а1? аг, ..., сс„ с сохранением неравенств между ними (cti < а% < < ссп), и так как по доказанному определитель при этом не обратится в нуль, то и | V | > 0 при любых @ <) а4 < аг < ... < а„. Поскольку любой минор матрицы V может быть рассматриваем как определи- определитель некоторой обобщенной матрицы Вандермонда, то все миноры матрицы V положительны. Пример 2. Рассмотрим якобиееу матрицу A13) а1 ч 0 *i а2 С2 0 ... Ъ2 ... а3 ... 0 0 0 0 0 0 0 0 0 ... cn_i т. е. матрицу, в которой все элементы, не принадлежащие главной диагонали, первой наддиагонали и первой поддиагонали, равны нулю. Установим формулу, выражающую произвольный минор этой матрицы через главные миноры и элементы Ъ, с. Пусть
396 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIIE Тогда Справедливость этой формулы вытекает из легко проверяемого равенства: J U i. =</ L ь К . К L . (ПРИ *v Ф *v)- (И5> [h ... kpj \k! ...fcv_i/ \kvj \kv+1...kp) K ' Из формулы A14) следует, что любой минор равен произведению некоторых главных миноров и некоторых элементов матрицы J. Таким образом, для тог» чтобы матрица J была вполне неотрицательной, необходимо и достаточно, чтобы все ее главные миноры и элементы Ъ, с были неотрицательны. 2. Для вполне неотрицательной матрицы А = || щи |[" всегда имеет место следующее важное детерминантное неравенство1): /1 2 ... п\ /1 2 ... р\ I A[l2...n)<A[l2...P]A[ l ... п\ Выводу этого неравенства предпошлем следующую лемму: Лемма 5. Если во вполне неотрицательной матрице .4 = ||a;ft||" какой-либо главный минор равен нулю, то равен нулю любой «объемлющий» главный минор. Доказательство. Лемма будет доказана, если мы покажем, что для вполне неотрицательной матрицы ^4 = |j а^ ||™ из 1 2 ... Л \1 2 всегда следует: 2 ... При этом рассмотрим два случая: аи a^h 1) ац = 0. Поскольку ац>0, alh>0 н aih = 2, ..., п), то либо все atl — 0 (i = 2, ..., п), либо все а^. = 0 (к = 2, ..., п). Из этих равенств и из аи = 0 следует A18). 2) ацфО. Тогда при некотором р A <!/ 2 ... р —1\ /1 2 ... р — )^A[ Введем окаймляющие определители /1 2 ... р — 1 i\ dih==A[l 2.\. p-l к] (*".* = Р,р + 1, -..,»)• A20> !) См. [82в], а также [7], стр. 111 и далее. Там же выяснено, что знак равен- равенства в A16) может иметь место только лишь в следующих очевидных случаях: 1) один из множителей в правой части A16) равен нулю, 2) все элементы «гй: (*' = !» 2, ..., р\ к=р-\-1, ..., п) либо все элементы erft(i=P + l. •••. "'. к —1,2, ...,р) равны нулю. Неравенство A16) имеет тот же внешний вид, что и обобщенное неравенство Адамара [см. ' B9) на стр. 231] для положительно определенной эрмитовой или квадратичной формы.
§ 8] ВПОЛНЕ НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ 397 Из них составим матрицу D = || <i;ft ||". Согласно тождеству Сильвестра (гл. II, § 3) D{k\k2'" I Г II 2 ... р — 1\18-1 [1 2 ... р— 1 ix i2 ... ig \ = \Л 12 v 1 Л 1 2 » 1 Л /с Л>0 (Ш) и поэтому D — вполне неотрицательная матрица. Поскольку в силу A19) 1 2 ... р\ то матрица Z) = ||eZjft||p подходит под уже разобранный случай 1) и р р+1 ... п\ Г /1 2 ... р —1\"]"-р 1 /1 2 ... р —1\ I . I \1 z ... jo— 1/ Отсюда, поскольку Л I . 1 ^=0, следует A18). Лемма доказана. 3. Теперь мы имеем возможность при выводе неравенства A16) пред- предполагать, что все главные миноры матрицы А отличны от нуля, так как согласнно лемме 5 равенство нулю одного из главных миноров возможно лишь тогда, когда |Л| = 0, а в этом случае неравенство A16) очевидно. При п = 2 справедливость неравенства A16) проверяется непосред- непосредственно: A 2\ поскольку а12>0, а21>0. Будем устанавливать неравенство A16) для п > 2, предполагая, что оно уже справедливо для матриц порядка < п. Кроме того, не нарушая общности, можем считать, что р^>1, так как в противном случае за счет обратной нумерации строк и столбцов мы поменяли бы ролями числа р и п — р. Вводя, снова в рассмотрение матрицу D = || dih !]?, где dih (i, k = p, р+1, '..., п) определяются формулами A20), используя дважды тождество Сильвестра и основное неравенство A16) для матриц порядка < п, имеем ... «Л ... п) /1 2 ... /Л /р + 1 ... ге\ <Л , _ U ,,• • A22) \12 ... р/ \р+1 ... п) v ; Таким образом, неравенство A16) можно считать установленным.
398 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Введем следующее Определение 6. Минор к ¦¦¦ к2 ... к < Ч < • • • < iP A23) матрицы А = || Cjft ]|" будем называть почти главным, если среди разностей i"i—к±, i2—к2, ..., ip — кр только одна разность не равна нулю. Обращаем внимание на то, что весь вывод неравенства A16) (в том числе и доказательство вспомогательной леммы) сохраняет свою силу, если условие «.А — вполне неотрицательная матрица» заменить более сла- слабым условием «в матрице А неотрицательны все главные и почти глав- главные миноры»1). § 9. Осцвлляционные матрицы 1. Характеристические числа и собственные векторы вполне положи- положительных матриц обладают целым рядом замечательных свойств. Однако класс вполне положительных матриц недостаточно широк с точки зре- зрения приложений к малым колебаниям упругих систем. В этом отношении класс вполне неотрицательных матриц имеет уже достаточный объем. Но не для всех вполне неотрицательных матриц имеют место нужные нам спект- спектральные свойства. Однако существует промежуточный класс (между клас- классами вполне положительных и вполне неотрицательных матриц), в котором сохраняются спектральные свойства вполне положительных матриц и кото- который достаточно широк для охвата приложений. Матрицы этого промежу- промежуточного класса получили название «осцилляционных». Это название связано с тем, что осцилляционные матрицы образуют математический аппарат для исследования осцилляционных свойств малых колебаний линейных упругих систем2). Определение 7. Матрица А—\\аи^ называется осцилляцион- ноц, если А—вполне неотрицательная матрица и существует такое це- целое число д>0, что А"—вполне положительная матрица. Пример. Якобиева матрица J [см. (ИЗ)] является осцилляционной в том и только в том случае, когда Iе все числа Ъ, с положительны и 2° последователь- последовательные главные миноры положительны: A24) a Ч Ъ, ul az >o, 4 4 0 h «2 0 !2 0 h a2 0 .. 4 ¦ a3 . . 0 .. 0 .. 0 0 0 0 0 0 0 *¦) См. [976]. Мы пользуемся случаем отметить, что в книге Ф. Р. Гантмахера и М. Г. Крейна [7] (во втором издании) в этом пункте допущена ошибка, на кото- которую первый обратил внимание авторов Д. М. Котелянский. В книге [7], стр. 111 почти главный минор A23) определяется равенством 2 i*v-m=i. v=l При таком определении почти главного минора из неотрицательности главных и почти главных миноров не следует еще неравенство A16). Однако все формули- формулировки и доказательства § 6 гл. II в [7], посвященного основному неравенству, становятся верными, если' для почти главного минора дать приведенное здесь определение, взятое нами из работы [976]. 2) См. [7], Введение, а также гл. III, IV.
9] ОСЦИЛЛЯЦИОННЫЕ МАТРИЦЫ 399 Необходимость условий Iе, 2е. Числа Ъ, с неотрицательны, поскольку матрица J > 0. При этом ни одно иэ чисел Ъ, с не может равняться нулю, так как в противном случае матрица была бы разложимой, и тогда при любом q > 0 нера- неравенство /9^>0 не соблюдалось бы. Следовательно, все числа Ь, с положительны. Все главные миноры A24) положительны согласно лемме 5, поскольку из | J \ ~^- О и | JQ | > 0 следует: | J \ > 0. Достаточность условий 1е, 2е. Раскрывая \J\, легко убеждаемся в том, что числа 6, с входят в состав | J | только произведениями Ъгсъ b2c2, ... ..., bn_icn_j. Это же относится к любому главному минору «нулевой плотности», т. е. минору, образованному подряд идущими (без пропусков) строками и столб- столбцами. Но любой главный минор матрицы J распадается в произведение главных миноров нулевой плотности. Поэтому в любой главный минор матрицы J числа Ъ и с входят только произведениями bjCj, &2c2i •••> ^>n-icn-l- Составим симметрическую якобиеву матрицу Ь, 0 bn-l j="VVj >0 (г = 1, 2, ..., и). A25) 0 %п-1 ап Из установленного выше свойства главных миноров якобиевой матрицы сле- следует, что соответствующие главные миноры матриц J m}J равны |друг другу. Но тогда условия A24) означают, что квадратичная форма 7(х, х) является положительно определенной (см. гл. X, теорема 3, стр. 277). Но у поло- положительно определенной квадратичной формы все главные миноры положительны. Следовательно, и в матрице J все главные миноры положительны. Поскольку по условию 1е все числа Ъ, с положительны, то по формуле A14) все миноры матрицы J неотрицательны, т. е. J—вполне неотрицательная матрица. Осцилляционность вполне неотрицательной матрицы J, для которой выпол- выполняются условия 1е, 2е, вытекает непосредственно из следующего критерия осцилляционности. Для того чтобы вполне неотрицательная матрица -А=||агй1|" была осцилля- ционной, необходимо и достаточно, чтобы выполнялись условия: 1) А—неособенная матрица (| А | > 0), 2) все элементы матрицы А, расположенные на главной диагонали, на первой наддиагонали и на первой поддиагонали, отличны от нуля (а,-^>0 при | i-—к |<^ 1). Доказательство этого предложения читатель найдет в [7], глава II, § 7. 2. Для того чтобы сформулировать свойства характеристических чисел и собственных векторов осцилляционной матрицы, введем некото- некоторые предварительные понятия и обозначения. Рассмотрим вектор (столбец) u = (ulf u2, .... Un). Будем подсчитывать число перемен знака в ряду координат щ, и2, ... н„ вектора и, приписывая нулевым координатам (если таковые имеются) произвольные знаки. В зависимости от того, какие мы знаки припишем нулевым координатам, число перемен знака будет колебаться в изве- известных пределах. Получающиеся при этом максимальное и минимальное числа перемен знака будем обозначать соответственно через Si. и Su- Sufi том случае, когда Su — Su, мы будем говорить о точном числе пере- .мен знака и обозначать его через Su. Очевидно, Su = St тогда и только
400 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII тогда, когда 1° крайние координаты щ и ип вектора и отличны от нуля, и 2° равенство щ = 0 A < i < и) всегда сопровождается неравенством Щ-i'h+i < 0. Теперь мы докажем следующую основную теорему: Теорема 13.1. Осцилляционная матрица ^4==||а;^||" всегда имеет п различных положительных характеристических чисел .. >Х„>0. A26) 1 2. У собственного вектора u = {Uu, uzu ..., ип1) матрицы А, отве- отвечающего наибольшему характеристическому числу Aj, все координаты 2 отличны от нуля и одного знака; у собственного вектора u = (ulz, и22, ...,ип2), отвечающего второму по величине характеристическому числу %2, в ряду координат имеется точно одна перемена знака и вообще k в ряду координат собственного вектора и = (щи, u2k ..., Unh), соответ- соответствующего характеристическому числу %ь, имеется точно к — 1 перемен знака (/е = 1, 2, ..., п). 3. При любых вещественных числах cg, cg+1, ..., Си h 2j c\ > 0) в ряду координат вектора h A27) ft=g число перемен знака заключается между g — 1 и h—1 g-l^Su^SZ^h-l. A28) Доказательство. 1. Занумеруем характеристические числа %i, Кг, ..., "Кп матрицы А так, чтобы и введем в рассмотрение р-ю ассоциированную матрицу Stp {р — 1, 2, ..., п\ см. гл. I, § 4). Характеристическими числами матрицы 4S.P являются всевозможные произведения по р из характеристических чисел матрицы А (см. стр. 86), т. е. произведения AjA^ • • • Ар, Из условий теоремы следует, что при некотором целом q степень Aq — вполне положительная матрица. Но тогда §Гр>0, Stp>Ox), т. е. 1ДР—неразложимая неотрицательная и притом примитивная матрица. Применяя теорему Фробениуса (см. § 2, стр. 355) к примитивной мат- матрице Sip (p=l, 2, ..., п), получим: АЛ...Яр>0 (р=1, 2, ..., п), AjA,2 ... Ар > А1А2 ... Ap-jAp+i (/з== 1, 2, . .., п—-1). Отсюда вытекают неравенства A25). 2. Из установленных неравенств A25) вытекает, что -4 = |]ajfe||" — матрица простой структуры. Тогда и все ассоциированные матрицы 21 р (р = 1, 2, ..., п) будут иметь простую структуру (см. стр. 86). *¦) Матрица Я| является р-й ассоциированной матрицей для Ач (см. гл. I, стр.- 31).
§ 9] ОСЦИЛЛЯЦИОННЫЕ МАТРИЦЫ 401 Введем в рассмотрение фундаментальную матрицу U = || щъ ||" для матрицы А (в к-м столбце матрицы U стоят координаты к-то собствен- k ного вектора и матрицы А; к=1, 2, ..., п). Тогда (см. гл. III, стр. 86) характеристическому числу Я^ ... Яр матрицы Sip будет соответствовать собственный вектор с координатами U Q1 '22 •'" IpJ (Ki1<i2< ... <i,<n). A29) По теореме Фробениуса все числа A29) отличны от нуля и одного 12 п знака. Умножая векторы и, и, ..., и на ± 1, можно сделать все миноры A29) положительными: и,уу1Л>0 |-^^-р...^-,™_ A30) Фундаментальная матрица U = \\ Щи ||" для матрицы А связана с матри- матрицей А равенством А = U{lit k2, ..., К}U'1. A31) Но тогда л' ГГ'—1 /11 11 7Т' /4Q9\ xi — и 1'^l9'^2i • • ' 1 **ni *-* • V / Сопоставляя A31) с A32), мы видим, что матрица F = «7'-i A33) является фундаментальной для транспонированной матрицы А' при тех же характеристических числах %и h^, ..., %п. Но из осцилляционности матрицы А следует осцилляционность транспонированной матрицы А'. Поэтому и для матрицы V при любом р=1, 2, ..., п все миноры У (j 2 " ' IP) A<t-1 < fe < • • • < «р<») A34) отличны от нуля и имеют один и тот же знак. С другой стороны, согласно A33) матрицы U и V связаны равенством Переходя к р-м ассоциированным матрицам (см. гл. I, § 4), будем иметь: Отсюда, в частности, записывая, что диагональный элемент матрицы @р равен единице, получим: = 1. A35) В левой части этого равенства первые множители в слагаемых положи- положительны, а вторые—отличны от нуля и одного знака. Тогда очевидно, что и вторые сомножители положительны, т. е. 2 ... J Таким образом, для матриц U = \\ uih ||" и V = U'~x одновременно имеют место неравенства A30) и A36). 26 ф. р. Гантмахер
402 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Выражая миноры матрицы V через миноры обратной матрицы V г = V по известным формулам [см. стр. 31], получим: V у 111 /2 ¦ • • /n-p \ _ (-1) У=1 /«1 h ... 1Р \ \12...п—р/~ 1#| \вв-1...п-р + {Г A37) где i'i < г2 < ... < гр и /i < /2 < - -. <С /ге-р вместе дают полную систему индексов 1, 2, ..., п. Так как в силу A30) |{7|>0, то из A36) и A37) вытекает: l 2 ... p=l,2, ...,» . A38) Пусть теперь и — 2 cftw B с| > 0) . Мы покажем, что из неравенств h=g k=g A30) следует вторая часть неравенства A28): 1, A39) а из неравенств A38)—первая: Sz>g—1. A40) Допустим, что 6*+>/г—1. Тогда можно указать такие h-\-l коорди- координат вектора и Щ±, щ2, ..., uifi+1 A <ц<г2< • • • <i/i+i<n), A41) что Ui«uWi<0 (a==1» 2' •••» А)- При этом координаты A41) не могут все одновременно равняться нулю, так как тогда, приравнивая нулю соответствующие координаты h ft h вектора и = У\ chu (с± = ... = с^_! = 0; 2 С1 > 0)> мы получили бы систему fei fei однородных уравнений h = 0 (a = l, 2, ..., с ненулевым решением си с2, ..., ch; в то же время определитель этой системы U h Ч ¦¦¦ ih 1 2 ... h согласно A30) отличен от нуля. Рассмотрим теперь равный нулю определитель ¦ ¦ - uijh Ui2 = 0.
9] ОСЦИЛЛЯЦИОННЫЕ МАТРИЦЫ 403 Раскроем его по элементам последней вертикали: иг---1*~1 la+1 • •"Ift+i; | =0. U Но такое равенство не может иметь места, так как в левой части нет двух слагаемых разных знаков и по крайней мере одно слагаемое отлично от нуля. Таким образом, допущение <5"?>/г—1 привело нас к противо- противоречию, и неравенство A39) можно считать установленным. Введем в рассмотрение векторы u* = (u*ft, u*k, .., Kk) (fc = l, 2, ..., n), где utu = (- l)n+i+h uik (J, Ы, 2 n); тогда для матрицы U* = || u*& ||" в силу A38) будем иметь: ) >0 A<l1<l2< -<*><*) . A42) п п—1 ... п—p + l) \ р = 1, 2, ...,п } v ' Но неравенства A42) аналогичны неравенствам A30). Поэтому, полагая »•= 2 (-!)*<*?•, A43) будем иметь неравенство, аналогичное неравенству A39)х): Sti><n — g. A44) Пусть ы = (иь и2. •••¦> ип), а и* = (и*, м*, ..., и%). Легко видеть, что «? = (—1)*ы* («' = !, 2, ..., п). Поэтому и, следовательно, в силу A44) имеет место соотношение A40). Неравенство A28) установлено. Поскольку из него получается при g — h = k утверждение 2 теоремы, то теорема доказана полностью. 3. Рассмотрим применение доказанной теоремы к исследованию малых колебаний п масс ти т2, ..., тп, сосредоточенных в п подвижных точках Xi < ж2 < • • • < жп сегментного упругого континуума (струна или стержень конечной длины), простирающегося (в состоянии равновесия) вдоль отрезка О^.х^.1 оси х. Обозначим через К(х, s) @<!ж, s^.1) функцию влияния этого конти- континуума [К(х, s) — прогиб в.точке х под действием единичной силы, при- приложенной в точке s], а через кц — коэффициенты влияния для данных п масс: кц = К(хи Xj) (г, 7 = 1, 2, ..., п). h !) В неравенствах A42) в векторы и (k = i, 2, ..., п) идут в обратном порядке n n-i g и, и , ... Вектору и предшествует п — g векторов этого ряда. 26*
404 МАТРИЦЫ С НЕОТРИЦАТЕЛЬНЫМИ ЭЛЕМЕНТАМИ [ГЛ. XIII Если в точках хъ х2, ..., хп приложены п сил Fit Fz, , Fn, то соответствующий статический прогиб у(х) @<!ж<[?) в силу линейного наложения прогибов выразится формулой d2 Заменяя здесь силы Fj силами инерции —тз~ш y(xh Й 0" = ^» 2, , п), получим уравнение свободных колебаний п у (*) = - 2 т*к (*' ъ) -w у (** ')• <145> *=1 Будем искать гармонические колебания континуума в виде у (ж) = и (х) sin (at + а) @<ж<г). A46) Здесь и(х) — амплитудная функция, со — частота, а — начальная фаза. Подставляя это выражение для у(х) в A45) и сокращая на sin (of + а), получим: п и(х) — ю2 ^mjK(x, Xj)u(xj). A47) Введем обозначения для переменных прогибов и для амплитудных прогибов в точках расположения масс: У».= г/(жг, t), щ = и(хг) (i = l, 2, ...,п). Тогда yt = щ sin (co? + а) (? = 1, 2, ..., п). Введем еще приведенные амплитудные прогибы и приведенные коэффи- коэффициенты влияния Zi = YmiUU aiJ = }/rmimjkij (i, j = 1, 2, ..., n). A48) Заменяя в A47) x последовательно на xt (i = l, 2, ...,n), получим систему уравнений для амплитудных прогибов: (=-^; i = l, 2, ...,п). A49) 3=1 Отсюда видно, что амплитудный вектор и = (щ, и2, ..., ип) есть собствен- собственный вектор матрицы А = || а^-1|" -= || Ymimj кц |[? при X = -^ (ср. с гл. X, § 8). В результате подробного анализа1) устанавливается, что матрица коэффициентов влияния || ktj ||^ сегментного континуума всегда является осцилляционной матрицей. Но тогда и матрица А = |[ at]-1|" = || y~mtmjkij ||™ является осцилляционной! Поэтому матрица А (согласно теореме 13) имеет п положительных характеристических чисел См. [Юд, е] и [7], гл. III.
S 9] ОСЦИЛЛЯЦИО ИНЫЕ МАТРИЦЫ 405 т. е. существует п гармонических колебаний континуума с различными частотами: @<)со1<(о2< ... <ю„ (Чг = ~; i = 1, 2, ..., п В силу той же теоремы основному тону с частотой (uj соответствуют амплитудные прогибы, отличные от нуля и одного знака. В ряду ампли- амплитудных прогибов, отвечающих первому обертону с частотой сог, имеется точно одна перемена знака и вообще в ряду амплитудных прогибов для обертона с частотой со,- имеется точно j— 1 перемен знака (j = 1, 2, ..., п). Из того факта, что матрица коэффициентов влияния || kij/fi осцил- ляционна, вытекают и другие осцилляционные свойства континуума: 1) при <й = ю1 амплитудная функция и(х), связанная с амплитудными прогибами формулой A47), не имеет узлов; и вообще при со = ю; эта функция имеет j— 1 узлов (/= 1, 2, ..., п); 2) узлы двух смежных тонов перемежаются и т. д. На обосновании этих свойств мы не можем здесь останавливаться1). 1) См. [7], гл. III, IV.
ГЛАВА XIV РАЗЛИЧНЫЕ КРИТЕРИИ РЕГУЛЯРНОСТИ И ЛОКАЛИЗАЦИЯ СОБСТВЕННЫХ ЗНАЧЕНИЙ § 1. Критерий регулярности Адамара и его обобщения Пусть Л = ||агь||" — произвольная п X /г-матрица с комплексными элементами. Допустим, что эта матрица вырождена, т. е. существуют такие числа хи х2, ..., Хп с максимальным А | = 0. Тогда | что1) Цад 0. A) n Но тогда Сокращая на | хъ |, получаем: п B) 2 I O-kj | | ЖУ | < | Xk | 2 КИ2 3=1 Поэтому, если выполняются условия Адамара ^ (i = l, ...,n), C) то неравенство типа B) невозможно и, следовательно, матрица А является регулярной (невырожденной), т. е. |Л|=/=0. Таким образом, справедлива следующая Теорема 1 (Адамара). Если для матрицы А == [|aih||" выпол- выполняются п неравенств C), то матрица А является невырожденной. Условие Ht > 0 означает, что модуль диагонального элемента ati превосходит (строго!) сумму модулей всех остальных элементов г-й строки. Такой элемент ац называется доминирующим (для своей строчки). Усло- Условия Адамара требуют, чтобы все диагональные элементы матрицы А были доминирующими (для своих строк). Замечание 1. Если выполняются условия Адамара C), то для mod | А | справедлива следующая оценка снизу: mod | Л !>#!#;>...Я„>0. D) г) Равенства A) выполняются при любом /с=1, ..., п. Мы же берем только то значение к, при котором | х^ является максимальным.
§ 1] КРИТЕРИЙ РЕГУЛЯРНОСТИ АДАМАРА И ЕГО ОБОБЩЕНИЯ 407 Для того чтобы убедиться в справедливости неравенства D), введем вспомогательную матрицу F=\\fij\\", где П]=щ («\ / = 1, •¦-, п), E) для которой, очевидно, 2 4 (г = 1, ...,п). F) Обозначим через Хо какое-либо характеристическое число этой матрицы. Числу %0 соответствует собственный вектор (xi, х2, ..., хп) с максималь- максимальным | xh | > 0. Тогда п %axh = S fkjZj. G) 3=1 Из этого равенства с учетом соотношений F) получаем |Ао| |я*|>|/**| 1**1-S \fhj\ Ы>|а*|(|/М|- 2 l/wl) = l«*l- 5=1 5=1 }фк зфк Сокращая на | х^ |, найдем: |Яо|>1. Но определитель | F \ равен произведению характеристических чисел матрицы F. Каждое из них по модулю > 1. Поэтому и mod\F\>l. (8) С другой же стороны, Из (8) и (9) сразу следует искомое неравенство D). Заметим еще, что для всего класса матриц, удовлетворяющих условиям Адамара с заданными значениями Н±, ..., Нп, оценка D) не может быть улучшена, так как неравенство D) переходит в равенство, если в качестве матрицы А взять матрицу ЦЯ^бйЦ. Замечание 2. Поскольку }Л| = |Л'|, то, заменяя матрицу А транспонированной матрицей А', получаем достаточные условия невы- невырожденности матрицы А в виде условий Адамара для столбцов Gi = |a«|-S|e,f|>0 (i = l, ...,n). (Ю) При выполнении этих, условий вместо D) будем иметь mod\A\>GiGz...Gn. A1) Пусть С — произвольная невырожденная п х /г-матрица. Тогда матрицы А и АС одновременно являются невырожденными. Поэтому в условиях C), A0), а также в оценках D) и A1) можно матрицу А заменить на АС. Варьируя матрицу С, будем получать различные (неэквивалентные между собой) достаточные условия невырожденности, а также оценки для | А_|, аналогичные D) и A1). В частности, за счет подбора надлежащей матрицы С можно осуществить произвольную
408 КРИТЕРИЙ РЕГУЛЯРНОСТИ И ЛОКАЛИЗАЦИЯ СОБСТ. ЗНАЧЕНИЙ [ГЛ. XIV перестановку столбцов. Тогда вместо условий C) получим условия Я; = |аг1Ч|-2 |оу|>0 (* = 1,..., в), A2) где ([я-!, ..., \\.п) — фиксированная, но произвольная перестановка индек- индексов 1, 2, ..., п. Другими словами, матрица А = \\ atj \\n будет невырожденной, если в каждой ее строке имеется доминирующий (не обязательна диаеоналъ- ный\) элемент и эти п доминирующих элементов расположены в различ- различных столбцах. Аналогичное предложение имеет место для столбцов. Пусть теперь выполняются ослабленные условия Адамара \\^\J\ (* = 1, ...,п). A3) 3=1 В этом случае каждый диагональный элемент является слабо доминирую- доминирующим для своей строки. Допустим, что матрица А вырождена и Ах = 0, вектор-столбец х = (хи ..., %п)фО имеет ровно р элементов xh с максимальным модулем \Xk\, и пусть сначала p<in. Перенумеруем координаты вектора х так, чтобы этими максимальными по модулю были первые р координат: \xt\=... = \xp\>\xj\ (j = p + l, ..., п). При этом равенство Ах — 0 сохранится, если мы совершим некоторую (но одну и ту же) перестановку строк и столбцов матрицы А. После этого можно написать: п ahhXn = — 2 ah]xj (к = 1, ..., р), откуда р п I ahh | ] xh |< ( 2 I аи;|) | ^h| + 2 I ahjI ] xjК ji jp+i Сокращая на | хъ |, получим п I I V1 Сопоставляя ^ти соотношения с ослабленными условиями Адамара A3), которые имеют место по условию, заключаем, что во всех соотношениях A5), а значит и в A4), имеет место знак равенства. А это возможно' лишь тогда, когда
§ 2] НОРМА МАТРИЦЫ 409 т. е. матрица А имеет вид v iA^ ° \ \р A6) AJ • Но матрица, которая одной и той же перестановкой строк и столбцов приводится к виду A6), называется разложимой (см. гл. 13, § 1). Таким образом, при p<in A — разложимая матрица. Если же р=п, то во всех соотношениях A5) и, следовательно, во всех п ослабленных условиях Адамара A3) имеет место знак равенства. К этим выводам мы пришли, допустив, что А — вырожденная мат- матрица. Таким образом, нами доказана следующая теорема, представляющая собой уточнение теоремы Адамара. Теорема 2 (Ольги Тауски). Если для неразложимой мат- матрицы А выполняются ослабленные условия Адамара A3) и по крайней мере в одном из этих условий имеет место знак >, то матрица А невырождена. Само собой разумеется, что и в этой теореме условия Ht > 0 (i = 1, ..., п) могут быть заменены условиями Gt > 0 (i = 1, ..., п). Для дальнейших обобщений теоремы Адамара нам понадобится понятие о норме прямоугольной матрицы. Этому понятию посвящается следующий параграф. § 2. Норма матрицы В гс-мерном пространстве R векторов-столбцов х введем понятие о норме вектора. Каждому вектору x?R ставим в соответствие некото- некоторое вещественное неотрицательное число || х||н или просто \\x\\ так, чтобы для произвольных векторов х, у из R и произвольного скаляра Я выполнялись следующие условия: 2° 3° IIаII>0, если хфО. Полагая в 2° А = 0, получим, что ||ж|| = 0, если х = 0. Кроме тога, ° б R\||||| ||| у |||| из 2° сразу следует для любых векторов х, y?R:\\x—|| Так, например, можно ввести «кубическую» норму вектора Цж!^ max \xt\ A7) или «октаэдрическую» норму I! Ми— ?> \ ""i г К1' ) «Эрмитову» (в случае вещественного пространства R «евклидову») норму ||ж1|ш определяют равенством1) ^3 1 xt |2. A7") См. гл. IX, § 2.
410 КРИТЕРИЙ РЕГУЛЯРНОСТИ И ЛОКАЛИЗАЦИЯ СОБСТ. ЗНАЧЕНИЙ [ГЛ. XIV Легко проверяется, что все эти нормы удовлетворяют постулатам 1°, 2° и 3°. Рассмотрим теперь произвольную прямоугольную т х /г-матрицу А и связанное с нею линейное преобразование у = Ах. х — п-мерный век- вектор-столбец из /г-мерного пространства R, а у— /n-мерный вектор- столбец из m-мерного пространства S. Введем в этих пространствах нормы векторов ||ж||в = ||ж|| и ||j/||s = = || у ||. После этого норму прямоугольной матрицы А определим равен- равенством хфО Норма т X /г-матрицы А определяется как самой матрицей А, так и теми векторными нормами, которые введены в пространствах R и S. При изменении этих норм изменяется и норма матрицы. Из определения нормы следует очевидное соотношение || Ac ||s< || Л || ||s |Ь. A8') Для двух т х /г-матриц А и В при одном и том же определении вектор- векторных норм имеем соотношение \\А+В\\^\\А\\ + \\В\\. A9) Кроме того, очевидно, что ||ЯЛ|| = |Я|И11- A9') Пусть р X /г-матрица В отображает n-мерное пространство R в /ьмерное S, а т х /^-матрица А отображает р-мерное пространство S в /n-мерное Т. Очевидно, матрица АВ отображает R в Т. Вводя в пространствах R, S и Т векторные нормы и определяя с их помощью нормы матриц || А ||, || В ||, |]АВ||, легко приходим к неравенству \\АВ||<\\А|| ||ВЦ. A9") Так, например, если исходить из «кубических» векторных норм || х \\г = max | xh |, || у \\i = max | yt |, то норма матрицы А = || aih \\ (i = 1, ... ..., m; k — 1, ...,n) определяется формулой || Л ||= max S|ea|. B0) Действительно, в этом случае п п ]| Ах\\i = max I 2 aihXk | < max | xh |max 2 I ath\, i^i^ h=l l^h^n i^i^m fi=l и потому II ^ III В то же время здесь знак = имеет место, если выбрать координаты хи х2, ..., хп вектора х так, чтобы |х1 \ — \х21 = ... = |хп\ и aphxh = I | (ft=l. •••, п), где р — то значение г, при котором достигается
§ 2] НОРМА МАТРИЦЫ 411 максимум в правой части соотношения B0). Таким образом, эта правая часть равна sup '.. х.. и имеет место формула B0)г). хфО II х II Если же исходить из октаэдрических векторных норм то, как нетрудно показать, т || А ||= max S|e»|. B0') п Рассмотрим теперь эрмитовы векторные нормы: || х ||2 = 2 I xk |2 fe=i п ш \\У\\2~ 2 |j/i|2- Тогда, вводя в рассмотрение положительную эрмитову матрицу S~A*A, будем иметь: || Ах ||2 = у*у = x*A*Az = x*Sx, \\ x f = х*х. Но тогда (см. гл. X, § 7) Л ||2 = max ^ = о, где q — максимальное характеристическое число матрицы АА*. В этом ¦случае \\A\\ = Vq. B0") Введем теперь различные нормы для векторных столбцов х и у. Пусть, например, Тогда п la;||ii= 2 1жл1. IIУ Hi = = max | 2 o«fe^fe|< «2 I a% | = fl | !) Иногда норму квадратной п X n-матрицы А вводят аксиоматически (незави- (независимо от векторной нормы): каждой п х n-матрице А ставится в соответствие неот- неотрицательное действительное число \\A\\ так, что: 1° || А || >0, если А ф 0, и || А \\ ф 0, если Л=0. 2е ||Л+-В|К|М|| + ||В||. 3° ||Ы|| = |Я| || А|| (Я—скаляр). Например, можно положшъ ^ Р ИЛИ II 4 II: |=У2 Uk i, h г>1 Вводят одну и ту же векторную норму как для вектора а;, так и для вектора у=Ах и называют эту норму согласованной с нормой ]|.4||, если всегда выпол- выполняется соотношение || Ах \\ <; |] А \\ \\ х \\. Наше определение нормы в этом частном случае (m=n и R = S) удовлетворяет требованиям 1°—4° и согласуется с вектор- векторной нормой. В отличие от произвольной нормы, определяемой аксиоматически, норму матрицы, определяемую с помощью формулы A8), называют операторной нормой, подчиненной данной норме векторов.
412 КРИТЕРИЙ РЕГУЛЯРНОСТИ И ЛОКАЛИЗАЦИЯ СОБСТ. ЗНАЧЕНИЙ [ГЛ. XIV где а= max \aik\- С другой стороны, если a = apq, то, выбирая хч так, чтобы apqxq = a\xq\, и полагая xj = 0 при ]фд, будем иметь равенство \\Ах\\1 = а\\х\\п. Таким образом, в этом случае ||Ла;||= max \aih\. B0"'> § 3. Распространение критерия Адамара на блочные матрицы Пусть п х /г-матрица А разбита на s2 блоков Аа$ с размерами соот- соответственно па х щ (а, р = 1, ..., s): П\ П2 П И ^12 ... ^lA }  A2i A22 ... A2S 1} "a si As2 . . . Ass/ ) ns При этом /г-мерное пространство R автоматически расщепляется на s подпространств Ra с числом измерений па (г = 1, ...,s). Для любого вектора x?R имеет место разложение 2 ( а = 1, ...,«). B1') а=1 Введем векторные нормы в пространствах йа. Поскольку блок-матрица •Лкр отображает i?p в Ra, то тем самым определится и норма = sup ,,;, R". B2) В частности, определяется и норма квадратных матриц Ааа: Если |^4aa|=^=0, то [|^4aa|]>0. В этом случае из B2') легко следует, что х сд 1М«а*а|[ О! С6 и, следовательно, \\Л^\Г1= Ы Правая часть этого равенства имеет смысл и в случае, когда Ааа — вырожденная матрица. (В этом случае справа стоит нуль.) Исходя из этого и из соображений непрерывности, будем считать, что || Ааа \\~1 опреде- определено и в случае | Ааа | = 0 равно нулю. Пусть теперь | А \ = 0 и имеет место равенство Ах = 0 при х Ф 0. Исходя из представлений B1) и B1'), раскрывая блочное произведение
S 3] РАСПРОСТРАНЕНИЕ КРИТЕРИЯ АДАМАРА НА БЛОЧНЫЕ МАТРИЦЫ 413 Ах, мы сможем написать 8 — Ааа,Ха = 2 А<х№ (а = 1, • • •, S). B4) р=1 Р>а Отсюда в силу установленных ранее свойств нормы матрицы (см. A8') я A9)) II Аааха || < 2 II ^р II < 2 II Art II II *Р II (о = 1, ..., s). B5) С другой стороны, из B3) следует \\А~* Ц-11| жа || <\\Аааха || (о=1, .... в), что в сочетании с предыдущими неравенствами B5) дает II А^ Ц || *а ||< 2 || ЛкР || || ^р || (О = 1, . . ., S). B6) Р=1 Р?=а Как и в § 1, выберем индекс а так, чтобы ||а;в|| имел наибольшее зна- значение (по сравнению с ||яр[|, где $Фа), и заменим в правой части B6) все ||яр|| на ||жк|]. После сокращения на ||жа||>0 получим Maair^SlMcpll- B7) р=1 Поэтому при выполнении «блочных условий Адамара» \\А™\Г1-%\\Аа»\\>0 (o = l,...,s) B8) P=i РчЬа соотношение B7) невозможно и матрица А не может быть вырожденной. Мы пришли к теореме: Теорема 3. Если выполняются блочные условия Адамара B8), то А — невырожденная матрица. В частном случае щ = п2 = ... = ns = 1 эта теорема переходит в тео- теорему Адамара, если в одномерных подпространствах Ra определить норму так: || ха || = | ха \ (a=.l, ...,s). Само собой разумеется, что, записывая условие невырожденности транспонированной матрицы А', можно в теореме 3 условия Адамара для блочных строк заменить условиями Адамара для блочных столбцов: ^ (о=1, ...,*). B8') РФа На блочные матрицы легко распространяется и теорема Ольги Тауски, если только в этой теореме потребовать «блочную» неприводимость матрицы А и выполнение ослабленных блочных условий Адамара со стро- строгим знаком > хотя бы в одном из них.
414 КРИТЕРИЙ РЕГУЛЯРНОСТИ И ЛОКАЛИЗАЦИЯ СОБСТ. ЗНАЧЕНИЙ [ГЛ. XIV § 4. Критерий регулярности Фидлера Пусть снова п х гс-матрица А представлена в блочном виде B1). Составим для нее числовую s х s-матрицу с вещественными элементами: ЧИ12Ц ¦-. || Ли11| ... —\\A -1И .2 B9) У этой матрицы все недиагональные элементы < 0, а диагональные > 0. Напомним читателю, что матрица с вещественными элементами назы- называется М-матрицей, если у нее все недиагональные элементы ^ 0, т. е. неположительные и все главные миноры положительны1). Имеет место Теорема 4 (Фидлера). Если s х s-матрща G является М-матрицей, то п X п-матрица А является регулярной. Доказательство. Допустим, что |Л| = 0. Тогда Ах = 0, где хфО. Исходя из представлений B1) и B1'), как и ранее на стр. 413, получаем неравенства B6), которые теперь перепишем так: (о=1 »). C0> 1. Пусть сначала все ||жа||>0. Тогда, увеличивая надлежащим образом в C0) коэффициент при ||жв||, т. е. заменяя 11-4^ Ц на неко- некоторое число gaa'>\\A^\\~l, мы из неравенств C0) получим систему равенств которые в матричной символике запишутся так: где gll —|| ^12 II ••• -1| A2i || g22 -\\Asl\\ -\\As2\\ ... а %Ф 0—s-мерный вектор-столбец с элементами ||?i||, •-., \\ха\\. Отсюда сразу следует, что | G \ = 0. С другой стороны, из определения М-матрицы следует, что |G|>|fi|>0. Мы пришли к противоречию, допустив, что» Если некоторые || ха || = 0, то мы возьмем лишь те из соотношений C0), которые соответствуют значениям а, при которых " "" Л !) Согласно лемме Котелянского (см. стр. 369), для этого достаточно, чтобы ns последовательных главных миноров были положительны.
§ 5] КРУГИ ГЕРШГОРИНА И ДРУГИЕ ОБЛАСТИ ЛОКАЛИЗАЦИИ 415 Повторяя дословно предыдущие рассуждения и оперируя вместо | G \„ некоторым главным минором матрицы G, мы снова придем к противо- противоречию. Теорема доказана полностью. § 5. Круги Гершгорина и другие области локализации Пусть А — \\o-ih\\i—произвольная п X гс-матрица с комплексными элементами и Я — некоторое ее характеристическое число. Тогда А — КЕ — вырожденная матрица, и потому для нее не могут выполняться все условия Адамара, т. е. должно иметь место хотя бы одно из соотно- соотношений |вц-Я|<2|«1/| (* = 1,...,л). C1) 3=1 Каждое из соотношений C1) определяет некоторый круг в комплексной п Я-плоскости с центром в точке пц радиуса 2 I аа I- Мы пришли к теореме, установленной Гершгориным в 1931 г. Теорема 5 (Гершгорина). Каждое характеристическое число % матрицы А = || а^ ||" всегда расположено в одном из кругов C1). Таким образом, объединение всех точек кругов Гершгорина C1) дает некоторую область локализации характеристических чисел мат- матрицы А, т. е. область, в которой заведомо лежат все характеристические числа матрицы А. Каждый критерий регулярности приводит к своей области локализации характеристических чисел. Так, исходя из условий Адамара для столбцов, мы получили область локализации в виде объединения п кругов [Я-в|||<2|«|Л (i=l,...,n). C1') 3=1 НА Блочные условия Адамара приводят нас сразу к теореме: Теорема 6. Каждое характеристическое число % п X п-матрицы А, представленной в блочном виде А = {Лкр}|, принадлежит по крайней мере одной из областей: НСЛю-ад-ЧГ^ЗИоэН (о = 1, ...,«), C2) а также по крайней мере одной из областей \\{Ааа-Ша)-Ц-^<^\\А^\\ (о = 1, ...,s) C2') P=i &фа (здесь Еа — единичная матрица того же порядка, что и Ааа; а = 1, ..., s). Выясним, какую область локализации можно получить, исходя из критерия Фидлера. Пусть неотрицательные числа си с2, ..., cs
416 КРИТЕРИЙ РЕГУЛЯРНОСТИ И ЛОКАЛИЗАЦИЯ СОБСТ. ЗНАЧЕНИЙ [ГЛ. XIV выбраны так, чтобы матрица C3) >-\\Ал\\ -\\АЛ\\... была ослабленной М-матрицей,' т. е. чтобы все главные миноры этой матрицы были неотрицательны (недиагональные элементы в этой матрице заведомо все <;0). Допустим теперь, что при некотором числе Я выпол- выполняются s неравенств: \\(Ааа-кЕауЦ-1>са (а=1, ...,*). C4) Тогда, заменяя в матрице C3) с„ на \\(Ааа — 'кЕа)~1\\~1 (а = 1, ...,s), мы строго увеличим все диагональные элементы и получим уже М-матрицу (неослабленную!) и-ля,)-*!!-1 -IMull ••• -\\Ais\ -\\Л21\\ Но тогда по теореме Фидлера j А — КЕ | ^ 0 и число Я не является характеристическим числом матрицы А. Поэтому для любого характеристического числа Я матрицы А по крайней мере одно из неравенств C4) не выполняется, т. е. выпол- выполняется одно из соотношений || (Ааа - Я^Г11Г1 < са (а = 1 »). C5) Объединение s областей C5) и образует область локализации Фидлера, зависящую от специально выбираемых неотрицательных параметров си с2, ..., cs. Теорема 7 (Фидлера). Если неотрицательные числа си с2, ..., cs выбраны так, чтобы матрица C3) была ослабленной М-матрицей, то каждое характеристическое число Я матрицы А принадлежит по крайней мере одной из s замкнутых областей C5). Рассмотрим в качестве примера симметрическую матрицу 4-го порядка 0 4 1-1 4 0-11 1 _1 _1 15 — 1 1 15 -1 Поскольку матрица А симметрическая, то у нее все характеристические числа вещественны. Поэтому вместо областей локализации в комплексной Я-плоскости можно рассматривать отрезки, высекаемые этими областями на вещественной Я-оси. I. Область Гершгорина состоит из одного сегмента 1 —1 — 1 1 А = который перекрывают остальные сегменты Гершгорина. II. Разобьем матрицу А на 4 блока: 12 О 4 4 О -1 15 15 -1
§5] КРУГИ ГЕРШГОРИНА И ДРУГИЕ ОБЛАСТИ ЛОКАЛИЗАЦИИ 417 (Аи — Л?'1)= В данном случае -к -4 -4 —к -1-Я, — 1 — к -15 -15 Рассмотрим три варианта нормировки подпространств i?j и i?2: а) в i?! и Д2 — кубические нормы; б) в jRj кубическая, а в Rz—октаэдральная норма; UB ДВ \Ла\ -i4Jf2-M -В -6 \4J-2 О г\4) 6 8 10\J2 M Рис. 6. в) в i?j октаэдральная, а в Rz—кубическая норма, а) Нормы всех блоков определяются по формуле B0'): || Аа||=2, ||421||=2, ||(Ai-^1)-1| Блочные области Гершгорина: представляют собой совокупность 4 интервалов: — 18<А.< —16, — 6<А.<— 2, 2<Л<6, 12<Л<16. (Па) б) В этом случае выражения для || (Ац — hEi)'1 Ц и \\(А22—кЕ2)'1\\~1 остаются прежними, но и л II II -Аи II - тах 1 3?9 1 | - max 2 \ Хя Хо I I 1 ^ I тах . тт - Блочные области Гершгорина: распадаются на 4 интервала — 20<Л< —12, —5<Л<— 3, 3<Л<5, 10<Л<18. (Пб) в) Отличие от предыдущего случая заключается лишь в том, что здесь 1Мм|| = 4, \\А1г\\ = 1. Поэтому блочные области Гершгорина распадаются на 3 интервала: — 17<А.< —15, —8<Л<8, 13<Л<15. (Нв) На схеме (рис. 6) изображены области I, Па, Пб, Пв. Их пересечение дает области локализации: — 17<Я< —15, — 5<А<— 3, 3<А<5, 13<Я<15. 27 ф. р. Гантшахер
418 КРИТЕРИЙ РЕГУЛЯРНОСТИ И ЛОКАЛИЗАЦИЯ СОБСТ. ЗНАЧЕНИЙ [ГЛ. XIV III. При применении критерия Фидлера будем снова исходить из нормировок а), б), в): с, -\\А —1|421 || С2 cj —2 -2 с2 Желая получить наименьшие значения с1 и с2, полагаем Область Фидлера 1, ||А-И|-15|<с2 совпадает с областью На при Cj = 2, с2 = 2, с областью Иб — при с± = 1, Н-3 ¦ Н -4 0 4 14 Рис. 7. с2 = 4 и с областью Пв при ct = 4, c2 = l. Область Фидлера состоит из 4 интервалов: —4 + clt ] 4—с1<Л<4 + с1, 14 —с2<Я<14 + с2 и зависит от одного положительного параметра, поскольку ci = 4/c2. Можно определить пересечение всех этих областей Фидлера. Для этого (рис. 7) приравняем величины: 1) —16 —с2= —4—сь 2) — 16 + с2=— 4 — си 3) -16 + с2=-4 + с1, 4) 4-Cl = 14-c2, 5) 4 + Cl = 14 — c2) 6) 4 + С! = 14 + с2. Используя равенство с^сг = 4, получим 6 квадратных уравнений с наимень- наименьшими положительными корнями: 1) <*—12с„-4 = 0, 2l=-6 +1/0 = 0,3246 .... 2) с\— 12с2'+4 = 0, z2 = 6-|/2 = 0,3431 ..., 3) cJ + 12Cl —4 = 0, 23 = 2!=-6+1/40 = 0,3246 ..., 4) cl + lOd—4 = 0, Ч=— 5 +/29 = 0,3852 ..., 5) c*-10Cl + 4 = 0, z5 = 5-/21 = 0,4174 ..., 6) с^+10с2-4 = 0, z6 = z4=-5 +/29 = 0,3852 ... Нетрудно уяснить себе, что область локализации, состоящая из пе- пересечения всех областей Фидлера, состоит из следующих 4 сегментов: — 16 —2!<Л<—16 + Z2) — 4 — 4 —
ГЛАВА XV ПРИЛОЖЕНИЯ ТЕОРИИ МАТРИЦ К ИССЛЕДОВАНИЮ СИСТЕМ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ § 1. Системы линейных дифференциальных уравнений с переменными коэффициентами. Общие понятия Пусть дана система линейных однородных дифференциальных урав- уравнений первого порядка: п ^=2 />**(*)** (i = l,2, ...,п), A) где рц (t) (i, Ac= 1? 2, ..., n) — комплексные функции вещественного аргу- аргумента t, непрерывные в некотором (конечном или бесконечном) интервале изменения t1). Полагая Р (t) = || pih (t) \\™ и х = (хи х2, ...,Хп), мы систему A) запи- запишем так: ^ = P(t)x. B) Интегральной матрицей системы A) мы будем называть квадратную матрицу X (t) = |] xtk (t) И?, столбцами которой являются п линейно неза- независимых решений системы. Так как каждый столбец матрицы X удовлетворяет уравнению B), то и интегральная матрица X удовлетворяет уравнению P(t)X. C) В дальнейшем мы вместо системы A) будем рассматривать матричное уравнение C). Из теоремы о существовании и единственности решения системы линейных дифференциальных уравнений2) следует, что интегральная матрица X(t) однозначно определяется, если задано значение этой матрицы при некотором («начальном») значении t = tos), X(to) = Xo. В качестве матрицы Хо можно взять любую неособенную квадратную матрицу тг-го порядка. В частном случае, когда X(to) = E, интегральную матрицу X (t) будем называть нормированной. !) Все соотношения этого параграфа, в которые входят функции от *, имеют место для данного интервала изменения t. 2) Доказательство этой теоремы приведено далее в § 5. См. также И. Г Пет- Петровский, Лекции по теории обыкновенных дифференциальных уравнений, «Наука», 1964. 3) Предполагается, что t0 принадлежит данному интервалу изменения t. 27*
420 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV Продифференцируем определитель матрицы X, дифференцируя после- последовательно строки определителя и используя при этом дифференциальные соотношения d ¦ п -ЗГ = 2 Р Тогда получим: Отсюда следует известное тождество Якоби t I SpPdt | X | = се'о , D) где с — постоянная, а SVP = PU + P22+ ••• +Рпп — след матрицы Р (t). Так как определитель ] X | не может тождественно равняться нулю, то с Ф 0. Но тогда из тождества Якоби следует, что определитель | X | при любом значении аргумента отличен от нуля т. е. интегральная матрица при любом значении аргумента является неособенной. Если X (t) — неособенное (| X | Ф 0) частное решение уравнения C), то общее решение этого уравнения определяется формулой где С — произвольная постоянная матрица. Действительно, умножая обе части равенства ^- = РХ F) справа на С, убеждаемся, что и матрица ХС удовлетворяет уравне- уравнению C). С другой стороны, если X — произвольное решение уравнения C), то из F) следует: откуда в силу C) и т. е. имеет место E). Все интегральные матрицы X системы A) получаются по формуле E) при \С\фО. Рассмотрим частный случай:
S 1J ОБЩИЕ ПОНЯТИЯ 421 где А— постоянная матрица. При этом Х=^е есть частное неособенное решение уравнения G)*) и потому общее решение этого уравнения имеет вид Х = емС, (8) где С — произвольная постоянная матрица. Полагая в (8) t = t0, найдем: X0 = eAi°C. Отсюда C = e-At°X0 и потому формулу (8) можно представить в виде (9) Эта формула эквивалентна выведенной ранее формуле D6) главы V (стр. 125). Рассмотрим еще так называемую систему Коши: -^т = -=—X (А — постоянная матрица). A0) Этот случай сводится к предыдущему заменой аргумента: и = ln{t— а). Поэтому общее решение системы A0) выглядит так: X = eA^t-aW = (t — a)AC. A1) Функции ем и (t — а)А, встречающиеся в формулах (8) и A1), могут быть представлены в виде (стр. 125) ем = 2 (Zki + Zhzt +...+ Zhmhtmh~l)е%ь*, A2) Ft-—-1 (/ —fl)A=|j (Zftl + ZA2ln(«-c)+...+ZAmft[ln(«-fl)]m*-1)(t-flLA3) Здесь гр(К) = (Л—Лц)™1 (Х-Я2)тг. . .(X-Xs)ms {hi Ф lh при 1фк; i, к = 1, 2, .. ., s) —минимальный многочлен матрицы A, a Zy (/ = 1,2, ..., m^; к= 1, 2, ... ..., s) — линейно независимые постоянные матрицы, являющиеся много- многочленами от А2). Замечание. Иногда в качестве интегральной матрицы системы дифференциальных уравнений A) берут матрицу W, у которой строки являются линейно независимыми решениями системы. Очевидно, матрица W будет транспонированной матрицей для X: Почленно дифференцируя ряд eAt=2j ~А{ '**, находим: — eAt = AeAt. 2) В правой части формулы A2) каждое слагаемое Xfe=( ...+Zftm/ii A ) е "А (fc=l, 2, ..., s) является решением уравнения G). Действи- Действительно, этому уравнению удовлетворяет произведение g (A) e ' при любой функции g(K). Но Xk=f (A)—g (A) eAt, если /(X)=g(A,)ew и ^(^й) = 1, а все остальные те—1 значений функции g (X) на спектре матрицы А равны нулю [см. A6) на стр. 111].
422 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV Переходя в обеих частях равенства C) к транспонированным мат- матрицам, мы вместо C) получим следующее уравнение для W: WP(t) C') В правой части этого уравнения матрица W стоит первым множителем, а не вторым, как X в уравнении C). § 2. Преобразование Ляпунова Допустим теперь, что в системе A) [и в уравнении C)] матрица коэффициентов Р (t) = || pa (t) ||"—непрерывная ограниченная функция от i в интервале [t0, соI). Введем вместо неизвестных функций хи xz, ..., Хп новые неизвестные функции ylt уг, ..., уп при помощи преобразования а* =2 kh(t)yh (i = l, 2 n). A4) На матрицу преобразования L (t) — \\ 1м (t) ||" наложим следующие ограничения: 1° L (t) имеет непрерывную производную -j- в интервале [to, со); 2° L(t) и -?- ограничены в интервале [t0, со); 3° существует постоянная т такая, что 0<m<mod|L(i)| (t>t0), т. е. определитель [ L (t) | ограничен по модулю снизу положительной постоянной т. Преобразование A4), в котором матрица коэффициентов L (t) = || ?,ь (t) ||" удовлетворяет условиям 1°—3°, мы будем называть преобразованием Ляпунова, а соответствующую матрицу L(t)—матрицей Ляпунова. Такие преобразования рассматривал А. М. Ляпунов в своем знаме- знаменитом мемуаре «Общая задача об устойчивости движения» [19]. Примеры. 1. Если L=const и \Ь\ФО, то матрица L удовлетворяет условиям 1°—3°. Следовательно, неособенное преобразование с постоянными коэф- коэффициентами всегда является преобразованием Ляпунова. 2. Если Х>=|| djft ||"—матрица простой структуры с чисто мнимыми характе- характеристическими числами, то матрица L(t)=e™ удовлетворяет условиям 1°— 3° и потому является матрицей Ляпунова2). Легко проверить, что из свойств 1° — 3° матрицы L{t) следует, что существует обратная матрица L (?) и что она удовлетворяет тем же условиям 1°-—3°, т. е. обратное преобразование для преобразования Ляпунова снова является преобразованием Ляпунова. Точно так же проверяется, что два последовательных преобразования Ляпунова в результате снова дают преобразование Ляпунова. Таким образом, преобразования Ляпунова образуют группу. Преобразования Ляпунова обладают следующим важным свойством: 1) Это означает, что каждая из функций ptk (t) (i, fc=l, 2,..., n) непрерывна и ограничена в интервале [t0, с»), т. е. при t > t0. 2) При этомв формуле A2) все mA~l, a Xk=i<fk (фь вещественны, ft=i, I, .... s).
f 3] ПРИВОДИМЫЕ СИСТЕМЫ 423 Если при преобразовании A4) система уравнений A) переходит € систему нулевое решение которой является устойчивым, асимптотически устой- устойчивым или неустойчивым по Ляпунову (см. гл. V, § 7), то таким же свойством обладает и нулевое решение исходной системы A). Другими словами, преобразования Ляпунова не изменяют характери- характеристики нулевого решения (в отношении устойчивости). Поэтому эти преоб- преобразования могут быть использованы при исследовании устойчивости для упрощения исходной системы уравнений. Преобразование Ляпунова устанавливает одно-однозначное соответ- соответствие между решениями систем A) и A5), при этом линейно независимые решения остаются таковыми и после преобразования. Поэтому преобра- преобразование Ляпунова переводит интегральную матрицу X системы A) в неко- некоторую интегральную матрицу У системы A5), при этом X = L(t)Y. A6) В матричной записи система A5) имеет вид где Q (t) = || qik (t) ||? — матрица коэффициентов системы A5). Подставляя в C) вместо X произведение LY и сопоставляя полученное уравнение с A7), легко найдем следующую формулу, выражающую мат- матрицу Q через матрицы Р и L: Q = L-1PL-L~1^. A8) Две системы A) и A5) или, что то же, C) и A7) мы будем называть эквивалентными (в смысле Ляпунова), если они переводятся друг в друга преобразованием Ляпунова. Матрицы коэффициентов Р viQ эквивалентных систем всегда связаны между собой формулой A8), в которой матрица L удовлетворяет условиям] Iе—3°. § 3. Приводимые системы Среди систем линейных дифференциальных уравнений первого порядка наиболее простыми и наиболее изученными являются системы с постоянными коэффициентами. Поэтому представляют интерес системы, которые при помощи преобразования Ляпунова могут быть приведены к системам с постоянными коэффициентами. Такие системы А. М. Ляпу- Ляпунов называл приводимыми. Пусть дана приводимая система ~ = РХ. A9) Тогда некоторое преобразование Ляпунова X = L(t)Y B0) переводит ее в систему ^ B\)
424 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРБНЦ. УРАВНЕНИЙ [ГЛ. XV где А — постоянная матрица. Поэтому система A9) имеет частное решение X=L(t)eAi. B2) Легко видеть, что, и обратно, всякая система A9), имеющая частное реше- решение вида B2), где L (t) — матрица Ляпунова, аЛ — постоянная матрица, является приводимой и при этом она приводится к виду B1) при помощи преобразования Ляпунова B0). Следуя А. М. Ляпунову, покажем, что всякая система A9) с периоди- периодическими коэффициентами приводима г). Пусть в данной системе A9) Р (t) — непрерывная функция в интер- интервале (— оо, -J- оо) с периодом т: P(t + x) = P(t). B3) Заменяя в A9) t на t -f- т и используя B3), получим: Таким образом, X (t -[- т), как и X (t), является интегральной матрицей системы A9). Поэтому X(t-{-r} — X(t)V, где V — некоторая постоянная неособенная матрица. Поскольку | V | ф 0, то можно определить 2) Эта матричная функция от t, как и X (t), умножается справа на V, если к аргументу прибавить т. Поэтому «частное» InV является непрерывной периодической функцией с периодом т: и с определителем \ L (t) \ Ф 0. Матрица L (t) удовлетворяет условиям 1°—3° предыдущего параграфа и, следовательно, является матрицей Ляпунова. С другой стороны, поскольку решение X системы A9) представимо в виде lnVf X = L(t)e~ , то система A9) приводима. В данном случае преобразование Ляпунова X = L(t)Y, приводящее систему A9) к виду имеет периодические коэффициенты с периодом т. А. М. Ляпуновым был установлен 3) весьма важный критерий устой- устойчивости и неустойчивости по первому линейному приближению для !) См. [22], § 47. 2) Здесь In V — f (V), где / (X) — какая-либо однозначная ветвь функции In л. в односвязной области G, содержащей все характеристические числа матрицы V и не содержащей числа 0. См. гл. V. 3) См. [22], § 24.
§ 3] ПРИВОДИМЫЕ СИСТЕМЫ 425 нелинейных систем дифференциальных уравнений п f 2 (г = 1, 2, ...,«), B4) где в правых частях стоят сходящиеся степенные ряды относительно х±, х2,. . ., хп, а ('№?¦) обозначает сумму членов этих рядов второго порядка и выше относительно xit х2, . . ., хп; коэффициенты а^ (i, к = 1, 2, ... . . ., п) в линейных членах постоянны г). Критерий Ляпунова. Нулевое решение системы B4) будет устойчивым (и притом асимптотически), если матрица коэффициентное первого линейного приближения А = || aik \\™ имеет все характеристиче- характеристические числа с отрицательными вещественными частями, и неустойчивым, если хотя бы одно из этих характеристических чисел имеет положитель- положительную вещественную часть. Приведенные выше рассуждения позволяют использовать этот кри- критерий для систем с периодическими коэффициентами в линейных членах: п -^Г=У> Pih(t)xk + (**) (? = 1, .... га). B5) Действительно, на основании предыдущих рассуждений можно при помощи преобразования Ляпунова систему B5) привести к виду B4), где а. V — постоянная матрица, на которую умножается интегральная мат- матрица соответствующей линейной системы A9) при сдвиге аргумента на т. Не нарушая общности, можем считать т > 0. В силу свойств преобразо- преобразования Ляпунова нулевое решение исходной системы и нулевое решение преобразованной одновременно являются устойчивыми, асимптотически устойчивыми или неустойчивыми. Но характеристические числа Kt и Vj (? = 1, 2, . . ., п) матриц А и V связаны между собой формулой Xi^Mnvt (г=1, 2, ...,п). Поэтому, применяя критерий Ляпунова к приведенной системе, найдем 2): Нулевое решение системы B5) будет асимптотически устойчивым, если все характеристические числа v1? v2, . . ., vn матрицы V по модулю <1, и неустойчивым, если хотя бы одно из этих чисел по модулю >1. А. М. Ляпунов установил свой критерий устойчивости по линейному приближению для значительно более широкого класса систем, а именно для систем вида B4), у которых система линейного приближения не обя- обязательно система с постоянными коэффициентами, но принадлежит к классу систем, названных Ляпуновым правильными 3). Класс правильных линейных систем содержит в себе как часть все приводимые системы. Критерий неустойчивости для случая, когда первое линейное прибли- приближение является правильной системой, был установлен Н. Г. Четаевым 4). а) Коэффициенты при нелинейных членах могут зависеть от *. На эти функцио- функциональные коэффициенты налагаются известные ограничения (см. [22], § 11). 2) См. там же, § 55. 3) Там же, § 9. «) См. [38], стр. 181.
426 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV § 4. Каноническая форма приводимой системы. Теорема Еругина Пусть даны приводимая система A9) и эквивалентная ей (в смысле Ляпунова) система где А—постоянная матрица. Нас будет интересовать вопрос, в кикой степени матрица А опре- определяется данной системой A9). Этот вопрос можно еще сформулиро- сформулировать так: В каком случае две системы dYAY udZ где А и В— постоянные матрицы, являются эквивалентными по Ляпу- Ляпунову, т. е. переводятся друг в друга преобразованием Ляпунова? Для того чтобы ответить на этот вопрос, введем понятие о матрицах, имеющих одну и ту же вещественную часть спектра. Мы будем говорить, что две матрицы А и В га-го порядка имеют одну и ту же вещественную часть спектра в том и только в том случае, когда элементарные делители матриц А и В имеют соответственно вид {к-к^1, (к-ъгг, •¦¦, (*-*.)"*• и (я-шГМя-м*I11', ....(ь-ц.I"-. где Renfe (*=1, 2, ...,s). Имеет место следующая теорема, установленная Н. П. Еругиным1): Теорема 1 (Еругина). Две системы — =ЛУ и — = BZ B6) at at (А и В—постоянные матрицы п-го порядка) эквивалентны в смысле Ляпунова в том и только в том случае, если матрицы А и В имеют одну и ту же вещественную часть спектра. Доказательство. Пусть даны системы B6). Приведем матрицу А к нормальной жордановой форме2) (см. гл. VI, § 7) А = Т {КгЕг + Ни %гЕ2 + Я2, ..., KSES + Я,} Т~\ B7) где ^й = аь + г'Рь (ctft, pft — вещественные числа; Ж = 1, 2, ..., s). B8) В соответствии с B7) и B8) положим: j, а2Е2-\-Н2, .. ., asEe " • • » ^Ps^SJ * * х) См. [11], стр. 9—15. Приведенное здесь доказательство теоремы отличается от доказательства Н. П. Еругина. 2) Ek—единичная матрица, в Н^ элементы первой наддиагонали равны едини- единице, а остальные элементы равны нулю; порядок Ek, -Hfc равен степени fc-го элемен- элементарного делителя матрицы А, т. е. т^(А: = 1, 2, ..., s).
§ 4] КАНОНИЧЕСКАЯ ФОРМА ПРИВОДИМОЙ СИСТЕМЫ. ТЕОРЕМА ЕРУГИНА 427 Тогда A^Ai+Az, AlAz = A2Ai. C0) Определим матрицу L (t) равенством A (t) = еА&. L (t)—матрица Ляпу- Ляпунова (см. пример 2 на стр. 422). Но частное решение первой из систем B6) в силу C0) имеет вид gAt = g Отсюда следует, что первая из систем B6) эквивалентна системе где согласно B9) матрица Ах имеет вещественные характеристические числа и ее спектр совпадает с вещественной частью спектра матрицы А. Аналогично вторую из систем B6) заменим эквивалентной f = BtV, C2) где матрица Z?i имеет вещественные характеристические числа и ее спектр совпадает с вещественной частью спектра матрицы В. Наша теорема будет доказана, если мы покажем, что две системы C1) и C2), в которых матрицы А± и Вг—постоянные матрицы с веще- вещественными характеристическими числами, могут быть эквивалентны лишь в том случае, когда матрицы Ах и В% подобны1). Пусть преобразование Ляпунова U = LlV переводит C1) в C2). Тогда матрица L% удовлетворяет уравнению Это матричное уравнение относительно Lx эквивалентно системе п2 диф- дифференциальных уравнений относительно п2 элементов матрицы L4. Правая часть в C3) представляет собой линейную операцию над «вектором» Lt в пространстве п2 измерений ^ = F(A) [FiL^A^-bBA. C3') Любое характеристическое число линейного оператора F (и соответ- соответствующей ему матрицы порядка и2) представляется в виде разности у—б, где у—характеристическое число матрицы Аи а б—характеристическое число матрицы В±2). Отсюда следует, что оператор F имеет только веще- вещественные характеристические числа. г) Из этого положения следует теорема 1, поскольку эквивалентность систем <31) п C2) означает эквивалентность систем B6), а подобие матриц Аг и В^ означает, что эти матрицы имеют одинаковые элементарные делители и потому матрицы А и В имеют одну и ту же вещественную часть спектра. 2) В самом деле, пусть Ло—какое-либо характеристическое число оператора F. Тогда существует матрица L фО такая, что F(L)=AoL или (Ai—A0E)L=LB1. (*) Матрицы Ai—Ло# и Bi имеют хотя бы одно общее характеристическое число, так как в противном случае существовал бы такой многочлен g(ty, что g(Ai-A0E)=0, g(Bl)=E, а это невозможно, поскольку из (*) следует: g(At—AoE)-L=L-g(Bj) и L Ф 0. Но
428 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV Обозначим через $ {К) = (К-К^1 (Х-А2р ... (K — lufu (Kt вещест- вещественны; Kt^=Kj при iф]\ i, /=1, 2, ...,u) минимальный многочлен для F. Тогда решение L1(t) = eFtL@) системы C3') в силу формулы A2) (стр. 421) запишется так: МО =2 S ?*АЧ C4> где Lkj—постоянные матрицы тг-го порядка. Поскольку матрица Lt(t) ограничена в интервале (t0, со), то как для любого Хь>0, так и при Xfc = 0 и />0 соответствующие матрицы Ьь} = 0. Обозначим через L-(t} сумму всех слагаемых в C4), в которых Хь<0. Тогда где Тогда 1 согласно C5) ¦-( и 0 — C5 L 0, ') ч (?) = ¦? t->+oo lim Lj _@ + L0, dt ~ (t) = Lo, , Lo = const. C5> C5'> откуда следует, что \Ь0\Ф0, поскольку определитель | Ll (t) | ограничен по модулю снизу. Подставляя в C3) вместо Lt (t) сумму L_ (t) -\- Lo, получим: откуда в силу C5') и, следовательно, .Bj = L^MjLo. C6) Обратно, если имеет место C6), то преобразование Ляпунова переводит систему C1) в систему C2). Теорема доказана. Из доказанной теоремы вытекает, что всякая приводимая система A9) при помощи преобразования Ляпунова X—LY может быть приве- приведена к виду если матрицы At—Ло# и В± имеют общее характеристическое число, то Ло=у—^ где у и б—характеристические числа соответственно матриц А% и В%. Подробное исследование оператора F можно найти в работах Ф. Голубчикова [85а, б].
I 5] МАТРИЦАНТ 429 где J — жорданова матрица с вещественными характеристическими числами. Эта каноническая форма системы заданием матрицы P(t) опре- определяется однозначно с точностью до порядка диагональных клеток в /. § 5. Матрицант Рассмотрим систему дифференциальных уравнений ^ = P(t)X, C7) где P(t) = \\Pih(t)\$ — непрерывная матричная функция в некотором интервале (а, Ь) изменения аргумента t1). Воспользуемся методом последовательных приближений для опреде- определения нормированного решения системы C7), т. е. решения, обраща- обращающегося в единичную матрицу при t = t0 [t0 — фиксированное число из интервала (о, Ь)]. Последовательные приближения Хх (k = Q, 1. 2, ...) будем находить из рекуррентных соотношений djh = P(t)Xh^ (Л = 1, 2, ...), выбирая в качестве приближения Хо единичную матрицу Е. Полагая Х^{1о) = Е (к = 0, 1, 2, ...), мы сможем Xk представить в виде ^idt (к=1, 2, ...). to Таким образом, t t t t X0 = E, Xt = E+\ P(t)dt, X2 = E+\ P(t)dt+ \ P(t)dt \ P(t)dt, ..., to 'o to *o т. e. Xk (k = 0, 1, 2, ...) есть сумма первых /с-j-l членов матричного ряда г t t Е+ ^P(t)dt+ J P(t)dt ^ P(t)dt+... C8) to to <0 Для того чтобы доказать, что этот ряд абсолютно и равномерно сходится в любой замкнутой части интервала (а, Ъ) и определяет иско- искомое решение уравнения C7), мы построим мажорантный ряд. Определим неотрицательные функции g (t) и h(t) в интервале (а, Ь) оавенствами 2) \Pn(t)\, ...,\Pnn{t)\], | [ to 2) (a, b)—произвольный интервал (конечный или бесконечный). Все элементы Pih @ (i> Л=1, 2, , га) матрицы Р (t)—комплексные функции вещественного аргумента t, непрерывные в интервале (а, Ь). Все последующее сохраняет силу, если вместо непрерывности потребовать лишь ограниченность и интегрируемость по Риману [в любом конечном подинтервале интервала (а, Ь)] всех функций pik (г) <г\ Л = 1, 2, ..., п). 2) По определению значение функции g (t) при каком-либо из значений t равно наибольшему из и2 модулей значений pih(t) (г, /с=1, 2, ..., п) при том же зна- значении t.
430 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV Легко проверяется, что функции g(t), а следовательно, и h(t) непрерыв- непрерывны в интервале (а, ЬI). Каждый из п2 скалярных рядов, на которые распадается матричный ряд C8), мажорируется рядом C9) Действительно, t to to to п t 2 \ рч dt j=l t0 to <n to _ wfcg (f) ~ 2 И Т. Д. Ряд C9) сходится в интервале (а, Ь), причем сходится равномерно в любой замкнутой части этого интервала. Отсюда вытекает, что и мат- матричный ряд C8) сходится в (а, Ь) и притом абсолютно и равномерно в любом замкнутом интервале, входящем в (а, Ь). Почленным дифференцированием проверяем, что сумма ряда C8) представляет собой решение уравнения C7); это решение обращается в Е при t = t0. Почленное дифференцирование ряда C8) допустимо, поскольку ряд, получающийся после дифференцирования, отличается множителем Р от ряда C8) и, следовательно, как и ряд C8), является равномерно сходящимся в любой замкнутой части интервала (о, Ь). Таким образом, нами доказана теорема о существовании нормирован- нормированного решения уравнения C7). Это решение будем обозначать через Qtto(P) или просто й'о. Любое другое решение, как было показано § 1, имеет вид где С—произвольная постоянная матрица. Из этой формулы следует, что любое решение, и в частности нормированное, однозначно определяется своим значением при t = t0. Нормированное решение Q\o уравнения C7) часто называют матри- цатпом. Мы показали, что матрицант представим в виде ряда2) t t t .., D0) to to который сходится абсолютно и равномерно в любом замкнутом интер- интервале, в котором функция Р (t) непрерывна. х) Непрерывность функции g (t) в любой точке Ц интервала (а, Ь) следует и» того, что разность g(t) — g(*i) при t, достаточно близком к Ц, всегда совпадает с одной из rfl разностей | рщ Ь) I — I Pih (.h) I (г. lc=i> 2> •••> п)- 2) Представление матрицанта в виде такого ряда было впервые получено Пеано [226].
§ 5] МАТРИЦАНТ 431 Отметим некоторые формулы для матрицанта. 1° Q|o = Q^QtJ {to, h, tcz(a, b)). Действительно, поскольку Qj0 и Q^—два решения уравнения C7), то ?2'0 = Й^С (С—постоянная матрица). Полагая здесь t = tu получим C = Q/J. 2° п1(Р + <?) = ®Ь(Р)п\0(Я), где Я = 1п11 Для вывода этой формулы положим: и Y = XZ. Дифференцируя почленно D1), найдем: Отсюда § = X и, следовательно, поскольку из D1) следует, что Z(to) = E, Подставляя в D1) вместо X, Y, Z соответствующие матрицанты, получаем формулу 2°. t 3° lj Эта формула следует из тождества Якоби D) (стр. 420), если в него вместо X(t) подставить Q|0(P). 4° Если А = |[ alh ||" = const, то Введем следующие обозначения. Если -Р = ||/>гл||", то через mod/3 будем обозначать матрицу Кроме того, если Л = ||а№||" и B = \\bih\\™—две вещественные матрицы и ath<blh (г, к=1, 2, ..., п), то мы будем писать: Тогда из представления D0) следует: 5° Если modP{t)^Q(t), то mouGh(P)^Q?t0(Q) (t>t0). В дальнейшем матрицу тг-го порядка, у которой все элементы равны единице, будем обозначать через /: / = 11111.
432 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV Рассмотрим функцию g (t), определенную на стр. 429. Тогда Отсюда в силу 5° (t>t0). D2) Но Qj0 (g (t) I) есть нормированное решение уравнения Следовательно, в силу 4О1) где t = \g(t)dt. Поэтому из D2) следует: 6° тойп\0(Р)<(±е^т + ~I^е"*М1 (t>t0), где t h(t)=\g(t)dt, g(t)= max {\Pih(t)\}. Покажем теперь, как при помощи матрицанта выражается общее реше- решение системы линейных дифференциальных уравнений с правыми частями: п ^T^IiPih (t)xh + h (t) (i = 1, 2, ..., /г); D3) Pik(t), /j@ (h k = l, 2, ..., тг)—непрерывные функции в интервале изме- изменения аргумента t. Вводя столбцевые матрицы («векторы»] х = (хи х2, ..., хп) и / == = (А. /21 • • •, in) и квадратную матрицу Р = \\ pih ||Г. запишем эту систему так: ? D3') Будем искать решение этого уравнения в виде x = Q\0(P)z, D4) где z — неизвестный столбец, зависящий от t. Подставим это выражение для х в D3'), получим: рп\й {Р)ЧТ&\0 (Р) ¦?¦ = PQ\0](P) z+f (t), откуда Используя замену независимой переменной I переменной h=\ g(t) dt. to
6] МУЛЬТИПЛИКАТИВНЫЙ ИНТЕГРАЛ 433 Интегрируя, находим: t to где с — произвольный постоянный вектор. Подставим это выражение в D4), получим: i х = $0 (Р) $ [Q?o (Р)Г / (т) dx + Q'(o (P) с. D5) 'о Давая t значение to, найдем: х (t0) = с. Поэтому формула D5) принимает вид t х = Q|o (Р) ж (t0) + J X (*, т) / (т) dx, D5') где — так называемая матрица Коши. § 6. Мультипликативный интеграл. Инфинитезимальное исчисление Вольтерра Рассмотрим матрицант й?0 (Р). Разобьем основной интервал (t0, t) на п частей, введя промежуточные точки tu t2, ..., tn-u и положим Ath = — th — th-i (A=l, 2, ..., n; tn = t). Тогда на основании свойства 1° матри- цанта (см. предыдущий параграф) ?4=0^... Q&& D6) Выберем в интервале (tk-u th) промежуточную точку ть(/с = 1, 2, ..., п). Тогда, считая At^ малыми величинами первого порядка, при вычислении Q*fe с точностью до малых второго порядка можно принять Р (t) « const = = p\xh). Тогда P()At ) = Е + Р Ы Ath + (••); D7) здесь символом (**) мы обозначаем сумму членов, начиная со второго порядка малости. Из D6) и D7) находим: (•) D8) и 1 (tt) A*j] + (*). D9) Переходя к пределу при неограниченном увеличении числа интерва- интервалов разбиения и стремлении к нулю длин этих интервалов (при предель- предельном переходе малые члены (*) исчезают1)), получаем точные предельные х) Эти рассуждения могут быть уточнены путем оценки членов, обозначенных нами через (*). 28 ф. Р. Гантмахер
434 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV формулы Qjo(i3)= lim [eP(T*)At» .. д*ь-о и Q{t0 (Р) = lim [Е + Р (т„) Д*п] ...[Е + Р (т2) Д*2] [Е + Р (т,) Д*,]. D9') Выражение, стоящее под знаком предела в правой части последнего равенства, представляет собой интегральное произведение1). Предел его мы назовем мультипликативным интегралом и обозначим символом V [Е + Р (t) dt] = lim [Е + Р (tn) Atn] ...[E + P (^AtiJ. E0) J 'о Д(.-»0 Формула D9') дает представление матрицанта в виде мультипликативного интеграла 14. (Р> = Л, <* + **>• E1) а равенства D8) и D9) могут быть использованы для приближенного вычисления матрицанта. Мультипликативный интеграл ввел впервые Вольтерра в 1887 г. На базе этого понятия Вольтерра построил своеобразное инфинитезималь- ное исчисление для матричных функций (см. [49]J). Вся специфика мультипликативного интеграла связана с непереста- новочностью между собой различных значений подинтегральной матричной функции Р (t). В том же весьма частном случае, когда все эти значения перестановочны между собой Р (?) P[(t") = P (t")P (?) (?, t" € («о,«)), мультипликативный интеграл, как это видно из D8') и E1), сводится к матрице Введем теперь мультипликативную производную E2) Операции Dt и\\ взаимно обратны: о to Если !) 2) Аналог интегральной суммы для обычного интеграла. ) Мультипликативный интеграл (по-немецки «Produkt-Integral») был исполь- использован Шлезингером при исследовании систем линейных дифференциальных уравне- уравнений с аналитическими коэффициентами [61а, Ь], см. также [235]. Мультипликативный интеграл E0) существует не только для функции Р (t), непрерывной в интервале интегрирования, но и при значительно более общих пред- предположениях (см. [154]).
§ 6] МУЛЬТИПЛИКАТИВНЫЙ ИНТЕГРАЛ 435 то и наоборот. Последняя формула может быть еще записана так2): t ^ = X {t) X (toT1. E3) 'о Предлагаем читателю проверить справедливость следующих дифферен- дифференциальных и интегральных формул3): Дифференциальные формулы Dt (ХС) = Dt (X), 1С—постоянная^ Dt (CY) = CDt (У) С'1 [ матрица / II. III. Dt (X-i) = - X-1 Dt (X) X = - (Dt (X')Y, Dt(X"i)=-(Dt(X))'. Интегральные формулы IV. |(o (E + P dt) = l^ (E + P dt) J? (E + P dt). V. ^t -7?t (С—постоянная\ VI. \^{Е + СРС-ЫЪ = С ^JE + PdQC-1 { матрица Г VI I. V [E + (Q + Z)tX) Л] = X (*) Г (Я + X-^X Л) X (fo)6). J to J 'c x) Здесь произвольная постоянная матрица С является аналогом аддитивной произвольной постоянной в обычном неопределенном интеграле. 2) Аналог формулы \ Р dt—X (t)—X(t0) в случае, когда ——=/'. 3) Эти формулы могут быть выведены непосредственно из определения муль- мультипликативных производной и интеграла (см. [67]). Однако интегральные формулы получаются быстрее и проще, если рассматривать мультипликативный интеграл как матрицант и воспользоваться свойствами матрицанта, изложенными в предыдущем параграфе (см. [61а]). 4) Значок ' обозначает переход к транспонированной матрице. 5) Формула VII может быть рассматриваема в известном смысле как аналог формулы интегрирования по частям длн обычных (немультипликативных) интегра- интегралов. Формула VII следует из формулы 2° § 5. 28»
436 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ УРАВНЕНИЙ [ГЛ. XV Выведем еще важную формулу, дающую оценку модуля1) разности между двумя мультипликативными интегралами: VIII. mod [Г (Е+Р dt)— \ * (E+Q &)]<?-&"*«-*)(<***-*>>—l\I(t>to), если mod(P — (q, d — неотрицательные числа, п — порядок матриц Р и Q). Обозначим через D разность Р—Q. Тогда Рассматривая мультипликативный интеграл как матрицант и пользуясь разложением D0) матрицанта в ряд, найдем: [E + (Q + D) dt\ - |fo (E + Q dt) = t t t t t t t = \ Ddt+^ D dt\ Qdt+ \ Qdt *\ Ddt+\ D dt\ D dt + ... ^0 to fo to to to to Из этого разложения видно, что mod-K [E + (Q + D)dt] — \ (E + Q dt)\ L J 'o 'i to J E + (modQ + modD)dt—\ (? + mod (?) to J <o \ [E + (q + d) I dt) — [' [E + ql] dt = -t») _ e<ii(t~tB) = Пусть теперь матрицы Р и Q зависят от некоторого параметра а: P = P(t,a), Q = Q(t,a), и пусть lim P(t, a) = li причем стремление к пределу равномерно относительно t в рассматриваемом интервале (t0, t). Допустим, что, кроме того, лри а —» а0 матрица Q (t, a) по модулю ограничена матрицей ql, где q—положительная постоянная. Тогда, полагая d (a) = max | pik (т, а) — qik (т, а) |, будем иметь: lim d (а) = 0. !) Относительно определения модуля матрицы, а также соотношения <; между матрицами см. стр. 431.
§ 7] ДИФФЕРЕНЦИАЛЬНЫЕ СИСТЕМЫ В КОМПЛЕКСНОЙ ОБЛАСТИ 437 Позтому из формулы VIII следует: lim Г\' (E+Pdt)-\ (E + Qdt)]=O. В частности, если Q не зависит от a[Q(t, a)=^P0(t)], мы получаем: lim \ [Я + /> (*, а) Л] - \ [Е f Ро (О Л], где />„(?) = lim P{t, а). § 7. Дифференциальные системы в комплексной области. Общие свойства Рассмотрим систему дифференциальных уравнений Здесь данные функции Pih(z) и искомые функции xt(z) (i, к = 1, 2, ..., п) предполагаются однозначными аналитическими функциями комплексного аргумента z, регулярными в некоторой области G комплексной z-плоскости. Вводя квадратную матрицу /)(z) = ||Pja(z) j|" и столбцевую матрицу ж==(ж1", ж2, ..., ж„), мы, как и в случае вещественного аргумента (§ 1), можем записать систему E4) в виде ^P{z)x. E4') Обозначая через X интегральную матрицу, т. е. матрицу, столб- столбцами которой являются п линейно независимых решений системы E4), мы вместо E4') можем написать: ^- = P(z)X. E5) Формула Якоби имеет место и при комплексном аргументе z: [ X | = се2" E6) При этом предполагается, что z0 и все точки пути, вдоль которого z берется \ , являются регулярными точками для однозначной аналитической ФУНКЦИИ Sp Р (Z) = Ри (Z) + PZZ (Z) + • • • + Рпп (Z) Х). Специфичность рассматриваемого случая комплексного аргумента заключается в том, что при однозначной функции Р (z) интегральная матрица X(z) может быть многозначной функцией от z. х) Здесь и в дальнейшем в канестве путей интегрирования берутся кусочно гладкие кривые.
438 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV В качестве примера рассмотрим систему Коши jy jj —j—= ¦_ X (U—постоянная матрица). E7) Одним из решений этой системы, как и в случае вещественного аргумента, является (см. стр. 421) интегральная матрица X = e°W-°'=*(z—af. E8) В качестве области G возьмем всю z-плоскость за исключением точки z = a. Все точки этой области являются регулярными точками матрицы коэффи- коэффициентов *<*> = — - v ' z—a Если 11фО, то точка z = a является особой точкой (полюсом первого порядка) для матричной функции Р (z) = ———. Элемент интегральной матрицы E8) при однократном обходе в положи- положительном направлении точки z = a возвращается с новым значением, которое получается из старого умножением справа на постоянную матрицу Для общей системы E5) теми же рассуждениями, что и в случае веще- вещественного аргумента, убеждаемся в том, что два однозначных решения X и X в некоторой части области G всегда связаны формулой Х-ХС, где С—некоторая постоянная матрица. Эта формула сохранится при любом аналитическом продолжении функций X (z) и X (z) в области G. Теорема о существовании и единственности (при заданных начальных значениях) решения системы".E4) может быть доказана аналогично веще- вещественному случаю. Рассмотрим односвязную и притом.звездообразную относи- относительно точки Zg1) область Gu составляющую часть области G, и пусть матричная функция Р (z) регулярна 2) в области б4. Составим ряд Z 2 2 Е+ J Pdz+ J Pdz J Pdz+... E9) 20 ZQ Zq Из односвязности области Gx следует, что каждый встречающийся в ряду E9) интеграл не зависит от пути интегрирования и представляет собой регулярную функцию в области Gt. Поскольку область Gx звездо- звездообразна относительно z0, то при оценке модулей этих интегралов мы можем считать, что все интегралы берутся вдоль прямолинейного отрезка, соединяющего точки Zq и z. Абсолютная и равномерная в любой замкнутой части области Gu содержащей точку z0, сходимость ряда E9) вытекает из сходимости х) Область называется звездообразной относительно точки z0, если любой отрезок, соединяющий произвольную точку z области с точкой zq, целиком лежит в данной области. а) То есть все элементы ргь(г) (t, k=i, 2, ... п) матрицы P(z) являются регу- регулярными функциями в области Gj.
§ 8] МУЛЬТИПЛИКАТИВНЫЙ ИНТЕГРАЛ В КОМПЛЕКСНОЙ ОБЛАСТИ 439 мажорантного ряда 1 -р ЫУ1 ~\ «Т~ «/ J.TA ~ 1 Q. Здесь М—верхняя граница для модуля матрицы Р (z), a I — верхняя граница расстояний точки z от точки z0, причем обе границы относятся к рассматриваемой замкнутой части области Gt. Путем почленного дифференцирования проверяется, что сумма ряда E9) представляет собой решение уравнения E5). Это решение нормировано, поскольку оно при z — z0 обращается в единичную матрицу Е. Однозначное нормированное решение системы E5), как и в вещественном случае, будем называть матрицантом и будем обозначать через Qlo(P). Таким образом, мы получили, представление матрицанта в области Gj в виде рядаг) г z z ) = Е+[ Pdz+\ Pdz\ Pdz+... F0) Свойства 1° — 4° матрицанта, установленные в § 5, автоматически переносятся и на случай комплексного аргумента. Произвольное решение уравнения E5), регулярное в области G и обра- обращающееся при z = z0 в матрицу Хо, представится в виде X = Qiz (Р\-С (С = X \ F1) Формула F1) охватывает все однозначные решения, регулярные в окрестности точки z0 [z0 — регулярная точка для матрицы коэффи- коэффициентов P(z)]. Эти решения, будучи аналитически продолжены в область G, дадут все решения уравнения E5), т. е. уравнение E5) не может иметь решений, для которых z0 была бы особой точкой. Для аналитического продолжения матрицанта в область G удобно пользоваться мультипликативным интегралом. § 8. Мультипликативный интеграл в комплексной области Мультипликативный интеграл вдоль некоторой кривой в комплексной плоскости определяется следующим образом. Пусть даны некоторый путь L и матричная функция Р (z), непрерывная на кривой L. Разобьем путь L на п частей (z0, zj (zu z2) ... (Zn-i, z); здесь z0—начало, Zn — z—конец пути, a zu z2, ...,zn_! — промежуточные точки разбиения. На отрезке пути (z^-i, z^) выберем произвольную точку %,ъ и введем обозначения Azh = zh—zk-i, k = 1, 2, ..., п. Тогда по определению = lim [tf + P,(?n)Azn] ... [E + Pfa) AzJ. Сопоставляя это определение с определением на стр. 434, мы видим, что новое определение совпадает с прежним в том частном случае, когда путь L является отрезком вещественной оси. Однако и в общем случае, х) Приведенное доказательство существования нормированного решения и пред- представления его в области Gl рядом F0) сохраняет свою силу, если вместо звездо- образности области сделать более общее допущение: для любой замкнутой части области Gj существует такое положительное число I, что любую точку z этой зам- замкнутой части можно соединить с z0 путем, длина которого <; I.
440 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV когда путь L произвольно расположен в комплексной плоскости, новое определение может быть сведено к старому при помощи замены переменной интегрирования. Если z = z(t) есть параметрическое уравнение пути, причем z (?) — непрерывная функция в интервале (t0, f), имеющая в этом интервале кусочно непрерывную произ- dz водную -зг, то, как легко видеть, Эта формула показывает, что мультипликативный интеграл вдоль про- произвольного пути существует, если подынтегральная матрица Р (z) непре- непрерывна вдоль этого пути1). Мультипликативная производная определяется прежней формулой При этом предполагается, что X(z) — аналитическая функция. Все дифференциальные формулы (I — III) предыдущего параграфа пере- переносятся без изменения на случай комплексного аргумента. Что же касается интегральных формул IV—VI, то несколько видоизменяется их внешняя запись: IV. J {E + Pdz)= J (E + Pdz) J (E + Pdz). (L'+L") L" L' V. VI'. \ (E + CPC'1 dz) = cX(E + Pdz)C-i (C~постоянная\ _ ? l \ матрица / В формуле IV мы через L' + L" обозначили составной путь, получаю- получающийся при прохождении сначала пути Z/, а затем пути L". В формуле V —L обозначает путь, отличающийся от пути L только направлением. Формула VII принимает теперь вид VII'. \ [E + (Q + DZX) dz] = X (z) \ (E + X^QX dz) X (zo)'1. L L Здесь X (z0) и X (z) в правой части обозначают соответственно значения X (z) в начале и в конце пути L. *¦) См. сноску2) на стр. 434. Даже в случае, когда Р (z)—непрерывная функция вдоль L, функция Р [z (t)] —тг может быть кусочно непрерывной. В этом случае мы можем интервал (*о. *) разбить на частичные интервалы, в каждом из которых про- dz изводная —=- непрерывна, и под интегралом от to ДО t понимать сумму интегралов tit вдоль этих частичных интервалов.
§ 8] МУЛЬТИПЛИКАТИВНЫЙ ИНТЕГРАЛ В КОМПЛЕКСНОЙ ОБЛАСТИ 441 Формула VIII заменится теперь формулой VIII'. mod [ J (Е + Р dz) — J (Е + Q dz) ] <~ е^1 (е™»-' — 1) /, L L где mod Q =CqI, mod(P — Q)^.d-I, / = ||1||, а / — длина пути L. Формула VIII' получается сразу из формулы VIII, если в последней сделать преобразование переменной, выбрав в качестве новой переменной интегрирования длину дуги s вдоль пути L ( при этом -^— = 1 j . Как и в случае вещественного аргумента, существует тесная связь мультипликативного интеграла с матрицантом. Пусть дана однозначная аналитическая матричная функция Р (z), регулярная в области G, и пусть Go — односвязная область, содержащая точку z0 и составляющая часть области G. Тогда матрицант Q%0 (P) будет регулярной функцией от z в области Go. Соединим точки Zq и z произвольным путем L, целиком лежащим в Go, и выберем на L промежуточные точки zu z2, ..., zn-i. Тогда, пользуясь равенством совершенно так же, как в § 6 (стр. 433), предельным переходом получим: QzZn (P) = <j (E + Pdz)=\Z (E + Pdz). F2) Из этой формулы видно, что мультипликативный интеграл не зависит от формы пути, а зависит только от начала и конца пути, если весь путь интегрирования лежит в односвязной области Go, в которой подинтеграль- ная функция Р (z) регулярна. В частности, для замкнутого контура L, лежащего в односвязной области Go, имеем: -Е. F3) Эта формула представляет собой аналог известной теоремы Коши, согласно которой обычный (немультипликативный) интеграл вдоль замкну- замкнутого контура равен нулю, если этот контур лежит в односвязной области, в которой подинтегральная функция регулярна. Представление матрицанта в виде мультипликативного интеграла F2) может быть использовано для аналитического продолжения матрицанта вдоль произвольного пути L в области G. В этом случае формула Х=\' (E+Pdz)X0 F4) задает все ветви многозначной интегральной матрицы X дифференциаль- дифференциального уравнения —-=— — РХ, обращающейся в Хо на одной из ветвей при z = z0. Различные ветви получаются за счет различных путей, соединяющих точки z0 и z. Согласно формуле Якоби E6) z JSp Pdz
442 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV и, в частности, при Х0 = Е \ (E + Pdz) = е*о . F5) Иэ этой формулы следует, что мультипликативный интеграл всегда представляет собой неособенную матрицу, если только путь интегрирования целиком лежит в области, в которой функция P(z) регулярна. Если L — произвольный замкнутый путь в G и G—неодносвязная область, то равенство F3) может и не иметь места. Более того, в этом случае значение интеграла не определяется заданием подинтегральной функции и замкнутого пути интегрирования L, а зависит еще и от выбора начальной точки интегриро- интегрирования z0 на кривой L. Действительно, выберем на замкнутой кривой L две точки z0 и Zj и обозначим участки пути от z0 до Zj и от Zj до z0 (в направлении интегрирования) соответственно через Lj и L2. Тогда согласно формуле IV х) ZQ L2 ^1 %1 ls\ L-2 и, следовательно, 1- F6> Формула F6) показывает, что символ <?> (Е + Р dz) определяет некото- некоторую матрицу с точностью до преобразования подобия, т. е. определяет только элементарные делители некоторой матрицы. Рассмотрим элемент X (z) решения F4) в окрестности точки z0. Пусть L—произвольный замкнутый путь в G, начинающийся и кончающийся в точке z0. После аналитического продолжения вдоль L элемент X(z) перейдет в некоторый элемент X (z). При этом новый элемент X (z) будет удовлетворять тому же дифференциальному уравнению E5), поскольку Р (z) — однозначная функция в G. Поэтому X = XV, где V—некоторая неособенная постоянная матрица. Из формулы F4) следует, что Z0 Сопоставляя это равенство с предыдущим, найдем: Xo. F7) В частности, для матрицанта X — Ql имеем Xo = jB, и тогда F8) х) Здесь мы для сокращения обозначений опускаем подинтегральное выражение E + Pdz, одно и то же во всех интегралах.
§ 9] ИЗОЛИРОВАННАЯ ОСОБАЯ ТОЧКА 443 § 9. Изолированная особая точка Займемся исследованием поведения решения (интегральной матрицы) в окрестности изолированной особой точки а. Пусть матричная функция Р (z) регулярна для значений z, удовле- удовлетворяющих неравенствам 0<|z — a| Совокупность этих значений образует двусвязную область G. Матрич- Матричная функция Р (z) в области G разлагается в ряд Лорана +00 P(z)= 2 Pn(z-a)n. F9) п=—оо Элемент X (z) интегральной матрицы после однократного обхода в положительном направлении вокруг а вдоль пути L перейдет в элемент где V — некоторая постоянная неособенная матрица. Пусть U — постоянная матрица, связанная с матрицей V равенством У-еачи. G0) Тогда матричная функция (z—а)и после обхода вдоль L также переходит в (z—a)uV. Поэтому аналитическая в области G матричная функция при аналитическом продолжении вдоль L переходит сама в себя (остается неизменнойI). Поэтому матричная функция F (z) регулярна в G и раз- разлагается в G в ряд Лорана F(z)= f Fn(z-a)n. G2) п=—оо Из G1) следует: Таким образом, каждая интегральная матрица X(z) может быть представлена в виде G3), где однозначная функция F(z) и постоянная матрица U зависят от матрицы коэффициентов P(z). Однако алгорифми- ческое определение матрицы U и коэффициентов Fn ряда G2) по коэф- коэффициентам Рп ряда F9) в общем случае представляет собой сложную задачу. Частный случай этой задачи, когда P(z)= 2 Pn(z-a)n, n=—1 х) Отсюда уже следует, что функция F (z) при обходе вдоль любого другого замкнутого пути в G возвращается к исходному значению.
444 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV будет нами разобран полностью в § 10. В этом случае точка а называется регулярной особой точкой системы E5). Если разложение F9) имеет вид п=-д то точка а называется иррегулярной особой точкой типа полюса. Нако- Наконец, если в ряду F9) имеется бесчисленное множество отличных от нуля матричных коэффициентов Рп при отрицательных степенях z—а, то точка а называется существенной особой точкой данной диф- дифференциальной системы. Из формулы G3) следует, что интегральная мат- матрица X (z) при любом однократном обходе в по- положительном направлении (вдоль некоторого замк- замкнутого пути L) умножается справа на одну и ту же матрицу Если этот обход начинается (и кончается) в точке z0, то согласно F7) V = X (zq) у (Е-\-Р dz) X (z0). G4) го Если вместо интегральной матрицы X(z) мы рассмотрим любую другую интегральную матрицу X(z) — X(z)C (С—постоянная матрица, \С\фО)г то, как видно из G4), матрица V заменится подобной матрицей v=c~wc. Таким образом, «интегральные подстановки» V данной системы образуют класс подобных между собой матриц. Из формулы G4) также следует, что интеграл (E + Pdz) G5) определяется начальной точкой обхода z0 и не зависит от формы кривой обхода1). Если же мы меняем точку z0, то получающиеся при этом раз- различные значения интеграла G5) подобны между собой2). В этих свойствах интеграла G5) можно убедиться и непосредственно. Действительно, пусть L и L' — два замкнутых пути в G вокруг точки z = a с начальными точками обхода z0 и z'o (см. рис. 8). Двусвязная область, заключенная между L и L', может быть сде- сделана односвязной, если провести разрез от z0 до z'o. Интеграл вдоль раз- разреза мы обозначим через *¦) Конечно, при условии, что путь интегрирования обходит точку а однократно в положительном направлении. 2) Это вытекает из формулы G4), а также из формулы F6).
« 9] ИЗОЛИРОВАННАЯ ОСОБАЯ ТОЧКА 445 Поскольку мультипликативный интеграл вдоль замкнутого контура односвязной области равен Е, то откуда I/ Таким образом, как и V, интеграл Ф (Е + Р dz) определен с точностью до подобия, и равенство G4) мы иногда будем записывать так: понимая под этим совпадение элементарных делителей у матриц, стоящих в левой и правой частях равенства. Рассмотрим для примера систему с регулярной особой точкой ? = *<*) X, тде Пусть Q (z) = ^17 • Пользуясь формулой VIII' предыдущего параграфа, дадим оценку модуля разности —§ (E + Qdz), G6) выбрав в качестве пути интегрирования окружность радиуса r(r<iR) с положительным направлением обхода. Тогда при оо mod P-^p-J, mod 2 Рп (z — а)п < d (r) I, / = ||1|| I z—a |=r эт=0 мы можем в формуле VIII' положить: 4 = ^, d = d(r), l = 2nr, после чего получим: mod D < — e2llP-i (e2nnrd <¦ г> — 1) /. Отсюда видно, что1) lim?> = 0. G7) Г-+0 !) При этом мы используем то, что при надлежащем выборе d (г) lim d(r)=d0, r->0 где d0—наибольший из модулей элементов матрицы Ро.
446 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV С другой стороны, система dY является системой Коши, и в этом случае при любом выборе начальной точки обхода z0 и при любом R Поэтому из G6) и G7) следует: lim$ (E + Pdz) = t r-*0 ° G8) Но элементарные делители интеграла k(E-\-Pdz) не зависят от z0 и г 20 и совпадают с элементарными делителями интегральной подстановки V. Отсюда Вольтерра в своем известном мемуаре (см. [149]), а также в книге [49] (стр. 117 —120) делает вывод, что матрицы V и eZniP-* подобны, и потому интегральная подстановка V с точностью до подобия определяется матрицей «вычетов» P_t. Это утверждение Волътерра ошибочно. Иэ G4) и G8) можно лишь сделать вывод, что характеристические числа интегральной подстановки V совпадают с характеристическими числами матрицы e2!tip-i. Однако элементарные делители у этих матриц могут быть различными. Так, например, матрица а г О а при любом г^=0 имеет один элементарный делитель (Я—аJ, а предел II а О этой матрицы при i—>0, т. е. матрица _ , имеет два элементар- элементарных делителя К—а, к—а. Таким образом, утверждение Вольтерра не вытекает из,формул G4) и G8). Но оно и вообще неверно, как показывает следующий пример. Пусть P(z) = Соответствующая система дифференциальных уравнений имеет вид: 0 0 0 -1 1 0 0 1 0 dx. !__. dz Интегрируя эту систему, находим: = с In z + d, хг = —. Интегральная матрица lnz 1 z-1 О
§ 9] ИЗОЛИРОВАННАЯ ОСОБАЯ ТОЧКА 447 при однократном положительном обходе вокруг особой точки z = О умно- умножается справа на матрицу V-\\ * ° ~ || 2га 1 Эта матрица имеет один элементарный делитель (Я—IJ. В то же время матрица 2лг О О I О -1 | е -е - О 1 имеет два элементарных делителя X — 1, Я—1. Рассмотрим теперь случай, когда матрица Р (z) имеет конечное число отрицательных степеней z—а (а — регулярная или иррегулярная особая точка типа полюса): P-q _4_J*=I_ + у р (Z — l п=0 Преобразуем данную систему ^ = РХ, G9) dz положив X = A(z)Y, (80) где A (z) — матричная функция, регулярная в точке z = 0 и принимающая в этой точке значение Е: степенной ряд в правой части сходится при \z—a|<Ci- Известный американский математик Г. Биркгофф в 1913 г. опубли- опубликовал теорему (см. [119]), согласно которой всегда можно подобрать преобразование (80) так, чтобы матрица коэффициентов преобразованной системы ^f- = P*(z)Y G9') содержала только отрицательные степени z—а: Р* Р* л Теорема Биркгоффа вместе с полным ее доказательством приведена в книге Э. Л. Айнса «Обыкновенные дифференциальные уравнения»1). Там же на основе рассмотрения «канонических» систем G9') проводится исследование поведения решения произвольной системы в окрестности особой точки. !) См. [1], стр. 632—641. Биркгофф и Айне формулируют теорему для особой точки z=oo. Это не является каким-либо ограничением, поскольку любая особая точка z=a преобразованием z' = может быть переведена в z'=co.
448 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV Между тем доказательство Биркгоффа содержит ошибку, а сама теорема неверна. В качестве опровергающего примера можно взять хотя бы пример, приведенный выше для опровержения утверждения Вольтерра1). В этом примере д — 1, а = 0 и р __ О О О -1 О 1 о о при ге = 1, 2, ... Применяя теорему Биркгоффа и подставляя в G9) вместо X произ- ведение AY, мы после замены -т— на —=— Y и сокращения на У получим: dA ~dz = РА. Ч Приравнивая коэффициенты при — и свободные члены, найдем: Полагая А,= а Ъ , получим: а О с О О О -с —d О 1 О О Это—противоречивое равенство. В следующем параграфе мы выясним, к какому каноническому виду может быть преобразована система G9) при помощи преобразования (80) в случае регулярной особой точки. § 10. Регулярная особая точка Исследуя поведение решения в окрестности особой точки, мы без нару- нарушения общности рассуждения можем принять, что особой точкой является точка z = 02). 1. Пусть дана система где (81) (82) тп=0 ряд 2 Pm,zm сходится внутри круга | z | < г. 0 !) В случае д=1 ошибочное утверждение Биркгоффа по существу совпадает •с ошибкой Вольтерра (см. стр. 446). \ 2) Преобразованием z'=z—с или z' = — можно соответственно любую конеч- 2 ную точку z=c или z=oo перевести в точку z'=0.
§ 10] РЕГУЛЯРНАЯ ОСОБАЯ ТОЧКА 449 Положим X = A(z)Y, (83) где A (z) = E + A1z + Azz*+ ... (84) Оставляя пока в стороне вопрос о сходимости ряда (84), постараемся так определить матричные коэффициенты Ат этого ряда, чтобы преобра- преобразованная система •? = *•(*) У, (85) где ^2 (86) т=0 имела возможно более простой («канонический») вид1). Подставляя в (81) вместо X произведение AY и используя (85), мы получим: Умножая обе части этого равенства справа на У, найдем: Заменяя здесь P{z), A(z), P*{z) рядами (82), (84), (86) и приравни- приравнивая в левой и правой частях равенства коэффициенты при одинаковых степенях z, получим бесконечную систему матричных уравнений для иско- искомых коэффициентов Ai, А2, ... 2): 1) 2) 3) (т + 2) P^Am+i - Am+l [/>_! + (m +1) E] + m-i — Am-iPi -(-... -f- Pm = P?n. (87) 2. Рассмотрим отдельно несколько случаев: 1° Матрица Р_± не имеет различных характеристи- характеристических чисел, отличающихся друг от друга на целое число. В этом случае при любом к=1, 2, 3, ... матрицы Р^ и P-i-\-kE не имеют общих характеристических чисел, и потому (см. гл. VIII, § 3K) х) Мы будем стремиться к тому, чтобы в ряду (86) было конечное (и притом возможно меньшее) число коэффициентов Рт, отличных от нуля. 2) Во всех уравнениях, начиная со второго, мы заменим в силу первого урав- уравнения матрицу Р—1 на P_t. 3) Можно, впрочем, доказать это и не опираясь на гл. VIII. Интересующее нас положение равносильно утверждению, что матричное уравнение имеет только нулевое решение ?/=0. Поскольку матрицы P_t и Р„\-\-кЕ не имеют 29 ф. р. Гантмахер
450 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV матричное уравнение P-lU—U(P-l + kE) = T при любой правой части Т имеет одно и только одно решение. Это решение будем обозначать через Поэтому в уравнениях (87) можно положить все матрицы Pm{m=0,1, 2,...) равными нулю и последовательно определить Alt Л2. ... при помощи равенств А^Ф^Р-и -Ро), Ая = Фг(Р-1, -Pt-PoAd, ••• Тогда преобразованная система является системой Коши dY _ j»_t у dz ~ г ' и потому решение X исходной системы (81) имеет вид1) X = A(z)zp-K (88) 2° Среди различных характеристических чисел матрицы Р-1 имеются числа, разность между которыми является целым числом; при этом матрица P-i имеет простую структуру. Обозначим через Я1? Я2) ..., К> характеристические числа матрицы P-i, расположенные так, чтобы имели место неравенства ReA1>ReX2>...>ReXn. (89) Не нарушая общности рассуждений, мы можем матрицу P-i заме- заменить любой, ей подобной. Это следует из того, что,- умножая обе части уравнения (81) слева на неособенную матрицу Т, а справа —на 71, мы фактически заменяем все Рт на ТРтТ~1(т=—1, 0, 1, 2, ...) (при этом и X заменяется на ТХТ'1). Поэтому мы будем считать, что в рассма- рассматриваемом случае P-i— диагональная матрица: Р-1 = |Я.,6„к||». (90) Введем обозначения для элементов матриц Рт, Р^ и Ат: №, ibHlpiTll?. Ат = \\х№\)?. (91) Для определения Ai мы воспользуемся вторым из уравнений (87). Это матричное уравнение можно заменить скалярными уравнениями (Я, - Я* -1) х$ + р№ = /4Г (», к = 1, 2, ..., п). (92) Если ни одна из разностей Я?—%h не равна единице, то мы можем положить Р% = 0. Тогда из (872J) At = Ot (Р_ь — Ро). общих характеристических чисел, то существует такой многочлен / (Я), для кото- которого /(/>_!)=(), f(P_l+kE)=E. Но из (*) следует: Отсюда ?/=0. !) Формула (88) определяет одну интегральную матрицу системы (81). Произ- Произвольная интегральная матрица получается из (88) умножением справа на произволь- произвольную постоянную неособенную матрицу С. 2) Мы пользуемся обозначениями, введенными при разборе случая 1°.
§ 10] РЕГУЛЯРНАЯ ОСОБАЯ ТОЧКА 451 В этом случае элементы матрицы Ах однозначно определятся из урав- уравнений (92): («-,* = 1, 2, ....»). (93) Если же при некоторых i, к1) то соответствующее p|<j*> определяется из (92): а соответствующее х$ выбирается совершенно произвольно. При тех же i и к, при которых А*— Аь=/=1, мы полагаем: а соответствующее аК*> находим по формуле (93). Определив Аи мы переходим к определению Az из третьего уравне- уравнения (87). Заменим это матричное уравнение системой и2 скалярных урав- уравнений: {Ki - Afe - 2) *?> = pg*) - pji) _ (PoAl - А^Ы (94) (i, ft=l, 2, ...,!»). Здесь мы поступаем так же, как и при определении -4j. Если Аг — Хкф2, то мы полагаем: и тогда из (94) находим: Если же Я{ — Яй = 2, то при этих i и к из (94) следует, что В этом случае ж(|> выбирается произвольно. Продолжая этот процесс далее, мы последовательно определим все матрицы Р-и Р*, Pt, ... и Аи Az, ... При этом только конечное число из матриц Рт будет отлично от нуля, и, как нетрудно видеть, матрица Р*(z) будет иметь вид2) P*(z) = О ^ Z 2—"hn— 1 0 0 (95) !) В силу (89) это возможно лишь при i<&. 2) Рт (т ~^> 0) может быть отличным от нуля лишь тогда, когда существуют характеристические числа Я,; и кь матрицы Р_4 такие, чтоХ;— Х^—1==т (при этом в силу (89) i<fc). При данном m каждому такому равенству соответствует элемент Рш aik матрицы Рт.; этот элемент может быть отличен от нуля. Все остальные элементы матрицы равны нулю. 29*
452 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV где ajfc = O, если к, — kk не есть целое положительное число, и aik = = Pikl~ к~ **» если ^"i — ^h является целым положительным числом. Обозначим через т^ наибольшую целую часть числа Re Яг1): ш, = [ReЯ,] (i=l, 2,',..., п). (96) Тогда в силу (89) m1>mz> ... >тп. При этом если Xt — %k есть целое число, то Поэтому в выражении (95) канонической матрицы Р* (z) мы можем все разности Aj—Яд заменить на иг*— тп^. Кроме того, мы положим: (i = l, 2, ..., m), l Й12 - • • йщ 0 %2 • • • Cl^n о о ...к Тогда из (95) следует (см. формулу I на стр. 435): (91') (97) = Dz Р* (г) = zM Отсюда вытекает, что Y = zMzu представляет собой решение уравне- уравнения (85), а X = A{z)zMzv (98) является решением уравнения (81J). 3° Переходим к общему случаю. Как было выяснено выше, мы можем, не нарушая общности, матрицу Р_4 заменить любой матрицей, ей подобной. Мы примем, что матрица P-i имеет нормальную жорданову форму 3) Р_! = {11Е1 + Ни ЪЕ2 + Я2, ..., КЕи + Ни}, (99) причем ReXl>T{eXz> ... >Re^. A00) Здесь Е обозначает единичную матрицу, а Н — матрицу, у которой эле- элементы первой «наддиагонали» равны единице, а остальные элементы равны нулю. Порядки матриц Et ж Ht в различных диагональных клет- клетках будут, вообще говоря, различными; зти порядки совпадают со сте- степенями соответствующих элементарных делителей матрицы .P-i4). В соответствии с представлением (99) матрицы Р_± разобьем все матрицы Рт, Р%п, Am на блоки: n /n(m)\u р* /n(«i*)\u л <\ ^m="(^ih )l, rm—(rik )l, Am= i.ik J) To есть mj—наибольшее целое число, не превосходящее Re Kt (?=1, 2, ..., п). 2) Специальный вид матриц (97) соответствует каноническому виду матрицы P-i- Если матрица P-i не имеет каноническую форму, то матрицы М и V в (98) подобны матрицам (97). 3) См. гл. VI, § 6. 4) Для сокращения обозначений мы не пишем при Et и Hj индекса, указы- указывающего порядок этих матриц.
§ 10] РЕГУЛЯРНАЯ ОСОБАЯ ТОЧКА 453 Тогда второе из уравнений (87) может быть заменено системой уравнений (КЕЬ + Щ XU> - JXU> l(Kk +l)Ek + Hk] + P$ = Р\Р A01) (г, ft =1,2, ...,в), которые могут быть еще переписаны так: {xi-bk-i)x№+Hix№-x№Hh+HV=PW (»,ft=1,2,...,«). A02) Пусть х) — )]xst\\t _ и „@), —\\Pt | (О*)_ц (о*), Тогда матричное уравнение A02) (при фиксированных i и к) можно заме- заменить системой скалярных уравнений вида2) A03) (^+i,t = 2)s>o = O; s = l, 2, ..., v; t = 1, 2, ..., w), где у и w—порядки матриц %tEi-{-Hi и hkEk-{-Hb в (99). Если Аг — Aft=/=1, то в системе (ЮЗ) можно положить все и однозначно определить все xst из рекуррентных соотношений A03). Это означает, что в матричном уравнении A02) мы полагаем и однозначно определяем Если Kt — Afc = l, то соотношения A03) принимают вид l, f - XS, ,_i + Р® = PiP (s=l, 2, ...,v; « = 1,2, ...,гг;; ж„+1>г = ж8,0 = A04> Нетрудно показать, что из уравнений A04) можно так определить элементы xst матрицы Х$, чтобы матрица />|^*) имела в соответствии со своими размерами (v x w) вид а0 0 0 0 «в-2 • • - а1 а0 по 0 о о ... о 0 0 ... 0 а„_ в-1 a0 0 ... 0 (v<w) г) Для сокращения обозначений мы опускаем индексы i, к при обозначении элементов матриц Х^, р[^, р\ь*^ 2) Рекомендуем читателю вспомнить свойства матрицы Н, разобранные на стр. 24—25.
454 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV о о о 0 flo Й1 0 . . 0 . . ЙО ¦ . О . О . . О a0 A05) {v>w) Про матрицы A05) будем говорить, что они имеют правильную ниж- нижнюю треугольную форму1). Из третьего уравнения (87) мы определяем матрицу Az. Это уравне- уравнение можно заменить системой уравнений №-X^Hk + {P0Al- Р|Г A06) (i,k = 1,2, ...,и). Аналогично тому, как это было при определении Alf если Аг— > то из соответствующего уравнения A06) матрица Х& определяется однознач- однозначно при Р[^ = 0. Если же Aj — Я* = 2, то можно так определить матрицу Х$, чтобы матрица Р\^ имела правильную нижнюю треугольную форму. Продолжая этот процесс, мы определим последовательно все матрич- матричные коэффициенты Аи Аг, ... и Р^_и Рд, Р*, ... При этом только конеч- конечное число из коэффициентов Р%, будет отлично от нуля, и матрица Р*(z) будет иметь следующий блочный вид2): A07) 0 где 0, ih J если А; — Kh не есть целое положительное число; если Аг — %к = целому положительному числу A,Л = 1,2, ...,и). 2) Аналогично определяются верхние правильные треугольные матрицы. Из уравнений A04) все элементы матрицы Х$ не определяются однозначно; имеется некоторый произвол в выборе элементов xSf. Это видно и непосредственно из уравнения A02): при Xt—Хь=1 к матрице Х$ можно прибавить произвольную матрицу, перестановочную с Н, т. е. произвольную правильную верхнюю треуголь- треугольную матрицу. а) Размеры квадратных матриц Ei, Hi и прямоугольных матриц 2?jfc опреде- определяются размерами диагональных клеток в жордановой матрице -P_j, т. е. степенями элементарных делителей матрицы Р^.
§ 10] РЕГУЛЯРНАЯ ОСОБАЯ ТОЧКА 455 Все матрицы Bih (i, к — 1, 2, ..., и; К к) имеют правильную нижнюю треугольную форму. Как и в предыдущем случае, обозначим через mt целую часть Re^ тщ = [Re %i\ (i = 1, 2, ..., и) A08) и положим % (i=l, 2, ...,м). A08') Тогда снова в выражении A07) для Р* (z) мы можем всюду разность hi^—кь заменить разностью т%—тъ. Вводя диагональную матрицу с целыми элементами М и верхнюю треугольную матрицу U при помощи равенств1) Bt тг гъ 1 , A09) о о мы, исходя из A07), легко получим следующее представление для матрицы P*(z); Р* (г) = гм ~ z~M + 1L = Dz (zMzu). Отсюда следует, что решение уравнения (»5) может быть задано в виде У = гмги, а решение уравнения (81) может быть представлено так: X = A{z)zMzu. A10) Здесь A (z) — матричный ряд (84), М — диагональная матрица с постоян- постоянными целыми элементами, U — постоянная треугольная матрица. Матрицы М и U определяются равенствами A08), A08') и A09J). 3. Переходим теперь к доказательству сходимости ряда A (z) = Воспользуемся леммой, которая представляет и самостоятельный интерес. Лемма. Если ряд .. A11) формально удовлетворяет системе 3) для которой z = 0 является регулярной особой точкой, то ряд A11) сходится в любой окрестности точки z = 0, в которой сходится разло- разложение в ряд (82) для матрицы коэффициентов Р (z). 2) Здесь разбиение на блоки соответствует разбиению матриц P_i и Р* (z). 2) См. сноску 2) к стр. 452. 3) Здесь х=(хи хг, ..., хп) — столбец из неизвестных функций; с0, ait a^, ...— постоянные столбцы; Р (z)—квадратная матрица коэффициентов.
456 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV Доказательство. Пусть g=0 00 где ряд 2 Рт2™ сходится при |z|<Cr. Тогда существуют такие поло- 7П=0 жительные постоянные p-i и р, чтог) moAP-i<p-lJ,modPm^I,I = \\l\\ (m = 0, 1, 2, ...)• (ИЗ) Подставляя в A12) вместо х ряд A11) и приравнивая между собой коэффициенты при одинаковых степенях в обеих частях равенства A12), получим бесконечную систему векторных (столбцевых) равенств A14) BE—P-i)az = (mE — P-j) am = Poam-i + /\flm-2 + •¦¦ J Нам достаточно доказать, что какой-либо остаток ряда A11) xW = afeib -|- flft+12b+1 -f-... A15) сходится в окрестности точки z = 0. Число к подчиним неравенству Тогда число к будет превосходить модули всех характеристических чисел матрицы jP-i2) и потому при т^-к будем иметь \mE—P-i\^0 и -Р^* = ± (E-P^yl=± E + ±P-1+±3PU+ ... A16) В последней части этого равенства стоит сходящийся матричный ряд. Пользуясь этим рядом, мы из A14) можем все коэффициенты ряда A15) выразить однозначно через а0, аи ..., ah-i при помощи рекуррентных 1) Относительно определения модуля матрицы см. стр. 431. а) Если Яо—характеристическое число матрицы Л=||а№||", то |Я0|< <пшах |ojft|. Действительно, пусть Ах—кох, где х={хх, хг, ..., хп) ф 0. Тогда Пусть | xj | =max {| xt |, | хг \, ..., | хп |}. Тогда п I А-0 I I XJ К 2 I «Л I I ж* К I *./ I n тйх I aik I- Сокращая на | xj \, получим нужное неравенство.
§ 10] РЕГУЛЯРНАЯ ОСОБАЯ ТОЧКА 457 соотношений ...), A17) где /ro-i = Pm-huh-i +••-+ Pm-i^o {m = k, k+l, ...). A18) Заметим, что ряд A15) формально удовлетворяет дифференциальному уравнению dz где -/(*), A19) — Zj /n»2 — ^ — ai — 2a2z—...—(k—l)ah-izk-*. A20> Из A20) вытекает, что ряд оо JmZ m=ft—1 сходится при | z | < г, и потому существует такое число N > 0, чтог) [171=1 fv — 1, /С, • • • )ш \ 1Л1 i.y Из вида рекуррентных соотношений A17) следует, что, заменив в них матрицы jP-j, Pq, /m_j мажорантными матрицами p-±I, ~ I, -j^j , а стол- столбец ат столбцом tlctmll2) (m=k, fc+1, ...;q = 0, 1,2, ...), мы получим соотношения, определяющие верхние границы ||а„,|| для modflm: modaro<||am||. A22) Следовательно, ряд 1+... A23) после почленного умножения на столбец || 11| будет мажорантным рядом для ряда A15). Заменив в A19) матричные коэффициенты Р-и Рд, fm рядов g=0 m=fe—1 соответствующими мажорантными матрицами р-4/, ^/, ||-^||» а также II N II г) Здесь -jjj обозначает столбец, у которого все элементы равны одному N и тому же числу — . 2) Здесь ||am|| обозначает столбец (am, am, ...^^(am—число;- m=fc, fc+li ¦••>
458 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV заменив ж<*> на || ?(*> |[, мы получим дифференциальное уравнение для -»l!r+JrU|l|+-^. A24) * ' *"f -7 Это линейное дифференциальное уравнение имеет частное решение Z"P-1 I Q±yw~i dz, A25) которое регулярно в точке z = 0 и в окрестности этой точки разлагается в сходящийся при | z | <Г г степенной ряд A23). Из сходимости мажорантного ряда A23) следует сходимость ряда A15) при | z | <Г г. Лемма доказана. Замечание 1. Приведенное доказательство позволяет определить все регулярные в особой точке решения дифференциальной системы A12), •если таковые существуют. Для существования регулярных решений (не равных тождественно нулю) необходимо и достаточно, чтобы матрица вычетов Р-± имела целое неотрицательное характеристическое число. Если s — наибольшее такое целое характеристическое число, то из первых s + 1 уравнений A14) можно определить не обращающиеся одновременно в нуль столбцы а0, аъ ..., as, поскольку определитель соответствующей системы линейных однородных уравнений равен нулю: Из остальных уравнений A14) столбцы as+l, as+2, ... однозначно выра- выразятся через а0, аъ ...,as. Полученный ряд A11) сходится согласно лемме. Таким образом, линейно независимые решения первых s -f-1 урав- уравнений A14) определяют все линейно независимые регулярные в особой точке z = 0 решения системы A12). Если z = 0 есть особая точка, то задание начального значения а0 для регулярного в этой точке решения A11) (если таковое существует) не определяет однозначно этого решения. Однако решение, регулярное в регулярной особой точке, определяется однозначно, если заданы а0, «!, ..., as, т. е. если заданы начальные значения при z = 0 самого реше- решения и его первых s производных (s — наибольшее неотрицательное целое характеристическое число матрицы вычетов Р-г). Замечание 2. Доказанная лемма сохраняет свою силу и при P-i = 0. В этом случае в доказательстве леммы в качестве р^ можно взять любое положительное число. При />_1 = 0 лемма утверждает изве- известное положение о существовании регулярного решения в окрестности регулярной точки системы. В этом случае решение однозначно опреде- определяется заданием а0. 4. Пусть дана система ~ = P(z)X, A26) где со p(z)=^+ 2 v m=0 и ряд, стоящий в правой части, сходится при |z|O-
10] РЕГУЛЯРНАЯ ОСОБАЯ ТОЧКА 459 Пусть, далее, полагая X = A(z)Y A27) и подставляя вместо A (z) ряд A(z) = A0 + A1z + A2z*+ ..., A28) мы после формальных преобразований получаем: ^ = P*(z)Y, A29) где m=0 причем здесь, как и в выражении для P(z), ряд в правой части сходится при | z | < г. Докажем, что и ряд A28) сходится в окрестности I z | < г точки 2 = 0. Действительно, из A26), A27) и A29) следует, что ряд A28) формально удовлетворяет следующему дифференциальному матричному уравнению ^ = P{z)A-AP*{z). A30) Мы будем рассматривать А как вектор (столбец) в пространстве всех матриц ю-го порядка, т. е. в пространстве п2 измерений. Если мы в этом пространстве определим линейный оператор Р (z) над матрицей А, ана- аналитически зависящий от параметра z, при помощи равенства z), A31) то дифференциальное уравнение A30) можно будет записать в виде ^ A32) Правую часть этого уравнения можно рассматривать как произведе- произведение матрицы P(z) порядка /г2 на столбец А из и2 элементов. Из фор- формулы A31) видно, что точка 2 = 0 является регулярной особой точкой для системы A32). Ряд A28) формально удовлетворяет этой системе. Поэтому, применяя лемму, заключаем, что ряд A28) сходится в окрест- окрестности | Z | < Г ТОЧКИ 2 = 0. В частности, сходится и ряд для A (z) в формуле A10). Таким образом, нами доказана следующая Теорема 2. Всякая система dX =P(z)X A33) dz с регулярной особой точкой 2 = 0: r \ / — ~z г 2л ' m=0
460 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV имеет решение вида X = A(z)zMzU, A34) где A (z) — матричная функция, регулярная при z = 0 и обращающаяся в этой точке в единичную матрицу Е, а М и U—постоянные матрицы, причем М имеет простую структуру и целые характеристические числа, и разность между любыми двумя различными характеристическими числами матрицы U не есть целое число. Если матрица P-i приводится к жордановой форме при помощи неособенной матрицы Т + Ни К2Ег+Н2, .... KES + Hs) Г* A35) mo можно взять М и U в виде и т2Е2, ..., msEs)Г, A36) Bi2 ¦ ¦ • Bis 0 )^Ez-{-Hz ... BZs 71, A37) о ... Xe.+hJ где h = h—ini (i==l, 2, ..., s), A38) Bik—правильные нижние треугольные матрицы (г, Л: = 1, 2, ..., s), причем Bih — 0, если Xt — 7* не есть целое положительное число (i,k = l, 2, ..., s). В частном случае, когда ни одна из разностей Яг—Aft (г, к — 1, 2, ..., s) не равна целому положительному числу, в формуле A34) можно поло- положить М = 0, U — P^i, т. е. в этом случае решение представимо в виде X = A(z)zp-i. A39) Замечание 1. Обращаем внимание на то, что в настоящем параграфе был установлен алгоритм для определения коэффициентов ряда A (z) = = 2 -^«tZm (Ao — E) через коэффициенты Рт ряда для P(z). Кроме того, т=0 доказанная теорема определяет и интегральную подстановку V, на кото- которую умножается решение A34) при однократном обходе особой точки г=0 в положительном направлении: у _ Замечание 2. Из формулировки теоремы следует, что Bih = 0 при it^K (i, k-1,2, ...,s). Поэтому матрицы '0 Ва .. Л= Т faEu hEz, .... %SES)Т-1 и U = Т| ° ° ;; • Bzs | Г* A40) 0 ... 0
§ 11] ПРИВОДИМЫЕ АНАЛИТИЧЕСКИЕ СИСТЕМЫ 461 перестановочны между собой: Отсюда ZMZU = ZMZA+V = ZMZAZU = A41) где Л = М+Л = Т {1и Я2, ..., К} Т-\ A42) где Я17 Я2, ..., кп — все характеристические числа матрицы Р-и распо- расположенные в порядке Re Ai > Re А2 > ... > Re А„. С другой стороны, где /г (Я)—интерполяционный многочлен Лагранжа-Сильвестра для функ- функции /(Я) = гЧ Поскольку все характеристические числа матрицы U равны нулю, то h(К) линейно зависит от /@), /'@), ..., ^~1)@), т. е. от 1, lnz, ..., (lnz)^ (g—наименьший показатель, при котором IIе = 0). Поэтому и потому /г (g?) = A43) где qtj (г, / = 1,2, ..., п; г</)— многочлены от lnz степени ниже g. В "силу A34), A41), A42) и A43) частное решение системы A26) можно взять в виде z*i 0 ... О О z^ ... О 0 0 ... Чы 0 1 0 0 1 A44) Здесь Я17 Я2, ..., Хп — характеристические числа матрицы P-t, располо- расположенные в порядке Re Я, > Be Я2> ... > Re Яп, a qtj (i, /=1, 2, ..., п; i <))— многочлены от lnz степени не выше g — 1, где g — максимальное коли- количество характеристических чисел Яг, отличающихся между собой на целое число; A (z) — матричная функция, регулярная в точке z = 0, причем А @) = Т (| Т | Ф 0). Если матрица P_i имеет жорданову форму, то Т — Е. § 11. Приводимые аналитические системы В качестве приложения теоремы предыдущего параграфа выясним, в каких случаях система dX dt A45)
462 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV где A46) m=l — сходящийся ряд при t>t0, является приводимой (по Ляпунову), т. е. в каких случаях существует решение системы вида X = L(t)eBt, A47) где L(t) — матрица Ляпунова (т. е. L(t) удовлетворяет условиям 1° — 3° на стр. 422), а В — постоянная матрица1). Здесь X, Q — матрицы с ком- комплексными элементами, a t — вещественный аргумент. Сделаем преобразование 1 z Тогда система A45) перепишется в виде где A48) A49) m=0 Ряд, стоящий в правой части выражения для Р (z), сходится при | г | < — . Могут представиться два случая: 1) (?1 = 0. В этом случае точка z — О не является особой для системы A48). Эта система имеет решение, регулярное и нормированное в точке z = 0. Это решение задается сходящимся степенным рядом Полагая = 0, получим искомое представление A47). Система приводима. 2) Qi^O. В этом случае система A48) имеет регулярную особую точку в точке Z---0. Не нарушая общности рассуждений, можно считать матрицу вычетов P-i= —(?i приведенной к жордановой форме, в которой диагональные элементы Aj, Я2, ..., Хп расположены в порядке Re 7^ >> Re Яг !>...!> Re Xn. Тогда в формуле A44) Т — Е, и потому система A48) имеет решение 0 0 о о о о ... Яш 0 0 ... 1 l) Если имеет место равенство A47), то преобразование Ляпунова X=L(t)Y dY переводит систему A45) в систему —^-=BY.
§ 11] ПРИВОДИМЫЕ АНАЛИТИЧЕСКИЕ СИСТЕМЫ 465 где функция A (z) регулярна при г = Ои принимает в этой точке значе- значение Е, a qtk (i, к —1,2, ...,п; i<Ck)— многочлены от Inz. Заменяя здесь z на —, будем иметь: X Cf)' о о о о .V. (±I» О Q2n( 1ПТ 1 -и О О О О ... О • ... О . . . Г%п 1 (, О О 7,2 (in -^ .. 1 О ¦ ^0пт) 1 A50) Так как преобразование Х = А( — )У является преобразованием Ляпунова,, то система A45) будет приводимой к некоторой системе с постоянными коэффициентами в том и только в том случае, когда произведение A51) где Б—некоторая постоянная матрица будет матрицей Ляпунова, т. е. когда матрицы Lt (t), —^- и L^1 (t) будут ограничены. При этом, как следует из теоремы Еругина (§ 4), матрицу В можно считать матрицей с вещественными характеристическими числами. Из ограниченности матриц Lx (t) и LJ (t) при t > <o вытекает, что все характеристические числа матрицы В должны равняться нулю. Это следует из выражения для ет и е~т, получаемого из A51). Кроме того, все числа К±, Я2, ..., Хп должны быть чисто мнимыми, поскольку согласно A51) из ограниченности элементов последней строки в L^ (t) и первого столбца в L^ (t) вытекает, что ReXn>0 и ReA^O. Но если все характеристические числа матрицы Р-± чисто мнимы, то разность между любыми двумя различными характеристическими числами матрицы Р^ не равна целому числу. Поэтому имеет место формула A39): и для приводимости системы необходимо и достаточно, чтобы матрица i A52) вместе со своей обратной была бы ограничена при t > t0. Поскольку все характеристические числа матрицы В должны рав- равняться нулю, то минимальный многочлен для матрицы В имеет вид к°. Обозначим через при
464 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ [ГЛ. XV минимальный многочлен матрицы Qt. Поскольку Qt = — P_l5 то числа \ilt J*2> • • •, [Ац отличаются знаком от соответствующих чисел %t и потому все они — чисто мнимые числа. Тогда [см. формулы A2), A3) на стр. 421] и tQi = 2 [^fto + Uki In t+...+ Uh c. _i (In t)k~ ] Л, A53) h=i ¦ ft ' i<11-1. A54) Подставляя эти выражения в равенство L2(t)eB* = tb, получим: [Lz(t) Fd_t + (#)] **-* = Zo(t) (InfN, A55) где с—наибольшее из чисел cit c2, ..., с„, (>fc) обозначает матрицу, стремя- стремящуюся к нулю при t—> оо, a Z0(t) — ограниченная матрица при t>t0. Так как матрицы, стоящие в левой и правой частях равенства A55), должны иметь одинаковый порядок роста при t—> со, то т. е- и матрица Qi имеет простые элементарные делители. Обратно, если матрица (?, имеет простые элементарные делители и чисто мнимые характеристические числа jilt \iz, ..., |х„, то X = A (z) z-Qi = A (z) || z-»i8lk ||? «сть решение системы A49). Полагая здесь z = —, найдем: Функция X (f) вместе с — и обратной матрицей X (f) огра- ограничена при t>t0. Поэтому система приводима (i? = 0). Нами доказана1) Теорема 3. Система где матрица Q (t) представима сходящимся при t>t0 рядом ++ является приводимой в том и только в том случае, если у матрицы ¦вычетов Qi все элементарные делители простые и все характеристиче- характеристические числа чисто мнимы. *) См. работу Еругина [11], стр. 21—23. Там эта теорема доказана для случая, когда матрица Qi не имеет различных характеристических чисел, отличающихся между собой на целое число.
12] АНАЛИТ. ФУНКЦИИ МАТРИЦ. РАБОТЫ И. А. ЛАШГО-ДАНИЛЕВСКОГО 465 § 12. Аналитические функции от многих матриц и их применение к исследованию дифференциальных систем. Работы И. А. Лаппо-Данилевского Аналитическая функция от то матриц га-го порядка Х1г Х2,' ..., Хт может быть задана при помощи ряда оо A. .. т.) F(XUX2, ...,Xm) = ao+S S оцш...^кХк...Хк, A56) V=l Л. 32 Jv сходящегося для всех матриц то-го порядка Xj, удовлетворяющих нера- неравенствам mod Xj<.R} (/ = 1, 2, ..., то). A57) Здесь коэффициенты «о, ahh..Jv Gi. /2, •••> /v = l, 2, ..., то; v = l, 2, 3, ...) — комплексные числа, Rj (/ = 1, 2, ..., то) — постоянные матрицы га-го порядка с положительными элементами и Х,(/ = 1, 2, ..., то) — матрицы того же порядка, но переменные и с комплексными элементами. Теория аналитических функций от нескольких матриц была развита И. А. Лаппо-Данилевским. На основе этой теории И. А. Ланпо-Дани- левский провел фундаментальные исследования систем линейных диффе- дифференциальных уравнений с рациональными коэффициентами. Система с рациональными коэффициентами путем надлежащего преобразования независимой переменной всегда может быть приведена к виду т тт Uj UЛ ± Г± где Ujh—постоянные матрицы га-го порядка, aj — комплексные числа, Sj — целые положительные числа (/с = 0, 1, ..., Sj—1; / = 1, 2, ..., тоI). Некоторые результаты Лаппо-Данилевского мы проиллюстрируем на частном случае так называемых регулярных систем. Последние харак- характеризуются условием st = sz = ... = sm = 1 и записываются в виде m A59) ^=УХ. dz ZJ z—aj j=l Следуя Лаппо-Данилевскому, введем в рассмотрение специальные аналитические функции—гиперлогарифмы, —определяемые следующими рекуррентными соотношениями: 1Ь (z; ah, ah, .... a,- ) = \ dz. л x) В системе A58) все коэффициенты—правильные рациональные дроби отно- относительно г. К такому виду приводятся любые рациональные коэффициенты, если при помощи дробно-линейного преобразования над переменной г перевести регу- регулярную (для всех коэффициентов) конечную точку z=c в точку z=co. 30 Ф. Р. Гантмахер
466 ПРИЛОЖЕНИЯ К СИСТЕМАМ ЛИНЕЙНЫХ ДИФФЕРЕНЦ. УРАВНЕНИЙ ГГЛ. XV Рассматривая точки at, а2, ..., ат, оо как точки разветвления логарифмического типа, построим соответствующую риманову поверхность S(au а2, ...,ат; оо). Каждый гиперлогарифм будет однозначной функ- функцией на этой поверхности. С другой стороны, матрицант системы A59} Ql (т. е. нормированное в точке z = 6 решение), будучи аналитически продолжен, также может быть рассматриваем как однозначная функция на S(at, а2, ..., ат; со); при этом в качестве b может быть выбрана любая конечная точка на S, отличная от аи а2, ..., а^. Для нормированного решения Ql Лаппо-Данилевский дает явное выражение через определяющие матрицы Uu U2, ..., Um системы A59) в виде ряда со A. .. т) Йь = Е + S 2 h (*; ah, ah а5) VhUh ... U} A60) vl) i v v Это разложение сходится равномерно относительно z при любых U\, U2, ..., Um и представляет Q% в любой конечной области на поверх- поверхности S(osi, az, ..., ат; со), если только эта область не содержит внутри и на границе точек аи ..., Ощ. Если ряд A56) сходится при любых матрицах Хи Х2, ...,Хт, то соответствующая функция F(Хи Х2, ..., Хт) называется целой. Ql пред- представляет собой целую функцию от матриц Ult U2, ..., Um. Заставляя в формуле A60) аргумент z обойти точку aj в положи- положительном направлении один раз так, чтобы контур обхода не захватывал других точек аг (при 1ф)), мы получим выражение для интегральной подстановки Vj, соответствующей точке z = ay. Vj - Е + 2 2 PS (Ь; а?, ah, ..., а5) UhUh ... U} A61) v=l л iv v (j = l, 2, ...,m), где в понятных обозначениях pj(b: ah) = Pj(b; ah, ah,...,aj)= \ ji. 72. ...»7v, J = l, 2, ...,m; v = l, 2, 3, ... Ряд A61), как и ряд A60), представляет собой целую функцию от Uu U2, ..., Um. Обобщив теорию аналитических функций на случай бесконечного, но счетного множества матриц-аргументов Хи Xz, X3, ...,х). Лаппо-Да- Лаппо-Данилевский -использовал эту теорию для исследования поведения решения системы в окрестности иррегулярной особой точки2). Мы приведем основ- основной результат. 1) См. [216], т. I, Мемуар 1. 2) См. [216], т. I, Мемуар 3, см. также [92], [104а, б].
§ 12] АНАЛИТ. ФУНКЦИИ МАТРИЦ. РАБОТЫ И. А. ЛАППО-ДАНИЛЕВСКОГО 467 Нормированное решение Йь системы "IT" 2 V*. где степенной ряд в правой части сходится при |z| </¦(/•>> II), может быть представлено рядом v=l h, h iv=-« V П—|t , S V 2 , S a$*> . In**. vH=0 X=0 J|i+i'""''v к=0 л V A62) Здесь a*(X) ,- и a^...j —скалярные коэффициенты, определяемые по специальным формулам. Ряд A62) сходится при любых матрицах Pit Р2, ... в кольце (q — произвольное положительное число, меньшее г). Этому кольцу должна принадлежать и точка b (q < | b \ < г). Не имея возможности в какой бы то ни было степени подробно изло- изложить содержание работ Лаппо-Данилевского в настоящей книге, мы вынуж- вынуждены ограничиться приведенными выше формулировками некоторых основ- основных результатов и отослать читателей к соответствующей литературе. Все относящиеся к дифференциальным уравнениям работы Лаппо-Да- Лаппо-Данилевского изданы посмертно Академией наук СССР в трех томах в 1934 —1936 гг. Кроме того, основные результаты автора изложены в статьях [82] и небольшой книге [18а]. Сокращенное изложение неко- некоторых результатов можно найти и в книге В. И. Смирнова «Курс высшей математики», т. III. х) Ограничение г > 1 несущественно, так как это условие всегда можно полу- получить заменой z на az, где a—надлежащим образом выбранное положительное число. 30*
ГЛАВА XVI ПРОБЛЕМА РАУСА — ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ § 1. Введение В главе XII, § 2 мы выяснили, что согласно теореме Ляпунова нулевое решение системы дифференциальных уравнений п iir=2 ад*+(**) (*=1 п) A) lath (i, к = 1, 2, . . ., га) — постоянные коэффициенты] при любых чле- членах (>К>К) второго порядка и выше относительно хи хг, . . ., х„, является устойчивым, если все характеристические числа матрицы А = || aik ||*\ т. е. все корни векового уравнения А (Я) = | %Е — А | = 0, имеют отрица- отрицательные вещественные части. Поэтому задача установления необходимых и достаточных условий, при которых все корни данного алгебраического уравнения расположены в левой полуплоскости, имеет фундаментальное значение в ряде при- прикладных областей, в которых исследуется устойчивость механических и влектрических систем. Важность 8той алгебраической задачи была ясна основоположникам теории регулирования машин, английскому физику Д. К. Максвеллу и русскому инженеру-исследователю И. А, Вышнеградскому, которые в своих^работах, посвященных регуляторам, установили и широко исполь- зовали упомянутые алгебраические условия для уравнений не выше третьей степени г). В 1868 г. Максвелл выдвинул математическую эадачу об отыскании соответствующих условий для алгебраического уравнения любой степени. Между тем эта задача по существу была решена в опубликованной в 1856 г. работе французского математика Эрмита [128J. В зтой работе была уста- установлена тесная связь между числом корней комплексного многочлена / (z), расположенных внутри какой-либо полуплоскости (или даже внутри какого-либо прямоугольника), и сигнатурой некоторой квадратичной формы; Однако результаты Эрмита не были доведены до такого состояния, чтобы они могли быть использованы специалистами, работающими в при- прикладных областях. Поэтому эта работа Эрмита и не получила соответ- соответствующего распространения. х) Д. К. Максвелл, О регуляторах A868); И. А. Вышнеградский, О регуляторах прямого действия A876). Эти работы опубликованы в сборнике «Тео- «Теория автоматического регулирования» (издание АН СССР, 1949). См. там же статью А. А. Андронова и И. Н. Вознесенского, О работах Д. К. Максвелла, И. А. Вышноградского и А. Стодолы в области теории регулирования машин.
I 2] ИНДЕКСЫ КОШИ 469 В 1875 г. английский механик Раус [45], пользуясь теоремой Штурма и теорией индексов Коши, установил алгоритм для определения числа к корней вещественного многочлена, расположенных в правой полупло- полуплоскости (Re z >> 0). В частном случае к = 0 этот алгоритм и дает крите- критерий устойчивости. В конце XIX в. крупнейший словацкий инженер-исследователь, создатель теории паровых и газовых турбин, А. Стодола, не зная работы Рауса, снова поставил задачу об отыскании условий того, чтобы все корни алгебраического уравнения имели отрицательные вещественные части, и в 1895 г. А. Гурвиц [129], опираясь на работы Эрмита, дает второе (независимое от Рауса) решение той же задачи. Полученные Гур- вицем детерминантные неравенства известны в настоящее время под названием условий Рауса — Гурвица. Однако еще до появления в свет работы Гурвица основатель совре- современной теории устойчивости А. М. Ляпунов в своей знаменитой диссер- диссертации («Общая задача об устойчивости движения», Харьков, 1892) уста- установил г) теорему, из которой вытекают необходимые и достаточные условия для того, чтобы все корни характеристического уравнения вещественной матрицы А = || atk ||" имели отрицательные вещественные части. Эти условия используются в ряде работ по теории регулирования 2). Новый критерий устойчивости был установлен в 1914 г. француз- французскими математиками Льенаром и Шипаром [135]. Используя специальные квадратичные формы, эти авторы получили критерий устойчивости, имеющий некоторые преимущества перед крите- критерием Рауса — Гурвица (число детерминантных неравенств в критерии Льенара — Шипара примерно вдвое меньше, нежели в критерии Рауса — Гурвица). Знаменитые русские математики П. Л. Чебышев и А. А. Марков установили две замечательные теоремы в связи с разложением в ряды непрерывных дробей специального типа. Эти теоремы, как будет пока- показано в § 16, имеют непосредственное отношение к проблеме Рауса — Гурвица. В очерченном круге вопросов, как увидит читатель, находят себе существенное применение теория квадратичных форм (гл. X) и, в част- частности, теория ганкелевых форм (гл. X, § 10). § 2. Индексы |Коши Начнем с рассмотрения так называемых индексов Коши 3). Определение 1. Индексом Коши вещественной рациональной функции R (х) в пределах от а до Ь (обозначение /„i? (x); a, b — веще- вещественные числа, либо ± °о) будем называть разность между числом раз- разрывов R (х) с переходом от — сю к -|- сю и числом разрывов с переходом от +°° к — °° ПРИ изменении аргумента от а к b 4). Согласно этому определению, если i-i *) См. [22], § 20. 2) См., например, [73]. 3) См. [10], стр. 419—425. 4) При подсчете нисла разрывов к райнио значения х — пределы а и Ъ — не вклю- яаются.
470 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI где Аи аг (i = 1, 2, . . ., р) — вещественные числа, a Ri (x) — рацио- рациональная функция, не имеющая вещественных полюсов г), то =2tagnAt*) B) и вообще fifl(x)= 2 signal» (o<6). B') <<Ь В частности, если / (х) = а0 (х—at)ni ... (х—ат)п™ —вещественный многочлен (aj^aft при i^k; i, к = 1, 2, ...,т) и среди корней а4, «г» • • • > ат этого многочлена только первые р вещественны, то /(ж) Zj я—а* 2л х—щ где i?i (ж) — вещественная рациональная функция, не имеющая вещест- вещественных полюсов. Поэтому индекб равен числу различных вещественных корней многочлена f (x), находя- находящихся внутри интервала (а, Ь). Произвольная вещественная рациональная функция R (х) всегда представима в виде где все а и А — вещественные числа (А^фО; i — 1, 2, ...,р) и Rt(x) не имеет вещественных полюсов. Тогда J±ZR(x)= 2 signal C) (п. нечетно) и вообще IbaR{x)= 2 sign А% (а<Ь)«). C') " а<аг<Ь \ п. вечетно ) ч I S Если R(a) = R (b) = 0, то индекс /a-ft (я) выражается через прираще- приращение непрерывной функции arctgR (х): IbaR (х) = - А„ arctg R (х) (а <Ь)% D) !) Полюсами рациональной функции являются те значения аргумента, при кото- которых эта функция обращается в бесконечность. 2) Под sign а (а — вещественное число) мы понимаем +1, —1 или 0 в зависи- зависимости от того, а > 0, а < 0 или а =» 0. 3) В C) сумма распространяется на все те значения i, для которых соответ- соответствующее щ нечетно. В C') сумма распространяется на все те i, для которых щ нечетно и а < cij < Ь. 4) Если а=—со, a 6=+oo, то фэрмула D) справедлива для любой правиль- правильной рациональной дроби R(x), поскольку в этом случае R (— оо) = Я(+оо)=°-
§ 2] ИНДЕКСЫ КОНШ 471 Один из методов вычисления индекса IaR (%) основан на классичес- классической теореме Штурма. Рассмотрим ряд вещественных многочленов h(x), /2 (as),...,/„(a), E) обладающий двумя свойствами по отношению к интервалу (а, ЬI): 1° При любом значении х (а < х < 6), обращающем в нуль какую-либо из функций fh (x), две смежные функции /ft_i (x) и /й+1 (ж) имеют зна- значения, отличные от нуля и разных знаков, т. е. из fk (x) = 0 при a<zx<:b следует: fk^ (х) fh+i (x) <Z 0. 2° Последняя функция fm (x) в ряду E) не обращается в нуль внутри (а, Ь), т. е. ^(х)фО при а<.х<.Ь. Такой ряд D) многочленов называется рядом Штурма в интервале (о, Ъ). Обозначим через V (х) число перемен знака в ряду E) при фиксиро- фиксированном значении х2). Тогда при изменении х от а до Ъ величина V (х) может измениться лишь при переходе через нуль какой-либо из функций ряда E). Но в силу 1° при переходе через нуль функции fh (x) (к = 2, ... . . ., т — 1) величина V (х) не изменяется. При переходе же через нуль функции /t (x) теряется или приобретается одна перемена знака в ряду E) U (х) в зависимости от того, переходит при этом отношение , ; I от — сю к -f- оо и \х) или наоборот. Поэтому имеет место Теорема 1 (Ш т у р м а ). Если /t (х), /2 (х), , . ., fm(x) — ряд Штурма в (a, b), a V (х) — число перемен знака в этом ряду, то Iba^- = V(a)-V(b). F) Примечание. Помножим все члены ряда Штурма на один и тот же произвольный многочлен d(x). Полученный таким образом ряд много- многочленов назовем обобщенным рядом Штурма. Так как умножение всех членов ряда E) на один и тот же многочлен не меняет ни левой, ни правой части равенства F), то теорема Штурма сохраняет свою силу и для обобщенного ряда Штурма. Заметим, что если даны два произвольных многочлена / (х) и g (x) [степень / (х) > степени g (х)], то всегда можно при помощи алгоритма Евклида построить обобщенный ряд Штурма, который начинался бы с функций /i (х) == / (х), /2 (х) ~,g(x). Действительно, обозначая через —/3 (х) остаток от деления /t (x) на /2 (х), через —/4 (х) — остаток от деления /2 (х) на /3 (х) и т. д., будем иметь цепочку тождеств U (Ж) = ?1 (X) f2 (Х) — /3 (Ж), . . . , /ft-i (X) = = 9Л-1 (х) fh fa) — /fc+1 (Z), . - ., /m-1 (Ж) = qm-l (X) fm (x), G) где последний не равный тождественно нулю остаток /т (х) является наибольшим общим делителем / (х) и g (x), а также наибольшим общим *) При этом а может равняться —со, а Ъ -{-со. 2) Если а < х < Ъ и /t (x) Ф 0, то в силу 1° при определении V (х) нулевые зна- значения в ряду D) можно опустить либо этим значениям можно приписать произволь- произвольные знаки. Если а конечно, то под V (а) следует понимать V (а + е), где е— столь малое положительное число, что в полузамкнутом интервале (a, a -f- в] ни одна из функций /j (х) (г = 1, 2, . . ., т) не обращается в нуль. Точно так же, если Ь конечно, то под V (Ь) следует понимать V (Ъ — е), где число в определяется анало- аналогично.
472 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI делителем всех функций построенного таким образом ряда E). Если fm (х) фО (а < х < Ь), то полученный ряд E) в силу G) удовлетворяет условиям 1°, 2° и является рядом Штурма. Если же многочлен fm (х) имеет корни внутри интервала (а, Ь), то ряд E) является обобщенным рядом Штурма, поскольку он становится рядом Штурма после деления всех его членов на fm (x). Из сказанного следует, что индекс любой рациональной функции R (х) может быть определен при помощи теоремы Штурма. Для этого достаточно представить R (х) в виде О (х) +§7~ч > гДе Q (х)' /(*)> 8 (х) ~ многочлены и степень g (x) <; степени f (х). Тогда, если построить обоб- обобщенный ряд Штурма для f (x), g (x), то При помощи теоремы Штурма можно определить число различных вещественных корней многочлена / (х) внутри интервала (а, Ь), поскольку гЬ /' 0*0 это число, как мы видели, равно 1а .,/ ¦ § 3. Алгоритм Рауса 1. Задача Рауса состоит в определении числа к корней веществен- вещественного многочлена /(z), расположенных в правой полуплоскости (Rez>0). Рассмотрим сначала случай, когда / (z) не имеет нулей на мни- мнимой оси. В правой полуплоскости построим полуокружность радиу- радиуса R с центром в нуле и рассмотрим область, ограниченную этой полуокружностью и отрезком мнимой оси (рис. 9). При до- достаточно большом R все к нулей многочлена / (z) с положи- положительными вещественными частями будут находиться внутри этой области. Поэтому arg / (z) при положительном обходе контура области получит приращение 2/от1). С другой стороны, приращение arg / (z) вдоль полуокружности радиуса R при R—¦> с» определяется приращением аргумента старшего чле- члена uqZ71 и потому равно пп. Поэтому для приращения arg / (z) вдоль мнимой оси (Я—> со) получаем выражение rg/(Mo) = (n—2k) л. (8) Введем не совсем обычные обозначения для коэффи- Рис. 9. циентов многочлена / (z), пусть Тогда, замечая, что приращение A arg/(но) в формуле (8) не изме- изменится, если многочлен /(z) помножить на произвольное комплексное число, положим: — / (гсэ) = /i (со) — if2 (to), (9) п п х) В самом деле, если i{z)—a0 ГТ (г—zj), то Л arg/(z)= 2 Л arg (z—zj)- i=l ц i=l Если точка zj находится внутри рассматриваемой области, то Aarg(z—zj)=2it; если zj вне этой области, то Д arg (z—zj)=O.
§ 3] АЛГОРИТМ РАУСА 473- где /1((o) = a0(on-a1(on-2 + a3(on-4-..., | ( } Следуя Раусу, воспользуемся индексом Коши. Из формул D) и (9) находим: Поэтому из формулы (8) следует, что1) 2. Для определения индекса, стоящего в левой части равенства A1), используем теорему Штурма (см. предыдущий параграф). Исходя из функ- функций /i(cc>) и /2((о), определяемых равенствами A0), построим, следуя Раусу, при помощи алгоритма Евклида обобщенный ряд Штурма (см. стр. 471) АИ, Ыю), /»(©),...,/»(©)• Рассмотрим теперь регулярный случай: т = п-\-{. В этом случае в ряду A2) степень каждой функции на единицу меньше степени предыдущей, и последняя функция fm((o) имеет нулевую степень2). Из алгоритма Евклида [см. G)] следует, что /3 (ш) = ^- ш/2 (о) - /i (ю) = союп-а — С!©"" где Точно так же /4 («) = —^ ш/з (<о) — /2 (со) = d0an~3 — did>n~6 + ..., где л l 6о с0^1 — ^Л j i ^0 CQ&2 — &0с2 /^Ч'Ч с0 СО СО с0 Аналогично определяются коэффициенты остальных многочленов /s (со), .... • ¦ • 1 /п+1 (й>). При этом каждый из многочленог U 0»), /г («)» ¦ • •, fn+i (w) A4) является четной или нечетной функцией, причем степени смежных мно- многочленов всегда имеют разную четность. х) Напомним, что формула A0) выведена в предположении, что многочлен / (z} не имеет корней па мнимой оси. 2) В регулярном случае ряд A2) является обычным (необобщенным) рядом Штурма..
474 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Составим схему Рауса: а0, «1, а2, ..., "j I с0, сь с2, ..., f A5) do, du dz, ..., В этой схеме, как показывают формулы A3), A3'), каждая строка определяется из двух предыдущих по следующему правилу: Из чисел верхней строки вычитаются соответствующие числа ниж- нижней, предварительно помноженные на такое число, чтобы первая раз- разность обращалась в нуль. Отбрасы- Отбрасывая эту нулевую разность, получаем •••• .... искомую строку. Регулярный случай, очевидно, • • * ... характеризуется тем, что при после- последовательном применении этого пра- • * * ... вила мл в ряду b0, c0, d0, . . . . . не встречаем числа, равного нулю, * и этот ряд состоит из п +1 чисел. • На рис. 10 и 11 показан скелет регулярной схемы Рауса при п чет- • ном (п = 6) и п нечетном (п = 7). Здесь элементы схемы отмечены точками. Рис. 10. Рис. 11. В регулярном случае многочлены /4 (со) и /2 (со) имеют наибольший общий делитель fn+i (со) = const Ф- 0. Поэтому эти многочлены не обра- обращаются одновременно в нуль, т. е. / (ио) = /i (со) —ifz (со) Ф 0 при ш веще- вещественном. Поэтому в регулярном случае имеет место формула A1). Применяя к левой части этой формулы теорему Штурма в интервале (— со, +со) и используя при этом ряд A4), получаем согласно A1): V(— со)—F( + oo) = n — 2k. A6) В данном случае х) со) = V(a0, b0, с0, d0,...), V( — co) = V(a0, —b0, c0, —do,...). Отсюда F(_oo) + F( + oD) = n.l A7) Из равенств A6) и A7) находим: k = V(ao, b0, c0, d0,...). A8) Нами доказана для регулярного случая х) Знак /^ (ш) при (о= +оз совпадает со знаком старшего коэффициента, а при ш=—со отличается от этого знака множителем(—i)n~h~t~i (k=i, 2 и
§3] АЛГОРИТМ РАУСА 475 Теорема 2 (Рауса). Число корней вещественного многочлена f (z), лежащих в правой полуплоскости Rez>0, равно числу перемен знака •в первом столбце схемы Рауса. 3. Рассмотрим важный частный случай, когда все корни / (z) имеют отрицательные вещественные части («случай устойчивости»). В этом слу- случае многочлен / (z) не имеет чисто мнимых корней, и потому имеет место формула A1), а следовательно, и формула A6). Поскольку & = 0, фор- формула A6) перепишется так: V( — со) — F( + co) = n. A9) Но 0<.F( — со)*Ст — l^Cn и 0<;У( + со)<;т — 1<Ж Поэтому равен- равенство A9) возможно лишь тогда, когда т — п-\-1 (регулярный случай!) и F (+ оэ) = О, V(— оо) = т — 1 = п. Тогда из формулы A8) следует: Критерий Рауса. Для того чтобы все корни вещественного мно- многочлена f(z) имели отрицательные вещественные части, необходимо и достаточно, чтобы при выполнении алгоритма Рауса все элементы первого столбца схемы Рауса получались отличными от нуля и одного знака. 4. При установлении теоремы Рауса мы опирались на формулу (И). В дальнейшем нам понадобится обобщение этой формулы. Формула A1) была выведена в предположении, что многочлен f(z) не имеет корней на мнимой оси. Мы покажем, что в общем случае, когда многочлен / (z) = = aozn + boz"'1 + axzn~% + ... (ав Ф 0) имеет к корней в правой полуплос- полуплоскости и я корней на мнимой оси, формула A1) заменяется формулой о1 В самом деле, f(z)=d(z)f*(z), где вещественный многочлен d (z) = zs + ... имеет я корней на мнимой оси, а многочлен /*(z) степени п* = п — s таких корней не имеет. Пусть ± f (ш) - U (ш) - if г (со), i^ Г (iw) = ft № - ift («о). Тогда h И -if 2 И = 4" d (i<u) Ift (««>) - ift («©)]¦ Поскольку -^-d(i(u) — вещественный многочлен относительно ш, то /i(u>) ЯН" К многочлену f*(z) применима формула (И). Поэтому 7+°°/2(<а)__ Н-°° /1М-и*_2А--/г — 2/с — ч что и требовалось доказать1). *) Обращаем внимание читателя на интересное обобщение критерия Рауса, содержащееся в работе Фаэдо [176]. Здесь устанавливаются достаточные условия того, что корни всех многочленов / (z)=aQzn-\-a1zn~i-\-...-\-ап с коэффициентами щ, меняющимися в заданных интервалах aj<ai<ai (i=0, 1, ...,в; яо<°). одновременно все имеют отрицательные вещественные части.
476 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI § 4. Особые случаи. Примеры 1. В предыдущем параграфе мы разобрали регулярный случай, когда прв ваполнении схемы Рауса ни одно из чисел b0, c0, d0, ... не оказывается равным нулю. Переходим теперь к рассмотрению особых случаев, когда в ряду чисел Ъо, Со,... мы встречаемся с числом кц—О. Алгоритм Рауса останавливается на той строке, где находится h0, так как для получения чисел следующей строки нужно делить на h0. Особые случаи могут быть двух типов: 1) В той же строке, где находится h0, имеются числа, не равные нулю. Это означает, что в каком-то месте ряда A2) произошло пони- понижение степени больше чем на единицу. 2) Одновременно все числа строки, содержащей й0, оказы- оказываются равными нулю. Тогда эта строка является (т-\- 1)-й, где т— числа членов в обобщенном ряду Штурма E). В этом случае в ряду A2) степени функций все время понижаются на единицу, но степень последней функции fm (со) больше нуля. В обоих случаях в ряду A2) число функций m<^.n-\-i. Поскольку обычный алгоритм Рауса в особых случаях приостанавливается, Раус дает специальные правила для продолжения схемы в случаях 1), 2). 2. В случае 1) следует по Раусу вместо йо=О подставить «малую» величину е определенного (но произвольного) знака и продолжать заполнение схемы. При этом последующие элементы первого столбца схемы будут рациональными функциями от е. Знаки этих элементов определятся, исходя из «малости» и знака е. Если же- какой-либо из этих элементов окажется тождественным нулем относительно е, то> мы этот элемент заменим другой малой величиной Т] и продолжим алгоритм. Пример. Схема Р.ауса (с малым параметром е) 1, 2, 1 1, 2 е. 1 k=v(l,l,B,2 —, 1^=2. 2-1- 8 1 Обоснование этого своеобразного метода варьирования элементов схемы заклю- заключается в следующем: Поскольку мы предполагаем отсутствие особенностей второго типа, то функ- функции /4 (со) и /2 (со) взаимно просты. Отсюда следует, что многочлен / (z) не имеет корней на мнимой оси. В схеме Рауса все элементы выражаются рационально через элементы первых двух строк, т. е. через коэффициенты данного многочлена. Но нетрудно усмотреть из формул A3), A3') и аналогичных формул для последующих строк, что, задавшись произвольными значениями для Элементов двух любых подряд идущих строк схемы Рауса и для первых элементов предыдущих строк, мы можем целым рациональным образом выразить через эти элементы все числа, стоящие в первых двух строках, т. е. коэффициенты исходного многочлена. Так, например, все числа а, Ъ можно представить в виде целых рациональных функций от °о> ^о» со> •¦•> ^о> ^1> ^2> ¦¦•! ёог ёи ё2> ••• Поэтому, заменяя Ло=0 на е, мы фактически видоизменяем наш исходный многочлен. Вместо схемы для / (z) мы имеем схему Рауса для многочлена F (z, e), где F (z, е)—целая рациональная функция от z и е, обращающаяся в / (z) при 8=0. Так как корни многочлена F (z, e) непрерывно меняются с изменением пара- параметра е и при е=0 нет корней на мнимой оси, то при малых по модулю значениях е число к корней в правой полуплоскости у многочленов F(z, e) и F (z, 0)=/(z) одинаково. 3. Переходим к рассмотрению особенностей второго типа. Пусть в схеме Рауса «о ф 0,- Ъо ф 0, ..., еоф 0, Ло=°. fci=0, A2=0. •••
§ 4] ОСОБЫЕ СЛУЧАИ. ПРИМЕРЫ 477 В этом случае в обобщенном ряду Штурма A6) последний многочлен имеет вид: 1т (co)=eocuT1-m+1—eico«-m-i+ ... Раус предлагает ваменитъ нулевое /m+i (ю) на /^ (а), т. е. вместо нулевых h0, hi, ... написать соответственно коэффициенты (ге — ш продолжать алгоритм. Обоснование этого правила заключается в следующем: Согласно формуле B0) s корней многочлена / (z) на мнимой оси совпадают с вещественными корнями мно- многочлена }т (со). Поэтому, если эти вещественные корни простые, то (см. стр. 470) +о и, следовательно, /тИ ._ ,, Эта формула показывает, что недостающую часть схемы Рауса следует заполнить схемой Рауса для многочленов /го (со) и f'm (со). Коэффициенты многочлена f'm (to) и используются для замены элементов нулевой строки в схеме Рауса. Если же корни fm (со) ^не простые, то, обозначая через d (со) наибольший общий делитель /го (со) и f'm (а), через е (со) наибольший общий делитель d (со) и d' (fit) и т. д., мы будем иметь: Г Н d' (со) /(со) + -°° d(co) +/-~ в (со) ^ s- Таким образом, искомое число к можно получить, если недостающую часть схемы Рауса дополнить схемами Рауса для fm (а) и f'm (со), d (со) и d' (со), в (а) и е' (а) и т. д., т. е. несколько раз применять правило Рауса для ликвидации особенностей 2-го типа. Пример. Схема «w 1—1 1 1—11 л>9 1—2 3—21 •о» 1—2 3—21 7 f 8 —12 12 —4 W { 2—3 3—1 2 —1 3—3 —1 1 2 1 q Q 1 — 1 2—2 1—1 4—2 2—1 2 =V(l, 1, 1, 2, —1, 1, 1, 2, —1, 1, 1)=4.
478 ПРОБЛЕМА РАУСА—ГУРБИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Примечание. Не изменяя знаков элементов первого столбца, можно все элементы какой-либо строки помножить на одно и то же число. Это замечание было использовано при построении схемы. 4. Однако применение обоих правил Рауса не дает возможности во всех слу- случаях определить число к. Применение первого правила (введение малых парамет- параметров е, tj, ...) обосновано лишь в том случае, когда многочлен /(z) не имеет корней на мнимой оси. Если многочлен / (z) имеет корни на мнимой оси, то при варьировании пара- параметра е некоторые из этих корней могут перейти в правую полуплоскость и изме- изменить число к. Пример. Схема щв 1 3 3 1 ©в 1 3 2 to* e 11 3-- 2-i- /г-1 3~V ее I e . 2е—1 28 — 1 <о° 1 V е у 12 при е <0. Вопрос, чему равно к, остается открытым. В общем случае, когда / (z) имеет корни на мнимой оси, следует поступать так: Полагая f (z)=F1(z)-\-F2{z), где Ft (z) =o0z«+в1*«-я + ..., F2 (z) = fc следует найти наибольший общий делитель d (z) многочленов Fi (z) и F^. (z). Тогда /(z)=d(z)/*(z). Если /(z) имеет корень z, для которого —z снова является корнем (этим свой- свойством обладают и все корни на мнимой оси), то из /(z)—0 и /(—z)=0 следует: 7?! (z)=0 и /<'2(z)=0, т. е. z является корнем d (z). Поэтому многочлен /*(z) не имеет корней z, для которых —z является корнем /* (z) *). Тогда где &i и Л2—числа корней в правой полуплоскости многочленов /*(z) и d(z); fcj определяется по алгоритму Рауса, а ^2=^2—• где *—степень d(z), a s — число вещественных корней многочлена d (ia) 2). В последнем примере Поэтому (см. пример на стр. 476) здесь /с2=0, fci=2 и, следовательно, г) При определении многочлена d (z) можно исходить не из функций F± (z) и ^2 (z)> а из введенных ранее (стр. 472) функций /i (z) и /2 (z). (Подробнее об этом см. сноску к стр. 490.) z) d (ico)—вещественный многочлен или становится таковым после сокращения на I. Число вещественных корней его можно определить при помощи теоремы Штурма.
§ 51 ТЕОРЕМА ЛЯПУНОВА 479 § 5. Теорема Ляпунова Из исследований А. М. Ляпунова, опубликованных в 1892 г. в его монографии «Общая задача об устойчивости движения», вытекает теорема1), дающая необходимые и достаточные условия для того, чтобы все корни характеристического уравнения | КЕ — А \ = О вещественной матрицы А = || агь. \\^ имели отрицательные вещественные части. Поскольку любой многочлен /(Х) = а0Х"+а1ХТ1+ ... +ап(а0фО) может быть представлен в виде характеристического определителя | "кЕ—А |2), то теорема Ляпунова носит общий характер и относится к любому алгебраическому уравне- уравнению / (X) == 0. Пусть дана вещественная матрица .A = ||ajfc||™ и однородный много- многочлен m-го измерения относительно переменных х%, хг, ..., хп V (х, х, ..., х) [х = (хи х2, ..., Найдем полную производную по t от функции V (х, х, ..., х) в пред- предположении, что х есть решение дифференциальной системы —^- = Ах. Тогда -^ V (х, х, ..., х) = V (Ах, х, ..., х + V(x, Ax, ...,x)+...+V(x, х, ...,Ax)=W(x, x, ...,x), B1) где W(х, х, ..., х) — снова однородный многочлен m-го измерения отно- относительно хи х2, ..., Хп. Равенство B1) определяет линейный оператор А, относящий каждому однородному многочлену m-го измерения V (х, х, ... ..., х) некоторый однородный многочлен W (х, х, ..., х) того же изме- измерения т Мы ограничимся случаем т = 2 3). В этом случае V (х, х) и W (х, х) — квадратичные формы от переменных Xi, x2, . • ¦, хп, связанные равенством dt V(x, x) = x) + V(x, Ax)r=W(x, x), B2) 1) Cm. [19], § 20. z) Для этого достаточно, например, положить: 0 0 ... 0 1 0 ... 0 — а0 о-п- а0 О 0 ... 1 — а0 3) А. М. Ляпунов установил свою теорему (см. ниже теорему 3) при любом целом и положительном т.
-480 ПРОБЛЕМА РАУСА—ГУРБИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI откуда*) B3) Здесь F = ||yjfc[|y и И7 = || м;г/г ||^—симметрические матрицы, состав- составленные соответственно из коэффициентов форм V (х, х) и W (х, х). Линей- Линейный оператор А в пространстве симметрических матриц и-го порядка V целиком определяется заданием матрицы А = || Cja ||^. Если А,!, Х2, ..., Я„—характеристические числа матрицы А, то каж- каждое характеристическое число оператора А представляется в виде %i + Xj, ) <<) Действительно, пусть ии—собственный вектор-столбец матрицы А', соответствующий характеристическому числу Х^, т. е. Аи^^^п ® и пусть Vik = UiUk. Тогда Avih = А'щи'к + щи'пА = (А'щ) щ. + Щ (A'uh)' = = (lt + %h) щи'к = (Л, + Xft) оЛ (i, Л = 1, .... л). B3') ^Если все величины (Яг + ^й) (*» ft = l, ...,n) различны между собой, то из равенств B3') следует, что эти величины образуют полную систему характеристических чисел оператора А. Общий случай, когда среди сумм ^¦j + ^fi имеются равные между собой, получается из рассмотренного слу- случая с помощью соображений непрерывности. Из доказанного предложения следует, что оператор А является .неособенным, матрица А = || щъ ||" не имеет нулевых и двух противопо- противоположных характеристических чисел. В этом случае задание матрицы W -однозначно определяет матрицы V в B3). Таким образом, если матрица А = \\ щъ. II" we имеет нулевых и двух .противоположных характеристических чисел, то каждой квадратичной ¦форме W (х, х) отвечает одна и только одна квадратичная форма V (х, х), связанная с V (х, х) равенством B2). Теперь сформулируем теорему Ляпунова. Теорема 3 (Ляпунова). Если все характеристические числа вещественной матрицы А = || ath ||" имеют отрицательные вещественные части, то любой отрицательно определенной квадратичной форме W (х, х) отвечает положительно определенная квадратичная форма Т(я, х), связанная с формой W (х, х) в силу уравнения ^ = Ах B4) равенством ±V{x, x) = W(x, x). B5) Обратно, если для некоторой отрицательно определенной формы W (х, х) существует положительно^ определенная форма V(х, х), связанная с W (х, х) равенством B5) в силу уравнения B4), то все характеристи- характеристические числа матрицы А = || aih ||™ имеют отрицательные вещественные части. Поскольку V (х, y)=x'Vy.
§ 51 ТЕОРЕМА ЛЯПУНОВА 481 Доказательство. 1. Пусть все характеристические числа мат- матрицы А имеют отрицательные вещественные части. Тогда для любого решения x = eAtx0 системы B4) имеем: lim х = 0г). Пусть формы V(x, x) «-Н-со и W(x, x) связаны формулой B5) и W(х, х)<.0 Допустим, что при некотором Но -гг V(х, х) = W(х, х)<С0(ж = eAtx0). Поэтому при (>0 величина V(x, х) отрицательна и убывает при t —> +оо, что находится в проти- противоречии с равенством lim V (х, х) = lim V (х, х) = 0. Следовательно, + V (х, я)>0 при хфО, т. е. V (х, х)—положительно определенная квад- квадратичная форма. 2. Пусть, обратно, дано, что в равенстве B5) W(x, x)<0, V(x, z) Из B5) следует: V (х, х) = V (х0, х0) + J W (х, х) dt (х = емх0). B5') о Докажем, что при произвольном х0 ф 0 столбец х = емхй как угодно близко подходит к нулю при некоторых сколь угодно больших значениях tZ>0. Допустим противное. Тогда существует число v>0 такое, что W(x, x)< — v<0 (х = еА% Но тогда из B5') V(x, x)<V(x0, xo)-xt, и, следовательно, при некоторых достаточно больших значениях t спра- справедливо неравенство V (х, х) <С 0, что противоречит условию. Из доказанного следует, что при некоторых достаточно больших значениях t величина V(х, x)(x = eAtx0, х0ф0) будет как угодно близка к нулю. Но V (х, х) монотонно убывает при t > 0, поскольку -^ V (х, х) = = W(x, х)<0. Поэтому Нш7(ж, х) = 0. t-*co Отсюда вытекает, что при любом х0ф0 имеет место равенство limeAta;o = O, т. е. limeA* = 0. Это возможно лишь тогда, когда все характеристические числа матрицы А имеют отрицательные вещественные части (см. гл. V, § 6). Теорема доказана полностью. В качестве формы W (х, х) в теореме Ляпунова можно взять любую п отрицательно определенную форму и, в частности, форму — V х\. В этом {=1 случае теорема допускает следующую матричную формулировку: 1) См. гл. V, § 6. 2) Форма W (х, х) нам произвольно задана. Форма V (х, х) однозначно опреде- определяется из условия B5), поскольку в данном случае матрица А не имеет нулевых и двух противоположных характеристических чисел. 31 ф. Р. Гантмахер
482 ПРОБЛЕМА РАУСА—ГУРБИЦА И СМЕЖНЫЕ ВОПРОСЫ ?ГЛ, XVI Теорема 3'. Для того чтобы все характеристические числа веще- вещественной матрицы A = \\aih\\\ имели отрицательные вещественные части, необходимо и достаточно, чтобы матричное уравнение A'V+VA^—E B6) имело в качестве решения V матрицу коэффициентов некоторой поло- положительно определенной квадратичной формы V (х, х) > 0. Из доказанной теоремы вытекает критерий для определения устой- устойчивости нелинейной системы по ее линейному приближению1). Пусть требуется доказать асимптотическую устойчивость нулевого решения нелинейной системы дифференциальных уравнений A) (стр. 419) в том случае, когда коэффициенты а{&(г, к= 1, 2, ..., п) в линейных членах правых частей уравнений образуют матрицу А = || Ац,. ||^, имеющую только характеристические числа с отрицательными вещественными час- частями. Тогда, определяя положительно определенную форму V(x, x) при помощи матричного уравнения B6) и вычисляя ее полную производную по времени в предположении, что х = (хи хг, ..., хп) есть решение системы A), будем иметь: dt V(x, я)= — xz, ..., где R(xu хг, ..., Хп)—ряд, содержащий члены третьего и более высоких измерений относительно хи х2, ..., хп. Поэтому в некоторой достаточно малой окрестности точки @, 0, ..., 0) для любого х=/=0 одновременно V(x, x)>0, -^V(x, * Согласно общему критерию устойчивости Ляпунова2) это и означает асимптотическую устойчивость нулевого решения системы дифференциаль- дифференциальных уравнений. Если из матричного уравнения B6) выразить элементы матрицы V через элементы матрицы А и полученные выражения подставить в нера- неравенства vH vu то мы получим неравенства, которым должны удовлетворять элементы матрицы А = atk ||" для того, чтобы все характеристические числа матри- матрицы имели отрицательные вещественные части. Однако в значительно более простом виде эти неравенства могут быть получены из критерия Рауса — Гурвица, которому посвящается следующий параграф. 1) См. [22], § 26; [38], стр. 113 и далее; [23], стр. 66 и далее. 2) См. [22], § 16; [38], стр. 19—21 и 31—33; [23], стр. 32—34.
6] ТЕОРЕМА РАУСА—ГУРВИЦА 483 Примечание. Теорема Ляпунова C) или C') непосредственно обобщается на случай произвольной комплексной матрицы А = = || щи ||". В этом случае квадратичные формы V (х, х) и W (х, х) заме- заменяются эрмитовыми п _ п V(X, Ж)= 2 "*ЬХ*ХЬ> W(X> ж)= 2 wihXtXh. i, ft=l 1, ft=l В соответствии с этим матричное уравнение B6) заменится уравнением A*V -\-VA=—E (A* = A'). § 6. Теорема Рауса — Гурвица В предыдущих параграфах был изложен непревзойденный по своей простоте метод Рауса для определения числа к корней в правой полу- полуплоскости вещественного многочлена, коэффициенты которого заданы как конкретные числа. Если же коэффициенты многочлена зависят от пара- параметров и требуется определить, при каких значениях параметров число к будет иметь то или другое значение и, в частности, значение 0 (область устойчивости!I), то желательно иметь конкретные выражения для вели- величин с0, ^о, • • • через коэффициенты данного многочлена. Разрешив эту задачу, мы получим метод определения числа к и, в частности, критерий устойчивости в том виде, в каком он был установлен Гурвицем [129]. Рассмотрим снова многочлен / (z) = aozn+ b^-1 + вцР* + btz*+ + ... (oo ф 0). Назовем матрицей Гурвица квадратную матрицу и-го порядка B7) bo do 0 0 0 0,1 h Щ 0 62 ... Vi a% . . . dn-i h ... bn-z gi ... пп-г b0 ... bn-3 Преобразуем эту матрицу, вычитая из второй, четвертой, ... соответ- соответственно первую, третью, ... строки, предварительно помноженные на ~2). On Получим матрицу Ьо 0 0 0 0 Со Ьо 0 0 bz ч Со Ьо • ¦ • &п-1 • • • сп-2 • • • V-2 ... Сп_3 • • • Ьп-3 1) Так именно и обстоит дело при проектировании новых механических или электрических систем регулирования. 2) Сначала рассматривается регулярный случай, когда Ьо ф 0, с0 ф 0, d0 ф 0,... 31*
484 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Здесь с0, си — —третья строка схемы Рауса, дополненная нулями (Сй = 0при *">[-?-]-i). Полученную матрицу снова преобразуем, вычитая из третьей, пятой, строки соответственно вторую, четвертую, строки, предва- предварительно помноженные на *о_. «0 ' ь0 0 0 0 0 0 h Со 0 0 0 0 Ъг Cj do Со 0 0 b3 .. с2 .. d, ... с± ... do... Co ... Продолжая этот процесс далее, мы придем в конце концов к тре- треугольной матрице и-го порядка 0 0 bx Co 0 bz ... Ci ... do ... которую назовем матрицей Рауса. Она получается из схемы Рауса [см. A5)] 1) отбрасыванием первой строки, 2) сдвигом строк вправо так, чтобы ия первые элементы пришлись на главную диагональ, и 3) попол- пополнением нулями до квадратной матрицы n-го порядка. Определение 2. Две матрицы А = || aih ||? и В = || bih||" назовем равносильными в том и только в том случае, если при любом р^п в первых р строках этих матриц соответствующие миноры р-ro порядка равны между собой: 1 2 ... р\в П 2...р\ liu i2, ..., ip = l, 2, ...,n,\ iz...ip) \h h--'ipl \ P = l, 2, ...,n /" Так как при вычитании из какой-либо строки матрицы какой-либо предыдущей строки, помноженной предварительно на произвольное число, миноры р-то порядка в первых р строках (р = 1, 2, ...,п) не меняют своей величины, то согласно определению 2 матрицы Гурвица и Рауса Н и R равносильны: я/1 2...р\ д/1 2...р\ Ik, h, ...,iP = l, 2, ..„„Л {iiif.ipl \hh---bl V р=1, 2, ...,п. / Равносильность матриц Н и R позволяет выразить все элементы матрицы R, т. е. элементы схемы Рауса, через миноры матрицы Гурвица Н и, следовательно, через коэффициенты данного многочлена. Действи-
§ 6] ТЕОРЕМА РАУСА—ГУРВИЦА 485 тельно, давая р в B8) последовательно значения 1, 2, 3, ..., получим: B9) 2 3 2 З 2 3 2 4 12 l 2 - boCodz, ... и т. д. Отсюда находим следующие выражения для элементов схемы Рауса: ¦СП) 'О') C0) Последовательные главные миноры матрицы /? обычно называются определителями Гурвица. Мы их будем обозначать через а0 ., А„ = Я 2.., 2.., а0 О О Ьо... ¦ «п-2 Замечание 1. Согласно формулам B9) Aj = b0, A2 = Ъосо, А3 = bocodo, ... C1) C2) Из А] Ф 0, ..., Ар =5^ 0 следует, что первые р из числа Ьо, с0, ... отличны от нуля и наоборот; в этом случае определены р подряд идущих строк схемы Рауса, начиная с третьей, и для них имеют место^ формулы C0). Замечание 2. Регулярный случай (все bo, Co, ... имеют смысл и не равны нулю) характеризуется неравенствами , ..., Апф0. Замечание 3. Определение элементов схемы Рауса при помощи формул C0) является более общим, нежели определение при помощи 1) Если коэффициенты многочлена / (z) заданы численно, то формулы C2) дают наиболее простой способ вычисления определителей Гурвица, сводя это вычисление к составлению схемы Рауса.
486 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI алгоритма Рауса. Так, например, если Ъо = Н I 1 = 0, то алгоритм Рауса нам не дает ничего, кроме первых двух строк, составленных из коэффи- коэффициентов данного многочлена. Однако, если при At = 0 остальные опреде- определители Д2, Д3, •.. отличны от нуля, мы при помощи формул C0), минуя строку из с, можем определить все последующие строки схемы Рауса. Согласно формулам C2) - Л Д2 -J Д3 ' Ai ' Аг ' " * * * и потому V(a0, b0, c0, .. .) = V (^а0, Аи —¦, .... -^-J = ii, A3, ... Поэтому теорема Рауса может быть сформулирована так: Теорема 4 (Рауса — Гурвица). Число к корней вещественного многочлена f(z) = atfzn-\-..., расположенных в правой полуплоскости, определяется формулой (o, А,-?.?,...,?) C3) или (что то же) k = V(a0, Аи Д„ ...) + F(l, Д2, Д4, ...). C3') Примечание. Приведенная формулировка теоремы Рауса— Гурвица предполагает, что имеет место регулярный случай В § 8 мы покажем, как пользоваться этой формулой в особых слу- случаях, когда некоторые из определителей Гурвица Дг- равны нулю. Рассмотрим теперь тот частный случай, когда все корни многочлена f(z) расположены в левой полуплоскости Re z<0. В этом случае согласно критерию Рауса все а0, b0, c0, d0, ... должны быть отличны от нуля и , одного знака. Так как здесь мы имеем дело с регулярным случаем, то получаем из C3) при А = 0 следующий критерий: Теорема 5 (Критерий Рауса—Гурвица). Для того чтобы у вещественного многочлена f (z) = aozn + ... (a0 Ф 0) все корни имели отри- отрицательные вещественные части, необходимо и достаточно, чтобы имели место неравенства „ . л л а0Дп>0 (при п нечетном), ) «оА1>О,Д2>О)«оД3>О,Д4>О,...) Д>0;п;ипчетном)/ } C4) Примечание. Если йо>О, то эти условия записываются так: Ai>0, Д2>0, ..., Дп>0. C5) Если принять обычные обозначения для коэффициентов многочлена / (z) = aozn —a1zn~1 + a2zn"a+ ••• +fln-iz + an. то при ао>О условия Рауса—Гурвица C5) записываются в виде следующих детерминантных
§ 6] ТЕОРЕМА РАУСА—ГУРВИЦА 487 неравенств: «1 «3 а0 аг ai a3 a5 CLq &2. ^4 0 a a» aj а3 а5 ... О по «2 Я4 . . . О О at а3 ... О О clq а2 ... О C5') Вещественный многочлен / (z) = o0z" + ..., коэффициенты которого удовлетворяют условиям C4), т. е. вещественный многочлен, у которого все корни имеют отрицательные вещественные части, обычно называют многочленом Гурвица. Отметим два замечательных свойства схемы Рауса: 1. Обозначим элементы р+1-й строки схемы Рауса через аро, ар1, арг, .-.; тогда ар;-=^ Гурвица, а (р, /=0, 1, ...). Здесь Д<Р>=Др=Я i\"pJ — определитель Л=Я ( . '"Р , Р . . ) при /> 1—«побочный» определитель Гурвица р-го порядка. Между элементами схемы Рауса имеет место основная зави- зависимость [см. формулы A3), A3') на стр. 473]: а0 ap+i.J+ap+2.j-i (р,/=0, 1, ...; аЛг=0, если к>п либо /<0). Элементы любой р-й строки схемы Payca получаются из элементов двух последую- последующих строк с помощью двух операций—умножения на отношение аро/ар+и о и сло- сложения. Поэтому (в регулярном случае!) элементы произвольной р-й строки схемы Рауса могут быть выражены с помощью операций сложения и умножения через элементы последних двух строк an_i, о и а„ о и через отношения —-— , ..., "~2'° ар+1,0 ап-1, О и представлены в виде 0i ap+l. Oi ap+l, 0 (p, /=0, 1, ...), C6) где q>pj (про, ар+1,о, ..., an0)—многочлены с целыми положительными коэффи- коэффициентами. С помощью формул C6) все элементы схемы Рауса и, в частности (при р=0, 1), коэффициенты исходного многочлена / (z) рационально выражаются (и притом с положительными коэффициентами) через элементы первого столбца схемы Рауса. Если выполняется критерий Рауса, т. е. все элементы первого столбца схемы Рауса положительны, то из формулы C6) непосредственно следует, что в этом случае все элементы схемы Рауса и, в частности, коэффициенты основного многочлена, положительны. Заметим еще, что, заменяя в формулах C6) величины apJ- через отношения д(р+я/д побочные определители Гурвица (д fo=\ ¦ > g0 = -j~- j . Так как эти две строки вместе с последующими образуют самостоя- самостоятельную схему Рауса, то элементы' (т-\-р-\-1)-й строки (в первона- первоначальной схеме) выражаются через элементы (та + 1)-й и (го+2)-й строк, /о, /i, ... и g0, gi, ...—по тем же формулам, по каким эле- элементы (р-f- 1)-й строки выражаются через элементы первых р /Ap_i, можно рационально (с положительными коэффициентами) выразить Г Д*р^ через основные.
488 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI двух строк а0, аи ••• и bo, i>i, ..., т. е., полагая будем иметь: 3= /о 0 0 h go /о gi ... к ••• Дго+p-i Sp_j C7) Определитель Гурвица Ат+р равен произведению первых т-\-р чисел в ряду Ьо, с0, ...: =ЬоСо • • • fogO ••• Но Поэтому имеет место следующее важное соотношение: ). C8) Формула C8) имеет место всегда, если только определены числа /0) /i, ... и go, gi, ..., т. е. при условии Дт-1 ф 0, Дт ф 0. Формулы C7) имеют смысл, если дополнительно к условиям Дт_1 Ф О, Дто gt О выполняется и условие ATO+p_j Ф 0. Из этого условия уже следует, что и знамена- знаменатель дроби, стоящей в правой части равенства C7), не равен нулю: Др_! ф 0. § 7. Формула Орландо При рассмотрении случаев, когда некоторые из определителей Гурвица равны нулю, нам понадобится следующая формула Орландо [137], выра- выражающая определитель An-i через старший коэффициент а0 и корни zu z2, .. ., zn многочлена /(zJ) м(м— 1) i.. .п \ 2 я"-1 C9) При п = 2 эта формула сводится к известной формуле для коэффи- коэффициента Ьо в квадратном уравнении ao2 b O Допустим теперь, что формула C9) справедлива для многочлена и-й степени / (z) = aozn + Ьо2" + • • •» и покажем, что она справедлива для многочлена {п-\-1)-к степени =- zn+1). + (b0 + ha0) zn + (Й1 + hb0) zn~l х) Здесь Др—минор р-то порядка, стоящий в левом верхнем углу матрицы Н. 2) При этом коэффициентами многочлена / (z) могут быть произвольные ком- комплексные числа.
$73 ФОРМУЛА ОРЛАНДО 489 Для этого составим вспомогательный определитель (п + 1)-го порядка b0 bi ... bn-i 1гп а0 [ = U при О Ьо ... Ъп-2 hn 2 О ао...ап-2 —hn~s 0 0. = 0 при Помножим первую строку D на а0 и прибавим к ней вторую, помно- помноженную на —Ъо, третью, помноженную на аи четвертую—на —6; и т. д. Тогда все элементы первой строки, кроме последнего, обратятся в нуль, а последний элемент будет равен f(h). Отсюда легко заключаем, что С другой стороны, прибавляя к каждой (кроме последней) строке определителя D последующую, помноженную на h, мы получим помно- помноженный на (— 1)п определитель Гурвица Д? п-го порядка для много- многочлена F (z): bo+hao bi +Л«1 ¦ ¦ - «о О О а0 Таким образом, Д* = /W (h) = aoAn-i Д (h - ?,) - Заменяя здесь Д„_1 на его выражение из C9) и полагая h= —2„+1, получаем: (м-Н)п 1...П+1 Д*=(-1) 2 а- Д (Zl+zh). ih Таким образом, методом математической индукции установлена спра- справедливость формулы Орландо для многочлена любой степени. Из формулы Орландо следует, что Д„_! = 0 тогда и только тогда, когда сумма двух корней многочлена /(z) равна нулю1). Так как An = cAn_j, где с—свободный член многочлена f(z)(c = = (— l^aozfo ... Zn), то из C9) следует: п(п+1) 1.. .п D0) Последняя формула показывает, что Дп обращается в нуль тогда и только тогда, когда у f(z) существует такой корень z, что и —z является корнем. *) В частности, An_i=0, когда /(г) имеет хотя бы одну пару сопряженных чисто мнимых корней или кратный нулевой корень.
490 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI § 8. Особые случаи в теореме Рауса — Гурвица При рассмотрении особых случаев, когда некоторые из определителей Гурвица равны нулю, мы можем предполагать, что Дп ф 0 (и, следовательно, Д,^ Ф 0). Действительно, если Д„=0, то, как было выяснено в конце предыдущего параграфа, вещественный многочлен /(z) имеет такой корень z', для которого —z' также является корнем /(z). Если положить /(z)=/'i(z)+i;'2B)» где то из равенств /(z')=/(—z')=0 можно заключить, что F^ (z')=Fz (z')=0. Следо- Следовательно, z' будет корнем наибольшего общего делителя d (z) многочленов Fi (z) n,F2(z). Полагая / (z)=d(z)/* (z), мы сведем задачу Рауса—Гурвица для / (z) к'такой же задаче для многочлена /* (z), для которого уже последний определитель Гурвица отличен от нуля1). 1. Рассмотрим сначала тот случай, когда = ...=Др=О, Ар+1ф0, .. О &! Из Ai=0 следует: Ъ0=0; из Дг= тогда автоматически Из а0 <jj ., КФО. D1) —а0Ь1=0 вытекает: Ь4=0. Но А4= О &! Ь2 flQ Л^ ^2 0 0 b! О 0 bo Ья аО а1 а2 аЗ О О О Ъ2 О Gq Gj Й2 следует: b2=0t а тогда Д5 =—agb|=O и т. д. Приведенные рассуждения показывают, что в D1) всегда р—нечетное число: р=2/г—1. При этом fco=fc1=b2=...=bft-i=O, б^Ои2) D2) !) В случае, когда An=An_1==...=Am+1=0, &тф0, ^ можно в явном виде записать уравнения d (z) =0. Действительно, функции Fi (z) и /"г (г) связаны с функциями /i (ш) и /г (ш) [см. формулу (9) на стр. 472] соот- соотношениями Fi (г) = inh (-!«), ^2 (г) = P-i/a (- iz). Поэтому уравнение d(z)=O совпадает с уравнением /m+i (—?z)=0, где многочлен /т+1(ш)—наибольший общий делитель многочленов /i(z) и /2(z)—определяется последней строкой схемы Рауса. Следовательно, в силу формул C1) уравнение d (z) =0 может быть записано в виде г 71—ТП-1 3=0 где =н(, "' . / /==^'^> •••)—побочные определители Гурвица. 2) Из D2) следует, что при h нечетном signAp+2=(—1) 2 signaOi а при Учет- Учетном sign Ap+i=(—IJ •
§ 8] ОСОБЫЕ СЛУЧАИ В ТЕОРЕМЕ РАУС л—ГУРВИЦА 491 Проварьируем, т. е. изменим немного, коэффициенты Ьо. Ь±, ..., b^-i так, чтобы при новых проварьированных значениях b*, b*, ..., Ь^_х все определители Гурвица А?, Д*э .... An стали отличными от нуля и чтобы при этом определители ¦Др+ii • • •. An сохранили свои прежние знаки. Мы будем считать Ьо, Ьг, ..., Ьд+1 «малыми» величинами разного порядка «малости», а именно мы примем, что каждое Ь/_1 по абсолютной величине «значительно» меньше bj (/=1, 2, ...,h; Ъп=Ь^). Последнее означает, что при вычислении знака целого алгебраического выражения относительно Ъ* мы можем пренебрегать членами, в которых некоторые Ьг имеют индекс < / по сравнению с членами, где все bi имеют индекс !> /. После этого мы легко найдем «знакоопределяющие» члены в А*, А%, ..., Ap(p=2h—II): **.*•* i * 1 д * i *2 , . * 2 . *2 , A6 А = йЬ+ А =йЬ + ^==й6 + .* 2ь*8_ь л* и т. д.; вообще (/=1.2, ...,h-i), (/=0, 1 h — 1). D3) Выберем Ьр, Ь|, ..., Ь|л—i положительными; тогда знаки Д| определятся из фор- формулы signA?=(-l) 2 signai (/=[-2-]« ' = *• 2' ¦•- р) ¦ D4> При любом малом варьировании коэффициентов многочлена число к остается неизменным, поскольку многочлен / (г) не имеет корней на мнимой оси. Поэтому, исходя из D4), мы определяем число корней в правой полуплоскости по формуле .* Д! Др+1 Ар+2 \ . „ (АР+2 Д„ \ //Г. Элементарный подсчет, проведенный на основании формул D2) и D4), показы- показывает, что / .* Д| й0' А!' ДГ р+1 Заметим, что величина, стоящая в левой части равенства D6), не зависит от способа варьирования коэффициентов и при любых малых варьированиях сохра- сохраняет одно и то же значение. Это следует из формулы D5), поскольку к не меняет своего значения при малом варьировании коэффициентов. 2. Пусть теперь при s > 0 Д 4= =Д =0 D7) а. все остальные определители Гурвица отличны от нуля. Обозначим через а0, а^ ... и 1>о. ^1. • ¦ • элементы {s + 1)-й и (s-f 2)-й строки в схеме Рауса ( 'ао=——?—, Ь~о= ^+1 ) . Соответствующие определители Гурвица V. A«-i As у *) По существу аналогичные члены уже были вычислены выше для А2, ..., Ар.
490 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI § 8. Особые случаи в теореме Рауса — Гурвица При рассмотрении особых случаев, когда некоторые из определителей Гурвица равны нулю, мы можем предполагать, что Ап ф 0 (и, следовательно, An_t ф 0). Действительно, если Д„=0, то, как было выяснено в конце предыдущего параграфа, вещественный многочлен /(z) имеет такой корень г', для которого —z' также является корнем /(z). Если положить f (z)=Fi(z)-\-F2(?)t где то из равенств / (z')=/ (—z')=0 можно заключить, что Fi (z')=F2 (z')=0. Следо- Следовательно, z' будет корнем наибольшего общего делителя d (z) многочленов Fi (z) и.-^гС2)- Полагая / (z)=d(z)/*(z), мы сведем задачу Рауса—Гурвица для / (z) к'такой же задаче для многочлена /* (z), для которого уже последний определитель Гурвица отличен от нуля1). 1. Рассмотрим сначала тот случай, когда Из Ai=O следует: Ь0=0; из А2= тогда автоматически О bi Ъ2 Дд = G.Q U^ 0-2 О fci ... AngfcO. D1) = —aobi=O вытекает: bt=0. Но 0 0 Из ^4 = О О Ь2 Ь3 до oj а2 аз О О О Ь2 О ?Eq ^i ?E2 следует: Ь2=0, а тогда А5 =—а§Ь|=О и т. д. Приведенные рассуждения показывают, что в D1) всегда р—нечетное число: р=2/г—1. При этом fco=fc1=fc2=...=fcft_1=O, 6ft ф 0 и 2) D2) !) В случае, когда An=An-i=...=Am+1=O, Атф0, Am_j^O, ..., А1=5ь0, можно в явном виде записать уравнения d (z) =0. Действительно, функции F± (z) и Fz (z) связаны с функциями /i (ш) и /2 (ш) [см. формулу (9) на стр. 472] соот- соотношениями Fi W=inh (-iz), F2 (z)=P-1/2 (-iz). Поэтому уравнение d(z)=O совпадает с уравнением /m+i (—?z)=0, где многочлен /m+i(b>)—наибольший общий делитель многочленов /i (z) и /2 (z)—определяется последней строкой схемы Рауса. Следовательно, в силу формул C1) уравнение d(z)=O может быть записано в виде где H( . "' . | •) (/=0,1, ...)—побочные определители Гурвица. ft+i 2) Из D2) следует, что при h нечетном sign Ар+2=(—1) 2 signao» а при h чет- ном signAp+1=(—1J.
§ 9] МЕТОД КВАДРАТИЧНЫХ ФОРМ 493 в которой при подсчете величины V для каждой группы подряд идущих р нулевых определителей (р — всегда нечетное число\) As+1=...=As+p=0 ¦следует положить: W _g«L_ , "w , ..., ^- \=h+ о ' E0) еде 9=2/i—l и e=slgn ¦ - - ^ § 9. Метод квадратичных форм. Определение числа различных вещественных корней многочлена Раус получил свой алгоритм, применяя теорему Штурма к вычисле- вычислению индекса Коши правильной рациональной дроби специального типа [см. формулу A1) на стр. 473]. У этой дроби из двух многочленов— числителя и знаменателя—один содержит только четные, а другой только нечетные степени аргумента z. В настоящем параграфе и в последующих параграфах мы изложим более глубокий и более перспективный метод квадратичных форм Эрмита в применении к проблеме Рауса—Гурвица. При помощи этого метода мы получим выражение для индекса произвольной рациональной дроби через коэффициенты числителя и знаменателя. Метод квадратичных форм позволяет применить к проблеме Рауса—Гурвица результаты тонких исследований Фробениуса по теории ганкелевых форм (гл. X, § 10) и уста- установить тесную связь некоторых замечательных теорем П. Л. Чебышева и А. А. Маркова с задачей устойчивости. Мы познакомим читателя с методом квадратичных форм сначала на сравнительно простой задаче определения числа различных веществен- вещественных корней многочлена. При решении этой задачи мы можем ограничиться случаем, когда f(z)— вещественный многочлен. Действительно, пусть дан комплексный многочлен / (z) = и (z) -f- iv (z) [u(z) и v(z)—вещественные многочлены]. Каждый вещественный корень многочлена /(z) обращает в нуль одновре- одновременно и u(z) и v(z). Поэтому комплексный многочлен /(z) имеет те же вещественные корни, что и вещественный многочлен d(z), являющийся наибольшим общим делителем многочленов и (z) и v (z). Итак, пусть f(z)—вещественный многочлен с различными корнями «1» «2» •••» Од соответственно кратностей щ, п2, ..., nq: ... (z—ag) 3[oo9^0; af^aft при j^=fc (i, k = l,2,...,q)]. Введем в рассмотрение суммы Ньютона 9 г) При s = l отношение s следует заменить на Aj, а при s=0—на а0.
494 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI При помощи этих сумм составим ганкелеву форму п-1 Sn (ж, Ж) = 2 Si+hXtXk, i, fe=0 где п—любое целое число >д. Тогда имеет место следующая Теорема 6. Число всех различных корней многочлена f(z) равно рангу, а число всех различных вещественных корней равно сигнатуре формы Sn (ж, х). Доказательство. Из определения формыSn(x, ж) непосредственно вытекает следующее ее представление: g Sn (ж, х) = 2 rij (х0 + ajXi + щхг + ... + a"~ixn-iJ.  E1) Здесь каждому корню а,- многочлена f(z) соответствует квадрат линейной формы Zj — xo + aJXi+...+aj~ixn-.i (/=1,2, ...,д). Формы Zu Z2, ..., Zq линейно независимы между собой, так как коэффициенты этих линейных форм образуют матрицу Вандермонда |] а,-1|, ранг которой равен числу различных а,-, т. е. д. Следовательно (см. стр. 269), ранг г формы Sn(ж, ж) равен д. В представлении E1) каждому вещественному корню a.j отвечает положительный квадрат. Каждой паре комплексно сопряженных корней a,j и а/ отвечают две комплексно сопряженные формы: соответствующие слагаемые в E1) в сумме дают один положительный и один отрицательный квадрат: n}Z) + njZ) = 2n}P)—2rijQ). Отсюда легко усмотретьх), что сигнатура формы Sn (ж, х), т. е. разность между числом положительных и числом отрицательных квадратов, равна числу различных вещественных a,j. Теорема доказана. Из доказанной теоремы вытекает, что все формы Sn{x, x) (п = д имеет один и тот же ране и одну и ту же сигнатуру. Применяя теорему 6 к определению числа различных вещественных корней, возьмем в качестве п степень многочлена f(z). Используя уста- установленное в главе X (стр. 275) правило определения сигнатуры квадра- квадратичной формы, мы получаем Следствие. Число различных вещественных корней вещественного многочлена f (z) равно избытку числа постоянств знака над числом пере- перемен знака в ряду чисел So Si . . . Sr_i 50 Si 51 S2 Si S2 —2 E2) J) Квадратичная форма Sn (x, x) представлена в виде суммы (алгебраической) 9 квадратов вещественных форм Zj (для вещественных Kj), Pj и Qj (для комплекс- комплексных Xj). Эти формы независимы, так как число q равняется рангу г формы Sn (ж, х).
§ 10] БЕСКОНЕЧНЫЕ ГАНКЕЛЕВЫ МАТРИЦЫ КОНЕЧНОГО РАНГА 495 где sF (p = 0, 1, 2, ...)—суммы Ньютона для многочлена f(z), a r—ранг п-1 ганкелевой формы Sn(x,x)— 2 st+h^i^h [n—степень многочлена f(z)]. Сформулированное таким образом правило для определения числа различных вещественных корней непосредственно применимо лишь в слу- случае, когда все числа в ряду E2) отличны от нуля. Однако, поскольку здесь идет речь о вычислении сигнатуры ганкелевой квадратичной формы, то на основе результатов главы X, § 10 это правило с надлежащими уточнениями применяется в самом общем случае (более подробно об этом см. § 11 этой главы). Число различных вещественных корней вещественного многочлена / (z) равно индексу /JT^ .,!¦ (см. стр. 470). Поэтому следствие из теоремы 6 1D дает нам формулу s0 s4 ... sr_i Sl = r-2F Si S2 Sr-1 В § 11 мы установим аналогичную формулу для индекса произволь- произвольной рациональной дроби. Необходимые для этого сведения о бесконечных ганке левых матрицах будут даны в следующем параграфе. § 10. Бесконечные ганкелевы матрицы конечного ранга 1. Пусть дана последовательность комплексных чисел So, Si, S2, ... Эта последовательность чисел определяет бесконечную симметрическую матрицу 50 Sj S2 . . . 51 S2 S3 ... 52 S3 S4 . . . которую называют обычно ганкелевой. Наряду с бесконечными ганкеле- выми матрицами рассматриваются конечные ганкелевы матрицы Sn = = ||Sj+ft||o~I и связанные с ними ганкелевы формы n-i Sn(x, х) — 2 Sj+ft^Xft. i, fe=0 Последовательные главные миноры матрицы <S" будем обозначать через Du D2, D3, ...: Бесконечные матрицы могут быть конечного и бесконечного ранга. В последнем случае в этих матрицах существуют отличные от нуля миноры сколь угодно большого порядка. Следующая теорема дает необходимое и достаточное условие, которому должна удовлетворять последовательность чисел s0, Si, s2, ... для того, чтобы порождаемая ею бесконечная ганке- лева матрица S = \\ si+k ||o° имела конечный ранг.
496 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕШНЫЕ ВОПРОСЫ [ГЛ. XVI Теорема 7. Бесконечная матрица S= ||$г+лЦо" имеет конечный ранг г тогда и только тогда, когда существует г чисел аи а2, . -., аР таких, что S ggg ( •••). E3) g=l и г есть наименьшее число, обладающее этим свойством. Доказательство. Если матрица <S'=||Si+ft||o> имеет конечный ранг г, то первые г-\-1 строк Tit Г2, , Гг+1 этой матрицы линейно зависимы. Поэтому существует число h <С г такое, что строки Г4, Г2, ..., Г^ линейно независимы, а строка Гл+i есть линейная комбинация этих строк: 1 Zj g=i Рассмотрим строки Гд+1, Гд+2) ..., Гд+л+1, где q—любое целое неотри- неотрицательное число. Из структуры матрицы S непосредственно видно, что строки Гд+1, Гд+2, ..., Гд+л+1 получаются из строк Г1? Г2, ..., Гл+1 «укорочением», отбрасыванием элементов, стоящих в первых q столбцах. Поэтому h Гд+л+i = S Ogfg+ft-g+t (д = 0, 1, 2, ...). g=i Таким образом, в матрице S любая строка, начиная с (й + 1)-й, выра- выражается линейно через h предыдущих и, следовательно, выражается линейно через h линейно независимых первых строк. Отсюда следует, что для h матрицы S ранг г = йх). Линейная зависимость Гд+л+1= 2 UgTq+h-g+i g=i после замены h на г в более подробной записи дает E3). Обратно, если выполняется условие E3), то в матрице S любая строка {столбец) является линейной комбинацией первых г строк (столбцов). Поэтому все миноры матрицы S, порядок которых >г, равны нулю, и матрица S имеет конечный ранг <: г. Но этот ранг не может быть <С г, так как тогда, как было уже показано, имели бы место соотношения ви- вида E3) при меньшем значении г, а это противоречит условию 2). Таким образом, теорема доказана полностью. Следствие. Если бесконечная ганкелева матрица S = ||si+h|lo° имеет конечный ранг г, то Действительно, из соотношений E3) следует, что любая строка (стол- (столбец) матрицы S есть линейная комбинация первых г строк (столбцов). Поэтому любой минор r-го порядка матрицы S может быть представлен в виде aDr, где а—некоторое число. Отсюда следует неравенство D0 х) Положение «число линейно независимых строк в прямоугольной матрице равно рангу этой матрицы» справедливо не только длн конечных, но и для беско- бесконечных строк.
§ 10] БЕСКОНЕЧНЫЕ ГАНКЕЛЕВЫ МАТРИЦЫ КОНЕЧНОГО РАНГА 497 Примечание. Для конечных ганкелевых матриц ранга г нера- n n i Sz при $() = $! = U, s2=5^=U имеет ранг 1, в то время как Vt = s0~U. 2. Выясним замечательные взаимные связи между бесконечными ган- келевыми матрицами и рациональным функциями. Пусть дана правильная рациональная дробная функция R(z nW- h(z) ' где h (z) - aozm + ... + am {a0 ф 0), g (z) = V" + b2zm~* +...+bm. Напишем разложение R{z) в степенной ряд по отрицательным сте- степеням z: г 44- Если все полюсы функции R{z), т. е. все значения z, при которых R(z) обращается в бесконечность, лежат в круге | z | <; а, то ряд, стоящий в правой части разложения, сходится при | z \ > а. Обе части последнего равенства помножим на знаменатель h(z): Приравнивая между собой коэффициенты при одинаковых степенях z в обеих частях этого тождества, получим следующую систему соотношений: aoso = bt, E4) ...+amsq-m = 0 (q = m,m + l,...). E4') Полагая ag=—%L (g=l,2, ...,m), мы можем соотношения E4') записать в виде E3) (при г — т). Следова- Следовательно, согласно теореме 7 построенная при помощи коэффициентов s0, st, s2, ... бесконечная ганкелева матрица имеет конечный ранг (<!тп). Обратно, если матрица S = \\ si+h \\^ имеет конечный ранг г, то имеют место соотношения E3), которые могут быть переписаны в виде E4') (при тга = г). Тогда, определяя числа bu b2, ...,bm равенствами E4), будем иметь разложение b^-i+... + bm =^о., _?i_j- EЛ'Л a0zm + «l2m~1+---+am 2 z2 • ¦•• ' V04'' 32 ф. р. Гантмахер
498 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Наименьшая степень знаменателя т, при которой имеет место это разложение, совпадает с наименьшим числом т, при котором имеют место соотношения E3). По теореме 7 это наименьшее значение т равно рангу матрицы S = || Sj+fe ||". При этом значении т рациональная дробь, стоящая в левой части равенства E4"), является несократимой. Таким образом, нами доказана следующая теорема: Теорема 8. Матрица S = \\si+i1\\^' имеет конечный ранг в том и только в том случае, когда сумма ряда есть рациональная функция переменной z. В этом случае ранг матри- матрицы S совпадает с числом полюсов функции R (z), считая каждый полюс столько раз, какова его кратность. § 11. Определение индекса произвольной рациональной дроби через коэффициенты числителя и знаменателя 1. Пусть дана произвольная рациональная функция. Напишем ее разложение в ряд по нисходящим степеням z1): + -^ + ^-|-... E5) Последовательность коэффициентов при отрицательных степенях z Sq, Si, sz, ... определяет бесконечную ганкелеву матрицу S = || sl+k ||™. Таким образом, устанавливается соответствие R (z) ~ S. Очевидно, что двум рациональным функциям, разность между которыми есть целая функция, отвечает одна и та же матрица S. Однако не всякая матрица S = || si+h ИГ соответствует рациональной функции. В предыдущем параграфе было установлено, что матрица S тогда и только тогда соответ- соответствует рациональной функции, когда эта бесконечная матрица имеет конеч- конечный ранг. Этот ранг равен числу полюсов (с учетом кратностей) функции R (z), т. е. равен степени знаменателя / (z) в несократимой дроби 8,, =R(z). С помощью разложения E5) устанавливается взаимно одно- / (z) значное соответствие между правильными рациональными функциями R (z) и ганкелевыми матрицами S — \\ si+k ||Г конечного ранга. Отметим некоторые свойства соответствия: Iе Если Ri (z) — Si, i?2 (z) ~ S2, то при любых числах clf c2 В дальнейшем нам придется встретиться со случаем, когда коэффи- коэффициенты числителя и знаменателя R (z) будут целыми рациональными функциями параметра а; тогда и R будет рациональной функцией от z и а. Из разложения E4) следует, что в этом случае и числа s0, s4, s2) ..., *) Ряд E5) сходится вне любого круга (с центром в точке z = 0), содержащего все полюсы функции R (z).
§ Hi ОПРЕДЕЛЕНИЕ ИНДЕКСА ПРОИЗВОЛЬНОЙ РАЦИОНАЛЬНОЙ ДРОБИ 499 т. е. элементы матрицы S, будут рационально зависеть от а. Дифференцируя по а почленно разложение E5), получим: 2° Если R (z, a)~S (а), то ^-^~ *). v ' v ' да да ' 2. Напишем разложение R (z) на простейшие дроби: -Ь^Н-...+ ^Л, E6) где Q(z)—многочлен, и покажем, как по числам а и А построить матри- матрицу S, соответствующую рациональной функции R (z). Для этого рассмотрим сначала простейшую рациональную дробь z—a ZA Ей отвечает матрица Соответствующая этой матрице форма San(x, x) имеет вид я-1 С /-v. ™\ V r,i- i, fe=0 Если то в силу 1° соответствующая матрица S определится по формуле %iit 3=1 J 3=1 а соответствующие квадратичные формы имеют вид Sn (х, х) = 2 ^(i) (a*, + ед + ... + Г ) 3=1 Для того чтобы перейти к общему случаю E6), мы предварительно h — 1 раз продифференцируем почленно соотношение Получим согласно 1° и 2°2): i+feft+1iir <Cfci=0 при Поэтому, пользуясь снова правилом 1°, в общем случае, когда для R (z) имеет место разложение E6), находим: R (z) ~ S = ? (^AЛ + 4« -^ + • • • + (^ту| 4? ^) *.,. E7) *) Если о=|| sj+ft ||q , то = 2) Здесь и ниже С1^ означает число сочетаний из d no h. 32*
500 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Выполняя дифференцирование, получим: 5 = 11 У A(j)ai+h + A(j)C* ai+h~l 4- + A<-j).CV-J~ia-+h~Vj+i ||°° E7') || я-1 Соответствующая ганкелева форма Sn (х, х) = 2 si+h%i%h будет равна i fe0 X (ж0 + ар! + ... + аГ Ч-iI. E7") 3. Теперь мы имеем возможность сформулировать и доказать основную теорему1): Теорема 9. Если R{z)~S и т — ранг матрицы S2), то индекс Коми I't'ZR (z) равен сигнатуре3) формы Sn(x, х) при любом Доказательство. Пусть имеет место разложение E6). Тогда согласно E7) 53 53 3=1 где каждое слагаемое имеет вид E8) и Sn (ж, ж) = 2 Та (х, х) = 2 Та (х, х)+ S [Уа, («, ж) + 71- (ж, х)]. j=l а^вещ. а^-компл. •< Согласно теореме 8 ранг матрицы Та. и, следовательно, ранг формы Та (ж, ж) равен \j(j=l, 2, ..., q), а ранг 6"п(ж, ж) равен m=^l\J. j=i Но если ранг суммы нескольких вещественных квадратичных форм равен сумме рангов слагаемых форм, то такое же соотношение имеет место и для сигнатур: o[Sn(x,x)]= 2 а[Г„(ж, ж)]+ 2 о[Та(х,х) + Та.{х,х)]. E9) а^-вещ. а,-компл. J Рассмотрим раздельно два случая: 1) а вещественно. При любой вариации параметров Аи А2, ..., Av_t и а в —+/ \+-П—^Ч г—а ' (z—аJ (г—a)v F0) !) Эта теорема была доказана Эрмитом в 1856 г. для простейшего случая, когда R (г) не имеет кратных полюсов [195]. В общем случае эта теорема была доказана Гурвицем [195] (см. также [16], стр. 17—19). Приведенное в тексте доказательство отличается от доказательства Гурвица. 2) Как мы уже отмечали, m равно степени знаменателя в несократимом пред- представлении рациональной дроби R (z) (см. теорему 8 на стр. 498). 3) Сигнатуру формы Sn (х, х) будем обозначать через a [Sn (x, x)\.
§ 11] ОПРЕДЕЛЕНИЕ ИНДЕКСА ПРОИЗВОЛЬНОЙ РАЦИОНАЛЬНОЙ ДРОБИ 501 ранг соответствующей матрицы Та будет оставаться неизменным ( = v); следовательно, будет оставаться неизменной и сигнатура формы Та (ж, х) (см. стр. 280). Поэтому а [Та (х, х)\ не изменится, если мы в E9) и F0) положим: А1 = ... = Av-i = 0ин = 0, т. е. вместо Та возьмем матрицу v-1 -1)! да? 0 0...0 Av 0 0... 0 .'.'." 6 • ' . ' ¦ ' а; .' .' О ' . ' о ' Соответствующая квадратичная форма равна при v = Av • • • + xs_2xs) -f x2s_t] при v = 2s— 1 ~~ ' ' ' ''" *" Но сигнатура верхней формы всегда равна нулю, а сигнатура нижней формы равна sign^v1). Таким образом, если а вещественно, то о[Та(х, х)^{ s. при v четном, при v нечетном. F1) 2) a—комплексное число. Пусть V V Та (х, х) = 2 (Ph + iQhf, T-a (x, x) = 2 (Pk - iQhf, где P^ Qh (&=1, 2, ..., v) — вещественные линейные формы переменных ж0, жь ..., жп-!. Тогда Та (х, х) + Т- (х, х) = 2 2 К ~ 2 2 <?!• F2) Так как ранг этой квадратичной формы равен 2v, то Pk, Qk (к = 1, 2, ..., v) линейно независимы, и потому согласно F2) при невещественном а Из E9), F1) и F3) вытекает: o[Sn(x,x)]= 2 увещ. \ ечетно/ \v нечетно г) Каждое произведение xoxv_1, x±xv_2, ... можно заменить соответственно на разности квадратов (^J(J (d)"(^\ Все получающиеся при этом квадраты независимы между собой. ¦
502 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Но на стр. 470 было выяснено, что сумма, стоящая в правой части этого равенства, равна lt™R(z). Таким образом, теорема доказана. Из доказанной теоремы вытекает: Следствие 1. Если R(z) — S = ||st+h||Г и т — ранг матрицы S, я-1 то все квадратичные формы Sn(x,x) = 2 г, fe=0 (тг = тга, т-{-1, ...) имеют одну и ту же сигнатуру. В главе X, § 10 (стр. 305, 306) было установлено правило вычисле- вычисления сигнатуры ганкелевой квадратичной формы, причем исследования Фробениуса дали возможность сформулировать правило с охватом всех особых случаев. Согласно доказанной теореме этим правилом можно поль- пользоваться для вычисления индекса Ковш. Таким образом, получаем Следствие 2. Индекс произвольной рациональной функции R(z), которой соответствует матрица S = || Si+k ||~ ранга т, определяется по формуле I±ZR (z) = m-2V(I, Du D2, ..., Dm), F4) где 50 Si 51 S2 Sf f-i Sf S2f-2 {f =1,2, ...,m); F5) если среди определителей Du D2, ..., Dm имеется группа подряд идущих определителей, равных нулю1) то при вычислении V(D^, Dh+i, ..., Z?h+p+i) можно принять: i(i-i) signDh+j = ( — 1) 2 signZ)h 0 = 1, 2, ..., p), что дает: V (Dh, Dh+i, ¦ • ¦ > ^ft+y+i) = p~— при р нечетном, —e при р четном, e = ( — I)'5 sign F6) Для того чтобы выразить индекс рациональной функции через коэф- коэффициенты числителя и знаменателя, нам понадобятся некоторые вспомога- вспомогательные соотношения. Прежде всего всегда можно представить R(z) в виде2) ?L, Г) ?±i /l+p-Ы 2 1) При этом всегда Dm ф 0 (стр. 496) и при р нечетном sign———=(—1) (стр. 309). 2) У пас нет необходимости заменять R (z) правильной рациональной дробью. Для дальнейшего достаточно, чтобы степень g (z) не превосходила степени h (г).
1 iJ ОПРЕДЕЛЕНИЕ ИНДЕКСА ПРОИЗВОЛЬНОЙ РАЦИОНАЛЬНОЙ ДРОБИ 503 где Q(z), g(z), k(z)—многочлены, причем h (z) = aoz™ + fliz + ... + am (во ф 0), g (z) = Ърт + Очевидно, + • • • + bm. Пусть h (Z) Тогда, освобождаясь здесь от знаменателя и после этого приравнивая друг другу коэффициенты при одинаковых степенях z в левой и правой частях равенства, получаем: s_i — b0, F7) ams-l — a0St + diSt-i + ...+ OmSt-m = 0 (t = ТП, Ш -f 1, . . . ). Пользуясь соотношениями F7), находим выражение для следующего определителя 2/т-го порядка, в котором кладем й; = 0, bj — O при / а0 а1 а2 • • • b0 Ьг b2 ... 0 a0 di ... 0 b0 bt ... 1 0 0 ...0 s2p-2 P(p-l) =(-1) sp-2 0 1 0 ...0 0 S-i So . • . «2 s2p-2 S2p-3 0 а0 0 0 а2р-2 а2р-з 0 0 0 ... а0 ! Sp_i Sj Si . . . S p S2p-2 F8) Введем сокращенное обозначение 0 «o • • • й2р-2 О Ьо ... &2p-2 , 2, j=zbj = O при . F9) Тогда формула F8) запишется так: Cp=l,2, ...). F8') В силу этой формулы следствие 2 на стр. 502 приводит нас к следующей теореме:
504 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. X"VI Теорема 10. Если Угт^О1), то G0) где V2p(/>=1, 2, ...,пг) определяется формулой F9); если при этом имеются подряд идущие нулевые определители то в формуле G0) при подсчете V (Vzft, V2ft+2> • • •. ^гы-гр+г) следует поло ¦ экиты sign Vsh+zj = (— 1) 2 sign V27, (/ = 1,2, ..., р), или, что то же2), р+1 ?-^— при р нечетном, ;i • ¦ ч V27i+2p+2) = ' р v Р+1 — 6 , ,.; . v2ft+2p+2 *L±-2 при Р четном, е = ( — IJ sign—^ Замечание. Если V2m=0, тге. е. дробь, стоящая под знаком индекса в фор- формуле G0), сократима, то формулу G0) следует заменить формулой -i+ ... +am ~Г еде г—число полюсов (с учетом кратнсстей) рациональной дроби, стоящей под зна- знаком индекса (т. е. г — степень знаменателя после сокращения дроби). Здесь V2P -ф- 0. Действительно, если V2m=0, то интересующий пас индекс равен r-2F(l, Du Dz, ...,DT), так как число г является рангом соответствующей^матрицы iS"=|| «j+ft ||^°. Но равен- равенство F8') имеет формальный характер и оно справедливо и для сократимой дроби 3). Поэтому F(l, Dit DZ,..., DT) = V(i, V2, V4 V2r). и мы приходим к формуле G0')- Формула G0') дает возможность выразить индекс любой рациональной дроби, у которой степень числителя не превышает степени знаменателя, через коэффи- коэффициенты числителя и знаменателя. § 12. Второе доказательство теоремы Рауса—Гурвица В § 6 мы доказали теорему Рауса—Гурвица, опираясь на теорему Штурма и алгоритм Рауса. В этом параграфе мы дадим доказательство теоремы Рауса — Гурвица, основанное на теореме 10 § 11 и на свойствах индексов Коши. !) Условие V2nt ф 0 означает, что Dm ф 0 и что, следовательно, дробь, стоящая в G0) под знаком индекса, несократима. +1 ov „ v2ft+2p+2 . J-h+p+\ . ,,2 / й) При р нечетном —= =sign—jr —(—1) (см. сноску1) на стр. 502. 3) Из равенства F8') следует, что значения Vzp определяются рациональной дробью R (z) (точнее, ее правильной частью), а не числителем и знаменателем в отдельности. Поэтому при сокращении дроби g (z)/h (z) меняются элементы в каждом определителе V2p, а величина его остается неизменной.
§ 12] ВТОРОЕ ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ РАУСА—ГУРВИЦА 505 Отметим некоторые свойства индексов Коши, которые нам понадо- понадобятся в дальнейшем. Г faR(x)=-KR(xI). ( 0 z)i?(a;) = signi?1(a;)/oi?(a;), если ^(ж)^ внутри (a, b). 3°. Если а<с<Ь, то ilfi (ж) = IcaR (ж) + IbcR(х) + т]с, где т]в = 0, если /? (с) — конечная величина, и г\с—+1, если в точке с функция R (х) обращается в бесконечность; при этом г\с = +1 соответствует пере- переходу в точке с от —со к -|-со (при возрастании х), а %== —1 — пере- переходу от + °° к — °° • 4° Ясли R (— ж) = — R (х), то I4aR (х) = I«R (x). Если R( — x) = = R{x), то Il.aR(x)=—I«R{x). 5° IaR (ж) -f-la p ч = еь"~Е°, г9е ео — знак i?(a;) внутри (a, b) вблизи К (х) Л а, еь—знак R (х) внутри (а, Ь) вблизи Ъ. Первые четыре свойства непосредственно следуют из определения индекса Коши (см. § 2). Свойство 5° вытекает из того, что сумма индексов IaR (х) 4- 1ьа . . равна разности щ — га2, где щ — число перемен знака R (х) с переходом от отрицательных значений к положительным при изменении ж от а до Ъ, а п2 — число перемен знака R (ж) с переходом от положитель- положительных к отрицательным значениям. Рассмотрим вещественный многочлен2) / (z) = aozn + а±гп-г + а^п~2 + - • • + вп-iZ + ап (а0 > 0). Мы его можем представить в виде где Введем обозначение В § 3 мы показали [см. B0) на стр. 475], что Q = n — 2k — s, G2) где к—число корней многочлена f(z) с положительными вещественными частями, a s — число корней f(z), расположенных на мнимой оси. Преобразуем выражение G1) для q. Рассмотрим сначала случай четного п. Пусть п = 2т. Тогда h (и) = афт + a&m-i +...+an, g{u) = aju™-1 + аъит-ъ + ... + о»-! • 1) Здесь п далее нижний предел при индексе может равняться —со, а верх- верхний предел +со. 2) Здесь мы, в отличие от § 3, возвращаемся к обычным обозначениям для коэффициентов многочлена.
506 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Пользуясь свойствами 1°—4° и полагая т)=±1, если соответственно lira ° . * = ±'оо и т) = 0 в остальных случаях, будем иметь: „__о " (м) _ Г+°° g (M) H-oo "g(") ~7-°° Й(и) 7-°° h(u) * Точно так же при п нечетном, п = 2т-\-1, имеем: h (и) = aiUm + из" + ... + а„, g (и) = аомга + офт~х + • • - + On-i- Полагая ^ = sign f ёи, х), если lira f ^ . = 0 и ^ = 0 в остальных случаях, найдем: _ 7-Н -У-°°МЯ(М) 7-°° g(u) Таким образом2), По-прежнему через Д15 Д2, ..., Дп будем обозначать определители Гурвица для данного многочлена f (z). Примем, что Дп^03). 1) п = 2т. По формуле G0L) 1+%Щ = т-2УA, Дь Дз, ..., Дп-0, G4) , Д2, Д4, .-., Дп). G5) !) Здесь под sign f;":¦ мы понимаем знак ° , : при очень малом по \_ п(и) _1и=—о ft (и) абсолютной величине отрицательном и. 2) Если а1 Ф 0, то две формулы G3') и G3") можно объединить в одну формулу 6 -°° й() ^'-°° Я() 3) В этом случае s=0 и, следовательно, Q=n—2к. Кроме того, Дп ф 0 озна- означает, что дроби, стоящие под знаком индексов, в формулах G3'), G3") несократимы. 4) При вычислении V2, V4, , ^zm величины uq, aj, , am и Ъо, bj, ..., Ът следует соответственно заменить при вычислении первого индекса на а0, а2, ..., а2т и 0, oi, аз, •••! a2m-i> а при вычислении второго индекса—на а0, а2, ...,a2m и et, аз, --.1 «2m-i. °-
§ 12] ВТОРОЕ ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ РА УСА—ГУРВИЦА 507 Но тогда согласно G3') C = n-2FA, Д„ А3, ..., An-1)-2V(l, Д2, А4, ...,ДП), что в соединении с равенством Q = n—2к дает: * = FA, Alf As, ...,An_,) + F(l, Д2, Д4, .... An). G6) 2) n = 2m + l. По формуле G0I), ^ -2F(l, Alf А,, ...,Д„), G7) , A2, At, ...,А„-1). G8) Равенство Q = 2m+1 — 2ft вместе с равенствами G3"), G7) и G8) дает нам снова формулу G6). Теорема Рауса—Гурвица доказана (см. стр. 486). Замечание 1. Если в формуле k = V(l, Alf As, ...) + F(l, Д2, Д4, ...) некоторые промежуточные определители Гурвица равны нулю, то формула сохраняет силу и в этом случае, только в каждой группе подряд идущих нулевых определителей (Ai Ф 0) Дг+2 = Дт = ... = Дг+2р = 0 (Дг+гр+г Ф 0) следует приписать этим определителям (в соответствии с теоремой 7) знаки 3C-1) sign А над = ( — 1) 2 sign Дг 0 = 1, 2, .... р), что дает: , Д г+2, - при р нечетном, V при р четном, е = (— IJsign Дг^+2 . G9) Внимательное сопоставление этого правила вычисления к при наличии нулевых определителей Гурвица с правилом, данным в теореме 5 (стр. 492), показывает, что оба правила совпадают2). Замечание 2. Если Дп = 0, то многочлены ug (и) и h (и) не являются взаимно простыми. Обозначим через d(u) наибольший общий делитель многочленов g(u) и h (и), а через уУсЦи) — наибольший общий делитель ug(u) и h(u) ("у = 0 или 1). Степень d(u) обозначим через б и положим h(u) = d(u)hi(u) и g (и) = d (и) gt (и). Несократимой рациональной дроби ^ ". всегда соответствует некото- некоторая бесконечная ганкелева матрица S = || si+h ||j° ранга г, где г — степень *) Здесь при вычислении первого индекса в формуле G0) вместо а0, aj, ..., am+i и b0, bi, ..., Ът+1 берем соответственно Oq, а2, ..., а^т, 0 и 0, ait a3, ..., агто+и а при вычислении второго индекса вместо а0, аь ..., ат и Ьо, Ьь ..., Ът ставим: 3, . 2m+l o, i, , гт 2) При этом следует учесть замечания, сделанные в сносках 1), 2) на стр. 492.
508 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI hi(u). При этом соответствующий определитель DT Ф 0, a Z)r+1=Z)r+2=...=O. В силу формулы F8') V2r Ф 0, V2r+2 = V2r+4 = ... = 0. Кроме того, -°° hi(u) —г — гу С1» V2. •••, V2r). Применяя все это к дробям, стоящим под знаком индекса в G4), G5), G7) и G8), мы легко найдем, что при любом п (четном и нечетном) и а = 26 + у и что все формулы G4), G5), G7) и G8) сохраняют свою силу и в рассма- рассматриваемом случае, если в правых частях этих формул опустить все Д* при i > п — к и заменить число т[ав формуле G7) число m +1 ] на степень соответствующего знаменателя подиндексной дроби после ее сокращения. Тогда мы получим с учетом G3') и G3"): e = n-Jt-2F(l, Alf Д3, ...)-2F(l, Да, Д4, ...)• Вместе с формулой Q = n—Ik — s это дает: *! = FA, Alf Д3) ...) + V(U Д2, Ai, ...). (80) где k1 = k + ~2—~2—число всех корней f(z), лежащих в правой полу- полуплоскости, за исключением тех, которые одновременно являются корнями и многочлена / (—zI). § 13. Некоторые дополнения к теореме Рауса—Гурвица. Критерий устойчивости Льенара и Шипара Пусть дан многочлен с вещественными коэффициентами f(z) = aozn + aizn-l+...+an (ао>О). Тогда условия Рауса—Гурвица, необходимые и достаточные для того, чтобы все корни многочлена f(z) имели отрицательные действительные части, записываются в виде неравенств Ai>0, Д2>0, ..., Дп>0, (81) где а2 0 0 а3 = 0 при — определитель Гурвица i-ro порядка (i = l, 2, ..., n). г) Это следует из того, что у.—степень наибольшего общего делителя много- многочленов h(u) и ug(u); у,—число «особых» корней многочлена /(z), т. е. тех корней z*, для которых —z* также является корнем /(z). Число этих особых корней равно числу последних (включая Дп) подряд идущих нулевых определителей Гурвица
§ 131 КРИТЕРИЙ УСТОЙЧИВОСТИ ЛЬБНАРА И ШИПАРА 509 Если условия (81) выполнены, то многочлен / (г) представляется в виде произведения а0 на множители вида z + и, z2 + vz -f- w (и > 0, у>0, w>0), и потому все коэффициенты многочлена f (z) положительны1); «i>0, й2>0, ..., йп>0. (82) В отличие от условий (81) условия (82) являются необходимыми, но отнюдь не достаточными для расположения всех корней f(z) в левой полуплоскости Rez-<0. Однако при выполнении условий (82) неравенства (81) уже не являются независимыми. Так, например, при п = 4 условия Рауса — Гурвица при- приводятся к одному неравенству Д3>0, при п = 5 — к двум: Д2>0, Д4>0, при п = 6 —к двум; Д3>0, Д5>02). Это обстоятельство было исследовано французскими математиками Льенаром и Шипаром и дало возможность им в 1914 г.3) установить критерий устойчивости, отличный от критерия Рауса — Гурвица. Теорема 11 (Критерий Льенара иШипара). Необходимые и достаточные условия для того, чтобы вещественный многочлен /(г) = = aazn ~\- а^'1 -f-... + On (Go > 0) имел все корни с отрицательными вещественными частями, могут быть записаны в любом из следующих четырех видов4): 1) йп>0, а„_2>0, ...; Ai>0, Д3>0, ..., 2) а„>0, а„-2>0, ... ; Д2>0, Д4>0, ..., 3) й„>0; а„_1>0, а„_3>0, ...; Ai>0, Д3>0, ..., 4) а„>0; ап_1>0, а„_3>0, ...; Д2>0, Д4>0, .... Из теоремы 11 вытекает, что для вещественного многочлена / (z) = = aozn + a^zn~Xjr ... +а„(йо>О), у которого все коэффициенты (или даже только часть ап, а„_2. ••• или «п» о-п-и ^п-з» •••) положительны, детер- минантные неравенства Гурвица (81) не являются независимыми, а именно: из положительности определителей Гурвица нечетного порядка следует положительность определителей Гурвица четного порядка и наоборот. Условия 1) были получены Льенаром и Шипаром в работе [135] при помощи специальных квадратичных форм. Мы дадим более простой вывод условий 1) [а также условий 2), 3), 4)], опирающийся на теорему 10 § И и теорию индексов Коши, получив эти условия как частный случай значительно более общей теоремы, к изложению которой мы и переходим. Введем снова в рассмотрение многочлены h(u) и g(u), связанные с f(z) тождеством *¦) ао ^> 0 по условию. 2) Это обстоятельство для первых значений п было установлено в ряде работ по теории регулирования независимо от общего критерия Льенара и Шипара, с которым авторы этих работ, очевидно, не были знакомы. 3) См. [208]. Изложение некоторых основных результатов Льенара и Шипара можно найти в фундаментальном обзоре М. Г. Крейна и М. А. Наймарка [16]. 4) Условия 1), 2), 3), 4) имеют известное преимущество перед условиями Гурвица, поскольку они содержат примерно вдвое меньше детерминантных нера- неравенств, нежели условия Гурвица. Из двух серий детерминантных неравенств Д4 > 0, Дз > 0, ... и Дг > 0, Дз > 0, практически лучше та, которая представляется в виде Дга_1 > 0, Дп-з ^> 0, ..., так как она содержит определители меньшего порядка.
510 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Если п четно, п = 2т, то h (и) = аои"> + a2um-i +...+an, g(u) = если же п нечетно, п = 2т-\-1, то h (и) = а&т + а3ип~х + ... + ап, g (и) = Тогда условия а„>0, ап_2>0, ... (соответственно «n-i>0, а„-2;>0,...) можно заменить более общими условиями: h (и) [соответственно g (и)] не ме- меняет знака при мХЗ1). При этих условиях можно вывести формулы для числа корней много- многочлена f(z) в правой полуплоскости, используя только определители Гур- вица нечетного порядка или только определители четного порядка. Теорема 12. Если для вещественного многочлена f (z) = aozn + ... + an = h (*«) + zg (z*) (g0 > 0) выполняется условие: h{u) [или g(u)] не меняет знака при м и последний определитель Гурвща Дп Ф 0, то число к корней многочлена f(z), расположенных в правой полуплоскости, определяется по формулам п=2т h (u) не ме- меняет знака при Л=2УA,Д1,Д3,...,Дп) i^= =2FA, Да, Д4, ..., Дп-ОЧ-^—5 (83) g (м) не ле- кяет знака при и>0 /с=27A,Д1,Д3,...,Д„)— 1-ео 1-80 2) (83') Доказательство. Снова введем обозначение 3) (84) To есть /г (и) >0 или й (в)<0 при и > 0 [соответственно g («) >0 или < при м>0]. 2) Если а^фО, то eoo=signa1, и вообще если a1=a3= •.. =а2цл-1=0, a2p.+i =^ 0, то eTC=sign a2ll+i; если an_i ^= 0, то eo=sign-^=i , и вообще если an_i= =^ 0, то eo=sign 3) См. G1), G2); в нашем случае s=0. an-Z\x.-l
§ 13] КРИТЕРИЙ УСТОЙЧИВОСТИ ЛЬЕНАРА И ШИПАРА 511 Рассмотрим в соответствии с таблицей (83) четыре случая: 1) п = 2т; h(u) не меняет знака при и>0. Тогда1) Н-оо g(u) j+oo Ug (и) __ п •/° ТГм~Io T(uf~v' и потому из очевидного равенства гО g(") гО Ug(u) следует2): г+°° g (М) __ _ г+оо Ug(ll) 1 -те h (и) ~~ -°° h (и) ' Но тогда из G3'), G4) и (84) находим: * = 2FA, Alf Aj, ...) Аналогично из формул G3), G5) и (84) следует: * = 2FA, Д2, Д4, .... An)- 2) n = 2m; g (u) не меняет знака при и > 0. В этом случае 0 h(u) и, следовательно, пользуясь обозначениями (83'), найдем: г+оо h (и) . +оо h(u) _n Заменяя функции, стоящие под знаком индекса, их обратными вели- величинами, мы в силу 5° (см. стр. 505) получим: н-°° g(M) 1 r+°°Mg(") „ __„ •/-oo/1(M) + i-°o Л(м) ^8о° Е°- Но это в силу G3'), G4) и (84) дает: /c = 2F(l, Alf A3, ...) + -^Z!i. Аналогично из G3'), G5) я (84) находим: k = 2V(l, Д2, Д4, ...)--^1^- 3) n = 2m + l, g(^) не меняет знака при м>0. В этом случае, как и в предыдущем, имеет место формула (85). Из равенств G3"), G4), G8), (84) и (85) легко получаем: * = 2FA, &it А3, ...)-^, /c = 2F(l, Д2, Д4, ...) + -^-. 4) n = 2m + l, /г (и) не меняет знака при и>0. !) Если /i(mj)=0 (m!>0), to g (и^фО, поскольку Апф0. Поэтому из h(u) >O 0) следует, что ^ не меняет знака при переходе через и=щ. 2) Из Дп=апД„_1 ф 0 вытекает, что h @)=ап Ф 0.
512 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Из равенств /*°° -frr = /Г If/*! = 0, /-«>-f-тт + ^-°° w\ = 0 заклю- r ° n (и) ° h (и) h{u) h (и) чаем: Обращая функции, стоящие под знаком индекса, получаем: h(u) T+co h(u) _ Но тогда формулы G3"), G7) и (84) дают: * = 2FA, Дь As, ...)-Ц^, /c-2F(l, Д2, Д„ ...)+ 4~8<х> ¦ Теорема 12 доказана полностью. Из этой теоремы как частный случай получается теорема 11. Следствие из теоремы 12. Если вещественный многочлен f (z) = = aozn¦+ a.iZn~l + • • • + dn (a0 >> 0) имеет положительные коэффициенты ao>O, ai>0, й2>0, ...,йп>0 и Дп ^ 0, тоо число к корней этого многочлена, расположенных в правой полуплоскости Re2>0, определяется формулой * = 2FA, Alf As, ...) = 2FA, Д2, А4, ...)• Замечание. Если Дп^=0, но в последней формуле или в формулах (83) некоторые из промежуточных определителей Гурвица равны нулю, то формулы остаются верными, но при вычислении величин F(l, At, Д3, ...) и F(l, Д2, Д4, ...) следует руководствоваться правилом, изложенным в замечании 1 на стр. 507. Если же Д„ = Д„_1 = ... = Дп-и+1 = 0, Д^-и Ф 0, то, отбрасывая в фор- формулах (83) определители Дп-x+i, ..., Дп 1), мы определим по этим форму- формулам число к1 «неособых» корней f(z), расположенных в правой полу- полуплоскости Re2>0, если соответствующий из многочленов hi (и) и gi(u), получающихся из к {и) и g (и) после деления на их наибольший общий делитель d(u), удовлетворяет условиям теоремы 122). § 14. Некоторые свойства многочлена Гурвица. Теорема Стильтьеса. Представление многочленов Гурвица при помощи непрерывных дробей 1. Пусть дан вещественный многочлен f( Представим в виде Выясним, какие условия должны быть наложены на многочлены h (и) и g{u) для того, чтобы многочлен f(z) был многочленом Гурвица. Полагая в формуле B0) (стр. 475) k = s = O, мы получим необходи- необходимое и достаточное условие для того, чтобы / (z) был многочленом Гур- Гурвица в виде равенства !) См. стр. 508. 2) Это условие выполняется, если h (и) Ф 0 при и > 0 или g (и) ф 0 при и > 0.
§ 14] НЕКОТОРЫЕ СВОЙСТВА МНОГОЧЛЕНА ГУРВИЦА 513 где, как и в предыдущих параграфах, Пусть п = 2т. Согласно формуле G3') (стр. 506) это условие может быть записано так: ff. (86) Так как абсолютная величина индекса рациональной дроби не может превосходить степени знаменателя (в данном случае т), то равенство (86) может иметь место тогда и только тогда, когда одновременно • При п = 1т +1 равенство G3") (поскольку q = n) дает: Mg(M) °°g(M) Заменяя здесь дроби, стоящие под знаком индекса, их обратными вели- величинами (см. 5° на стр. 505) и замечая при этом, что h (и) и g(u) имеют одну и ту же т<-ю степень, получаем1): i-oo^-— i-oo А(в) Исходя снова из того, что абсолютная величина индекса дроби не может превосходить степени знаменателя, заключаем, что равенство (88) имеет место тогда и только тогда, когда одновременно *Z*$ = m, ^и~Щ-=-т, в~ = 1. (89) Если п = 2тп, то первое из равенств (87) означает, что многочлен h (и) имеет m различных вещественных корней щ -< и2 -<...-< ищ и что правильная дробь ~^Ц~ представима в виде h(u)~ Ziu — Ui* где Д' = Щ>° (*=*. 2,..-,m). (90') Из этого представления дроби ~~ следует, что между любыми двумя корнями щ, щ+1 многочлена h(и) лежит вещественный корень щ много- многочлена g(u)(i=l, 2, ..., m— 1) и что старшие коэффициенты многочленов h (и) и g (и) имеют одинаковые знаки, т. е. u) = ao(u — щ) ... (и — Щ < и'х < и2 < и2 < ... < Щп^ < um_i < um; йой! > 0. Ц Как и в предыдущем параграфе, eoo=sign ° ; L п (и) J u=+c» 33 ф. р. Гантмахер
514 ПРОБЛЕМА РАУСА —ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Второе из равенств (87) вносит лишь одно дополнительное условие Um<0. Согласно этому условию все корни h (и) и g (и) должны быть отрицатель- отрицательными. Если и = 2то + 1, то из первого равенства (89) следует, что h(u) имеет т различных вещественных корней щ, и2, ..., Щл и где Из третьего равенства (89) вытекает, что s_,>0, (92) т. е. что старшие коэффициенты а0 и й4 имеют одинаковые знаки. Кроме того, из (91), (91') и (92) следует, что g(u) имеет т вещественных кор- корней и1<Си'2<С ... <и'т, лежащих внутри интервалов (— оо, щ), (и1г Щ), • •., (Um-i, ihn)- Другими словами, (м) = а1(м — щ) ... (и — ит), g(u) = ao(u — и'г) ... (и — ит), 2 < щ, < ... < и'т < Ит; aoai > 0. Второе из равенств (89), как и при га = 2т, вносит лишь одно дополни- дополнительное неравенство мт<0. Определение 3. Мы будем говорить, что два многочлена /г(и) и g(u) т-й степени [или первый т-й, а второй — (т — 1)-й степени] обра- образуют положительную пару х), если корни этих многочленов щ, м2, ..., иш и Mj, и2, ...,ит (соответственно и[, и'2, ...,Um-i) все различны, вещест- вещественны, отрицательны и перемежаются следующим образом: U\ < Щ < U2 < U2 < . . . < и'т < Urn < 0 (соответственно щ < и2 < иг -< ... < и'т- 4 < ит -< 0), а старшие коэффициенты этих многочленов имеют одинаковые знаки2). Вводя положительные числа v%=—щ, v\——щ и помножая оба многочлена h (и) и g (и), образующих положительную пару, на ±1 так, чтобы старшие коэффициенты этих многочленов стали положительными, мы эти многочлены сможем представить в виде т т h (и) = ах Д (и + vt), g (и) = ао Д (и + v[), (93) i=i i=l где Й! > 0, а0 > 0, 0 < Vm < V'm < Vm-l < Vm-l < ¦ • • < ^1 < v[, x) Cm. [7], стр. 333. Определение положительной пары многочленов, проведен- проведенное здесь, несколько отличается от определения, данного в книге [7]. 2) Если мы отбросим требование об отрицательности корней, мы получим веще- вещественную пару многочленов. Относительно использования этого понятия в задаче Рауса — Гурвица см. [23].
§ 14] НЕКОТОРЫЕ СВОЙСТВА МНОГОЧЛЕНА ГУРВИЦА 515 если оба многочлена h (и) и g{u) имеют степень т, и в виде m_ т—1 h (и) = а0 Д (и + Vi), g (и) = fll Д (и + i;,), (93') i=i i=l где а0 > 0, й! > 0, 0 < vm < z4_i < ym_j < ... < у, < vlt если /г (и) имеет степень т, a g(u) — степень т— 1. Приведенные ранее рассуждения доказывают следующие две теоремы: Теорема 13. Для того чтобы многочлен f (z) = h(г2) + zg(z2) был многочленом Гурвица, необходимо и достаточно, чтобы многочлены h{u) и g (и) составляли положительную пару1). Теорема 14. Для того чтобы два многочлена h(u)u g (и), из кото- которых первый имеет степень т, а второй имеет степень т или т—1, составляли положительную пару, необходимо и достаточно, чтобы имели место равенства & Ш=~т <94> и в случае, когда степени h(u) и g(u) одинаковы, дополнительное условие [№] (95> 2. Из последней теоремы, используя свойства индексов Коши, мы легко получим теорему Стильтьеса о представлении дроби -, . . в виде непрерыв- непрерывной дроби специального типа в случае, когда многочлены h(u) и g(u)> образуют положительную пару многочленов. Доказательство теоремы Стильтьеса опирается на следующую лемму: Лемма. Если многочлены h(u), g(u) [степень h(и) равна т] соста- составляют положительную пару и М * , (96) i (") где с, d—постоянные, a hi (и), gi(u)—многочлены степени^.т—1, то 1° с>0, d>0, 2° многочлены hi{u), gi(u) имеют степень т—1, 3° многочлены hi (и), gi (и) составляют положительную пару. Задание h(u) и g(u) однозначно определяет многочлены hi(u), gi(u) (с точностью до общего постоянного множителя) и постоянные cud. Обратно, из (96) и 1°, 2°, 3° следует, что многочлены h(u) и g(u) образуют положительную пару, причем h(u) имеет степень т, ag(u),— степень т или т — 1 в зависимости от того, с>0 или с = 0. Доказательство. Пусть h(и), g(и) — положительная пара. Тогда из (94) и (96) следует: gl (") Из этого равенства следует, что степень gi(u) равна т—1 и что !) Эта теорема представляет собой частный случай так называемой теоремы Эрмита—Билера (см. [37], стр. 21). 33*
516 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Далее из (97) находим: Отсюда следует, что d>0 и что (98) Теперь второе равенство (94) дает: Н-оо Ug(u) _ J+oc Г , 1 1 _ "gl (") _ И-CO 1 _ Г>Гл I hi (fe) 1 _ H-OO fej(M) ,QQV Отсюда следует, что hi (и) имеет степень т—I1). Условие (95) в силу (96) дает: с>0. Если же степень g(u) меньше степени /г (к), то из (96) вытекает: с = 0. Из (98) и (99) следует: где e~=signLftl(")J«=+~ Так как второй из индексов A00) по абсолютной величине <!m—1, то вй' = 1, A01) а тогда из A00) и A01) на основании теоремы 12 заключаем, что много- многочлены hi (и) и gi (и) образуют положительную пару. Из (96) следует: u-*oo h (") «-,«> L А (и) J d После того как с и d определены, из (96) определяется отношение -^-Ш ¦ Соотношения (97), (98), (99), A00), A01), использованные в обратном порядке, устанавливают вторую часть леммы. Таким образом, лемма дока- доказана полностью. Пусть нам дана положительная пара многочленов h (и), g (и) и т есть степень многочлена h (и). Тогда, разделив g (к) на h (и) и обозначив частное через с0, а остаток через gi (и), получим: А (и) ~ с° + h (и) ft() —^у можно представить в виде doU -j—~~ , где степень hi (и), как и сте- степень gi(u), меньше т. Отсюда !) Из равенства (99) следует, что знаменатель ugi (и) имеет степень т и что между любыми двумя корнями знаменателя ugi (и) содержится корень числителя А4 (и).
§ 14] НЕКОТОРЫЕ СВОЙСТВА МНОГОЧЛЕНА ГУРВИЦА 517 Таким образом, для положительной пары h (и) и g(u) всегда имеет место представление (96). Согласно лемме Со>О, do>O, а многочлены ^(и) и gi(u) имеют степень т — 1 и образуют положи- положительную пару. Применяя эти же рассуждения к положительной паре 1ц{и), gi(u), получим равенство ( 1 где ct>0, а многочлены h2 (и) и g2 (и) имеют степень т — 2 и образуют положитель- положительную пару. Продолжая этот процесс далее, мы в конце концов придем к положительной паре km и gm, где hm и gm—постоянные одного знака. Мы положим: ¦f^ = <W A020»)) Тогда из A02), A02'), ...,A02<m>) вытекает: ст Пользуясь второй частью леммы, мы аналогично покажем, что при любых с0 > 0, q > 0, ..., ст > 0, d0 > 0, dt > 0, ..., dm_! > 0 написанная непрерывная дробь однозначно (с точностью до общего постоянного мно- множителя) всегда определяет положительную пару многочленов h (и) и g (и), причем h (и) имеет степень т, a g (и) имеет степень т при с0>0 и сте- степень т — 1 при со = О. Таким образом, нами доказана1) Теорема 15 (Стильтьеса). Если h(u), g(u)—положительная пара многочленов и !г(и) имеет степень т, то g(»)-G. I 1 А (и) A03) х) Доказательство теоремы Стильтьеса, не опирающееся на. теорию индексов Коши, можно найти в книге [7], стр. 333—337.
518 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI где с0 > 0, cd > 0, ..., Cm > 0, d0 > 0, ..., dm_! > 0. При этом с0 = О, если g (и) имеет степень т — 1, и с0 > 0, если g (и) имеет степень т. Постоянные Cj, d^ однозначно определяются зада- заданием h (и), g (и). Обратно, при любом Со>О и любых положительных cit . . ., ст, d0, ¦ . ., dm—i непрерывная дробь A03) определяет положительную пару многочленов h (и), g (и), где h (и) имеет степень т. Из теоремы 13 и теоремы Стильтьеса следует: Теорема 16. Вещественный многочлен п-й степени/ (z) = h (z2) -}- + zg (z2) в том и только в том случае является многочленом Гуреица, если имеет место формула A03) при неотрицательном с^ и положитель- положительных Си . . ., ст, d0, . ¦ ., dm—i- При этом с0 > 0, когда п нечетно, и с = 0, когда п четно. § 15. Область устойчивости. Параметры Маркова Каждому вещественному многочлену п-й степени можно отнести точку и-мерного пространства, координаты которой равны частным от деления на старший коэффициент всех остальных коэффициентов. В таком «пространстве коэффициентов» все многочлены Гурвица обра- образуют некоторую n-мерную область, которая определяетсях) неравен- неравенствами Гурвица А4 > 0, А2 > 0, . . ., А„ > 0 или, например, неравен- неравенствами Льенара — Шипара ап > 0, а„_2 > 0, . . ., А} > 0, А3 > 0, ... Эту область будем называть областью устойчивости. Если коэффициенты уравнения заданы как функции р параметров, то область устойчивости строится в пространстве этих параметров. Исследование области устойчивости представляет большой практиче- практический интерес; так, например, такое исследование существенно при проек- проектировании новых систем регулирования 2). В § 16 мы покажем, что две замечательные теоремы, установленные А. А. Марковым и П. Л. Чебышевым в связи с разложением непрерывных дробей в степенные ряды по отрицательным степеням аргумента, имеют тесное отношение к исследованию области устойчивости. При формули- формулировке и доказательстве этих теорем нам удобно будет задавать многочлен не его коэффициентами, а специальными параметрами, которые мы назо- назовем параметрами Маркова. Пусть дан вещественный многочлен / (z) = aozn + а^-1 +...+«„ (во Ф 0). Представим его в виде Примем, что многочлены h (и) и ug (и) взаимно просты (Ап Ф 0). Несократимую рациональную дробь j~^ разложим в ряд по убывающим *) При а0 = 1- 2) Исследованию области устойчивости, а также областей, соответствующих раз- различным значениям к (к — число корней в правой полуплоскости), посвящен ряд работ Ю. И. Наймарка (см. монографию [27]).
$ 15] ОБЛАСТЬ УСТОЙЧИВОСТИ. ПАРАМЕТРЫ МАРКОВА 519 степеням и *): h(u) —s-i+ и „а + „з „4 + • • • Если п нечетно, то для получения этой формулы необходимо доба- добавочно предположить, что ai ф 0 (в противном случме s_i = оо). Последовательность чисел s0, s1? «2> • • • определяет бесконечную танкелеву матрицу S = \\ si+h ||?°. Определим рациональную функцию R (v) равенством Тогда д(Р)=_м+^- + ^. + 5-+..., A06) и потому имеет место соответствие (см. стр. 498) Д(р)~5. A07) Отсюда следует 2), что матрица S имеет ранг т = -^- , поскольку да — степень многочлена h (и) и, следовательно, число полюсов функ- функции R (v). При п = 2т (в этом случае s_i = 0) задание матрицы S однозначно определяет несократимую дробь —~ и, следовательно, с точностью до постоянного множителя однозначно определяет / (z). При п = 2т -f-1 для задания / (z), помимо матрицы S, необходимо еще знать коэффи- коэффициент S_j. С другой стороны, для задания бесконечной ганкелевой матрицы т-го ранга S достаточно задать лишь первые 2т чисел s0, su . . ., s2m-i. Числа s0, su . , ., s2m_i могут быть выбраны произвольно при одном лишь ограничении A08) все последующие коэффициенты разложения A04) s2m, s2m+i, . . . одно- однозначно (и даже рационально) выражаются через первые 2т: s0, su ... . . ., S2m-i- Действительно, у бесконечной ганкелевой матрицы т-го ранга S элементы связаны между собой рекуррентными соотношениями {см. теорему 7 на стр. 496) т s<z= 2 aBs4-g (q = m, m + 1, ...)• A09) g=i Если числа s0, slt . . ., s2m-i удовлетворяют неравенству A08), то после задания этих чисел из первых т соотношений A09) однозначно опреде- определяются коэффициенты аи а2, ¦ ¦ ., ат; тогда последующие соотноше- соотношения A09) определяют s2m, sSm+1, . . . Таким образом, вещественный многочлен / (z) степени п = 2т при Д„ Ф 0 может быть однозначно 3) задан при помощи 2т чисел s0, su . . . . . ., s2m_i, удовлетворяющих неравенству A08). При п = 2т + 1 к этим числам следует прибавить еще s-t. ') Для дальнейшего нам удобно коэффициенты при четных отрицательных сте- степенях и обозначать через —sj, —s3 и т. д. 2) См. теорему 8 (стр. 498). 3) С точностью до иостоянного множителя.
520 ПРОБЛЕМА РАУСА-ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI П ВеЛИЧИН S0, Su . . ., S2m-l (при П = 2т) ИЛИ S-U So, . . ., «2т-1 (при п = 2т -f-1) мы будем называть параметрами Маркова для много- многочлена / (z). В и-мерном пространстве эти параметры могут быть рас- рассматриваемы как координаты точки, изображающей данный много- многочлен / (z). Выясним, какие условия должны быть наложены на параметры Маркова для того, чтобы соответствующий многочлен / (z) был многочле- многочленом Гурвица. Этим самым мы определим область устойчивости в про- пространстве параметров Маркова. Многочлен Гурвица характеризуется условиями (94) и дополнительным условием (95) при и = 2тга4-1. Вводя функцию/?(v) [см. A05)], мы равен- равенства (94) запишем так: = m. A10) Дополнительное же условие (95) для п = 2т-\-1 дает: Введем наряду с матрицей S = || si+ft ||~ бесконечную ганкелеву мат- матрицу Sm = || Sj+fc+i ||?°. Тогда поскольку из A06) то имеет место соответствие vR(v)~Sa\ A11) Матрица Sa}, как и матрица S, имеет конечный ранг т, так как функция vR (v), как и R (v), имеет т полюсов. Поэтому и формы т—1 т—1 Sm(x, X)= 2 Si+hXiXh, S%{X, Х)= 2 Si+h+1XtXh i, ft=0 i, ft=0 имеют ранг т. Но согласно теореме 9 (стр. 500) сигнатуры этих форм в силу соответствий A07), A11) равны индексам A10) и, следовательно, также равны т. Таким образом, условия A10) означают положительную определенность квадратичных форм Sm(x, x) и S% (х, х). Нами установ- установлена Теорема 17. Для того чтобы вещественный многочлен f(z) = — h (z2) + zg (za) степени n = 2m или n = 2m -f-1 был многочленом Гурвица, необходимо и достаточно1), чтобы !) Мы не оговариваем специально неравенства Дп Ф 0, поскольку это неравен- неравенство автоматически следует из условий теоремы. В самом деле, если /(z)—много- /(z)—многочлен Гурвица, то, как известно, Ап Ф 0. Если же даны условия 1°, 2°, то из поло- положительной определенности формы 5<i> (x, х) вытекает равенство , ие (и) из которого следует несократимость дроби , -, что выражается неравенством Дп Ф 0. Точно так же из условий теоремы автоматически следует, что Dm—\ si+h \™ Ф 0Т т. е. что числа s0, sj, ...,s2m-i и (ПРИ n=2m-{-i) число s_j являются параметрами Маркова для многочлена / (z).
§ 16] СВЯЗЬ С ПРОБЛЕМОЙ МОМЕНТОВ 521 1° квадратичные формы т— 1 Sm(x, х) = 2 г, й=0 были положительно определенными и 2° (при п = 2 A12), (ИЗ), т—1 г, ft=0 Здесь s_u sq, Si, ..., S2m-i — коэффициенты в разложении g(y) _ , Jo si | S2 s3 fr (u) • -1 "т" и и* "г" U3 m* ' " " Введем обозначения для определителей: Dv = I si+fe |Г S ^p" =! *i+ft+i 1Г * (P = 1» 2, ..., m). Тогда условие 1° эквивалентно системе детерминантных неравенств S0 Si sl S2 St S2 В случае п = Ъп неравенства A15) определяют область устойчивости; в пространстве параметров Маркова. При п = Ъп +1 к этим неравенствам следует прибавить еще одно: *U>0. A16). В следующем параграфе мы выясним, какие свойства матрицы S вытекают из неравенств A15) и тем самым выделим специальный класс бесконечных ганкелевых матриц S, которые соответствуют многочленам' Гурвица. § 16. Связь с проблемой моментов 1. Сформулируем следующую проблему моментов из поло- положительной полуоси1) 0<у<оэ: Дана последовательность вещественных чисел s0, su ... Требуется определить положительные числа 14>0, fi2>0, ...,щ„>0; 0<.v1<.v2<....<vm так, чтобы имели место равенства = O, 1, 2, ... *) Эту проблему моментов следовало бы называть дискретной в отличие от общей1 т степенной проблемы моментов, в которой суммы 2 Wjj" заменены интегралами ii Стильтьеса\ vPdy.(v) (см. [3]). о
522 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Нетрудно усмотреть, что система равенств A18) равносильна следую- следующему разложению в ряд по отрицательным степеням и: т D В этом случае бесконечная ганкелева матрица 6" = || si+h Цо" имеет конечный ранг т, и в силу неравенств A17) в несократимой правильной рациональной дроби Ц0+7 3=1 ^старшие коэффициенты в /г (и) и g (и) выбираем положительными] много- многочлены /г (и) и g(u) образуют положительную пару [см. (91) и (91')]. Поэтому (см. теорему 14) сформулированная нами проблема моментов имеет решение в том и только в том случае, когда последовательность чисел s0, su s2, ... при помощи равенств A19) и A20) определяет много- многочлен Гурвица / (z) = h (z2) -f Щ (z2) степени 2m. Решение проблемы моментов единственно, поскольку из разложе- разложения A19) однозначно определяются положительные числа vj и [ij 0 = 1, 2, ..., т). Наряду с «бесконечной» проблемой моментов A18) рассмотрим и «конечную» проблему моментов, задаваемую первыми 2т из урав- уравнений A18): т sP= 2 |*J»F (P = O, 1, .... 2m-1). A21) 3=1 Из этих соотношений уже вытекают следующие выражения для ганкеле- вых квадратичных форм: m—i m m-1 m 2 si+h+lXiXk = 2 г, й=0 3=1 Поскольку линейные формы относительно переменных х0, х±, :.., a^-i Хо + XiVj + ... + Xm-ivf~l (j = 1, 2, ..., т) независимы (коэффициенты этих форм образуют отличный от нуля опре- определитель Вандермонда!) и ^->0, |J.j>0 0 = 1, 2...,т), то квадратич- квадратичные формы A22) являются положительно определенными. Тогда согласно теореме 17 числа s0, slt ..., s2m-i являются параметрами Маркова неко- некоторого многочлена Гурвица /(z). Эти числа являются первыми 2т коэф- коэффициентами разложения A19). Вместе с остальными коэффициентами ¦згт, $2т+1, • • • они определяют бесконечную разрешимую проблему момен- моментов A18), которая имеет то же решение, что и конечная проблема A21). Таким образом, нами доказана следующая Теорема 18. 1. Для того чтобы конечная проблема моментов HWi A23) 3=1
16] СВЯЗЬ С ПРОБЛЕМОЙ МОМЕНТОВ 523 (р = 0, 1, ...,2т—1; f! , [ ) p заданные, a Vj и \ij—искомые вещественные числа (р — 0, 1, ...,2т—1; j = l, 2, ..., т), имела решение, необходимо и достаточно, чтобы квадратичные формы т—1 2 Si+kXiXk, i, fc=0 т—1 A24) были положительно определенными, т. е. чтобы числа So, s4..., $2m-i бьгли параметрами Маркова некоторого многочлена Гурвица сте- степени 2т. 2. Для того чтобы бесконечная проблема моментов A25) (р = 0, 1, 2, ...;.|х1>0, ..., [xm'>0;0<:v1<.v2<....<.vm), где sp—за- sp—заданные, a Vj и [ij—искомые вещественные числа (р = 0, 1, 2, ...; j = l, 2, ..., пг), имела решение, необходимо и достаточно, чтобы 1° квадра- квадратичные формы A24) были положительно определенными и 2° бесконечная еанкелева матрица S = || si+ft ||S° имела ранг т, т. е. чтобы ряд м3 A26) определял многочлен Гурвица f (z) — h (z2) + zg (z2) степени 2т. 3. Решение проблемы моментов, как конечной A23), так и бесконеч- бесконечной A24), всегда единственно. 2. Доказанную теорему мы используем для исследования миноров бесконечной ганкелевой матрицы S = \\ si+h ||2° ранга т, соответствующей некоторому многочлену Гурвица, т. е. матрицы S = || si+h ||o°, для которой квадратичные формы A24) являются положительно определенными. В этом случае порождающие матрицу S числа s0, st sz, могут быть представлены в виде A23), и потому для произвольного минора матрицы S порядка /г<!т имеем: я, следовательно, it h...i »%¦¦¦< v vZ vih .М ¦ A27)
524 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Но из неравенств следует положительность обобщенных определителей Вандермонда ч Va\ Va4 Va\ vlh ¦¦Va\ is • -Vali >o, vl\ Va\-- vll- hh •vai •Van Поэтому, поскольку и числа 0 = 1, 2, ..., m), то из A27) вытекает- *-•¦2 Обратно, если в бесконечной ганкелевой матрице t = ||sj+u|!o° ранга т все миноры любого порядка hs?.m положительны, то квадратичные- формы A27) являются положительно определенными. Введем Определение 4. Бесконечную матрицу А = \\ atk ||o° будем называть вполне положительной ранга т в том и только в том случае, когда все- миноры матрицы А порядка h ^ m положительны, а все миноры, порядка h>m равны нулю. Теперь сформулируем установленные свойства матрицы S2). Теорема 19. Для того чтобы бесконечная ганкелееа матрица S = || Si+h ]|o° была вполне положительной ранга т, необходимо и доста- достаточно, чтобы 1) матрица S имела ранг т и 2) квадратичные фбрмых т—\ 2 i, fc=0 т—1 2 i, fc=0 были положительно определенными. Из этой теоремы и теоремы 17 следует Теорема 20. Вещественный многочлен f (z) степени и является многочленом Гурвица в том и только в том случае, когда соответ- соответствующая этому многочлену бесконечная ганкелееа матрица S = || si+b ||JS°" является вполне положительной ранга т= [ 4- ив случае п нечетного- дополнительно s_t > 0. При этом элементы s0) Sj, s2, ... матрицы S и число s_i опреде- определяются из разложения g(ц) h (и) d "г и м2 "Г „s A29) где г) См. стр. 395, пример 1. • См. [82д].
S 17] СВЯЗЬ МЕЖДУ ОПРЕДЕЛИТЕЛЯМИ ГУРВИЦА И МАРКОВА 525 ¦§ 17. Связь между определителями Гурвица и определителями Маркова1) Рассмотрим сначала случай четного п—2т. Тогда В(Ц) h (и) аоит-\- azum~i + ... и Согласно формуле F8') на стр. 503 имеем: _?2_. A30) V2p= а0 а2 а4 а6 ... О aj аз as ... О а0 а2 О4 .. . О 0 а) аз... (Р=1 т). •С другой стороны, V2p= ао&2р-1, где Д2р-1—определитель Гурвица порядка 2р—1. Поэтому A8p1l> (Р=1. •••.»)• A31) Помножим обе части равенства A30) на и и снова применим формулу F8') •со стр. 503. Получим: a0 o2 a4 ... aj a3 a6 ... 0 a0 az ... откуда При нечетном re=2m + l имеем: g (ц) _ — H sz — s3...( —1)% *2 —«3 «4--- =l, 2, ..., -1 + ¦. ¦ , ?0 h(u) п!ит + a3um-i + ... °~1 ^ и •откуда снова по .формуле F8') стр. 503 имеем: A31') A32) ч а0 0 0 а3 ... а2 ... а4 ... а0 ¦¦¦ 'С другой стороны, из A32) находим: .где Но тогда для р=1, ..., т = 1 т). «2 A32') ч 0 0 аз «4 < а5 ... а'в ... а3 ... oi ... =afP A33) x) Определители Гурвица Дд введены на стр. 485; определители Маркова задаются формулами A14).—Прим. ред.
526 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI С другой же стороны, а3 ..  a0 0 0 аз d% a^ a'o as ... al ... a3 ... a'2 ... В полученном определителе Bр+1)-го порядка к каждой строке с четным номером прибавим предыдущую строку, помноженную предварительно на «_j. Тогда этот определитель перейдет в Дгр+i- Поэтому из A33) и A33') получаем: б) при n=2m-j-l (заменяя а\ на aos-i): Таким образом имеет место следующая связь между определителями Гурвица и Маркова: а) при n=2m: (P=i, ••-. Эти формулы показывают, как неравенства Маркова A15) переходят в неравенства! Гурвица и наоборот. Кроме того, эти неравенства в соединении с критерием Льенара—Шипара дают нам следующую теорему: Для того чтобы вещественный многочлен f {z)=h (zz)-\-zg (z2) со старшим коэф- коэффициентом а(,^>0 был гурвицевым, необходимо и достаточно, чтобы: 1) все коэффициенты этого многочлена были положительны и 2) одна из квадратичных форм A12) была положительно определенной. § 18. Теоремы Маркова и Чебышева В своем известном мемуаре «О функциях, получаемых при обращении, рядов в непрерывные дроби», напечатанном в Записках Петербургской Академии наук за 1894 г. г), покойный акад. А. А. Марков доказал две теоремы, из которых вторая иными методами и в не столь общей фор- формулировке была в 1892 г. установлена П. Л. Чебышевым2). В этом параграфе мы покажем, что эти теоремы имеют непосред- непосредственное отношение к исследованию области устойчивости в параметрах Маркова, и дадим сравнительно простое доказательство (не связанное- с непрерывными дробями) этих теорем, опирающееся на теорему 19 предыдущего параграфа. Переходя к формулировке первой теоремы, процитируем соответствую- соответствующее место упомянутого выше мемуара А. А. Маркова 3): «Основываясь на предыдущем, нетрудно уже доказать две замеча- замечательные теоремы, которыми мы закончим нашу статью. Одна касается определителей4) Alf Д2, ...,Ат, ДA\ ДB>, ...,Д(т\ 1) См. также [22], стр. 78—105. 2) Эта теорема была опубликована в работе П. Л. Чебышева «О разложении! в непрерывную дробь рядов, расположенных по нисходящим степеням переменной». См. [31], стр. 307—362. 3) [25], стр, 95, третья строка снизу и далее. *) В наших обозначениях Dlf D2, ..., Dm, D^\ ?>?>, ..., Dm (см. стр. 521)..
§ 18] ТЕОРЕМЫ МАРКОВА И ЧЕБЫШЕВА 527 а другая—корней уравнения1) = 0. Теорема об определителях. Если для чисел Sq, Sf, S2, - • • ? S2m—2» S2m—1 /tw имеем две системы значений 1) So = а0, Si = Й1, S2 = й2, . . ., S2m_2 = Й2т_2, S2m-1 = Й2то_1, при которых все определители So Si . . . STO_i So == s0, Д2 = Sj S2 Sj . . . S = su Д<2) = 51 S2 52 «3 Sj S2 . . . Sm S2 S3 • ¦ • sm+l sm sm+l S2m-l оказываются числами положительными и удовлетворены неравенства то наши определители Д„ Д2, ..., Дт; Дш, ДB), ... Д(т) должны оставаться числами положительными при всех значениях удовлетворяющих неравенствам и й2т-2 > *2m-2 5s- l>2m-2i ^2m-i >¦ «гпг-! При тех же условиях должно быть а0 а2 -.. ah So Si ... Sj S2 . . . ... ь* bh+1 ¦ ¦ ¦ Sft-1 «ft - • • «2Й-2 Si S2 . . - Sh s2 s3 .. b0 «A Sh+i ¦ ¦ ¦ S2k-1 -1 bh ... 1 a2 . a2 a-h при fc = l, 2, ..., m». Для того чтобы дать иную формулировку этой теоремы, связанную» с задачей устойчивости, введем некоторые понятия и обозначения. В наших обозначениях h (—ж)=0.
'528 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Параметры Маркова s0, Si, .. -, San-i (при п = 2т) или s_l5 s0, su ..., szn-i (при п = 2т-\-\) будем рассматривать как координаты некото- некоторой точки Р тг-мерного пространства. Область устойчивости в этом про- пространстве будем обозначать через G. Область G характеризуется нера- неравенствами A15), A16) (стр. 521). Мы будем говорить, что точка Р = {st} «предшествует» точке Р* — {s*}, и писать Р-<Р*, если и (при n = A34) »и хотя бы в одном из этих соотношений имеет место знак <\ Если имеют место только соотношения A34) беэ последней оговорки, то мы будем писать: Р^Р*. Мы будем говорить, что точка Q лежит «между» точками Р и В, фсли B-<Q-<B. Каждой точке Р соответствует бесконечная ганкелева матрица .ранга т: S = || si+h ||o°- Эту матрицу будем обозначать еще так: SP. Теперь мы дадим теореме Маркова следующую формулировку: Теорема 21 (Маркова). Если две точки Р и В принадлежат области устойчивости G, то и любая точка Q, расположенная между .точками Р и В, также принадлежит области G, т. е. из Р, B?G, P¦<<}¦<В следует: Доказательство. Из JP^ Qrl-R следует, что две точки Р ш В можно соединить отрезком кривой sj = ( — 1)гфг(г)[а<г<'у; г = 0, 1, ..., 2/п —1 и (при п = 2/п+1)г= — 1], A35) ¦содержащим точку Q так, чтобы 1) функции <рг (t) были непрерывными, монотонно возрастающими и дифференцируемыми при изменении t от t = a до t = y и 2) чтобы значениям а, ($, у (a<Lfi<Ly) аргумента t соответ- соответствовали точки Р, Q, В на кривой. При помощи величин A35) составим бесконечную ганкелеву матрицу jS = <Sr(f) = ||si+ft||o° ранга т. Рассмотрим часть этой матрицы, я именно прямоугольную матрицу Sq Si . . . Sjn-l Sm Si S2 . . . S Sm+j A36) Согласно условию теоремы при ( = аи при t = у матрица S (t) вполне положительна ранга т, и потому все миноры матрицы A36) порядка р = 1, 2, ..., т положительны. Мы докажем, что это свойство сохраняется при любом промежуточ- промежуточном значении ^(а<г^<!'у)- Для р — 1 это очевидно. Докажем это утверждение для миноров р-го порядка в предположении, что оно верно для миноров (р — 1)-го порядка. Рассмотрим произвольный минор р-го порядка, образованный
$ 18] ТЕОРЕМЫ МАРКОВА И ЧЕБЫШЕВА 529 подряд идущими строками и столбцами матрицы A32): Sq+l ¦ ' = 0, 1, ...,2(т-р) + 1]. sq+p-l sq+p • • • sq+2p-Z Вычислим производную от этого минора Р dt "p ZJ dsq+l+h dt ' i, k—0 (i, k = 0, 1, ..., p — 1)—алгебраические дополнения (адъюнкты) Vsq+l+h элементов определителя Dp. Поскольку согласно допущению все миноры этого определителя положительны, то (*, * = 0,1, .... Р-1). A37) С другой стороны, из A31) находим: Из A34), A35) и A36) следует: = 0, 1, ...,2(|» Д = i, 2, ...,m, • A37") Таким образом, каждый минор D^P при q четном монотонно возра- возрастает (точнее, не убывает), а при q нечетном—монотонно убывает (точ- (точнее, не возрастает) при возрастании аргумента t от значения i = a до значения t = y, и поскольку при f = a и t = y этот минор положителен, то он будет положительным при любом промежуточном значении t(a<.t<.y). Из того, что положительны миноры матрицы A36) порядка р — 1 и миноры р-го порядка, образованные подряд идущими строками и столб- столбцами, уже следует, что все миноры р-го порядка матрицы A36) поло- положительны1). Из доказанного следует, что при любом t (a^.t^.y) величины s0. s^ ...,s2m-i и (при n = 2m + l)s-i удовлетворяют неравенствам A15) и A16), т. е. при любом t эти величины являются параметрами Маркова для некоторого многочлена Гурвица. Другими словами, вся кривая A35), а значит, и точка Q лежат в области устойчивости G. Теорема Маркова доказана. Примечание. Поскольку доказано, что каждая точка кривой A35) принадлежит области G, то при любом t (u*Ct*Cy) величины A35) опре- определяют вполне положительную ранга т матрицу S (t) = || st+h (t) ||o°. Поэтому неравенства A37), а следовательно, и A37") имеют место при любом t (a<Cf <;{$), т. е. с возрастанием t любое D^ возрастает, если q — четное число, и убывает, если q нечетно [q = 0,1, ..., 2 (т — р) +1; р = 1, ..., т]. х) Это следует из детерминантного тождества Фекете (см. [7], стр. 306—307). 34 ф. р. Гантмахер
530 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI следует: -if Df (Q)<(-1)« D™ (В) Другими словами, из (- 1)«Z><?> [5 = 0, 1 Эти неравенства при д = 0, 1 дают неравенства Маркова (стр. 527). Рассмотрим теперь упомянутую в начале этого параграфа теорему Чебышева — Маркова. Снова приведем цитату из мемуара А. А. Маркова1): «Теорема о корнях. Если числа -2j S2m-li удовлетворяют всем условиям предыдущей теоремы*), то уравнения по й! ... am-i 1 , й2 ... ат х 2 as ... <zm+i z? So «i «2 sm bo bt h «i s2 s3 Sni+1 b2 h ¦ ¦ • Sm_! ... sm ¦ • ' Sm+i • • • S2m-i ... fcm-i ... bm ... bm+1 1 X X2 xm 1 X 3? = 0, um um+l n—1 J- = 0 степени т относительно неизвестной х не имеют ни кратных, ни мни- мнимых, ни отрицательных корней. И корни второго уравнения больше соответственных корней первого и меньше соответственных корней последнего уравнения)). Выясним, в какой связи эта теорема находится с областью устойчи- устойчивости в пространстве параметров Маркова. Полагая f(z)—h(z2) + zg(z2) и мы из разложения A05) получим тождество +ст). х) См. [25], стр. 103, 5-я строка сверху и далее. 2) Имеется в виду предыдущая теорема Маркова — теорема об определителях (стр. 527).
§ 18] ТЕОРЕМЫ МАРКОВА И ЧЕБЫШЕВА 531 Приравнивая нулю коэффициенты при степенях г;, V2, . ...+ smc0 = О, = 0, Sm-lCm + SmCm-i + • • . + «гет-^О = 0; , к этим соотношениям добавим уравнение .., v т, найдем: A38) A39) записанное так: -i -f ... + vmc0 = 0. Исключая из A38) и A39') коэффициенты с0, си . уравнение A39) в виде s 1 Sq Sj Sj S2 «2 «3 ... Sm V • • • sm+l v Sm «ro+i . . . S2m_j V" = 0. A39') cm, мы представим A39") Таким образом, алгебраическое уравнение в теореме Чебышева— Маркова совпадает с уравнением A39), а неравенства, налагаемые на вели- величины s0, Sj, ...,s2m-ij совпадают с неравенствами A15), определяющими область устойчивости в пространстве параметров Маркова. Теорема Чебышева—Маркова выясняет, как меняются корни щ — — vu и2— — v2, ..., ит — — vm многочлена h(и), когда соответствую- соответствующие параметры Маркова s0. su • • •» «2m-i изменяются в области устой- устойчивости. Первая часть теоремы утверждает известные нам факты: при выпол- выполнении неравенств A15) все корни щ, и2, ..., ит многочлена h(и) простые, вещественные и отрицательныег). Мы эти корни будем обозначать так: щ(Р), иаСР), ....ИтОР), где Р—соответствующая точка области G. Тогда вторая (основная) часть теоремы Чебышева—Маркова может быть сформулирована так: Теорема 22 (Чебышева—Маркова). Если Р и Q — две точки области G и точка J* «предшествует» точке Q, , A40) то щ(Р)<щ(Q), u2(JP)<иг(Q), ...,um{P)<:um(Q) A41) Доказательство. Коэффициенты многочлена h(u) можно выра- выразить рационально через параметры s0, su ..., s2m-i3)- Тогда из h(Ui) = 0 (г = 1, 2, ...,т) х) См. теорему 13 на стр. 515. 2) Другими словами, корни м1( м2, ..., Sg, S2j , S2m-2 И убывании «1, S3, . . ., «2т-1- 3) Хотя бы из уравнений A38), положив в них для конкретности со=1. возрастают при возрастании 34*
532 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI следует г): С другой стороны, дифференцируя почленно разложение g И _ ,Jo «1 ¦ «а h(u) ~ *"t" и и "*" i*3 по параметру Sj, найдем: K ' dst Ё K ' dst (—1)» 1 Помножая обе части этого равенства на многочлен _' и обозначая яерез Сц коэффициент этого многочлена при степени и1, получим: . dh (и) k(u) ag(u) g u a*i (-i)'c,; Приравнивая коэффициенты при — (вычеты) в левой и правой частях равенства A44), найдем: (-l/^W^f^u, A45) что в сочетании с A42) дает: Вводя величины ^=?Ц («--1.2 т), A46) мы получим формулу Чебышева—Маркова $°ii"U (.•=l,2,...,m;l-0, 1.....&.-1). A47) Но в области устойчивости величины Ri (г = 1, 2, ..., т) положительны [см. (90') на стр. 513]. То же можно сказать и о коэффициентах Сц. Действительно, ? •.. (и + УтJ, A48) где г;г=—^i>0 (г —1, 2, ..., т). Из A48) видно, что все коэффициенты Сц в разложении —— по сте- степени и положительны. Таким образом, из формулы Чебышева—Маркова получаем: ,. n dh(ut) Г dh (и) 1) здесь -Л±=[-Л±
S 19] ОБОБЩЕННАЯ ЗАДАЧА РАУСА—ГУРВИЦА 533 При доказательстве теоремы Маркова мы показали, что любые две точки Р < Q области G можно соединить дугой кривой si~(— l)'<pi (t) A = 0, 1, ..., 2т— 1), где фг(?) — монотонно возрастающие дифференци- дифференцируемые функции от t [t изменяется в пределах от а до Р (а<Р), причем f = a соответствует точка JP, а ? = Р — точка Q]. Тогда вдоль этой кри- кривой в силу A49)г) 2т-1 ^=2$f>0. -S-^0 (a<*<P). A50) 1=0 Отсюда, интегрируя, получаем: = щ (JP) < M*(fc=p) = щ (Q) (г = 1, 2, .... т). Теорема Чебышева—Маркова доказана. § 19. Обобщенная задача Рауса—Гурвица В этом параграфе мы дадим правило определения числа корней в правой полуплоскости для многочлена / (z) с комплексными коэф" фициентами. Пусть / (iz) = bozn + Ъ&п~1 +...+bn + i (aozn + a^ + ... + an), A51) где a0, ai, ..., an, b0, bu ..., bn — вещественные числа. Если п есть сте- степень многочлена / (z), то Ъо + шо Ф 0. Не нарушая общности, можем считать, что а0ф0 [в противном случае мы бы заменили многочлен f{z) на if(z)]. Мы будем предполагать, что вещественные многочлены и bozn + biZ7 A52) взаимно просты, т. е. что результант этих многочленов отличен от нуля2): а0 а* . Ъо Ь, . 0 а0 . 0 bo . Ъп 0 0 ап Ъп . 0 . 0 . 0 . 0 A53) Отсюда следует, в частности, что многочлены A52) не имеют общих вещественных корней и что, следовательно, многочлен /(z) не имеет корней на мнимой оси. Обозначим через к число корней f(z), имеющих положительные вещественные части. Рассматривая область в правой полуплоскости, огра- ограниченную мнимой осью и полуокружностью радиуса R(R—> со), и повто- повторяя дословно рассуждения, приведенные на стр. 472 для вещественного многочлена /(z), получим формулу для приращения arg/(z) вдоль мни- мнимой оси = (п — 2к)п. A54) г) Поскольку (—1)'-^=-^->° (°<<<Р)> причем хотя бы для одного I существуют такие значения *, при которых (—i)l—J-'. 2) ^2п—определитель порядка 2л,
534 ПРОБЛЕМА РАУСА—ГУРВИЦА И СМЕЖНЫЕ ВОПРОСЫ [ГЛ. XVI Отсюда в силу A51) и условия ао=?О получаем: A55) Пользуясь теоремой 10 § 11 (стр. 504), отсюда получаем: Л — V ух, V2, »4, •••, »271/» К*-™^'/ где Яо их . . . Я2р—1 Oq О4 . . . О2р_1 0 я0 ... а2р-2 0 Ьл ... Ы„-9. (p=l, 2, ...,n; ak = bh = Q при /с>тг). A57) Мы пришли к теореме: Теорема 23. Если дан комплексный многочлен f(z), для которого j(jz) = boZn-f-bjZ*1 -(- ... -\-bn-\-i[a,QZn-\-aizn~l-\- ...-{-an) (a0^= 0), при- причем многочлены aozn + . • • + an и fcozn + ... + bn взаимно просты (V2n =Ф 0), то число корней многочлена f(z), расположенных в правой полуплоскости, определяется формулами A56), A57). При этом х), если среди определителей A57) имеются равные нулю, то для каждой группы подряд идущих нулей (V2fc ф 0) V2/i+2=... =У2Л+2р=0 (V2ft+2p+2 ф 0) A58) при подсчете F(l, V2, V4, ..., V2ra) следует положить: signV2ft+2j=(—1) 2 signV2ft (/=1, 2, ..., р), или, что то же, A59) р+1 —5—р ПРИ Р нечетном, —e при р четном, e=(—iy sign A60) Предоставляем самому читателю проверить, что в частном случае, когда f(z) — вещественный многочлен из теоремы 23, можно получить теорему Рауса — Гурвица (см. § бJ). В заключение отметим, что в этой главе были рассмотрены прило- приложения квадратичных форм (в частности, ганкелевых форм) к одной задаче распределения корней многочлена в комплексной плоскости, к задаче Рауса — Гурвица. Между тем квадратичные и эрмитовы формы имеют интересные приложения и к другим задачам распределения корней. Читателя, интересующегося этими вопросами, мы отошлем к цитирован- цитированному нами уже обзору М. Г. Крейна и М. А. Наймарка «Метод симмет- симметрических и эрмитовых форм в теории отделения корней алгебраических уравнений», Харьков, 1936. !) См. стр. 503. 2) Удобные алгоритмы для решения обобщенной задачи Рауса—Гурвица можно найти в монографии [27] и зстатье [26]. См. также [37].
ДОБАВЛЕНИЕ НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ В. Б. Лидский Ниже рассматриваются неравенства, которым удовлетворяют собствен- собственные и сингулярные числа линейных операторов в n-мерном унитарном пространстве. Основное внимание уделяется неравенствам Неймана — Хорна и Вейля {§§ 2 и 3), которые позволяют оценивать собственные числа оператора посредством его сингулярных чисел. В § 4 устанавливается максимально-минимальное свойство сумм и произведений собственных чисел эрмитовых операторов, обнаруженное Виландтом и Амир-Моэзом. Результаты § 4 используются далее в § 5 для доказательства нера- неравенств, содержащих оценку собственных и сингулярных чисел операто- операторов А + В и АВ. В § 6 рассматривается задача о собственных числах суммы и произ- произведения эрмитовых операторов в постановке И. М. Гельфанда *). § 1. Мажорирующие последовательности В этом параграфе мы остановимся на ряде вспомогательных вопросов, связанных с конечными числовыми последовательностями. Рассмотрим две убывающие последовательности чисел, по п элементов в каждой: а1>а2>...>ап, A) ... >а'п. B) Принято говорить, что последовательность B) мажорируется последова- последовательностью A), если а1 + а2+ ... +fC<ai + a2+ ...+am A</п<тг —1) C) и C') При выполнении условий C) и C') пишут а' < а. D) *) Автор приносит благодарность А. С. Маркусу, прочитавшему рукопись настоящей статьи и сделавшему ряд полезных замечаний.
536 ДОБАВЛЕНИЕ Квадратную матрицу jT= ||*г.;||? мы будем в дальнейшем называть двояко стохастической, если матрицы Г и Г являются стохастическими» другими словами, если 0 2 «„ = 1, 1<?<п, E) 3=1 и 2 «у = 1, 1</<п. E') i=i Справедливо следующее утверждение (см. [35], стр. 63). Лемма 1. Последовательность а' мажорируется последователь- последовательностью а тогда и только тогда, когда существует двояко стохасти- стохастическая матрица Т такая, что а' = Та. F) Достаточность условия F) доказывается легко*). В самом деле, 771 Ш П И 7/1 К S a*= S S **Х=2 B *ад)<ч=2 «л-- G> ft=i fe=i j=i j=i ft=i j=i Мы положили m «)j= S ^3 A </</!). (8) ft=l Легко видеть, что 0<^и,-<;1 и n m n 2 оЪ=2B <w) = m. (9) Имеем на основании равенства G) m m m n1 2 Щ— S ctft = 2 а,— 2<о^ = j=l ft=l J=l j=i = at A — oh) + ... + ctm A — o)m) — o)m+1am+1 — ... — ем^. A0) Уменьшая слагаемые в правой части, получаем m m 2 Щ — 2 aJXXmCl—(O^+.-.+CtmCl —@m) —(Om+iCtn,—... 3=1 3=1 aro(m—m) = 0. A0') Следовательно, неравенства C) имеют место. Так как, далее, при т = п согласно (8) о), = 1 (/=1, 2, ..., п), то в силу G) справедливо и равен- равенство C'). Таким образом, достаточность условия F) установлена. Доказатель- Доказательство необходимости зтого условия требует известных усилий. Мы прове- проведем его по индукции **). В случае п = 1 последовательности содержат по *) В формуле F) под а и а' следует понимать столбцовые матрицы с элемен- элементами A) и B). **) В книге Харди, Литтлвуда и Пойа «Неравенства» приводится доказатель- доказательство, основанное на другой идее. Настоящее, более короткое, доказательство при- принадлежит А. С. Маркусу (см. [113]),
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 537 одному элементу, а^сц, и матрица Т, очевидно, существует. Предполо- Предположим, что утверждение справедливо для случая последовательностей из п—1 элементов и рассмотрим две последовательности а' и а, которые связаны соотношением а'<аи состоят из п элементов. Из условия aj-<ai и равенства C') следует, что схп-^а^сц. Поэтому найдется такое к (l<;ft<!n—1), при котором A1) Следовательно, при некотором т, 0<т<1, мы имеем . A2) Наряду с а' и а рассмотрим две последовательности по п — 1 элементов в каждой: и аь а2, ..-, aft_i, aft + aft+i —a^, aft+2, ..., an. A3') Обозначим эти последовательности через а' и а соответственно. Учитывая A1), легко заключить, что элементы последовательности a расположены в порядке убывания. Без труда проверяется также соотно- соотношение a'<a. Поэтому в силу индуктивного предположения существует такая двояко стохастическая матрица jT = |[^j||"~1, что а' — Та, или в развернутой записи: + ts, ft+iaft+2 + ...+*«, n-iCtn A < S < П — 1). Подставив сюда с^ из равенства A2), получим при l<[s<[/i — 1: «s+i = tsiV-l + + tsk A — T) Oft + tskTCtk+i + *s, ft+lOft+2 +•••+'«, n-lOn- Добавляя сюда равенство aj = xaft + (l — т)аь+1, легко убеждаемся в том, что последовательности а' и а связаны двояко стохастической матрицей О 0 0 ... т 1-т ... О „ _ tu ti2 ti3 ... tift A — T) f4feT ... 11, n-1 Лемма доказана полностью. Нам понадобится ниже также следующее предложение (см. [233]): Лемма 2. Пусть q>(t) — непрерывная выпуклая*) монотонно возра- возрастающая функция. Пусть a't > a; > ... > ap, A4) ai>a2>...>ap A5) f ...-fam<a1-fa2+ ... +aTO A<то<р). A6) *) Функция ф (t) называется выпуклой на интервале, если для любых точек этого интервала q> Г^-у-^^) < у 1<Р (г)
538 ДОБАВЛЕНИЕ Тогда Доказательство. Предположим сначала, что при т = р в соот- соотношении A6) имеет место равенство. Тогда последовательность а' мажори- мажорируется последовательностью а и согласно лемме 1 v а; = 2 tsjait l<s<p, A8) i=i где tsj — элементы двояко стохастической матрицы. В силу выпуклости <р (t) из равенства A8) следует *), что 2 *„ф(а,-). A9) Суммируя неравенства A9), получаем 2 ф (<4) <2 B *.i)ф(«;) = 2 Ф (<Ч). B0) S=l J=l S=l j=l Таким образом, в указанном случае неравенство A7) выполняется. Рассмотрим теперь общий случай. Пусть в соотношении A6) при лг = р имеет место знак <• Положим V V 2 Щ — 2 aj = c>0. }=i 3=1 Наряду с последовательностями A4) и A5) рассмотрим две последова- последовательности: a'1>a'2>...>ap>a'v+1 B1) ш ai>a2> — >ap>ap+i, B2) где ар+1 и ap+i — произвольные два числа, удовлетворяющие неравен- неравенствам B1) и B2) и соотношению ap+i = a;+1 —с. B3) Легко видеть, что при таком выборе ap+i и ар+1 последовательность B1) мажорируется последовательностью B2), и по доказанному имеем Ф К) + ф (а^) + .-..+ ф Ю + ф (c^+i) < < ф (ai) + ф (а2) + ... + Ф (ар) + ф (ар+1). B4) Так как, далее, q>(t)—монотонно возрастающая функция и ap+i> >ap+1, то ф (ap+i) > ф (ap+i) и из B4) снова следует неравенство A7). Лемма доказана полностью. Замечание. Из наших рассуждений следует, что в том случае, когда последовательность A4) мажорируется последовательностью A5) |т. е. при т=р в A6) достигается равенство], то неравенство A7) спра- справедливо для любой непрерывной выпуклой функции фB) (возрастание является излишним требованием). *) Доказательство неравенства A9) для непрерывных выпуклых функций про- проводится по индукции (см. [35], стр. 93).
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 539 § 2. Неравенства Неймана — Хорна Пусть А— линейный оператор, действующий в «-мерном унитарном пространстве В. Собственные числа неотрицательного эрмитова оператора *) У\А*Л (см. стр. 249) принято называть сингулярными числами опера- оператора А. В настоящем параграфе мы установим неравенства, связывающие сингулярные числа произведения двух операторов с сингулярными чис- числами сомножителей. Пусть уи у 2, ..., Ут и zu z2, ..., zm —два набора векторов из В. Введем сокращенное обозначение для определителя порядка т, связан- связанного с данными наборами: {Уи Zi) B/z, *i) ¦¦¦ (Ут, *i) [(Уи zj)] = (Уи »г) B/2, z2) ... (ут, z2) B5) i, zm) B/2, zm) ... (ут, zm) Рассмотрим далее неотрицательный эрмитов оператор Н, действующий в В. Собственные значения оператора Ш занумеруем в убывающем порядке: B6) Справедливо следующее предложение, принадлежащее А. Хорну ([191Ь]): Лемма 3. Пусть B7) — произвольный набор векторов из В. Тогда **) [(Hxt, xy)]</?1ft2 ... hm[Ccu Xj)]. B8) Для доказательства рассмотрим ортонормированный базис собственных векторов оператора Н: е4, е2, ..., еп B9) и разложим каждый из векторов xi (i = l, 2, ...,т) по базису B9). Вычисляя скалярное произведение, получаем: (Hxt, Xj) = 2 hs (хи es) (Xj, es) = "V A« (xi> e«) (es> xjh (Щ i, /=1, 2, ..., m. Равенство C0) позволяет рассматривать матрицу определителя [(Нхи ас,)] как результат умножения двух прямоугольных матриц размеров тхп и пхт. Разлагая определитель по формуле Бине — Коши (см. стр. 20), полу- получаем в принятых обозначениях для определителей: и Xj)]= 2 l(xu hses)][(es, Xj)]. C1) *) Мы будем пользоваться также обозначением 8), ^KVi, yj)\>Q. **) Определитель, стоящий в левой части B8), неотрицателен. Действительно, полагая И /2a;j—2/г> получаем
540 ДОБАВЛЕНИЕ Здесь //у» Ji ?* \ (*}Р l(?H, hses)]= CCl' VO ••• (*«" (xu A, e. ) ... (xm, A. e. ) C1') а суммирование ведется по всевозможным наборам натуральных чисел 1 < $! < S2 < . . . < Sm < П. Оценив правую часть C1) по неравенству Коши—Буняковского, получим: Вторая сумма в правой части неравенства C2) равна определителю- Грама [(xt, Xj)]. В Этом легко убедиться, положив в формуле C1) JET = 22, где И—единичный оператор. Впрочем, соответствующее равен- равенство отдельно доказано на стр. 230 (формула B6)). В первой сумме правой части C2) вынесем из каждого определителя C1') произведение hshs .. . hs и заменим его большим /г±Л2 ... hm~ В результате получим: [(Дав,, «,)]¦< Aft... AUto, Ъ)?. Извлекая из обеих частей этого неравенства квадратные корни; мы устанавливаем справедливость неравенства B8). Докажем далее следуда- щий факт. Лемма 4. Пусть К—произвольный оператор в В и C3) — его сингулярные числа. Тогда для произвольного набора векторов xiT хг , хт (т ^ п) справедливо неравенство [(Kxt, Kxj)] < хЖ — эсй, [{хи xj)]. C4) Неравенство C4) немедленно следует из леммы 3 при Н — К*К. Установим, наконец, еще одно вспомогательное предложение. Лемма 5. Пусть А и Л—линейные операторы в И, С —АН, и пусть as, |3S и ys (s=l, 2, . .., п)—сингулярные числа соответственна А, Б и С, занумерованные в убывающем порядке. Тогда при любом справедливы неравенства*) .. р\„. C5) Для доказательства рассмотрим ортонормированный базис ех, е2, ..., еп собственных векторов оператора С*С Последовательно применяя C4), получаем = l(ABet, ABej)]^a*al ... a^[(Bet, Be})\ < < а\а\ ... е&КК ...fa [(в„ ej)]. C6) *) При m=w в формуле C5) достигается равенство. Действительно, имеем С*С=В*А*АВ; отсюда | С*С | = | А*А | | В*В |. Поскольку определитель матрицы оператора равен произведению его собст- собственных чисел, то YiYl ¦ • • Yn=Oia|... ада| ... РД.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 541 С другой стороны, поскольку et (l^t^m) — собственные векторы <С*С, мы имеем: [(Се,, Се,)] = [(С*Сеи е,)] = уЭД • • • Y« [(««. «>)]• C7) Следовательно, C5) имеет место. Мы в состоянии теперь доказать следующую теорему, которая Является основной целью настоящего параграфа. Теорема 1 (Нейман —Хорн [218b, 191b]). Пусть А, В и С — линейные операторы в п-мерном унитарном пространстве 1$. Пусть С = АВ и пусть as, p*s и ys (s = l, 2, ..., п) — сингулярные числа опе- операторов А, В и С, занумерованные в порядке убывания. Пусть f (х) — непрерывная при ж>0 функция такая, что <p(f) = = /(е')—монотонно возрастающая выпуклая функция параметра t. Тогда при всех т^п справедливы неравенства*) 22 C8) s=l Доказательство. Пусть сначала операторы А ж В невырож- невырождены, тогда все числа as, ps и ys положительны. Логарифмируя нера- неравенства C5), получаем C9) l На основании леммы 2 имеем тп m 2 ф(InYs)< 2 ф(Inasps), l^m^n. D0) l l Так как ф@ = /(е')» то отсюда следует C8). В случае вырожденных операторов неравенства C8) устанавливаются по непрерывности. Замечание 1°. В случае /(ж) = х°(а>0) получаем m m Sv.e<S°?P? A<™</г). D1) 8=1 8=1 В таком виде неравенства C8) встречаются в приложениях чаще всего. Замечание 2°. При т = п неравенство C9) превращается в равен- равенство (см. сноску на стр. 540). Поэтому при m = n неравенство D0) спра- справедливо для любой непрерывной выпуклой функции ф(?) (см. замечание к лемме 2). В частности, неравенство D1) при т = п справедливо и для о<0. Замечание 3°. Пусть — сингулярные числа оператора А и пусть *) Неравенства C8) установлены А. Хорном в работе [191Ь]. В работе п п Дж. Неймана [218Ь] доказано лишь, что 2 Yf< 2 asPf • °Днак0 развитый там Sl Sl 2 2 S=l S=l метод позволяет доказать неравенства C8) в общем виде.
542 ДОБАВЛЕНИЕ — сингулярные числа оператора А1 {I — натуральное число). Тогда при любом с>0 и любом 1 S,2 g=l S=l Неравенства D2) докажем индукцией по I. При 1 = 1 соотношение D2) очевидно; пусть оно выполняется для I — 1. Так как А1 = А1~1-А, то согласно D1) т т 2 al s < S °f-i. -а?« 1 <m < "• D3> S=l 8=1 Применяя к правой части D3) неравенство Гёльдера*) с получаем a- D4> B .)B D s=l s=l По предположению индукции, имеем для первой суммы в правой части D4): B ,)(S )B) S=l S=l 8=1 Учитывая, что во второй сумме правой части D4) q — l, легко полу- получаем из D4): 2f,.2№ S=l S=l что и требовалось доказать. В частности, при о = 2 и т = п из формулы D2) следует, что Sv(A*lAl)<CSv(A*AI. D5) § 3. Неравенства Вейля В настоящем параграфе мы выведем принадлежащие Г. Вейлю нера- неравенства, которые позволяют оценивать собственные числа линейного оператора А посредством его сингулярных чисел**). Нам понадобится следующее важное предложение: Лемма 6. Пусть Ks (s = l, 2, ...,/г) — собственные числа линей- линейного оператора А, занумерованные так, что \%i\>\X2\>...>\K\, D6) и пусть D7) — сингулярные числа этого оператора. Тогда при любом т^п справед- справедливы неравенства ... aTO. D8) *) См. [35], стр. 40. **) Определение см. в § 2.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 543 Для доказательства рассмотрим ортонормированный базис в котором матрица оператора А имеет треугольный вид. Существование такого базиса устанавливается теоремой Шура (см. гл. IX, стр. 242). Мы воспользуемся леммой 4 и двумя способами оценим определитель ь. Aet)Y?. E0) Пусть аи — элементы матрицы оператора А в базисе D9). Имеем п г. Поскольку ai}- = 0 при i > /, то i Aej E1) И g et) = jj il g _ = min(k, I)). E2) Формула E2) позволяет записать определитель E0) в виде следующего произведения двух определителей: [(Aeh, «11 «12 «13 «lm 0 «22 «23 «2И, 0 ... 0 ... «33 • • • «3m 0 0 0 amm «и 0 0 0 «12 «22 0 0 «13 • • • «23 - - - a33 0 ... «27П amm .E3> Поскольку ац = К} и оба определителя в правой части E3) равны произ- произведению диагональных элементов, то Л2|2 ... |^т|2- E4) 1(Аек, С другой стороны, в силу леммы 4 [(Aekt \ ... al, E5> так как [(еь, ег)]™ = 1. Неравенства D8) следуют теперь из соотношений E4) и E5). Лемма 6 доказана *). *) Эту лемму можно доказать иначе, если воспользоваться теоремой 4 гл. III,. согласно которой произведение 'к^къ ^т является собственным числом ассоци- ассоциированной матрицы Stm для матрицы А. Пусть х—соответствующий собственный вектор 8lm; умножая равенство 8lma?=XjX2 ^W яа сопряженное, получаем Матрица 8l^2tTO является ассоциированной для А*А и, следовательно, наиболь- наибольшее собственное число 8ljj8lm равно afa| a^. Поскольку дробь в правой части последнего равенства не превосходит afa| am, то мы приходим к нера- неравенствам D8).
-544 ДОБАВЛЕНИЕ Используя неравенства D8), мы сейчас докажем следующую тео- теорему: Теорема 2 (см. [257]). Пусть А—линейный оператор и пусть Я8 и as (s = I, 2, ..., п) — его собственные и сингулярные числа, занумеро- занумерованные так же, как и в лемме 6. Пусть f(x)—непрерывная при ж!>0 функция такая, что ф(?) = /(е')—монотонно возрастающая выпуклая функция параметра t. Тогда при любом т^.п справедливы неравенства 2/A1К2 /(«*)• E6) s=l s=l Доказательство. Если оператор А невырожден, то согласно D8) получаем: т т 2ln|As|<Slnas E7) s=l s=l при всех т*Сп. Отсюда на основании леммы 2 уже следуют неравен- неравенства E6). Если оператор А вырожден, то неравенства E6) могут быть получены по непрерывности. Теорема доказана. Замечание 1°. При т = п неравенство D8) превращается в равен- равенство, так как в этом случае равенство имеет место в формуле E5). Сле- Следовательно, при т — п равенство достигается и в E7). Используя заме- п п чания к лемме 2, мы можем заключить, что 2 / (I ^s I) ^ 2 / (as) Для 8=1 8=1 любой функции f(x), если только функция <f(t) = f(e) выпукла. Воз- Возрастание оказывается излишним требованием. Например, при любом вещественном о 2|а*|в<2а?. E8) 8=1 S=l Замечание 2°. Рассмотрим функцию f(x) = ln(l + xz), x>0, E9) тде z фиксировано и положительно. Легко проверить, что функция E9) удовлетворяет всем условиям теоремы 2. Поэтому при любом т, l^^ .имеем: 2 (+||к 2 8=1 *=1 Потенцируя, получаем неравенство m m П A+ 1 А, |*)<:П (*+<*.*). F0) 8=1 в=1 которое используется в теории интегральных операторов. § 4. Максимально-минимальные свойства сумм и произведений собственных чисел эрмитовых операторов В настоящем параграфе мы получим обобщение ряда результатов, относящихся к экстремальным свойствам собственных чисел эрмитовых операторов (см. § 7 гл. X). 1°. Для дальнейшего удобно придать теореме 12 гл. X, устанавли- устанавливающей основное максимально-минимальное свойство собственных чисел, несколько иную формулировку.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 545 Пусть А— эрмитов оператор, действующий в n-мерном унитарном пространстве В, и пусть ,.->К F1) —его собственные числа. Обозначим через JBq ^-мерное подпространство пространства В. Справедлива следующая формула: Яд = max min (Ax, x). F2) Rq ж?Л В этой формуле минимум берется по всем нормированным векторам ас, принадлежащим некоторому фиксированному подпространству Bq, а затем берется максимум по всем ^-мерным подпространствам. Равенство F2) составляет содержание теоремы 12 гл. X и представляет собой видоиз- видоизмененную запись формулы G9). Действительно, всякое g-мерное подпро- подпространство JBg может быть рассмотрено как совокупность векторов, удов- удовлетворяющих некоторой системе п — q независимых линейных уравнений Lh (х) = О, А: = 1, 2, ..., п — q F3) (см. обозначения на стр. 288). Если ввести эрмитову форму В (х, х) = п = 21 I xs |2 и выбирать лишь нормированные векторы х, то тогда s=l В(х, x) = i и ~g-, Lu Lz, ..., Ln_g) = min (Ax, x). F4) (x, oc)=l В силу G9) гл. X мы получаем: Я(п-д+1) = max min (Ax, x), F5) где п—7+1—номер собственного числа оператора А при нумерации, принятой в гл. X (в возрастающем порядке). Легко сообразить, что при новой нумерации Я(„^+1) = Яд. Таким образом, соотношение F2) действи- действительно имеет место. Легко также видеть, что согласно F2) %i = max (Ax, х), F6) (ж, а>)=1 Я„= min (Ax, х). F6') (ж, а?)=1 Непосредственным обобщением равенства F6) является следующее пред- предложение, принадлежащее Фаню [177а]. Теорема 3. Для любого эрмитова оператора А с собственными числами F1) и любого т*Сп справедлива формула ^1 + Я2+...+Я„,= max (Axt, xt). F7) Максимум в правой части F7) берется по всем системам взаимно орто- ортогональных нормированных векторов xl7 X2, ..., хт. F8) 35 ф. р. Гантмахер
546 ДОБАВЛЕНИЕ Для доказательства рассмотрим ортонормированный базис собствен- собственных векторов оператора А: п Полагая аг,= 2 (жи es)eg, легко найдем: 8=1 п (Axt, xt) =YK\ (&s, es) |2. F9) Расширим систему F8) до ортонормированного базиса в В и заметим, что п SI//V.. „ \ |2 //v.. /у..\ Л С7О\ п Матрица || |ECj, es) |21|", таким образом, является двояко стохастической. Из равенств F9) следует, что последовательность (Axt, xt), i = l,2, ...,n, G2) связана с последовательностью F1) двояко стохастической матрицей. На основании леммы 1 (см. A0')) мы заключаем, что т т Так как, далее, при 5Сг = ег A<;г<;т) в формуле G3) достигается равен- равенство, то теорема доказана. Если наряду с оператором А ввести оператор —А, собственные числа которого, очевидно, равны —Ks (s=l, 2, ..., /г), то на основании доказанной теоремы можно легко заключить, что т К + К-1 + • • • + К-т+1 = min 2 {АЯъ *0- G^) Эта формула обобщает равенство F6'). Замечание. Из неравенств G3) на основании леммы 2 заключаем, что для любой непрерывной выпуклой возрастающей функции ф (t) и любого т имеет место неравенство 2 г=1 где an = (AXi, xt). 2°. Дальнейшее обобщение формулы F2) связано с установлением максимально-минимальных свойств сумм собственных чисел эрмитова оператора А вида где 1<д1<г2< • • • <*г<и — некоторый набор натуральных чисел. Соот- Соответствующая теорема принадлежит Г. Виландту [260е]. Сохраняя в основном ход рассуждений Виландта, мы докажем более общее предложение, установленное Амир Моэзом [149]. Этим предложе- предложением мы воспользуемся и при оценке произведений собственных и сингу- сингулярных чисел.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 547 Предварительно введем некоторые обозначения. Пусть l<ii<;2<...<im<n G6) — фиксированный набор т натуральных чисел. Рассмотрим некоторую цепочку последовательно вложенных подпространств пространства JS: .Bijez.Bi.c... czBim, G7) где индекс указывает размерность подпространства. Пусть, далее, xh, хч, .... ачт G8) — система т взаимно ортогональных и нормированных векторов: (ав«л,а5|л.) = 8№, G9) таких, что «iAei?iA (A = l, 2, ...,т). (80) Условимся называть систему векторов G8) системой, подчиненной цепочке G7). Сформулируем и докажем теперь следующую лемму: Лемма 7 (см. [149]). Пусть Л—эрмитов оператор с собственными числами F1) и пусть (81) — монотонно возрастающая по каждому аргументу функция т веще- вещественных переменных (т*Сп)*). Пусть G7) — некоторая цепочка под- подпространств, построенная по фиксированному набору G6), и пусть xh, xh, ..., ач™ (82) — подчиненная этой цепочке система векторов. Обозначим через Рт опе- оператор проектирования на подпространство [xh, xh, ..., xim], (83) натянутое на векторы (82), и пусть Ai>A2> ... >A,m — собственные числа эрмитова оператора РтЛРт, (83') рассматриваемого в подпространстве (83)**). Тогда ф (Ч. А*г> • • •' Aim) = max min ф (I1? 12, ..., ^»). (84) Поясним, что в формуле (84) сначала выбирается некоторая цепочка подпространств и находится минимум по всем подчиненным ей системам векторов; после этого берется максимум по всевозможным цепочкам. Доказательство формулы (84), очевидно, сводится к доказательству следующих' двух утверждений. *) Предполагается, что область определения функции ( содержит куб a<*s<P. *=1. 2 т, где а и р — границы спектра оператора А. **) Определение оператора проектирования дано на стр. 244. 35*
548 ДОБАВЛЕНИЕ A. К любой цепочке G7) всегда можно подобрать такую подчинен- подчиненную систему G8), что ф (Ij Д2, . . ., 1т) < ф {%iv Ki2, ..-, hm). (85) B. Существует такая цепочка G7), что для любой подчинённой ей системы векторов выполняется неравенство Ф (Kh, Ki2, ..., Kin) < ф (Ки %,..., Хт). (86) Докажем сначала утверждение В. Пусть еи ег, ..., еп (87) — базис собственных векторов оператора Л, соответствующих собственным числам F1). Выберем следующую цепочку подпространств: Bik = \eue2, ...,eih], k = l, 2, ..., т, (88) и покажем, что в этом случае неравенство (86) выполняется всегда. Пусть G8) — система векторов, подчиненная цепочке (88), и пусть Si—некоторое Z-мерное подпространство, принадлежащее оболочке (83). Как мы видели [см. F2)], при любом выборе Si min (РтАРтх, ж). (89) (х, а,)=1 Заметив, что при x^Si {РтАРтх, х) = (АРтх, Ртх) = (Ах, х), положим Si = [xh, xh, ..., xit\. Легко видеть, что при этом Sid Hi, вследствие чего мы получаем: min (Ax, x)> min (Ax, х). (90) же*, х?вг (х, х)—1 (ж, as)=l Но минимум в правой части (90) достигается на собственном векторе e-t и равен %i . Сравнивая (90) и (89), мы заключаем, что Отсюда в силу возрастания функции (81) следует (86). Таким образом, утверждение В доказано. Утверждение А доказывается труднее. Мы проведем его по индукции, предполагая, что для операторов, действующих в (п — 1)-мерном про- пространстве, это утверждение справедливо. Заметим, что в случае п = 1 (пространство одномерно) Х^ = Kit и неравенство (85) имеет место для любой функции ф(<). Переходя к случаю n-мерного пространства, мы можем считать, что гп<Сп. Действительно, при т = п подпространство (83) совпадает со всем пространством, AS = AS (s = l, 2, ..., п), и, следовательно, неравенство (85) справедливо. При m<in мы разберем два подслучая: I) Пусть im<Zn, тогда существует некоторое (п — 1)-мерное подпро- подпространство Hn-i, содержащее все подпространства цепочки G7). Пусть JPn-i — оператор проектирования на подпространство Bn-i. Введем в Jin-t
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 549 эрмитов оператор An-^Pn-iAPn-i. (91) Ясно, что для всех ж ? Нп-\ имеет место равенство (An~iX, ас) = (Ах, ж). Если K's (s = 1, 2, ..., п — 1) — собственные числа оператора An-i, то в силу теоремы 14 (стр. 291)*) (s = l, 2, ...,п—1). (92) По индуктивному предположению, для любой цепочки G7) в Bn-i найдется подчиненная ей система векторов G8) таких, что Отсюда в силу (92) сразу следует, что неравенство (85) в рассматриваемом случае действительно имеет место. 2) Рассмотрим теперь случай tm = n(m<n). Пусть im = n, u+i = n-l, ..., im-p = n — р (p>0) (93) — последние элементы набора G6), и пусть число п—р—1 уже не при- принадлежит набору G6). Обозначим через im- наибольший из оставшихся номеров набора G6). Очевидно **), im-<n—p—2. (94) Цепочка подпространств G7) в рассматриваемом случае может быть записана следующим образом: Bh а Вн с: ... с: В1т, а Вп-Р а Вп-р+1 а ... а Вп. (95) Пусть еп-Р, еп_р+1, ..., е„ (96) — собственные векторы оператора А, занумерованные так же, как и в (87). Обозначим через i?n_t (n—1)-мерное подпространство, содержащее векторы (96) (их всего р-\-1) и подпространство Rtm,. Такое подпространство действительно существует, ибо + n —р—2 = п —1. Наряду с цепочкой (95) рассмотрим цепочку Bi± cr Bi2 с: ... с: Bim, cr Bn-p-i с: Мп-Р а ... с: Вп-и (97) которая получается из цепочки (95), если каждое подпространство в (95) заменить его пересечением с подпространством Bn-i- Ясно, что первые т' подпространств цепочки (95) при этом не изменяются, так как они со- содержатся в Bn-i, последующие подпространства цепочки уменьшат свою размерность на единицу ***). Введем снова оператор Ап-^ на *) Напомним, что в § 7 гл. X собственные числа занумерованы в порядке возрастания. Неравенства (92) легко также следуют из формулы F2). **) Может случиться, что номера (93) исчерпывают весь набор G6), тогда для сохранения единообразия мы будем считать im,=0, а соответствующее подпро- подпространство Rim-—состоящим из нуль-вектора. ***) Если размерность пересечения не уменьшается, то, очевидно, пересечение всегда можно сузить так, чтобы подпространства в цепочке (97) имели указанные размерности.
550 ДОБАВЛЕНИЕ подпространстве Bn-i по формуле (91). По индуктивному предположению, к цепочке (97) можно подобрать подчиненную систему векторов xlm., асп-р-ц .... xn-i (98) таких, что В правой части штрихами обозначены собственные числа оператора Ап-^. Согласно (92) имеем: ^i1>Ai1, ^,-2>Я{2, ..., ^im>^im,- A00) Разумеется, на основании (92) мы не можем утверждать, что ^n-p^^n-p-ii Ki-p+l ^ ^n-p, •••» "кп~> "к-п-у A00') Однако поскольку векторы (96) лежат в подпространстве Бп-и они явля- являются собственными векторами оператора An-i- Соответствующие им соб- собственные числа Кп-р>А„_р+1 > ... >Я,„ во всяком случае не меньше, чем числа K'n-p+i > к'п-р > ... > ^n-р, которые являются наименьшими собствен- собственными числами оператора An-i- Таким образом, A00') имеет место, и в силу A00) и A00') мы заключаем, что ф(^1ц ^{2> • • •> ^im» Ki-p-l, Ki-p) -^ ф (^?i. ^i2. • • ч ^гтч hi-p, • ¦ •, ^n)- A01) Это неравенство вместе с (99) приводит к доказательству утверждения А, поскольку система векторов (98) подчинена не только цепочке (97), но и исходной цепочке (95). Таким образом, лемма 7 доказана полностью. Из доказанной леммы вытекает следующая теорема: Теорема 4 (см. [260е]). Пусть А — эрмитов оператор с собствен- собственными числами А!>А2> ... >Я„. Пусть A02) фиксированный набор п натуральных чисел; тогда т max min 2 (^*ifc, *ifc), (ЮЗ) еде минимум берется по всем системам векторов Xtk (/c=l, 2, ...,т), подчиненным цепочке *) JB4l a JSi2 cr ... cr Bim. Для доказательства заметим, что матрица оператора РтАРт (см. лемму 7) в ортонормированием базисе (82) имеет вид так как (PmAPmxik, xih,) Поэтому сумма, стоящая в правой части (ЮЗ), есть след оператора РтпАРт и, значит, равна 11 + А2+...+Ят. Формула A03) после этих замечаний следует из леммы 7 при ф(*1, hi ¦ ¦ -1 tm) = 'l + *2+ ¦ • • +tm- Теорема 4 доказана. •) Определение см. на стр. 547.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 551 Укажем, что формула F2), равно как и F7) и G4), является частным случаем теоремы 4. В заключение установим следующее утверждение, тоже непосред- непосредственно вытекающее из леммы 7. Теорема 5 (см. 1149]). Пусть А —неотрицательно определенный эрмитов оператор, и пусть — его собственные значения. Пусть l<0"i<02< .. - <tm-<n — фиксиро- фиксированный набор т натуральных чисел. Тогда XhKi2 ¦ ¦ ¦ hm= max min Det||Dse,fc, se,fc.)||?fc.=1, A04) где минимум берется по всем системам векторов, подчиненным цепочке Для доказательства теоремы достаточно в формуле (84) положить ф(^, t2, ..., <т) = Мг.-- tm (ts>0, s = l, 2, ...,т) и заметить, что стоящий в правой части A04) определитель равен лД2 ... Хт. Теоремами 4 и 5 мы воспользуемся в следующем параграфе при выводе неравенств для сумм и произведений собственных и сингулярных чисел. § 5. Неравенства для собственных и сингулярных чисел сумм и произведений операторов Пусть А и В—два эрмитовых оператора в n-мерном унитарном про- пространстве В, собственные числа которых известны. Теоремы предыдущего параграфа дают возможность оценить суммы вида G5) собственных чисел оператора А-\-В. Близкие по характеру оценки мы получим и в случае произведения операторов. Мы начнем со следующего предложения. Теорема 6 (см. [260е]). Пусть А, В и С—эрмитовы операторы такие, что С— А-\-В; пусть Ks, \x,su vs(s = l, 2, ..., п) — собственные числа операторов А, В и С соответственно, занумерованные в порядке убывания. Тогда для любого набора т натуральных чисел 1 <к <Ск< • • • <Хт<п A05) справедливо неравенство . A06) При т = п в формуле A06) достигается равенство. Доказательство. По заданному набору A05) выберем такую цепочку подпространств ... czBim, A07) чтобы для любой системы векторов xh, xi2, .... xim, A08) подчиненной цепочке A07), выполнялось неравенство т ... +v, < 2 (CXi Xi ). A09) fti v, < 2 (CXi Xi ft=i Такая цепочка A07) найдется в силу теоремы 4 (ср. лемму 7
552 ДОБАВЛЕНИЕ Заметив, что т т т 2 (C3tkh, xlh)= 2 (Axih, xik)+ 2 (Bxih, xif), A10) ft—1 R=x 1 ft 1 подберем такую систему векторов, подчиненную *) цепочке A07), чтобы т 2 (Axi, Xi) ^ %i -\-Ki -f-... +Я{ . (Ill) Такую систему векторов можно найти также на основании теоремы 4 (ср. лемму 7, А). Так как, далее, в силу теоремы 3 для любой ортого- ортогональной нормированной системы Xi , Xi , ..., Xi m. 2 (BXi SCj ХЦ1 + Ц2+ • • • +Hm, A12) то неравенство A06) следует из A09), A10), A11) и A12). При т = п A06) превращается в равенство, поскольку SpC = Sp^l + SpJB. Теорема 6 доказана полностью. Следствие. Для любой непрерывной выпуклой функции ф(?) спра- справедливо неравенство 2фКJфЫ (ИЗ) в= 1 8= 1 Этот результат следует из неравенств A06) на основании замечания к лемме 2. Оказывается, неравенства типа A06) справедливы для сингулярных чисел произвольных линейных операторов. Для доказательства соответ- соответствующего предложения мы используем следующее замечание: пусть А — матрица некоторого линейного оператора Л в ортонормированном базисе, и пусть ai>a2>...>an — сингулярные числа А. Рассмотрим квадрат- квадратную матрицу A-, ,. 0 порядка 2п. Мы сейчас покажем, что собственные числа матрицы А равны Jt ctg (s = l, 2, ..., и). Действительно, раскрыв характеристический опре- определитель А (К) = | Л — ХЕъп | по формуле A6) стр. 59, легко найдем: Отсюда сразу следует сформулированное утверждение. Сопоставив каждому оператору А оператор А, действующий в 2/г-мер- ном унитарном пространстве, мы на основании теоремы 6 установим сле- следующее предложение: Теорема 7 (см. [149]). Пусть А, В и С—линейные операторы в п-мерном унитарном пространстве. Пусть С = А-\- В, и пусть as, |3S и ys (s = l, 2, , п) — сингулярные числа операторов А, В и С, занумеро- занумерованные в порядке убывания. Тогда для любого набора натуральных *) Определение см. на стр. 547.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 553 чисел A05) справедливо неравенство ¦ • • +Рт- Замечание. Так как собственные числа операторов А, В и С рас- располагаются относительно начала координат симметричными парами, нера- неравенства A14) на основании теоремы 6 легко обобщаются следующим образом: ± (Yi,-S) ± (^2-%) ± • • • ± 0Yiro-«4j<Pi+ fc+ ¦ • Поскольку выбор знака перед каждой скобкой произволен, то Используя лемму 2, мы можем на основании неравенств A14) заключить, что для любой непрерывной возрастающей выпуклой функции ф (t), t > 0r и любого т^п m m 2 <р(|ъ-«.|К 2ф(Р.П- 1 l 2 р(|ъ|К 2 8=1 S=l Перейдем теперь к оценке сингулярных и собственных чисел произве- произведений двух операторов. Основной в этом направлении является следующая теорема, обобщающая неравенство C5) (см. лемму 5). Теорема 8. Пусть А, В и С—линейные операторы в п-мерном унитарном пространстве. Пусть Q — AB и пусть as, |3g и ys (s = l, 2, ..., п) — сингулярные числа операторов А, В и С соответ- соответственно, занумерованные в порядке убывания; тогда для любого набора- натуральных чисел 1<г1<г2<...<гт<п A15) справедливы неравенства • • • a'mPiP2 ¦ • • Pm, A16) ,2 m • • ат$ф2 ... p1^. A16') Доказательство этой теоремы вполне аналогично доказательству тео- теоремы 6. Докажем сначала неравенства A16'). На основании леммы 4 § 2 получаем: [(Cxik, Cxik)] = [(ABxih, ABxlh)]<.<№ ... a2m[{Bxih, Bxih)] A17) для любой системы векторов а?, (fc = 1, 2, ..., т). По данному набору натуральных чисел A15) найдем на основании теоремы 5 такую цепочку подпространств, чтобы для любой подчиненной ей системы векторов выпол- выполнялось неравенство АЧЧ ¦ ¦ • Y?m < \{C*Cxih, хф A18) после чего на основании той же теоремы 5 найдем такую подчиненную выбранной цепочке систему векторов, чтобы л xth)] < Р1Д ... p1m. (И9> Очевидно, неравенство A16) уже следует из неравенств A17), A18) и A19). *) По поводу этих неравенств см. [212е].
-554 ДОБАВЛЕНИЕ Для доказательства неравенства A16') следует повторить рассужде- рассуждение применительно к оператору С* = В* А* и воспользоваться при этом тем фактом, что сингулярные числа у сопряженных операторов равны {см. (82), стр. 251]. Теорема 8 доказана полностью. Заметим попутно, что сингулярные числа операторов АВ и ВА в общем случае не совпадают. Отметим еще следующий факт, вытекающий из теоремы 8: Теорема 9. Пусть Аи В—два положительно определенных эрми- эрмитовых оператора с собственными числами Xs и ц8 (s = 1, 2, ..., п), занумерованными в убывающем порядке, и пусть vt>v2> ...>vn A20) — собственные числа оператора АВ. Тогда для любого набора A15) выполняется неравенство V^Vjj . . . ¦Vim<litki2 ¦ ¦ • hn№№ ¦¦¦Vm- A21) Доказательство. Так как оператор В невырожден, то АВ = B~lh {В1/2АВ1/2) В1'2 = В'1'2 {(А1/2ВУУ (A1/2J3Va)} BVi A22) и, следовательно, собственные числа A20) являются квадратами сингу- - 1/о тЛ/а лярных чисел оператора А -В . Применяя к произведению А1/2'В1/2 неравенство A16), получаем A21). § 6. Другая постановка задачи о спектре суммы и произведения эрмитовых операторов В настоящем параграфе мы сопоставим набору собственных чисел Vi > v2 > ... > vn суммы эрмитовых операторов А п В точку в п-мерном координатном пространстве и рассмотрим множество точек, получающихся "при сложении всевозможных операторов А и В с данными спектрами. Аналогичную задачу мы рассмотрим и в случае произведения операторов. Постановка задач на собственные значения в указанной геометриче- геометрической форме принадлежит И. М. Гельфанду (см. по этому поводу [76], 1106], [113], [191с]. Мы приведем здесь лишь аналоги теорем 6 и 9, первоначально полученные другими методами. 1° Нам понадобится геометрическое описание всех последовательно- последовательностей а', которые мажорируются данной последовательностью а. Соответ- Соответствующую лемму мы установим, используя некоторые результаты Фро- -бениуса, Кёнига и Биркгофа. Начнем со следующего замечания. Пусть Т = || tjj II™ — квадратная матрица. Нормальным набором эле- элементов матрицы Т назовем набор п элементов этой матрицы, взятых що одному из каждой строки и каждого столбца, т. е. набор вида *iii» %2. • • •' tn*n> A23) тде /i, /г' • • ч In — некоторая перестановка индексов 1, 2, . . ., п. Справедливо следующее предложение, имеющее самостоятельное зна- значение в ряде разделов математики. Лемма 8 (Фробениус — Кёниг [182е], [203]). Пусть Т=\\ tu ||?— квадратная матрица порядка п с неотрицательными элементами, и пусть каждый нормальный набор матрицы Т содержит нулевой элемент; тогда •существует состоящий из нулей минор матрицы Т размеров р X q такой, что р -(- q = и4-1.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 555 Доказательство *) мы проведем по индукции, предположив, что для матриц всех порядков /с < п лемма справедлива. Случай п = 1 тривиален. Обращаясь к матрице Т порядка п, мы можем, очевидно, считать, что не все ее элементы равны нулю. Пусть для определенности tnn Ф О- (этого всегда можно добиться перестановками строк и столбцов, так как при этом условия леммы не нарушаются). Для матрицы Т\ = || tij ||"~x, очевидно, выполняются условия леммы, и по индуктивному предположению найдется состоящий из нулей минор Mi матрицы Ti размеров pt X qt: Pi + qi = n. A24) Не ограничивая общности, можно считать, что минор Mi расположен на пересечении первых pt строк и первых q± столбцов матрицы Т. Разобьем матрицу Т следующим образом на блоки: 91 Р\ и рассмотрим квадратные матрицы Тч и Т3 размеров pt X p± и q^ X qt. Хотя бы одна из матриц Тг или Т3 обладает тем свойством, что каж- каждый нормальный набор ее элементов содержит нулевой элемент (в про- противном случае можно было бы образовать нормальный набор положитель- положительных элементов всей матрицы Т). Пусть указанным свойством обладает матрица Т2- По предположению индукции, Т2 обладает состоящим из одних нулей минором Мг размеров р2 X qz' A + 9a = Pi + l- A25) Очевидно, можно считать, что минор Af2 расположен в строках матрицы Т с номерами 1, 2, . . ., р2 и в столбцах с номерами qt -f I, ql ~\- 2, . . . . . ., ql -\- q2. Легко видеть, что при этом минор матрицы Т, располо- расположенный в строках с номерами 1, 2, . . ., р2 и в столбцах с номерами 1, 2, . . ., qu ^i+l, . . ., ?i + <?2, состоит из одних нулей, причем в силу A24) и A25) Рг + (9i + Яг) = q\ + Pi +1 = п +1. Лемма 8 доказана. Следствие. Пусть элементы квадратной матрицы Т неотри- неотрицательны и сумма элементов в каждой строке и в каждом столбце равна (о > 0. Тогда матрица Т обладает нормальным набором положительных элементов. В самом деле, допустив противное, мы сможем согласно лемме 8 указать минор матрицы Т размеров рХ q, p -\- q = п -}-1, состоящий из одних нулей. Легко видеть, что сумма элементов матрицы Т, располо- расположенных в тех р строках и тех q столбцах, на пересечении которых распо- расположен данный минор, равна рсо -\- qa = (п -(- 1) и- Последнее, однако, невозможно, так как сумма всех элементов матрицы Т равна псо. Условимся в дальнейшем матрицу Р порядка п называть матрицей перестановки (permutation matrix), если она обладает нормальным набо- *) См. [1721.
556 ДОБАВЛЕНИЕ ром элементов, каждый из которых равен единице, а все остальные эле- элементы матрицы равны нулю. Ясно, что умножение матрицы Р на столбце- вую матрицу х приводит к некоторой перестановке элементов матрицы х~ Так как и, обратно, каждая перестановка элементов х порождает некоторую матрицу Р, то всего существует п\ различных матриц пере- перестановок. Докажем теперь следующее предложение, принадлежащее Биркго- фу [153]. Лемма 9. Множество всех двояко стохастических матриц сов- совпадает с выпуклой оболочкой матриц перестановок. Другими словами, любая двояко стохастическая матрица Т может быть представлена в виде T = %x8Ps, A26) s=l где xs>0, 2 t. = l, A27) s=l a Ps — матрицы перестановок. Обратно, правая часть A26) при усло- условии A27) является двояко стохастической матрицей. Последняя часть утверждения почти очевидна. В самом деле, сумма элементов г'-го столбца матрицы xsPs равна х8. Поэтому сумма элементов п! i-ro столбца правой части A26) равна 2 тв = 1. Аналогично в слу- 8=1 чае строк. Доказательство первой части леммы существенно использует пре- предыдущую лемму 8. Пусть Т — двояко стохастическая матрица. Тогда по следствию- из леммы 8 существует положительный набор элементов *ijn ^2j» •••' Inin A28) этой матрицы. Пусть mint.je = xl (ti>0), A29) s и пусть Pi — матрица перестановки, у которой на местах элементов набора A28) стоят единицы. Рассмотрим матрицу В1 = Т-т1Р1. A30) В силу A29) элементы матрицы В неотрицательны, а сумма элементов в каждой строке и в каждом столбце Вг равна 1— т1 = со1>О. Заметим, что число нулевых элементов В± во всяком случае на единицу больше, чем у матрицы Т. Если o>i = 0, то i?t = 0, и лемма доказана. Если toj > 0, то Bi обладает нормальным набором положительных эле- элементов, и, повторив рассуждение, мы придем к неотрицательной матрице В2 — Т — х1Р1 — х2Р2, число нулевых элементов которой уже на два больше, чем у Т. Суммы элементов в столбцах и строках Вг равны 1 — Tt — т2 = со2>О. Ясно, что на некотором fc-мшаге (к < п2 — п -f- 1) этот процесс приведет к числу со^ = 1 — %% — х%— . . .— т^ = 0 и, сле- следовательно, к матрице Bh = T-t1Pl-x2P2- ... —xhPh = 0.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 557 Действительно, при к = пг — п -\- 1 матрица Bh уже не имеет нормаль- нормального набора положительных элементов (у нее и2 — п -\- 1 нулевых эле- элементов), и, следовательно, toft не может быть положительным числом. Лемма 9 доказана. 2° Условимся каждой числовой последовательности (хи %2> - • ч Хп) •ставить в соответствие точку в n-мерном координатном пространстве 1)п. Пусть а1>а2> ...>ап A31) — некоторая последовательность. Рассмотрим п! последовательностей, получающихся иэ последовательности A31) всевозможными перестанов- перестановками ее элементов a4l, ai2, ..., ain. A31') Сопоставив каждой последовательности A31') точку в 1)п, обозначим через К (а) линейную выпуклую оболочку, натянутую на эти точки. Легко видеть, что множество К (а) состоит из всех точек n! A32) тде ts > 0, 2 ts = 1, Р& — матрицы перестановок и a — столбцевая 8=1 матрица с координатами A31). Заметим попутно, что каждая точка принадлежит множеству К (а) вместе с п\ точками, получающимися перестановками ее координат. Для доказательства достаточно умножить равенство A32) на матрицу пере- -становки и воспользоваться тем, что произведение матриц перестановок есть матрица перестановки. Мы теперь без труда докажем следующее предложение: Лемма 10. Для того чтобы последовательность а'1>а2>...>а'п A33) мажорировалась последовательностью щ^>а2^> ... > <х„, необходимо и достаточно, чтобы точка а' с координатами A33) принадлежала ¦выпуклой линейной оболочке К (а) *). Доказательство леммы. Пусть сначала а'?К (а), тогда и! a' = %TsPsa, A34) s=l я! где ts>0, 2Ts==l' а Р* — матрицы перестановок. Следовательно, 8=1 по лемме а' = Та, A35) где Т — двояко стохастическая матрица, и значит, согласно лемме 1 последовательность A33) мажорируется последовательностью A31). *) Это утверждение было установлено Радо [234], использовавшего при дока- доказательстве теорему об отделении выпуклых множеств плоскостями. Другое доказа- доказательство, основанное на теореме о крайних точках выпуклых множеств, дано в работе [113], содержащей обстоятельный обзор литературы. Идея приводимого здесь доказательства, опирающегося на лемму Биркгофа, -принадлежит А. Хорну [191d].
558 ДОБАВЛЕНИЕ Пусть теперь, наоборот, известно, что а' < а, тогда по лемме 1 найдется дважды стохастическая матрица Т, с которой выполняется равенство A35). Этому равенству согласно лемме 9 можно придать вид A34), откуда уже следует, что а'?К (а). 3° Перейдем теперь к теоремам, составляющим цель настоящего параграфа. Теорема 10 (см. [106а]). Пусть А и В— эрмитовы операторы в п-мерном унитарном пространстве с собственными значениями ---Ж A36) ••• >Цп- A37) Пусть С = А-\-В и пусть v1>v2>...>v7l A38) — собственные числа С. Обозначим через Kt выпуклую линейную обо- оболочку точек (Я,! + [ih, Kz + ph, ...,K + Vin) (I39) и через К2 выпуклую линейную оболочку точек (берутся всевозможные перестановки j\, /2, ..., jn чисел 1, 2, ..., п). Тогда точка v = (yu v2, ..., vn) принадлежит пересечению оболочек Kt и Kz. Доказательство. Рассмотрим точку (\i-lu v2—%2, ¦¦-, vn —Я«). A41) Согласно теореме 6 [см. неравенства A06)] последовательность, полу- полученная упорядочением координат точки A41), мажорируется последова- последовательностью \аи |л2, ..., цп. На основании леммы 10 мы заключаем, что точка A41) принадлежит выпуклой линейной оболочке точек (И71. 1-^2. •••. Pin)- Отсюда следует, что v = (v!, v2, ..., Vn)^Kt. Поменяв ролями А и В, легко получим, что \?Кг- Таким образом, теорема 10 доказана. Мы вывели теорему 10 из теоремы 6. Легко видеть, что и обратно, ввиду леммы 10 теорема 6 следует из теоремы 10 *). В связи с теоремой 10 сделаем несколько замечаний. Обозначим через М множество точек A38), отвечающих спектрам операторов С = А + В, где А и В — всевозможные эрмитовы операторы с данными спектрами A36) и A50). Утверждение теоремы 10 состоит в том, что М с: Кt (~) Kz. Полное описание множества М до сих пор не получено, несмотря на имеющиеся в этой области важные исследования ([76], [191с]). В частности, в работе [191с] найдено полное описание множества М для случая п<;4. Приведем без доказательства относящийся к этому вопросу следующий просто формулируемый результат [106а]: Пусть при всех ? = 1, 2, ..., п—1 *) В [106а] теорема 10 доказана другим методом.
НЕРАВЕНСТВА ДЛЯ СОБСТВЕННЫХ И СИНГУЛЯРНЫХ ЧИСЕЛ 559 или *.! — *«< 1*1+1 — Тогда Отметим здесь же, что при условии A42) или A42') среди собствен- собственных значений оператора С = А + В нет кратных. В самом деле, пусть, например, выполнено условие A42). Согласно теореме 10 j 2 (f() JV)) s=l где n! т8>0 и 2 t. = l. s=l n! Поэтому vj+i —Vi>A,m —A,j—2 T8(fii — fxn)=A,i+1—%t—(щ—^„)>0и,сле- s=l довательно, V?+1^=Vj. Сформулируем в геометрических терминах теорему, эквивалентную теореме 9. Теорема 11 ([106]). Пусть А и В— положительно определенные эрмитовы операторы с собственными числами Ks и \is (s = l, 2, ..., п), занумерованными в убывающем порядке, и пусть vt>v2> ... — собственные числа оператора С = АВ. Пусть Ki — выпуклая линей- линейная оболочка точек (In %i + In \ih, In %z + In ]kh, ..., In Kn + In \ijn) и Kz — выпуклая линейная оболочка точек (In Ц! + In Kh, In fx2 + In Kh, ..., In fxn + In Тогда точка с координатами (In vlf In v2, ..., In vn) принадлежит пере- пересечению оболочек Кх и К2. Доказательство. Прологарифмировав неравенства A21), получим: (In Vi, — In Kh) + (In vi2 — In Kiz) + ... + (In vim — In Aim) < In Hi + In 4u2 + ... + In 4um. И в этом случае при т = п достигается равенство, ибо | С] = |-4 | |U|. Далее поступаем так же, как в теореме 10. Отметим также следующую теорему о спектре произведения унитар- унитарных матриц, принадлежащую А. А. Нудельману и П. А. Шварцман (УМН, т. 13, вып. 6 (84), 1958). Пусть 0 < ф4 < ф2 < ... < ф„ < 2л — аргументы собственных чисел унитарной матрицы U, и пусть 0<;1ф1<1'ф2^;...<:1фп<;2л—аргументы собственных чисел унитарной матрицы F. Пусть, кроме того, фп + 'фп — — <Pi — ^i < 2л. Обозначим через -/Vt выпуклую оболочку, натянутую на п\ векторов («pj + ifr , <p2 + ^*v ¦ • •> фп + ^г), а через JV2—выпуклую оболочку векторов (г^+фг.. 1|J+фг, ...,г|)п + фг )• Пусть, наконец, 0^tu!<;oJ<I... <со„<2л — аргументы собственных чисел матрицы UV; тогда точка с координатами (сОц сйг, ..., со„) принадлежит пересеченито выпуклых оболочек JVt и Nz.
ЛИТЕРАТУРА А. МОНОГРАФИИ, ОБЗОРЫ, УЧЕБНИКИ . А йн с Э. Л., Обыкновенные дифференциальные уравнения, ДНТВУ, 1939, гл. "XIX. 2. А х и е з е р Н. И., Лекции по теории аппроксимации, Гостехиздат, 1948, гл. I. 3. А х и е з е р Н. И. и Крейн М. Г., О некоторых вопросах теории моментов, ДНТВУ, 1938. 4. Бернштейн С. Н., Теория вероятностей, 4-е изд., Гостехиздат, 1946. 5. Б о х е р М., Введение в высшую алгебру, ОНТИ, 1933. 6. Булгаков Б. В., Колебания, т. I, Гостехиздат, 1949, гл. I. 7. Гантмахер Ф. Р. и Крейн М. Г., Осцилляционные матрицы и ядра и малые колебания механических систем, 2-е изд., Гостехиздат, 1950. 8. Гельфанд И. М., Лекции по линейной алгебре, 2-е изд., Гостехиздат, 1951. 9. Геронимус Я. Л., Теория ортогональных многочленов, Гостехиздат, 1950, гл. II. 10. Граев Д. А., Элементы высшей алгебры, Киев, 1914. 11. Еругин Н. П., Приводимые системы, Труды Матем. ин-та им. В. А. Стек- лова, т. XIII A946). 12. Еругин Н. П., Метод Лаппо-Данилевского в теории линейных дифференци- дифференциальных уравнений, Изд-во Ленингр. ун-та, 1956. 13. Каган В. Ф., Основания теории определителей, Гос. изд-во Украины, 1922. 14. Клейн Ф., Высшая геометрия, ГОНТИ, 1939, §§ 96—99. 15. Крейн М. Г., Основные положения теории Х-зон устойчивости канонической системы линейных дифференциальных уравнений с периодическими коэффициен- коэффициентами, Сб. «Памяти А. А. Андронова», Изд-во Академии наук СССР, 1955. 16. Крейн М. Г. и Наймарк М. А., Метод симметрических и эрмитовых форм в теории отделения корней алгебраических уравнений, Харьков, 1936. 17. Крейн М. Г. иРутманМ. А., Линейные операторы, оставляющие инва- инвариантным конус в пространстве Банаха, УМН 3, № 1 B3) A948). ^8. Кудрявцев Л. Д., О некоторых математических вопросах теории электри- электрических цепей, УМН 3, № 4 B6) A948). 19. Курант Р. и Гильберт Д., Методы математической физики, т. I, 3-е изд., Гостехиздат, 1951, гл. I, II. 20. К у р о ш А. Г., Курс высшей алгебры, 3-е изд., Гостехиздат, 1952. 21. Л а п п о-Д анилевский И. А., а) Теория функций от матриц и систем линейных дифференциальных уравнений, Гостехиздат, 1934. б) Memoires sur la theorie des systemes des equations differentielles lineaires, т. I, II, III, Труды Физико-матем. ин-та им. В. А. Стеклова, VI—VIII A934— 1936). 22. Ляпунов А. М., Общая задача об устойчивости движения, Гостехиздат, 1950. 23. М а л к и н И. Г., Теория устойчивости движения, Гостехиздат, 1952. 24. Мальцев А. И., Основы линейной алгебры, Гостехиздат, 1948. 25. М а р к о в А. А., Избранные труды, Гостехиздат, 1948. 26. М е й м а н Н. Н., Некоторые вопросы расположения корней полиномов, УМН 4, № 6 C4) A949). 27. Наймарк Ю. И., Устойчивость линеаризованных систем, Изд-во Ленингр. Военно-воздушной инж. академии, 1949. 28. Потапов В. П., Мультипликативная структура /-нерастягивающих матриц функций, Труды Моск. матем. о-ва 4 A955). 29. Романовский В. И., Дискретные цепи Маркова, Гостехиздат, 1948. 30. Смирнов В. И., Курс высшей математики, т. III, Физматгиз, 1958. 31. Стильтьес Т. И., Исследование о непрерывных дробях, ОНТИ, Харьков, *936.
ЛИТЕРАТУРА 561 32. Фаддеев Д. К. и С о м и н с к и й И. С, Сборник задач по высшей алгебре, 2-е изд., Гостехиздат, 1949. 33. Ф а д д е е в а В. Н., Вычислительные методы линейной алгебры, Гостехиздат, 1950. 34. Ф р е з е р Р., Дункан В., К о л л а р А., Теория матриц и ее приложе- приложении к дифференциальным уравнениям и динамике, ИЛ, 1950. 35. Харди Г., Литтлвуд Дж., Пойа Г., Неравенства, ИЛ, 1948. 36. Ч е б ы ш е в П. Л., Полное собрание сочинений, т. Ill, Изд-во АН СССР, 1948. 37. Ч е б о т а р е в Н. Г. и М е й м а н Н. Н., Проблема Рауса — Гурвица для полиномов и целых функций, Труды Матом, ин-та им. В. А. Стеклова, т. XXVI, Изд-во АН СССР A949). 38. Ч е т а е в Н. Г., Устойчивость движения, Гостехиздат, 1946. 39. Ш а п и р о Г. М. Высшая алгебра, 4-е изд., Учпедгиз, 1938. 40. Шилов Г. Е., Введение в теорию линейных пространств, Гостехиздат, 1952. 41. Ш и р о к о в П. А., Тензорное исчисление, ГТТИ, 1934. 42. Ш р е й е р О. и Шпернер Е., а) Введение в линейную алгебру в геометри- геометрическом изложении, ОНТИ, 1934; б) Теория матриц, ОНТИ, 1936. 43. A i t k e n А. С, Determinants and matrices Edinbourg, 5-е изд., 1948. 44. Bodewig E., Matrix calculus, Amsterdam, 1956; New York, Interscience publ., 1959. 45. С a h e n G., Elements de calcul matriciel, Paris, 1955. 46. С о 11 a t z L., Eigenwertaufgaben mil technischen Anwendungen, Leipzig, 1949. 47. С u 1 1 i s С. Е., Matrices and determinoids, т. I—III, Cambridge, 1913—1925. 48. Jung H., Matrizen und Determinanten. Eine Einfiihrung, Leipzig, 1953. 49. G r 6 b n e r W., Matrizenrechnung, Munchen, 1956. 50. Kowalewski G., Einfiihrung in die Determinantentheorie, Leipzig, 1909. 51. Lichnerowicz A., Algebre et analyse lineaires, 2 ed., Paris, 1956. 52. M а с D u f f e e С. С, a) The theory of matrices, Berlin, 1933; b) Vectors and matrices, New York, 1943. 53. M a r d e n M., The geometry of the zeros of a polynomial in a complex variable, New York, 1949. 54. M i r s k у L., An introduction to linear algebra, Oxford, 1955. 55. M u i r, Sir Thomas, The theory of determinants, t. I—III, Cambridge, 1906—1923. 56. M u t h P., Theorie und Anwendung der Elementarteilertheorie, Leipzig, 1899. 57. P a r о d i M., Sur quelques proprietes des valeurs caracteristiques des matrices carrees, Memorial des Sciences Mathematiques, № 118, Paris, 1952. 58. P e r 1 i s S., Theory of matrices, Cambridge, 1952. 59. P i с k e r t G., Normalformen von Matrize, Enzykl. Math. Wissensch. I. 1.7. Band 1. Algebra und Zahlentheorie, 1. Teil B. Algebra. Heft 3, Teil 1. Leipzig, 1953. 60. R о u t h E. J., a) Stability of a given state of motion, London, 1877; b) The advanced part of a treatise on the dynamics of a system of rigid bodies, ч. II, 5-е изд., London, 1892. 61. Schlesinger L., a) Vorlesungen fiber lineare Differentialgleichuneen, Ber- Berlin, 1908, b) Einffihrung in die Theorie der gewohnlichen Differentialgleichungen auf funktionentheoretischer Grundlage, Berlin, 1922. 62. Schmeidler W., Vortrage iiber Determinanten und Matrizen mit Anwendun- Anwendungen in Physik und Technik, Berlin, 1949. 63. Schwerdtfeger H., Introduction to linear algebra and the theory of matri- matrices, Groningen, 1950. 64. T h r a 11 R. and Tornheim L., Vector spaces and matrices, New York — London, 1957. 65. T u r n b u 11 H. W. and A i t k e n A. C, An introduction to the theory of cano- canonical matrices, London, 1932. 66. T u r n b u 11 H. W., The theory of determinants, matrices and invariants, Lon- London, 1929. 67. Volterra V. etHostinsky В., Operations infinitesimales lineaires, Paris, 1938. 68. Wedderburn J. H. M., Lectures on matrices, New York, 1934. 69. W e у 1 H., Mathematische Analyse des Raumproblems, Berlin, 1923. 70. W i n t e r A., Spektraltheorie der unendlichen Matrizen, Leipzig, 1929. 71. Z u г ш п b 1 R., Matrizen und ihre technischen Anwendungen, 3-te Auf., Berlin, 1961. 36 ф. р. Гантмахер
562 ЛИТЕРАТУРА Б. СПЕЦИАЛЬНЫЕ СТАТЬИ 72. АзбелевН. и Виноград Р., Процесс последовательных приближе- приближений для отыскания собственных чисел и собственных векторов, ДАН 83 A952), 173—174. 73. А й з е р м а н М. А., Об учете нелинейных функций от нескольких аргументов при исследовании устойчивости системы автоматического регулирования, Автома- Автоматика и телемеханика, т. VIII, № 1 A947). 74. А р ж а н ы х И. С, Распространение метода А. Н. Крылова на полиномиаль- полиномиальные матрицы, ДАН 81 A951), 749—752. 75. Атрашенок П. В., Определение произвола в выборе матрицы, приводящей систему линейных дифференциальных уравнений к системе с постоянными коэффициентами, Вестник Ленингр. ун-та, сер. матем., физ. и хим. 2 A953), 17—29. 76. Березин Ф. А. и Гельфанд И. М., Несколько замечаний к теории сферических функций на симметрических римановых многообразиях, Труды Московского матем. о-ва 5 A956), 311—351. 77. Б у л г а к о в Б. В., Деление прямоугольных матриц, ДАН 85 A952), 21—24. 78. Вержбицкий Б. Д., Некоторые вопросы теории рядов композиций не- нескольких матриц, Матем. сб. 5 D7) A939), 505—512. 79. В е й л е н д Г., Представление векового уравнения в виде многочлена, пере- перевод с англ., УМН 2, № 4 B0) A947), 128—158. 80. Виленкин Н. Я., Об одной оценке максимального собственного значения матрицы, Ученые записки Моск. гос. педагогического ин-та им. В. И. Ленина CVIII, № 2 A957), 55—57. 81. Г а н т м а х е р Ф. Р., а) Геометрическая теория элементарных делителей по Круллю, Труды Одесского гос. ун-та, Математика, т. I A935), 89—108. б) К алгебраическому анализу метода акад. А. Н. Крылова преобразо- преобразования векового уравнения. Труды II Всесоюзного матем. съезда, т. II A934), 45—48. в) On the classification of real simple Lie groups, Матем. сб. 5 D7) A939), 217—250. 82. Г а н т м а х е р Ф. Р. и К р е й н М. Г., а) К структуре ортогональной матри- матрицы. Труды Физ.-мат. отдела ВУАН, Киев A929), 1—8. б) О нормальных операторах в эрмитовом пространстве, Известия Физ.-мат. об-ва при Казанском университете, т. IV, вып. 1, сер. 3 A929—1930), 71—84. в) Об одном специальном классе детерминантов в связи с интегральными ядрами Келлога, Матем. сб. 42 A935), 501—508. г) Sur les matrices oscillatoires, Comptes Rendus de l'Acad. des Sciences, Paris, 201 A935), 577—579. д) Sur les matrices oscillatoires et completement non-negatives, Compositio Mathematica 4 A937), 445—476. 83. Гельфанд И. М., Л и д с к и й В. Б., О структуре областей устойчивости линейных канонических систем дифференциальных уравнений с периодическими коэффициентами, УМН 10, № 1 F3) A955). 84. Г е р ш г о р и н С. A., Ueber die Abgrenzung der Eigenwerte einer Matrix, ИАН, сер. физ.-матем. A931), 749—754. 85. Голубчиков А. Ф., а) Об одном матричном уравнении, Учен. зап. Сталингр. пед. ин-та, № 3 A953), 71—82. б) О структуре автоморфизмов комплексных простых групп Ли, ДАН 77, 1 A951), 7—9. 86. Граве Д. А., Малые колебания и некоторые предложения алгебры, ИАН, сер. физ.-матем. A929), 563—570. 87. Гроссман Д. П., К задаче численного решения систем совместных линейных алгебраических уравнений, УМН 5, № 3 C7) A950), 87—103. 88 Данилевский А. М., О численном решении векового уравнения, Матем. сб. 2 D4) A937), 169—172. 89. Д м и т р и е в Н. А. и Дынкин Е. Б., а) О характеристических числах стохастических матриц, ДАН 49 A945), 159—162. б) Характеристические корни стохастических матриц, ИАН, матем. серия, 10 A946), 167—194. 90. Д о н с к а я Л. И., Построения решения линейной системы в окрестности регулярной особой точки в особых случаях, Вестник Ленингр. ун-та A952), № 6. б) О структуре решений системы линейных дифференциальных уравнений в окрестности регулярной особой точки, Вестник Ленингр. ун-та A954), № 8, 55—64.
ЛИТЕРАТУРА 563 91. Д у б н о в Я. С, а) О совместных инвариантах системы аффиноров, Труды Всесоюзн. съезда матем. в Москве A927), 236—237. б) О симметрично сдвоенных ортогональных матрицах, М., Изв. асе. ин-тов ун-та A927), 33—35. в) О матрицах Дирака, М., Ученые зап. ун-та 2 : 2 A934), 43—48. 91'. Дубнов Я. С. и Иванов В. К., О понижении степени аффинорных поли- полиномов, ДАН СССР 41 A943), 99—102. 92. Е р у г и н Н. П., a) Sur la substitution exposante pour quelques systemes irre- gulieres, Матем. сб. 42 A935), 745—753. б) Показательная подстановка иррегулярной системы линейных диффе- дифференциальных уравнений, ДАН СССР 17 A937), 235—236. в) О проблеме Римана для системы Гаусса. Л., Ученые зап. пед. ин-та 28 A939), 293—304. 93. Е р ш о в А. П., Об одном методе обращения матриц, ДАН СССР 100 A955), 209—211. 93'. Каган В. Ф., О некоторых системах чисел, к которым приводят лоренцовы преобразования. М., Изв. асе. ин-тов ун-та A927), 3—31. 94. К а р п е л е в и ч Ф. И., О характеристических корнях матрицы с неотрица- неотрицательными элементами, ИАН, матем. сер., 15 A951), 361—383. 95. Коваленко К. Р. и К р е й н М. Г., О некоторых исследованиях А. М. Ля- Ляпунова по дифференциальным уравнениям с периодическими коэффициентами ДАН 75 A950), 495—499. 96. Колмогоров А. Н., Цепи Маркова со счетным множеством возможных состояний. М., Бюлл. ун-та (А) 1 : 3 A937). 97. Котелянский Д. М., а) Про монотонщ в-го порядка функцп ввд матриць. Труды Одеського державного ун-ту, Зб1рник матем. ввддшу, т. 3 A941), 103—114. б) К теории неотрицательных и осцилляционных матриц., Укр. матем. журнал, 2, № 2 A950), 94—101. в) О некоторых свойствах матриц с положительными элементами, Матем. сб. 31 G3) A952), 497—506. г) Об одном свойстве знакосимметрических матриц, УМН 8, № 4 E6) A953), 163-167. д) О некоторых достаточных признаках вещественности и простоты матрич- матричного спектра, Матем. сб. 36, № 1 A955), 163—168. е) О влиянии преобразования Гаусса на спектры матриц, УМН 10, № 1 A955), 117—121. ж) О расположении точек матричного спектра, Укр. матем. журнал 7, № 2 A955), 131—133. з) Оценки для определителей матриц с преобладающей главной диагональю, ИАН СССР, сер. матем., 20, № 1 A956), 137—144. 98. К р а в ч у к М. Ф., а) До теорп перемшних матриць, Киев, Зап. физ.-матем. отд. АН УССР 1 : 2 A924), 28—33. б) До загально! Teopi'i бшшшних форм, Кшв, Изв. Политехи, с.-х. ин-та 19 A924), 17—18. в) Про одне перетворення квадратичних форм, Кшв. Зап. физ.-матем. отд. АН УССР 1 : 2 A924), 87—90. г) Про квадратичт форми та лшшт перетворення, Киш, Зап. физ.-матем. отд. АН УССР 1 : 3 A924), 1—89. д) Перемшт множини лшшних перетворень. Khib, Зап. с.-госп. ин-ту 1 A926), 25—58. е) Ueber vertauschbare Matrizen. Rend. circ. mat., Palermo 51, A927), 126—130. ж) О структуре перестановочных групп матриц. Труды II Всесоюзи. матем. съезда, II A934), 11—12. 99. Кравчук М. Ф. и Гольдбаум Я. С, а) Про групи коммутативних матриць, Кшв, Труды авиац. ин-та A929), 73—98 A936), 12—23. б) Об эквивалентности особенных пучков матриц Киев, Труды авиац. ин-та A936), 5—27. 100. Красносельский М. А. и Крейн С. Г., Итерационный процесс с минимальными невязками, Матем. сб. 31 G3) A952), 315—334. 101. Крейн М. Г., а) Добавление к работе «К структуре ортогональной матрицы», Труды физ.-мат. отдела ВУАН, Киев A931), 103—107. б) О спектре якобиевой формы в связи с теорией крутильных колебаний валов, Матем. сб. 40 A933), 455—466. в) Об одном новом классе эрмитовых форм, ИАН, сер. физ.-мат. A933), 1259—1275. 36*
564 ЛИТЕРАТУРА г) Об узлах гармонических колебаний механических систем некоторого специального типа, Матем. сб. 41 A934), 339—348. д) Sur .quelques applications des noyaux de Kellog aux problemes d 'oscillations. Сообщ. Харьк. матем. об-ва D) 11 A935), 3—19. е) Sur les vibrations propres des tiges dont l'une des extremites est encastree et l'autre libre, там же D) 12 A935), 3—11. ж) Обобщение некоторых исследований А. М. Ляпунова о линейных диф- дифференциальных уравнениях с периодическими коэффициентами, ДАН 73 A950), 445—448. з) Об одном применении принципа неподвижной точки в теории линейных преобразований пространств с индефинитной метрикой, УМН 5, № 2 C6) A950), 180—190. и) О применении одного алгебраического предложения в теории матриц монодромии, УМН 6, № 1 D1) A951), 171—177. к) О некоторых вопросах, связанных с кругом идей Ляпунова в теории устойчивости, УМН 3, № 3 B5) A948), 166—169. л) К теории целых матриц функций экспоненциального типа, Украинок, матем. ж. 3, № 1 A951), 164—173. м) О некоторых задачах теории колебаний штурмовых систем, Прикл. матем. и механ. 16, № 5 A952), 555—568. 102. Крейн М. Г. и Наймарк М. А., а) Об одном преобразовании безутианты, приводящем к теореме Штурма, Харьков, Зап. матем о-ва D) 10 A933), 33—40. б) О применении безутианты к вопросам отделения корней алгебраических уравнений, Труды Одесского гос. ун-та, Математика, т. I A935), 51—69. 103. Крылов А. Н., О численном решении уравнения, которым в технических вопросах определяются частоты колебаний материальных систем, ИАН, серия физ.-мат. A931), 491—539. 104. Лаппо-Даиилевский И. А., а) Основные задачи теории систем линей- линейных дифференциальных уравнений с произвольными рациональными коэффи- коэффициентами, Труды 1-го Всесоюзн. съезда матем., ОНТИ A936), 254—262. б) Resolution algorithmique des problemes reguliers de Poincare et de Riemanu, I, Журн. физ.-матем. о-ва, Л., 2 : 1 A928), 94—120; II, там же, 121—154. в) Theorie des matrices satisfaisantes a des systemes des equations differenti- elles lineaires a coefficients rationnels arbitraires. Журн. физ.-матем. об-ва, Л., 2 : 2 A928), 41—80. 105. Лившиц М. С. и Потапов В. П., Теорема умножения характеристиче- характеристических матриц-функций, ДАН СССР 72 A950), 164—173. 106. Л и д с к и й В. В., а) О собственных значениях суммы и произведения симме- симметрических матриц, ДАН 75 A950), 769—772. б) Осцилляционные теоремы для канонической системы дифференциаль- дифференциальных уравнений, ДАН 102 A955), 877—880. 107. Л и пин Н. В., О регулярных матрицах. Л., Труды ин-таинж. ж.-д. транспорта 9 A934), 105. 108. Л о п ш и ц А. М., а) Векторное решение задачи о симметрически сдвоенных матрицах, Труды Всеросс. съезда матем. в Москве A927), 186—187. б) Характеристическое уравнение наинизшей степени для аффинора и при- применение его к интегрированию дифференциальных уравнений, Труды сем. по вект. и тенз. исчислению, вып. II—III A935). в) Численный метод нахождения собственных значений и собственных пло- плоскостей линейного оператора, там же, т. VII, 233—259. г) Экстремальная теорема для гиперэллипсоида и ее применение к решению системы линейных алгебраических уравнений, там же, т. IX A952), 183—197. 109. Лузин Н. Н., а) О методе акад. А. Н. Крылова составления векового уравне- уравнения, ИАН, сер. физ.-матем. A931), 903—958. б) О некоторых свойствах перемещающего множителя в методе акад. А. Н. Крылова, ИАН, сер. физ.-матем. A932), I, 596—638; II, 735—762; III, 1065—1102. в) К изучению матричной теории дифференциальных уравнений, Атом. и телемех. 5 A940), 3—66. 110. Л ю б и ч Ю. И., Оценки для оптимальной детерминизации недетерминирован- недетерминированных автономных автоматов, Сиб. матем ж. 5 A964), 337—355. 111. Люстерник Л. А., а) Нахождение собственных значений функций на электрической схеме, Электричество 11 A946), 67—68. б) Об электрическом моделировании симметрических матриц, УМН 4 : 2 C0) A949), 198—200.
ЛИТЕРАТУРА 565 Люстерник Л. А. и Прохоров А. М., Определение собственных зна- значений и функций некоторых операторов с помощью электрической цепи, ДАН 55 A947), 579—582; ИАН, ОФН 11 A947), 141—145. 113. Маркус А. С, Собственные и сингулярные числа суммы и произведения ли- линейных операторов, УМН, т. XIX, вып. 4 A18) A965), стр. 93—123. 114. М а я н ц Л. С, Метод уточнения корней вековых уравнений высоких степеней и численного анализа их зависимости от параметров соответствующих матриц, ДАН 50 A945), 121—124. 115. Нейгауз М. Г. и Лидский В. Б., Об ограниченности решений линей- линейных систем дифференциальных уравнений с периодическими коэффициентами, ДАН 77 A951), 183—193. 116. Папкович П. Ф., Об одном методе разыскания корней характеристиче- характеристического определителя, Прикл. матем. и мех. 1 A933), 314—318. 117. Понтрягин Л. С., Эрмитовы операторы в пространстве с индефинитной метрикой, ИАН, сер. матем. 8 A944), 243—280. 118. Потапов В. П., О голоморфных ограниченных в единичном круге матрицах- функциях, ДАН 72 A950), 849—853. 119. Птак В., Об одной комбинаторной теореме и ее применении к неотрицательным матрицам, Чехосл. матем. ж. 8 A958), 487—495. 120. Романовский В. И., a) Un theoreme sur les zeros des matrices non-negati- non-negatives, Bull. Soc. Math. France 61 A933), 213—219. 6) Recherches sur les chaines de Markoff, Acta Math. 66 A935), 147—251. 121. Рехтман-Олыпанская П. Г., Об одном утверждении академика А. А. Маркова, УМН, т. XII, № 3 G5) A959), 181—187. 122. Сарымсаков Т. А., О последовательности стохастических матриц, ДАН СССР 47 A945), 331—333. 123. Севастьянов Б. А., Теория ветвящихся случайных процессов, УМН, т. VI, вып. 6 A951), 46—99. 124. Семендяев К. А., О нахождении собственных значений и инвариантных многообразий матриц посредством итераций, Прикл. матем. и мех. 3 A943), 193—221. 125. Смогоржевский А. С, По уштарш типи циркулянпв, Киев, Журн. матем. цикла АН УССР 1 A932), 89—91. 126. Смогоржевский А. С. и Кравчук М. Ф., Про ортогональт пере- творення, Киев, Зап. ин-та нар. проев. 2 A927), 151—156. 127. Сулейманова X. Р., а) Стохастические матрицы с действительными характеристическими числами, ДАН 66 A949), 343—345. б) О характеристических дислах стохастических матриц, Учен, записки Моск. гос. пед. ин-та, сер. матем., 71, вып. 1 A953), 167—197. 128. Султанов P.M., Некоторые свойства матриц с элементами из некоммутатив- некоммутативного кольца, Баку, Труды сектора матем. АН АзССР 2 A946), 11—17. 129. Сушкевич А. К., Про деям типи особливих матриць, Учет записки Харь- KiBCbKoro держ. ун-ту 10 A937), 1—16. 130. Турчанинов А. С, О некоторых приложениях исчисления матриц к линей- линейным дифференциальным уравнениям, Одесса, Учен. зап. высш. шк. 1 A921), 41—48. 131. Фаге М. К., а) Обобщение неравенства Адамара об определителях, ДАН 54 A946), 765—768. б) О симметризуемых матрицах, УМН 6, № 3 D3) A951), 153—156. 132. Фаддеев Д. К., О преобразовании векового уравнения матрицы, Л., Тру- Труды Ин-та инж. пром. строит. 4 A937), 78—86. 133. Хлодовский И. Н., К теории общего случая преобразования векового уравнения методом академика А: Н. Крылова, ИАН, сер. физ.-мат., 8 A933), 1077—1102. 134. Хуа Ло-ген, а) Геометрия симметрических матриц над полем действитель- действительных чисел, ДАН 53 A946), I, 99—102; II, 199—200. б) Автоморфизмы действительной симплектической группы, ДАН 53, A946), 307—310. 135. Хуа Ло-ген, Б. А. Розенфельд, Геометрия прямоугольных матриц и ее применения к вещественной проективной и неевклидовой геометрии, Изве- Известия высших учебных заведений СССР, Математика, 1 A957), 233—246. 136. Цейтлин М. Л., Применение матричного исчисления к синтезу релейпо- контактных схем, ДАН 86 A952), 525—528. 137. Циммерман Г. К., Разложение нормы матрицы по произведениям норм ее строк, Научные зап. Николаевск, гос. пед. ин-та, 4 A953), 130—135.
566 ЛИТЕРАТУРА 138. Шварцман А. П., О матрицах Грина самосопряженных конечнораз- ностных операторов, Труды Одесского гос. ун-та, Математика, т. III A941), 35—77. 139. Шиффнер Л. М., а) Разложение интегралов системы дифференциальных уравнений с правильными особыми точками в ряды до степеням элементов диф- дифференциальных подстановок, Труды физ.-мат. ин-та им. Стеклова 9 A935), 235—266. б) О степени матрицы, Матем. сб. 42 : 3 A935), 385—394. 140. Ш о с т а к Р. Я., О признаке условной определенности квадратичной формы переменных, подчиненных линейным связям, и о достаточном признаке условного экстремума функции переменных, УМН 9, № 2 A954), 199—206. 141. Шрейдер Ю. А., Решение систем линейных совместных алгебраических уравнений, ДАН 76 A951), 651—655. 142. Штаерман И. Я., Новый метод решения некоторых алгебраических урав- уравнений, которые имеют применения в математической физике и технике, Киев, Журн. ин-та матем. АН УССР 1 A934), 83—89; 4 A934), 9—20. 143. Штаерман И. Я. и Ахиезер Н. И., К теории квадратичных форм, Киев, Изв. политехи, с.-х. ин-та 19 A934), 116—123. 144. Шура-Бура М.Р., Оценка ошибок при численном обращении матриц высо- высокого порядка, УМН 6, № 4 D4) A951), 121—150. 145. Я г л о м И. М., Квадратичные и кососимметрические билинейные формы в ве- вещественном симплектическом пространстве, Труды семинара по векторному и тензорному анализу (Москва, Гостехиздат) 8 A950), 364—381. 146. Якубович В. А., Некоторые критерии приводимости системы дифферен- дифференциальных уравнений, ДАН 66 A949), 577—580. 147. Afriat S., Composite matrices, Quart. J. Math. 5, N 18, 1954, 81—98. 148. Aitken A. C, Studies in practical mathematics. The evaluation with applica- applications of a certain triple product matrix, Proc. Roy. Soc, Edinbourgh 57, 1936—1937. 149. Amir Moez Ali R., Extreme properties of eigenvalues of a hermitian trans- transformation and singular values of the sum and product of linear transformations. Duke Math. J. 23 A956), 463—476. 150. Baker H. F., On the integration of linear differential equations, Proc. Lond. Math. Soc. 35 A903), 333—378. 151. Barankin E. W., Bounds for characteristic roots of a matrix, Bull. Amer. Math. Soc. 51 A945), 767—770. 152. Bartsch H., Abschatzungen ffir die kleinste charakteristische Zahl einer posi- tiv-definiten Matrix, ZAM 34, № 1—2 A954), 72—74. 153. В i r k h о f f G. D., a) Equivalent singular points of ordinary linear differential equations, Math. Ann. 74 A913), 134—139. b) Tree observations sobre el algebra lineal, Revista Universidad Nacional Tucuman, ser. A, 5 A946), 147 — 151. 154. Birkhoff Garret t, On product integration, Journ. of Math, and Phys., т. XVI A937), 104—132. 155. Bellman R., Notes on matrix thoory, Amer. Math. Monthly 60 A953), 173— 175; 62, № 3 A955), 172—173; № 8 A955), 571—572; № 9 A955), 647—648; 64, № 3 A957), 189—191. 156. Bellman R., H о I f m a n A., On a theorem of Ostrowski, Arch. Math. 5, № 1—3 A954), 123—127. 157. Bendat J., Scherman S., Monotone and convex operator functions, Trans. Amer. Math. Soc. 9, № 1 A955), 58—71. 158. В e r g e C, Sur une propriete des matrices doublement stochastiques, C. r. Acad. Sci. 241, № 3 A955), 269—271. 159. Bjerhammar A., Rectangular reciprocal matrices, with specially references to geodesic calculus, Bull. geod. int. A951), 188—220. 160. В о 11 R., D u f f i n R., On the algebra of networks, Trans. Amer. Math. Soc. 74, № 1 A953), 99—109. 161. В r a u e r A., Limits for the characteristic roots of a matrix, Duke Math. J. I, 13 A946), 387-395; II, 14 A947), 21-26; III, 15 A948), 871-877; IV, V, 19 A952), 73—91, 553—563; VI, 22, 1955, 387—395. b) TJber die Lage der charakteristischen Wurzeln einer Matrix, J. reine und angew. Math. 192, № 2 A953), 113—116. c) Bounds for the rations of the coordinates of the characteristic vectors of a matrix, Proc. Nat. Acad. Sci. USA 41, № 3 A955), 162—164. d) The theorems of Ledermann and Ostrowski on positive matrices Duke, Math. Jf. 24, № 2 A957), 265—274.
ЛИТЕРАТУРА 567 162. Brenner J., Bounds for determinants, Proc. Nat. Acad. Sci. USA 40 A954), 452—454; Proc. Amer. Math. Soc. 8 A957), 532—534; C. R. Acad. Sci. 238 A954), 555—556. 163. Bruijn N., Inequalities concerning minors and eigenvalues, Nieuw. arch, wiskunde 4, № 1 A956), 18—35. 164. Bruijn N., Szekeres C, On some exponential and polar representations of matrices, Nieuw arch, wiskunde 3, № 1 A955), 20—32. 165. Cayley A., A memoire on the theory of matrices, London, Phil. Trans. 148 A857), 17-37; Coll Works 2, 476—496. 166. Coheen H. E., On a lemma of Stiltjes on matrices, Amer. Math. Monthly 56 A949), 328—329. 167. Collatz L., a) EinschlieBungssatz fur die charakteristischen Zahlen von Matri- zen, Math. Zs. 48 A942), 221—226. b) tlber monotone Systeme linearer Ungleichungen, J. reine und angew. Math. 194, № 1—4 A955), 193—194. 168. С r e m e r H., Die Verringerung der Zahl der Stabilitatskriterien bei Vorausset- zung positiver Koeffizienten der charakteristischen Gleichunq, ZAM 33, № 7 A953), 222—227. 169. Cremer H., Effertz F. H., Uber die algebraischen Kriterien fur die Sta- bilitat von Regelungssystemen. Math. Ann. 137, 4 A959), 328—350. 170. D i 1 i b e r t о S., On system of ordinary differential equations. Contributions to the theory of non-linear oscilations, Princeton A950), 1—38. 171. D о b s с h O., Matrixfunktionen beschrankter Scnwankung, Math. Zs. 43 A937), 353—388. 172. Dulmage L. and Halperin I., On a theorem of Frobenius — Konig and J. von Neumann's game of hide and seek, Trans. Roy. Soc. Canada, ser. Ill, 49 A955), 23—29. 173. Duncan W., Reciprocation of triply-partitioned matrices, J. Roy. Aeronaut. Soc. 60, № 542 A956), 131—132. 174. E g e r v а г у Е., a) On hypermatrices whose blocks are commetable in pairs and their application in lattice-dynamics, Acta scient. math. 15, № 3—4 A954), 211—222. b) On a lemma of Stieltjes on matrices, Acta Scient. Math. 15, № 2 A954), 99—103. 475. Epstein M., Flanders H., On the reduction of a matrix to diagonal form, Amer. Math. Monthly 62, № 3 A955), 168—171. 176. F a e d о S., Un nuovo problema di stabilita per le equazioni algebriche a coeffi- cienti reali, Aun. Scuola notm. super. Pisa Sci. fis. e. mat. 7, № 1—2 A953), 53—63. 177. Fan К у, a) On a theorem of Weyl concerning eigenvalues of linear transforma- transformations, Proc. Nat. Acad. Sc. I, 35 A949), 652-655; II, 36 A950), 31—35. b) Maximum properties and inequalities for the eigenvalues of completely continuous operators, Proc. Nat. Acad. Sci. USA 37 A951), 760—766. c) A comparision theorem for eigenvalues of normal matrices, Pacific J. Math. 5 A955), 911—913. d) Some inequalities concerning positive-definite Hermitian matrices, Proc. Cambridge Philos. Soc. 51, № 3 A955), 414—421. 178. Fan Ky, Hoffman A., Some metric inequalities in the space of matrices, Proc. Amer. Math. Soc. 6, № 1 A955), 111—116. 179. Fan Ky, Housenholder A. S., A note concerning positive matrices and M-matrices. Monatsh. Math. 63, № 3 A959), 265—270. 180. Fan Ky, Paul Gordon, Imbedding conditions for Hermitian and normal matrices, Canad. J. Math. 9 A957), 298—304. 181. Fan К у, Т о d d J., A determinantial inequality, J. London Math. Soc. 30, № 1 A955), 58—64. 182. Frobenius G., a) Ueber lineare Substitutionen und bilineare Formen, J. reine und angew. Math. 84 A877), 1—63. b) Ueber die cogredienten Transformationen der bilinearen Formen, Sitz.- Ber. Akad. Wiss. Phys.-math. Klasse, Berlin A896), 7—16. c) Ueber die vertauschbaren Matrizen, ibidem A896), 601—604. d) Ueber Matrizen aus positiven Elementen, ibidem A908), 471—476; A909), 514—518. e) Ueber Matrizen aus nicht negativen Elementen, ibidem A912), 456—477. f) Ueber das Tragheitsgesetz der quadratischen Formen, ibidem A894), 241—256; 407—431.
568 ЛИТЕРАТУРА 183. G a u t s с h i W., Bounds of matrices with regard to an hermitian metric, Com positio math. 12, № 1 A954), 1—16. 184. G о d d а г d L., An extension of a matrix theorem of A. Brauer, Proc. Intern Congr. Math., 1954, 2, Amsterdam A954), 22—23. 185. Haynsworth E., Bounds for determinants with dominant main diagonal, Duke Math. J. 20, № 2 A953), 199—209. 186. H e 11 m a n 0., Die Anwendung des Matrizanten bei Eigenwertaufgaben, ZAM 35, № 8 A955), 300—315. 187. H j e 1 m s 1 e v J., Introduction a la theorie des suites monotones, Oversight over Kgl. Danske Videnskaberns Selbskabs Forhandlinger, 1914, 1—74. 188. Hoffman A., Taussky Olga, A characterisation of normal matrices, J. Res. Nat. Bur. Standards 52, № 1 A954), 17—19. 189. Hoffman A., Wielandt H., The variation of the spectrum of a normal matrix, Duke Math. J. 20, № 1 A953), 37—39. 190. Holladay I., Varga R., On powers of non-negative matrices, Proc. Amer. Math. Soc. 9 A958), 631—634. 191. Horn A., a) On the eigenvalues of a matrix with prescribed singular values, Proc. Amer. Math. Soc. 5, № 1 A954), 4. b) On the singular values of product of completely continuous operators, Proc. Nat. Acad. USA 36, № 7 A950), 374—375. c) Eigenvalues of sums of Hermitian matrices, Pacific Journal of Math. 12, № 1 A962), 225—241. d) Doubly stochastic matrices and the diagonal of a rotation matrix, Amer. Journ. Math. 76, № 3 A954), 620—630. 192. Hsu P. L., a) On symmetric, orthogonal, and skew symmetric matrices, Proc. Edinburgh Math. Soc, ser. 2, 10 A953), 37—44. b) On a kind of transformations of matrices, Acta Math. Sinica 5, № 3, 333—347. 193. Hoteling H., Some new methods in matrix calculation, Ann. Math. Stat. 14, № 1 A943). 194. Hua Loo-ken g, a) On the theory of automorphic functions of a matrix variab- variable, Amer. J. Math. 66 A944), I, 470—488; II, 531—563. b) Geometries of matrices, Trans. Amer. Math. Soc. 57 A945), 441—490. c) Orthogonal classification of Hermitian matrices, Trans. Amer. Math. Soc. 59 A946), 508—523. d) Inequalities involving determinants, Acta Math. Sinica 5 A955), 463—470. 195. H e r m i t e C, Sur le nombre des racines d'une equation algebrique comprise entre des limites donndes, J. fur die reine und angew.Math. 52 A856), 39—51. 196. H u г w i t z A., Ueber die Bedingungen, unter welchen eine Gleichung nur Wur- zeln mit negativen reellen Teilen besitzt, Math. Ann. 46 A895), 273—284. 197. Ingraham M. H., On the reduction of a matrix to its rational canonical form, Bull. Amer. Math. Soc. 39 A933), 379—382. 198. Jonescu D., О identitate importanta ai descompunere a unei forme bilineare intro suma de produse, Gaz., mat. si fiz. A7, № 7 A955), 303—312. 199. Jongmans F., Problemes matriciels lies an ring, Bull, de la Soc. Roy. sci de Liege 29 A960), 3—4, 51-60. 200. Ishak M., Sur les spectres des matrices, Semin. P. Dubreil et Ch. Pisot. Fac. sci. Paris 9, № 14 A955—1956), 1—14. 201. Khan N. A., The characteristic roots of the product of matrices, Quart. J. Math. 7, № 26 A956), 138—143. 202. Kowalewski G., Natiirliche Normalformen linearer Transformationen, Leipz. Ber. 69 A917), 325—335. 203. К 6 n i g D., Ueber Graphen und ihre Anvendungen, Math. Ann. A916), 453—465. 204. К r a U s F., Ueber konvexe Matrixfunktionen, Math. Zs. 41 A936), 18—42. 205. Kronecker L., Algebraische Reduktion der Scharen bilinearer Formen, Sitzungsber. Akademie Berlin A890), 763—776. 206. К r u 11 W., Theorie und Anwendung der verallgemeinerten Abelschen Gruppen, Sitzb. Heidi. Akad. A926), 1. 207. Ledermann W., a) Reduction of singular pencils of matrices, Proc. Edinb. Math. Soc, сер. 2, 4 A935), 92—105. b) Bounds for the greatest latent root of positive matrix, J. of Lond. Math. Soc. 25 A950), 265—268. 208. Lienard et Chipart, Sur la signe de la partie reelle des racines d'une equation algebrique, J. de Math, pure et appl. F) 10 A914), 291—346. 209. L owner K., a) Ueber monotone Matrixfunktionen, Math. Zs. 38 A933), 177—216.
ЛИТЕРАТУРА 569 b) Some classes of functions defined by difference or differential inequalities. Bull. Amer. Math. Soc. 56 A950), 308—319. 210. Marcus M., a) A remark on a norm inequality for square matrices, Proc. Amer. Math. Soc. 6, № 1 A955), 117—119. b) An eigenvalue inequality for the product of normal matrices, Amer. Math. Monthly 63, № 3 A956), 173—174. 211. Marcus M., McGregor J. L., Extremal properties of Hermitian matrices, Canad. J. Math. 8 A956), 524—531. 212. M i r s к у L., a) An inequality for positive definite matrices, Amer. Math. Monthly 62, № 6 A955), 428—430. b) The norm of adjugate and inverse matrices, Arch. Math. 7 A956), 276—277.. c) The spread of a matrix, Mathematica 3 A956), 127—130. d) Inequalities for normal and Hermitian matrices, Duke Math. J. 24, № 4 A957), 591—599. e) Symmetric gange functions and unitarily invariant norms, Quart. J. Math. 11 A960), 50—59. 213. Mitrovic D., Conditions graphiques pour que toutes les racines d'une equation algebrique soient a parties reelles negatives, C. r. Acad. Sci. 240, № 11 A955), 1177—1179. 214. Moore, Bull. Amer. Math. Soc. 26 A920), 394—395. 215. Morgenstern D., Eine Verscharfung der Ostrowski'schen Determinanten- abschatzung, Math. Zs. 66 A956), 143—146. 216. Motzkin Т., Taussky Olga, Pairs of matrices with property W, Trans. Amer. Math. Soc. I, 73, № 1 A952), 108—114; II, 80, № 2 A955), 387—401. 217. N a g у В e 1 a, Remark on S. N. Roy's paper «A useful theorem in matrix theory», Proc. Amer. Math. Soc. 7, № 1 A956). 218. Neumann J., a) Approximative of matrices of high order, Portug. Math. 3 A942), 1—62. b) Some matrix-inequalities and metrization of matrix-space, Известия Науч- Научно-исследовательского ин-та математики и механики при Томском государств, ун-те им. В. В. Куйбышева, т. 1, вып. 3 A937). 219. Okamoto M., On a certain type of matrices with an application to experimen- experimental design., Osaka Math. J. 6, № 1 A954), 73—82. 220. Oppenheim A., Inequalities connected with definite Hermitian forms, Amer. Math. Monthly 61, № 7 A954), 463—466. 221. Orlando L., Sul problema di Hurwitz relativo alle parti realli delle radici di un'equazione algebrica, Math. Ann. 71 A911), 233—245. 222. Ostrowski A., a) Bounds for the greatest latent root of a positive matrix, J. of London Math. Soc. 27 A952), 253—256. b) Sur quelques applications des fonctions convexes et concaves аи sens de J. Schur, J. Math, pures et appl. 31 A952), 253—292. 223. Ostrowski A., c) On nearly triangular matrices, J. Res. Nat. Standards 52, № 6 A954), 344—345. d) On the spektrum of one-parametric family of matrices, J. reine und angew. Math. 193, № 3/4 A954), 143—160. e) Sur les determinants a diagonale dominante, Bui. Soc. math. Belgique 7, № 1 A955), 46—51. f) Note on bounds for some determinants, Duke Math. J. 22, № 1 A955), 95—102. g) Uber Normen von Matrizen, Math. Zs. 63, № 1 A955), 2—18. 224. P a p и 1 i s A., Limits on the zeros of a network determinant, Quart. Appl. Math. 15, № 2 A957), 193—194. 225. P a r о d i M., a) Remarques sur la stabilite, C. R. Acad. Sci. Paris 228 A949), 51—52, ibidem, 807—808, 1198—1200. b) Sur une propriete des racines d'une equation qui intervient en mecanique, С R. Acad. Sci. 241, № 16 A955), 1019—1021. c) Sur la localisation des valeurs caracteristiques des matrices dans le plan complexe, C. R. Acad. sci. 242, № 22 A956), 2617—2618. 226. P e a n о G., Integration par series des equations differentielles lineaires, Math. Ann. 32 A888), 450—456. 227. Penrose R., a) A generalized inverse for matrices, Proc. Cambridge Phil. Soc. 51, № 3 A955), 406—413. b) On best approximate solutions of linear matrix equations, Proc. Cambridge Phil. Soc. 52, № 1 A956), 17—19. 228. Perfect H., a) On matrices with positive elements, Quart. J. Math. 2 A951),, 286—290.
•570 ЛИТЕРАТУРА b) On positive stochastic matrices with real characteristic roots, Proc. Cam- Cambridge Phil. Soc. 48 A952), 271—276. c) Methods of constructing certain stochastic matrices, I, Duke Math. J. 20, № 3 A953), 395-404; II, 22, № 2 A955), 303—311. d) A lower bound for the diagonal elements of a non-negative matrix, J. Lon- London Math. Soc. 31 A956), 491—493. 229. Perkins P., A theorem on regular matrices, Pacif. J. Math. 11 A961), 1529— 1533. 230. Perron O., a) Jacobischer Kettenbruchalgorithmus, Math. Ann. 64 A907), 1—76. b) Ueber Matrizen, ibidem, 64 A907), 248—263. 231. Phillips H. В., Functions of matrices, Amer. J. Math. 41 A919), 266—278. 232. P i g n a n i, On certain matrix equations, Amer. Math. Monthly A957), 573— 576. 233. P о 1 у a G., Remark on Weyl's note, Proc. Nat. Acad. USA 36 A950), 49—50. 234. R a d о R., An ineguality, J. London Math. Soc. 27 A952), 1—6. 235. R a s с h G., Zur Theorie und Anwendung des Produktintegrals, J. fur die reine und angew. Math. 171 A934), 65—119. 236. R h a m G. d e, Sur un theoreme de Stieltjes relatif a certain matrices, Acad. Sci. Serbe, Publ. Inst. Math., 1952, 133—154. 237. R i с h t e r H., a) tlber Matrixfunktionen, Math. Ann. 122 A950), 16—35. b) Bemerkung zur Norm der inversen einer Matrix, Arch. Math. 5, № 4—6 A954), 447—448. c) Zur Abschatzung von Matrizennormen , Math. Nachrichten 18 A959), 178— 187. 238. Roth W., a) On the characteristic polynomial of the product of two matrices, Proc. Amer. Math. Soc. 5, № 1 A954), 1—3. b) On the characteristic polynomial of the product of several matrices, Proc. Amer. Math. Soc. 7, № 4 A956), 578—582. 239. Roy S., A useful theorem in matrix theory, Proc. Amer. Math. Soc. 5, № 4 A954), 635—638. 240. Schneider H., a) An inequality for latent rosts applied to determinants with dominant principal diagonal, 3. London Math. Soc. 28, 1, № 109 A953), 8—20. b) A pair of matrices with property W, Amer. Math. Monthly 62, № 4 A955), 247—249. c) A matrix problem concerning projections, Proc. Edinbourgh Math. Soc. 10, № 3 A956), 129—130. d) The elementary divisors, associated with 0, of a singular /-matrix, Proc. Edingbourgh Math. Soc. 10, № 3 A956), 108—122. 241. S с h о d a K-, tlber mit einer Matrix vertauschbaren Matrizen, Math. Zs. 29 A929), 696—712. 242. Schoenberg J., a) Ueber variationsvermindernde lineare Transformationen, Math. Zs. 32 A930), 321—328. b) Zur Abzahlung der reellen Wurzeln algebraischer Gleichungen, Math. Zs. 38 A933), 546. 243. Schoenberg Т., Whitney A., A theorem on polygons in dimensions with application to variation-diminishing linear transformations, Сотр. Math. 9 A951), 141—160. 244. S с h u r J., Uber die charakteristischen Wurzeln einer linearen Substitution mit einer Anwendung auf die Theorie der Integralgleichungen, Math. Ann. 66 A909), 488—510. 245. Sedla6ek I., O inciden6nich maticich orientovanych grafu, Casop. pest, mat. 84 A959), 303—316. 246. S i e g e 1 С L., Symplectic Geometry, Am. J. Math. .65 A943), 1—86. 247. Stenzel H., Ueber die Darstellbarkeit einer Matrix als Produkt von zwei sym- metrischen Matrizen, Math. Zs. 15 A922). 248. S t б h r A., Oszillationstheoreme fur die Eigenvectoren spezieller Matrizen, J. reineund angew. Math., B. 185, № 3 A943). 249. Taussky Olga, a) Bounds for characteristic roots of matrices, Duke Math. J. 15 A948), 1043—1044. b) A determinantal inequality of H. P. Robertson, J. Washington Acad. of Science 47, № 8 A957), 263—264. 250. Toeplitz O., Das algebraische Analogen zu einem Satz von Fejer, Math. Zs. 2 A918), 187—197. .251. Turnbull H. W., On the reduction of singular matrix pencils, Proc. Edinbo- Edinbourgh Math. Soc, сер. 2, 4 A935), 67—76.
ЛИТЕРАТУРА 571 252. V i v i е г М., Note sur les structure unitaires et paraunitaires, C. R. Acad. sci. 240, № 10 A955), 1039—1041. 253. Volterra V., Sui fondamenti della teoria delle equazioni differenziali lineari, Mem. Soc. Ital., Sci. C) 6 A887), 1—104; C) 12 A902), 3—68. 54. Walker A., Weston J., a) Inclusion theorems Eor the eigenvalues of a normal matrix, J. London Math. Soc. 24 A944), 28—31. b) Ein Einschliesungssatz fur charakteristische Wurzeln normaler Matrizen, Arch, der Math. 1, 1948/49, 348—352. c) Die Einschliesung von Eigenwerten normaler Matrizen, Math. Ann. 121 A949), 234—241. 255. Weierstrass K., Zur Theorie der bilinearen und quadratischen Formen, Monatsh. Akad. Wissenschaft, Berlin A867), 310—338. 256. Wellstein J., Ueber symmetrische, alternierende und orthogonale Nor- malformen von Matrizen, J. fur die reine und angew. Math. 163 A930), 166—182. 257. W e у 1 H., Inequalities between the two kinds of eigenvalues of a linear transfor- transformation, Proc. Nat. Acad. Sci. 35 A949), 408—411. 258. Weyr E., Zur Theorie der bilinearen Formen, Monatsh. fur Math, und Phys. A890), 163—236. 259. Whitney A., A reduction theorem for totaly positive matrices, J. Analyse Math. 2 A952), 88—92. 260. W i e 1 a n d t H.f a) Unzerlegbare, nicht negative Matrizen, Math. Zs. 52 A950), 642—648. b) Lineare Scharen von Matrizen mit reellen Eigenwerten, Math. Zs. 53 A950), 219—225. c) Pairs of normal matrices with property W, J. Res. Nat. Bur. Standards 51, № 2 A953), 89-90. d) Inclusions theorems for eigenvalues, Nat. Bur. Standards, Appl. Math. № 29 A953), 75—78. e) An extremum property of sums of eigenvalues, Proc. Amer. Math. Soc. 6, № 1 A955), 106—110. f) On eigenvalues of sums of normal matrices, Pacif. J. Math. 5, № 4 A955), 633—638. 261. Wong Y., a) An inequality for Minkowski matrices, Proc. Amer. Math. Soc. 4, № 1 A953), 137—141. b) On non-negativ-valued matrices, Proc. Nat. Acad. Sci. USA 40, № 2 A954), 121—124. 262. Winter A., On criteria for linear stability, J. Math. Mech. 6 A957), 301—309.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Алгоритм Гаусса 41 — — обобщенный 55 — —, механическая интерпретация 45 — Рауса 472 Базис векторного пространства 66 — ортонормированный 224 Вектор 65 — главный пучка квадратичных форм 281 — — — эрмитовых форм 301 — собственный линейного оператора 82 — — матрицы 82 —, аннулирующий многочлен 171 —, координаты 67 —, минимальный многочлен 172 —, норма 409 —, относительный аннулирующий много- многочлен 177 —, — минимальный многочлен 177 Векторы линейно зависимые и линейно независимые см. Зависимость линей- линейных векторов Вероятность абсолютная 390 — — предельная 391 — — — средняя 393 — переходная 381 — — предельная 386 — — — средняя 393 Вычитание матриц 16 Делитель элементарный квадратной мат- матрицы 147 — — Я-матрицы 145 Дефект линейного оператора 77 — матрицы 77 Дискриминант квадратичной формы 267 — эрмитовой формы 298 Дополнение ортогональное 241 Жорданова форма см. Форма нормаль- нормальная квадратной матрицы жорданова (верхняя) Зависимость линейная векторов 66 — — —, критерий Грама 225 Задача Рауса — Гурвица обобщенная 533 Закон инерции квадратичных форм 269 — — эрмитовых форм 299 Индекс импримитивности 377 — Коши 469 Интеграл мультипликативный 434 в комплексной области 439 — от матрицы 127 Компонента линейного оператора косо- симметрическая 255 — — — симметрическая 255 Конгруэнтность пучков симметрических матриц 345 — симметрических матриц 269 Координаты вектора 67 Корень из матрицы 212 Критерий Адамара 406 — — для блочных матриц 413 — Грама линейной зависимости векто- векторов 225 — Льенара и Шипара 508 — Ляпунова 425 — подобия матриц 150 — Рауса 475 — Рауса — Гурвица 486 — Фидлера 416 — эквивалентности Я-матриц 144 — — строгой регулярных пучков мат- матриц 332 — — — сингулярных пучков матриц. 344 Линейный оператор см. Оператор линей- линейный Логарифм матрицы 219 Я-матрица 135 —, инвариантные многочлены 143 —, ранг 143 —, элементарные делители 145 —, — операции (левые и правые) 13^ и 136
предметный указатель 573 Матрица 13 — ассоциированная р-я 30 — бесконечная вполне положительная 524 — — ганкелева 495 — блочная 55 — Вандермонда обобщенная 395 — вполне неотрицательная 395 — — положительная 395 — ганкелева 301 — главная пучка квадратичных форм 282 — Гурвица 483 — двояко стохастическая 536 — диагональная 14 — единичная 24 — жорданова (верхняя и нижняя) 153 — идемпотентная 208 — импримитивная 377 — инволютивная 81 — интегральная 418 — квадратная 13 — —, аннулирующий многочлен 98 — —, дефект 77 — —, естественная нормальная форма (первая и вторая) 152 — —, жорданова нормальная форма (верхняя и нижняя) 153, 189 и 154, 190 — —, инвариантные многочлены 147 — —, компоненты 111 — —, минимальный многочлен 98 — —¦, перестановка рядов '352 — —, порядок 13 — —, разложение на треугольные мно- множители 49 — —, след 96 — —, функция от нее 103 — —, характеристический многочлен 92 — —, элементарные делители 145 — квазидиагональная 56 — квазитреугольная (верхняя и нижняя) 56 — комплексная кососимметрическая 313 — — —, нормальная форма 322 — — неособенная, полярное разложе- разложение 317 — — ортогональная 313 — — —, нормальная форма 327 — — симметрическая 313 — — —, нормальная форма 319 — кососимметрическая 29 — Ляпунова 422 — многочленная см. ^-матрица квадратная 87 — неособенная 26 — неотрицательная 352 — неразложимая 352 — —, индекс импримитивности 377 — нильпотентная 208 — нормальная 244 — обратная 26 — ограниченная 132 — ортогональная 238 — особенная 26 — осцилляционная 398 Матрица положительная 352 — преобразующая 150 — примитивная 377 — присоединенная 92 — — приведенная 99 — проекционная 81 — простой структуры 85 — прямоугольная 13 — псевдообратная 32 — разложимая 352 — —, нормальная форма 372 — Рауса 484 — симметрическая 29 — сопряженная 29 — столбцевая 14 — стохастическая 381 — строчная 14 — транспонированная 29 — треугольная (верхняя и нижняя) 28 — унитарная 238, 244 — фундаментальная 86 — характеристическая 92 — эрмитова 244 — якобиева 395 интеграл 127 корень из нее 212 логарифм 219 минор 14 многочлен от нее 24 производная 124 ранг 14 степень 24 функция от нее см. Функция от матрицы Матрицант 430 Матрицы перестановочные (коммутирую- (коммутирующие) 18 — подобные 80 —, вычитание 16 —, сложение 15 —, умножение 17 —, — на число 16 Метод Гревилля нахождения псевдооб- псевдообратной матрицы 39 — Крылова 190 — Лагранжа приведения к сумме квад- квадратов квадратичной формы 271 — — — — — — эрмитовой формы 299 — построения преобразующей матрицы 159 — Фаддеева 96 — Якоби приведения к сумме квадратов квадратичной формы 272 — — — — — — эрмитовой формы 299 Метрика 223 — евклидова 225 — эрмитова 223 — — неотрицательная 223 — — положительно определенная 223 Минор 14 — главный 14 — почти главный 398 Многочлен аннулирующий вектора 171 — — матрицы 98 — — пространства 172
574 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Многочлен инвариантный квадратной матрицы 145 — — ^-матрицы 143 — интерполяционный Лагранжа — Сильвестра 104 — матричный 87 — — регулярный 87 — —, левое и правое деление 87 — минимальный вектора 172 — — — относительный 177 — — матрицы 98 — — пространства 172 — от матрицы 24 — характеристический 82, 92 Модуль линейного оператора левый 249 — — — правый 249 Неравенства Вейля 251, 542 — Неймана — Хорна 539 — Сильвестра 78 Неравенство Адамара 230 — — обобщенное 231 — Бесселя 235 — Буняковского 232 — детерминантное для вполне неотри- неотрицательных матриц 396 Норма вектора 409 — линейного оператора 410 — матрицы 410 Оператор линейный 70 в В 79 — — вещественный 256 — — инволютивный 81 — — кососимметрический 255 — — неособенный 81 — — нормальный в евклидовом про- пространстве 254 — — — в унитарном пространстве 242 — — ортогональный 255 — — — второго рода 255 — — — первого рода 255 — — проекционный 81 — — простой структуры 84 — — псевдообратный 265 — — симметрический 254 — — — неотрицательный 254 — — — положительно определенный 254 — — сопряженный 240 — — транспонированный 254 — — унитарный 243 — — эрмитов 243 — — ¦— неотрицательный 248 — — — положительно определенный 248 , дефект 77 — —, инвариантное подпространство 173 — —, кососимметрическая и симметри- симметрическая компоненты 255 —¦ —, левый и правый модули 249 — —, полярное разложение в евкли- евклидовом пространстве 260 — —, полярное разложение в унитар- унитарном пространстве 249 Оператор линейный, ранг 77 — —, собственные векторы 82 — —, характеристические (собственные) числа 82 Операторы линейные, сложение 71 — —, умножение 71 — —, умножение на число 73 Операция элементарная 135 — — левая 136 — — правая 136 Определитель Грама 226 — —, геометрический смысл 229 — Гурвица 485 — Маркова 521, 525 Ортогонализация ряда векторов 233 Параметры Маркова 518 Перестановка рядов в квадратной матри- матрице 352 Подпространство 68 — инвариантное 173 — координатное 353 — циклическое 178 Порядок матрицы 13 Предел последовательности матриц 49 Преобразование координат 70 — — ортогональное 238 — — унитарное 238 — линейное 15 — Ляпунова 428 Приведение квадратичной формы к глав- главным осям 279 — — — к сумме квадратов 271 — эрмитовой формы к главным осям 300 Проблема Рауса — Гурвица 468 Проектирование ортогональное 227 Проекционная матрица 81 Проекционный оператор 81 Производная мультипликативная 434 — от матрицы 124 Пространство 65 — бесконечномерное 66 — векторное см. Пространство — евклидово 225 — конечномерное 66 — унитарное 223 — —, ортонормированный базис 224 —, аннулирующий многочлен 171 —, базис 66 —, метрика см. Метрика —, минимальный многочлен 172 Псевдообратная матрица 32 Пучок квадратичных форм 281 — — — регулярный 281 — — —, главная матрица 282 — — —, главный вектор 281 — — —, характеристические числа 281 — — —, характеристическое уравне- уравнение 281 — матриц 331 •— — регулярный 332 —¦ — •—, каноническая форма 334 — — сингулярный 332 — — —, каноническая форма 340
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 575 Пучок матриц сингулярный, ранг 335 — эрмитовых форм 301 — — — регулярный 301 — — —, главный вектор 301 — — —, характеристические числа 301 — — —, характеристическое уравне- уравнение 301 Равенство Парсеваля 237 Разложение квадратной матрицы на тре- треугольные множители 49 — полярное комплексной матрицы 317 — — линейного оператора в евклидо- евклидовом пространстве 260 — — — — в унитарном пространстве 249 Ранг квадратичной формы 268 — линейного оператора 77 — матрицы 14 — — многочленной 143 — сингулярного пучка матриц 335 — эрмитовой формы 298 Ряд векторов ортогональный 233 — — полный 236 — —, ортогонализация 233 Сигнатура квадратичной формы 270 — эрмитовой формы 299 Система линейных дифференциальных уравнений с переменными коэффи- коэффициентами 419 — — — — — — — приводимая 423 — — — — — — — — аналитическая 461 — — — — — — —, интегральная ма- матрица 419 — — — — — — —, преобразование Ляпунова 422 — — — — с постоянными коэффици- коэффициентами 124 Системы векторов биортонормированные 241 Скелетное разложение матрицы 32 След матрицы 96 Сложение линейных операторов 71 — матриц 15 Собственное число см. Число собственное Степень матрицы 24 Схема Рауса 474 Сходимость в среднем 236 Теорема Безу обобщенная 92 — Гамильтона — Кэли 93 — Гершгорина 415 — Еругина 426 — Кронекера об ассоциированных ма- матрицах 86 — Ляпунова 479 — Маркова 528 — Неймана — Хорна 541 — Ольги Тауски 409 — о расщеплении вторая 179 — — — первая 173 Теорема о расщеплении третья 181 — Перрона 354 — Рауса 475 — Рауса — Гурвица 483 — Стильтьеса 512 — Фробениуса о ганкелевых формах 305 — — о неотрицательных матрицах 355 — Чебышева — Маркова 531 — Штурма 471 — Шура 242 Тождество Сильвестра детерминантное 47 Умножение линейных операторов 71 — матриц 17 — на число линейного оператора 73 —• — — матрицы 16 Уравнение матричное многочленное 209 — характеристическое (вековое) матри- матрицы 82 — — пучка квадратичных форм 281 — — — эрмитовых форм 301 Форма билинейная 267 — квадратичная 225, 267 — — вещественная 267 — — ганкелева 301 — — неотрицательная 276 — — неположительная 276 — — отрицательно определенная 276 — — положительно определенная 225, 276 — — сингулярная 267 — —, дискриминант 267 — •—, закон инерции 269 — —, приведение к главным осям 279 — —, приведение к сумме квадратов 271 , ранг 268 — —, сигнатура 270 — —, формула Якоби 272 — нормальная квадратной матрицы есте- естественная первая 152 — — — — — вторая 152 — — — — жорданова верхняя 153, 189 — — — — — нижняя 154, 190 — — комплексной кососимметрической матрицы 322 — — — ортогональной матрицы 327 — — — симметрической матрицы 319 — — разложимой матрицы 372 — эрмитова 224, 297 — — билинейная 297 — — неотрицательная 224, 300 — — неположительная 300 — — отрицательно определенная 300 — — положительно определенная 224, 300 — — сингулярная 298 — —, дискриминант 298 —• —, закон инерции 299 — —, приведение к главным осям 300 — —, формула Якоби 299 Формула Бине — Коши 20 — Орландо 488
576 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ ¦Формула основная для функции от матрицы 111 — Чебышева — Маркова 532 — Якоби для квадратичной формы 272 — — для эрмитовой формы 299 Формулы Кэли 252 — — в евклидовом пространстве 261 Функция от матрицы 103 — — —, основная формула 111 — от многих матриц аналитическая 465 Характеристическое число см. Число ха- характеристическое Цепочка векторов жорданова 188 — — — нижняя 189 Цепь Маркова однородная 381 — — — ациклическая 386 — — — неразложимая 386 — — — правильная 386 — — — разложимая 386 — — — регулярная 386 Цепь Маркова однородная циклическая 386 Число характеристическое (собственное) линейного оператора 82 — — пучка квадратичных форм 281 — — — — —, экстремальные свойства 286 — — — эрмитовых форм 301 — — — — —, экстремальные свойства 301 Эквивалентность линейных двучленов 148 — к- матриц 137 — — левая 137 — — правая 137 — —, критерий 144 — рядов векторов 233 — строгая пучков матриц 331 — — — — регулярных, критерий 332 — — — — сингулярных, критерий 344 Элементарный делитель см. Делитель элементарный