/
Текст
П.Ланкастер
ТЕОРИЯ МАТРИЦ
Главная редакция физико-математической литературы издательства «Наука», М., 1973, 280 с.
Книга предназначена быть основой для спецкурсов и справочным пособием
для всех, интересующихся прикладными аспектами теории матриц. Ее можно
рассматривать как хорошее дополнение к обычному курсу линейной алгебры
(первые две главы — изложение линейной алгебры на матричном языке).
Строгое изложение основ теории матриц сочетается в ней с обсуждением
прикладных вопросов, отчасти классических, отчасти новых.
ОГЛАВЛЕНИЕ
Предисловие 7
Глава 1
Линейные пространства, алгебра матриц и линейные алгебраические
уравнения
1.1. Связанные векторы в трехмерном пространстве 9
1.2. Пространства ^,и^ 11
1.3. Внутренние произведения 14
1.4. Линейные комбинации 16
1.5. Матричная алгебра 17
1.6 Разбиения матриц 20
1.7. Вектор-столбцы и вектор-строки 23
1.8. Аннулируемое подпространство и область значений 25
1.9 Линейная зависимость и размерность 27
1.10. Свойства базисных векторов 32
1.11. Определение функции определителя 34
1.12. Свойства определителей 3 6
1.13. Присоединенная и обратная матрицы 39
1.14. Формула Бине — Коши 41
1.15. Ранг матрицы 44
1.16. Решение уравнений 48
1.17. Правило Крамера 51
Смешанные упражнения 52
Глава 2
Собственные значения и собственные векторы
2.1. Характеристическое уравнение 54
2.2. Кратность собственного значения 57
2.3. Собственные векторы 58
2.4. Преобразования подобия и простые матрицы 59
2.5. Спектральная теорема и многочлены от матриц 63
2.6. Ортогональные и квазиортогональные векторы 67
2.7. Ортонормированные системы 69
2.8. Специальные типы матриц 73
2.9. Эрмитовы матрицы 75
2.10. Унитарно подобные преобразования 79
2.11. Идемпотентные матрицы и проекции 82
2.12. Эрмитовы и квадратичные формы 85
2.13. Метод приведения Лагранжа 90
2.14. Определенные матрицы 93
2.15. Теория малых колебаний и одновременное приведение квадратичных 98
форм
2.16. Колебания с внешними силами 102
Смешанные упражнения 103
Глава 3
Вариационный метод
3.1. Введение 106
3.2. Экстремальные собственные значения и отношение Релея 106
3.3. Свойство стационарности отношения Релея 108
3.4. Вариационное описание собственных значений 110
3.5. Задачи со связями 111
3.6. Теорема Куранта — Фишера 113
3.7. Приложения к теории малых колебаний 118
Смешанные упражнения 120
Глава 4
Минимальный многочлен и нормальные формы
4.1. Введение 121
4.2. Алгебра А.-матриц с 122
4.3. ^.-матрицы с матричными аргументами 125
4.4. Аннулирующие многочлены 128
4.5. Приведенная присоединенная матрица и минимальный многочлен 132
4.6. Элементарные операции и эквивалентность А.-матриц 134
4.7. Приведение А.-матриц эквивалентными преобразованиями к 137
простейшему виду
4.8. Эквивалентные преобразования матриц из 3^ 140
4.9. Инвариантные многочлены и каноническая форма Смита 140
4.10. Подобие 143
4.11. Первая естественная нормальная форма 144
4.12. Элементарные делители над полем комплексных чисел 146
4.13. Вторая естественная нормальная форма и жорданова нормальная 149
форма
Смешанные упражнения 153
Дополнение к главе 4 154
Глава 5
Функции от матриц
5.1. Введение 156
5 2 Интерполяционные многочлены 156
5 3. Определение функции от матрицы 158
5.4. Спектральное разложение ддяДА) 163
5.5. Свойства компонентных матриц 166
5.6. Последовательности и ряды матриц 170
5.7. Свойства некоторых элементарных функций 174
5.8. Использование контурных интегралов 175
5.9. Приложения к решению дифференциальных уравнений 178
Смешанные упражнения 182
Глава 6
Нормы векторов и матриц
6.1. Матричные нормы 185
6.2. Векторные нормы 190
6.3. Индуцированные матричные нормы 194
6.4. Абсолютные векторные нормы 199
6.5. Нижние грани 201
6.6. Поле значений 203
Глава 7
Теория возмущений и оценки для собственных значений
7.1 Возмущения в решении линейных уравнений 205
7.2. Теорема Гершгорина 203
7.3 Теорема Шура 212
7.4 Возмущение собственных значений простой матрицы 214
7.5. Аналитические возмущения 219
7.6. Возмущение компонентных матриц 220
7.7. Возмущение некратного собственного значения 223
7.8. Оценка коэффициентов возмущения 224
7.9. Возмущение кратного собственного значения 227
7.10. Редукционный процесс 232
Глава 8
Прямые произведения, решение матричных уравнений и задачи
устойчивости
8.1. Введение 231
8.2. Прямое произведение 235
8.3. Собственные значения составных матриц 237
8.4. Решение линейных матричных уравнений 239
8.5. Уравнение АХ+ХВ=С 240
8.6. Коммутирующие матрицы 242
8.7. Теория устойчивости Ляпунова 245
8.8. Критерий Рауса — Гурвица 248
Глава 9
Неотрицательные матрицы
9.1. Введение 255
9.2. Теорема Перрона — Фробениуса 257
9.3. Приводимые матрицы 262
9.4. Примитивные и импримитивные матрицы
9.5. Стохастические матрицы
9.6. Цепи Маркова
Дополнение 1. Некоторые теоремы из анализа
Дополнение 2. Обобщенная обратная матрица
Дополнение 3. Рекомендации для дальнейшего чтения
Алфавитный указатель
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
264
266
268
271
273
277
278
Алгоритм деления 123
Ассоциативность 10, 18
Базис 27
Бак (R. С. Buck) 275
Беллман (R. Bellman) 279
Бендиксон (I. Bendixon) 213
Блок 21
Варга (R. S. Varga) 279
Вектор единичный 11
— нормального вида 101
— нормированный 68
— нулевой 9
— порядка п 14
— связанный 9
— собственный левый 58
ограниченный 112
правый 54
Вектор-столбец 23
Вектор-строка 23
Векторы биортогональные 67
— квазибиортогональные 63, 68
— квазиортогональные 68
— квазиортонормированные 68
— ортогональные 14, 67
— ортонормированные 67
Вероятность условная 269
Вид колебания 100
Возмущение линейное 227
— относительное 203
Гамбургер (Н. L. Hamburger) 277
Гамильтон (W. R. Hamilton) 126
Гантмахер Ф. Р. 279
Гармоника нормальная 101
Грань нижняя матрицы 202
Граф направлены и 256
— сильно связный 256
Гревил (Т. N. Е. Grevill) 278
Гримшоу (М. Е. Grimshaw) 277
Делитель левый 123
— общий 129
наибольший (НОД) 129
— правый 123
— элементарный 147
линейный 148
нелинейный 148
Дельта кройекеровская 20
Диагональ главная 20
Дистрибутивность 18
Длина 10. 14, 15
Дополнение алгебраическое 36
Дополнения 82
— ортогональные 82, 112
Зависимость линейная 27
Задача общей интерполяции Эрмита
157
Закон инерции Сильвестра 90
Значение собственное 54
ограниченное 112
— функции на спектре матрицы 159
— ^.-матрицы левое 125
правое 125
Индекс импримитивности 264
— собственного значения 154
— формы 90
Интеграл от вектора 102
матрицы 176
— частный 181
Като (Т. Kato) 228, 232, 277
Квадрика центральная 92
Кели (A. Cayley) 126
Клетка жорданова 150
Комбинация линейная 16
Коммутативность 10, 18
Компонента матрицы 164
Координаты нормальные 101
Корень скрытый 147
Косинус направляющий 10
Коши (A. L. Cauchy) 116
Кратность геометрическая 58
— скрытого корня 149
— собственного значения 57
Критерий Грама 72
— Рауса —Гурвица 249
Курант (R. Courant) 111
Ляпунов А. М. 245—247, 249
Макдаффи (С. С. MacDuffee) 241, 277
Маркус (М. Marcus) 277
Матрица 17
— Вандермонда 39
— главная 41
— дефектная 61
— диагональная 20
каноническая 137
— единичная 19
— идемпотентная 65
— импримитивная 264
Матрица квадратная 17
— квазидиагональная 146
— кососимметрическая 74
— косоэрмитова 74
— многочленов 122
— неособая 40
— неотрицательная 255
— неприводимая 256
— нильпотентная 66
— нормальная 80
— нулевая 19
— обратная 40
обобщенная 273
— определенная 93
неотрицательно 93
положительно 93
— ортогональная 74
— особая 40
— перестановочная 87
— приводимая 255
— примитивная 265
— присоединенная 39
приведенная 129
— простая 61
— прямоугольная 17
— с доминирующей диагональю 211
— симметрическая 74
— скалярная 19
— сопровождающая 144, 252
— сопутствующая 64
— стохастическая 266
— транспонированная 17
— треугольная 39
— унитарная 74
— устойчивая 234, 245
— элементарная 136
— эрмитова 74, 228 Матрицы
Гурвица 249
— коммутирующие 18
— подобные 59
ортогонально 78
унитарно 78
— соответствующие 18
Минк (Н. Mine) 277
Мииор 38, 41
— главный 41
Мирский (L. Mirsky) 277
Многочлен аннулирующий 128
— инвариантный 141
— Лагранжа 157
— минимальный 128
— неприводимый 129
— приведенный 128
— с матричным аргументом 64
— характеристический 54
Многочлены взаимно простые 129
Множество выпуклое 193
— замкнутое 271
— ограниченное 271
Монотонность абсолютной
векторной нормы 200
Независимость линейная 27
Неравенство Шварца 15, 44
Норма векторная 190
абсолютная 199
— Гёльдера 190. 192
— евклидова 189
— матричная 185
индуцированная 194
обобщенная 186
— спектральная 186
— Фробениуса 189
Нормы согласованные 191
Область значений матрицы 25
Оболочка выпуклая 193
Образ матрицы 25
Окрестность 271
Оператор самосопряженный 76
Операция бинарная 12
замкнутая 13
— элементарная левая 135
правая 135
Оси квадрики главные 93
Островский (А. М. Ostroweki) 277
Отношение Релея 106
обобщенное 109
эквивалентности 60
Пенроуз (R. A. Penrose) 276
Перестановка 34
Перлис (S. Perils) 277
Перрон (О. Perron) 262
Подпространства дополнительные 82
Подпространство 16
— аннулируемое 25
— собственное 16
Поле алгебраически замкнутое 55
— значений 203
Порядок матрицы 17
— минора 41
Последовательность матриц
расходящаяся 170
сходящаяся 170
Правило параллелограмма 10
Преобразование 24, 60
— конгруэнтное 86
— подобия 59
— эквивалентное 135, 136
Проекция 15, 84
Произведение внешнее 24
— внутреннее 14, 24
— прямое 235
— скалярное 14
Производная вектора 99
— матрицы 99, 176
— определителя 52
Пространство бесконечномерное 28
— линейное 11
, натянутое на систему векторов
16
, порожденное системой
векторов 16
— собственное левое 58
правое 58
— столбцов 25
Радиус спектральный 188
Разбиение 21
— квадратной матрицы
симметричное 22
Разложение определителя по столбцу
36
строке 36
— спектральное 163
Размерность 28
Райнхарт (R. F. Rinehart) 277
Ранг матрицы 46
— по минорам 46
столбцам 45
строкам 45
— формы 90
— А--матрицы 140
Раус (E.J.Routh) 116
Резольвента 176
Релей (Lord Raylegh) 116
Реллих (F. Rellich) 228
Рефлексивность подобия матриц 60
Решение нетривиальное 24
— приближенное в смысле
наименьшего квадратичного
отклонения 275
Решение тривиальное 24
Рудин (W. Rudin) 273
Ряд матриц 172
расходящийся 172
сходящийся 172
— Пюизье 220
Связь 112
Сегмент прямой 193
Сигнатура 90
Симметричность подобия матриц 60
След 56
Сложение векторов 13
Смит (Н. J. S. Smith) 141
Спектр матрицы 63
Стационарность отношения Релея
109
Степень ^.-матрицы 122
Сумма векторов 10
— кронекеровская 238
— матриц 17
— прямая 82
Сфера единичная 106, 192
Теорема Аполлония 16
— Гершгорина 209
— Кели — Гамильтона 126
— Куранта — Фишера 115, 119
— о вычетах 176
параллелограмме 16
— об остатке 125
— Перрона — Фробениуса 259—261
— Пифагора 15
— спектральная 64
— Шура 212
Теплиц (О. Toeplitz) 79
Тождество Коши 44
— Якоби183
Точка предельная 271
Транзитивность подобия матриц 60
Транспозиция 34
Угол 10, 67
Уилкинсон (J. H. Wilkinson) 277
Умножение матриц 17, 18
— на скаляр 13,17
Уравнение неоднородное 24
— однородное 24
— характеристическое 24
Уравнения алгебраические линейные
24
Фаддеев Д. К. 277
Фаддеева В. Н. 277
Финкбейиер (D. Т. Finkbeiner) 277
Фишер (Е. Fischer) 111
Форма каноническая Смита 141
— квадратичная 86
— нормальная естественная вторая
150
первая 146
жорданова 150
— эрмитова 85
Формула Бине — Коши 41, 47
— Лиувилля 183
— Орландо 249
Фробениус (G. Frobenius) 126, 141,
241, 261
Функция 12
— аддитивная 36
— аналитическая 175
— непрерывная 271
— однородная 36
—, определенная на спектре 159
— от матрицы 160
— целая 173
Халмош (P. R. Halmos) 277
Хаусхолдер (A. S. Householder) 277
XHpni(K.A.HirschJ13
Хон (F. E. Hohn) 277
Цепь Маркова 270
однородная 270
Циркулянт 244
Частное левое 123
— правое 123
Частота собственная 100
Число условное 207
спектральное 207 Элемент матрицы 17
Шар 193, 271 п-ка чисел упорядоченная 9
— единичный 193 р-иорма 190
Шнейдер (Н. Schneider) 277 А,-матрица 122
Шур (I. Schur) 79, 212 — регулярная 122
Эквивалентность матриц 140
— А.-матриц 136
ПРЕДИСЛОВИЕ
Эта книга написана в основном для студентов по специаль-
специальностям: прикладная математика, инженерное дело и различные
естественные науки (биология, химия и др.), которые желают
получить полное знакомство с теорией матриц, включая некото-
некоторые наиболее важные достижения теории за приблизительно
последние двадцать лет. Однако ввиду не совсем обычного со-
содержания последних глав я думаю, что многое здесь заинтере-
заинтересует также и математика.
Имея в виду предполагаемую аудиторию, я не счел себя обя-
обязанным придерживаться всех математических абстракций, в то
же время стремился всюду к строгому изложению, которое
было бы приемлемо как для математиков, так и для их со-
собратьев-прикладников. Мы сочли также совершенно необходи-
необходимым привести нетривиальные приложения. Некоторые из них
разбираются в деталях, другие же появляются в упражнениях
и примерах. Некоторые из этих приложений принадлежат обла-
области численных методов, и было бы возможно включить значи-
значительно большее количество таких приложений. Однако, чтобы
книга не стала слишком громоздкой и чтобы не отклониться от
основной линии развития теории, я должен был тщательно себя
ограничить во избежание искушения перегрузить книгу числен-
численными методами.
Хотя предварительные знания для читателя не предполага-
предполагаются обширными, они включают в себя полное владение алгеб-
алгеброй в объеме колледжа (в частности, сюда входят комплексные
числа и полиномиальные уравнения), годовой курс дифферен-
дифференциального и интегрального исчисления и некоторое знаком-
знакомство с алгеброй связанных векторов. Тем не менее опыт пока-
показывает, что, исходя из требуемого уровня восприятия студентов,
материал следует излагать на третьем курсе. Его достаточно
для полного годового курса. Главы- 1, 2 и 4 охватывают мате-
материал, излагаемый во многих местах и предназначенный для по-
полугодовых курсов, и мы рекомендуем главы 1, 2, 4 и 5 как ядро
любого курса, основанного на данной книге. Затем могут быть
8 ПРЕДИСЛОВИЕ
усвоены главы 3, 6 и 7—9, в зависимости от интересов препода-
преподавателя и аудитории. Вторая часть главы 7 и § 5.8 используют
теорию функций комплексной переменной, но эти разделы неза-
независимы от остальной части книги и могут быть при необходи-
необходимости пропущены.
Сокращение упр. используется одновременно для обозначе-
обозначения как примеров, так и упражнений. Так как предполагается,
что студенты уделят внимание как тем, так и другим, то лишь
малое количество из них может быть пропущено. Следует под-
подчеркнуть, что упражнения и примеры составляют существенную
часть книги, а так как я придерживаюсь взгляда, что матема-
математика может быть усвоена лишь при помощи активного действия,
то всякий серьезный читатель этой книги должен быть готов вы-
выполнить по крайней мере 50% упражнений. Большинство упраж-
упражнений довольно простые, там же, где могут возникнуть некото-
некоторые трудности, даются краткие советы или указания на их
полное решение. Отметим также, что некоторые из упражнениГг
используются в изложении теории. Используемые таким обра-
образом упражнения отмечены звездочкой.
Каждая глава делится на параграфы. Так, § 5.3 — это третий
параграф главы 5. Теоремы нумеруются при помощи номера па-
параграфа, так что теорема 5.3.2 — это вторая теорема из § 5.3.
Упражнения нумеруются последовательно 1, 2, 3, ... в каждом-
параграфе.
Книга такого рода во многом, естественно, должна быть обя-
обязана более ранним публикациям на эту тему. В данном изложе-
изложении теории я воспользовался несколькими предыдущими рабо-
работами, наиболее важные из которых упомянуты в дополнении 3.
Однако я могу выделить «Теорию матриц» Гантмахера как осо-
особенно важный для справок труд и как ценный источник идей-
Я благодарен нескольким машинисткам за помощь на различ-
различных стадиях подготовки рукописи, а особенно Лезии Хорелак
за всегда квалифицированное содействие. Мои коллеги Ри-
Ричард К. Гай и Девид Л. Рой помогли детальными и конструк-
конструктивными замечаниями по главе 1 и Джон Г. Рокне принял
участие в окончательном корректировании. Я искренне благо-
благодарен всем троим. Но так как я один несу ответственность за
ошибки в тексте, прошу обратить на них мое внимание.
Питер Ланкастер
Глава 1
ЛИНЕЙНЫЕ ПРОСТРАНСТВА, АЛГЕБРА МАТРИЦ
И ЛИНЕЙНЫЕ АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
1.1. Связанные векторы в трехмерном пространстве
Наша цель в этой главе — ввести понятие линейного прост-
пространства и, в частности, тех пространств, которые понадобятся
нам при изучении матриц. Начнем с основного понятия: упоря-
упорядоченная п-ка чисел есть п чисел, расположенных в определен-
определенном порядке. Повторения одного и того же числа в упорядочен-
упорядоченной п-ке допустимы, но если положения двух неравных чисел
в упорядоченной n-ке меняются, то в результате получается
новая упорядоченная п-ка, не равная первоначальной. Нашей
ближайшей целью является введение алгебры упорядоченных
л-ок, т. е. мы хотим исследовать способы их комбинирования
и преобразования друг в друга.
Многие читатели, по-видимому, знакомы до некоторой сте-
степени с алгеброй упорядоченных троек вещественных чисел, но,
возможно, в другом виде. Мы имеем в виду изучение алгебры
связанных векторов в трехмерном евклидовом пространстве.
Чтобы начать наш анализ с того, что будет знакомо для боль-
большинства читателей, мы кратко (и с некоторой опорой на интуи-
интуицию) обсудим алгебру связанных векторов и затем покажем,
как изложенные идеи могут быть обобщены на изучение упоря-
упорядоченных п-ок и на понятие /г-мерного пространства.
С точкой Р, имеющей декартовы координаты (хих2,хъ), ас-
ассоциируется связанный вектор х. Начало О системы координат,
т. е. @,0,0), определяет нулевой вектор. Точка Р однозначно
определяет либо х, либо упорядоченную тройку вещественных
чисел (х\,х2,Хз). Рассматривая х a (x\,x2,x3) как различные
обозначения одного и того же вектора, будем писать
* — (*Ь Х2, Х3).
10
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Длина вектора х задается формулой | х | = л/х\ + х\ + х2г>
а его направление определено углами 8^ 82, 83> где 0<I6j<In и
cos 6,=-^-, i= 1,2,3.
Это направляющие косинусы вектора х (рис. 1).
Пусть точкам Р, Q соответствуют связанные векторы х, у.
Мы определяем сумму векторов х и у как вектор
x + y = (xi + уь х2 + Уъ х3 + уг).
Легко проверить, что это определение эквивалентно правилу па-
параллелограмма для сложения векторов, которое утверждает,.
Рис.
Рис. 2.
что если х -\- у — связанный вектор точки R, то OPRQ — парал-
параллелограмм (рис. 2).
Из определения и соответствующих свойств вещественных
чисел следует, что сложение связанных векторов коммутативно
и ассоциативно, т. е.
Последнее равенство означает, что можно писать х + У + z, не
опасаясь двусмысленности.
Рассмотрим связанный вектор г, который имеет длину |дс[,
но направление, противоположное х. Если направления векто-
векторов х и z задаются углами 8г-, ц>^ соответственно (г = 0, 2, 3), то
ф* = П — 0j И
cos фг = — cos 8, = — -rjj = -r-f-.
11
Таким образом, г,-=—xiy г = (—хи—х2,—х3) и х + г = 0.
Поэтому мы записываем г как —х. Следовательно, для каждого
.связанного вектора х существует вектор —х такой, что * +
Пусть k — произвольное вещественное число. Определим век-
вектор k{x\,x2,Лз), или kx, как (kxi,kx2,kxb). Если х фиксировав
и k пробегает все вещественные числа, то множество всех век-
векторов вида kx представляет все точки на прямой, проходящей
через начало координат и содержащей х. Ясно, что можно на-
написать (—х) ~ (—\)х. Легко убедиться, что для любого веще-
вещественного числа а
«(х + у) = а (хх + уь х2 + г/2. *з + Уз) =
= (а (х, + У\), а (х2 + у2), а (х3 + у3)) = ах + ау,
а также
(а + Р) х = ах + Р«, а (Р«) = (Ф х.
Единичные векторы в\— A,0,0), е2 = @,1,0), е3=@, 0, I)
особенно важны. Используя введенные выше операции, мы мо-
можем написать теперь для любого х:
х = (хи х2, х3) = {хи 0, 0) + @, х2, 0) + @, 0, х3) = х,е, -f x2e2 + х3е3.
1.2. Пространства 9in и <%„
Перечислим теперь те свойства связанных векторов, которые
¦обсуждались выше. Для любых связанных векторов х, у, z и лю-
любых вещественных чисел а, р имеем:
А1 х-\~ у — однозначно определенный вектор из того множе-
множества, которому принадлежат х, у.
А2 х + У = У + х.
A3 (x + y)+z = x + (y + z).
А4 Существует такой вектор 0, что х + 0 = х.
А5 Для любого х существует такой вектор —х, что
Б1 аде — вектор из того множества, которому принадлежит х.
Б2 а(рлс) = (аР)ж.
БЗ а (х + У) = ах + ау.
Б4 (а + Р)* = а*-т-Р*.
Б5 1 -х = х.
Мы используем теперь эти свойства для общего определения.
•Любое множество элементов (интуитивно соответствующих свя-
связанным векторам, вследствие чего эти элементы называются век-
векторами), которые удовлетворяют условиям А1—А5 и Б1—Б5,
называется линейным пространством над полем вещественных
чисел.
]2 ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Элементы множеств из некоторых последующих упражнений
являются функциями. Если это так, то сумма двух функций
есть функция, получаемая обычным образом при помощи сло-
сложения соответствующих функциональных значений для каждого'
допустимого значения независимой переменной. Подобно этому
произведение вещественного числа и функции есгь функция,
получаемая умножением функциональных значений на заданное
число. '
Например, пусть функции / и g определены на отрезке [2, 3]:
формулами
f(x) = (l-x)~l и g(x) = ex.
Функции f-\-g и а/ (для любого вещественного а) определены.
на том же самом отрезке формулами
g)М = f(x) + g(x) = (l- A-)"' + е
\
Упр. 1. Проверить, что следующие множества являются ли-
нейными пространствами над полем вещественных чисел:
(а) множество всех многочленов степени не выше п с веще-
вещественными коэффициентами;
(б) множество всех вещественнозначных функций, опреде-
определенных на [0, 1] и имеющих там непрерывную первую произ-
производную;
(в) множество всех ограниченных функций, определенных
на [0, 1];
(г) множество всех сходящихся последовательностей (с со-
соответствующими операциями сложения и умножения).
Упр. 2. Являются ли следующие множества линейными про-
пространствами над полем вещественных чисел:
(а) множество всех функций, интегрируемых на [0, 1];
(б) множество всех вращений твердого тела вокруг осей,,
проходящих через фиксированную точку;
(в) множество всех связанных векторов единичной длины
в трехмерном пространстве?
Пусть А, В и 5 — произвольные множества и А X В обозна-
обозначает множество всех упорядоченных пар элементов (а,Ь), где
a, b — элементы из А и В соответственно. Бинарная операция
из А X В в 5 есть правило, по которому каждой упорядоченной
паре из А~ХВ ставится в соответствие единственный элемент
из 5. Например, если каждое из А, В и 5 есть множество всех
вещественных чисел, то сложение, вычитание и умножение ве-
вещественных чисел являются бинарными операциями из А X А
в А. Если за Ai принять множество всех вещественных чисел, за
1.2. ПРОСТРАНСТВА %п И <?„ 13
исключением нуля, то деление будет бинарной операцией из
Ау^Ах в А. Если V — множество всех связанных векторов, то
бинарная операция умножения на скаляр, удовлетворяющего
условиям Б1—Б5, отображает А X V в V. Бинарная операция
сложения векторов, удовлетворяющего условиям А1—А5, отоб-
отображает V X V в У-
Бинарная операция, определенная на множестве R X R, на-
зызается замкнутой, если она отображает /? X R в R. Так, сло-
сложение векторов — замкнутая бинарная операция.
В определении линейного пространства было использовано
выражение «поле вещественных чисел». Мы не даем определе-
определения понятия «поле». Заинтересованный читатель, не знакомый
пока с этим понятием, может найти его определение в любом
изложении современной алгебры. В применении к этой книге
ноле, о котором идет речь, всегда будет либо множеством Ш
всех вещественных чисел, либо множеством <$? всех комплекс-
комплексных чисел. Следовательно, тому, кто не знаком с общим опре-
определением, всегда можно при упоминании общего поля 5Г пред-
представлять себе вместо 5Г либо 52, либо W.
Рассмотрим теперь множество ? такое, что условия А1—А5
и Б1—Б5 выполняются для любых х, у, г из 9? и любых а, р из
поля 3". В таком случае мы говорим, что &— линейное про-
пространство над полем SF.
В частности, рассмотрим множество всех упорядоченных п-ок
вещественных чисел. Если х, у из этого множества, то мы пишем
х = (*,, х2, ..., хп), у — (г/,, уъ ..., уп)
и определяем сложение в этом множестве по правилу
х + У = (*i + У\, х2 + у2, ..., хп + уп).
Умножение на вещественное число а определяется равенством
аде = {ахь ах2, ..., ахп).
Легко проверить, что введенные операции превращают рассмат-
рассматриваемое множество в линейное пространство над веществен-
вещественными числами. Это пространство обозначается через @tn- При
п — 3 получаем уже рассмотренные связанные векторы и Й?3
соответствует обычному евклидову трехмерному пространству.
При п = 2 получаем множество связанных векторов на плос-
плоскости.
Второй важный пример линейного пространства: множество
всех упорядоченных n-ок комплексных чисел над полем ком-
комплексных чисел с операциями, определенными по тем же
"D ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
правилам, что и для 5?„. В общем случае через &~п обозначаем
линейное пространство упорядоченных я-ок над полем $Г.
В дальнейшем элемент (х\, х2,... ,хп) линейного простран-
пространства ЗГп будет упоминаться также как вектор порядка п.
1.3. Внутренние произведения
В пространстве 5?з «скалярное произведение» х-у = Х\у\ -f-
+ x2iJ + хъуъ — важное и полезное понятие. В частности, имеем
х ¦ х = \х\2 и х • у = \х\ -\у\ cos 9,
где 6 — угол между х и у, причем ненулевые векторы х и у по
определению перпендикулярны, если 6 = 90°, т. е. если х-у = 0.
В пространстве 31п мы вводим другое обозначение для того
же самого произведения. Мы пишем
(х, у) = *!//, + х2у2 + ¦ • • + хпуп A.3.1)
и называем это число внутренним произведением векторов х и у.
Мы заимствуем также геометрический язык из 5?3 Для опреде-
определения
1*1= У*г + *5+ ••• +хп = (*> *>
как длины вектора х и говорим, что два вектора х, у из 91п ор-
ортогональны, если (дс, у) = 0.
Обобщим это понятие на более широкий класс линейных
пространств. В общем линейном пространстве SP над полем 9"
(в котором определено комплексное сопряжение) бинарная опе-
операция (дс, у) из 2? X 2? в &~ называется внутренним произведе-
произведением, если для всех х, у, z из 3? и а, р из 5Г выполняются
условия:
81 (дс, дс) ^ 0 и (дс, дс) = 0 тогда и только тогда, когда дс = 0.
82 {х, ау + Р«) = а{х, у) + р(дг, г).
83 {х,у) = {у,х) (где черта сверху обозначает комплексное
сопряжение).
Легко проверяется, что эти условия выполняются для бинар-
бинарной операции A.3.1) в 31п.
Попытаемся теперь найти внутреннее произведение в ^„. Бу-
Будет ли таковым произведение, определенное формулой A.3.1)?
Согласно этой формуле мы имели бы
и ясно, что е общем случае условие В1 не выполняется. Если
же положить
(дс, у) = xiyi + х2у2 + ... + хауя, A.3,2)
1.3. ВНУТРЕННИЕ ПРОИЗВЕДЕНИЯ 15 ,
то {х,х) = х1х1 + ... +XnXn = \xi\'2+ ... +\xn\2^s0, и усло-
условие В1 теперь выполняется. Проверка условия В2:
(х, ад + р«) = хх (ш/, + pz,) + х, (аг/2 + Pz2) + ... + хп (ауп + $г„) =
= а (ЗД, + ... + х„г/Л) + р(х,^ + .. . + *„г„) = а<лс, у) + р(х, г).
Для проверки ВЗ пишем
(у> х) = (г/.л:! + . . . + дяхп) = x^i + • • • + хпуп = (х, у).
Следовательно, формула A.3.2) действительно определяет
внутреннее произведение в ^„ и, более того, A.3.1)—частный
случай A.3.2) для Stn. Естественно, если х — элемент из ffn, то
мы называем {х,х)Чг длиной х.
В конце этого параграфа мы приведем одно важное неравен-
неравенство, обычно известное как неравенство Шварца:
Теорема 1.3.1. Если х, у — элементы линейного простран-
пространства, в котором определено внутреннее произведение, то
\{х, у)\2<(х, х)(у,у).
Доказательство. Положим а = —{х,у), Ь = (х,х) и z =
i= ах + by. Мы должны доказать, что \а\2 ^ Ь{у,у). По усло-
условиям В1 и В2
О < (г, г) = (ах + by, ax +by) = a (ax + by, x) + b (ax -\- by, у)
и, используя упр. 1 ниже,
О < аа (х, х) + ab (у, х) + Ъа (х, y) + bb {у, у).
Используя определения а и b и то, что Б = Ь, приводим послед-
последнее неравенство к виду
Если 6 = 0, то х = 0 и результат тривиально верен. Если
b > 0, то получаем \а\2 ^ Ь(у,у). 4
*Упр. 1. При выполнении условий В1—ВЗ показать, что
(ах + $у, 2> = а<ж, 2> + P<r/, г).
*Упр. 2. В 5?з проекция вектора х на ненулевой вектор у
определяется как ау, где у — вектор единичной длины с направ-
направлением вектора у и а — длина вектора х, умноженная на коси-
косинус угла между хну. Показать, что
а = (У, х)/(у, уУ'2.
*Упр. 3 (теорема Пифагора). Доказать, что если (х,у) =0,
то
(х + у, х + у) = (х, х) + (у, у).
Jp ГЛ. I. ЛИНЕЙНАЯ АЛГЕБРА
Упр. 4. Доказать, что
(х + У, х + у) + <* - у, х - у) = 2 «ж, х) + (у, У)).
Этот результат иногда упоминается как теорема Аполлония или
как теорема о параллелограмме.
1,4 Линейные комбинации
Если Хи *2, • • ¦ > *г — элементы из 9? и а,\, а*. ... аг — эле-
элементы из #", то п\Х\ + ... + аг*г принадлежит 2' и назы-
называется линейной комбинацией векторов Х\, х2, ..., дсг. В следую-
следующей теореме рассматривается множество всех линейных комби-
комбинаций от *ь #2, ¦•-, х,, т. е. множество всех векторов вида
aiX\ + ... + ar*r, где (аи...,аг) пробегает всевозможные упо-
упорядоченные наборы г чисел из ноля 3F.
Теорема 1.4.1. Множество всех линейных комбинаций век-
векторов Х\, ..., хг из 3? является линейным, пространством.
Доказательство. Очевидно, что сумма линейных ком-
комбинаций есть линейная комбинация (Al). A2 и A3 следуют из
свойств 9?. Отмечая, что 0 может быть выражен как линейная
комбинация векторов xit ..., хг, получаем А4. Свойства А5 и
Б1—Б5 проверяются так же просто. ^1
Описанное в теореме пространство называется порожденным
(или натянутым на) г данными векторами. Оно является под-
подпространством в S', т. е. подмножеством 3?, которое само есть
линейное пространство над #". Если обозначить подпространство
через 2", то каждый элемент из 3?' будет элементом из 9?\ об-
обратное утверждение не обязательно выполняется. Мы говорим,
что 9?' «содержится в» 9? и пишем ?' S 9?, или 9? э 9?', что
выражается словами: «9? содержит 2"». Если известно, что
&! Ф 9?, то мы пишем 2" а 2? или & :э 9?' и говорим, что
9?' — собственное подпространство в 9?.
Евклидова геометрия пространства Й?з дает нам несколько
полезных примеров. Отметим, что любые два ненулевых связан-
связанных вектора х и г/, которые не кратны друг другу, порождают
плоскость в 5?з, проходящую через начало координат. Один век-
вектор х порождает прямую, проходящую через начало координат,
и любые три вектора, не лежащие в одной плоскости, порож-
порождают Й?3-
Упр. 1. Найти вектор х в 5?з, который ортогонален к каждому
из векторов B, 1,—1) и A,5,2), и показать, что любое скаляр-
скалярное кратное вектора х также ортогонально этим векторам.
Упр. 2. Найти длину проекции вектора B,7,—1) на вектор
E,7,4).
1.5. МАТРИЧНАЯ АЛГЕБРА 17
Упр. 3. Найти ненулевой вектор, который принадлежит как
пространству, натянутому на A,2,—1) и C,2,0), так и прост-
пространству, натянутому на B,—1,—1) и A,0,4). Дать геометри-
геометрическую интерпретацию.
Упр. 4. Доказать, что B,—1,6,4) принадлежит простран-
пространству, порожденному A,5,—2,1) и A1,11,18,19).
*Упр. 5. Показать, что векторы B,—1,6) и (—3,4,1) по-
порождают то же самое пространство, что и (—1, 3, 7) и (8, —9, 4).
1.5. Матричная алгебра
Мы определяем матрицу как прямоугольную таблицу чисел
<11 «12 Old
l2l «22 &2П
&m\ Ощ2 пщп
где элементы матрицы a,j (I ^ i ^ ш, 1 ^ / ^ п) — числа из
поля 3F. Для наших целей поле ST всегда будет либо множе-
множеством всех вещественных чисел, либо множеством всех ком-
комплексных чисел. Размер матрицы в терминах числа строк m
и числа столбцов п обозначается через m X п- Если m = n, то
говорят, что матрица квадратная порядка п. В общем случае
матрица называется прямоугольной.
Каждой m X «-матрице А с элементами a,j соответствует
п X ти-матрица с элементами ац. Она называется транспониро-
транспонированной к Л и обозначается через А'. Ясно, что {А')' = А. Отме-
Отметим, что строки матрицы А становятся столбцами в Л' и столб-
столбцы матрицы Л становятся строками в А''.
Определим теперь следующие операции:
(i) Сумма двух шХя-матриц А и В с элементами a,j и 6,-j
есть m X «-матрица С с элементами Сц = а,ц + Ьц, и мы пишем
(И) Произведение матрицы Л на число а поля &~ есть мат-
матрица С с элементами Сц = аац, и мы пишем С = аА.
(iii) Произведение тХ /-матрицы Л на / X я-матрицу В есть
п X «-матрица С с элементами Сц= Л aikbkl, и мы пишем
*Упр. 1. Рассмотрим множество всех тХ «-матриц (с фик-
фиксированными ш, п) с элементами из ?Г. Показать, что операции
(i) и (ii) превращают это множество в линейное пространство
«ад 9Г.
18 ГЛ. 1 ЛИНЕЙНАЯ АЛГЕБРА
Результат этого упражнения наводит на мысль обозначить
множество всех вещественных (комплексных) тХ^-матриц че-
через Ятхп('ё'тХп) и вообще множество всех тХ^-матриц с эле-
элементами из поля &~ через 2Гту.п. Таким образом, последнее
упражнение просто означает, что 5ГтХп— линейное простран-
пространство над ?Г. Очень важно, чтобы читатель завершил доказа-
доказательство этого утверждения. В результате он убедится в том,
что сложение матриц коммутативно и ассоциативно, чтЬ умно-
умножение на скаляры ассоциативно, как и требует условие Б2,
и дистрибутивно по отношению к сложению матриц, как и тре-
требует условие БЗ.
Отметим, что операция (ш), известная как умножение мат-
матриц, определена только для соответствующих друг другу мат-
матриц, т. е. число столбцов первого множителя должно быть равно
числу строк второго. Следовательно,' как определено в (iii),
умножение матриц является бинарной операцией из STm^i X
X STix-n в 3Fmxn.
Читателю следует также доказать, что умножение матриц
дистрибутивно по отношению к сложению матриц, т. е. если А,
В, С, D — матрицы, то
А (В + С) = АВ + AC, (B+C)D = BD + CD
всегда, когда все входящие сюда операции определены. Нако-
Наконец, следует доказать, что умножение матриц ассоциативно,
т. е. если Р, Q — соответствующие друг другу матрицы и Q, R
тоже, то
Эти свойства легко проверяются прямым вычислением, исходя
из определений сложения и умножения матриц.
Отметим, что, вообще говоря, ВА Ф АВ; если имеет место
равенство, то мы говорим, что А и В коммутируют. Если А и В
коммутируют, то они, очевидно, квадратные матрицы одного
и того же порядка.
Упр. 2. Вычислить АВ, ВС, А (ВС), (АВ)С, (ВС)', С'В',
где
14 1 о| | 1 — 1 |
0-23, С= 2 0 .
0 — 3 2 11 1 4 2 I
*Упр. 3. Доказать, что
(i) если Л и В из ЗГтХп, то (А + В)' = А' + В';
(и) (аА)' — а.А', где А из grmXn и а из ЗГ;
(Hi) если произведение АВ существует, то (АВ)' = В'АГ,
а следовательно, если АВ ... К существует, то (А...К)'=:
= К' ... А'.
1.5 МАТРИЧНАЯ АЛГЕБРА
19
Упр. 4. Найти все матрицы, коммутирующие с
1
-1
(и)
*Упр. 5. Если А из 9~тхп и Л/ = Л, JA = А, то / из STnxn
И / ИЗ &~тХт.
*Упр. 6. Доказать, что если А из @~ту.{, В из 3Fixn и а из 5F,
то (аА)В = А(аВ) = а(АВ),
В дополнение к упр. 1 читателю предлагается убедиться
в том,,что т X «-матрица из f mxn, элементы которой все яв-
являются нулями, играет роль нулевого элемента. Очевидно, что
такая матрица действует также как нулевой элемент в операции
умножения матриц. Существует ли такая матрица, которая вы-
выполняет роль единицы, или единичного элемента, для умноже-
умножения матриц? Иначе говоря, существует ли такая матрица /, что
AI = А и IB = В всегда, когда произведения определены? Не-
Нетрудно убедиться (упр. 5), что если Л/ = А и А из &~тхп, то /
должна быть квадратной матрицей порядка п. Отметим теперь,
что п X «-матрица /, заданная как
г
удовлетворяет требуемому свойству для любой А из &~тхп- Чи-
Читателю предлагается проверить этот простой факт, исходя из
определения умножения матриц. Нетрудно проверить также,
что для любой В из @~пхр имеем IB = В. Эти два свойства
позволяют назвать матрицу / единичной матрицей.
Следует отметить, что для некоторой фиксированной мат-
матрицы А может существовать много матриц В, для которых
АВ = А, но / — единственная матрица с этим свойством для
любой матрицы Л из @~тхп- Доказательство этого станет оче-
очевидным, когда будут привлечены понятия ранга и вырождения.
Скалярная матрица определяется как скалярное кратное
единичной матрицы. Следовательно, Л — скалярная матрица
в @~пхп тогда и только тогда, когда существует такое а из 9~,
что Л = а/, где / — единичная матрица порядка п. Следует за-
заметить, что умножение на скалярную матрицу дает тот же са-
самый эффект, что и операция умножения на скаляр и наоборот.
Это следует из того, что для любой В из 9~тхп имеем
1
0
0
0
0
1
0
0
0 . .
0 . .
1 . .
0 . .
. 0
. 0
. 0
. I
20 ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
и подобно этому для С из (ГпХр и а из &" будет (а/) С =¦
= а AС) = аС.
Скалярные матрицы являются подмножеством другого
класса матриц, известных как диагональные матрицы.
Будем называть элементы ajh матрицы Л с / = k главной
диагональю А. Квадратная матрица, ненулевые элементы кото-
которой лежат на главной диагонали, называется диагональной.
Ясно тогда, что скалярная матрица является диагональной мат-
матрицей, все элементы которой на главной диагонали равны.
Если D — диагональная матрица с элементами djh, 1 ^ /, k ^ пг
то
du при j =
а,
: = difijk = |
0 при \фк.
где 8jft — кронекеровская дельта, имеющая значение 1 при / = k
и 0 при / Ф k.
Диагональная матрица сокращенно записывается в виде
Z) =^= diag -[cf|i, d22, ..., dnn}.
Если Л — квадратная матрица, то определено произведение
АА, и мы пишем АА = Л2. Используя ассоциативность произве-
произведения матриц, можно показать, что АА ... А (р раз) — одно-
однозначно определенная матрица, которую мы записываем в виде
Ар. Предположим также, что А° = I. В настоящий момент эта
формула должна рассматриваться как удобное соглашение, на
в главе 5 мы увидим, чго она является логическим следствием
соответствующего соглашения для комплексных чисел.
Упр. 7. Найти все матрицы /, для которых AJ = Л, если
A = V Ml
л 1 0 0 1| '
*Упр. 8. Для D = diag {du ... ,dn) показать, что результат
матричного произведения AD сводится к умножению/-го столбца
матрицы Л на dj, ] = 1, 2, ..., п; дать подобную интерпретацию-
для произведения DB.
*Упр. 9. Доказать, что диагональные матрицы одного и того-
же порядка коммутируют.
1.6. Разбиения матриц
Если m X «-матрицу Р, m X /-матрицу Q, k X «-матрицу R
и k X /-матрицу S записать в виде
| Р Q || m П fi П
\\ R S \\ k ' U-o-i>
п I
1.6. РАЗБИЕНИЯ МАТРИЦ
21
то они, очевидно, образуют некоторую (т + k) X(" + 0 -мат-
-матрицу А. В таком случае Р, Q, R, S могут быть названы блоками
матрицы А и обозначены через Л1Ь Л12, A2i и А22 соответ-
соответственно. Представление A.6.1) называется разбиением мат-
матрицы А. Эта идея может быть обобщена на несколько подраз-
подразделений между строками и столбцами; блоки матрицы можно
представлять себе образованными разделяющими линиями
между некоторыми строками и некоторыми столбцами (каждая
разделяющая линия полностью рассекает матрицу по ширине
или высоте).
Если матричное произведение АВ существует и А, В разбиты
на блоки AqP, Bpr, а разбиение по столбцам матрицы А соот-
соответствует разбиению по строкам матрицы В, го можно ожидать,
что АВ имеет блоки (AB)qr, задаваемые формулой
(AB)qr = Z AqpBpr.
р
Таким образом, мы предполагаем, что произведение матриц
в терминах блоков, полученных при соответствующих разбие-
разбиениях сомножителей, формально совпадает с произведением этих
матриц в терминах скалярных элементов. Прежде чем дать до-
доказательство этого результата, иллюстрируем высказанное пред-
предположение простым примером.
Упр. 1. Пусть
/4 =
2: 13
о: -l 2
3 -7 -7
Лп =
-1
Я„ = ||3 -7 -7 2|1,
-2140
0 2 4 0
Тогда мы требуем, чтобы
АВ = \\Ап Л,2|
Е>2\
|3 -7 -7
5 -14 -14 4
) 0 0 0
0 II I
z II ~г
"г"
—
-2
2
7
3
3
2
16
4
-2
С
0
0
1
2
=
4
4
4
2
0
0
_7
3
2
4
4
0
что может быть проверено прямым вычислением АВ.
Теорема 1.6.1. Пусть матрица А из @~mxi имеет блоки A
где Aqp — mq X 1Р-матрица, 1 ^ р < а, « S — матрица из
qpy
ГЛ. I. ЛИНЕЙНАЯ АЛГЕБРА
с блоками Врг размера 1Р X пг. Тогда Л В имеет блоки
(AB)qr = ? AqpBpr.
Доказательство. Отметим сначала, что каждое произ-
произведение AqpBpr существует и является mq Xfir-матрицей. Сле-
а '
довательно, Cqr = Z AqpBpr существует и будет mq X "г-матри-
цей. Далее, для фиксированного q каждое Cqr имеет пг столбцов
и для фиксированного г каждое CqT имеет mq строк, откуда
следует, что Cqr— блоки некоторой m X "--матрицы С.
Пусть сц — некоторый элемент матрицы С, расположенной
а
в клетке (а, Ь) блока Cqr. Так как Cqr — Z AqpBpr, Сц есть
сумма элементов в клетках (а, Ь) матриц AqpBpr, р — 1, 2, ...
. . . , а. Но элемент матрицы AqpBpr в клетке (а, Ь) является
суммой произведений 1Р элементов в строке а матрицы Aqr на
элементы столбца b матрицы Врг. Далее, элементы строки а
матрицы Адр совпадают с некоторыми элементами /-й строки
в А, а именно, с а^, где индекс k определяется неравенствами
p-1
Z/v
v=l
Z /*
если
если
p> i.
Подобно предыдущему, элементы столбца b матрицы Врг будут
элементами bk! в В. Следовательно,
= Е alkb
lkbk!
ciikb
kj
П
Z o.ikbkl.
*Упр. 2. (i) Квадратная матрица А с блоками Aqr имеет
.симметричное разбиение, если блоки Aqg — квадратные матрицы
для каждого q. Исследовать вид степеней Ап для целого поло-
положительного числа п, если AqT = 0, как только q ф г.
(и) Пусть р(Х) = Х3 + 12 + 2К + 2 и р(А) = А3 + А2 + 2А + 2.
Показать, что если
X
0
0
0
0
0
0
и
0
0
0
0
0
1
^
0
0
0
0
0
0
V
0
0
0
0
0
1
V
0
0
0
0
0
1
V
1.7. ВЕКТОР-СТОЛБЦЫ И ВЕКТОР-СТРОКИ
ТО
P(A) =
Упр. 3. Пусть
рица вида
Р (^)
0
0
0
0
0
А-
0
р(ц)
0
0
0
0
0
Р'ОО
Р(И)
0
0
0
0
0
0
P(v)
0
0
0
0
0
p'(v)
p(v)
0
0
0
0
Р'Ы
P(v)
-имеющая симметричное разб
А
=
An
0
л12
1
и значение многочлена от Л определено, как в упр. 2. Доказать,,
что для любого целого положительного числа п
Л?1 Р(ЛП)Л12
О /
где
= (Г-
1.7. Вектор-столбцы и вектор-строки
дХ1-матрица (имеющая лишь один столбец) определена
упорядоченной совокупностью своих п элементов из поля SF. За-
Заметим, что операции сложения и умножения на скаляр, приме-
примененные к этим матрицам из одного столбца, или вектор-столб-
вектор-столбцам, в точности совпадают с операциями над компонентами,
которые определены в 8Гп. Действительно, пространство всех
вещественных вектор-столбцов, например, в точности совпадает
с 5ЙП, если только условиться записывать каждый вектор вер-
вертикально. Начиная с этого места, в дальнейшем х всегда будет
обозначать вектор-столбец
х2
а говоря о векторах из &~п, мы будем представлять себе их за-
записанными в виде столбцов.
Мы могли бы равным образом рассматривать элементы из.
&~п как матрицы из одной строки, или вектор-строки, но мы
отдаем предпочтение записи такой матрицы как транспониро^
¦24 ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
ванной от вектор-столбца. Таким образом, для введенного выше
вектор-столбца х имеем х' — И*! х2... х„ \\.
Внутреннее произведение векторов х и у из Wn может быть
теперь записано в виде
(х, у) = х]ух + х2у2+ ... + хпуп = х'у,
где х — элемент из Wn, получаемый комплексным сопряжением
компонент х.
Если х, у имеют порядки п, m соответственно, то произведе-
произведение ху' будет п X пг-матрицей, которая часто называется внеш-
внешним произведением. Отметим, что ух' имеет размеры m X«
и (ух')' = ху'.
Введя все эти обозначения, совокупность линейных алгеб-
алгебраических уравнений
апхх +«12*2 + ... +а\пХп =У\,
+ + • ¦ • + а2пхп = у2,
amiXi + am2x2 + . .. + amnxn = ym
относительно неизвестных хи х2, ..., хп можем записать в виде
Ах = у, A.7.1)
где А — тХ "-матрица коэффициентов atj и х, у — векторы по-
порядков п, m соответственно Последнее уравнение может также
рассматриваться как преобразование вектора х из @~п в век-
вектор у из &~т. Это наводит на мысль рассматривать А как пре-
преобразование 8Гп В ЗГт-
Уравнение A.7.1) называется однородным при у = 0 и не-
неоднородным при у ф 0. Решение х однородного уравнения на-
зызается тривиальным или нетривиальным в зависимости от
того, будет ли х = 0 или х Ф 0.
Мы имеем теперь возможность сформулировать один частный
случай теоремы 1.6.1 в векторном виде. Этот случай очень ва-
важен, и, так как в дальнейшем предстоит его часто использовать,
мы выделяем этот результат отдельным следствием.
Следствие теоремы 1.6.1. Если матрица А В существует
и столбцами матрицы А являются ait a2 а„, а строками
матрицы В являются Ьь b\, . . ., Ъп, то
ЛВ=±аЛ.
1.8. АННУЛИРУЕМОЕ ПОДПРОСТРАНСТВО 25-
Прямое доказательство следствия намного проще доказа-
доказательства основной теоремы и читателю предоставляется воз-
возможность провести его.
1.8. Аннулируемое подпространство и область значений
Введем еще одно полезное обозначение. Принадлежность
к некоторому множеству будем обозначать при помощи сим-
символа е (который не следует смешивать с греческой буквой е).
Таким образом, если х представляет элемент множества А, то
мы пишем хб/1. Символ е можно обычно заменять словами
«из», «принадлежит» или «является элементом из»
Теорема 1.8.1. Если А<=ЗГтхп и 0 — нулевой вектор из
&~т, то множество всех решений уравнения Ах = 0 является
подпространством в Э~п.
Доказательство. Отметим сначала, что для существо-
существования произведения Ах должно быть x^fFn, т. е. множество
векторов, удовлетворяющих уравнению, должно быть подмно-
подмножеством в @~п- Мы должны показать, что множество всех реше-
решений уравнения Ах = 0 удовлетворяет условиям А1—А5 и Б1—Б5
из § 1.2. Если Ах\ = 0 и Ах2 = 0, то по свойству дистрибутив-
дистрибутивности умножения матриц
А (дс, + х2) = Ахх + Ax2 = 0 + 0 = 0,
так что А1 выполняется. Все другие условия непосредственно
следуют из определений операций над матрицами. 4
Определения, (а) Множество всех векторов х, для кото-
которых Ах = 0, есть аннулируемое подпространство матрицы А
и записывается как Jf(A).
(б) Если Ле^тхп, то х принадлежит области значений
матрицы А (записывается как Я{А)) тогда и только тогда,
когда х = Ау для некоторого у е Ф~п.
Отметим, что по теореме 1.8.1 Jf(A) — подпространство. Об-
Область значений матрицы А более наглядно описывается словом
образ пространства @~п при действии А.
Предположим, что матрица А из @~тхп имеет столбцы аи
а2, ..., ап (которые, очевидно, являются элементами из 5Fm).
Тогда из определения умножения матриц следует, что для лю-
любого v e STn вектор Av будет линейной комбинацией векторов
аи а2, ..., а„. На самом деле, следовательно, область значений
матрицы А просто совпадает с множеством всех линейных ком-
комбинаций столбцов из А. По этой причине область значений мат-
матрицы А часто в литературе обозначается словами «пространство
столбцов» для А.
*Упр. 1. Будет ли Я(А) подпространством?
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Упр. 2. Уравнение х-\-2у — Зг = 0 можно записать в виде
Ах = О, где
А = |
2 -
и х = \
Что такое Jf (А)? В данном случае, если рассмотреть включение
/(Л)?^з, имеется очень простая геометрическая интерпрета-
интерпретация. Каждое решение уравнения ортогонально вектору а с а' =
= ||12—3 ||. Множество векторов, удовлетворяющих уравне-
уравнению, совпадает поэтому с множеством всех связанных векторов
в 5?3, ортогональных к а; они образуют плоскость, проходящую
через начало координат. Область значений матрицы А совпа-
совпадает с множеством всех вещественных чисел.
Упр. 3. Найти Jf{A), если
Л =
1 -1 О
1 1 1
С геометрической точки зрения Jf (А) есть множество всех век-
векторов из 5?з, ортогональных одновременно к
Если какой-нибудь вектор ортогонален к обоим этим векторам,
то он ортогонален к любой их линейной комбинации, т. е. к плос-
плоскости (подпространству), которую они порождают. Таким обра-
образом, можно ожидать, что Jf (Л) — прямая линия в 5?3, проходя-
проходящая через начало координат.
С алгебраической точки зрения, если
из Ж {А), то
Таким образом, х = у, z = —2у и каждый вектор из Jf(A)
представляется в виде
у
у
или у
_
при некотором у.
1.9. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И РАЗМЕРНОСТЬ
27
1.9. Линейная зависимость и размерность
Пусть 2 — линейное пространство над полем 5F и хи х2, ...
.... хт—векторы из 3?. Если существуют числа щ, аг, ¦¦¦, <хг
из поля &~, не все равные нулю и такие, что
а,*, + а2дс2 + ... + агхг = О,
A.9.1)
то векторы Х\, ..., хг линейно зависимы. Если из уравнения
A9.1) следует, что а\ = аг = ... = аг = 0, то векторы ли-
линейно независимы.
Основание для этой терминологии состоит в том, что если
A.9.1) выполняется и, например, а,- отлично от нуля, то урав-
уравнение можно преобразовать к виду, где Xi выражен через ос-
остальные г ¦— 1 векторов, и зависимость xt от других векторов
получена. Заметим, что в этом случае можно сказать, что %i ле-
лежит в пространстве, порожденном другими г—1 векторами.
Если из уравнения A.9.1) следует, что все а равны нулю, то
такой зависимости не существует — отсюда термин независимы.
Упр. I. Векторы
х, =
из 5?4 удовлетворяют уравнению 3*i + 2х2 — #з = 0 и поэтому
линейно зависимы. Любые два из этих векторов линейно не-
независимы.
*Упр. 2. Если 9? — линейное пространство, х\, х2, ..., ^еЗ1
и линейно зависимы, то любое множество векторов из 3?, содер-
содержащее Х\, х2, ..., хг, линейно зависимо.
*Упр. 3. Если в упр. 2 х\, дс2, .... *г линейно независимы, то
векторы из любого подмножества в х\, ..., хт линейно неза-
независимы.
Упр. 4. Найти нетривиальные линейные соотношения вида
A.9.1), которые выполняются для
1
2
0
4
i X<i —
-1
0
5
1
. хг
1
6
10
14
(а)
3
-4
6
4
-9
11
(б)
(в)
1
0
2
4
II °
1
9
1 2
2
1
-5
2
8
-16
— 1
3
Определения. Конечное множество векторов х\, хо, ..., хт
является базисом для линейного пространства 9? в том и только
28 ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
в том случае, когда эти векторы линейно независимы и каж-
каждый х е 3? представляется в виде линейной комбинации от xt.
(Базис для 3? порождает 3?.)
Пусть 3? — линейное пространство. Если существует п ли-
лейно независимых векторов в 3?, в то время как любое мно-
множество п + 1 векторов из Я? является линейно зависимым, то 3?
имеет размерность п. Если такого п не существует, по 3? — бес-
бесконечномерное пространство.
*Упр. 5. Пусть е, — вектор из #"п, у которого на месте i
стоит 1 и на всех других местах 0. Векторы еи е2, ..., еп обра-
образуют базис в #"„. В самом деле, пусть х есть вектор
хп
¦из &п; тогда
х = Х\в\ + х2е2 + . .. + хпеп
и каждый х е д~п является линейной комбинацией от е{.
Для доказательства того, что векторы е( линейно незави-
независимы, предположим, что это не так. Тогда существуют такие аь
¦а,2, .-., ап, не все равные нулю, что ai^i + ... + апеп = 0. Но
из этого уравнения, очевидно, следует, что оы — 0, / = 1, 2, . ..
..., п (противоречие).
Лемма 1. Если A^g~mxn « tn < n, то существует нетри-
нетривиальное решение (с элементами из 8F) однородного уравнения
Ах = 0.
Доказательство. Оно проводится по индукции относи-
относительно т. (Отметим, что Ах = 0 можно интерпретировать как
т линейных однородных алгебраических уравнений для неиз-
неизвестных хи х2, ..., хп.) Р?ссмотрим сначала случай т = 1.
Тогда Ах = 0 сводится к единственному уравнению вида
au*i + «12*2+ ••• +ainxn = 0.
Если А = 0, то любое х будет решением и результат тривиален.
Если А Ф 0, то можно предположить (перенумеровывая пере-
переменные и коэффициенты, если необходимо), что ап Ф 0. Пере-
Переменным х2, хъ, ..., хп можно придать тогда произвольные нену-
ненулевые значения и положить
xi = — — (а12х2 + апхъ + ... +ainxn),
что и даст нетривиальное решение исходного уравнения.
1.9. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И РАЗМЕРНОСТЬ 29
Мы предположим теперь, что утверждение верно для т — 1
уравнений от более чем т—1 неизвестных, и покажем, что от-
отсюда следует, что утверждение верно для т уравнений от более
чем т неизвестных. Это завершит доказательство по индукции,
рассмотрим уравнение Ах = 0, где А — тХ «-матрица и т < п.
Пусть строки матрицы А будут а[, а[, ..., а'т. Опять можно
лредположить, что А Ф 0. Переставляя уравнения
а'х^ахххх +а12х2 + ... + ainxn =0,
a'jc = a2lxt + a22x2 + ... -f a2nxn = 0,
A.9.2)
ъ перенумеровывая неизвестные и коэффициенты, если необхо-
необходимо, можем считать ап Ф 0. Воспользуемся первым уравне-
уравнением для исключения Х\ из всех других уравнений. В результате
получим т — 1 уравнений от лг2, *з *п вида
axax Qu
Так как т — 1<д-—1 (числа неизвестных), предположение
индукции означает, что существует нетривиальное решение
Л'2, Хъ, ¦¦¦, Хп для этих уравнений. Первое из уравнений A.9.2)
может быть использовано теперь для нахождения такого хи
что Х\, х2, ..., хп дают нетривиальное решение первоначальных
т уравнений. Это завершает индукцию. •<
Отметим, что в лемме утверждается всего лишь существова-
существование решения, в то время как теорема 1.8.1 означает, что реше-
решение не может быть единственным.
Теорема 1.9.1. ^"п — линейное пространство размерно-
размерности п.
Доказательство. Обратимся к определению размерно-
размерности. Как мы видели, существует п линейно независимых векто-
векторов в &~п, а именно, е\, е2, ..., еп. Мы должны доказать, что
чюбые п ~\- 1 векторов х\, х2, ..., xn+i необходимо линейно
30
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
зависимы. Пусть Я = || *i ж2 ••• *n+i II- Обращаясь к определе-
определению линейно зависимых векторов, видим, что х\, х2, ..., хп+1
линейно независимы в том и только в том случае, когда сущест-
существует ненулевой вектор
а.
а =
ап+1
такой, что
л+1
i&i = Ха = 0.
Но X — п X («+ 1) -матрица и, согласно лемме, существует не-
ненулевой вектор а, удовлетворяющий последнему уравнению. ^
Из определения размерности теперь немедленно следует, что
любое множество г векторов из @~п при г > п линейно зависимо.
Приводимые ниже результаты выражают важные свойства
конечномерных линейных пространств. В частности, будет по-
получен результат о том, что все базисы для данного линейного
пространства должны содержать одно и то же число векторов
и что это число совпадает с размерностью пространства. Сле-
Следует отчетливо понять, что линейное пространство может иметь
разные множества базисных векторов. Например,
1
0
0
11 0
• Iх
о
будут базисами для одного и того же подпространства в 5?3.
Другой пример дает упр. 5 из § 1.4.
Лемма 2. Если линейное пространство 3? порождается мно-
множеством V элементов, г из которых аи а2, ..., аг линейно неза-
независимы и каждое множество г + 1 векторов из V линейно зави-
зависимо, то 3? порождается векторами аь an, ..., ат.
Доказательство. Мы докажем, что из as e V следует,
что as выражается в виде линейной комбинации от аь а2, ..., аг.
По предположению аь ..., аг, а., линейно зависимы, так что
существуют аь аг, ..., аГ, а8, не все равные нулю и такие, что
arar
= 0.
При as = 0 получаем противоречие с независимостью элементов
пи •••> аг- Следовательно, авф0, а поэтому любой элемент аа
из V будет линейной комбинацией от аь ..., ar. Но каждый
1.9. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И РАЗМЕРНОСТЬ
31
элемент из S? является линейной комбинацией элементов из V
и, так как каждый элемент из V выражается в виде линейной
комбинации от аь ..., аг, то каждый элемент из % будет ли-
линейной комбинацией от а.\ аг. -^
Теорема 1.9.2. Для линейного пространства 2 размерно-
размерности d каждое множество порождающих 2 элементов содержит
d и только d линейно независимых векторов.
Доказательство. Пусть V — множество порождающих
S? элементов и а.\, а2, ..., аг — максимальная система линейно
независимых векторов из V, т. е. каждое множество г+1 век-
векторов из V линейно зависимо. Из определения размерности по-
получаем, что г ^ d. Покажем теперь, что предположение г < d
ведет к противоречию.
Из определения размерности следует существование множе-
множества Х\, х2, ..., xd независимых векторов в 2. Но по лемме 2
& порождается аи ..., аг, а поэтому существуют константы
b-h, 1 ^ / ^ г, 1 ^ k ^ d, такие, что xk = 2 bika-r Таким обра-
образом, для любого множества констант С\, с2, ..., Cd имеем
d r
ckxk = Y, Z ckbjka, =
fti /i
bjkck.
A.9.3)
Для гХ^-матрицы в с элементами bjh по лемме 1 получаем
существование такого вектора с Ф 0, что Вс = 0. Поэтому при
таком выборе с имеем 2^/лА = 0 Длч всех / в правой части
k
d
равенства A.9.3) и, следовательно,
X
= 0. Это противоре-
противоречит тому, что Х{ линейно независимы, откуда следует, что г не
меньше d. Следовательно, г = d. Л
Следствия, (а) Каждый базис в 9? содержит d и только
d элементов.
(б) Любые d независимых векторов в S образуют базис
для 2?.
Упр. 6. Получить теорему 1.9.1 из теоремы i.9.2.
Упр. 7. Показать, что векторы
1
0
2
-1
0
]
2
0
линейно независимы и порождают в 5?4 подпространство 2? раз-
размерности 2. Это пространство имеет *ь дс2 в качестве базиса.
!
— 1
4
-1
- У2 =
-1
-2
2
1
32 ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Показать, что векторы
У\ =
тоже принадлежат 3? и образуют базис в 3?.
*Упр. 8. Пусть заданы два подпространства 3?\ и 3?2 в S
со свойством: любые ненулевые х^3?\ и у^3?2 линейно неза-
независимы. Показать, что если Х\, ..., xr e 3?\ и линейно незави-
независимы и у\, . ., ys^312 и линейно независимы, то Х\, ..., хг,
tj\, ..., ^линейно независимы.
1.10. Свойства базисных векторов
Теорема 1.10.1. Если векторы хи х2, ..., хт образуют ба-
базис линейного пространства З', то каждый вектор из 3/ может
быть однозначно выражен в виде линейной комбинации от
Х\, Х2, . . . , Хт.
Доказательство. Предположим, что теорема неверна и
для х е 3? существуют числа a,, bt, i == 1, 2, ..., т, с at ф bt
для некоторого i такие, что
Тогда
Z (a*-*?)*( =
и по крайней мере один коэффициент а, — Ьг ненулевой. Это
означает, что базисные векторы зависимы (противоречие). Сле-
Следовательно, пг = Ьг, i: = 1, 2, ..., т, и теорема доказана. ^
Теорема 1.10.2. Пусть 3? — линейное пространство размер-
размерности m и Х\, х2, ..., xr, r <Lm, — линейно независимые векторы
в 3'. Тогда существуют векторы хг+\, ..., хт в 3? такие, что
Х\, Х2, .... х,п образуют базис для &.
Доказательство. Векторы хи х2, ..., хт порождают соб-
собственное подпространство ?ГГ в 3', потому что существует такой
xr+i e 3/, который не принадлежит 9~т, а поэтому не выра-
выражается как линейная комбинация от хи х2, ..., хг. Рассмотрим
теперь уравнение
а1х1+а2х2+ ... +
1.10. СВОЙСТВА БАЗИСНЫХ ВЕКТОРОВ 33
Здесь <Xr+i = 0, ибо если это не так, то хт+\ линейно выразился
бы через х\, х2, ..., хг. Независимость Х\, ..., хг означает тогда,
что оц = аг = ... = <хг = 0. Следовательно, Х\, х2, ..., хг+1 ли-
линейно независимы и порождают, например, 9~т+\.
Если г+ 1 = т, то доказательство окончено. Если r + 1 < m,
то повторяем рассуждение для получения хг+2, для которого
*i. Х2, ¦¦¦, хг+2 линейно независимы, и так далее для т — г ша-
шагов, пока не получим 2Гт = S. Л
Упр. 1. Показать, что каждое из следующих подмножеств
является линейным пространством над 2F:
(а) множество векторов в SFn (n ^ 2), первые два элемента
которых нулевые;
(б) множество векторов в 2Fп (п^2), первые два элемента
которых равны;
(в) множество векторов в #"„, сумма элементов которых
равна нулю.
Упр. 2. Найти размерность и базис для каждого из про-
пространств (а), (б) и (в) в упр. 1.
Мы видели, что любое множество г линейно независимых
векторов в подпространстве 9? S STn размерности г образует
базис. Исследуем два таких базиса хи х2, ..., хг и у\, у2, ...
..., уг. Так как хи х2, ... ,жг образуют базис, каждый из
У\> Уг, •••, Уг является их линейной комбинацией. Таким обра-
образом, существуют числа ац A ^ i, j ^ r) такие, что для
1 < i^ r
yi=auxi + а2гя:2+ ... +arlxr.
Если определить п X г-матрицы X = \\х\ х2 ... хг\] и У = H^i у2 ...
... уг\\ и г X r-матрицу А с элементами ац, то будем иметь
Y = X А . A.10.1)
пХг (п X г) (г X г)
Это можно выразить словами, сказав, что базисные векторы
Xi преобразуются в t/; посредством умножения X на матрицу А
справа и для любых двух множеств базисных векторов суще-
существует такая матрица А. В частности, существует гХг-матрица
В такая, что X = YB. Отметим, что если S = &~п, то X, Y, А и
В все размера п X «•
Мы имеем также
Y = Y(BA), A.10.2)
что приводит нас к вопросу о том, не будут ли преобразующие
матрицы А, В таковы, что В А = / (§ 1.5). Мы должны отло-
отложить ответ на этот вопрос на конец главы.
2 П. Ланкастер
34 ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
1.11. Определение функции определителя
Предполагается, что читатель знаком с основными идеями
теории определителей. Поэтому без попыток дать какие-либо
обоснования мы начинаем с формального определения и затем
приводим наброски доказательств некоторых основных свойств.
Для введения общего определения следует сначала исследовать
некоторые свойства перестановок.
Пусть /i/2 ... ]п — числа 1,2, ..., п, записанные в любом
порядке. Мы называем \\]г ... /„ перестановкой чисел 1,2, ...
..., п. Обозначим такую перестановку через р и отметим, что
существует в точности п\ различных перестановок.
Далее, для всех вещественных значений х определим функ-
функцию signx (читается «сигнум х») так:
{1 для х > О,
О для х = 0,
— 1 для х < 0.
Операция перестановки двух чисел в р приводит к новой пере-
перестановке, называемой транспозицией. Предположим теперь, что
р может быть приведена к естественному (возрастающему) по-
порядку чисел с помощью t(p) транспозиций*). Мы утверждаем,
что если
Q(p)= П (/*-//)
ТО
signQ(p) = (-l)'(p). ' A.11.1)
Для доказательства этого заметим, что произведение Q(p)
может быть записано в виде
(к - h) (h - U) ¦ ¦ ¦ (L - h) Оз — к) • • • (к - 1г) • • • (in — /1,-1).
Ясно, что когда р соответствует естественному порядку чисел,,
скажем р = р', тогда sign Q (pf) = 1.
Предположим, что р преобразуется в pi с помощью одной
транспозиции. Мы утверждаем, что
A.11.2)
Если последнее равенство получено, то ясно, что
а так как signQ(p')=l, то отсюда будет следовать A.11.1).
Остается поэтому доказать лишь A.11.2).
*) Мы предполагаем существование t(p).
1.11. ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОПРЕДЕЛИТЕЛЯ 35
Предположим, что для получения pi из р мы переставляем
/л и /л- Обозначим через Fx произведение тех множителей в
Q(p), которые не содержат ни /л, ни /а. Имеется еще множитель
±(/л — /а). а также множители, содержащие //, и /А не вместе.
Пусть ±/^2, ±/*з обозначают произведения множителей, содер-
содержащих лишь jh и лишь Д соответственно, где
^2= П (//-/а), ^3= П (//-/*)•
t?-h,k 1ФПЛ
Тогда
Результат перестановки чисел /л и /& теперь ясен. Множитель
F\ в Q (/?) остается неизменным, /V^ переходит в F3F2 и /Л — /л
заменяется на jk— /л- Результат A.11.2) отсюда следует
сразу же.
Ясно, что может быть много различных комбинаций транспо-
транспозиций, которые преобразуют р к естественному порядку чисел.
Однако верен следующий важный результат относительно t(p).
Лемма. Четность числа транспозиций, требуемых для пре-
преобразования фиксированной перестановки к естественному по-
порядку, инвариантна относительно выбора транспозиций, т. е.
для фиксированной р число t(p) либо всегда нечетное, либо
всегда четное.
Доказательство. Предположим, что одновременно s и t
транспозиций могут быть использованы для преобразования р
к естественному порядку. Тогда из A.11.1) следует, что (—1)' =
= (—IK, откуда получаем утверждение. Л
Получив эту лемму, введем теперь понятие определителя
матрицы А е^пХя. Мы рассматриваем произведение элементов
из А вида
«i/,^/, - - - ап!п,
где /i J2 ... in — перестановка р чисел 1, 2, ..., п. Таким об-
образом, каждое такое произведение содержит один и только один
элемент из каждой строки А и один из каждого столбца А, Да-
Далее, существуют п\ таких произведений. Мы вводим теперь
функцию определителя матрицы А, в записи det Л, посредством
det А = Е (-1)'(р) ача21- ... ап1. A.11.3)
p • 2
где р пробегает все п\ перестановок чисел 1, 2, ..., п.
Отметим прежде всего, что лемма была нужна для того, что-
чтобы показать, что (—1)((р) однозначно определено для каждого
2*
36 ГЛ. I. ЛИНЕЙНАЯ АЛГЕБРА
члена этой суммы и затем чш det Л—функция, определенная
на Jnxn со значениями в @~.
*Упр. 1. Доказать, что для п = 2
det А = апа22 — ai2a2i,
а для /г = 3
*Упр. 2. Если А = diag {au а2, • • • i «Л. то det А = а,а2 ... а„.
1.12. Свойства определителей
Использованное выше для введения функции определителя
суммирование означает, что в каждом члене суммы имеется
один и только один элемент из каждого столбца. Таким обра-
образом, если аь а2, ..., ап — столбцы матрицы А и, например,
а, = abi -f- |3&2, то
det||a&, + |3&2 а2 ... ап\\ = a det || 6, а2 ... ап\\ + pdet|| Ь2 а2 ... ап\\
и подобно этому для любого другого столбца матрицы Л, т. е.
можно сказать, что det Л — аддитивная и однородная функ-
функция*) от /-го столбца матрицы Л (у = 1, 2, ..., п). Подобное
же утверждение справедливо для строк матрицы А.
Так как каждый член в A.11.3) содержит элемент из i-й
строки, то, собирая вместе члены, содержащие а^- для у = 1,2,...
..., п, получим выражение вида
detA = anAil + ai2Ai2+ ... +ainAin, A.12.1)
где коэффициенты Ац при ац называются алгебраическими до-
дополнениями для ац. Этот вид для det Л известен как разложе-
разложение определителя по его t'-й строке. Очевидно, что существует
подобное выражение для разложения det Л по его i-му столбцу.
Мы сформулируем теперь и докажем пять наиболее важных
свойств определителей. Напомним, что Л' обозначает транспо-
транспонированную матрицу к матрице Л (§ 1.5).
Свойство 1. det A' = det А.
Чтобы найти выражение для det Л', мы просто обращаем
порядок индексов в выражении A.11.3) для det Л. Таким об-
образом,
*) Функция f аддитивна в том и только в том случае, когда f(а + Ь) =
= f(a)-\-f(b) для всех а, Ъ и а + b из области определения /, и / одно-
однородна над 9Г, если /(ах) = а{(х) для всех a e 9~.
1.12. СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 37
Множители в a^ia/,,2 ... а1г[П можно, очевидно, так переставить,
что получится член а^аг^ ... ankfi из det А, за исключением, мо-
может быть, знака. Знак, который должен быть приписан этому
члену в det Л, есть (—1)"р'\ где р'— перестановка k\k2 ... kn
чисел 1,2, ..., п. Но р' получается из 1,2, ..., п применением
i(p) транспозиций, используемых для приведения р к естествен-
естественному порядку. Следовательно, простым обращением этой после-
последовательности транспозиций р' приводится к естественному по-
порядку. Поэтому t(p') = t(p) и (—1)(Ыа/,,а;2-2 ... а1пП будет чле-
членом det Л. Таким образом, каждый член det Л' является членом
det Л и наоборот. Следовательно, det A' = det Л.
Свойство 2. Если матрица В получается из п X п-матрицы
Л перестановкой двух строк {или столбцов), то det В = —det Л.
Для упрощения обозначений мы докажем этот результат для
случая, когда В получается из А перестановкой первых двух
строк. По существу нет ничего нового в рассмотрении случая
перестановки любых двух строк. Мы имеем
b\il=a2!l, Ь21-2 = ац2, br!r=arir, г = Ъ, 4 п,
а поэтому разложение для det В таково:
det В = ? (-1)' <"> аи2а211ащ ... ап/п.
р
р
Пусть q — перестановка /2/1/3 ••• in- Тогда можем написать
t{q)+\=t(p) и
anin
Но суммирование по всем перестановкам q дает те же самые
л! членов, что и суммирование по всем перестановкам р. Таким
образом,
det В = (— 1) ? (-1/ ш aii2a2il ... ania = (-1) det Л.
q
Доказав свойство 2 для строк, результат о столбцах полу-
получаем сразу же применением свойства 1.
Свойство 3. Если п X п-матрица А имеет одинаковые две
строки (или столбца), то det Л = 0.
Если переставить две одинаковые строки (или столбца) мат-
матрицы Л, то по свойству 2 получим, что det Л = —det Л, откуда
следует результат*).
*) Приведенное доказательство проходит лишь в предположении, что
-Характеристика поля Ф~ не равна 2. — Прим. черев.
38 ГЛ. I. ЛИНЕЙНАЯ АЛГЕБРА
Свойство 4. Если s ф г, то
и A.12.2)'
aiHir + a2sA2r + ... + ansAnr = 0.
Рассмотрим матрицу В, полученную из А заменой строки г
на строку s, г Ф s. Тогда В будет иметь одинаковые г-ю и s-io
строки; разлагая det В по r-й строке, получим первое из нужных
равенств. Подобное рассуждение для столбцов приводит ко вто-
второму равенству.
Если Ле^„хп, то минор порядка п — 1 матрицы А — это-
определитель матрицы, получаемой из А выбрасыванием одной
строки и одного столбца. Минор, получаемый выбрасыванием
строки i и столбца /, обозначается через Мц, 1 ^ i, j ^ п. Сле-
Следующий результат показывает, что существует тесная и, с пер-
первого взгляда, замечательная связь между алгебраическими до-
дополнениями и минорами.
Свойство 5. Ац = (—1) {+Шц.
Мы разобьем доказательство на две части:
1. Сначала рассмотрим случай i = j= 1. Пользуясь опреде-
определением det Л, можем написать
EM) ... ап,п + ? (-l)t{p)aUla2,2 ... ап,п,
Р
где q — обозначение перестановки /г /з ... }п чисел 2, 3, ..., д.
Опять используя A.11.3), убеждаемся в том, что
а поэтому утверждение в этом случае верно.
2. Для общих i, j перемещаем сначала элемент ац в положе-
положение A, 1) посредством i—1 последовательных перестановок
соседних строк, за которыми следуют / — 1 перестановок сосед-
соседних столбцов. Обозначим полученную после этого матрицу через
В. Соответствующий элементу a,j минор тот же самый как в Ау
так и в В, потому что относительные расположения строк и
столбцов в Мц не меняются. Следовательно, как в части 1,
det В = aijMij -f- (члены, не содержащие
Но по свойству 2 det В = (— 1 )*'-'(—l)'-i det Л = (—1)*+J det Л,
Следовательно, deM=(—1){+Ш^Мц + (члены, не содержащие
ац). Результат следует теперь из сравнения этого равенства с
A.12.1).
1.13. ПРИСОЕДИНЕННАЯ И ОБРАТНАЯ МАТРИЦЫ
39
Упр. 1. Вычислить определители следующих матриц:
3
2
2II
5||'
II 2
0
II 1
1
3
2
2
i
1
3
0
4
-2
1
2
1
1
-1
0
0
3
2
0
2
4
*Упр. 2. Квадратная матрица, в которой все элементы выше
(ниже) главной диагонали нулевые, называется нижней (верх-
(верхней) треугольной матрицей. Доказать, что если А треугольная,
то det Л будет равен произведению элементов главной диагонали
матрицы А.
*Упр. 3. Для Л е &"пхп иАе^" доказать, что
det (Ы) = Г det Л.
*Упр. 4. Если Л е 'iPnxn и А — матрица, элементы которой —
сопряженные комплексные числа к элементам матрицы Л, то
доказать, что
det A~= det Л.
Упр. 5. Матрица Вандермонда порядка п задается как
xl xi ... *,
-2 „п-1
к2 хп~1
хп ... хп
Доказать, что det V — П (хг —
/
1.13. Присоединенная и обратная матрицы
Предположим, что А^.^~пхп и, как выше, Л^ A ^ г,
j^n)—алгебраические дополнения ai}. Мы определяем при-
присоединенную матрицу к Л, в записи Л v, как транспонированную
к матрице алгебраических дополнений для А. Таким образом.
Л. Ап
40
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Рассмотрим матричное произведение AAV. Элемент на
п
месте /, / этого произведения есть J] cLikAlk, что по равенству
A.12.1) и свойству 4 сводится к бг/ det Л. Этим способом мы
получаем важный результат:
det Л О
О det Л
det Л
= (det A) I.
Определения, (i) матрица
б
,х„ называется особой
р ( р
или неособой в зависимости от того, будет ли det Л нулем или
нет.
(ii) Если А неособая, то определяем обратную матрицу к А„
в записи А-1, как
det Л
Из написанных выше уравнений сразу же следует
Значение обратной матрицы лучше всего, пожалуй, иллю-
иллюстрируется, если обратиться к уравнению A.7.1) в случае, когда
А неособая. Напомним, что (когда А размера п X п.) A.7.1) —
сокращенная запись для множества п алгебраических уравнений-
от п компонент вектора х. Если А известна, то, умножая обе
части уравнения на А~1 слева, видим, что решение может быть
сразу же записано в виде х = А~1у.
Упр. 1. Если А неособая и АВ = I, то доказать, что В = А~1*
Упр. 2. Доказать, что /-1 = /.
Упр. 3. Показать, что
||
2 4
10-2 Z
и найти обратные (если они существуют) к матрицам из упр. I
§ 1.12.
Упр. 4. Показать, что уравнение Р~х = Р имеет решением
О ... 1
Р =
0 1
1 0 ... О
I.H. ФОРМУЛА БИНЕ-КОШИ 41
*Упр. 5. Для нижней треугольной пу^п-матрицы А предпо-
предположим что ацфО, i=l, 2, ..., п. Показать, что А~х суще-
существует, будет тоже нижней треугольной и имеет диагональные
элементы 1/пц, i = 1, 2, ..., п.
Упр. 6. Доказать, что если А~х существует, то (А~1)'=
= {А')-К
Упр. 7. Если А неособая, В ф 0 и Ло существует, то дока-
доказать, что АВ ФО,
1.14. Формула Бине—Коши
Мы уже определили миноры порядка п—1 для п X «-опре-
«-определителя. В более общем случае, если из т X n-матрицы А вы-
выбросить все строки, кроме строк ii, t2, ..., ip, и все столбцы,
кроме столбцов ku k2, ..., kp, то определитель полученной в ре-
результате матрицы называется минором матрицы А порядка р,
и мы пишем
Миноры, для которых i\ = k\, i2 — k2, ..., iP = kp, называются
главными для матрицы А. Если А — /г X л~матрица, то в этих
обозначениях имеем
deM = /1(l 2 ... „)•
и алгебраическое дополнение А\п, например, есть
л,„ —(-1) л^ 2 _ „_,;•
Отметим, что индексы i и й не обязательно расположены в
возрастающем порядке. В действительности мы допускаем, что-
чтобы они принимали повторяющиеся значения — с очевидной ин-
интерпретацией, что получающиеся в результате миноры равны
нулю (§ 1.12, свойство 3).
Если квадратная матрица является произведением некоторых
матриц (которые могут быть прямоугольными), то часто бывает
важно иметь возможность выразить определитель произведения
в терминах свойств множителей. Следующая теорема — мощный
результат этого рода.
Теорема 1.14.1 (формула Бине — Коши). Пусть А, В —
*и X я- и п X m-матрицы соответственно, m s?l п и С = АВ.
42
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Тогда
detC =
К*. < А, < ... <
2 ..
т
km
k2
2
km
m
(l.H.l)
Другими словами, при т ^ п определитель матрицы С,является
суммой произведений всех возможных миноров порядка m в А
на соответствующие миноры матрицы В того же самого порядка.
Упр. 1. Проиллюстрируем сначала обозначения примером.
Пусть
Тогда
1 0 21!
-1 1 l||'
/-> __
-2
1
I1 Ч
О 2
и detC = 2. По написанной выше формуле имеем
1 J °
+ det
det
0 2
1 1
1 2
-1 1
det
-1 -1
1 1
det
—2 0
1 1
= 1 • (-2) + 3 • 0 + (-2) • (-2) = 2.
Доказательство теоремы. Так как Cij—2-и aikbki>
можно написать
/-»
Om=1
ft
Мы отмечали, что определитель — аддитивная и однородная
функция каждого из своих столбцов. Используя этот факт для
каждого из m столбцов в det С, выражаем det С в виде
1.14. ФОРМУЛА ВИНЕ — КОШИ
•суммы пт определителей:
<JetC=? ... ? ^t
... а.
• •• ат„ Ь,
mambamm
' ' ' L-i \а,\ а2 ... ат ) а1
43
A.14.2)
Те члены в суммировании, которые имеют совпадающими два
или более индексов ai, аг, • • •, ат, равны нулю, так как в этих
случаях миноры будут иметь по крайней мере два совпадающих
столбца. Таким образом, нужно рассматривать лишь те
n\i(n — m)! членов суммирования, в которых индексы а раз-
различны. Мы распределяем эти остающиеся члены на Г J групп
по т\ членов в каждой таким образом, что в каждой группе
члены отличаются лишь порядком индексов аь аг, .... ат. От-
Отметим также, что можно написать
2
a,
ат
km
где k] < k2 < ... < km и, в обозначении § 1.11, p — перестанов-
перестановка ai аг ... am чисел k\, kiy .... km. Следовательно, сумма по
m! членам, в которых ai аг ... ат — перестановка чисел
ku k2, ..., km, задается выражением
Переставляя элементы Ь так, чтобы первые индексы шли в воз-
возрастающем порядке, приводим это выражение к виду
1 2 ... т
ki k2 ... k,
Ч
где q — перестановка /i/2 ... jm чисел 1,2, ..., m и, как оче-
очевидно, t(q)—t(p). Из определения функции определителя те-
лерь следует, что это выражение есть просто
2 ... т \ R( k, k2 ... km'
k2 ... km)D\\ 2 ... m
Поэтому равенство A.14.2) сводится к A.14.1). А
Следствие. Определитель произведения двух квадратных
матриц равен произведению определителей множителей.
41.
44
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Это следует из теоремы при т = п.
Упр. 2. Снова может быть получено неравенство Шварца.
Пусть
а, а2 ... ап\
б, Ь2 ... Ьп\
и В =
сп dn
тогда из теоремы следует тождество Коши
n>2;
det "
а'с a'd
be b'd
= det
¦ апсп a,d, + ... + andn
¦ bncn bid, + ... + bndn
1 < I < k < л
Полагая а = с, b = d, получаем
2 J_ 4- n't . i I 4. л ft II
a, a.
; ^
det
... +b2n
\ \i Ь L
Если at и й,- — вещественные числа, то правая часть в этом
тождестве неотрицательна, а поэтому
К+ ••• +ОF?+ ••• +К)>(*А+ ••• +«ЛJ.
или
(a'a) (b'c) > (a'6J.
Упр. 3. Пусть a, 6 —векторы в ^„. Использовать рассужде-
рассуждение в упр. 2 для доказательства теоремы 1.3.1 для 'ё'п.
*Упр. 4. Для неособой матрицы А показать, что
*Упр. 5. Для неособых п X я-матриц А, В доказать, что.
(АВ)-1 существует и (АВ)~1 = В~1А-1.
1.15. Ранг матрицы
Пусть А — m X я-матрица. Обозначим столбцы матрицы А
через Л,,, Л„2, ..., Л*п и ее строки через Аи, А2„ Amts.
Тогда
1.15. РАНГ МАТРИЦЫ
45
Мы определяем ранг по строкам для матрицы А как наиболь-
наибольшее число линейно независимых (порядка п) векторов среди
Л,i, / = 1, 2, ..., m, и ранг по столбцам для А как наибольшее
число линейно независимых (порядка т) векторов среди А^,
/=1,2 /г.
Теорема 1.15.1. Для любой матрицы ранг по строкам и
ранг по столбцам совпадают.
Доказательство. Пусть г и с—ранг по строкам и ранг
по столбцам соответственно для матрицы А^&тХп- Мы
утверждаем, что матрица Л*, полученная из А перестановкой
строк, будет иметь те же самые значения г и с, что и А. Для г
это очевидно. Что касается столбцов, заметим, что столбцы мат-
п
рицы А удовлетворяют линейному соотношению J] аг-Л«,- = О
i=i
в том и только в том случае, когда все р е элементы каждого
из этих векторов удовлетворяют тому же самому линейному
соотношению, 1 ^ р ^ т. Изменение порядка строк в матрице
А не меняет этих соотношений между элементами, а поэтому
столбцы в А* удовлетворяют в точности тем же соотношениям,
что и столбцы в А. Следовательно, с тоже не меняется при пере-
перестановке строк.
Мы можем предположить теперь, что после перестановки
строк, если необходимо, матрица А имеет первые г строк ли-
линейно независимые, а последние т — г ее строк являются ли-
линейными комбинациями первых г строк. Таким образом, если
определить разбиение А:
А,
А
Г+ 1*
то существует такая (т — г) X /"-матрица Т, что С = ТВ. Мы
утверждаем, что матрицы Л и В имеют одинаковые ранги по
столбцам. Ибо если Ах = 0, то, очевидно, Вх = 0, а так как
I B
ТВ I
И Ах =
Вх
ТВх
то из Вх = 0 следует, что Ах = 0. Таким образом, столбцы мат-
матриц А и В удовлетворяют в точности одним и тем же линейным
соотношениям, а следовательно, ранги по столбцам для Л и В
оба равны с.
Но столбцы матрицы В — векторы из @~г, а поэтому с ^ г.
Применяя точно ту же цепочку рассуждений к матрице А',
46 ГЛ. !. ЛИНЕЙНАЯ АЛГЕБРА
находим, что (ранг по столбцам для А') ^ (ранг по строкам
для А'). Но строки матрицы А являются столбцами матрицы
А' и наоборот. Поэтому г ^ с, откуда следует, что г = с. 4
Мы можем дать теперь формальное определение: ранг неко-
некоторой матрицы есть наибольшее число ее линейно независимых
строк (или столбцов). Имеется, однако, третий подход к поня-
понятию ранга, а именно: ранг по минорам определяется как поря-
порядок наибольшего отличного от нуля минора матрицы А. 'Нашей
ближайшей целью будет доказательство замечательного резуль-
результата о том, что ранг по минорам совпадает с рангом.
Лемма 1. Если А — матрица ранга р по минорам и
¦—не равный нулю минор в А, то любой столбец в А будет ли-
линейной комбинацией от Л*й,, Л*йо, .. ., A»k .
Доказательство. Для удобства записи (чтобы избежать
двойных индексов) мы предположим, что гь /2, •••> «Р и k{, k2, ...
. . ., fep совпадают с 1, 2, . . . , р. Читатель может проверить, что
приводимое доказательство применимо к произвольным множе-
множествам различных i и различных k. Если А — m X «-матрица, то
.n). Рассмотрим
аи ... а1р als
1 2 ... р k , , ,
12...i j=det
-<рр "ps
Если k ^ p или s ^ p, то минор равен нулю, так как в нем
имеется повторяющаяся строка или столбец. Если k > p и
s> p, то минор равен нулю, так как ранг по минорам есть р.
Таким образом, минор обращается в нуль для всех возможных
выборов индексов ins.
Пусть с\, с2, ..., ср, cs — алгебраические дополнения элемен-
элементов в последней строке написанного выше определителя; разла-
разлагая этот определитель по последней строке, получим
akici+ak2c2+ ...
для 1 ^ k ^ m. Заметим теперь, что коэффициенты с не зави-
зависимы от выбора k. Это означает, что
, = 0.
Но
1.15. РАНГ МАТРИЦЫ 47
а поэтому Л*8— линейная комбинация столбцов Л,ь ..., Л»р.
Это верно для 1 ^ s ^ п, следовательно, лемма доказана.
Л е м м а 2. В обозначениях леммы 1 векторы Atki, A^2, .. -
..., A*k линейно независимы.
Доказательство. Мы опять считаем, что i\ = 1,..., ip =
= р; ki = 1, ..., kp = р. Предположим, что утверждение леммы
неверно. Тогда существуют такие не все равные нулю числа
«1, . . . , <Хр, ЧТО
/4*icti + А^а2 + . . . + Л*Рсср = 0.
Пусть В— верхняя левая матрица при р X р-разбиении матрицы
А (т. е. матрица Л( j ^ "' Р))- Тогда будем иметь
?а = 0 с det?=^O, AЛ5.1)
где а' = ||ccicc2 ... аР II Ф 0'. Но матрица В~1 существует, а по-
поэтому, умножая обе части уравнения Ва ¦= 0 на В-1, получим
а = 0, что противоречит предположению. Следовательно, лемма.
доказана.
Теорема 1.15.2. Для любой матрицы ранг по минорам сов-
совпадает с рангом.
Доказательство. Из леммы 1 получаем, что если р —
ранг по минорам, то р столбцов матрицы Л порождают про-
пространство, в котором лежат остальные п — р столбцов. Следова-
Следовательно, число линейно независимых столбцов не может превы-
превышать р. Но по лемме 2 имеем, что число линейно независимых
вектор-столбцов в точности равно р, которое равно поэтому
рангу по столбцам. Последнее же число совпадает с рангом. ^
Введем теперь сокращение г (А) для обозначения ранга мат-
матрицы А.
Теорема 1.15.3. Если А — пх п-матрица, то с!е1Л = 0 в
том и только в том случае, когда г(А)<С п.
Доказательство. Утверждение немедленно следует из
теоремы 1.15.2 и определения ранга по минорам.
Следствие 1. пХп-матрица А неособая в том и только в
том случае, когда г (А) = п.
Следствие 2 (обобщение теоремы 1.14.1). Пусть А, В-—
m х п- и л X m-матрицы соответственно и С = АВ. Тогда
z
<ft,<
0
л
...ftm<n
/1
2 .
*2 .
.. от
.. km
\ /
1 D 1
) \
при
Л, *2 ...
1 2 ...
m
km
m
>ny
)
при
48 ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Доказательство. Каждый столбец из АВ является ли-
линейной комбинацией столбцов матрицы А. Следовательно,
г(С)^г(А). Так как А имеет лишь п столбцов, очевидно, что
r{A) ^ п, а поэтому при т >п имеем г(С) ^.п<.т. Но С раз-
размера т X т, следовательно, из теоремы следует, что det С = 0.
При т ^ п результат совпадает с теоремой 1.14.1. Л
*Упр. 1. Показать, что размерность пространства 3?(А) равна
г (А).
*Упр. 2. Если произведение матриц АВ определено, то дока-
доказать, что
min {r (A), r (В)}.
*Упр. 3. Пусть А — неособая матрица и В, С таковы, что
АВ, СА определены. Доказать, что г(АВ) = г(В) и г(СА) =
= г (С).
*Упр. 4. Если сумма матриц А + В определена, то доказать,
что
1.16. Решение уравнений
Мы рассмотрим теперь некоторые важные результаты отно-
относительно решений множеств линейных алгебраических уравне-
уравнений, описанных в § 1.7.
Теорема 1.16.1. Если A<=tFnxn, то уравнение Ах = 0
имеет нетривиальное решение в том и только в том случае,
когда А — особая.
Доказательство предоставляется читателю.
Теорема 1.16.2. Если А е @~тхп,то А имеет ранг г в том
и только в том случае, когда Jf{A) имеет размерность п — г.
Доказательство. 1) Если А имеет ранг г, то можно
предположить для простоты, что А имеет разбиение вида
ц А22
где Ац размера г X г и detAn^O (теорема 1.15.2). Этого
всегда можно достигнуть с помощью перестановки компонент
вектора х и столбцов матрицы А и затем строк в А.
Для / = 1, 2, ..., п — г пусть ej е^"„_г — вектор, имеющий
1 на /-м месте и нули на всех других местах (упр. 5 из § 1.9),
Определим векторы
!/==
-Л
е
1.16. РЕШЕНИЕ УРАВНЕНИЙ
49
и пусть Ж— подпространство в &~п, порожденное этими векто-
векторами. Так как \h очевидно, линейно независимы, Ж имеет раз-
размерность п — г. Мы докажем теорему, показав, что Ж(А) = Ж.
2) Имеем
а так как последние п — г строк матрицы А получаются в виде
линейных комбинаций первых г строк, отсюда следует, что
A\j — 0. Таким образом, \j e Ж (А) для каждого / и, так как Ж
порождается этими векторами, Ж^ЛГ(А).
3) Обратно, если хе/(Л) и мы запишем х' — \х[, х',\, где
х <^3ГГ, х,^&~п_г, то существуют такие числа сь с2 сп-г,
п—г
что х2= Yj Cje/. Но равенство Ах — 0 означает, что х{ ¦=
п-г
— — A~llA]-zX2, откуда следует, что *=? cfei- Следовательно,
l-i
4) Результаты пунктов 2) и 3) означают, что Jf{A)= Ж,
а так как Ж имеет размерность п — г, теорема доказана. ^
Теорема 1.16.3. Если А ^.ЗГтхп, то уравнение Ах ~—с
имеет решение в том и только в том случае, когда m Х(я+ 1)-
пополненная матрица В = \\А,с\\ имеет ранг, равный г (А).
Доказательство. Если х — решение уравнения Ах = с,
п
то Та AtiXi=c и с — линейная комбинация столбцов матрицы
А. Следовательно, г(В)=г(А). Обратно, если г(В) = г{А), то
с будет линейной комбинацией столбцов матрицы А и коэффи-
коэффициенты этой комбинации дадут решение х нужного уравнения.
Теорема доказана. ^
*Упр. 1. Для /1е^„п доказать, что сумма размерностей
пространств JC(А) и 91{А) равна п.
Упр. 2. Уравнение
1
2
1
2
-3
4
0
7
—2
Х\
х2
Хз
I "
не имеет решения. Заметим сначала, что г(Л) = 2, так как
Л*3 = 2Л*1—Л*2, и затем, что r(fi) = 3. Отметим, что с не мо-
может быть линейной комбинацией векторов Atl и Л^. так как
ортогонален к ним обоим.
50
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Упр. 3. Существуют решения уравнения
1
2
1
2
—3
4
0
7
—2
Х\
х2
Хъ
—
-М-
В этом случае с = А*\ +/4*3, следовательно, г (В) = г (А).
Следующая теорема позволяет описать множество всех ре-
решений уравнения Ах = с в терминах некоторого частного' реше-
решения в комбинации с элементами из Jf(A).
Теорема 1.16.4. Пусть s — некоторое частное решение урав-
уравнения Ах = с. Тогда (i) если t^JP(A), то s + t — решение
уравнения Ах = с и (и) для каждого решения х уравнения
Ах = с существует такой вектор <е/(Л), что х = s -\-t.
Доказательство. Что касается первой части, имеем
A (s + t) = с + 0 = с, а следовательно, s +1 — вектор-решение
уравнения Ах = с.
С другой стороны, если Ах = с, то А(х — s) = 0, следова-
следовательно, х — s е Ж (А). Записав х — s = t, получим t e Jf{A) и
Упр. 4. В упр. 3 можно взять
Вектор-решение для уравнения Ах = 0 есть
2
-1
-1
11 +2ct
— а
1 -а
является решением уравнения Ах = с для любого а.
Теорема 1.16.5. Для квадратной матрицы А уравнение
Ах = с имеет единственное решение в том и только в том слу-
случае, когда А неособая.
Доказательство. Если А неособая, то х = А~1с яв-
является решением и единственным решением уравнения Ах = 0
будет х = 0 (теорема 1.16.1). Следовательно, по теореме 1.16.4
каждый вектор-решение уравнения Ах = с будет иметь вид
Л-1с + 0 = Л-1с, т. е. имеется лишь одно решение.
Обратно, если решение единственно, то в предыдущей тео-
теореме мы можем иметь лишь t = 0. Поэтому по теореме 1.16.1
матрица А неособая. -^
Предыдущие теоремы дают нам лишь теоретическую кар-
картину относительно решений уравнения Ах = с. Однако мы не
обсудили еще никаких практических приемов для отыскания
этих решений. В следующем параграфе мы приводим конструк-
1.17. ПРАВИЛО КРАМЕРА
51
тивный метод для нахождения решения, применимый к случаю,
когда матрица А неособая. Более глубокий анализ случая, когда
матрица Л особая, откладывается до упр. 5 и 6 в конце главы 3.
Дальнейшая информация по этому вопросу может быть полу-
получена из дополнения 2 об «обобщенно обратных» матрицах.
1.17. Правило Крамера
Мы сформулируем теперь ставшее уже классическим правило
Крамера для решения уравнения Ах = с в случае, когда det Л
существует и отличен от нуля. Как мы знаем, в этом случае
т. е.
Х\
Х2
х„
л. —
1
det
А
Ап
А,2
¦
Ащ
det
А21
А22
•
Л
™2П
А '
...
...
1 Ь.
Ап\
АП2
Ann
С\
с2
¦
с,
Таким образом,
/=i
Но последняя сумма совпадает с разложением det Л по t'-му
столбцу, если элементы этого столбца заменены на с\, с2, ..., сп.
Следовательно,
с,
с2
а\2
... ап
и для t = l, 2, ..., п число Xi будет частным двух определите-
определителей. Числитель является определителем матрицы, получаемой
из А заменой столбца i на с, а знаменатель совпадает с det Л.
Упр. 1. Решить уравнение
2—1 —2
4 1 2
8 -1 1
х,
I | 5
1 5
52
ГЛ. 1. ЛИНЕЙНАЯ АЛГЕБРА
Имеем de^=18 и по теореме 1.16.5 решение единственно:
— 1 —2||
1
I 5 -1
2 5-2
4 1 2
8 5 1
= 4deth
= 4rdet
Т8
2 = — =
1 18
— Л — !
18 f»
*3 =
18
det
-1 5
1 1
-1 5
-^—*
Читателю следует отметить, что хотя правило Крамера яв-
является важным теоретическим результатом и даже полезным
в случае, когда порядок матрицы не слишком велик, оно не
рекомендуется в качестве целенаправленного алгоритма для
численного решения широкого класса уравнений.
Смешанные упражнения
1. Пусть V — линейное пространство всех многочленов от t
с вещественными коэффициентами, степень которых не превос-
превосходит 2. Пусть М — подпространство в V, порожденное /—1,
<2+1, 3^2 + 2<+1. Найти базис для V, содержащий базис
для М.
2. Для произвольной матрицы А доказать, что det(А'А)^ 0.
Показать, как этот результат можно использовать для обобще-
обобщения неравенства Шварца на ??„.
3. Если А — 6 Х6-матрица, то какой знак следует приписать
следующим членам в разложении det Л:
4. Если элементы л X"-матрицы А—дифференцируемые
функции от х и А = \\ахп2 ... ап||, то доказать,_что
dx
det A = det
-r-a,a2 ... aj +det «,-7-02 ... an
... +det|ja,a2 ... -^ ап\.
5. Доказать, что в равенствах A.10.1) и A.10.2) В = А~\
если г — п.
6. Если квадратная матрица А имеет разбиение вида
1AU Al2 [I
О А„ ||'
где Аи и А22 — квадратные матрицы, то доказать, что det/4 =
= (det Ац) (det Л2г)- [Указание. В случае, когда Ап — не-
СМЕШАННЫЕ УПРАЖНЕНИЯ
53
особая, будем иметь
А =
"и
о
7. Найти базисы для Л'(Л) и 31{А), если
1 1 1
А=
1 2 1 2
3 4 3 4
8. Если Л — квадратная матрица и
А2 + 2Л + / = О,
то показать, что А неособая. Как бы вы стали вычислять Л~'?
9. Дано, что D — диагональная неособая матрица и D =¦
= (I -\- А)~1А. Доказать, что А диагональная.
10. Рассмотрим /г X ^-матрицу
х + X х х ... х
х х + X х ... х
х х х ... х + X
а) Доказать, что detM = ln~l (nx + X).
б) Доказать, что М~* (когда она существует) имеет тот же
вид, что и М.
11. Пусть А—квадратная матрица. Исследовать ранг мат-
матрицы Av.
12. а) Если А — матрица вида
1 а 0 0
а 10 0
1 а \ а
1 -1 а 1
то показать, что необходимым условием существования неедин-
неединственного решения уравнения Ах — с будет равенство а = 1
или а = —1.
б) В случае а = 1 рассмотреть уравнение, в котором с' =
= || а, р, y,0||. Найти условия на а, Р, у. при выполнении кото-
которых неоднозначные решения существуют, и написать общее ре-
решение уравнения Ах = с в этом случае.
A ff ^
*13. Если Л
доказать, что
а следовательно,
и а — комплексное число, то
det
det
II А
А
А\
а
Глава 2
СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
2.1. Характеристическое уравнение
Предположим, что А<^&~пХп и дсе^"„. Вектор Ах принад-
принадлежит &~п и будет элементом из области значений матрицы А.
Нам будут особенно интересны те векторы х, которые при умно-
умножении на А переходят в кратные им векторы, т. е. такие векторы
х Ф О, для которых существует число щ из SF с Ах = \ijX. Та-
Такой ненулевой вектор х называется правым собственным векто-
вектором матрицы А и (Xj — соответствующим собственным значе-
значением. Написанное выше уравнение может быть переписано
в виде (|ij/ — Л)* = 0. Применяя теорему 1.16.1, получаем, что
Hi — собственное значение матрицы А в том и только в том слу-
случае, когда det(jij/ — Л) = 0. Определение функции определи-
определителя означает теперь, что \x,j удовлетворяет полиномиальному
уравнению с коэффициентами в $Г\ это уравнение известно как
характеристическое уравнение матрицы А. Многочлен с(ц)е=
= det(|i/ — А) называется характеристическим многочленом
матрицы А.
Следует заметить, что правый собственный вектор мат-
матрицы А, соответствующий данному собственному значению щ,
не может быть единственным. Правые собственные векторы сов-
совпадают в действительности с множеством всех ненулевых эле-
элементов из Jf{\\,jl — А).
Изучение свойств характеристического многочлена даст нам
первое приближение к изучению свойств собственных значений.
Отметим, что при произвольном поле &~ собственные значения
не обязательно принадлежат У. Это происходит потому, что
корни многочлена с коэффициентами в некотором поле !У не
обязательно принадлежат ^". Классическим примером этого яв-
являются многочлены с вещественными коэффициентами, имею-
имеющие комплексные корни. Для избежания всех таких трудностей
мы будем всегда поле &~ предполагать таким, что корни всех
многочленов с коэффициентами в У также принадлежат У.
2 I. ХАРАКТЕРИСТИЧЕСКОЕ УРАВНЕНИЕ 55-
Поле с таким свойством называется алгебраически замкнутым.
В частности, отметим, поскольку это касается структуры данной
книги, что поле комплексных чисел алгебраически замкнуто,,
а поле вещественных чисел нет.
Первый результат такого рода уже был отмечен:
Теорема 2.1.1. Если /4 е Упхл, то ц; е У—собственное
значение матрицы А в том и только в том случае, когда \ij —
корень характеристического многочлена для А.
Следующим шагом нашего анализа будет исследование ко-
коэффициентов характеристического многочлена. Сначала сфор-
сформулируем вспомогательное утверждение.
Л е м м а. Пусть А е 3^"пхп и столбцы i\, t2, ..., ih матрицы А
совпадают с единичными векторами et:, е,-2, ..., eik. Тогда
det Л равен главному минору матрицы Л, полученному выбра-
выбрасыванием строк и столбцов l\, i2, ..., ih-
Доказательство. Разлагая det А по столбцу (ь полу-
получаем
;;;!;:; J j:;;
_ . / 1 2 .../,- 1 /, + 1 ... п \
~Л\\ 2 .../,- 1 /, + 1 ... п ) •
Далее вычисляем этот минор с помощью разложения по столбцу
с номером t2. В результате находим, что det Л равен главному
минору, полученному выбрасыванием строк и столбцов i\ и /г-
Продолжая таким образом разложение по столбцам г3) ..., ih,
получаем нужный результат. -^
Теорема 2.1.2. Пусть сг — сумма всех главных миноров по-
порядка г матрицы А, 1 ^ г ^ п. Тогда
Доказательство. Пусть аи а2, ..., ап — столбцы мат-
матрицы А. Тогда, используя единичные векторы, можем записать-
(—l)"c(n) = det(/4 —n/) = det||a, —це, a2 —це2 ... с„ —це„||.
Так как определитель — однородная линейная функция от столб-
столбцов, написанный определитель можно выразить в виде суммы 2п
определителей, имеющих столбцы вида at или —цег- Соберем-
вместе определители, содержащие точно г столбцов вида —\хе?
для некоторого i. Таких определителей имеется ( j и они по-
получаются из матрицы А заменой г ее столбцов на (—ц) • (еди-
(единичный вектор) всеми возможными способами. Таким образом,
из леммы следует, что каждый из этих определителей равен:
56
ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
некоторому главному минору порядка п — г в А, умноженному
на (—ц)г. С другой стороны, каждый главный минор порядка
п — г встречается при суммировании. Результат следует теперь
из рассмотрения значений г = О, 1, 2, ..., п. ^
п
В частности, отметим, что ct = ?_, arr. Эта величина изве-
г = 1
стна как след матрицы А и обозначается через tr(/4). Отметим
также, что cri = det/L Последний результат может быть'полу-
быть'получен непосредственно, если положить ;х = 0 в определении ха-
характеристического многочлена. Из основного результата теории
полиномиальных уравнений следует, что сг будет также суммой
всех произведений по г штук из п корней многочлена с(ц). Та-
Таким образом, если ци \i2, ..., цп — собственные значения мат-
матрицы А (не обязательно различные), то
*Упр. 1. Доказать, что deM =0 в том и только в том слу-
случае, когда А имеет нулевое собственное значение.
Упр. 2. Показать, что для
А =
-3 1
-7 5
собственными значениями будут рц = 4, (х2 = —2.
*Упр. 3. Исследовать собственные значения диагональных
и треугольных матриц, обратив особое внимание на единичную
и нулевую матрицы в ЗГпхп-
Упр. 4. Использовать теорему 2.1.2 для нахождения харак-
характеристического многочлена матрицы
3 -1 О
2 1 1
-1 1 О
Упр. 5. (а) Найти собственные значения матрицы
О 1
О О
и показать, что разные матрицы могут иметь одинаковые соб-
собственные значения.
(б) Найти собственные значения матриц
о 1
-1 0
10 о 1
о 1 о
1 0 0
2.2. КРАТНОСТЬ СОБСТВЕННОГО ЗНАЧЕНИЯ 57
*Упр. 6. Показать, что А и А' имеют одинаковые собствен-
собственные значения.
Упр. 7. Пусть А — неособая матрица. Исследовать связь
между собственными значениями матриц А и А~1.
2.2. Кратность собственного значения
Из предположения, что поле 3?~ алгебраически замкнуто,
следует, что характеристический многочлен с(ц) может быть
разложен в произведение п линейных множителей:
с(A) = П((*-И/), B.2.1)
где hi, Ц2, ..., Цп — собственные значения матрицы А. Можег
случиться, что некоторые из этих собственных значений равны.
Мы поэтому определяем кратность собственного значения \ij
матрицы А как число множителей ц — \\,j, входящих в разло-
разложение B.2.1) характеристического многочлена матрицы А на
линейные множители.
Мы убедились ранее, что щ — собственное значение мат-
матрицы А в том и только в том случае, когда ц,37— А имеет ранг,
который меньше п. Нашей целью теперь будет выявление неко-
некоторой связи между рангом матрицы ц3/— А и кратностью соб-
собственного значения ц}.
Лемма, пу^п-матрица ранга п — a (l^oc^n) имеет
нуль собственным значением кратности m ^ а.
Доказательство. Пусть А — «X л-матрица ранга п — а..
Из определения ранга по минорам следует, что все миноры мат-
риты А порядка выше п — а равны нулю. Поэтому по тео-
теореме 2.1.2 Cn-a+i ==...== Cn-i = с„ = 0 и характеристический
многочлен матрицы А приводится к виду
Следовательно, кратность нулевого собственного значения
Если в написанном выше характеристическом многочлене
cn_a Ф- 0, то очевидно, что нуль будет собственным значением
матрицы А кратности ос. Может ли эта кратность превзойти а?
Чтобы убедиться в возможности этого, нужно указать лишь,
подходящий пример. Пусть
А -11° '
Л — | О О
тогда г (А) = 1, так что имеем п = 2, a = 1. Но det(ji/ — А) =
= [i2, так что А имеет нуль собственным значением кратности 2,.
т. е. m = 2 > а.
58 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Читатель может без труда привести пример, в котором
т = а.
Теорема 2.2.1. Если п X п-матрица А имеет собственное
значение \ij и \ijl — А—матрица ранга п — а, то ц3- имеет крат-
кратность m ^ а.
Доказательство. Из леммы следует, что ц;7— А имеет
нуль собственным значением кратности пг ^ а. Для любой кон-
константы k соотношение
det {(ц/ — k)I — (A — kl)} = 0
показывает, что собственные значения матрицы А — kl совпа-
совпадают с собственными значениями матрицы А, уменьшенными
на k. Другими словами, собственные значения матрицы А сов-
совпадают с собственными значениями матрицы А — kl, увеличен-
увеличенными на k. В частности, собственные значения матрицы А сов-
совпадают с собственными значениями матрицы А — ц/, уве-
увеличенными на [ij. Таким образом, то, что А — \ijl имеет нуль
собственным значением кратности пг, означает, что А имеет
собственное значение \ij с кратностью т. Л
Следует заметить, что в формулировке теоремы число а
равно размерности пространства Jf{\\,jl — A) (теорема 1.16.2),
которое называется геометрической кратностью \ij. Таким обра-
образом, теорему можно сформулировать также в таком виде:
Кратность собственного значения не меньше его геометриче-
геометрической кратности.
2.3. Собственные векторы
Как мы видели в упр. 6 из § 2.1, собственные значения мат-
матриц А и А' совпадают. Следовательно, если \ij — собственное
значение матрицы А, то существует такое у ф 0, что
что можно записать также в виде
Это соотношение наводит на мысль называть у левым собствен-
собственным вектором матрицы А, соответствующим собственному зна-
значению \Hj.
Поэтому иногда удобно обозначать пространства H°(jij/—А)
и Jf(\ijl — А') как правое и левое собственные пространства jj,j
соответственно.
Следующий наш результат показывает, в частности, что
один и тот же вектор не может принадлежать двум правым соб-
2.4. ПРЕОБРАЗОВАНИЯ ПОДОБИЯ И ПРОСТЫЕ МАТРИЦЫ 59
ственным пространствам, соответствующим разным собствен-
собственным значениям матрицы А.
Теорема 2.3.1. Правые собственные векторы, соответствую-
соответствующие различным собственным значениям, линейно независимы.
Доказательство. Пусть щ, ц-2. •••. Us — различные соб-
собственные значения п X /г-матрицы А и хх, х2, ..., xs — правые
собственные векторы, соответствующие \i\, ц2, ¦ ¦ ¦, и* Предпо-
Предположим, что существуют такие числа с\, с2, ..., cs, что
c,*i + с2х2 + ... + csxs = 0.
Умножим обе части этого равенства слева на ц\1 — А, отметив,
что (ц\1 — А)х\ = 0, Axi = \nXi, / = 2, 3, ..., s. В результате
получим
(Hi — ц2) с2х2 + (Мч — ^з) с3«з + • ¦ • + (М-i — M-s) csxs = 0.
Умножая теперь полученное равенство на \i2l — А, получим
(|Л, — Ц3) (М-2 — М-з) СЯХ3 + ... + (М-1 — H-s) (^2 — Vs) CSXS = 0.
После s— 1 таких операций будем иметь
(М-i — Us) (М-2 — M-s) - - • (M-s-i — И-s) cs*s = °.
откуда следует, что cs = 0. Но порядок собственных значений
и собственных векторов произволен, а поэтому можно также
доказать, что С\ = с2 = ... = cs_i = 0. Следовательно, векторы
х\, Хг, ..., xs линейно независимы. Л
Очевидно, подобный результат верен и для левых собствен-
собственных векторов.
2.4. Преобразования подобия и простые матрицы
Матрицы Л и В из &~пх-п называются подобными, если су-
существует такая неособая матрица Ге^пхп, что А = Т-1ВТ.
Можно также сказать, что А получается из В преобразованием
подобия.
Если х — некоторый элемент из &~п, то мы говорили про век-
вектор у = Ах, что он является образом х при преобразовании,
определенном А. Предположим теперь, что zit г2, . .., г„ — про-
произвольный базис в 8Гп, и пусть Z=\\z\Z2 ... zn ||; это — не-
неособая матрица, ибо ее ранг по столбцам равен п. Существуют
такие числа й\, а2, ..., а„ и Ь\, Ь2, ..., Ь„, что
п п
х = Yi QjZj = Za и у = X pjZf = Zb.
Можно сказать, что векторы а, Ь представляют х, у соответ-
соответственно в том смысле, что а, Ь определяют х, у как их коорди-
60 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
наты в базисе векторов г. Уравнение у = Ах переходит теперь
в Zb = AZa, или b = Z~lAZa. Это уравнение дает возможность
интерпретировать матрицу Z~lAZ, подобную А, как то же са-
самое преобразование, что и А, но представленное на языке ба-
базиса векторов z. Это — важная алгебраическая идея и она при-
приводит к заключению, что подобные матрицы являются просто
представлением одного и того же преобразования на основании
разных базисных векторов. Однако приведенное соображение
не более чем эвристическое, так как мы не даем (и не будем
использовать) формального определения «преобразования».
Заметим, что преобразования подобия симметричны в том
смысле, что если А и В подобны, то таковыми же будут В и А.
Ибо А = Т-{ВТ означает, что В = ТАТ-1 = S~lAS, где S = Г-1.
Более того, если Л и В подобны и В и С подобны, то Л и С по-
подобны. Читателю следует это проверить. Это свойство известно
как транзитивность преобразований подобия*).
Отметим также, что
= T~l(Al + A2 + ... +Ak)T B.4.1)
и, если р — произвольное целое положительное число,
(Т~1АТ)Р = (Т^АТ) (Т~1АТ) ... (Т~1АТ) = Т~1АРТ. B.4.2)
Если /(Л) — скалярный многочлен a0Xft + axXk~l -\- ... + ап,
то мы определяем f(M), где М — произвольная квадратная мат-
матрица, как
При таком определении значения многочлена от матрицы из
свойств B.4.1) и B.4.2) следует, что
Теорема 2.4.1. Подобные матрицы имеют одинаковые соб-
собственные значения.
Доказательство. Мы докажем, что подобные матрицы
имеют одинаковые характеристические многочлены и, следова-
следовательно, по теореме 2.1.1 одинаковые собственные значения.
Предположим, что А = Т~1ВТ, так что А и В подобны, и пусть
с(ц) = det(n/ — A) — характеристический многочлен матрицы А.
*) Эти свойства вместе с рефлексивностью (матрица подобна самой
себе) означают, что подобие матриц является отношением эквивалентности.
2.4. ПРЕОБРАЗОВАНИЯ ПОДОБИЯ И ПРОСТЫЕ МАТРИЦЫ 61
Тогда
с(ц) = det {ц1 — Т~[ВТ) = detT~l (ц/ — В)Т =
= (det T~l) (det (ц/ - В)) (det T) = det (ц/ — 5),
так как (det Г) (det Г) = 1 (упр. 4 из § 1.14). Таким образом,
характеристические многочлены матриц А и В совпадают. ^
К сожалению, матрицы, имеющие одинаковые собственные
значения, не обязательно подобны. Следующий пример это по-
показывает.
Упр. 1. Доказать, что матрицы
о о
о о
О 1
о о
¦имеют одинаковые собственные значения, но не подобны.
Для данной п X «-матрицы А мы теперь ставим вопрос: ка-
каково максимальное число линейно независимых правых соб-
собственных векторов для Л? Ясно, что это число не превосходит п.
В этой главе нас особенно будет интересовать случай, когда оно
равно в точности п. В § 2.3 мы определили максимальное число
линейно независимых правых собственных векторов, соответ-
соответствующих ц, (т. е. размерность пространства Jf(nl — А)), как
геометрическую кратность ц. Теорема 2.3.1 и упр. 8 из § 1.9
означают тогда, что максимальное число линейно независимых
правых собственных векторов А равно в точности сумме геомет-
геометрических кратностей собственных значений матрицы А. Так как
сумма кратностей собственных значений равна п, теорема 2.2.1
означает, что сумма геометрических кратностей либо меньше,
либо равна п. Кроме того, у А имеется п линейно независимых
правых собственных векторов в том и только в том случае, когда
геометрическая кратность каждого собственного значения равна
его кратности. Это приводит нас к следующему определению.
Квадратная матрица А называется простой, если для каж-
каждого собственного значения матрицы А его кратность равна гео-
геометрической кратности. Непростая квадратная матрица назы-
называется дефектной.
Если А^'ё'пХп, то можно также сказать, что собственные
векторы матрицы А порождают 9$п в том и только в том случае,
когда А — простая. Предположим, что А имеет множество не-
независимых правых собственных векторов х\, х2, ..., хп, соответ-
соответствующих собственным значениям щ, ц2, ..., \in (не обяза-
обязательно различным). Тогда имеем
Ах, = \ijXj, /=1, 2, .... п.
62 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Определим U — diag {ц.и цг, ¦ ¦ ¦, м4 и Л = II *i*2-. .*п II и за-
заметим, что, так как ранг по столбцам для X равен п, X — неосо-
неособая. Написанные выше уравнения можно записать теперь
в виде матричного уравнения
АХ = XU, B.4.3)
откуда
A = XUX~\ ' B.4.4)
Таким образом, простая матрица подобна диагональной мат-
матрице из своих собственных значений.
Предположим теперь, что заданы диагональная матрица U
и неособая матрица X, для которой А = XUX~X. Тогда АХ = XU
и (в обозначениях § 1.15)
Д*„ = ,!,*„, /=1,2 п.
Таким образом, столбцы матрицы X могут быть интерпретиро-
интерпретированы как п линейно независимых правых собственных векторов
для А с элементами ц в качестве соответствующих собственных
значений. Следовательно, А простая. Нами доказана
Теорема 2.4.2. Некоторая матрица простая в том и только
в том случае, когда она подобна диагональной матрице.
Упр. 2. Доказать, что п X и-матрица с п различными соб-
собственными значениями простая.
*Упр. 3. Если А простая, то доказать, что А' простая и, сле-
следовательно, А имеет п линейно независимых левых собственных
векторов.
Мы рассмотрим теперь конструкцию для левых собственных
векторов, подобную использованной выше для правых собствен-
собственных векторов. Если А — простая матрица, то существуют та-
такие п линейно независимых левых собственных векторов у1г
J/2, • • ¦ , Уп, ЧТО
y'fA^v-iV'i, /=1, 2 п.
Полагая Y = \\yiH2 ¦•¦ Уп\\> получаем
У А = UY. B.4.5)
Но из равенства B.4.3) следует, что X~lA = UX~l. Сравнивая
эти равенства, замечаем, что строки матрицы Х~1 являются ле-
левыми собственными векторами для А. В частности, элементы у
можно выбрать так, что V = Х~\ откуда
. Y'X = I и XY' = I.
2.5. СПЕКТРАЛЬНАЯ ТЕОРЕМА И МНОГОЧЛЕНЫ ОТ МАТРИЦ 63
Первог из этих соотношений можно записать в виде
II 12 • • • Ха\\ =
Г
Уп
или, используя символ Кронекера,
^x. = 6.;., i, j=\, 2, ..., п.
Мы говорим в таком случае, что два множества векторов Xi, ...
..., х„ и у\, ..., уп квазибиортогональны. Обоснование этой тер-
терминологии будет дано в § 2.6.
Заметим, что каждая из рассматриваемых систем векторов
является базисом в ffn и, если выражать произвольный вектор
через один из этих базисов, коэффициенты разложения без
труда находятся при помощи другого базиса. Например, если
а е Wn, то существуют такие комплексные числа ось а2, ..., ап,
что
а =-- а,*, + а2ж2 + • •, + апхп.
Умножая слева это равенство на у' и используя условие квази-
квазибиортогональности, убеждаемся в том, что
a/ = J/-e, /=, 2, ..., п.
Теорема 2.4.3. Если А — простая матрица, то ее правые
и левые собственные векторы можно определить таким обра-
образом, что Y'X = I и А = XUY'.
Доказательство. Мы уже убедились в том, что Y'X = I
и А = XUX~K Полагая Х~[ = У во втором равенстве, завер-
завершаем доказательство.
Упр. 4. Показать, что матрица
41 "Л
простая, и найти такие X, У, что Y'X = I и А = XUY'.
2.5. Спектральная теорема и многочлены от матриц
Множество всех собственных значений некоторой квадрат-
квадратной матрицы известно как ее спектр. Про теорему 2.4.3 можно
было бы сказать, что она спектральная, потому что в ней дается
выражение А через матрицы, связанные со спектром А. Сле-
Следующий наш результат обобщает теорему 2.4.3. Утверждение
64
ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
теоремы мы записываем в таком виде, который подчеркивает
ее спектральный характер.
Теорема 2.5.1. Пусть А — простая пХ^п-матрица и р —
скалярный многочлен. Если х\, х2, ..., х„ и уи у2, ..., уп — ква-
зибиортогональные системы правых и левых собственных век-
векторов соответственно, то
p(A)=?p(VL,)Gt,
где сопутствующие матрицы С;- задаются равенствами
Доказательство. Для целого положительного числа г
по теореме 2.4.3 имеем
АГ = (МО {XUY') . .. (XUY')
и Y'X = I. Следовательно,
Ar = XUrY' = Ц JT., ... Х,а |
= х,
V-пУп
Теорема 1.6.1 (или ее следствие в § 1.7) означает теперь, что
Если
= рои' + PiM-' + ... + Pi, то получаем
. + plZ^lr]Gi+ ... +ptl.
Z
Далее, XY' = / и, следовательно, опять используя теорему 1.6.1,
получаем /=Х^/- Таким образом,
Следствие. 1. Сопутствующие матрицы обладают следую-
следующими свойствами:
(О %С, = 1;
(ii) GjGk = O, \фк\ /, 6 = 1, 2, ..., п;
(Hi) GJ^G,, /=1, 2, .... п.
2.5. СПЕКТРАЛЬНАЯ ТЕОРЕМА И МНОГОЧЛЕНЫ ОТ МАТРИЦ 65
Свойство (i) было получено выше. Свойства (ii) и (iii) сле-
следуют сразу же из квазибиортогональности собственных векто-
векторов. Матрица А, для которой А2 = А, называется идемпотент-
ной. Таким образом, сопутствующие матрицы идемпотентны.
Структура идемпотентных матриц будет подробно проанализи-
проанализирована в § 2.11.
Следствие 2. Собственные значения матрицы р(А) совпа-
совпадают с p(n-i), .... р(цп), м принадлежащие им собственные под-
подпространства совпадают с соответствующими собственными под-
подпространствами матрицы А.
Проверка этого утверждения предоставляется читателю. Од-
Однако первая часть следствия может быть немедленно обобщена,
а именно, можно убрать условие о том, что матрица А простая.
Теорема 2.5.2. Если [хь \i2, ..., \in — собственные значения
некоторой п X п-матрицы Аир — скалярный многочлен, то соб-
собственными значениями матрицы р(А) будут p(ni), р((хг), •¦•
р(ц)
Доказательство. Пусть g — многочлен степени / с кор-
корнями цО, ц,<2' ц((). Тогда существует такая константа gQ ф О,
что
и мы имеем
Если записать с (n) = det (\il — А) — характеристическому
п
многочлену матрицы А и вспомнить, что с(ц) = Ц(ц — [Х;), то
будем иметь
(«>)с(ц<'>) ... с((!«>) =
= g? П ((х(/) - И,) ... П <!*«'»—1*„) = g ((х.) g (ц2) ...g dxn).
i l
Пусть g (ц) — X — p ([x), так что p ([x) — тоже многочлен от
степени /. Имеем
g(A) = U-p(A),
откуда
det (Ы - р (А)) = {К-р ((х,)} {К - р Ы) ...{К-р (цп)}.
3 П, Ланкастер
66 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Так как это равенство верно для любого Ае^", нами получено
разложение характеристического многочлена матрицы р(А) на
линейные множители. Отсюда сразу же следует, что собствен-
собственными значениями матрицы р(А) будут р(ц\), р(ц-г), •••
• •-, P(\in). <
Упр. 1. Если А — простая матрица и р — скалярный много-
многочлен, то показать, что р(А)—простая матрица.
Упр. 2. Показать, что матрица
Л = 1 '
/l 0 2
простая. Найти сопутствующие матрицы для А и использовать
их для нахождения Л20.
*Упр. 3. Если А — простая матрица, то показать, что в обо-
обозначениях теоремы 2.5.1 имеем
*Упр. 4. Доказать, что собственные значения идемпотентной
матрицы все равны либо единице, либо нулю.
Упр. 5. Матрица А называется нилыготентной степени т,
если существует такое целое число т ^ 2, что Ат = 0 и
Дт-i ф д. Показать, что собственные значения нильпотентной
матрицы все равны нулю и что такая матрица не может быть
простой.
Упр. 6. Если ц, — собственное значение простой матрицы Л,
то выбор базисных векторов в Jf(\xl — Л) не однозначен. По-
Показать, что сумма сопутствующих матриц для ц. тем не менее
определена однозначно.
Упр. 7. (Мощный метод зычисления собственных значений.)
Пусть Л — простая матрица из ^nxn с собственными значе-
значениями hi, ц,2, ••-, \у.п и |ц! | > |ц;|, / = 2, 3, ..., п. Процессы
предельного перехода к матрицам и векторам интерпретировать
как примененные к соответствующим элементам.
(i) Показать, что ((хрМ)г—> С, при г—*оо, где Gt — сопут-
сопутствующая матрица собственного значения ц,ь т. е. G1 = x[y'l.
(ii) Для произвольного а0 е'iPn определить последователь-
последовательность векторов а,0, п\, а2, ... при помощи рекуррентного соот-
соотношения
^Ur' '" = 0,1,2,...,
2.6. ОРТОГОНАЛЬНЫЕ И КВАЗИОРТОГОНАЛЬНЫЕ ВЕКТОРЫ
67
где kr+i определяется так, чтобы наибольшая по модулю компо-
компонента вектора аг+1 была равна 1. Исследовать limar и limftr
при г—+оо, предполагая, что у'а0 ф 0.
(iii) Исследовать собственные значения и собственные век-
векторы матрицы Л[ = А — \iiGi и показать, что Аг{ = Аг — Vffiy
Упр. 8. Использовать упр. 7 для нахождения наибольшего
по модулю собственного значения матрицы
А =
(При вычислении векторов аь а2, ... использовать четыре де-
десятичных знака.)
Упр. 9. Доказать, что если А — простая матрица с характе-
характеристическим многочленом c(\i), то с(А) = 0. (Это частный слу-
случай теоремы Кели — Гамильтона, в полной общности доказы-
доказываемой в главе 4.)
2
8
4
4
9
13
6
15
36
с а3 =
0
0
1
2.6. Ортогональные и квазиортогональные векторы
В этом параграфе мы вводим два понятия ортогональности.
Оба они имеют важное значение в 9*п и, как мы увидим, совпа-
совпадают в 91п. Хотя нас в основном интересуют эти два простран-
пространства, определения будут даны в виде, годном для более широкого
приложения.
Рассмотрим сначала линейное пространство &, в котором
определено внутреннее произведение (§ 1.3). Пара ненулевых
векторов х, y^L называется ортогональной, если {х,у) = 0.
Развивая эту идею, говорим, что множества Х\, х2, ..., xh и yit
У2, ¦ ¦ ¦, Ук из 3? биортогональны в том и только в том случае,
когда
(Xi, У]) = бц, 1 < «, / < k.
Если, в частности,
(Xit Xj) = 6if, 1 </, j<k,
то множество х\, х2, ...,хь. ортонормированное.
Мы начали главу 1 с формализации некоторых привычных
понятий в Жъ и затем использовали их для определения линей-
линейного пространства. Идя дальше в этом направлении, опреде-
определяем угол 8 между двумя ненулевыми векторами х и у из & по
формуле
i = arccos-
3*
68 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Заметим, что при 2 = ^п внутреннее произведение принимает
в общем случае комплексные значения и тогда 6 будет ком-
комплексным. Это не должно удивлять, ибо в пространстве векто-
векторов, определенных комплексными числами, можно ожидать, что
углы будут комплексными. В частности, угол между х и у будет
комплексным сопряженным к углу между у и х. Тем не менее
мы по-прежнему можем сказать, что х и у ортогональны, если.
0 = л/2, и что угол между вектором и им самим необходимо
равен нулю.
При 2 = 31п неравенство Шварца (теорема 1.3.1) гаранти-
гарантирует, что | cos в j ^ 1, а поэтому в этом случае можно всегда вы-
выбрать 0< 6< л.
Второе определение ортогональности вводится для линейного
пространства @~„. Пара ненулевых векторов х, yef, назы-
называется квазиортогональной, если х'у = 0. Мы говорим, что мно-
множества хи х2, ... , xk и уи у2, .. . , Ун из @~„ квазибиортогональ-
ны, в том и только в том случае, когда
*^/= б*/> '. /= 1. 2, ..., k.
Если, в частности,
*r*7 = 6i/' '• /= Ь 2, .... k,
то множество Х\, х2, ..., Хи квазиорюнормировано.
Сравнивая определения ортогональных и квазиортогональ-
квазиортогональных векторов в Sin, убеждаемся в том, что, так как (х, у) =
= х'у = х'у, эти два определения совпадают. То же самое отно-
относится к определениям о множествах векторов. Оба приближения
могут поэтому считаться обобщениями хорошо знакомой орто-
ортогональности в Яъ-
Упр. 1. Показа ib, что единичные векторы eit е2, ..., еп в ffn
ортонормированы и квазиортонормированы.
Упр. 2. (а) Построим пример вектора, квазиортогонального
к себе самому.
(б) Пусть 2 — пространство с внутренним произведением
и х^2. Показать, что если х ф 0 и у = х/(х,х)Ч*, то {у,у) = I.
Мы говорим, что у получен нормированием из х.
Упр. 3. Показать, что следующая система векторов из ffn
ортонормирована, но не квазиортонормирована:
о
1 II О || 1
о
о II 1
X = —7=г
1 » ™ 7—
1 Уз
I
о
Найти такие числа cci, осг, аз, что ai*i, а2*2 и а3*з будут квази-
ортонормированы.
2.7. ОРТОНОРМИРОВАННЫЕ СИСТЕМЫ 69
Упр. 4. Для Ле^"„Хга с det Л =7^= 0 запишем Ж/=А/, 9/ =
= (Л~')/,, /—1, 2, ..., /г. Показать, что системы векторов
{Xi}, {t/j} квазибиортогональны.
*Упр. 5. Для А^@~пхп и х, у^'&п доказать, что
(х, Ау)*=(А*х,у),
Где А* = А', транспонированная сопряженная к матрице А.
Упр. 6. Если х, у f= #„, то доказать, что | х'у |2 <(ж, х)(у, у).
Теорема 2.6.1. (а) Если 2— линейное пространство, в ко-
котором определено внутреннее произведение, и множества век-
векторов xi xk и уи ..., yk в 2 биортогональны, то векторы
Х\, ..., Xh линейно независимы.
(б) Если множества векторов х\, ..., Xk и у\, ..., yk принад-
принадлежат $Гп и квазибиортогональны, то хь ..., хи линейно неза-
независимы.
Доказательство, (а) Пусть ось «2, .... ось — числа, для
которых
0. B.6.1)
Тогда для г=1, 2, ..., k имеем
уГ) = ау{хь yr)+ ... + ak{xk, yr) = ап
так как {xs, yr) = 6sr по свойству биортогональности. Таким об-
образом, осг = 0 для г = 1, 2, ..., k и, значит, хи х2, ..., хи ли-
линейно независимы.
(б) В этом случае умножаем обе части равенства B.6.1)
слева на у'г. Из квазиортогональности тогда опять следует, что
а,г = 0. Так как это верно для г= 1, 2, ..., k, элементы опять
линейно независимы. ^1
Очевидно, что множество ортонормированных (или квазиор-
тонормированных) векторов линейно независимо. Это — част-
частный случай теоремы, в котором уг = хг, г = 1, 2, .. . , k.
Мы не будем глубоко заниматься сходством между ортого-
ортогональностью и квазиортогональностью. Более плодотворно сосре-
сосредоточиться теперь на понятиях ортогональности и ортонорми-
ортонормированных систем.
2.7. Ортонормированные системы
Во всем этом параграфе 2 будет обозначать линейное про-
пространство, в котором определено внутреннее произведение. Мы
хотим показать, что для заданного множества из k линейно не-
независимых векторов в 2 можно построить некоторое множество
из k ортонормированных векторов, беря линейные комбинации
zr t_ 1/2 , r I, 2, ..., ft.
70 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
в заданном множестве. Другими словами, если 3?h — подпрост-
подпространство в &, порожденное линейно независимыми векторами
х\, х2, ..., xh, то существуют ортонормированные векторы zlr
z2, ..., zk в Sh. Мы построим сначала множество ненулевых
векторов уи Уч, ..., уь в 2и, для которых {yr,ys) = 0 при г Ф s,
1 ^ г, s ^ ft. Ортонормированное множество тогда строится и*
этого при помощи '
Уг
(Уп У гI
Пусть S'р — подпространство, порожденное дсь х2, . .., хРг
где 1 ^ р ^ ft; тогда SS\ с: З'г сг .. . с: 3?и и дсг не принадле-
принадлежит Sv при г > р. Полагая j/i = *ь находим затем вектор
Уг е j?2. не принадлежащий Si и для которого (уи У2) == 0.
Записав
J/2 = «12^1 + «2.
определяем а12 из условия (j/b y^} = 0. Должно быть
п (у и у г)
так что
Далее, равенство У2 = О означало бы, что ^g^, что не так.
Следовательно, у2 Ф 0.
Мы могли бы теперь продолжить рассуждение, положив.
но, применяя индукцию, мы запишем сразу для г = 2, 3, ..., k
yr = alryl+ ... +ar-Uryr-l + xn B.7.1)
где
0) (yi,yi) = o, 1фг, 1
(ii) У1Ф0; > i, /=1, 2, .... r- 1.
(Hi) ^eiP, и yt^gi-u )
Мы докажем, что константы air, ..., ar-i,r могут быть выбраны
так, что (i), (ii) и (iii) будут выполняться для /, /= 1, 2, ..., г.
Определение B.7.1) сразу же дает, что (iii) выполняется
для i = г. Придав теперь константам значения
a'r==~(JV^y /==1« 2, .... г-1,
Лез труда проверяем, что (i) выполняется для I, /= 1, 2 г.
Используя (iii) при t = г, убеждаемся в том, что равенство
2.7. ОРТОНОРМИРОВАННЫЕ СИСТЕМЫ
71
yr = 0 противоречило бы тому, что уг ф ^r-i, а поэтому ут ф 0.
Таким образом, может быть найдена нужная последователь-
последовательность у\, у2, ..., уи и ортонормированная система ги ..., Zh мо-
может быть получена при помощи нормирования из элементов у.
Описанная конструкция известна как процесс ортогонализации
Грама — Шмидта.
Теорема 2.7.1. Каждое подпространство в 3? размерно-
размерности k содержит о рт оно р мир о ванный базис.
Доказательство. Начиная с любого множества базис-
базисных векторов Х\, х2, ..., xh для подпространства, ортонормиро-
ванный базис можно получить при помощи процесса Грама —
Шмидта. Полученное ортонормированное множество будет тогда
базисом, потому что его члены линейно независимы (тео-
(теорема 2.6.1). <
\Уз
.Уг
Рис. 3.
В помощь интуиции можно дать геометрическую интерпре-
интерпретацию получению элементов у, использованных при процессе
ортогонализации. Полагаем опять ух = Х\ и затем записываем
(рис. 3)
у2 = х2 — (проекция х2 на j/i).
Если х, у е & и у Ф- 0, то, обобщая упр. 2 из § 1.3, определяем
проекцию х на у как вектор {{у,х)/{у,у)}у. Таким образом,
В качестве у3 мы используем элемент из 5?ъ, получаемый в виде
Уз = *з — {(проекция хъ на у{) + (проекция х3 на у2)} =
— v (У'' *3> (У2, *3>
- Хз ~ ~&7у1) yi ~ ~&TJ2> Уг'
Продолжая этот способ получения векторов далее, приходим
к тому же самому множеству векторов, которое было получено
выше при алгебраическом процессе ортогонализации.
72 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Поучительно описать в общих чертах третий подход к задаче
ортогонализации. Чтобы определить взаимно ортогональное
множество у\, у2, ¦. ¦, уп в Sh, мы опять берем ух = хх и затем по-
полагаем
yr = ctxrXx + а2гх2 + ... -\-ar-x,rxr+]+xr, r = 2, 3, ..., k.
Таким образом, как и прежде, уг^3?т и yr<?3?T-\. Для опреде-
определения коэффициентов air, ..., ar-\,r теперь мы наложим усло-
условие, что ут ортогонален к каждому вектору из &г-\. Так как
х\, ..., хг-\ порождают 2т-\, это означает, что (xj,yr) = 0 для
/ = 1, 2, ..., г — 1. Таким образом,
<лсь Xi)alr + (xu x2)a2r + ... +(хи xr-x)ar-Ur = — <дсь xr),
(xr-x, *]>alr-f <дсг_ь x2)a2r+ ... + (xr-u xr-l)ar-Ur =
= —{xr-x, xr).
Это множество уравнений относительно air, a2r, ..., ar-:,r имеет
единственное решение тогда и только тогда, когда определи-
определитель из коэффициентов не равен нулю. Этот определитель есть
ерамиан или определитель Грама от *i, х2, ..., xr-i. В записи
<*1, Х2) ... (*i, ДС,—1
G{xu x2, . .., хг-{)= det
(xr-u Xi) ... <Xr_l, Ж,-
В случае 2' = <S'n можно определить nsX,(r — 1)-матрицу Х==
= ||дс1дс2 ... хг-х ||; тогда
G(*,, хъ ..., xr-x) = det(X*X),
где X* — сопряженная транспонированная матрица к X. Со-
Согласно следующей теореме этот определитель положителен ил»
равен нулю в зависимости от того, будут ли векторы *i, х2, ...
..., «г-) линейно независимы или зависимы. По предположению
эти векторы линейно независимы, так что их грамиан не равен
нулю и для ахг, о-чг, ¦¦¦, о-т-\,т имеется нетривиальное решение.
Следовательно, по индукции мы можем завершить процесс ор-
ортогонализации.
Теорема 2.7.2 (критерий Грама). Векторы х\, х2, ..., xk e
е ^п линейно независимы или зависимы согласно тому, будет
ли G(xx,x2 Xk) положителен или равен нулю.
Доказательство этой теоремы является простым примене-
применением формулы Бине — Коши (теорема 1.14.1). Детали этого
предоставляются читателю.
2.8. СПЕЦИАЛЬНЫЕ ТИПЫ МАТРИЦ
73
Теорема 2.7.3. Если X^Wnxh и r(X)=k, то существуют
такие неособая верхняя треугольная матрица Т в ^хй и мат-
матрица Z e ffnxk с ортонормированными столбцами, что X = ZT.
Доказательство. Напомним, что при процессе ортого-
нализации взаимно ортогональные векторы у\, у2, ..., уи нену-
ненулевые и имеют вид
,. ™ v 1_ п v I I п v I v г 1 О U
У г — г 1 1~ ^*2г 2 ~i ¦ • • i~ '— 1. г/* — 1 i~ "ft — » » •'•> >
а следовательно, существуют такие числа tir, t2r, ..., trr, что
векторы
zr = tlrxi + t2rx2+ ... +/„*„ /-=1, 2, ..., 6, B.7.2)
ортонормированы. Пусть теперь X*j = дс;- и Z*j = Zj, j = 1, 2, ...
. . . , k, так что столбцы в Z ортонормированы и столбцы в X
линейно независимы. Кроме того, равенства B.7.2) можно за-
записать в виде Z = ХТ{, где
U\ t\2 . . . t\k
О
kk
Но t\\, ...,thh все не равны нулю, так что Т\ — неособая и имеет
верхнюю треугольную обратную ГГ' —Т (упр. 5 из § 1.13). Сле-
Следовательно, существует матрица Т с требуемыми свойствами,
для которой X = ZT. -^
Упр. 1. Построить ортонормированныи базис для подпрост-
подпространства в 3?4, порожденного векторами
1
1
0
0
0
1
1
0
и
0
1
0
1
то
то дока-
ТО
Упр. 2. (i) Если дс е ^п и x'iy = 0 для каждого у у
доказать, что лг = 0.
(ii) Если дсе?„ и {х ,у) = 0 для каждого 1/е^л,
зать, что л: = 0.
*Упр. 3. Если А ^'ё'пХп и (,*,Ау) — 0 для всех х, у
доказать, что А = 0.
2.8. Специальные типы матриц
Мы предполагаем всюду в следующих определениях, что
A^ffnXn и имеет элементы а^, 1 ^/, k^n. Строки мат-
матрицы А обозначаются через Аи Ап* и столбцы — через
74 ГЛ. 2 СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Матрица А называется симметрической, если А = А'. Это
условие и условия ctjh = ал3-, 1 ^ /, k ^ п, как легко видеть,
эквивалентны. Третья эквивалентная формулировка: А^ —
— (^j*)'» j—h 2, ..-, «. Следует заметить, что не существует
различия между правыми и левыми собственными векторами
симметрической матрицы.
Матрица А называется кососимметрической, если А = —А'. '
В этом случае имеем aih = —ahi для / Ф k и а^ = 0. Еще одна
формулировка: А^ = —(А,*)'.
Упр. 1. Доказать, что если А — симметрическая матрица, то
таковой же будет и Аг для любого целого положительного
числа г. Показать на примере, что если А я В симметрические,
то АВ не обязательно симметрическая.
Упр. 2. Доказать, что:
(i) если |л — собственное значение кососимметрической мат-
матрицы, то таковым же будет и —\i;
(ii) кососимметрическая матрица нечетного порядка особая..
Начиная с этого места, А* будет обозначать матрицу, полу-
получаемую из А транспонированием матрицы, элементы которой
комплексно сопряжены к элементам А. Таким образом, А* =
= А'. Матрица А называется эрмитовой, если А = А*. Опять
имеем эквивалентные формулировки:
A4 = (Ahy, /=1, 2, ..., п.
Заметим, что вещественная симметрическая матрица (т. е.
симметрическая матрица с вещественными элементами) будет
эрмитовой. Матрица Л, для которой А = —А*, называется ко-
соэрмитовой.
Матрица А называется ортогональной, если А'А = I. Как
очевидно, для ортогональной матрицы (det/4J= 1, так что та-
такая матрица неособая. Определяющее уравнение можно по-
поэтому записать в виде А~1 = А' или АА' = /. Соотношение-
А'А = I также означает, что
Таким образом, столбцы ортогональной матрицы образуют ква-
зиортонормированную систему векторов. То же утверждение
справедливо для строк ортогональной матрицы.
Матрица А называется унитарной, если А*А = /. Без труда
получаем, что унитарная матрица неособая, что А~1 = А* и что
АА* = 1. Заметим, что вещественная ортогональная матрица
унитарна.
Рассуждение, только что примененное к ортогональным мат-
матрицам, может быть использовано для доказательства того, что>
2.9. ЭРМИТОВЫ МАТРИЦЫ 75
столбцы (или строки) унитарной матрицы образуют ортонорми-
рованную систему базисных векторов для 9V Наоборот, если
столбцы некоторой квадратной матрицы U ортонормированы,
то U*U = I и эта матрица унитарна. Теорема 2.7.3 означает те-
теперь: если X— произвольная неособая матрица, то существуют
такие неособая верхняя треугольная матрица Т и унитарная
матрица U, что X = UT.
Упр. 3. Можно ли последнее утверждение расширить до
включения случая, когда матрица X особая?
Упр. 4. Будет ли множество всех эрмитовых матриц по-
порядка п подпространством в WnXn? Дать ответ на тот же вопрос
для вещественных симметрических матриц в $.пхп.
Упр. 5. При A^Wmxn, x^Wm иуе?„ показать, что
{х,Ау) = (А*х,у).
2.9. Эрмитовы матрицы
Свойства и структура эрмитовых матриц особенно просты
и изящны, а так как такие матрицы часто возникают в прило-
приложениях, познакомиться с ними в полном объеме очень важно.
Множество всех эрмитовых матриц порядка п — собственное
подмножество в ФпХп, структура элементов которого более
полно будет изучена в главе 4. Ни одно из свойств, получаемых
в этом параграфе для эрмитовых матриц, в общем виде не вы-
выполняется В ФпХп-
Теорема 2 9.1. Собственные значения эрмитовой матрицы
вещественны.
Доказательство. Пусть А — эрмитова матрица с соб-
собственным значением ц. Тогда существует такой вектор х Ф О,
что
Ах = цх,
откуда, беря сопряженное равенство и транспонируя обе его
¦части, получаем
х*А — \хх*,
так как А* = А. Умножая первое из уравнений слева на х*
V второе справа на х, находим, что ц*** = Д**дс. Но х Ф 0, так
что х*х > 0, откуда получаем ц = р.. М
Следствие. Собственные значения вещественной симмет-
симметрической матрицы вещественны.
Как мы знаем, для произвольной квадратной матрицы пра-
правые собственные векторы, соответствующие различным соб-
собственным значениям, обязательно линейно независимы (тео-
(теорема 2.3.1). Если матрица эрмитова, то можно утверждать не-
нечто большее.
76 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Теорема 2.9.2. Правые собственные векторы эрмитовой
матрицы, соответствующие различным собственным значениям,
ортогональны.
Доказательство. Пусть X, \i — различные собственные
значения эрмитовой матрицы А, и предположим, что Ах = Хх
и Ау = цу, где х, у Ф 0. Теорема 2.9.1 означает, что ^ веще-
вещественно, так что, беря сопряженные и транспонируя, второе ра-'
венство можем записать в виде у*А = цу*. Умножая это равен-
равенство на х справа и равенство Ах = Хх на у* слева, получаем
у* Ах = Ху*х = иу*х,
откуда (X — ц)у*х = 0. Так как X ф \х и у*х — (у, х), получаем,
что х и у ортогональны.
Теорема 2.9.3. п X п-матрица А эрмитова в том и только-
в том случае, когда {Ах,у) = (х,Ау) для всех x,y^9i>n.
Доказательство. Предположим сначала, что А эрми-
эрмитова. Тогда для любых х, у^'ё'п
(Ах, у) = (АхТ у = х'Ау = (х, Ау).
Наоборот, если дано, что (Ах, у) = (х, Ау) для всех х, у е
^'ё'п, то, так как (Ах,у) = (х,А*у), имеем
(х, (А'-А)у) = 0
для всех х, y^ffn. Нетрудно убедиться в том (упр. 6 из § 2 7)„
что это означает выполнение равенства А* — А = 0, и, следова-
следовательно, А эрмитова. *3
Отметим, что приведенная характеризация эрмитовых мат-
матриц наводит на мысль дать одно общее определение для преоб-
преобразований на произвольном линейном пространстве с внутрен-
внутренним произведением. И действительно, рассмотренное свойство
используется для определения самосопряженных операторов
в теории гильбертовых пространств.
В начальных параграфах этой главы мы некоторое время
занимались исследованием понятия простой матрицы. Мы до-
докажем теперь, что эрмитовы матрицы обязательно простые. Та-
Таким образом, {эрмитовы матрицы порядка п} а {простые мат-
матрицы порядка п} с^^пхп-
Теорема 2.9.4. Каждая эрмитова матрица простая.
Доказательство. Доказательство разбивается на три
отдельных шага. A) Пусть А—эрмитова матрица с собствен-
собственным значением ц. Так как [х вещественно (теорема 2.9.1), то
В = [х/ — А тоже эрмитова. Шаг 1 состоит в доказательстве
того, что JT(В) = Jf (В2).
Сразу же ясно, что из Вх — 0 следует В2х = 0, так что
Ж {В) *= JF (В2). Мы покажем, что на самом деле здесь имеется
2.9. ЭРМИТОВЫ МАТРИЦЫ
77
равенство, доказав, что каждый элемент из Ж {В2) принадлежит
также Jf(В). Из теоремы 2.9.3 получаем, что
(В2х, х) = (Вх, Вх),
так что из В2х = 0 следует {Вх,Вх) = О, следовательно, Вх = О
(аксиома В1 для внутреннего произведения). Таким образом,
Jf (В) = Jf (В2).
B) Предположим, что \х имеет геометрическую кратность
а, так что Jf{B) имеет размерность а. Согласно шагу 1 Jf(B2)
имеет размерность а. Мы покажем, что это означает, что алгеб-
алгебраическая кратность [I равна тоже а.
Рассмотрим некоторый главный минор матрицы В2 по-
порядка р. Его можно записать в виде
В...
ip
а так как В эрмитова, то Bik, — B,ik. Поэтому (в обозначениях
теоремы 2.7.2)
и все главные миноры матрицы В2 неотрицательны. Кроме того,
так как В имеет ранг п — а, В имеет п — а линейно независи-
независимых столбцов, так что (по теореме 2.7.2) существуют положи-
положительные главные миноры у В2 порядкос1, 2, ..., п — а. Из тео-
теоремы 2.1.2 теперь следует, что характеристический многочлен
для В2 имеет вид
lin — Ci\in^+ ... ±сп-ааа,
где с„_а ф 0. Таким образом, В2 имеет нулевое собственное зна-
значение с алгебраической кратностью а, и теорема 2.5.2 тогда
означает, что В должна тоже обладать этим свойством.
C) Так как В = ц1 — А, то мы только что доказали, что
собственное значение ц матрицы А имеет одинаковые кратность
и геометрическую кратность. Но это верно для любого соб-
собственного значения матрицы Л, поэтому, согласно определению
простой матрицы, А простая. Л
Из теоремы 2.4.2 теперь следует, что эрмитова матрица по-
подобна вещественной диагональной матрице ее собственных зна-
значений. На самом деле мы в § 2.4 видели, как, исходя из соб-
собственных векторов данной матрицы, может быть построена
трансформирующая матрица. То, что правые собственные век-
78 ГЛ 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ II СОБСТВЕННЫЕ ВЕКТОРЫ
торы эрмитовой матрицы, соответствующие различным соб-
собственным значениям, ортогональны, позволяет нам в данном
случае сказать о трансформирующей матрице нечто большее.
Но сначала: мы говорим, что матрицы А и В унитарно (орто-
(ортогонально) подобны, если существует такая унитарная (ортого-
(ортогональная) матрица U, что А = U~]BU = U*BU.
Теорема 2.9.5. Эрмитова матрица унитарно подобна диа-
диагональной матрице ее собственных значений.
Доказательство. Пусть ^ — собственное значение крат-
кратности ocj эрмитовой матрицы А порядка п. Теоремы 2.7.1 и 2.9.4
означают, что существуют а, ортонормированных правых соб-
собственных векторов матрицы А, соответствующих jij. Для каж-
каждого отдельного собственного значения матрицы А строим такое
множество векторов. Из теоремы 2.9.2 тогда следует, что полу-
получающееся в результате множество из п векторов хи х2, ..,, хп
может быть предположено ортонормированным. В таком случае
матрица X = \\ хи х2,... ,хп || будет унитарной. Но последняя
матрица как раз совпадает с трансформирующей матрицей X
равенства B.4.4), так что утверждение доказано.
Следствие. Вещественная симметрическая матрица орто-
ортогонально подобна диагональной матрице ее собственных зна-
значений.
Чтобы убедиться в этом, заметим, что в доказательстве тео-
теоремы правые собственные векторы могут быть все выбраны ве-
вещественными. Из определения получаем, что вещественная уни-
унитарная матрица ортогональна.
Упр. 1. Если А и В эрмитовы, то обязательно ли эрмитова
АВ? Если А п В унитарны, то обязательно ли унитарна АВ?
Упр. 2. Найти вещественную ортогональную матрицу X и
диагональную матрицу U, для которых А = XUX', если
1 0 — 4 II
0 5 4 I
— 4 4 3 |'
Упр. 3. Пусть Л —эрмитова матрица с правым собственным
вектором х. соответствующим собственному значению ц. Дока-
Доказать, что 5с — левый собственный вектор с собственным зна-
значением yL.
Упр. 4. Доказать, что если А — эрмитова матрица, то detA—
вещественное число.
Упр. 5. Доказать, что если 1х(Л*Л) = 0, то А = 0.
Упр. 6. Доказать, что если U унитарна и эрмитова, то
IP = /.
Упр. 7. Доказать, что если [х — собственное значение унитар^
ной матрицы, то |[х|= 1.
2.10. УНИТАРНО ПОДОБНЫЕ ПРЕОБРАЗОВАНИЯ 79
*Упр. 8. Доказать, что любую матрицу A^'g'nXn можно од-
однозначно представить в виде А = Н -f- 5, где Н эрмитова и S
косоэрмитова.
*Упр. 9. Пусть А = А* и {х,Ах) = 0 для каждого яе^п.
Доказать, что А = 0.
2.10. Унитарно подобные преобразования
Рассмотрим некоторую матрицу с комплексными собствен-
собственными значениями, которая вместе с тем унитарно подобна диа-
диагональной матрице из ее собственных значений. Очевидно, что
такая матрица не эрмитова. Возникает вопрос: можно ли харак-
характеризовать множество всех матриц в 'S'nXn, которые унитарно
подобны диагональным матрицам из их собственных значений?
Как мы увидим в теореме 2.10.2, это может быть сделано
в весьма изящном виде. Доказательство этой теоремы будет об-
облегчено, однако, если мы сначала получим следующий результат
относительно приведения произвольной матрицы из ?„хп с по-
помощью унитарно подобных преобразований. Эта теорема при-
принадлежит Шуру и Теплицу A910) и имеет важное значение
сама по себе.
Теорема 2.10.1. Любая матрица А^&пХп унитарно по-
подобна верхней треугольной матрице.
Заметим прежде всего, что если А подобна треугольной мат-
матрице Т, то элементы главной диагонали в Т будут собственными
значениями для А. Ибо если с — характеристический многочлен
матрицы А и А = S^TS, то
с (ц) = det (ц/ - Л) = det (ц/ - S~lTS) = det (ц/ - Г)=Ц (ц -у.
}—1
п
Так как одновременно с(р.) == XX (м- — Ц/)> т0 требуемое утверж-
утверждение доказано.
Доказательство. A) Теорема доказывается индукцией
по п. Предположим сначала, что п = 2 и А имеет собственное
значение ц\ с соответствующим ему правым собственным векто-
вектором х\, для которого х*х{ = 1. Мы строим 2Х2-матрицу U, пер-
первый столбец которой совпадает с Х\ и второй столбец выби-
выбирается так, чтобы U была унитарна. Тогда
Л*ал — \Xl \a\\y y II — X[AXl *'Л*
или — * Л || Х\Х21|— * *
11 ^ 1 II Xn/i.X I Xy/iX
Так как Ах{ = ix1xl и х*1х1 = 0, то х*2Ах{ = 0. Следовательно,.
U*AU — верхняя треугольная матрица, так что А = UTU* и тео-
теорема верна в случае п = 2.
80
ГЛ. ?. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
B) Мы покажем теперь, что если теорема верна для некото-
некоторого п ^ 2, то она с необходимостью верна для п-\-\. Пусть
опять х\ — правый собственный вектор матрицы А с собствен-
собственным значением \i\, А порядка п -f 1 и x\xl = \. Построим мно-
множество из п векторов аь а2 а„ порядка п-\- 1, для которого
Х\, О], а.2, ..., а„ ортонормированы, т. е. матрица 0= || *, а, а2...
... а„ || унитарна. (Заметим, что для такого построения всегда
может быть использован процесс Грама — Шмидта.) Будем
иметь тогда
U*AU =
*\Aa\ ••• V4
а*[Ах1
апАх\
где В — п X n-матрица. Но Axt = \ilxj и a'jxi — 0 для /=1,2, ...
..., п означают, что а*.Ах{ = 0, у =1,2, ..., л, так что при
некотором векторе 4е?„
Hi
о
По предположению индукции существует унитарная мат-
матрица V порядка п, для которой V*BV — верхняя треугольная.
Определим унитарную матрицу U\ порядка п-\- 1 как
?/,=
1 0'
0 V
и заметим, что произведение UU\ тоже унитарно. Как легко
видеть,
а так как V*BV — верхняя треугольная, то унитарная матрица
UUi приводит А к верхнему треугольному виду. ^
Эга георема приводит ко второму, изящному доказательству
теоремы 2.9.5. Ибо если U*AU = Т — треугольная матрица и
А —А*, то Т = Т*. Но единственными матрицами, для которых
это верно, являются диагональные матрицы, откуда и следует
результат.
Мы введем теперь еще один важный тип матриц. Матрица
А е'ё'пХп нормальна, если АА* = А"А, г. е. если А коммутирует
со своей сопряженной транспонированной. Без труда убеж-
убеждаемся в том, что все унитарные, эрмитовы, косоэрмитовы и диа-
2.10. УНИТАРНО ПОДОБНЫЕ ПРЕОБРАЗОВАНИЯ 81
тональные матрицы будут также нормальными. Значение нор-
нормальных матриц выяснено в следующем результате, который
отвечает на поставленный в начале этого параграфа вопрос.
Теорема 2.10.2. Некоторая матрица из ^„хп унитарно
подобна диагональной матрице из своих собственных значений
в том и только в том случае, когда она нормальна.
Доказательство. Предположим сначала, что суще-
существуют унитарная матрица U и диагональная матрица D, для
которых А = UDU*. Тогда
АА* = (UDU*) (UDU*) = UDDIT = UDDU* = (UDU*) (UDU*) = А* А,
так что А обязательно нормальна.
Наоборот, предположим, что А нормальна, и применим пре-
предыдущую теорему. Итак, существуют унитарная матрица U
и верхняя треугольная матрица Т, для которых А = UTU*. Без
труда убеждаемся в том, что АА* = А*А 4=> *) ТТ* = Т*Т. Ис-
Использование элементов A,1) последнего равенства дает
I'i.I2 + I'i2I2+ ••• + I Л» I2-!'по-
I2-!'последовательно, tij = O для /' = 2, 3, ..., п. Элементы B.2) ра-
равенства ТТ* = Т*Т приводят к
Так как уже доказано, что t\2 = 0, отсюда следует t2j = 0 для
I — 3, 4, ..., п. Продолжая это рассуждение, находим, что
tjh = 0 всегда, когда / ф k и 1 ^ /, k ^ п. Таким образом, Т
должна быть диагональной матрицей и А = UTU*.
Заметим теперь, что нормальные матрицы простые. В част-
частности, мы доказали, что эрмитовы матрицы простые и тем са-
самым дублировали результат теоремы 2.9.4. Следует заметить,
что обобщена также теорема 2.9.2. В самом деле, мы можем те-
теперь сказать, что некоторая матрица из 'ё'пХп имеет множество
из п ортонормированных правых собственных векторов <=?> эта
матрица нормальная.
Упр. 1. Показать, что если А нормальная, то такова же
и ц/ — А.
Упр. 2. Доказать, что х — правый собственный вектор нор-
нормальной матрицы А <=> х — правый собственный вектор для А*.
Упр. 3. Построить пример:
(i) нормальной матрицы, которая не унитарна, не эрмитова,
не косоэрмитова и не диагональна;
(ii) простой матрицы, которая не нормальна.
*) Знак ФФ используется как сокращение для выражения €в гом и
»олько в том случае, когда». — Прим. ред.
82 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Упр. 4. Доказать, что нормальные матрицы унитарно подоб-
подобны 4=> они имеют одинаковые собственные значения (с соот-
соответствующими кратностями).
2.11. Идемпотентные матрицы и проекции
Прежде чем детально исследовать строение идемпотентных
матриц, полезно ввести некоторые геометрические понятия в
изучение линейных пространств. Мы будем говорить, что линей-
линейное пространство S представляется в виде прямой суммы под-
подпространств 3?\ и 3?2, и писать S = S\ ф S2, если удовлетво-
удовлетворяются следующие условия:
(i) ^ = ги 2%<=2\
(ii) для каждого х <ее S существуют такие Х\ <ее 3?\ ил2е 2*2»
что х = jti + х2;
(iii) если х <ее 3?\ hjcg S2, то х = 0.
Следует заметить, что в условии (iii) утверждается, что
единственным вектором из 3?, принадлежащим одновременно
как S\, так и 3?2, будет нулевой вектор, и, в свою очередь, это
означает, что описанное в (ii) разложение единственно. Ибо
если х е 9; и
X = Ж, + Х2 = У, + у2,
где *i, JigS'i и *2) Уг^&г, то де, — yi = у2 — х2. Но дс, — yi e
е i?i и t/2 — *2 е 5^2, так что (iii) означает, что yi = деь у2 = де2.
При ^ = S\ ф ^2 мы будем говорить про i?i и S2, что они
дополнительные, или что они являются дополнениями, друг к
другу. Если, в частности, мы имеем также, что (*, у) = 0 для
каждого x^.S\ и каждого jfE^, то мы говорим, что i?i и
&ч — ортогональные дополнения друг к другу.
Упр. 1. Доказать, что если S = 3?\ © 3?2, то размерность
& равна сумме размерностей 3?\ и 3?2.
Теорема 2.11.1. Если Р идемпотентна, то
(а) / — Р идемпотентна;
б) ЯG — Р) = Jf(P);
(в) /ГA — Р) = ЩР).
Доказательство. Для части (а) заметим, что (/ — РJ=
:==/_2Р + ^>2 иР2 = Р означают, что (/ — РJ = / — Р.
Если лей(/ — Р), то существует такой уеЕ^п, что
X==(j — P)y. Следовательно, Рх = P(I — P)y= (P — Р2)у = 0.
Поэтому ж е ./Г (Р;I, так что М (I — Р) s JC (Р).
Наоборот, если x^Jf(P), то Рде = 0, так что (/ — Р)х = х*
Следовательно, x<=M(I — P), так что Jf(P)^M(I — Р). По-
Поэтому часть (б) доказана. Подобное же рассуждение приводит
к части (в). М
Лемма. Если Р идемпотентна, то <<РП = ^1°(Р)ф 91{Р).
2.11. ПДЕМПОТЕНТНЫЕ МАТРИЦЫ И ПРОЕКЦИИ 83
Доказательство. Аксиома (i) для прямой суммы, оче-
очевидно, удовлетворяется. Для любого х е ЧРп можно записать
х = X]-\~ хг, где Х\ = (/ — Р)х и х2 = Рх. Таким образом, х\ е
^5?(/ — P) = Jf(P) по части (б) предыдущей теоремы и
лс2е52(Р). Поэтому выполняется аксиома (ii).
Наконец, если х eJS(P) и х ^Jf(P), то по части (в) послед-
последней теоремы имеем (/ — Р)х = 0 и Рх = 0. Следовательно,
jf = 0, так что все аксиомы для прямой суммы выполняются. ^
Теорема 2.11.2. Идемпотентная матрица проста.
Доказательство. Как мы видели, собственные значения
идемпотентной матрицы все равны либо 1, либо 0 (упр. 4 из
§ 2.5). Отсюда следует, что правые собственные векторы мат-
матрицы Р все принадлежат либо Jf(P), либо JC{1 — Р). Так как
JC{I — Р) = 52 (Р), результат леммы означает, что Jf{P)®
©.yf(/ — Р) = <&п и, следовательно, правые собственные век-
векторы матрицы R должны порождать ^Рп. Поэтому Р проггя. -^
Следствие. Р — идемпотентная матрица ранга г <=> сг/-
ществуют такие квазибиортогональные системы уи у2, ..., Уг «
Ль *2, • • •, хг, что
P=?x,g'r
Доказательство. Если Р имеет этот вид, то ранг по
столбцам Р равен, очевидно, г, и, используя свойство квазибиор-
квазибиортогональности, получаем
Z *х) = Z Ж/ Z (у;*Л) У; = ± х^=р.
Наоборот, так как идемпотентная матрица проста, то при-
применение теоремы 2.5.1 с f(P)=P показывает, что Р должна
иметь написанный выше вид. Эта теорема также показывает, что
элементы х и у — это соответственно правые и левые собствен-
собственные векторы с собственным значением 1. ^
Важным является случай, когда матрица Р идемпотентна и
эрмитова. В этом случае можно выбрать ортонормированное
множество правых собственных векторов для Р и соответствую-
соответствующие левые собственные векторы будут просто комплексно сопря-
сопряженными к правым собственным векторам. Таким образом, по-
получаем
г
р = Z *,*;
и для любого х е "<?„
Рх = Z ж
г
= Z (х х) ж.,
81 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
причем каждый член в этой сумме является проекцией вектора
х на правый собственный вектор. Мы поэтому называем мат-
матрицу Р проекцией, если Р идемпотентна и эрмитова, и будем
говорить, что Р — проекция на пространство, порожденное
хи ..., Хт, т. е. на Я(Р) = Л(/ — Р).
Будет поучительно изложить следующий более прямой под-
подход к проекциям. Предположим, что задано произвольное под-'
пространство 9? с базисом /,, f2, ..., fi, и мы хотим найти проек-
проекцию на S. Определим и X ^-матрицу F = ||/i/2 ... fk\\\ тогда все
элементы в 3" записываются в виде Fx при некотором х е Wk.
Для данного ае'Э',, нам следует найти такой вектор FxeS7,
который с наибольшим правом может быть назван проекцией
вектора а на 2'.
Мы определяем Fx требованием, чтобы а — Fx был ортогона-
ортогонален к каждому элементу из 9?. Это будет так, если а — Fx
ортогонален к каждому базисному вектору. Таким образом,
должно быть
</,, a-Fx) = rt(a-Fx) = 0, /=1,2, .... k,
что эквивалентно матричному уравнению
Г (a — Fx) = 0.
Решая это уравнение относительно х, получаем х = (F*F)-]F*a,
заметив, что обратная матрица существует, так как F*F — гра-
миан линейно независимых векторов (теорема 2.7.2). Если
Р — матрица этого проектирования, то мы хотим, чтобы было
(Y1 F*a,
т. е.
P = f(frr'r. B.11.1)
Таким образом, мы определили проектирующую матрицу в тер-
терминах произвольного базиса для S7. Читатель без труда прове-
проверит, что Р идемпотентна и эрмитова.
Однако, что особенно интересно, так это то, что Р не зависит
от выбора базисных векторов для 3?. Чтобы убедиться в этом,
заметим, что если X — матрица другого множества базисных
векторов, то существует такая неособая feX ^-матрица М, что
F = ХМ, откуда
р = ХМ {М*Х*ХМ)~Х М*Х* =
= ХМ (ЛГ1 (Х*Х)~{ (М*)~1) М*Х* =
Следовательно, мы получаем ту же самую проекцию Р, каков
бы ни был выбор базисных векторов для S. В частности, если
2.12. ЭРМИТОВЫ И КВАДРАТИЧНЫЕ ФОРМЫ 8!>
выбрать ортонормированныи базис для 3?, то Х*Х = / и
P = XX*=Z x,x*
и мы возвращаемся к виду для матрицы Р, который мы имели
ранее.
Упр. 2. Показать, что сопутствующие матрицы для эрмито-
эрмитовой матрицы являются проекциями.
Упр. 3. (i) Показать, что если 3? = 2?1 © 3?2 и 2? © 3?ъ
определены, то можно записать S © &% = &\ © &г © 3?з, не
опасаясь неопределенности.
(ii) Если &\, 3?2, ••., 3?и— правые собственные простран-
пространства, соответствующие различным собственным значениям про-
простой п X «-матрицы, то показать, что fn = 5'i©2'2©.-. ©-2V
Показать также, что если матрица эрмитова, то 2", и 3?ь
(i Ф- k) — ортогональные дополнения.
*Упр. 4. Пусть 3S — линейное пространство размерности п
и подпространства 3?\, S2 в S имеют размерности щ, п2 соот-
соответственно, где п\-\-п-2> п. Показать, что существует ненулевой
элемент в 3?, принадлежащий как &\, так и 3?2-
Упр. 5. Если Р — проекция, то показать, что в лемме к тео-
теореме 2.11.2 Jf(P) и 5?(Я)—ортогональные дополнения.
2.12. Эрмитовы и квадратичные формы
Предположим, что Л—эрмитова п X «-матрица, и рассмот-
рассмотрим функцию h(x), определенную для всех x^Wn no формуле
п
h (х) = х*Ах = 2
На первый взгляд h появляется как функция со значениями в
области комплексных чисел, но мы утверждаем, что h на самом
деле — вещественнозначная функция. Чтобы убедиться в этом,
заметим, что h* — Я, так что, так как А эрмитова,
h = (х'Ах)* = х'А*х = х*Ах = h.
Таким образом, для любого х имеем h = Я, а поэтому h веще-
вещественна. Введенная функция h называется эрмитовой формой
от Х\, лг2, ..., хп и А называется матрицей эрмитовой формы
(см. ниже упр. 1).
Очень важным является частный случай, когда А — веще-
вещественная и симметрическая матрица. В этом случае мы предпо-
предполагаем х принадлежащим 91п и называем
п
q (х) = х'Ах = 2
86 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
квадратичной формой от хи ::2, ¦ ¦ ¦, х„. Таким образом, квадра-
квадратичная форма — вещественнозначная функция, определенная
на Sin-
Предположим, что мы рассматриваем х\, х2, ..., х„ как ко-
координаты в «-мерном пространстве, и путь Т—некоторая неосо-
неособая матрица порядка п. Можно сказать, что уравнение х = Ту,
или у = Т~1х, определяет новую систему координат у\, у2, ...
..., уп в том же пространстве. Имеем тогда
А (ж) = А (Гу) = у'(Г Л Л
и, так как Т*АТ эрмитова, h(Ty) будет эрмитовой формой от
У\, У г, ¦¦•-, Уп- Матрица новой формы Т*АТ называется кон-
конгруэнтным преобразованием матрицы А. Нашей ближайшей це-
целью будет исследование таких систем координат, для которых
п
h(Ty) имеет вид 2]сг|г/;|2. Другими словами, мы должны ис-
i = \
следовать те конгруэнтные преобразования Т*АТ матрицы А
(если они вообще существуют), для которых Т*АТ приводится
к диагональной матрице.
В случае квадратичных форм мы разыскиваем вещественные
конгруэнтные преобразования Т'АТ матрицы А, для которых
ТАТ — диагональная матрица.
В нашем распоряжении уже имеется способ проведения не-
необходимой редукции, хотя он не предлагается как практически
полезный. Он содержится в следующей теореме.
Теорема 2.12.1. Если h — эрмитова форма, то существуют
такие вещественная матрица U = diag{|ib ..., цп} и унитарная
матрица X, что, записывая у = Х*х, будем иметь
h(x) = h(Xy)=Z \i,\y,?.
Доказательство. Пусть А — матрица эрмитовой формы
h. Пусть Л" —унитарная матрица правых собственных векторов
матрицы А, как она построена в теореме 2.9.5, и ци ц2, • • •, Цп —
собственные значения матрицы, которые, как мы знаем, веще-
вещественны. Если тогда х = Ху, то мы имеем Х*АХ = U и
h (х) = х'Ах = уХ*АХу = fUy = t H/1 У112- <
Таким образом, эрмитову форму можно привести к сумме
¦квадратов при помощи унитарного конгруэнтного преобразова-
преобразования и, соответственно, квадратичную форму можно всегда при-
привести к сумме квадратов при помощи вещественного ортогональ-
лого конгруэнтного преобразования. Однако эти преобразования
2.12. ЭРМИТОВЫ И КВАДРАТИЧНЫЕ ФОРМЫ
87
довольно специальные, и мы сейчас покажем, что существует
намного более широкий класс конгруэнтных преобразований,
который может быть использован в приведении эрмитовой (или
квадратичной) формы к сумме квадратов.
Прежде чем приступить к исследованию этого вопроса, по-
полезно ввести еще одно множество матриц. Напомним, что еди-
единичный вектор ej в Wn — это вектор с 1 на /-м месте и 0 на всех
других местах. Перестановочная матрица — это п X «-матрица
вида
t еЧеЧ • • ¦ ein\\'
где г" 1, i ... in — перестановка чисел 1,2, ..., п. Если А^^пхпу
то отметим результат умножения справа матрицы А на Р. Для
/-го столбца произведения имеем
Таким образом,
и умножение матрицы А справа на Р просто переставляет столб-
столбцы в А. Аналогичный результат имеет место и для строк мат-
матрицы А при умножении А слева на Р', ибо
Р'А =
' Упр. 1. Доказать, что (эрмитова) матрица эрмитовой формы
единственна. (Указание. Использовать упр. 9 из § 2.9.)
*Упр. 2. Показать, что если Р — перестановочная матрица и
D = diagjdi, d2, ..., dn), то Р'Р = I и
г
ч
А =
К*
X*
...,dln).
Мы покажем теперь, как построить некоторое семейство мат-
матриц, каждая из которых может быть использована в приведении
заданной эрмитовой формы. Если А — матрица этой формы, то
предположим, что собственные значения А расположены в по-
порядке их невозрастания и что различными собственными значе-
значениями будут hi, H2, ¦ ¦ ¦, Hs с кратностями аь а2, ..., as соответ-
соответственно. Мы можем записать диагональную матрицу из соб-
собственных значений матрицы А в виде
О
U =
ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Пусть теперь X—унитарная матрица правых собственных век-
векторов, расположение которых соответствует зафиксированному
выше порядку собственных векторов матрицы А. Наше семей-
семейство преобразующих матриц будет построено при помощи рас-
рассмотрения преобразований матрицы X, которые сохраняют диа-
диагональный вид конгруэнтного преобразования Х*АХ. Рассмот-
Рассмотрим следующий план.
Пусть Vit V2, ..., Vs — произвольные унитарные матрицы
порядков cci, а2, ¦ ¦ ., ocs соответственно; Du D2, ¦ ¦ ¦ , Ds— произ-
произвольные неособые диагональные матрицы тех же порядков и
Р — произвольная перестановочная матрица. Если определить
xD, О
V2D2
I — Л
О
Р,
то конгруэнтное преобразование Y*AY приводит А к диагональ-
диагональному виду.
Для доказательства этого заметим, что
y*AY = Р'
D{V\
О
Х*АХ
V,D,
о
VSDS
р =
— Р'
D,V\
= P'
p =
P — диагональная матрица,
причем на последнем шаге использовано упр. 2.
Таким образом, имеется широкий класс конгруэнтных пре-
преобразований, которые могут быть использованы при приведении
эрмитовой формы. Возникает вопрос о том, существуют ли
инварианты, общие множеству всех приведенных форм. Первый
результат подсказывает вид только что найденных диагональ-
диагональных матриц Y*AY. Мы формулируем результат для матрицы
некоторой эрмитовой формы и надеемся, что значение этого
результата для самих форм очевидно.
2.12. ЭРМИТОВЫ И КВАДРАТИЧНЫЕ ФОРМЫ 89
Теорема 2.12.2. Пусть А—некоторая эрмитова матрица,
имеющая р и только р положительных собственных значений
и ранг г. Если тогда V — неособая матрица, для которой
V*AV = diag{du .... dn}=D, то:
(i) существует п — г и только п— г чисел dj, равных нулю;
(и) существует р и только р чисел dj, которые положи-
положительны.
Доказательство. 1. Так как V неособая и V*AV = D,
мы убеждаемся в том (по упр. 3 из § 1.15), что ранг матрицы D
равен г, что дает результат (i).
2. Для части (ii) мы сначала строим перестановочную мат-
матрицу Р, для которой P'DP = D\ = diag{6i,62, ..., 8п), где диа-
диагональные элементы будут числами du ..., dn, переставленными
так, чтобы они шли в порядке невозрастания. Таким образом,
6i ^ б2 ^ ... ^б„. Если определить теперь W=VP, то
det W Ф 0 и V*A V = D означает, что
W*AW = D{. B.12.1)
Если предположить, что 6|, 62, ..., 6q >» 0 и 6q+\ ^ 0, то мы
должны доказать, что q = р.
Нам известно также, что если щ ^ ц2 ^ ••• ^ \Уп — соб-
собственные значения матрицы А и t/ = diag{^xi, ..., цп), то су-
существует унитарная матрица X, для которой
X*AX = U B.12.2)
и, кроме того, |хь (х2, ..., |хР >¦ 0 и [ip+i ^ О-
3. Пусть Xj = Xt} и Wj=W»j, / = 1,2 п. Если S —
пространство, порожденное Х\, хг, ¦¦¦, хР) то его размерность
d{S) равна р. Если х ^ 3? и х Ф 0, то можно записать-
X = Z ajXj И
х'Ах =
Z аЛ) = Z | а, |2 Ц/ > О,
так как равенство B.12.2) означает, что x*.Axk = nkx*xk = nk6jk.
Пусть теперь 91 — пространство, порожденное wq+u ..., wn.
Имеем d(9?) = n — q. Если уфО и y^R, то, используя равен-
равенство B.12.1), получаем подобно предыдущему, что
У*Ау < 0.
Но dE2) + dC?) — n-\-(p — q), так что при р > q долже»
существовать вектор z ф 0, который принадлежит как 91, так и
3? (упр. 4 из § 2.11). Для такого вектора мы имели бы z*Az > О-
и z*Az ^ 0, что невозможно. Следовательно, р ^ q.
90 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
4. Если &\, 2&\ — пространства, порожденные W\, ...,wq и
Jfp+i, ..., хп соответственно, то можно показать подобно пре-
предыдущему, что р ^ q. Следовательно, q = р. -^
Легко видеть, что то же самое рассуждение и те же заклю-
заключения выполняются в случае, когда А вещественная и симмет-
симметрическая и V вещественная и неособая. Таким образом, числа г
и р будут инвариантами эрмитовой (квадратичной) формы при,
неособых (вещественных неособых) преобразованиях координат.
Этот факт известен как закон инерции Сильвестра и инварианты
г, р и 2р — г (разность между числом положительных и числом
отрицательных членов в приведенной форме) известны как ранг,
индекс и сигнатура формы соответственно.
2.13. Метод приведения Лагранжа
В последнем параграфе было доказано существование неко-
некоторых инвариантов, соответствующих данной эрмитовой или
квадратичной форме, но в нашем распоряжении нет в общем
случае полезного способа для нахождения этих инвариантов или
приведенных форм, кроме как вычислять все собственные зна-
значения и собственные векторы матрицы формы. Мы опишем
теперь принадлежащий Лагранжу метод для вычисления при-
приведенной формы.
Начиная с этого места, мы для простоты ограничим наше
рассмотрение квадратичными формами. Необходимые для рас-
распространения результатов на эрмитовы формы изменения пре-
предоставляется провести в качестве упражнения читателю.
Заметим прежде всего, что так как А симметрическая, то
можем записать
= .? aijxixj =
аппх\
Случай 1. Предположим, что не все из коэффициентов
аи, а22, • •¦, впп равны нулю. Тогда, производя перенумерацию
переменных и коэффициентов, если это необходимо, можем счи-
считать, что а\\ ф 0, и записать
п
q (х) = апх\ + 2aI2*,;t2 + ... + 2а1пх1хп + ?^ aijxixj =
2.13. МЕТОД ПРИВЕДЕНИЯ ЛАГРАНЖА 91
где |' = |U2*3 ••• AnII и <7i — квадратичная форма. Продолжая
«дополнение до квадрата», получаем
где «72 — другая квадратичная форма от х2, ..., *„. Таким
образом, неособое преобразование координат, определенное как
г/, = хх + ^j— х2 + ... + -^- *п, #2 = *2 уп = *„,
приводит <7 к виду
di^i +Я2(У2 У») B.13.1)
(где d1=an).
Случай 2. Если Дц = ... = аПп = 0, то рассмотрим ко-
коэффициент ац ф О с t =^= /. Опять, без потери общности, можем
предположить, что ai2 не равен нулю. В этом случае произве-
произведем конгруэнтное преобразование матрицы Л, задаваемое преоб-
преобразованием координат
El=*b Ег==-)С2 — ХЬ Ез = -"С3> •••. En—Я/г-
Легко видеть, что определяемая преобразованной матрицей
форма содержит член Щ. Теперь можно применить способ, опи-
описанный в случае 1, для приведения q к виду B.13.1).
Таким образом, мы доказали, что любую данную квадратич-
квадратичную форму q, определенную на 52П, можно привести к виду
B.13.1). Применяя тот же самый прием к q2(y2, •¦•, уп), при-
приводим ее к виду d2z\ + q3 (z3, ..., гп). Тогда q = d^][-\- d2z\ +
+ q3(z3, ..., га), где 2,= ух.
Мы можем, очевидно, закончить приведение квадратичной
формы q самое большее за п— 1 таких шагов. Конечный эффект
последовательных неособых преобразований эквивалентен неко-
некоторому одному неособому преобразованию первоначальных ко-
координат *ь *2, ..., хп.
Упр. 1. Найти ранг, индекс и сигнатуру квадратичной формы
q (х) = 2*,*2 + 2*2*з + xf,
найти также преобразование координат, которое приводит q к
сумме квадратов.
92 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Решение. Производя сначала преобразование
(О У\ = х3, у2 = х2, у3 = хь
получаем
Я = (у'1 + 2угу2) + 2у2у3 = (г/, + y2f - у\ + 2г/2г/3.
Положив теперь
/::\ ~ ,. i ,, ~ ,, у ,.
\11/ л,\ у\ \^ t/2, /С2 ?/2, 3 '— с/3,
будем иметь
где
(Ш) Ш, = 2,, ©а = 22 — 23, ПK = 23.
Таким образом, ранг г = 3, индекс р = 2 и сигнатура
2р — а" = 1. Приводящее к сумме квадратов преобразование по-
получается комбинированием (i), (ii) и (iii) в виде
Таким образом, х1 = да3, x2 = w->-\-Wj, и x$ = W\ — w2 — w3, или
О 0 111
ж= о 1 1L,.
Упр. 2. Найти ранг, индекс и сигнатуру следующих квадра-
квадратичных форм и преобразования, приводящие их к сумме квад-
квадратов:
(„\ 1)у2 / 1 r v ± f V •
(В) &Х\Хо ~"~ ^3 ' I" лтлл ^~" 3 { ^2 4 ~~~ ^лдЛ4»
*Упр. 3. Рассмотрим квадратичную форму q, определенную
на Щ.
(i) Показать, что преобразованию координат х = Ту, где
Т — вещественная ортогональная матрица, соответствует неко-
некоторый поворот осей координат в Я3.
(ii) Множество точек в 523 (если оно существует), удовлетво-
удовлетворяющих уравнению q{x\, х2, а;3)=1, называется центральной
квадрикой. Показать, что при подходящих новых координатных
2.i4. ОПРЕДЕЛЕННЫЕ МАТРИЦЫ 93
осях, получаемых из прежних поворотом, уравнение квадрики
приводится к виду
Новые координатные оси называются главными осями квадрики.
{Заметим, что вид квадрики определяется относительными ве-
величинами и знаками чисел щ, Ц2, Из-)
Упр. 4. Исследовать вид центральной квадрики, уравнение
которой
Зл| + Зл:~ — %х2хз — ^хэх\ — 4лг,л:2 = 1.
2» 14. Определенные матрицы
Как и в предыдущем параграфе, мы ограничимся рассмотре-
рассмотрением квадратичных форм, хотя вводимые определения и полу-
получаемые результаты опять без труда могут быть распространены
на эрмитовы формы.
Нас интересуют здесь два семейства матриц, определяемых
¦следующим образом. Вещественная симметрическая матрица А
порядка п называется положительно определенной, если
х'Ах > 0 для всех ненулевых векторов х i= 9tn- Если х'Ах ^ О
для всех х е 5?п и х'Ах — 0 для некоторого ненулевого х е 31п,
то А называется неотрицательно определенной. В обоих случаях
мы можем также сказать, что квадратичная форма, задаваемая
матрицей А, положительно определенная или неотрицательно
определенная соответственно. Заметим, что под определенной
матрицей понимается любая из матриц двух указанных выше
семейств. Мы могли бы также дать определения, включающие
случаи, когда х'Ах ^ 0 для всех хев&п, но эту возможность
нам нет необходимости рассматривать.
Следует также заметить, что положительно определенная
матрица обязательно неособая, ибо если матрица особая, то су-
существует вектор х ^ф 0, для которого Ах = 0 и, следовательно,
{х, Ах) = 0. Эта возможность исключена определением положи-
положительно определенной матрицы.
Теорема 2.14.1*). Вещественная симметрическая пу^п-
матрица А будет определенной ранга г ^ п в том и только в
том случае, когда А имеет г положительных собственных значе-
значений и п — г собственных значений, равных нулю.
*) В оригинале эта теорема сформулирована следующим образом:
«л X «-матрица А будет определенной ранга г ^ п в том и только в том
¦случае, когда А вещественная и симметрическая и имеет г положительных
¦собственных значений и п — г собственных значений, равных нулю». Здесь
лриводигся ее исправленная формулировка. — Прим. перев.
94 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Доказательство. Всюду в этой теореме и в следующей
U будет обозначать вещественную диагональную матрицу из
собственных значений матрицы А, и X будет обозначать веще-
вещественную ортогональную матрицу, для которой А = XUX' (след-
(следствие теоремы 2.9.5). Так как ортогональная матрица обяза-
обязательно неособая, то сразу же получаем, что ранг U равен г,
рангу А. Отсюда следует, что п — г и только п — г диагональных
элементов U равны нулю и, следовательно, что А имеет ровно
п — г собственных значений, равных нулю.
Если ц — некоторое собственное значение матрицы А, то, как
известно, существует такой вектор х Ф О, что Ах = цх, откуда
получаем, что
х'Ах
V
чак как х'х = {х, х) > 0. Если теперь А — определенная мат-
матрица, то, очевидно, ц^О и г ненулевых собственных значений
должны быть все положительны.
Наоборот, предположим, что А имеет собственные значения
ць ..., цг > 0 и цг+1 = ... = \in = 0. Тогда равенство А = ХАХГ
означает, что ранг матрицы А равен г.
Если столбцы в X — это собственные векторы х\, х2, ..., хп,
то можно написать Л = 2] (i.G где Gi = x,x'. (теорема 2.5.1)»
/=i ' ' ' ' '
Поэтому для любого ненулевого х е 5?„
х'Ах = ? 1х! (x'xt) (*;*) = ? ц, («;*)* > о.
Кроме того, если г<^п, то x'r+lAxr+, = 0 и А поэтому не-
неотрицательно определенная. Если г = п, то х^х Ф 0 по крайней
мере для одного /, так что х'Ах > 0 и А положительно опреде-
определенная, чем доказательство завершается.
В частности, следует заметить, что вещественная симметриче-
симметрическая матрица А положительно определенная в том и только
в том случае, когда все ее собственные значения положительны.
Упр. 1. Для каких вещественных значений X следующие мат-
матрицы положительно определены:
1
я
X
X
1
я
X
X
1
1
\\х
1
1
1
я
1
1
Упр. 2. Доказать, что вещественная проекция, не являю-
являющаяся единичной матрицей, должна быть неотрицательно опре-
определенной.
2.14. ОПРЕДЕЛЕННЫЕ МАТРИЦЫ 95
Упр. 3. Если М — вещественная проекция и k\, k2 не равны
нулю, то доказать, что матрица
положительно определена.
Упр. 4. Сформулировать условие на а, Ь, с, при выполнении
которого квадратичная форма ах2 + Ьху + су2 положительно
определенная.
Упр. 5. Доказать, что если Л— вещественная симметриче-
симметрическая матрица, то матрица / -\- еЛ положительно определена для
достаточно малых вещественных чисел е.
Теорема 2.14.2. Матрица А — определенная матрица ранга
г ФФ существует такая определенная матрица Л1'2 ранга г, что
(А'/»J== А.
Доказательство. Пусть сначала А определенная. Тогда
по предыдущей теореме собственные значения |i1? ..., \хп мат-
матрицы Л неотрицательны. Определим матрицу U'l» как diag |ц'/2,
\х'12, ..., ц^2}, где в каждом случае берется неотрицатель-
неотрицательный квадратный корень. Положив Л''2 = XU'l'X', сразу же полу-
получаем, что Л'/а — вещественная симметрическая матрица ранга г.
Кроме того,
(Л1/.J = XUWXW'X' = XUX' = Л.
Наоборот, если задана определенная матрица Л'/г ранга г,
для которой (Л''2J = Л, то Л1'2 имеет г положительных собствен-
собственных значений и п — г нулевых собственных значений. Теорема
2.5.2 означает, что собственные значения матрицы А имеют те
же самые свойства и результат следует из теоремы 2.14.1. А
Мы можем изложить теперь новый подход к определенным
матрицам и характеризовать их свойствами определителей.
Прежде всего имеет место
Теорема 2.14.3. Вещественная симметрическая матрица А
положительно определена <=> все ее главные миноры положи-
положительны.
Доказательство. Предположим, что Л положительно
определена. Тогда Л неособая и матрица А'^ из предыдущей
теоремы тоже неособая, так как мы, очевидно, имеем (det Л1/2J=
= detA. Пусть столбцы матрицы А'1' — это йь й2, ..., ап. Так
как А'!' вещественная и симметрическая, мы имеем тогда для
любого главного минора матрицы А
по теореме 2.7.2. Это то, что мы должны были доказать.
96
ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Наоборот, предположим, что А вещественная и симметриче-
симметрическая и все ее главные миноры положительны. Заметим, что од-
одним из таких миноров будет и det Л. Пусть характеристический
многочлен матрицы А — это
с(ц) = ц«-с,ц—' + ... + (-\)пса,
где, согласно теореме 2.1.2, сг есть сумма всех главных миноров
порядка г для г= 1, 2, ..., п. Таким образом, сг > 0 для каж-
каждого г. В частности, сп > 0, а поэтому все собственные значения
должны быть отличны от нуля. Если теперь |х < О, то ясно, что
каждый член в с(ц) одного и того же знака, а поэтому с(\к)Ф 0.
Следовательно, собственные значения матрицы должны быть
положительны. Из теоремы 2.14.1 теперь следует, что А положи-
положительно определена.
На практике нам не хотелось бы испробовать все главные
миноры для того, чтобы узнать, будет ли некоторая матрица
положительно определенной, и этого можно избежать при по-
помощи следующего более сильного результата, который с вычис-
вычислительной точки зрения применять не так уже сложно.
Теорема 2.14.4. Вещественная симметрическая п X п-мат-
рица А будет положительно определенной Ф=> ведущие главные
миноры
*СУ<\ I) Ч! ;:::
положительны.
Используя предыдущую теорему, мы должны лишь доказать,
что если ведущие главные миноры положительны, то А положи-
положительно определенная. Прямое доказательство этого результата
представляет некоторые трудности. Читателю предоставляется
возможность либо найти такое доказательство, либо развить
доказательство по индукции, намечаемое в следующей последо-
последовательности из четырех упражнений.
Упр. 6. Пусть Cft((i), k=l, 2 п, — характеристический
многочлен блока
*12
•*lfe
матрицы А и
—
/
ak+l ak+l, k+l
2.14. ОПРЕДЕЛЕННЫЕ МАТРИЦЫ 97
Используя упр. 13 на стр. 53, доказать, что если ц не является
собственным значением для Ah, то
ск+1 (ц) = ck (ц) {(ц - afc+li ft+1) - a'k+x (ц/ - Л,) a,+I}.
Упр. 7. (i) Пусть ц,1, ..., us — собственные значения блока
<4ft; если тогда с'кЫ{) обозначает dchld\x,, вычисленную при
A = ць то показать, что
<Ы = П(^-^/)-
(ii) Используя упр. 3 из § 2.5, доказать, что существуют
такие вещественные числа <*), ..., ak, что
k k
ck+l (ц) = (l* - aft+1> ft+I) ck (ц) - g aj П (I* - H;)
и, следовательно,
Упр. 8. Предположим, что Ак положительно определенная,
что
=0, /= 1, 2, ..., г,
и что 0 < ,u, < (i2 < • • • < Иг- Пусть
*) Для положительно определенной матрицы
1 0 1 II
0 10
1 0 2 I
имеем Аг = / и |ii = 1, ц2 = 1. Как нетрудно видеть, тогда c3(ni) =
= сз(Ц2)=0 и я(ц) = (ц — IJ. Но в то же время с3(ц) =
= (ц—1) [(ц—1)(ц —2)—1] не делится на (ц—IJ, т. е. на л(ц). При-
Приводимая цепочка рассуждений проходит, тем не менее, для случая, когда
матрица Ак не имеет кратных корней. Поэтому следует в упр. 8 считать,
что матрица Ak не имеет кратных собственных значений. Затем добавить,
упр. 8': если положительно определенная матрица Ak имеет кратные соб-
собственные значения, то, добавляя к Ak+i матрицу diag{ei, ..., Bk+t) с до-
достаточно малыми ei > 0 и такими, что Л* -f- diag {ei, ..., е&} не имеет крат-
кратных собственных значений, доказать, что матрица Ak+i + diag {ei, ..., еь+i}
будет иметь положительные собственные значения при det^j,+1 > 0. Устрем-
Устремляя затем е* к нулю, убедиться в том, что Ль+i будет иметь положитель-
положительные собственные значения при det/4ft+i>0 и положительно определенной
матрице Ак- — Прим. перев.
4 П. Ланкастер
98 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Доказать, что
г
d(и,) = — а- Д (ц, — Ц/), /=1, 2, .. ., /-,
и при помощи исследования sign[d((Xj)] доказать, что если
detAk+i > 0, то d(|i) имеет г+ 1 положительных корней.
Упр. 9. Доказать теорему 2.14.4.
Упр. 10. Доказать, что А положительно определена
А~1 существует и положительно определена.
2.15. Теория малых колебаний и одновременное приведение
квадратичных форм
Начиная с обсуждения классической задачи упругих колеба-
колебаний механических систем, мы вводим в этом параграфе алгеб-
алгебраическую задачу одновременного приведения двух квадратич-
квадратичных форм с помощью одного и того же конгруэнтного преобра-
преобразования. Вводимая алгебраическая задача возникает и в других
интересных случаях, мы же ограничимся рассмотрением задачи
о механических системах. Основные результаты в чисто алгеб-
алгебраических терминах сформулированы в теоремах 2.15.1 и 2.15.2.
Рассмотрим движение упругой механической системы, откло-
отклонение которой от некоторого устойчивого положения равновесия
может быть задано п координатами. Пусть этими координатами
будут pi, pi, ..., рп. Если система допускает малые колебания
около положения равновесия, то ее кинетическая энергия Т за-
задается квадратичной формой от скоростей изменения во вре-
времени координат, т. е. от pi, ..., рп. Таким образом, существует
такая вещественная симметрическая матрица А, что
где p' = \\piP2 ¦ ¦ ¦ Pn\\ и p' = \\pip2 ¦ ¦ ¦ pn\\. Кроме того, при лю-
любом движении с ненулевым рейя по физическим соображе-
соображениям Т будет положительной. Таким образом, Т — положи-
положительно определенная матрица.
Когда система отклоняется от своего положения равнове-
равновесия, в ней, вообще говоря, накапливается потенциальная энер-
энергия. Можно показать, что если координаты определены так, что
р = о в положении равновесия, и потенциальная энергия пред-
предполагается равной нулю в этом положении, то для малых
2.15. ТЕОРИЯ 1ЧАЛЫХ КОЛЕБАНИЙ 99
колебаний она будет выражаться в виде
п п
2 Z
/ = 1 ft=l
где С — вещественная симметрическая неотрицательно (или по-
положительно) определенная матрица, т. е. V ^ 0 для любого
р €Е Sin.
Мы определяем производную от некоторой матрицы (или
вектора) Р как матрицу, элементы которой — производные от
элементов Р. Для любых соответствующих друг другу матриц
Р и Q, элементы которых — дифференцируемые функции от х,
как легко видеть,
JL (PQ) = ~ Q + Р -j^ . B.15.1)
Рассматривая теперь р\, р2, ..., рп, Pi, p?, ..., рп как мно-
множество 2п независимых переменных, получаем
Подобно этому
Уравнения движения для системы (при отсутствии действия
внешних сил) получаются по методу Лагранжа и записываются
в следующем виде:
л [dpj др. — aPt ' ' —1. А •••. п.
Из приведенных выше выражений для производных находим,
что уравнениями движения будут
Aup = — Ci,p, i= I, 2, .... п,
или в матричном виде
Ар+Ср = 0. B.15.2)
Для этого уравнения мы ищем синусоидальное решение p(t)
в виде p{t) — qeiat, где q не зависит от / и со вещественно.
Тогда р = —m2qeiat и, записывая Я = со2, будем иметь
или
4*
100 ГЛ 2 СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
Допустимые значения X (определяющие собственные частоты
колебания) — это п собственных значений матрицы А~'С. Вид
колебания определяется соответствующими правыми собствен-
собственными векторами. Но прежде всего мы должны убедиться в том,
что эти собственные значения вещественны и неотрицательны,
ибо в противном случае наши решения не будут иметь требуе-
требуемого вида с вещественным значением to. На самом деле можно .
доказать, что все возможные решения уравнения B.15.2) имеют
такой вид, но эту сторону рассматриваемой задачи мы обсуж-
обсуждать не будем. Ясно, что собственные значения матрицы А-1 С
будут также корнями для det(AX—С).
Теорема 2.15.1. Если А и С — положительно и неотрица-
неотрицательно определенные матрицы соответственно, то корпи для
dei(A\— С) вещественны и неотрицательны.
Доказательство. Как мы знаем, существует положи-
положительно определенная матрица А'!\ для которой (А'/'J = А (тео-
(теорема 2.14.2). Запишем (А''')-1 = A~'h и
А1-С = АЧг (U — А~''2СА~'и) Ач\
Полагая тогда В = А~'1гСА~'12 и r = A'!2q, замечаем, что
{АХ — C)q = 0 в том и только в том случае, когда
(II -В)г = 0.
Собственные значения матрицы А~1С будут поэтому собствен-
собственными значениями вещественной симметрической матрицы В, и
наоборот. Следовательно, они вещественны.
Пусть теперь К — собственное значение матрицы Л~'С с ве-
вещественным правым собственным вектором q. Тогда kAq = Cq.
Умножая это равенство слева на q', получаем
Так как q'Aq > 0 и q'Cq ^ 0, отсюда следует, что К ^ 0. Л
Пусть теперь Xi, ..., Хп — собственные значения матрицы
А~1 С и Kl = m2i, f = 1,2, ..., п. Так как X,- являются собствен-
собственными значениями вещественной симметрической матрицы В, ис-
использованной выше в доказательстве, то, как мы знаем (след-
(следствие теоремы 2.9.5), существует такая вещественная ортого-
ортогональная матрица Т, что
Тогда В = T'W2T и равенство (AJ — В)г = 0 означает, что
{ХТ'Т — T'W2T) г = 0,
или
(II — W2)s = 0,
где s=Tr= TA'i*q, или q = A-Ws.
2.15. ТЕОРИЯ МАЛЫХ КОЛЕБАНИЙ 101
Этот результат показывает, что, производя преобразование
координат, определенное при помощи q = A-'Ws, мы одновре-
одновременно приводим Л и С к диагональному виду: А приводится к
j и с - к W2.
Теорема 2.15.2. Матрицы А и С из теоремы 2.15.1 могут
¦быть приведены к диагональным матрицам при помощи одного
и того же конгруэнтного преобразования.
Возвратимся теперь к дифференциальному уравнению
B.15.2). Положив
р = А Т'| и р = А 2Т%,
лолучим
Умножая это равенство на ТА~'1г слева, найдем, что 5 +
-flF2g = 0 или
это означает, что
|; = at cos (со;/ + 8;), если сог Ф 0.
Числа а и е в этих равенствах — произвольные постоянные,
которые обычно определяются заданием начальных условий.
Если \i изменяется по этому закону, в то время как все осталь-
остальные \ равны нулю, то мы говорим, что система колеблется по
1-й нормальной гармонике. Координаты \\, |2, ..., In назы-
называются нормальными координатами для системы. Заметим, что
и
Некоторую информацию о нормальных колебаниях мы мо-
можем получить, заметив, что когда система колеблется по нор-
нормальной гармонике частоты аи, мы имеем s = e,-, так что реше-
решение для вектора нормального вида будет
qi = {A~ll2Tf) = ei — /-й столбец матрицы (Л~1/27").
Следовательно, матрица векторов нормальных гармоник Q =
= \\<Ji<l2 ... gn\\ задается в виде Q = А-'/2Т'. Кроме того,
Q'AQ = I, Q'CQ = W\ B.15.3)
иричем эти соотношения можно считать выражающими свойства
биортогональности векторов нормальных гармоник.
102 ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ
2.16. Колебания с внешними силами
Мы предполагаем, что, как и выше, упругая система произ-
производит лишь малые отклонения от положения равновесия, но что
дополнительно имеются предписанные силы /i(/)> ¦¦¦,fn(t)r
прилагаемые к координатам рь р2, ..., р„. Определяя f{t) =
= \\fi(t) fn(t)II, будем иметь теперь такое уравнение дви-
движения:
B.16.0-
Полагая р = А~{1'Т'% = Q| и умножая это уравнение на Q' сле-
слева, приводим его к виду
или
!/ + <oj!/ = <7/7@, 7=1, 2 я.
При со, Ф 0 частный интеграл такого уравнения может быть
получен в таком виде:
МО == ^J-S K7 to) Sin СО, (/-
J' о
и при coy = 0 — в виде
t
о
Если det W ф 0, то можно написать
t
¦I @ = l^ \ {sin № (/ - т)} Q'f (т) Л,
о
где интегрирование векторного выражения понимается как по-
почленное интегрирование и /-и диагональный член диагональной
матрицы sin U7(f — т) есть sin (Oj(t — т).
Важный для практики случай возникает при /(/) = foeiat,
где /о не зависит от t. Это случай задания синусоидальной внеш-
внешней (или возбуждающей) силы. В качестве упражнения чита-
читателю предоставляется доказать, что если со Ф coj (/=1, 2, ,.,
.... л), то
будет решением уравнения B.16.1).
СМЕШАННЫЕ УПРАЖНЕНИЯ
103
Этот результат можно использовать для обсуждения явле-
явления резонанса. Если представить себе со, приложенную частоту,
непрерывно меняющейся в окрестности некоторой собственной
частоты coj, то вид решения указывает на то, что величина век-
вектора-решения (или результирующей амплитуды), вообще го-
говоря, стремится к бесконечности при ы —*coj. Однако особенно-
особенности можно избежать, если q'ffu = 0 для всех qj, соответствую-
соответствующих со,-.
Смешанные упражнения
(i) Если А е ^2X2, Л ф 0 и А имеет два собственных зна-
значения, равных нулю, то доказать, что А дефектная.
(п) Если А е^2Х2, то показать, что А дефектная с собствен-
собственным значением а <=> А имеет вид
+ Р у |
- б а — р |'
где р2 = у8 и одно из чисел у, 8 не равно нулю.
2. Пусть а, Р — вещественные числа. При каких условиях
следующая матрица унитарна:
3.
з/,
Найти
если
0
а
0
п
собственные
А
0
г
('
S 0
СО.
0
ф
0
а
значения
—
1
2
1
-1
3
1
i
0
а
0
3
матрицы
0 II
2 I.
2
= Л2 — 2Л -f-
4. Если а е Ч?п, то найти собственные значения матрицы в
WnXn, каждый столбец которой равен а.
5. Если A e'g'mXn, то показать, что А'А и АА' имеют одина-
одинаковые ненулевые собственные значения.
6. Для идемпотентной матрицы А ранга г показать, что
tr(A)=r.
7. Если А ейпХп и симметрическая, то показать, что А по-
положительно определенная <=> В'АВ положительно определен-
определенная для всех неособых матриц В е i%n.
8. При а е ^п и а ф§ построить эрмитову унитарную мат-
матрицу А, первая строка которой кратна а!.
9. Найти ортогональную матрицу, которая представляет по-
поворот на 45° вокруг прямой в <%з, соединяющей точки @, 0, 0)
и A, 1, 1).
104
ГЛ. 2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ II СОБСТВЕННЫЕ ВЕКТОРЫ
10. (а) Доказать, что если Ап-
Чс
\
1
2с
1
1
2с
и с = cos 9, то
¦п X «-матрица
0
1
2с
sin (п + 1)9
и показать, как Dn может быть вычислено при |с|> 1. [Указа-
[Указание. Dn{c) — многочлены Чебышева второго рода Un(c)]
(б) Найти собственные значения и собственные векторы мат-
матрицы Л„. (Матрица Ап с с = —1 встречается в релеевском ко-
конечномерном приближении к задаче о колеблющейся струне.)
П. Если А, В и С положительно определенные, то доказать,,
что корни многочлена
det (А,2 Л + IB + C)
имеют отрицательные вещественные части.
12. Для А, Ве?„хп показать, что АВ и ВА имеют одина-
одинаковые характеристические многочлены и, следовательно, одни-
и те же собственные значения.
[Указания. Предположить сначала, что А неособая, и до-
доказать, что
det (ц/ — АВ) = (det A) (det (ц/ — В A)) (det Л),
откуда получается результат в этом случае.
В общем случае использовать тождество многочленов от X,
det (м-/ — (II — А)В) = det (ц/ — В (XI — Л)).]
13. Если А и В эрмитовы, то доказать, что:
(i) собственные значения матрицы АВ + ВА вещественны;
(и) собственные значения матрицы АВ—ВА чисто мнимые^
14. Если Л и В — неотрицательно определенные матрицы, то-
доказать, что:
(i) собственные значения матрицы АВ вещественны и неот-
неотрицательны;
(и) АВ = )
15. Пусть А^&пхп. Показать, что:
(i) Jf{A2)^Jf(A); если ./Г (Л) = ./Г (Л2), то Jf (Ар) =
Р=1, 2, ...;
СМЕШАННЫЕ УПРАЖНЕНИЯ 105
(ii) если нулевое собственное значение матрицы А имеет
одинаковые кратность и геометрическую кратность, то Ж{А) —
ЖА2
(Hi) &(А2)^&(А); если А простая, то &(А2) — 52 (Л).
16. Если U — унитарная матрица, то доказать, что Wn =
= &(U)®Jf(U) и что 3i{V) и Jf (U)~ортогональные допол-
дополнения.
17. Пусть S вещественная и кососимметрическая. Доказать,
¦что тогда I -\-S неособая и что преобразование Кели
ортогонально.
18. Пусть А — вещественная ортогональная матрица и А-\-f
.неособая. Доказать, что можно записать
где S — вещественная кососимметрическая матрица.
19. Определим свойство А для эрмитовой матрицы W по-
порядка п следующим образом: существуют подпространства <&+
и W- такие, что ^п = с&'+@<&'-, {Wx, x) > 0 для всех ненулевых
jce^+ и (W7*, ж)<0 для всех ненулевых хе?1-. Доказать,
что W имеет свойство А <=> det W ф 0.
Глава 3
ВАРИАЦИОННЫЙ МЕТОД
3.1. Введение
В этой главе мы будем иметь дело главным образом с ве-
вещественными симметрическими матрицами, действующими в.
Stn, хотя развиваемые идеи без труда обобщаются на эрмитовы
матрицы, действующие в %'„. Применяемая техника может быть
представлена как обобщение геометрического подхода к задаче;
о собственных значениях для вещественных симметрических мат-
матриц из 5?3хз- Мы видели (упр. 3 из § 2.13), что квадрике может
быть поставлена в соответствие такая матрица при помощи
уравнения х'Ах = 1, или {х, Ах) = 1. Точка (gi, |2, 1з) на по-
поверхности, которая одновременно лежит на главной оси, обла-
обладает тем свойством, что длина задающего ее связанного вектора
(|'i)Va = (?, I>V2 является стационарной величиной относительно-
вариаций координат на поверхности.
Это свойство приводит нас к задаче исследования стационар-
стационарных значений {х, х) при условии, что х удовлетворяет уравнению-
{х, Ах) = 1. Эта задача имеет другую формулировку, в которой
исключается ограничивающее условие: для этого следует за-
заняться поиском стационарных значений отношения {х, х)/\х, Ах),.
где х пробегает все ненулевые векторы в 523; или, что по суще-
существу то же самое, мы разыскиваем стационарные значения для
отношения Релея
(х, Ах)
Последняя формулировка дает определение отношения Релея и-
ставит важную задачу для любой эрмитовой матрицы А.
3.2. Экстремальные собственные значения
и отношение Релея
Пусть А—вещественная симметрическая л X "-матрица..
Определим единичную сферу О в Яп (или в 'ё'п) как множество'
зсех векторов в fflnCffn), Для которых {х, х)=\. Рассмотрим:
32. ЭКСТРЕМАЛЬНЫЕ СОБСТВЕННЫЕ ЗНАЧЕНИЯ 107
отношение Релея для А
я(*)=1т4г- C-2Л)
Очевидно, если вместо х подставить kx, то отношение Релея
«станется без изменения. С геометрической точки зрения можно
¦сказать, что R(x) принимает одно и то же значение для каждой
точки (связанного вектора) на прямой, проходящей через на-
начало координат в 91п (исключая само начало координат, где
JR(O) не определено). Таким образом, если ограничиться рас-
рассмотрением векторов х, соответствующих точкам на единичной
•сфере, то для R{x) получим ту же самую совокупность значе-
значений. Мы поэтому рассмотрим задачу нахождения максимума и
.минимума значений*) для (х, Ах) при условии, что {х, х)= 1.
.Запишем эти величины:
max (ж, Ах), min(*, Ax).
Х^в Х<^0
Как мы видели,
max R (х) = max (x, Ах)
я подобно этому для минимума.
Предположим, что собственными значениями матрицы А бу-
будут щ ^ цг ^5= ... ^ Цп, что U = diag{\i\, ..., \in} и что Т —
вещественная ортогональная матрица, для которой
T'AT = U. C.2. 2)
¦Отметим, что если х = Ту, то
(х, х) = х'х = у'Т'Ту = у'у = {у, у).
Кроме того, так как Т обязательно неособая, R(T')=<%n. От-
Отсюда следует, что если х пробегает все векторы в О, то и у
пробегает все векторы в С и
imax(*, Ax) — max (Ту, АТу) = тах(у'Т'АТу) —
-х^0 уе(? jefl
= max (у'Uу) = max ( X! Р,У)) •
уев уев \j = l ' '/
Подобно этому
пп(дс, Ах) = min ( ? \а,у)).
sff уев \/=1 ' '/
*€=<?
*) См. дополнение 1, где обсуждается вопрос о существовании макси-
шума и минимума.
108 ГЛ. 3. ВАРИАЦИОННЫЙ МЕТОД
Но согласно упорядочению собственных значений имеем
далее
п п
и
п п
Ц.у: -^ U 2-1 У! = Н„ \У. У/ == И„.
если y^iO. Кроме того, при y = ei и у = еп получаем
X М-;?// = М-1 и Х|а////:==М'п соответственно. Следовательно, так
как е. и еп е= О,
max (х, Ах) = |o.j и min (х, Ах) = ц„.
Этот результат может быть сформулирован следующим образом
в терминах отношения Релея, определенного по C.2.1).
Теорема 3.2.1. Если А — некоторая вещественная симмет-
симметричная матрица, то для любого ненулевого х е 31п
ц„ < R (х) < м-1
и
Hi =maxR(x), ц„== min R(x).
Этот результат, очевидно, очень легко может быть применен
к нахождению границ для экстремальных собственных значений
матрицы А.
*Упр. 1. Для собственного вектора Xj с собственным значе-
значением [ij показать, что R (Xj) — ^j.
Упр. 2. Доказать, что если а = пт1 X а/ь то
i.k
для /=1,2, ..., п.
*Упр. 3. При рассмотрении R(x) как функции на 9tn теоре-
теорема 3.2.1 утверждает, что область значений этой функции содер-
содержится в отрезке [цп, щ]- Существуют ли точки отрезка [цп, |XiL
которые не принадлежат области значений R?
3.3. Свойство стационарности отношения Релея
Во вводных замечаниях мы упоминали о стационарных зна-
значениях отношения Релея. Более точно эти понятия мы формули-
формулируем в следующей теореме, в которой R(x) рассматривается как.
вещественнозначная функция независимых вещественных пере-
3.3. СВОЙСТВО СТАЦИОНАРНОСТИ ОТНОШЕНИЯ РЕЛЕЯ '09
менных хи х2 хп — компонент вектора х. Мы пишем R (х) =
= R(xu х2, .... хп).
Теоре ма 3.3.1. Если А — вещественная и симметрическая
матрица с собственным значением \i и соответствующим соб-
собственным вектором \, то R(x\, ..., хп) имеет стационарное зна-
значение относительно хи ... , хп при х = % и R (|) — ц.
Доказательство. То, что /?(§) = ц, получпется без труда
и было отмечено в упр. 1 выше.
Для получения свойства стационарности мы должны пока-
показать, что dR/dXj = 0 при х = § для j = 1, 2, . . . , п. Но как
в § 2.15, находим, что
i±u±L = 2A,.x и -2^-i
дх. ' дх.
Следовательно,
dR (x'x) BAhx) - (х'Ах) 2х,
dxj (x'xJ
Вычисляя это выражение при х = |, положив А% =\i"?, и
§ = (i§j, находим, что числитель равен нулю, так что
j = 0 при х = | для каждого /. А
Упр. 1. Сформулировать и доказать обращение теоремы 3.3.1.
Имеется интересное обобщение теоремы 3.3.1 и неэрмитовы
матрицы. Мы рассмотрим некоторую простую матрицу А с соб-
собственным значением |а и соответствующей сопутствующей мат-
матрицей G = |т)'. Таким образом, имеем ц% = 1 и
(теорема 2.4.3). Для простоты это предположение берется даже
в более сильном виде, чем необходимо; существенным условием
является то, чтобы [i имело одинаковые кратность и геометри-
геометрическую кратность.
Для матрицы А мы определяем обобщенное отношение Ре-
лея как
C.3.2)
и рассматриваем R как функцию от 2л скалярных переменных
хи х2, .... хп, У\, ..., уп- Получаем тогда, что
dR _ (y'x) (y'Att) - (у'Ах) у,
д ~ ('У
дх}
dR (y'x)(Ahx)-(y'Ax)xl
ду, — (у'хУ
110 ГЛ. 3 ВАРИАЦИОННЫЙ МЕТОД
Если вычислить эти производные при х = |, у = т), используя
C.3.1) и Ц%= 1, то легко убеждаемся в том, что в этих точках
имеем dR/dxj = 0 и dRjey, = 0 для каждого /. Имеем также
/? (^, rj) = [л. Эти результаты являются очень естественным рас-
расширением теоремы 3.3.1 на неэрмитовы матрицы, но следует
ясно себе представлять, что существуют матрицы, для которых
R(x,y) не определено при х = §, у = г\. В частности, если.
г\'% = 0 для всех левых и правых собственных векторов, соот-
соответствующих данному собственному значению, то отношение
C.3.2) не определено при х = |, у = ц. Свойство стационарно-
стационарности (если оно выполняется) очень полезно при формулировке
методов вычисления собственных значений.
Можно также заметить, что мы не можем ожидать прямого
обобщения теоремы 3.2.1, так как собственные значения неэрми-
неэрмитовых матриц могут быть комплексными.
3.4. Вариационное описание собственных значений
Возвратимся к теме § 3.2. Нам удалось там характеризовать
экстремальные собственные значения вещественной симметри-
симметрической матрицы вариационными методами. Мы попытаемся те-
теперь этим способом характеризовать все собственные значения.
Свойство стационарности из теоремы 3.3.1 локальное и не пре-
предоставляет прямой возможности характеризовать собственные
значения.
Направление поиска можно предложить опять при помощи
обдумывания классификации поверхностей квадрик. В частно-
частности, рассмотрим эллипсоид, главная ось которого уже известна
(возможно, при помощи теоремы 3.2.1) и направлена вдоль век-
вектора |ь Свойства эллипсоида подсказывают мысль попытаться
определить вторую главную ось при помощи максимизации
R{x), где х теперь пробегает все ненулевые векторы в Rn, орто-
ортогональные к |ь Если бы это нам удалось, то мы попытались бы
найти третью главную ось при помощи максимизации R(x), где
х пробегает все ненулевые векторы, ортогональные к порожден-
порожденному |i и |г пространству. Оказывается, что этот простой подход
есть все, что нам нужно.
Как и прежде, мы предположим, что . щ ^ \х2 ^ .. .^ цп —
собственные значения вещественной симметрической матрицы Л
и «1, х2, ..., хп — соответствующие собственные векторы, обра-
образующие ортонормированную систему. Пусть Q/n-p+i — подпро-
подпространство в 5?п, порожденное хр, хр+и ..., хп для р = 1, 2,..., п.
Тогда, как очевидно,
и Х\, х2, ..., Хр ортогональны к каждому вектору из
3.5. ЗАДАЧИ СО СВЯЗЯМИ J11
Теорема 3.4.1. Для j = 1, 2, ..., п имеем
где максимум берется по всем ненулевым векторам х из <yn-j+x.
Доказательство. Прежде всего заметим, что случай
j = 1 в точности совпадает с теоремой 3.2.1 и что Xj — это
столбцы матрицы Т в равенстве C.2.2). Кроме того, ^„_j+i по-
порождается Xj, ..., хп. Для заданного xe.<yn-i+i существуют
п
такие вещественные числа yh ..., уп, что х = ? Укхк = ^У»
где у'= || 0, ..., О, у,, ..., г/„||. Имеем тогда
(х, Ах) = х'Ах = у'Т'АТу = у'?/у = ? H*i?
к — /
и подобно этому
<. > Е /1
ft-/
Опять следует рассматривать лишь те векторы из ^n-j+i,
для которых {х, х) = 1. Но, как очевидно, на этом множестве
имеем
max (х, Ах) = ц,
и этот максимум достигается при х с у} = 1, yj+l ==... = уп =
= 0, т. е. при х = *j. Это завершает доказательство теоремы.
Этот результат имеет тот недостаток, что щ (/>1) харак-
характеризуется с помощью собственных векторов Xi, ..., Xj_i. Таким
образом, при применении теоремы 3.4.1 мы должны вычислять
собственные значения в порядке их невозрастания вместе с ор-
тонормированными базисами для их собственных подпрост-
подпространств. Следующая теорема — это замечательный результат,
позволяющий характеризовать каждое собственное значение без
обращения к другим собственным значениям и собственным век-
векторам. Это знаменитая теорема Куранта — Фишера, начало ко-
которой было положено Э. Фишером в 1905 г. и которая была
переоткрыта Р. Курантом в 1920 г. При этом именно Курант
увидел и сделал ясным для всех большую важность этого ре-
результата для задач математической физики.
3.5. Задачи со связями
В этом месте будет удобно ввести операцию вычитания под-
подпространств. Если ^, М- — подпространства и stf-^f?, то через
*8 0 М- мы обозначаем множество всех векторов из <ё>, которые
ортогональны к каждому элементу из s&. Мы утверждаем, что
ffQt будет подпространством в ^ и, как нетрудно видеть.
П2 ГЛ. 3. ВАРИАЦИОННЫЙ МЕТОД
если Ф Qs& = 8>, то ff = s4-®$>, хотя обратное утверждение
не обязательно верно. Это происходит по той причине, что
9!? Qs& = 31 означает, что $Ф и J? — ортогональные дополнения
а s4-®9& определено для пространств $Ф и 31, которые лишь до-
дополнительные. Определяя Ф Q зФ как ортогональное дополнение
к зФ, мы получаем единственную интерпретацию операции вы-
вычитания.
Упр. 1. Доказать, что <& Q&— подпространство в 9?.
Упр. 2. Если s4- — подпространство в 31г, порожденное е\ и е2,
то указать все подпространства J? в 9L%, для которых s4- © $
определено. Какое из них совпадает с Жъ 0 $Ф!
Упр. 3. Пусть Р — проекция на $Ф. Доказать, что х е 9 0
Q <& фф РХ = 0.
Пусть *i, ж2, .... JKn — ортонормированные собственные век-
векторы вещественной симметрической матрицы A, S5'j — подпро-
подпространство в 5?п, порожденное Х\, ..., х$ для /== 1, 2, ..., п.
Напомним, что суп^+<1 обозначало подпространство, порожден-
порожденное Xj, ..., хп- Имеем тогда
ЗВ,®Уп-, = ^п и *„еЯ?/ = <У„-/, /=1,2 л-1.
C.5.1)
Задолго до формулировки и доказательства теоремы Куран-
Куранта— Фишера математики встретились^, вычислениями собст-
собственных значений, которые возникают из задач максимизации
при некоторой связи. С вариационной точки зрения это означает,
что мы ищем стационарные значения для x'AxIx'x, где х пробе-
пробегает те ненулевые элементы из &п, которые удовлетворяют не-
некоторому уравнению (или связи) вида
+ а2х2 + ... + апхп = 0
с, не всеми а,, равными нулю. Очевидно, если Oj ф 0, то мы мо-
можем использовать наложенную связь для выражения Xj в виде
линейной комбинации остальных х{, подставить в R(x) и полу-
получить новое отношение от я—1 переменных, стационарные зна-
значения которого (ил—1 соответствующих собственных значе-
значений) можно исследовать непосредственно без обращения к свя-
связям. Оказывается, это очевидное направление наступления не
самое выгодное, и если мы уже знаем свойства системы без
связей, то мы очень мало можем сказать о свойствах системы
со связями. Мы будем называть собственные значения и соб-
собственные векторы задачи со связями ограниченными собствен-
собственными значениями и ограниченными собственными векторами.
В общем виде рассмотрим задачу нахождения собственного
значения при г связях:
а'/Х = 0, /=1,2,..., г, C.5.2)
3.6. ТЕОРЕМА КУРАНТА - ФИШЕРА ИЗ
где а.\, ..., йг линейно независимы. Пусть $ФТ — подпростран-
подпространство, порожденное ах, ..., ат, и Йп_г = ^п9-^г- Если Ьи ...
., bn-r — ортонормированный базис для $п-г и В = \\b\b2 ...
... &n_r||, то В'В = 1 и Р = ВВ' — проекция на ^„_г (§ 2.11).
Мы должны теперь найти стационарные значения для
х'Ах/х'х, где х пробегает те ненулевые векторы из 5?„, которые
удовлетворяют наложенным связям, т. е. для х ф 0 и х е= <%п-г-
Но х е SSn-r ^=> существует такой § е Мп-Г, что * = 5|. Таким
¦образом, так как В'В = /, мы имеем
хМх = 1'В'АВЪ ^ §'В'ЛВ§
х'х Ъ'В'ВЪ VI
я задача сводится к стандартному виду нахождения стационар-
стационарных значений отношения Релея для (п — г)Х(л — г) веществен-
вещественной симметрической матрицы В АВ (§ 3.3). Как мы видели, эти
стационарные значения достигаются лишь в собственных значе-
значениях матрицы В'АВ. Таким образом, \х — ограниченное собствен-
собственное значение для А с соответствующим собственным вектором
х <=> |а — собственное значение для В'АВ с собственным векто-
вектором I, где х = В%.
Пусть ограниченными собственными значениями будут
Ш^М^^ ••• ^ №п-г и |), ..., |„_г — соответствующие орто-
нормированные собственные векторы для В'АВ, Если хи ...
..., хп~г — соответствующие ограниченные собственные векто-
векторы, то они тоже будут ортонормированными, потому что
Для / = 1,2, ..., п — г пусть $€$ и <yn-r-j+\ — подпространства
в Sln, порожденные лгь ..., Xj и Xj, xj+i, ..., хп-г соответствен-
соответственно. Применяя сначала теорему 3.4.1 к В'АВ в dln~r и преобра-
преобразуя затем результат в таковой для 91п, читателю не представит
труда доказать следующую лемму.
Лемма. Если jli ^ р2 ^ ... 5? [in_r — собственные значения
в сформулированной выше задаче нахождения собственных зна-
значений со связями с соответствующими ортонормированными соб-
собственными векторами хи х2, .... хп-г, то
\ij = max R(x), /=1, 2, ..., п — г,
где максимум берется по всем ненулевым векторам в простран-
пространстве Q/n-r-j+u порожденном xjt ..., хп-т-
3.6. Теорема Куранта — Фишера
Для иллюстрации метода, применяемого в доказательстве
этой теоремы, докажем сначала в рамках § 3.5, что если имеется
одна связь, то, каков бы ни был ограничивающий вектор а.\.
П4 ГЛ. 3. ВАРИАЦИОННЫЙ МЕТОД
имеем
C-6.1)
Прежде всего, так как <^n-ic ^п, лемма и теорема 3.2.1
означают, что
fii = max R(x)^ max R(x) = Hi-
Таким образом, верхняя граница для jii легко получена.
Мы докажем теперь, что существует § е SSn-u для которого
R(\)^ \12- Так как fii = max)?(ж) в 38п-и отсюда будет следо-
следовать, ЧТО pi ^ Ц2.
Так как сумма размерностей S82 и 38п-х равна л+ 1, то су-
существует ненулевой вектор, принадлежащий как $?2, так и
J?n_i (см. упр. 4 из § 2.11). Пусть § — такой вектор с %'\ = 1.
Тогда, так как |e^2l существуют такие вещественные числа
а\ и а2, что | = ai*i + а2*2 и §'| = (а^' + а^) (<*)*, + а2ж2) =
Так как |e^n-i, имеем также
/?(D< max /?(
Следовательно,
h > Л (I) = |М| = (a,*; + cy4) Л (a,
2a,a2
Так как AXj = n,Xj для 7 = 1, 2 и x'jxk = bjk, то дс[Лдс2 = О и
так как \i^\i2 и a^ + a2=l. Это устанавливает неравенства
C.6.1), но можно сказать больше, а именно, доказать, что суще-
существует некоторое йи для которого 'pi = \i2- Мы берем просто
а; = х\. Тогда 35п-\ = °Цп-\ и х2 е ^n-i- В таком случае по
теореме 3.4.1 получаем
[1!= max ^(дс) = |а2-
Таким образом, связи можно использовать для характериза-
ции (д.2 и записать
|л2= rnin max R(x),
т. е. jj.2 — наименьшее значение, которое может быть достигнуто
максимумом величины R(x) при добавлении одной связи. В про-
3.6. ТЕОРЕМА КУРАНТА — ФИШЕРА Ц5
тивоположность результату теоремы 3.4.1 это описание |х2 не
зависит от какого-либо знания \i\ или его собственного подпро-
подпространства. Теорема Куранта — Фишера является прямым обоб-
обобщением этого результата.
Теорема 3.6.1. Пусть заданы любые линейно независимые
векторы аи а2, ..., аг в Sin-, и пусть $п-т — подпространство всех
векторов в 52„, которые ортогональны к аь ..., ат. Тогда
цг+j = min max R (х), r = О, 1, 2 п — 1.
°п-т
Таким образом, минимум определен по всем множествам ли-
линейно независимых векторов а.\, ..., аг в 91п- Этот минимум до-
достигается При dj = Xj, j = 1, . . . , Г.
Доказательство. Мы дадим набросок доказательства.
Рассмотрим некоторый вектор 1, принадлежащий как S6r+\, так
# ?'|1
Прежде всего, так как |е^л+1, то |= Y, aixj и
П=Еа2=1.
/=i '
Затем, так как | е Яп-Г, то
max /?(x)>/?(D = r^ = aJnI+ ... +«r2+l(xr+]>
Кроме того, при aj = Xj, /=1, 2, ..., г, имеем\^„-г =
так что по теореме 3.4.1
max
Таким образом, существует $п-г, Для которого нижняя граница
jj,r+i достигается, так что
max R{x)
и минимум достигается при а3- = Xj, / = 1, 2, ..., г. ^
В качестве первоначального следствия теоремы Куранта —
Фишера мы докажем, что задача нахождения собственного зна-
значения, у которой порядок п и наложена одна связь, имеет п— 1
собственных значений и наибольшее собственное значение Ц4
с ^2 ^ jii ^ Иь В действительности верно также, что
А/<!-1/> / = 2,3 п—\,
116 ГЛ. 3. ВАРИАЦИОННЫЙ МЕТОД
и даже, более того, если имеется г связей, определенных век-
векторами аи ..., аг, то ограниченная задача имеет п — г собствен-
собственных значений и
ц/+г< Д/< \xh j = l, 2, ..., п — г.
Этот результат называют иногда теоремой Релея, хотя сам
Релей приписывает ее Раусу и даже еще ранее она использова-
использовалась Коши. Эта теорема легко доказывается при помощи тео-
теоремы Куранта — Фишера.
Теорема 3.6.2. Если jls ^ ?12 ^ • • • ^ jx«-r — собственные
значения задачи C.5.2), то
ц1+г < Д/ < Ц/> / = 1, 2, . .., л — г.
Доказательство. Вспомним сначала определения прост-
пространств 96j и °уп^гЧ+1, данные в § 3.5 для /=1,2, ..., п — г.
Так как размерность пространства ^n-r-j+i равная — ('' + /)+ U
из теоремы 3.6.1 следует, что
где максимум берется по всем ненулевым векторам в <уп_г_,-+1.
Но лемма из § 3.5 утверждает, что max R(x) = jij. Отсюда по-
получаем неравенство: jj,,-+j- ^ jij.
Для нахождения второго неравенства рассмотрим собствен-
собственные значения матрицы —Л: coj ^ (а2 ^ .. . ^ соп, где сор =
= —|лп+]_р, р=\, 2, ..., п. Пусть собственными значениями
матрицы —А при связях а'(х — 0, / = 1, 2, ...,/•, будут ©t ^ ...
• ¦ • ^йд_г- Тогда
о»р = — p-rt+1-r-p» Р=1. 2 п — г.
Применяя только что доказанный для А результат, получаем
cor+fe<©ft, k = \, 2 n — r,
откуда
— №n+l-r-k ^a — V-n+l-r-k-
Записывая / = л+1—г — k, получаем
/= 1, 2, ..., я —г. 4
Доказанные теоремы можно использовать для получения:
еще одного интересного результата. Если вещественная симмет-
симметрическая матрица А имеет собственные значения щ ^ ц2 ^
¦ • • ^ ^п и В — неотрицательно определенная матрица, то что-
можно сказать о собственных значениях %i ^ Яг ^ ... ^ Яя
матрицы Л +S? Интуитивно мы ожидаем, что собственкые зна-
значения матрицы А могут лишь возрасти (или остаться без изме-
изменений) при таком возмущении. Так оно и есть на самом деле.
3.6. ТЕОРЕМА КУРАНТА - ФИШЕРА 1 \Т
Мы можем также ожидать, что собственные значения могут
возрасти на сколь угодно много, если возмущающая матрица
будет равна кВ, где k принимает большие положительные зна-
значения. Но, по-видимому, немного удивит то, что это верно лишь
для г собственных значений матрицы А, где г — ранг В. Мы
найдем верхнюю границу для изменений |ar+i jj,n, которые
независимы от В.
Теорема 3.6.3. Если А— вещественная симметрическая
матрица с собственными значениями уц ^ f,i2 ^ .. . ~^\\п, В —-
неотрицательно определенная матрица ранга г A ^ г ^ п)
и A -J- В имеет собственные значения >ч ^ >»2 ^ ... ^ Яп, то
0) bi>vn, i = l, 2, .... л,
и
(ii) ц/_г>ЯЛ / = /•+ 1, ..., и.
Доказательство. Заметим, что, так как В неотрица-
неотрицательно определенная, то
х' (А + В) х = х'Ах + х'Вх^ х'Ах
для любого Х6Й„. Таким образом, если 9? — любое подпрост-
подпространство в 5?п, то
max х' (А + В) х ^ max л'Лдс,
где максимум берется по всем векторам «eS'c х'х = 1. В ча-
частности, если рассмотреть все подпространства 3§п-г+\ размер-
размерности п — i+ 1, где 1 ^ 1 ^ п, то из теоремы 3.6.1 получим
%i = min max (A-\-B)x^ min max x' Ах = ун.
Это доказывает часть (i) теоремы.
Применяя теорему 2.12.1 к квадратичной форме х'Вх и пред-
предполагая, что В имеет ненулевые собственные значения vu ..., vrr.
находим, что
где d'j = v1j2 (/-я строка матрицы X*), j = 1, 2, ..., г и du .. ^
..., dr, очевидно, линейно независимы. Мы можем записать те-
теперь
х' (А + В) х = х'Ах + Е (<*'*J.
Рассмотрим задачи нахождения собственного значения для*
А и А + В, обе при связях d'/X = 0, }=\, 2, ..., г. Очевидно,.
118 ГЛ. 3. ВАРИАЦИОННЫЙ МЕТОД
согласно написанному выше равенству, эти две задачи совпа-
совпадают и имеют одинаковые собственные значения jli ^ ...
... ^ jin-r- Применяя теорему 3.6.2 к обеим задачам, полу-
получаем также
r < V-k < Ни. , , о
k = l, 2, .... n — r.
Следовательно, M+r ^ цн, и, записывая j = г -\- k, мы получаем
часть (и) теоремы. Л
Упр. 1. Рассмотреть матрицу А из упр. 2 § 2.9. Исследовать
ограниченные собственные значения при наложении одной связи
для каждого из следующих ограничивающих уравнений и про-
проверить теорему 3.6.2 в каждом случае:
(i) х\ = 0; (п) хх — х2 — 0; (ш) хх — х3 — 0.
Упр. 2. Рассмотреть ограниченную задачу нахождения соб-
собственного значения с г связями, сформулированную в § 3.5,
В обозначениях, использованных там, Р — проекция на J?n_r.
Доказать, что матрица Р'АР имеет собственные значения Дь ...
..., fin_i вместе с г нулевыми собственными значениями.
Упр. 3. Рассмотреть предположение: «Если А, В е ^nxn и В
положительно определенная, то собственные значения |аь ..., цп
матрицы А и Ль ..., Хп матрицы А -\- В можно перенумеровать
так, что Re(Xj)^ Rq(hj), /= 1 л». Опровергнуть это пред-
лоложение, рассмотрев
А =
6 1
—36 —6
В =
2 0
0 1
3.7. Приложения к теории малых колебаний
Мы возвратимся теперь к задаче, обсуждавшейся в § 2.15.
В этом параграфе физическая задача о колебании была сведена
к задаче решения матричного дифференциального уравнения
B.15.2):
где А положительно определенная и С либо положительно, либо
неотрицательно определенная. Последняя задача была затем
¦сведена к чисто алгебраической задаче нахождения конгруэнт-
конгруэнтного преобразования, одновременно приводящего Л и С к диа-
диагональным матрицам. Это, как мы видели, в свою очередь, зави-
¦сит от приведения матрицы В = АЧ*СА~ч* к диагональному виду
посредством ортогонального конгруэнтного преобразования.
Собственные частоты колебания системы задаются неотри-
неотрицательными корнями из корней многочлена det(.4A,— С), кото-
3.7. ПРИЛОЖЕНИЯ К ТЕОРИИ МАЛЫХ КОЛЕБАНИЙ Ц9<
рые являются также собственными значениями матрицы В. Мы
знаем теперь поэтому, что наибольшая собственная частота
© =А,'/2 задается как К{ = max Ri(x), где Ri— отношение Ре-
лея для В. Теоремы 3.4.1 и 3.6.1 означают, что все собственные-
частоты могут быть определены в терминах экстремальных зна-
значений отношения R\. Заметим, однако, что если записать х =
.= A'hq, то
RiW- jr-x =YaJ-
Отношение Релея, соответствующее рассматриваемой задаче,,
совпадает поэтому с
Заметим также, что если Xj — собственный вектор матрицы В,
то <7, = A~xi'Xj — вектор нормального вида для задачи колебания,
и, как в равенствах B.15.3),
Применяя каждую теорему этой главы к В, без труда убеж-
убеждаемся в том, что получаются обобщения, применимые к корням
многочлена 6et(AX— С). Как пример мы сформулируем лишь
обобщенный вид теоремы Куранта — Фишера.
Теорема 3.7.1. Для данных любых линейно независимых
векторов аи а2, ..., аг в 5?„ пусть 3§п-г — подпространство, со-
состоящее из всех векторов в 5?„, которые ортогональны к аи ...
..., аг. Тогда
Xr+i = min max
х'Сх
п-r х'Ах
Минимум достигается при а3- = </3-, / = 1, 2, . . . , г.
Физические интерпретации теорем 3.6.2 и 3.6.3 более оче-
очевидны в рамках данного изложения. Добавление одной связи
может соответствовать закреплению некоторой точки системы,
так что в этой точке колебания нет. Возмущение, рассмотренное
в теореме 3.6.3, должно соответствовать увеличению жесткости
системы. Теорема утверждает, что это может сказаться лишь.
в увеличении собственных частот.
Наконец, следует заметить, что все теоремы этой главы и ре-
результаты, о которых говорилось в этом параграфе, могут быть
расширены заменой предположения «вещественная симметриче-
симметрическая» всюду на «эрмитова».
120 ГЛ. 3. ВАРИАЦИОННЫЙ МЕТОД
Смешанные упражнения
1. Сформулировать и доказать обобщения теорем 3.2.1, 3.3.1
и 3.4.1 на эрмитовы матрицы. (Обобщение теоремы 3.3.1 тре-
•бует некоторого знания теории функций комплексной пере-
переменной.)
2. Если А, С<='$'пхп и А неособая, то предложить подходя-
подходящее обобщение определения C.7.1), которое будет включать
C.3.2) как частный случай. Исследовать вопрос существования
стационарных свойств у данного обобщения, как намечено
в § 3.3.
3. Доказать теорему 2.15.2 при более слабом предположении,
что А положительно определенная и С вещественная и симмет-
симметрическая. Доказать, что теорема 3.7.1 также выполняется при
этих предположениях. (Заметим, что, полагая А = / в тео-
теореме 3.7.1, сводим результат к теореме 3.6.1.)
4. Предположим, что А — эрмитова матрица и по заданному
вещественному числу v0 и заданному вектору \^.<ёп мы строим
последовательности х0, хи ... и vo, vi, ... при помощи формул
*r = (/vr — Л) с,
vr+l=R(xr),
.Доказать, что если щ — собственное значение матрицы А
и v.-*Ui при г—* оо, то
-7^ 4,—> (константа) при г->оо.
[Указание. Использовать спектральное разложение для
</vr —Л)-1; упр.З из § 2.5.]
5. (О Пусть /!е?ш, ЛГ = ЛГ(Л), 31 = 31{А), Л'* = Л'{А*)
и ;Г = 52(Л*). Доказать, что % = WnQjr* и № = <BnQJC.
(ii) Для нормальной матрицы А доказать, что JC = JC*.
6. В обозначениях упр. 5 доказать, что существует един-
единственное решение \^.Ы* уравнения Ах = ЬЬЯ
Глава 4
МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
4.1. Введение
В главе 2 нас особенно интересовали те матрицы, или классы
матриц, которые могут быть приведены к диагональным матри-
матрицам применением подходящего подобного преобразования. Мы
описали любую такую матрицу как простую матрицу (теорема
2.4.2). В этой главе нашей основной целью будет приведение
любой матрицы из ^nxn подобными преобразованиями. Мы
знаем, что, вообще говоря, не всегда некоторую матрицу и»
ffnxn можно привести к диагональному виду, но какой бы про-
простой (нормальный) вид мы ни получили, он должен превра-
превращаться в диагональный, если рассматриваемая матрица про-
простая.
В дополнение к основным результатам мы получим не-
несколько других важных и интересных теорем. Наш подход к рас-
рассматриваемому вопросу покажется, может быть, не прямым, но„
с нашей точки зрения, он выгоден тем, что при этом получаются
другие полезные результаты и требуется минимум математиче-
математической абстракции. Мы подходим к задаче с алгебраической точки
зрения, при которой исследуются природа характеристического
многочлена и его разложение на множители в том случае, когда
имеются собственные значения, у которых (алгебраические)
кратности и геометрические кратности не совпадают.
Читателю следует по крайней мере отдавать себе отчет в том„
что существует другой подход к задаче, который, вероятно, бо-
более полулярен среди математиков и который может быть описан-
как геометрический. При этом подходе сначала отмечается, что
собственные векторы некоторой матрицы в ^nxn могут не по-
порождать ??„, и внимание сосредоточивается на способе добавле-
добавления дополнительных векторов, которые вАсте с собственными
векторами порождают <&„. Как только эта задача решена, нор-
нормальные формы получаются без труда.
122
ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
4.2. Алгебра ^-матриц
Мы рассматриваем «X «-матрицу А (К), элементы которой—¦
многочлены от Я. Предполагается, что значения для Я и коэф-
коэффициенты многочленов берутся из некоторого поля У, так что
если элементы матрицы А вычисляются для частного значе-
значения Я, скажем Я = Яо, то Л(Ао)е^гпхк. Если имеется некото-
некоторый элемент в Л (Я), который является многочленом от Я cfe-
пени /, и нет элементов в Л (Я) степени, большей /, то мы будем
говорить, что / — степень матрицы А (Я). Матрица Л (Я) изве-
известна как матрица многочленов, или Х-матрица. Если нужно бу-
будет выделить основное поле, то мы будем называть Л(Я).Я-мат-
рицей над SF.
Если Л (Я) имеет степень /, то (t,/)-элемент в А (к) может
быть записан в виде
ац (Я) = af}V + а\))Х<-' +
и имеется по крайней мере один элемент, для которого afj ф 0.
Если определить матрицу Аг (г = 0, 1,...,/) как такую, у кото-
которой (г,/)-элемент равен а(р, то будехм иметь Ао Ф 0 и
+ а«~
+ а»}
Я-матрица А(Х) называется регулярной, если det(Ло) =?^ 0.
.Для иллюстрации этих понятий предположим, что Яо — веще-
вещественное число и
Я2 + X + 1 X3 — к + 2
2Я X2 — ЗХ - 1
Л(Я) =
Тогда Л(Я0)'
О 1
О О
а и А{Х)
1 О
О 1
Л0Я3 + Л^2 +
2 "
2 -3
А2Я +
А3,
з =
где
1
О
2
-1
Отметим, что Л (Я) не регулярна.
Матрицы многочленов одного и того же порядка можно
складывать и перемножать между собой обычным образом
и в каждом случае в результате получится другая матрица мно-
многочленов. Что можно сказать о степени суммы и произведения?
Пусть Л (Я), В(Х) — Я-матрицы одного и того же порядка,
имеющие степени /, m соответственно. Пусть k — max(l,m).
Тогда (с очевидным изменением данных выше определений)
можем написать
Л(Я) = Л0Я* + Л1Я*-'+ ... +Ak,
+ BiXk->+ ... +Bk
либо Ло Ф 0, либо Во ф 0. Как очевидно,
4.2. АЛГЕБРА Я-МАТРИЦ 123
Таким образом, степень А-матрицы А(Х) -\- В(Х) не превосхо-
превосходит k.
Предположим теперь, что
' 1] ... +Ah
В(К) = Вок + В1к+ ... +Вт,
где А0Ф0 и В0ф0. Тогда
А (А) В (А) = А0В0Х!+'" + (Л0В, + А{В0) Л'+»-> + . . . + А,Вт.
Таким образом, произведение будет А-матрицей, степень кото-
которой не превосходит 1-\-т. Заметим, что можем иметь А0В0 = О,
но если одна из А(Х) и В (А,) — регулярная А-матрица, то
А0Вз Ф 0 и А (А) В (А) имеет степень / + гп-
Предположим, что В(Х)— регулярная А-матрица и что суще-
существуют такие ^-матрицы Q(K), R(K) с R(k)^Q или со степенью
R(X), меньшей т, что
В этом случае мы будем называть QCk) правым частным А(Х)
iipn делении на В (Я) и R(X) — правым остатком А (К) при деле-
делении на В(Х). Подобно этому QW> R(h)—левое частное и ле-
левый остаток А(Х) при делении на В (К), если
и R(X)=0 или степень R(%) меньше т.
Если правый (левый) остаток А (X) при делении на В(Х) ра-
равен нулю, то Q(X) (Q(A)) называется правым (левым) делите-
делителем А (X) при делении на В(Х).
Чтобы придать смысл этим формальным определениям, мы
должны доказать, что для данных А (X) и В(Х), причем В(Х)
регулярная, обязательно существуют частные и остатки, как
они были определены выше. После того как это будет сделано,
мы докажем, что они также единственны. Доказательство сле-
следующей теоремы является обобщением алгоритма деления для
скалярных многочленов.
Теорема 4.2.1. Пусть Л (л), В(Х) — Х-матрицы степеней I, m
соответственно и В (X) регулярная. Тогда существуют правое ча-
частное и правый остаток Л (А) при делении на В (А) и подобно
этому существуют левое частное и левый остаток.
Доказательство. При I < m мы должны лишь поло-
положить Q(A) = O и R(X) = А(Х) для получения результата.
При I ^ m мы сначала произведем «деление» на ведущий
член матрицы В (А), а именно В0Хт. Заметим, что членом наи-
наивысшей степени А-матрицы A0Bq1K1~B(X) будет как раз Л0А',
124 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОГМЫ
¦Следовательно,
Л (X) = A0Bq {Х1~тВ (X) + А{[) (X),
где АAЦХ)— А,-матрица, степень которой 1\ не превосходит /—1.
Запишем А^ЦХ) по убывающим степеням:
ЛA) (X) = 4'^'' + Л!1 V'-1 + • • • + А\\>, 4" ФО, /, < /.
При / ^ т процесс повторяем, но уже применительно
к ЛО(А,) вместо А (X), получая в результате
ЛA) {X) = A^BoXXll-mB (X) + ЛB) (X),
тде
Таким способом мы можем построить последовательность
.Я-матриц А(Х), Л('>(Я), А^(Х), ..., степени которых строго убы-
убывающие. После конечного числа шагов мы получим /(.-матрицу
Л^Ц степени 1Г <. т с lr_i ^ т и (если положить Л(Х) =
))
A(s~x){X) = A{tX)BoXXl^-mB(X) + A(s){X), s=\, 2 г.
Объединяя эти равенства, получаем
Л (X) = (А0В^Х10-т + Л^Во-У'""" + • • •
A(r)(X).
Матрица в скобках может теперь считаться правым частным
А(Х) при делении на ВЩ и Л(Г)(Я) — правым остатком.
Читатель без труда произведет изменения в доказательстве,
нужные для того, чтобы убедиться в существовании левого ча-
частного и левого остатка. ^
Теорема 4.2.2. При предположениях теоремы 4.2.1 правое
частное, правый остаток, левое частное и левый остаток един-
единственны.
Доказательство. Предположим, что существуют такие
1-матрицы Q{%), R{\) и Qi(X), Ri{X), что
A(X) = Q(X)B(X) + R(X)
A(K) = Q1(VB(k) + Rl{b)
и из R{X), R\(X) каждая имеет степень меньше т. Тогда
{Q (Я) - Q, (X)} В (X) = /?, (X) - R (X).
При Q(X)=7^=Qi(X) левая часть этого равенства будет А,-матри-
цей, степень которой по крайней мере т. Но в то же время
правая часть — это ^.-матрица степени, меньшей т. Следова-
Следовательно, Qi(X)= Q(X), откуда также и R1(X)= R(X).
4.3. Х-МАТРИЦЫ С МАТРИЧНЫМИ АРГУМЕНТАМИ
125
Подобное приведенному рассуждение может быть использо-
использовано для получения единственности левого частного и левого
остатка. Л
Упр. 1. Найти правые и левые частные и остатки А(Х) при
делении на В (к), где
Я4 + № + X — 1 Я,3
2А.3 - X 2Х2 + 2Х
Я2+ 1 1
X X2 + .
А(Х) =
В(Х) =
Решение. Прежде всего заметим, что В(Х) регулярная.
Находим, что
2л
Х2+1 1
X Х2 +
2Х 2Х + 3
-5Я, -2Х
Х2 +
X
X2 Х+\
Я-1 1
Таким образом, В(Х) — левый делитель А(К).
4.3. Jw-матрицы с матричными аргументами
При рассмотрении скалярного многочлена р мы можем
записать
Для Х-матрицы с матричным аргументом в общем случае это
невозможно. Если А (а) — ^.-матрица над 2Г и В ^.&~пхп, мы
«определяем правое значение А(В) матрицы А (к) в В как
и левое значение А(В) матрицы А(Х) в В как
A(B) = ?M0 + #-M1+ ... +Ah
Читатель, по-видимому, знаком с классической теоремой об
остатке, а именно, что остатком при делении скалярного много-
многочлена р(Х) на Я, — Ь будет р(Ь). Мы докажем теперь замеча-
замечательное расширение этого результата на ^.-матрицы. Прежде
всего заметим, что IX — В — регулярная Л-матрица степени 1.
Теорема 4.3.1. Правые и левым остатками Х-матрицы А (X)
при делении на /Я, — В являются А (В) и А(В) соответственно.
126 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
Доказательство. Разложение на множители
может быть проверено произведением умножения справа. Умно-
Умножим обе части этого равенства на A^j слева и сложим получен-
полученные равенства при j = 1, 2, ...,/. Правая часть полученного ра-
равенства будет иметь вид С(Х) (IK — В), где С(Х)— А,-матрица.'
Левая часть равенства
? At-fi - ? At-jB1 = ? A^jK1 - ? Al-,B! = A(X) - А (В).
/=1 /-1 1-0 1 = 0 '
Таким образом,
= С (X) (IX — В) + А (В).
Результат следует теперь из единственности правого остатка.
Утверждение для левого остатка получается обращением
множителей в исходном разложении, умножением полученного
равенства на Лг_,- справа и суммированием. Л
Следствие. К-матрица А(Х) делится справа (слева) на
1% — В с нулевым остатком «=>Л (В) = 0 (А (В) = 0).
Предположим теперь, что 4е?"лхп и c(X) = det(/?. — А) —
характеристический многочлен матрицы А. Определим матрицу
?(А) = (/А, — A)v. Из определения присоединенной матрицы ви-
видим, что В (К) — А-матрица над &~ порядка п и степени п— 1 и
(/Я — А)В(Х) = В {X) (IX — А) = с (к) I.
Но с(кI — /^-матрица степени п и-эти равенства означают, что
матрица с(КI делится слева и справа на /Я — А с нулевым
остатком. Следовательно, согласно следствию, имеем:
Теорема 4.3.2. Если А — квадратная матрица с характе-
характеристическим многочленом с, то с(А) = 0.
Этот результат известен как теорема Кели — Гамильтона
и иногда формулируется в виде: каждая квадратная матрица
удовлетворяет своему характеристическому уравнению. Частный
случай этого результата появлялся в упр. 9 из § 2.5, где был
предложен совершенно другой подход, чем в этом параграфе.
Гамильтон опубликовал теорему для 2Х2-матриц в 1853 г.
и Кели сформулировал общее утверждение вскоре после этого,
но не дал доказательства. Первое полное доказательство было
опубликовано Фробениусом в 1878 г.
Эта теорема имеет такое важное следствие: Если f — любой
скалярный многочлен с коэффициентами в поле &~ и А е ЗГпхп,
то существует многочлен р (зависящий от А) степени, мень-
меньшей п, для которого /(Л) = р(А). Чтобы убедиться в этом, на-
4.3. Х-МАТРИЦЫ С МАТРИЧНЫМИ АРГУМЕНТАМИ 127
ходим многочлены q, r, которые будут частным и остатком при
делении / на с. Тогда
где г — либо нулевой многочлен, либо имеет степень меньше п.
Таким образом,
Ввиду теоремы 4.3.2, получаем /(Л) = г(А).
Этот результат еще раз появляется в главе 5 в качестве
следствия определения f(A) для более общих классов скаляр-
скалярных функций f.
Упр. 1. Проверить теорему Кели — Гамильтона для матрицы
II
I -1 3
Упр. 2. Воспользоваться теоремой Кели — Гамильтона для
вычисления А6 — 25Л2 + 112Л, где
0
2
-1
0
1
-1
2
0
3
Упр. 3. Имеется ошибка в следующем рассуждении-.теорему
Кели — Гамильтона можно доказать, подставляя Л вместо X
в с (А,) = det (Я./ — Л), что дает в результате с(Л) = 0. В чем она
заключается?
Упр. 4. Теоремой Кели — Гамильтона можно воспользоваться
для нахождения характеристического многочлена простой мат-
матрицы. Записывая характеристический многочлен с(ц) = цп —
— CjH" + ... +(—1ГС«> получаем
схА — с2А +...+(—1) с„/ = А .
Умножая это равенство на произвольный вектор ие?п справа,
получаем
Тс = Апа,
где с' —1| сх с2 ... с„ || и Т ^Wnxn,
Г./ = (-1)'-1Лп-'а, / = 1,2 п.
Таким образом, коэффициенты многочлена с(ц) находятся как
решение (если оно существует) неоднородного уравнения Тс =
= Апа. Столбцы матрицы Т вычисляются, начиная с первого,
128 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
при помощи умножения а слева повторно на А. При каких ус-
условиях вектор-решение с единственный?
Упр. 5. Воспользоваться упр. 4 для нахождения характери-
характеристического многочлена матрицы
12 4 6 II II О [I
3 9 15 с а= 0 .
4 16 36 1 || 1 1
4.4. Аннулирующие многочлены
Скалярный многочлен / над F называется аннулирующим
многочленом для квадратной матрицы А е^пхп, если f(A)= 0.
В теореме 4.3.2 утверждается, что с(А) = 0, а поэтому всегда
существует по крайней мере один аннулирующий многочлен сте-
степени п, порядка матрицы А. Мы, конечно, можем построить ан-
аннулирующие многочлены степени, большей п, но нас особенно
интересуют аннулирующие многочлены наименьшей возможной
степени. Чтобы избежать ненужных усложнений, мы будем рас-
рассматривать многочлены, у которых старший коэффициент (ко-
(коэффициент при наивысшей степени переменной) равен 1. Такой
многочлен называется приведенным. Мы определяем теперь при-
приведенный многочлен г|), являющийся аннулирующим многочле-
многочленом для А наименьшей степени, как минимальный многочлен
для А.
Теорема 4.4.1. Каждый аннулирующий многочлен мат-
матрицы А делится без остатка на минимальный многочлен для А.
Доказательство. Пусть f — некоторый аннулирующий
многочлен матрицы А и г|) — минимальный многочлен для А.
Пусть f (К) — г|)(Х)дг(^)+ г (К), где q, г — многочлены и либо г —
нулевой многочлен, либо его степень меньше степени г|). Вы-
Вычисляя f в А и замечая, что 1|)(Л)=0, получаем г(Л)=0.
Но г не может быть аннулирующим многочленом для А, так как
его степень меньше степени минимального многочлена г|з. Отсю-
Отсюда поэтому следует, что г = 0, и теорема доказана.
Мы можем доказать теперь следующую теорему.
Теорема 4.4.2. Минимальный многочлен для данной мат-
матрицы единствен.
Доказательство. Пусть tyi, \p2—минимальные много-
многочлены для А. Тогда по определению \р\ и ф2 — приведенные мно-
многочлены одной и той же степени, каждый из которых делится на
другой без остатка. Как легко видеть, это означает, что
¦ф1 = ф2- ^
Мы должны теперь исследовать связь между характеристи-
характеристическим и минимальным многочленами. Пока не бьгло сказано
ничего, что препятствовало бы этим многочленам быть совпа-
совпадающими. Действительно, как мы увидим, для некоторых мат-
4.4. АННУЛИРУЮЩИЕ МНОГОЧЛЕНЫ 129
риц это так и есть, но имеется также важный класс матриц, для
которых степень минимального многочлена меньше степени ха-
характеристического многочлена.
Нам нужно будет воспользоваться некоторыми простыми по-
понятиями из теории уравнений, задаваемых многочленами, эти
понятия мы поэтому сначала и перечислим. Многочлен с коэф-
коэффициентами в поле ЗГ будет обозначаться как многочлен над &~.
Если fu /2, •••, /ft, g— многочлены над SF, то мы говорим, что
g— общий делитель для f^, /г, •••, fk, если g делит каждый из f
без остатка. Многочлен к, который является общим делителем
для f\,. . . , /ft, называется наибольшим общим делителем, или
НОД, этих многочленов, если (i) h — приведенный многочлен
над У и (п) каждый общий делитель для /ь • • •, h будет де-
делителем п.
Заметим, что каждое множество многочленов над 3" имеет
общий делитель 1 (многочлен степени 0). Если два многочлена
над вГ имеют НОД 1, то они называются взаимно простыми
в У. Если f — многочлен над ЗГ и единственным приведенным
многочленом над &~, делящим f (и не совпадающим с крат-
кратным /), является 1, то / называется неприводимым над &~.
Упр. 1. Проверить следующие утверждения (многочлены —
над полем вещественных чисел):
0) НОД многочленов f (X) = (X + 1) (X2 + Я, + 1) и (А2 +
22 Х+1) Я2 +1
+ )( + ) р +
(И) НОД многочленов /(Я) и (X2— 1) (I2 + X + 1) равен
Ц+1)(Я.2 + А.+ 1).
(ш) Я + 1 и 5Х2 -\- 6 взаимно просты.
Упр. 2. Пусть f (X) = X2 + X + 1. Будет ли f неприводимым,
если его рассматривать как многочлен над (а) вещественными
числами, (б) рациональными числами, (в) комплексными
числами?
Упр. 3. Если f, g — многочлены над $Г и h — НОД для f
и g, то доказать, что существуют такие многочлены s и i над SP",
что для всех ief имеем h(x) = s(x)f(x) + t(x)g(x).
Мы можем теперь продолжить исследование связи между
характеристическим и минимальным многочленами. Рассмотрим
еще раз (стр. 126) Я-матрицу В(Х) = AХ — A) v степени п— 1
и порядка п. п2 элементов в В (X) — это скалярные многочлены
от X над &~. Пусть dn-\{X) — их НОД. Тогда существует А,-мат-
рица С(Х), известная как приведенная присоединенная, для ко-
которой
Я(Л) = </„_,(*) С (А,).
Но (IX — А) В (X) = с (ХI, так что
c(X)I = dn.l(X)(IX-A)C(X).
5 П. Ланкастер
130 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
Это равенство означает, что с(Я) делится без остатка на
dn-\{k), а так как оба многочлена с и dn-\ приведенные, то су-
существует такой приведенный многочлен i|), что
с(Л) = й„_1(Л)ф(Л), D.4.1)
откуда
ф(А,)/ = (А —Л)С(А,). D.4.2)
Таким образом, Я-матрица if (Я)/ делится на /Я — А слева'без
остатка, а поэтому, согласно следствию теоремы 4.3.1, г|)(Л) = 0,
т. е. \р — аннулирующий многочлен для Л. Мы сейчас докажем,
'~:~э гр будет минимальным многочленом для А.
Пусть \J>* — минимальный многочлен для Л; тогда, согласно
теореме 4.4.1, существует такой многочлен 6, что г|)(Я) =
= 1|з*(А,N(Я). Так как \|>*(Л) = 0, то из следствия теоремы 4.3.1
также полузаем, что \|>*(Я)/ делится на /Я — А слева без ос-
остатка. Таким образом, существует такая Я-матрица С+(Ъ), что
if* (Я) = (/Я - А) С+ (Я),
а следовательно, умножая на 9 (Я), получаем
\|> (Я) / = (/Я - А) С+ (Я) 8 (Я).
Сравнивая это равенство с равенством D.4.2), замечаем, что
(по единственности левого частного, теорема 4.2.2) С(Я) =
= С+(ЯN(Я). Но это означало бы, что 6(Я) — общий делитель
элементов матрицы С (Я). Это противоречит предположению, что
dn-\{%) — НОД элементов матрицы ВA), если только б (Я) — не
константа, многочлен степени 0. Так как \jj и \jj* — оба приведен-
приведенные многочлены, то получаем, что 6(Я)=1 и, следовательно,
что \р = ifi*. Таким образом, нами доказана
Теорема 4.4.3. Пусть с, ^ — характеристический и мини-
минимальный многочлен матрицы А соответственно. Если dn-iCK) —
НОД элементов матрицы (/Я — A)v, то с(Ъ) = dn-i(h)tyCk).
Упр. 4. Найти минимальный многочлен скалярной матрицы
A — al, ae^".
Решение. Если Ле^„хп, то В(Я) = (/Я — Ia)v = (Я —
— а)"-1/. Следовательно, dn-\(X) = A — а)". Как очевидно,
с (Я) = det(A — Л) = (Я — а)п и, следовательно, по теореме 4.4.3
•ф(Л}=Я — а. Заметим, что ф(Л) = А — al = 0.
Упр. 5. Сравнить характеристический и минимальный мно-
многочлены матрицы Л == diag {a, a, b, b).
Упр. 6. Найти (/Я — А)у
Л ~
если
0
0
0
0
1
0
0
0
0
1
0
0
0
0
1
0
4.4. АННУЛИРУЮЩИЕ МНОГОЧЛЕНЫ 131
и показать, что характеристический и минимальный многочлен
совпадают.
*Упр. 7. Доказать, что подобные матрицы имеют один и тот
же минимальный многочлен.
Не представляет труда выяснение некоторых свойств корней
минимального многочлена. Мы предположим сейчас, что А е
efnXn, и будем рассматривать с, if и т. д. как многочлены над
полем комплексных чисел. Таким образом, можно считать, что
каждый многочлен степени k имеет k и только k корней. Беря
определители в равенстве D.4.2), находим, что
г|5 (Я,)" = с (Я,) det С (Я).
Следовательно, каждый корень с будет также корнем я|). Но мы
имеем также с{\) = dn-\ (X)ty(X), а поэтому каждый корень ф
будет корнем с. Более того, кратность корня г|) не может пре-
превзойти кратности соответствующего корня с. Результат можно
сформулировать в следующем виде.
Теорема 4.4.4. Если А е^„Хп и характеристический мно-
многочлен матрицы А имеет вид
с (ц) - (|i - ц,)а' (ц - ii2)a> . .. (ji - ц,)Ч
где никакие два из комплексных чисел щ, .. . , \xs не равны, то
минимальный многочлен матрицы А имеет вид
if, Ох) - (ix - ц/- (ix - ^Р ... (и - iij\
где 1 < p, < ah j = 1, 2, . . . , s.
Следствие. Если матрица А е ^nxn имеет п различных
собственных значений, то ее характеристический и минималь-
минимальный многочлены совпадают.
Упр. 8. Если
|| 3—10
А= -1 зо
!!
и f—произвольный скалярный многочлен над полем комплекс-
комплексных чисел, то показать, что существуют такие комплексные
числа а, р, зависящие от f, что f(A) = а/ + рЛ. Показать, как
вычислить а, р.
Решение. Используя прием, описанный после теоремы
4.3.2, мы могли бы, конечно, выразить f(A) в виде многочлена
г\(А) степени 2 по А. Это достигается взятием в качестве п
остатка при делении f на с. Тот же самый способ может быть
использован для нахождения остатка г при делении / на яр.
Если ф имеет степень, меньшую степени с, то степень г может
оказаться меньше степени гь
132 ГЛ. 4 МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
В рассматриваемом случае легко находим, ч:и c({i) =
= (ц-2)»(ц-4) и
|(ц-3)(ц-2) -((г-2) О II
(М./-Л)У= -(ц-2) (ц-3)(ц-2) О
1 |i - 2 - (ц - 2) (ц - 4) (ц - 2) |
Следовательно, й!2((г)=|г— 2 и 1ф((г) = (ц— 2) (ц — 4). Мььмо-
жем теперь записать
где г(ц) — либо нулевой многочлен, либо имеет степень не
больше 1. Тогда f(A) = r(A), и первая часть поставленной за-
задачи решена.
Коэффициенты а, р могут быть найдены без проведения про-
процесса деления. Заметим, сначала, что собственные значения
матриц f(A) и г(А) совпадают и (по теореме 2.5.2) равны /B),
/D) и а + 2р, а + 4р соответственно. Таким образом, при за-
заданном многочлене / для нахождения аир можно решить си-
систему уравнений
4.5. Приведенная присоединенная матрица
и минимальный многочлен
Мы покажем сейчас, как может быть вычислена приведенная
присоединенная матрица, если уже известен минимальный мно-
многочлен. Пусть
ц(К)==Хт + а1Хт-1+ ... +ат.
Тогда
- ф (ц) = (Хт - iim) + а, О™ - ix'1) + ... + ат_, (X - ц)
и правая часть делится на К — ц. Пусть W(X, \х) — многочлен
степени т — 1 по X и |л, определенный как
Тогда имеем тождество
^(Л)-ф(ц) = (Я,-ц)^(Л, ц).
Далее, так как умножение IX на любую степень А коммута-
коммутативно, 4я(/А, А) определено однозначно и коммутирует с IX — А.
Следовательно, можно записать
•ф(IX) — ф(Л) = (IX — A)W(IX, А).
4.5. ПРИВЕДЕННАЯ ПРИСОЕДИНЕННАЯ МАТРИЦА 133
Но г|)(Л) = О и г|> (А) = г|> (X) I, так что
Сравнивая это с равенством D.4.2) и используя единственность
частного при делении -ф(А,)/ на IX — Л, получаем, что
Упр. 1. Пусть Л
член с. Определим
= W(IX, A),
п и имеет характеристический много-
Доказать, что если B(X) = (IX — A)V, то ()()
Упр. 2. Пусть Я; — собственное значение матрицы А. Дока-
Доказать, что C(Xj)=^=O и что ненулевые столбцы матрицы C(Xj)
•будут правыми собственными векторами А, соответствую-
соответствующими Kj-
*Упр. 3. Если Kj — собственное значение матрицы А, то до-
доказать, что ненулевые столбцы в В (Xj) (если они имеются) бу-
будут правыми собственными векторами для А, соответствую-
соответствующими Kj.
Упр. 4. Показать, что две матрицы
Л,=
6 2-2
-2 2 2
2 2 2
6 2 2
-2 2 0
0 0 2
имеют одинаковые характеристические многочлены, и найти
их минимальные многочлены. Воспользоваться упр. 2 для на-
нахождения правых собственных векторов А\ и А2.
Решение. Читатель легко проверит, чго характеристиче-
характеристическим многочленом, общим для Л) и Л2, будет
= (Ц - 4J (ц - 2) = ц3 -
- 32.
В теореме 4.4.4 утверждается, что минимальными многочленами
должны быть либо (ц — 4J(|л — 2), либо (ц — 4)(ц — 2).
Мы вычислим Bj(X) = (IX — Aj)v, /= 1, 2, при помощи упр. 1
и, следовательно, воспользовавшись теоремой 4.4.3, получим
¦Cj(X) и tyj{X). Таким образом, для обеих матриц имеем
ГП \— (Я3 - И3) - Ю (Я2 - ц2) + 32 (Я - ц) _
л — (л
= ц2 + (X - 10) ц + (Л2 - ЮЛ + 32)
/=1,2.
134
ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
Вычисляя Л? и А?, подставляя их в эти равенства и склады-
складывая, находим, что
IX 2 -2 |
-2 Л-4 2 I
2 2 А. — 4 И
|(Л-2J 2 (Л-2) 2 (А.-2)
-2 (Л-2) (Я -2) (к- 6) -4
О 0 (к - 4J
НОД элементов этих матриц равны (к — 4) и 1 соответственно.
Следовательно, ^(К) = (X — 4) (Я — 2) и ip2(A,) = (Я—4J(Я—2).
Для нахождения некоторых собственных векторов восполь-
воспользуемся упр. 2. Имеем
4 2-2
С, D)= ~2
2 2
С, B) =
2 2-2
-2 —2 2
2 2—2
откуда получаем два линейно независимых правых собственных
вектора, соответствующих собственному значению 4, например
Р И I '
и правый собственный вектор
соответствующий собственному значению 2. Заметим, что At —*
простая матрица.
Находим также, что С2D) дает лишь один собственный
вектор
— 1 II
1
о |
для собственного значения 4 и С2B) дает собственный вектор
для собственного значения 2.
4.6. Элементарные операции и эквивалентность Х-матриц
Как было отмечено в § 4.1, нашей целью в этой главе яв-
является приведение произвольной матрицы A^ffnXn к некото-
некоторому простому виду при помощи подобных преобразований.
.6. ЭЛЕМЕНТАРНЫЕ ОПЕРАЦИИ
135
Прежде чем мы сможем приступить к исследованию этого во-
вопроса, требуется получить дополнительную информацию о раз-
разложении на множители минимального многочлена матрицы А.
Эта промежуточная стадия состоит в общем приведении мат-
матрицы IX— А к некоторому простому виду посредством эквива-
эквивалентных преобразований, которые мы и собираемся описать.
Однако, так как почти с такой же легкостью мы можем обсу-
обсудить сразу редукцию общей Я-матрицы размера п\п при
помощи эквивалентных преобразований, наше внимание не
ограничивается рассмотрением лишь матриц вида IX— А. Это
даст возможность получить дополнительные важные результаты
относительно Я-матриц.
Мы определим сначала правые и левые элементарные опе-
операции над Я-матрицами, многочлены которых имеют коэффи-
коэффициенты в SF. Скобки относятся к левым элементарным опе-
операциям.
1. Умножение любого столбца (строки) на ненулевой эле-
элемент с е ST.
2. Прибавление к любому столбцу (строке) любого другого
столбца (строки), умноженного на произвольный многочлен
над ST.
3. Перестановка любых двух столбцов (строк).
Читатель без труда проверит, что, умножение некоторой
Я-матрицы размера 5X5 на каждую из следующих матриц
справа является правой элементарной операцией:
S, =
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
с
0
0
0
ь
0
0
0
1
0
0
0
1
0
0
0
1
0
W
0
0
0
1
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
I
f
0
0
0
0
1
С помощью Si второй столбец умножается на с; с помощью 5г
четвертый столбец, умноженный на Ь(Х), прибавляется ко вто-
второму столбцу; с помощью S3 (перестановочная матрица) второй
и четвертый столбцы меняются местами. Sb S2 и S3 называются
136 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
поэтому правыми элементарными матрицами. Для общей Х-маг-
рицы размера п\п правые элементарные матрицы, приводя-
приводящие к правым элементарным операциям над г-м и /-м столб-
столбцами, образуются так же легко и лишь их запись более гро-
громоздкая. Отметим, что правые элементарные матрицы могуг
быть получены произведением нужной операции над единичной
матрицей /.
Для описанных выше частных случаев аналогичные левые
элементарные матрицы задаются в виде
Ti = Si, 7*2 = 52, T3 = S3.
Однако обратим особое внимание на то, что левые элементарные
операции получаются при умножении слева А,-матрицы на левую-
элементарную матрицу. И опять любая левая элементарная
матрица может быть получена произведением соответствующей
элементарной операции над единичной матрицей.
*Упр. 1. Доказать, что определитель элементарной матрицы
не зависит от X:
*Упр. 2. Доказать, что левая (правая) элементарная мат-
матрица неособая и что ее обратная будет левой (правой) элемен-
элементарной матрицей.
Мы можем дать теперь формальное определение эквивалент-
эквивалентных преобразований. Две А,-матрицы над &~, А(Х) и В(Х), на-
называются эквивалентными или связанными эквивалентным
преобразованием, если В(Х) может быть получена из А (X)
последовательностью элементарных операций. Из совпадения
элементарных операций и операций, получаемых с помощью
элементарных матриц, следует, что А (X) и В (X) эквивалентны
в том и только в том случае, когда существуют такие правые
элементарные матрицы Е^Х), ..., ЕГ(Х) и левые элементарные
матрицы Fi(X), . . . , F3(X) (r, s ^ 1), что
где Р(Х), Q(X) — Я-матрицы над SF и
Р (А,) = ?,(*) ... Er(X),
Более того, из приводившихся выше упражнений следует, чт»
det Р(Х) и det Q(X) ненулевые и не зависят от X.
*Упр. 3. Обозначая факт эквивалентности А {).) и В(Х) че-
через А ~ В, доказать, что:
(i) A ~ Л;
(И) А ~ В означает В ~ Л,
(iii) Л ~ В и В ~ С означают А ~ С.
Упр. 4. Показать, что две следующие матрицы эквивалентны:.
2-Л Я2-1 И 0 0 Г
4.7. ПРИВЕДЕНИЕ ^-МАТРИЦ К ПРОСТЕЙШЕМУ ВИДУ
137
Решение. Мы приведем А{'к) к более простой матрице по-
последовательностью элементарных операций. Прибавляя сначала
первую строку, умноженную на —(X—1), ко второй, получим
1 о
1 -Л 1
Я Я + 1 [I
о о г
A)
Для дальнейшего упрощения прибавляем первый столбец с об-
обратным знаком ко второму:
Я, Я + 1
о о
—1
о
к 1
о о
B)
Прибавляя теперь второй столбец, умноженный на —X, к пер-
первому и переставляя, наконец, столбцы, получаем
C)
Я 1
О О
1 О
-к 1
0 1
1 О
1 О
о о
Объединяя A), B) и C), находим, что
где
1 -1|| 1 О
О 1 -Я 1
0 1
1 О
— 1 1 +Я
1 -Я
Отметим, что dei.Q(X) = I, detP(X) = —l.
Упр. 5. Показать, что следующие пары матриц эквивалентны:
(а)
(б)
О 1 Я |
Я Я 1 и
Я2 _ х я,2 - 1 Я2 - 1
1 О О
О 1 О
0 0 0
я2
Я-1
Я + 1
я2
1 О
О к1 — Я2
1
4.7. Приведение ^-матриц эквивалентными преобразованиями
к простейшему виду
В этом параграфе мы показываем, что Л-матрицу можно при-
привести к простой диагональной Л-матрице последовательностью
элементарных операций. Диагональная А,-матрица, обладающая
¦свойствами, описанными в лемме, называется канонической диа-
диагональной матрицей.
Лемма. Если А(X) — Х-матрица над 2F порядка п, то А(Х)
эквивалентна диагональной матрице diag {п\ (X),... ,as (X), 0,..,
138 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
...,0}, где s ^ п и fli(/.), ..., as(X)— приведенные многочлены
над $Г и djCk) делится на а^\(Х), f = 2, 3, . .., s.
Доказательство. Можно предположить, что А(Х)ФО,
ибо если это не так, то доказывать нечего. Доказательство со-
состоит лишь в описании последовательности элементарных пре-
преобразований, нужных для последовательного приведения строк
и столбцов матрицы А (X) к требуемому виду.
Шаг 1. Пусть ац(Х)— элемент матрицы А (К) наименьшей
степени. Перестановкой строк и столбцов (элементарные опера-
операции типа 3) переводим этот элемент в положение A,1) и обо-
обозначаем его через ац(л). Для каждого элемента первых строки
и столбца полученной матрицы находим частное и остаток при
делении на аи (X):
ан(Х) = ап{Х) qu(X) + ru{X), 1 = 2, 3, ..., п,
ая (X) = а,, (X) <7У1 (X) + Гц (X), ] = 1, 2, ..., п.
Далее, для каждого i и / вычтем из i-го столбца умноженный
на Ци{к) первый столбец и умноженную на qn(X) первую строку
вычтем из /-Й строки (элементарные операции типа 2). Тогда
элементы ац(К), ац(Х) заменятся на Гц (К) и Гц(к) соответ-
соответственно (i, j = 2,3,..., п), каждый из которых либо есть нуле-
нулевой многочлен, либо имеет степень, меньшую степени ац(л).
Если эти многочлены не все нулевые, то используем операцию
типа 3 для замены аи (Я) на элемент гц(Х) или г л (X) меньшей
степени. Далее повторяем процесс приведения степени внедиа-
гональных элементов первых строки и столбца к меньшей, чем
степень нового ац(К). Так как степень ац(Я) строго убывает
при каждом шаге, то, очевидно, в конечном счете мы приведем
А-матрицу к виду
ои (X) о ... о
О о22(Я) ... а2п{Х)
О ап2(Х) ... апп(Х)
D.7.
Шаг 2. Для матрицы вида D.7.1) ненулевыми элементами^
степень которых меньше степени аи(Х), могут быть теперь
ац(Х), 2^.i, j^n. Если это так, то повторяем шаг 1 и полу-
получаем другую матрицу вида D.7.1), но со степенью ап(Х), еще
меньшей. Таким образом, повторяя шаг 1 достаточное число-
раз, мы можем найти матрицу вида D.7.1), которая эквива-
эквивалентна А(Х) и для которой ап(X) — ненулевой элемент наи-
наименьшей степени.
Шаг 3. Завершив шаг 2, мы ставим вопрос: существуют л»
ненулевые элементы, которые не делятся на ац(Я)? Если такой»
4.7. ПРИВЕДЕНИЕ ^.-МАТРИЦ К ПРОСТЕЙШЕМУ ВИДУ
139
один имеется, например ац(к), то прибавим столбец / к столб-
столбцу 1; находя остатки и частные нового столбца 1 при делении
на аи (К), мы продолжим повторение шагов 1 и 2 и закончим
опять матрицей вида D.7.1), где ац(Х) заменен на многочлен
меньшей степени
Этот процесс опять может продолжаться лишь конечное
число шагов, после чего мы получим матрицу вида
а, (Я) О
О &22 (к)
О
О Ьпг(к) ... Ьпп(к)
где после операции типа 1 (если необходимо) ai(X)—приведен-
ai(X)—приведенный многочлен и все ненулевые элементы Ьц(Х) делятся на
л\(к) без остатка.
Шаг 4. Если все Ьц(Х) нулевые, то лемма доказана. Если
лет, то написанная выше матрица может быть приведена к виду
i (Л) 0 0 ... О
О а2(к) 0 ... О
О 0 сззМ ... с3п(к)
О 0 сп3 (к) ... спп (к)
где а2(к) делится на ai(k) и элементы сц(К), 3 ^ i, j ^ n, де-
делятся на а2(к). Продолжая этот процесс, получаем утверждение
леммы. ^
Упр. 1. Доказать, что, используя лишь левые (правые) эле-
элементарные операции, Х-матрицу можно привести к верхней
(нижней) треугольной Х-матрице В (к) со свойствами: если сте-
степень bjj(k) равна dj (j = 1,2,...,/г), то (i) dj¦, — О означает, что
bkj = 0 (bjh = 0), А = 1,2, ..., / — 1, и (ii) dj > 0 означает,
¦что степень ненулевого элемента bhj(k) (bjk(k)), k = 1, 2, ...
. . . , / — 1, меньше dy
Упр. 2. Воспользовавшись упр. 1, доказать, что если А,-мат-
рица имеет ненулевой определитель, который не зависит от Я,,
то она может быть выражена в виде произведения конечного
числа левых или правых элементарных матриц.
Упр. 3. Воспользоваться упр. 2 для доказательства того, что
•Х-матрицы А(к) и В (к) эквивалентны в том и только в том слу-
случае, когда существуют такие Х-матрицы Р(к), Q(k), что В(к) =
= Q(k)A(k)P(k) и detP(A,), detQ(k) отличны от нуля и не
зависят от к.
140 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
4.8. Эквивалентные преобразования матриц из ?Fn хп
Описанное в § 4.7 приведение Х-матриц принимает простой'
вид в важном частном случае, когда А (Я,) явно совсем не зави-
зависит от К, т. е. когда А(Х)—Х-матрица степени 0. В этом случае
элементы матрицы A(i)—элементы поля 9". Кроме того, в до-
дополнение к процессу приведения используемые в элементарных:
операциях типа 2 множители — это элементы поля ЗГ, а не мно-
многочлены над 9". Имея в виду это естественное ограничение для
допустимых элементарных операций, матрицы Л, Be STnxn на-
называем эквивалентными, если В может быть получена из А не-
некоторой последовательностью элементарных операций. Таким
образом, существуют такие неособые матрицы Р, Q e &~nXnr
что В = QAP.
Лемма из § 4.7 означает теперь, что для любой матрицы
Ле^"пХп существуют такие неособые матрицы Р, Q&@~nxnr
что А = Q diag {1,..., 1,0,... ,0} Р. Читатель легко проверит,,
что число единиц в диагональной канонической форме равно-
в точности рангу матрицы А. Таким образом,
Теорема 4.8.1. Матрица ЛеЛхл эквивалентна п X п-
матрице diag {1,..., 1,0,... ,0}, где число единиц на диагонали
равно рангу матрицы А.
Упр. 1. Воспользовавшись упр. 1 из § 4.7, показать, что мат-
матрица А е У„хп может быть приведена к верхнему (нижнему)
треугольному виду при помощи лишь левых (правых) элемен-
элементарных операций.
4.9. Инвариантные многочлены и каноническая форма Смита
Возвратимся к изучению Х-матриц и, в частности, к резуль-
результату леммы из § 4.7. Наша ближайшая цель — показать, что-
многочлены а\(К), ..., as(h) однозначно определяются А,-матри-
цей А (К) и не зависят от выбора эквивалентных преобразова-
преобразований и что эти многочлены общие для класса всех А,-матриц„
эквивалентных А(К).
Определим сначала ранг ^-матрицы как порядок наиболь-
наибольшего минора, который не равен нулевому многочлену. Предпо-
Предположим, что Х-матрица Л(Х) размера «Х« имеет ранг г, и пусть
^j(^) — НОД всех миноров матрицы А (К) порядка /, /= 1, 2, ...
..., г. (Это согласуется с определением dn-\{k), использован-
использованным в теореме 4.4.3) Очевидно, любой минор порядка / ^ 2
может быть выражен в виде линейной комбинации миноров по-
порядка /— 1, так что dj-i(K) будет обязательно делителем dj{%).
Если определить do(X)= 1, то в последовательности
do (Я), d,(A) dr(X)
4.9. ИНВАРИАНТНЫЕ МНОГОЧЛЕНЫ HI
j() делится на dj-i(k), j = 1, 2, ..., г. Запишем соответствую-
соответствующие частные следующим образом:
. /л,\ dr {%) . ,, ч dr-t (Я.) . ,.v d, (Я)
''W = rfr_,(л)' ^-iW-rfr_2W > •••> 'iW-d^AT
Многочлены ii(^), . ••> 'V(^) называется инвариантными много-
многочленами матрицы А (к). Употребление слова «инвариантные»
будет оправдано, если мы покажем, что эти многочлены инва-
инвариантны относительно эквивалентных преобразований матрицы
А (к). Пусть В (к)—произвольная ^-матрица, эквивалентная
А (к). Тогда существуют такие Х-матрицы Р{к), Q(k), что
В(к)= Q(k)A(k)P(k) и detP(k), det Q(k)— ненулевые кон-
константы. Последние условия означают, что Р~1(к) и Q~l(k)—
также Я-матрицы.
Мы можем применить к равенству В = QAP дважды фор-
формулу Бине — Коши для выражения некоторого минора матрицы
В (к) порядка / в виде линейной комбинации миноров матрицы
А(к) того же самого порядка. Отсюда поэтому следует, что
ранг г (В) матрицы В (к) не превосходит г (А). Однако, приме-
применяя то же самое рассуждение к Х-матричному равенству А =
= Q-'SP-1, находим, что г(А)^г(В). Следовательно, г(В) =
= г(А).
То же самое разложение равенства В = QAP показывает,
что бр(Х), НОД миноров матрицы В порядка р, делятся на
dP(k). Но опять равенство А = Q^BP^1 означет, что dp(k) де-
лигся на 8р{к), а следовательно,
6p(k) = dp(k), р=1, 2 г.
Поэтому В (к) и А (к) имеют одни и те же инвариантные мно-
многочлены.
Применим этот результат к канонической диагональной
форме, полученной в лемме из § 4.7. Ясно, что
dx (к) = а, (к), d2 (к) = а, (к) а2 (Я), ..., dr{k) = a{ (к) а2 (Я) ... аг (к)
и, следовательно, что
г.
Каноническая диагональная форма diag {ii{k),.. .,ir(k),0,...
...,0} известна как каноническая форма Смита. Г. Дж. С. Сми-
Смитом этот вид был получен для матриц целых чисел (которые
имеют почти ту же самую алгебраическую структуру, что и
Я-матрицы) в 1861 г. Этот результат для Я-матриц был получен
Фробениусом в 1878 г. Нами доказана
Теорема 4.9.1. k-матрица А (к) ранга г эквивалентна мат-
матрице diag {fi (Я.),... ,ir (Я,), 0,..., 0}, где Й(к), ..., ir(k) —инва-
—инвариантные многочлены для А (к).
142
ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
Следствие. Две к-матрицы эквивалентны 4=> они имеют
одинаковые инвариантные многочлены.
Для получения следствия заметим, что мы уже доказали,
что эквивалентные ^.-матрицы имеют одинаковые инвариантные
многочлены. Наоборот, если две Х-матрицы имеют одинаковые
инвариантные многочлены, то теорема означает, что они имеют
одинаковые канонические формы Смита. Свойство транзитив-
транзитивности отношений эквивалентности (§ 4.6, упр. 1 (iii)) означает
тогда, что Х-матрицы эквивалентны.
Наконец, следует заметить, что если в утверждении теоремы
элементы матрицы А (X) — это многочлены над #", то инвариант-
инвариантные многочлены имеют коэффициенты в том же самом поле &".
Упр. 1. Найти (из их определения) инвариантные много-
многочлены следующих матриц:
(а)
О 1 Я
X X 1
X2 — X Х2—\ Х2—1
IX X2 О
я3 я5 о
О О 2Х
Решение. Для матрицы (а), как легко видеть, определи-
определитель равен 0. Следовательно, ее ранг меньше 3. Для всех мино-
миноров порядка 2 составляем следующую таблицу.
Строки
1,2
1,3
2,3
1,
-X2
Я2-
9
Я
+ я
-я
Столбцы
1,3
Л 2
- Я3 + X2
я3-я2
2,3
1 —
- Я3 + Я2
X2
_|-
-я
Я-1
+ 1
Поэтому d2(l)= 1 и di(K) = 1. Следовательно, /j (%) = dl (К) = 1
и i2(K) = d2(k)/di(l)= 1 (ср. упр. 5 (а) из § 4.6).
Для матрицы (б) определитель равен 2К7 — 2?Л Следова-
Следовательно, dz(X)^=K7 — К6 (приведенный многочлен по определе-
определению НОД). Используя введенную выше таблицу для миноров
порядка 2, записываем в этом случае:
Строки
1,2
1,3
2,3
1.2
Xs -Я5
0
0
Столбцы
1,3
0
2Я2
2Я4
1',3
0
2Х3
2Х6
1.10 ПОДОБИЕ 143
Поэтому d2(X) = X2 и dl(X) = X. Следовательно, /t (Я.) = Я, ь(Я) =
в=^2(Л)М(Л) = Я, и i3(X) = d6(V/d2(X)=X5-X\
*Упр. 2. Доказать, что минимальный многочлен матрицы
Ле^пХп совпадает с инвариантным многочленом матрицы
XI— А наивысшей степени.
4.10. Подобие
Этот параграф посвящен установлению связи между экЕИга-
лентными и подобными преобразованиями. Мы можем теперь
воспользоваться полученными для эквивалентных преобразова-
преобразований Х,-матриц результатами для достижения объявленной цели
этой главы, а именно, приведения матриц из fnXn к канониче-
каноническому виду посредством подобных преобразований. Следующая
теорема является связывающим звеном между этими двумя на-
направлениями, при этом мы все еще можем рассматрузать мат-
матрицы с элементами из произвольного поля ST.
Теорема 4.10.1. Матрицы А, ВеУлх, подобны <=ф IX—А
и IX — В имеют одинаковые инвариантные многочлены.
Доказательство. 1. Допустим сначала, что А и В по-
подобны. Тогда существуют такая неособая матрица Ге fnxn,
что А = ТВТ~1. Отсюда получаем равенство
/Я, —Л = Г (А —Я) Г*1,
которое означает, что IX — А и IX — В эквивалентны. По след-
следствию теоремы 4.9.1 получаем теперь, что IX — А и IX — В
имеют одинаковые инвариантные многочлены.
2. Наоборот, предположим, что IX — А и IX — В имеют оди-
одинаковые инвариантные многочлены. Тогда они эквивалентны
и существуют такие Х-матрицы Р(Х) и Q(X), что
P(X)(IX — A)Q(X) = IX — В
и detP(^), detQ()v) не равны нулю и не зависят от X. Таким
образом, полагая М(X) = [Р(Х)]~\ замечаем, что М(Х)—л-мат-
рица и
М {X) {IX — В) = (IX — A)Q (X).
Предположим теперь, что деление М(Х) слева на IX — А
и Q(X) справа на IX — В приводит к равенствам
M0,
Q0, DЛ0Л>
где Мо, Qo не зависят от X. Производя тогда подстановку в пре-
предыдущее равенство, получаем
{(А - A) S (X) + Мо} (А - В) = (А - А) {Т (Я) (А - В) + Qo},
144
ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
откуда
(А - A) (S (Я) - Т (Я)) (/Я - В) = (/Я -A)Q0 — Мо (/Я - В).
Но этс есть тождество между Я-матридами и, так как степень
Я-матрицы справа равна 1, из него следует, что 5(Я)^Г(Я);
если это не так, то степень Я матрицы слева равна по крайней
мере 2. Следовательно,
так что
Мо (/Я - В) = (/Я - A) Qo,
Q0, M0B = AQ0 и М0В =
D.10.2)
D.10.3)
Теперь следует лишь доказать, что Af0 неособая, и доказатель-
доказательство будет закончено.
3. Предположим, что деление Р (Я) слева на /Я — В дает
где Ро не зависит от Я. Воспользовавшись тогда равенствами
D.10.1) и D.10.2), получим
/ = М(Я)Р(Я) = {(А - A)S(k) + Мо} {(А - 5) ?/(Я) + Ро} =
= (А - A) {S (Я) (А — В) U (Я)} +
+ (/Я - A) Q0U (Я) + (A -A)S (Я) Ро + М0Р0 =
= (/Я - Л) {Q (Я) t/ (Я) + S (Я) Ро} + МоРо.
Следовательно, Q(X)L/(X,) +S{K)PU = 0 и MQP0 = I. Таким
образом, detAfo^O и равенство D.10.3) означает, что А и В
подобны. Ч
4.11. Первая естественная нормальная форма
Пусть f — приведенный скалярный многочлен над &~:
ДЯ) = Ят + а,Ят~1+ ... +ат.
Мы определяем матрицу LeJm)(m no f равенством
о о
— am — ctm_i
Эта матрица называется сопровождающей матрицей для f и
имеет некоторые интересные свойства.
4.11. ПЕРВАЯ ЕСТЕСТВЕННАЯ НОРМАЛЬНАЯ ФОРМА
145
Лемма 1. Если L(f)—сопровождающая матрица приведен-
приведенного многочлена f над $Г и f имеет степень т, то
(i) характеристический многочлен матрицы L(f) равен f;
(ii) минимальный многочлен для L(f) равен f,
(iii) инвариантные многочлены для IX — L(f) равны 1, ... ,1, f-
Доказательство. 1. Имеем
IX -L =
0
-1
X
- 1 О
X -1
Ct2 X + dl
Для вычисления det(A — L) прибавляем умноженный на X1
¦столбец /+ 1 к первому для /= 1, 2, ..., пг — 1. В результате
получим
О -1 ... О
О Л •
det(/A-L) =
f(X) am-, .
X -1
. a2 X + ai
Разлагая этот определитель по первому столбцу, получаем
утверждение (i).
2. Алгебраическое дополнение элемента а,п в IX — L равно 1.
Это означает, что НОД элементов d {II — L)v равен 1. Утверж-
Утверждение (ii) следует теперь из теоремы 4.4.3.
3. Заметим, что IX — L имеет ненулевые миноры порядков
1, 2, ..., m — 1, которые в то же время не зависят от X. Следо-
Следовательно, в обозначениях § 4.9 имеем dm-\ = dm-2 = ...
... d\ = 1, а так как dm = f согласно (i), определение ir(X) =
= dr(X)/dr-i(X) приводит к утверждению (iii). ^
Лемма 2. Если A e?Fnxn, то сумма степеней инвариантных
многочленов матрицы IX — А равна п.
Доказательство. Так как IX — А—А-матрица ранга п,
теорема 4.9.1 означает, что существуют Я-матрицы Р(Х), Q(X),
определители которых — ненулевые константы и
P(A)(/A-^Q(A) = diag{MA), /2(A) /„(А)}.
При взятии определителей левая часть становится кратной ха-
характеристическому многочлену и имеет степень п, откуда и по-
получаем нужное утверждение. Л
Мы теперь в состоянии доказать теорему о простом нормаль-
нормальном виде, к которому подобными преобразованиями может быть
приведена матрица из &~пхп- Эта первая нормальная форма
146 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
будет также элементом из ЗГпхп. Будет удобно пользоваться
следующим определением. Матрица А называется квазидиаго-
квазидиагональной, если она может быть разбита на блоки Aqr, где
q, г = 1, 2, ..., k, k ^ 2, Aqq — квадратная матрица для каж-
каждого q и Aqr = 0, как только q ф г. В этом случае мы пишем
j4 = diag{i4u, A22, ..., Akk}.
Теорема 4.11.1 (первая естественная нормальная формаI.
Если А <=^~пхп и IX— А име:: инвариантные многочлены iT(X),
ir+\(X), ..., in(X) ненулевой степени, то А подобна квазидиаго-
квазидиагональной матрице
L = diag {L (ir), L (ir+l), . .., L (/„)}.
Доказательство. Так как инвариантные многочлены
определены над 8Г, лемма 2 обеспечивает то, что L ^&~пхп- Мы
покажем, что IX— А и IX— L имеют одинаковые инвариантные
многочлены, из чего утверждение будет следовать затем по тео-
теореме 4.10.1.
Используя утверждение (ш) леммы 1 и теорему 4.9.1, убеж-
убеждаемся в том, что IX — L(is) эквивалентна диагональной матрице
L>s = diag{l, 1, ••¦, 1, is{X)}, s — г, r+1, •••, «• А тогда, как:
нетрудно видеть, IX — L будет эквивалентна диагональной мат-
матрице IX —D, где ?> = diag{A., ..., ?>„}. Таким образом, суще-
существуют такие Я-матрицы Q(h) и R(X) с ненулевыми константами
detQ(X) и detR(X), что
IX — L = Q(X) (IX — D)R (X).
Определим теперь
A = diag{l, 1, .... 1, ir{X), .... »„(*,)}.
Элементарными операциями типа 3 (§ 4.6) можно превратить-
IX — D в IX —А. Следовательно, IX — L и IX — А эквивалентны,,
и мы опознаем IX — А как каноническую форму Смита для
IX — L (теорема 4.9.1). Таким образом, 1,1, ..., 1, гг, ...
..., in(X)—инвариантные многочлены одновременно для IX—L
и IX — А. <
Упр. 1. Найти первые естественные нормальные формы для
матриц из упр. 8 (§ 4.4) и упр. 4 (§ 4.5).
Упр. 2. Если X— собственное значение матрицы L(f), то-
доказать, что существует соответствующий правый собственный
Еектор х с х' = ||1 XX2 ... Xm~l\\.
4.12. Элементарные делители над полем комплексных чисел
Мы попытаемся теперь привести первую естественную нор-
нормальную форму к еще более простому виду. Очевидно, эта за-
задача зависит от возможности приведения сопровождающих мат-
матриц инвариантных многочленов. Здесь поле &~, над которым
4.12. ЭЛЕМЕНТАРНЫЕ ДЕЛИТЕЛИ НАД ПОЛЕМ КОМПЛЕКСНЫХ ЧИСЕЛ 147
определены эти многочлены, начинает играть важную роль, ибо
дальнейшее приведение получается при рассмотрении разложе-
разложения каждого инвариантного многочлена на неприводимые мно-
множители над ST. Для простоты и потому, что это — наиболее важ-
лый случай в приложениях, мы ограничимся рассмотрением мат-
матриц (и, следовательно, инвариантных многочленов), определен-
определенных над полем комплексных чисел ??'.
Мы рассмотрим сначала случай ^-матрицы А (к) размера
лХл с определенными над W элементами, имеющей ранг п и
инвариантные многочлены i\(l), ^(Я), ..., in (к). Определим
корни datA(k) как скрытые корни матрицы А (К). Так как
det Л (Я) —многочлен над W, можем записать
где k\ Ф О, К\, А.2, ..., ks— различные скрытые корни А(к) и
¦raj ^ 1 для каждого /. Из канонической формы Смита полу-
получаем, что
п
det A (I) = k2 П it (Я.).
/=i
где k2 ф 0. Так как инвариантные многочлены приведенные, от-
отсюда следует, что k\ = k2 и
П «•/(л) = П(л-лА)т*.
/=i k=i
Кроме того, так как ij(K) является делителем ij+i(K) для
/=1, 2, ..., п — 1, то существуют такие целые числа a,jh,
1</<пи l^A^s, что
D.12.1)
a2fe < ... < ank 1
\ = l, 2 s.
Z, a/ft = mft J
Каждый множитель (К — Xft)a/fe, входящий в разложения
D.12.1) с ctjft > 0, называется элементарным делителем А(Х).
Элементарный делитель, для которого а^ъ. = 1, называется
148 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
линейным, в противном случае — нелинейным. Элементарные
делители (Я, — Яь)а/6 можно считать соответствующими Ял в оче-
очевидном смысле.
Перед переходом к общему приведению матриц из ?„х« тре-
требуется выяснить еще одну деталь. Она содержится в следующей
теореме.
Теорема 4.12.1. Если ЛA), В(Я)— неособые %-матриць~1 с
определенными над <& элементами, то множество элементарных
делителей квазидиагональной матрицы
ШАЛ —Ил) ° II
DW —1| о В(Х)\\
будут объединением множеств элементарных делителей матриц
Л (Я) и В (К).
Доказательство. Так как det ?>(Я) = (det A (Я)) X
X (det В (Я)), то некоторый скрытый корень Я] для ?>(Я) будет
скрытым корнем либо для А (Я), либо для В (К), либо для обеих
матриц вместе. Предположим поэтому, что А(Х) имеет инва-
инвариантные многочлены н(К), ..., iP(k), причем
= \, 2
и что В {К) имеет инвариантные многочлены h (Я) А, (Я),
причем
, s=l, 2, ..., q.
Можно предположить также, что
...<ap и
и затем расположить ненулевые а и р в неубывающем порядке,
перенумеровав их следующим образом:
Далее, очевидно, матрица D(X) эквивалентна матрице
^), ..., ip(K), /, (Я)
4.13. ВТОРАЯ ЕСТЕСТВЕННАЯ НОРМАЛЬНАЯ ФОРМА ]4?
Переставляя строки и столбцы, находим, что D(K) эквива-
эквивалентна матрице
dlag {(А. — A.,)v« (*), (А-АОМ*), •-., (А. — А,,)^ (*),
(*), (*>> .... (*)},
где (*) обозначает многочлен, взаимно простой с Я— Яь Если
D(K) имеет размерность п, то многочлены du(K), и = 1, 2, ...,пу
для D(K) имеют вид
и, следовательно, инвариантные многочлены для D(K) имеют
вид
/„ (Я) = (Я - Я,O- (•), in-л (Я.) = (А. - Я,,)**- (*), ...
Отсюда следует, что соответствующие Я1 элементарные делители
для Л (Я) и В (Я) будут также элементарными делителями для
D(X). Так как проведенное рассуждение применимо к каждому
отдельному скрытому корню матрицы О(Я), теорема дока-
доказана. ^
Упр. 1. Каковы элементарные делители Я-матрицы (б) из
упр. 1 (§ 4.9)?
Упр. 2. Найти элементарные делители матрицы /Я — D, где
D — диагональная матрица.
Упр. 3. Если Л (Я) — регулярная Я-матрица порядка п и сте-
степени /, то показать, что она имеет In скрытых корней (подсчи-
(подсчитанных с учетом их кратности). Если эти In скрытых корней
различны, то показать, что элементарные делители матрицы
А (Я) линейны. (Кратность скрытого корня Я1 — это число появ-
появлений множителя Я — Я1 при разложении det Л (Я,) на линейные
множители.)
Упр. 4. Если %\ — скрытый корень кратности а для л X га-
матрицы А (Я), то доказать, что соответствующие Xi элементар-
элементарные делители все линейны •<=> нулевое подпространство мат-
матрицы Л (Я]) имеет размерность а. '
4.13. Вторая естественная нормальная форма
и жорданова нормальная форма
Лемма. Матрицы А, Ве^„х„ подобны Ф=> /Я — А и
/Я — В имеют одинаковые элементарные делители.
Доказательство. По существу лемма является перефор-
переформулировкой теоремы 4.10.1. Ибо, если /Я — А, /Я — В имеют
одинаковые элементарные делители, то они должны иметь-
150 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
одинаковые инвариантные многочлены, и поэтому, согласно
теореме 4.10.1, матрицы А и В подобны.
Наоборот, если А и В подобны, то Ik — А и Ik—В имеют
одинаковые инвариантные многочлены и, следовательно, одина-
одинаковые элементарные делители. А
Теорема 4.13.1 (вторая естественная нормальная форма).
Если в\(к), ..., ер(к) обозначают элементарные делители для
Ik — А, А е^пхп.го А подобна квазидиагональной матрице
Lj = diag {L {в\), L (e2), . ¦., L {ep)}.
Доказательство Как мы видели (лемма 1 из § 4.11),
единственным инвариантным многочленом ненулевой степени
для Ik — L(ej) будет ej(k) и, следовательно, ej(k)—единствен-
ej(k)—единственный элементарный делитель для Ik — L(ej)- Повторное приме-
применение теоремы 4.12.1 означает теперь, что элементарными дели-
делителями для Ik — Li будут e\(k), ..., eP(k) и, согласно лемме,
А и L, подобны. ^
Теперь мы можем очень легко получить жорданову нормаль-
нормальную форму. Остается лишь придать подходящий вид диагональ-
диагональным блокам во второй естественной нормальной форме. Предпо-
Предположим, что
ej (k) = (А — k/Yi.
Определим жорданову клетку, соответствующую этому элемен-
элементарному делителю, как матрицу // е= ^Р. Хр., задаваемую в виде
Я/ 1 0 ... 0
0 Я/ 1
! 1
0 ... Я/
Иногда удобно записывать жорданову клетку в другом виде.
Мы определяем сначала Нп как «X «-матрицу с единицами в
верхней «наддиагонали» и нулями во всех других местах. Таким
образом, элементы матрицы Нп задаются как hjh = 6j+i,jt для
/, k = 1, 2, ..., п. Имеем тогда
// = /Л/ + ЯР/, D.13.1)
где предполагается, что порядок / равен р3-. Следует также за-
заметить, что при Pj = 1 мы берем J j = kj. В этом случае элемен-
элементарный делитель линейный.
Теорема 4.13.2 (жорданова нормальная форма). Если
т!е?„у„ и Ik — А имеет р элементарных делителей с соответ-
соответствующими жордановыми клетками I\, fa JP и I =
¦= diag{/i, ..., /Р}, то А и J подобны.
4.13. ВТОРАЯ ЕСТЕСТВЕННАЯ НОРМАЛЬНАЯ ФОРМА ]51
Доказательство. Согласно лемме и второй естественной
нормальной форме мы должны лишь доказать, что элементар-
элементарные делители матриц IX —13 и IX— L(e3) совпадают для
/= 1, 2, .... р, причем мы уже знаем, что единственным эле-
элементарным делителем для IX — L(e3) будет е3(Х).
Рассматривая ^-матрицу IX — J3, убеждаемся в том, что в
ней имеются миноры порядков 1, 2, ..., р3—1, принимающие
значения ± 1. Ясно, также, что det (IX — /у) = (X — Xj)pi = е$ (X).
Отсюда следует, что е3(Х)—единственный элементарный дели-
делитель для IX — Jj, j — 1, 2, ..., p. A
Мы можем теперь получить две новые характеризации про-
простых матриц.
Следствие 1. Матрица A^Wnxn простая <ФФ все эле-
элементарные делители Х-матрицы IX — А линейные.
Доказательство. Пусть сначала A^Wnxn простая и
U = diag {ць . .., ffn] — диагональная матрица собственных
значений для А. Тогда существует такая неособая матрица
X е ffnxn, что А = XUX-1, откуда
IX- A = X(IX-U)X.
Повторным применением теоремы 4.12.1 легко убеждаемся
в том, что элементарные делители диагональной матрицы IX— U
все линейные. Так как написанное выше равенство означает,
что IX — А и IX—U эквивалентны, то элементарные делители
для IX — А совпадают с таковыми для IX—U, а поэтому ли-
линейны.
Наоборот, если все элементарные делители линейны, то каж-
каждая жорданова клетка D.13.1) имеет р3 = 1, так что матрица
J из теоремы превращается в диагональную матрицу. Матрица
А поэтому подобна диагональной матрице и, следовательно, А
простая. ^
Таким образом, приведение простой матрицы к диагональ-
диагональному виду, описанное в теореме 2.4.2, является частным случаем
общего приведения к жордановой нормальной форме.
Следствие 2. Матрица из ЧРп^п простая <=> ее минималь-
минимальный многочлен имеет лишь простые корни.
Доказательство. Как бы видели (упр. 2 из § 4.9), ми-
минимальный многочлен i|) матрицы Ле?лхл совпадает с инва-
инвариантным многочленом in для IX — А наивысшей степени. Таким"
образом, простота А означает, что все элементарные делители:
для IX — А линейные, и поэтому
П
152
ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
где ць ..., |lis — все различные собственные значения матри-
матрицы А.
Наоборот, если \|>, а следовательно, и in имеют лишь про-
простые корни, то определение элементарных делителей означает,
что они все линейные. Следовательно, согласно первому след-
следствию, А простая. Л
Упр. 1. Найти жордановы нормальные формы для двух _мат-
риц из упр. 4 (§ 4.5).
Решение.
Для IX — Л,:
Для IX — А2:
d3 (Я) = (А - 2) (А - 4J,
Элементарные делители
таковы:
/з(А) = (А-2)'(А-4J.
Элементарные делители
таковы:
(А-2), (А-4J.
Жорданова нормальная
форма такова:
| 2 0 0 |
О 4 1 1
0 0 4
(А-2), (А-4), (А-4).
Жорданова нормальная
форма такова:
12 0 0 |
0 4 0 .
0 0 4 I
Упр. 2. Если А е 'S'mxto и А — А имеет инвариантные мно-
многочлены h(К)= ... = h(l) =1 и 18(А) = К + 1, fe(X) = А3 + 1,
ilo(X) = (А3 + IJ, то найти первую и вторую естественную нор-
нормальную формы и жорданову нормальную форму матрицы А.
Решение. Как легко видеть, первой естественной нормаль-
нормальной формой будет
= dlag
—10 0—200
Если положить ц, = — 1, jLt2, з = A/2)±(л/з/2)г, то
0
0
-1
1
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
8
i9 (А) = (А — Hi) (А - ц,2) (А - Ц
*ю (А) = (А - ^,J (А - ^2J (А -
СМЕШАННЫЕ УПРАЖНЕНИЯ
15»
и поэтому имеются семь элементарных делителей, четыре из-
которых линейные. Получаем, что
= diag|-l,
1,
О 1
-1 -2
О
-V-2
М-з.
= diag{-l, -1,
-1
О
1
-1
1*2.
О 1
-Из 2^
Из 1
О из
}¦
II-
Упр. 3. То же самое, что в упр. 2, с
/j\ ; /л \ ; /л \ 1 „ ; /л \ \ ; М \ л 2 (\ О\
\\) 1\ \К) = . . . = l-j \А) = 1 И tg \А) — Л, I9 \"/ — " \" — &IY
г10(Л) = Л2(Л-2J(Л2+1);
(ii) Л—матрица 12X12 и ii{k)== ... = г9(А.) = 1, iw(k) =
= к2 + 1, in (Л) = Я4 + 5Я2 + 4, /12 (Л) = Л6 + 6Л4 + 9к2 + 4.
Упр. 4. Доказать, что геометрическая кратность некоторого
собственного значения равна числу элементарных делителей, со-
соответствующих ему.
Смешанные упражнения
1. Если А (к), В (к), D(k) — Х-матрицы порядка п и А(к)г
В (к) регулярны и имеют степени /, т соответственно, то дока-
доказать, что степень произведения A (X)D(k)B(k) не меньше I-{-т.
2. Показать, что если A^ffnxn — идемпотентная матрица и
А =Ф I, А Ф 0, то минимальным многочленом для А будет
к2—к и характеристический многочлен имеет вид (к—l)rA,s.
Доказать, что А подобна матрице
/г 0J
о о|-
3. Если \р — минимальный многочлен матрицы Ле?„хп и
/ — некоторый многочлен над W, то доказать, что f(A) неосо-
неособая Ф=> i|j и / взаимно просты. Обобщается ли результат на
многочлен над произвольным полем ЗГ и матрицу ^еУпхп?'
4. Пусть А (к) — Х-матрица размера п\п со скрытыми кор-
корнями А,], ..., кп, и предположим, что существуют такие линейна
независимые векторы <7ь ¦••, <7п, что A(kj)qj — 0 для /= 1,
. . . , п. Если Q — II q\ . . . qn II,
5 = QAQ~l, то доказать, что 5
А (к).
5. Если А (к) = А0к2 -\-A\k + А2 — регулярная Я,-матрица, то-
доказать, что A (k)q = 0 в том и только в том случае, когда
Л = Ik — diag {k\, . . . , кп} и
будет правым делителем для
(I
Обобщить
степени.
этот
о Ai
результат
-А,
о
о
Xq
Ч
==0.
на регулярные ^.-матрицы любой
154 ГЛ. 4. МИНИМАЛЬНЫЙ МНОГОЧЛЕН И НОРМАЛЬНЫЕ ФОРМЫ
6. Исследовать собственные значения матрицы Нп, опреде-
определенной в § 4.13. Показать, что #« = 0 и что единичные векторы
еи ¦.., eh порождают /С(Н„) для k = 1, 2, ..., п.
7. Если Я и JC обозначают образ и аннулируемое под-
подпространство соответственно, то показать, что
, 7 = 1, % ..-, п.
8. Исследовать вид матрицы (IKn — Hn)h при k ¦< п и при
9. Как известно из упр. 4 (§ 4.13), если А — Л имеет р эле-
элементарных делителей, то существуют р линейно независимых
правых собственных векторов для Л. Как можно дополнить эти
р собственных векторов до базиса в ^п?
[Указание. Если А = XJX~\ то столбцы матрицы X обра-
образуют базис требуемого вида. Предположим для простоты, что
/i — единственная клетка в /, соответствующая собственному
значению ци и что /fe имеет порядок nh. Тогда для k eg: щ имеем
]f (-Hnt)k, (/(И1-Ц2)-ЯЯ|)*, ...}
и замечаем, что существуют k и лишь к столбцов из нулей в
матрице справа.]
*10. Пусть матрица A^.cSnxn имеет различные собственные
значения fii, ..., fxs, и предположим, что максимальная степень
элементарного делителя, соответствующего fu, равна yh,
k = 1, 2, ..., s. Тогда ул называется индексом ц/(. Если Jfh —
аннулируемое подпространство для {I\i.k — A)Sk, то показать, что
11. Показать, что характеристический и минимальный многс-
-члены для матрицы
а0 <*i а2 а3
— а, а0 — аз а2
— О.2 аз cio — ai
— а3 — а2 ai — а0
равны соответственно (Я2 — 2а0Я + (ао + ^ + ^ + «з)У с / = 2'
/=1.
Дополнение к главе 4
Чтобы подвести итог рассуждениям этой главы, приводящим
¦к нормальным формам, мы выделяем ниже некоторые из основ-
•ных положений. Мы рассматриваем лишь те результаты, кото-
которые нужны для получения нормальных форм, и поэтому некото-
некоторые из результатов и определений главы появляются здесь в
несколько ограниченном объеме. За пояснениями и обозначе-
обозначениями следует обратиться к основному тексту этой главы.
ДОПОЛНЕНИЕ К ГЛАВЕ 4
155
df (Л) —НОД миноров в IX —А
порядка г.
Эквивалентные преобразования
Инвариантные многочлены
для IX — А:
d (Я,)
Каноническая форма Смита:
IX— Л эквивалентна
diag{a, (X) йя(М}.
А, В е &~пхп подобны АА /\ —Л и IX —В имеют одинаковые инвариантные
многочлены.
Если L (!) — сопровождающая матрица
для f, то IX— L (f) имеет
инвариантные многочлены
I. 1 1, /.
Множители инвариантных многочленов
для А — А приводят к элементарным
делителям.
Если инвариантными многочленами
для If- — А являются
1. 1 '• is *п и
{(s)(
то А и L подобны.
Л, Be %nXn подобны фф II — А
и Ik —В имеют одинаковые
элементарные делители.
Первая естественная нормальная
форма
Если е—элементар-
е—элементарный делитель, то
единственным эле-
элементарным делителем
для A — L (е)
будет е.
Если I^ — жорданова
клетка, соответствую-
соответствующая элементарному
делителю е^, то един-
единственным элемен-
элементарным делителем
для IX — 1^
будет е^
Если IX—Л имеет
элементарные
делители е., .... е„ и
А и Z.J подобны,
Вторая естественная
нормальная форма
Если
/р), то Л и /
подобны
Жорданова нормаль-
нормальная форма
Глава 5
ФУНКЦИИ ОТ МАТРИЦ
5.1. Введение
В этой главе мы рассматриваем матрицы из ?пХп (включая
как частный случай и матрицы из Япхп) и возможность при-
придать смысл выражению !{А), где / — комплекснозначная функ-
функция комплексной переменной и А ^.^пхп. Мы хотели бы, чтобы
определение f (А) охватывало настолько широкий класс функций
/, насколько это возможно. Как мы видели, вопрос решается без
труда в случае, когда f—многочлен над полем комплексных
чисел. Более того, если матрица А имеет минимальный много-
многочлен i|) степени т, то для многочленов f существуют такие мно-
многочлены q и г, что
и г — либо нулевой многочлен, либо имеет степень меньше т.
Таким образом, так как г|5(Л) = О, имеем f(A) = r(A).
Более общие функции f, которые будут рассматриваться,
сохранят это свойство, т. е. для данных f и А будет существо-
существовать такой многочлен г (со степенью, меньшей степени мини-
минимального многочлена для А), что f(A) = r(A). Нам потребуется
сначала некоторые результаты о приближениях при помощи
многочленов.
5.2. Интерполяционные многочлены
Пусть Xu ta> • • • . ^* — различные комплексные (или веще-
вещественные) числа и fu f2 fs — произвольное множество комп-
комплексных (или вещественных) чисел. Мы хотим определить неко-
некоторый интерполяционный многочлен степени s—1, принимаю-
принимающий значения /ь ..., fs при ки ..., ks соответственно. Можно
дать простую конструкцию для такого многочлена. Определим
5.2. ИНТЕРПОЛЯЦИОННЫЕ МНОГОЧЛЕНЫ 157
сначала базисные многочлены 1\, ..., 1а степени s — 1 как
/*(*)= П (я-яУП^-яд k = \, 2 s.
Как нетрудно проверить, эти многочлены обладают свойством:
ММ = 6У- /, k = \, 2 s.
Тогда многочлен Лагранжа с нужными свойствами есть
Более того, L — единственный многочлен степени s — 1 с
L(kj) = fj, /= 1, 2, ..., s. Ибо если существует еще Lx с теми
же самыми свойствами, то L\— L будет многочленом, степень
которого не превосходит s—1 и имеющим корни в различных
точках Х\, ..., Xs- Это означает, что Lx — L — нулевой много-
многочлен и, следовательно, L\ = L.
Такова основная задача лагранжева приближения. Нам по-
потребуется нечто более общее. Мы хотим фиксировать не только
значения функции в hi, ..., Xs, но также некоторое число mh— 1
последовательных производных интерполяционного многочлена
в hi для k = 1, 2, ..., s. Таким образом, имеются т.и условий,
наложенных на многочлен в точке Kk, и если m = mi -f- m2 + ...
... +ms, то мы разыскиваем интерполяционный многочлен сте-
степени т — 1. Эта задача известна как задача общей интерполяции
Зрмита.
Решение этой задачи более громоздкое, чем простого случая
Лагранжа, но в принципе не более трудное. Мы определяем
сначала
tk (Я) = Ц (Я - А/)т//П (lk - k,)mt, k = 1, 2, ..., s,
и замечаем, что при nij = 1 для / == 1, 2, ..., s имеем th(X) =
= lk(%). При s = 1 следует полагать ^(Х)=1. Тогда tk(X)
принимает значение 1 в Xh и равен нулю в каждой точке Xj Ф Xk,
но производные не обладают нужными свойствами. Определим
Tk,p как многочлен степени р, получаемый срезанием ряда Тей-
Тейлора для 1/4 (X) по степеням X — JU. Тогда мы утверждаем, что
4>к! М = —(j—\)\ {k W Тк, mk-j (^)t
Л = 1, 2, .... s, j=l, 2, .... тк, E.2.1)
158 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
имеют базисные интерполяционные свойства:
ф*. «* (М = о. фУ,> mk (К) = о, ..., Фр?> (Ч) = 1
и
Ф# (Лр) = 0 для р ф k и г = 0, 1, . .., т„ — 1,
где мы пишем ф^ (А,) для s-й производной от фй/ в А,. Заме-
тим, что если т= 2 оть Т0 Фл/ имеет степень (/— \)-\-{т—mk) +
+ (mft — }) = tn—1. Теперь мы можем выписать многочлен Я
степени, не большей т— 1, который удовлетворяет т условиям
H^(Xk) = ff, k=\, 2 s и /- = 0, 1, .... mk — \. Он равен
H(l)=ZiZf(t1)<Pkl(V. E.2.2)
Упр. 1. Доказать, что tk(K)Tht Р(Х) — 1 — многочлен от (К —
— Kk), в котором каждый член имеет степень не меньше р-\-\.
Упр. 2. Доказать базисные интерполяционные свойства мно-
многочленов Щу
Упр. 3. Доказать, что определенный выше многочлен Я
единствен.
*Упр. 4. Показать, что в случае s = 1 равенство E.2.2) пре-
превращается в
н(я,) = h+ iiz^il;<¦> + <я-^)а /(а + ...
4 ^^fC!)
••• ^ (m,-l)! '1
5.3. Определение функции от матрицы
Предположим, что матрица Aefnxn имеет различные соб-
собственные значения А,ь Я,г, .... Я,» с индексами*) ти т2 т„
так что минимальный многочлен для А равен
ф (Я) = (Я — Я,)т' (Я - Я2)т^ ... (Я — Я8)т*.
Пусть g. h — многочлены над &, для которых g(A)=h(A), и
положим d — g — h. Тогда d (A) = 0, так что d — аннулирующий
*) См. упр. 10 на стр. 154. В обозначениях равенств D.12.1) mj = a*.
5.3. ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОТ МАТРИЦЫ 159
•многочлен и поэтому (теорема 4.4.1) делится на \р. Таким обра-
образом, существует такой многочлен р, что
Не, очевидно, для /г=1, 2, ..., s
H>(A*) = 1>0)(**)= ••• =^
откуда получаем, что
В общем случае т чисел
= i, 2,...,
называются значениями функции f на спектре матрицы А. Про
любую функцию f, для которой эти числа существуют, мы будем
говорить, что она определена на спектре матрицы А. Очевидно,
каждый многочлен определен на спектре любой матрицы из
'&пхп и, в частности, мы показали, что многочлены g к h имеют
одинаковые значения на спектре матрицы А, если g(A) = h(A).
Наоборот, если g и h — любые два многочлена с одинако-
одинаковыми значениями на спектре матрицы А, то d — g— h имеет
корень кратности nih в Хь для каждого k. Следовательно, d дол-
должен делиться на \|з, и поэтому d(A)= 0, т. е. g(A) = h(A). Нами
доказана
Лемма. Если g и h — многочлены на *& и А^'ё'пхп, то
g(A) = h(A) <?=> g и h имеют одинаковые значения на спектре
матрицы А.
Именно это свойство многочленов с матричными аргумен-
аргументами мы используем теперь для определения /(Л) с более об-
общими функциями /. Таким образом, мы будем требовать, чтобы
все функции, которые определены на спектре матрицы А и при-
принимают там одинаковые значения, приводили к одной и той же
матрице f{A). В частности, для любой /, определенной на спек-
спектре А, мы будем иметь возможность записать f(A) = g(A),
где g — некоторый многочлен. Всегда можно взять g в виде
общего интерполяционного многочлена E.2.2) Эрмита. Таким
лбразом, можно положить
Z] Z^
где f[l) = fU) (Xk) — j-я производная от /, вычисленная в Xk.
С первого взгляда это требование кажется очень жестким,
¦но, как мы увидим, оно удовлетворяет всем нашим потребностям
и включает в себя второй подход к задаче с использованием
.степенных рядов. Таким образом, если функция f определена на
160 ГЛ 5. ФУНКЦИИ ОТ МАТРИЦ
спектре матрицы А, то мы по определению полагаем f(A) —
= g(A), где g— произвольный многочлен, принимающий те же
самые значения, что и /, на спектре А. Согласно лемме выбор
многочлена g не имеет значения и, как мы знаем, выбор, опре-
определяемый равенством E.3.1), дает многочлен наименьшей воз-
возможной степени. Следовательно, имеем:
Теорема 5.3.1. Если f — некоторая функция, определенная
на спектре матрицы А, и g — интерполяционный многочлен ми-
минимальной степени, определенный значениями функции f на
спектре А, то f(A) = g(A).
Если А — простая матрица, то многочлен E.3.1) принимает
особенно простой вид. В этом случае имеем (следствие 2 тео-
теоремы 4.13.2) nil = m2 — ... = mh = 1, так что
g(X)=t
t
k
где 4 — базисный многочлен лагранжева типа степени s—I.
Упр. 1. Вычислить f(А), где f(k) = eM и Л= „ 0 .
Решение. Собственные значения для А равны Я] = 3,
Я2 = 5, так что минимальным многочленом матрицы А будет
(Я — 3) (Я — 5). Мы не используем в явном виде лагранжева
интерполяционного многочлена g, а, зная, что он должен быть
степени 1, записываем g(k) = а + рЯ с константами а, р, кото-
которые следует определить. Как мы знаем, f(h) — g(fa) и f(X2)=-
= g{k2), так что
а + ЗР = e3t, а + 50 = е5'.
Решая эти уравнения относительно а и Р, находим
Таким образом,
1 . | 3 1 || 1 II 1 I ||
2 || 3 — 1 JI 2 || —3 3 || *
*Упр. 2. Если
12 0 0 |
0 11
0 0 1 1
то доказать, что
|| 0 0 0 II
л " II о о 1 II
5.3. ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОТ МАТРИЦЫ
161
*Упр. 3. Пусть Нп — «X «-матрица
О 1 0 0 ... О
0 0 1 0 ... О
О 0 ... 1
о о ... о
и f(k)— некоторая функция, имеющая п — 1 производных в
к = 0. Найти f(Hn).
Решение (ср. упр. 6 на стр. 154). Минимальный многочлен
для Нп равен Хп и значениями f на спектре Нп будут поэтому
f@), /0@), ..., р-'>@). Положим f<*> =/<*> @), k = Q, I,...
..., п— 1. Интерполяционный многочлен g степени п— 1, опре-
определенный значениями / на спектре Нп, как нетрудно видеть, ра-
равен (упр. 4 из § 5.2)
1 1 1 , 1\ 1
Имеем тогда f (Нп) = g (Hn). Таким образом,
г , , 1
Вычисляя степени Нп, находим, что
f I fd) I fB)
'о л 'о 2! ° '"
n f ' fO
U /n ~ГГ In
.(п-1)
о
0
fn
1!
1 fd)
тг 'о
О ... О f0
*Упр. 4. Пусть / = Ао + ^и — жорданова клетка порядка и
и f(A)—некоторая функция, имеющая п—1 производных в
X = Хо. Если fW — k-я производная от f в Хо, k = 0, 1, .... л — 1,
то доказать, что /(/) совпадает с матрицей, выписанной в ре-
решении упр. 3.
Теорема 5.3.2. Если А — квазидиагональная матрица
A — diag{Ah A2, ..., Ар}
и f определена на спектре матрицы А, то
f (A) = diag {/ (Л))» / (-^г)» • • •» f (^p)}-
6 П. Ланкастер
162 гл. 5. функции от матриц
Доказательство. Прежде всего, ясно, что для любого
многочлена h
), .... А Ир)}.
Следовательно, если g— интерполяционный многочлен для f на
спектре А, то
f{A) = g(A) = diag{g(At), ..., g(Ap)}.
Далее, так как спектр для Aj (у = 1, 2, ..., р), очевидно,
является подмножеством спектра для А, то f определена на
спектре Aj, а так как g и f совпадают на спектре А, то они
должны совпадать также на спектре Aj. Следовательно, f(Aj) =
= g(Aj). и мы получаем
f(A) = diag{f(Al),...,f(Ap)}. 4
Теорема 5.3.3. Если А, В, Ге ^„у„, А = Т~1ВТ и f опре-
определена на спектре А, то f(A)= T~1f(B)T.
Доказательство. Так как А и В подобны, они имеют
одинаковые минимальные многочлены (упр. 7 из § 4.4). Таким
образом, если g — интерполяционный многочлен для f на спек-
спектре Л, то g будет также интерполяционным многочленом для /
на спектре В, и мы имеем f(A) = g(A), f(B) = g(B). Но, оче-
очевидно, g(A) — T~lg(B)T (§ 2.4), откуда следует, что f(A) =
= T-lf{B)T. <
Если есть возможность привести матрицу А е <&пхп к жорда-
новой нормальной форме и f определена на спектре А, то f(A)
находится затем очень легко. Предположим сначала, что мат-
матрица А простая с собственными значениями ц\, (i2, . • •, \in-
В этом случае существует такая матрица Ге?пхп, что
^ = 7'"'diag{n1) ..., цп}Т.
Воспользовавшись теоремами 5.3.3 и 5.3.2, немедленно убеж-
убеждаемся в том, что
= T-idisLg{f(lil), ..., ТЫ Т.
В общем случае мы можем лишь предположить, что А по-
подобна матрице в жордановой нормальной форме, т. е. что су-
существует такая матрица Т, что
1, ..., 1Р}Т,
где ]\, ..., Jp — жордановы клетки, соответствующие элемен-
элементарным делителям Х-матрицы /Я — А (теорема 4.13.2). В этом
случае получаем
f(^) = r-1diag{fG1), .... f(JP)}T,
и матрицы f (/ft) верхние треугольные, вид которых описан выше
5.4. СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ ДЛЯ НА) 163
в упр. 4. Заметим, что если Д соответствует собственному зна-
значению fu, то диагональные элементы в /(Д) все равны Д[и),
а так как собственные значения треугольной матрицы совпа-
совпадают с ее диагональными элементами, то собственные значения
матрицы f(A), возможно кратные, равны /(щ), ..., f((ip).
Верна поэтому
Теорема 5.3.4. Если \хи ..., цп — собственные значения
матрицы A e'g'nxn и f определена на спектре А, то собственны-
собственными значениями матрицы f(A) будут f(pn), ..., f{\in)-
Приведенное выше упр. 2 служит иллюстрацией того, что
элементарные делители, соответствующие некоторому выделен-
выделенному собственному значению, не обязательно сохраняются при
преобразовании, определяемом f. В рассмотренном случае эле-
элементарный делитель собственного значения я/2 матрицы А не-
нелинеен, а элементарные делители собственного значения
f(n/2)= 1 матрицы f(Л) линейны.
5.4. Спектральное разложение для / (Л)
Следующее (спектральное) разложение для f(A) имеет боль-
большое значение и, очевидно, тесно примыкает к уже полученной
спектральной теореме для простых матриц (теореме 2.5.1).
Теорема 5.4.1 Если A^ffuxn, f определена на спектре
A, ftjP — значение \-й производной от f в собственном значении
%h (k = 1, 2, ..., s, j = 0, 1 ..., mh — 1) и nik — индекс %к, то
существуют такие независимые от f матрицы Zkj, что
s mk
/04)=1 .?/</-%,.. E.4.1)
Кроме того, матрицы Zk, линейно независимы как элементы из
Wnxn и коммутируют с А.
Доказательство. Напомним, что / и многочлен g, опре-
определяемый равенством E.3.1), принимают одинаковые значения
на спектре матрицы А. Следовательно, f(A) = g(A) и равенство
E.4.1) будет выполняться, если положить
Так как q>kj определяется свойствами минимального многочлена
для А, то Zhj не зависит от /. Немедленно также получаем, что
каждое Zhi коммутирует с А.
Остается лишь доказать, что эти матрицы линейно незави-
независимы. Мы оставим читателю в качестве упражнения доказать,
что многочлены щ, — линейно независимые элементы простран-
пространства !?m-i многочленов степени не выше m—1, где m = m.i-\-
6*
164 ГЛ. 5. ФУНКЦИИ ОТ МАТРИП
Предположим, что
? 2 ckjzki = о,
и определим h (Я) = J], cfr, 7-фй/- (К)—многочлен пространства
k, i
!?т-\. Тогда равенство Zkj = Фйj(А) означает, что /г(Л) = О. Но
m — степень минимального многочлена матрицы Л и, так как h
аннулирует Л, из теоремы 4.4.1 следует, что h — нулевой много-
многочлен и, следовательно (так как q>kj независимы), что Chj = 0 для
всех k и /. Таким образом, матрицы Zki линейно независимы. ^
Мы будем называть матрицы Zhj компонентами матрицы А.
Заметим, что, так как они линейно независимы, ни одна из них
не может быть нулевой.
Рассмотрим более подробно случай простых матриц. В E.4.1)
мы имеем теперь т.\ = т2 = . .. = ms = 1, так что
=t fkZ
k
kX
для простой матрицы А. Сравним это равенство с результатом
теоремы 2.5.1. Применяя оба результата к базисным лагранже-
вым многочленам /&(Я), определенным в § 5.2, получаем, что
Zh\ равна сумме сопровождающих матриц, соответствующих соб-
собственному значению %h- Как тогда нетрудно видеть, ZM — идем-
потентная матрица и образ ZM — это правое собственное под-
подпространство, соответствующее hh (т. е. нулевое подпростран-
подпространство матрицы Ihi — А). Таким образом, теорема 2.5.1 оказы-
оказывается частным случаем теоремы 5.4.1. Из следствия теоремы
2.5.1 получаем, что
S
?;?*,=/ и ZMZn = bkjZkh E.4.2)
хотя первый из этих результатов, как легко видеть, верен для
всех матриц ^е^пхп, следует лишь положить f(A)= 1 в ра-
равенстве E.4.1). В следующем параграфе мы покажем, что вто-
второй результат тоже верен в общем случае.
Заметим, наконец, что в рассматриваемом случае фы = lh,
k = 1, 2, ..., s, так что
?w = Фы И) = к {А) = П (А - 1,1) П (К - А-/)- E-4.3)
1Фк 1фк
5.4. СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ ДЛЯ f(A) 165
*Упр. 1. Если Aefnx». T0 доказать, что
и
Упр. 2. Если А—простая матрица, ty — минимальный мно-
многочлен и С(Х) — приведенная присоединенная к А матрица, то
доказать, что
7
Решение. Заметим сначала, что, так как А простая,
и поэтому
ф(О(Я/)=П
1Фк
Таким образом, приняв во внимание равенство E.4.3), сле-
следует лишь доказать, что
П
!Фк
Используя результаты §4.5, записываем С(Х) — W{IX, Л), где
Ч: (A, ^l) =:= ^ '"= г
Так как ф (Я^) = 0, то
7_1 ' Т-Т
Следовательно,
to Л) = П (А - hi).
*Упр. 3. Доказать результат упр. 2 при предположении, что
Kh имеет лишь линейные элементарные делители (и Л не обя-
обязательно простая).
166 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
5.5. Свойства компонентных матриц
Мы исследуем теперь свойства компонент некоторой общей
матрицы А е Wnxn- При этом впервые находит применение
жорданова нормальная форма. Если /—жорданова нормаль-
нормальная форма для А, то существует такая неособая матрица
Т е^ихп, что А = TJT-1, и если
/ = diag{/b ..., /р},
то из теоремы 5.3.2 получаем
гк, = щ,{А) = Тй1яе{щ1{11), .... Ф„(/Р)}7'-'. E.5.1)
Рассмотрим две возможности:
Случай 1. Пусть /ц, — жорданова клетка порядка лд, соот-
соответствующая Ъл. Тогда, используя базисные интерполяционные
свойства фА,- в Xk, т. е. то, что Ф^~° (V) = бг/, г, / = 1, 2, ...
..., ni]U и упр. 4 из § 5.3, убеждаемся в том, что
Заметим также, что Пц =g; mh.
Случай 2. Другая возможность состоит в том, что жорда-
жорданова клетка Jv порядка nv соответствует собственному значению
Xi ф hA. Тогда «v ^ Щ, и мы замечаем, что фу вместе со своими
первыми rtii—1 производными равна нулю в Я = Яг. Опять ис-
используя упр. 4 из § 5.3, получаем, что
Для упрощения обозначений рассмотрим теперь случай k = 1
и предположим, что J\, ..., Jq — все жордановы клетки мат-
матрицы А, соответствующие Х\. Тогда в равенстве E.5.1) будем
иметь
(/-l)!Z,/ = rdiag{(^Bl)/-1 (Я»,)'"'. О, ..., 0}Т~1 E.5.2)
для ] = 1, 2, . .., Ш\. В частности, имеем
Z1I = rdiag{/l,1+...+v 0} Г. E.5.3)
Вид результатов для общих Л& теперь совершенно ясен, а если
это так, то утверждения следующей теоремы очевидны.
Теорема 5.5.1. Компоненты Zkj (k = l, 2, ..., s, j =
¦= 1, 2, ..., m-h) матрицы Ле^вхв удовлетворяют условиям:
(ii) ZkpZir = Q, если кф1;
5.5. СВОЙСТВА КОМПОНЕНТНЫХ МАТРИЦ 167
(Hi) Zlt = Zkl
(iv) ZklZkr = Zkr, r = l, 2, ..., mk.
Эти результаты следует рассматривать как обобщения ре-
результатов следствия 1 теоремы 2.5.1. Следующая теорема позво-
позволяет нам очень легко находить все компоненты, как только из-
известны идемпотентные компоненты Zh\.
Теорема 5.5.2. Для k = 1, 2, ..., s и j = 1, 2, ..., nth
имеем
Доказательство. Заметим сначала, что результат три-
тривиален для /= 1. Опять без потери общности мы предположим
k = 1 и воспользуемся соответствующими обозначениями, вве-
введенными выше. Равенство E.5.2) для / = 2, 3, ..., т, дает
(/-2)!7-1ZIi/_Ir = diag{(^i)/-2, .... (Hnqy-\ 0, .... О}.
Затем, так как А — XJ — T(J — \J)T~\ имеем также
T~x{A-KJ)T = A\&g{Hn , #v Jq+]-lJ, .... Ур — Л,/}.
Объединяя эти два равенства, получаем
0-2)!7-1(Л-Я1/J,./_1Г =
= diag{(//„,)'-', .... (HnJ-\ 0, ..., 0}=(/-1)!7-121/Г,
если опять воспользоваться равенством E.5.2). Таким образом,
Zu = j^{A-'K,l)Z^i-b / = 2, 3 тк.
Применяя этот результат повторно, получаем
¦Z)/ = /• _ jw (A — KJ) Z]],
что и доказывает теорему. 4
Теорему 5.5.2 следует дополнить некоторым описанием идем-
потентных компонент ZhI.
Теорема 5.5.3. Если 31 и Л" обозначают образ и аннулируе-
аннулируемое подпространство соответственно, то
Доказательство. 1. Мы опять будем рассматривать слу-
случай k= 1. Если / — жорданова форма для матрицы А, исполь-
168 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
зованная в доказательствах выше, то
(/_ Я,/Г ==diag {(//„, )"*, ..., (Hnq)m\ (V.-VT, ...
.... (/„-Vr} = diag{0 0, (V,-V)mi, •••. {Jq-hDm'}>
так как ti\, п% ¦ ¦ ¦, пд ^ Ш\. Клетки (Jr — h\I)m\ как легко ви-
видеть, неособые для г = q -\- \, ..., р, а поэтому аннулируемое
подпространство матрицы (/ — XJ)m' натянуто на единичные
векторы еи е2, ..., eN, где N = п\ + п2 + ... -(- nq. Пусть & обо-
обозначает это пространство.
Имеем также
(Л - А,/Г = Г (/- V)m'7",
откуда сразу же следует, что x^Jf{A — kiI)m'<^T~]x e <§.
2. Равенство E.5.3) может быть заяисано в виде
2„ = Г||е,в2 ...eN0 ... 0\\Т~\
Таким образом, |e^?(Zn) в том и только в том случае, когда
существует такой вектор ц, что | = Zuij, или
7-1| = ||е1 ...eN 0 ... ОНГ-'л,
т. е. когда Г^еЖИе, ... eN 0 ... 0||) = ^.
Объединяя полученные утверждения, имеем теперь
откуда и следует теорема.
К сожалению, результат доказанной теоремы не обобщается
до того, чтобы дать столь же простое описание для &(Zkj) при
/> 1. Однако некоторый результат для 91{Хкт^) приводится в
упр. 2 ниже.
Упр. 1. Доказать, что (Л — Kkl)mk lkx = 0.
Упр. 2. Доказать, что 3i (Zkl) => Я (Zk2) => ... =)Я(гктк)
и что 31{1итЛ будет подпространством S в Jf(A — KhI). Пока-
Показать, что размерность S равна числу жордановых клеток, соот-
соответствующих Xfe и имеющих порядок ти-
Упр. 3. Если х, у — правый и левый собственные векторы
соответственно с собственным значением %\, то доказать, что
Znx = x и y'Zn =y'.
Упр. 4. Если А—эрмитова матрица, то доказать, что Zhi
будет проекцией на правое собственное подпространство для %к-
5.5. СВОЙСТВА КОМПОНЕНТНЫХ МАТРИЦ
169
Обращаясь к задаче нахождения матриц Zh), видим, что оче-
очевидный способ — это найти сначала базисные эрмитовы интер-
интерполяционные многочлены щ, и затем положить Zkj = yhj{A).
Однако, как мы видели, вычисление многочленов фу может
быть очень трудоемким, и упражнение 5 указывает, как этого
можно избежать.
*Упр. 5. (ср .упр. 4 из § 4.5). Найти компоненты матрицы
16 2 2 II
-2 2 0 .
О 0 2 1
Решение. Как мы видели, минимальный многочлен мат-
матрицы А равен (к — 4J(Я— 2), так что для любой функции f,
определенной на спектре Л, теорема 5.4.1 дает
Мы подставим вместо / три целесообразно выбранных ли-
линейно независимых многочлена и решим полученную систему
уравнений относительно Z\\, Z]2, Z2]. Таким образом, полагая
f(X)= 1, Я — 4, (Я — 4J, по очереди получаем
12 2 2
— 2-2 О
О 0—2
«00 0 |
0 0 -4 1
0 0 4
Эти уравнения легко решаются:
1 0 0
0 1 1
0 0 0
Z[2 —
о о
о о -
о о
2
— 2
0
0 |
•: •
2 2
¦2 —2
0 0
Заметим, что в общем случае результаты теорем 5.5.1 и
5.5.2 могут помочь в решении уравнений для компонентных
матриц.
Упр. 6. Найти компоненты для матрицы
-112 1
0—10—3
0 0 1 1
0 0 0 0
170
5.6. Последовательности и ряды матриц
В этом параграфе мы показываем, как можно применить
другие понятия анализа к матрицам, в частности к функциям
от матриц, как они были определены. Мы рассмотрим сначала
множества матриц, определенных неотрицательными целыми
числами, т. е. последовательности матриц.
Пусть Аи А2, ... — некоторая последовательность матриц,
принадлежащих ^mXn, и пусть afj1 — (г, /)-элемент матрицы
Ар, р= 1, 2, ... Последовательность Ль Л2, ... называется схо-
сходящейся к матрице А е WmXn, если существуют такие числа ац
(элементы матрицы А), что я^'—*"Я?/ при р—»• оо для каждой
пары индексов i, j. Последовательность, которая не сходится,
называется расходящейся. Таким образом, сходимость последо-
последовательностей матриц определяется как поэлементная сходи-
сходимость. Введенное определение включает также в качестве част-
частных случаев сходимость вектор-столбцов и вектор-строк.
Упр. 1. Пусть А\, А2, ... и В\, В2, ... — сходящиеся последо-
последовательности из ffmxn и Ар-^-А, ВР—*В при p-voo. Доказать,
что при р—* со будет Ар-\- Вр-+ А -\- В. Если последователь-
последовательность ВиВ2, ... из &ПХ1, то доказать, что АРВР-*АВ.
[Указание. Эти результаты следуют из основных свойств
последовательностей комплексных чисел. Для второго утвержде-
утверждения, если ар—*а и bp-+b при р-+оо (для комплексных чисел),
то записать
anbn = {а + (ап - а)} {Ь + (Ъп - Ь)},
откуда получаем
anbn — аЪ = (ап — а)Ь + (Ьп — Ь)а + (ап — а) (Ьп — Ь).]
Рассмотрим случай, когда члены последовательности матриц
определяются некоторой последовательностью функций, дейст-
действующих на А. Таким образом, если функции f\, /2, ... опреде-
определены на спектре А, то ЛР = /Р(Л), р = 1, 2, ... Для каждого
члена последовательности по теореме 5.4.1 получаем
fP{A) = gi?ify-»(h)Zki. E.6.1)
Но компоненты Zhj зависят лишь от А, но не от р, так что каж-
каждый член последовательности определен т числами ?Ц~1) (kk)
для k = 1, 2, ..., s и / = 1, 2, ... ,-tnh. Мы вправе поэтому ожи-
ожидать, что сходимость последовательности А\, Лг, ... может быть
сделана зависящей от сходимости т скалярных последователь-
5.6. ПОСЛЕДОВАТЕЛЬНОСТИ И РЯДЫ МАТРИЦ 171
ностей/(,/"|)(Яй), /jj/~0(^A), ..., что позволило бы не рассматри-
рассматривать п2 скалярных последовательностей элементов из матриц
Теорема 5.6.1. Пусть функции fb f2, ... определены на
спектре матрицы A <=ffnxn и ЛР = /Р(Л), р=\, 2, ... Тогда
последовательность Ль Л2, ... сходится при р —> <х> Ф=> m ска-
скалярных последовательностей /У^*)' f['~x) (Kk), ... (опреде-
(определенных для k = 1, 2, ..., s и j = 1, 2, ..., nih) сходятся при
р—*оо.
Кроме того, если lim fU~lU'kA — fl~i~x)Ckl\ для всех j и k
и некоторой функции f, то lim Ap = f (А) и, наоборот, если lim Ap
р~>оо р->оо
существует, то существует такая определенная на спектре А
функция f, что lim Ap — f (Л).
Доказательство. 1. Если fр'~1)(Яй)->/(/~0(Xk) при р->оо
для всех j и 1г и некоторой /, то равенство E.6.1) означает,
что
lim Ля= lim /П(Л) = У
2. Наоборот, предположим, что lim Лр существует и что
р-»ех>
элементами матрицы ЛР = /Р(Л) будут a^v, \x, v = \, 2, ..., п.
Напомним, что компоненты некоторой матрицы линейно незави-
независимы как элементы в ^яу„ (теорема 5.4.1), и рассмотрим ра-
равенства E.6.1) как множество п2 уравнений от m неизвестных
f'p~ ](Ч)> пРичеМ Р фиксировано. Независимость матриц Zhj
означает, что п2 X /и-матрица коэффициентов этих уравнений
будет ранга пг, а поэтому существует единственное решение
вида
где Cp,v зависят от / и k, но не от р. Но так как lim off' суще-
ствует, отсюда следует, что lim f(l~l4^b) тоже существует для
всех / и k. Это завершает первую часть теоремы.
Из равенства E.6.1) можно теперь получить, что
lim Лр- lim fP (Л) = 11С lim Щ-
172 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
и мы можем выбрать в качестве / интерполяционный много-
многочлен, значениями которого на спектре А будут числа
lim f{tu(h)' k=\,2,...,s и /=1, 2, .... mk.
Это завершает доказательство. ^
Мы хотим теперь получить подобную теорему для рядов мат-
оо
риц. Прежде всего ряд матриц X А„ называется сходящимся
р = 0
к матрице А (сумме ряда), если последовательность частичных
v
сумм Bv = X ^р сходится к А при v-*oo. Ряд, который не схо-
р=0
дится, называется расходящимся.
Следующая теорема немедленно следует из применения тео-
теоремы 5.6.1 к последовательности частичных сумм.
Теорема 5.6.2. Если функции щ, и2, ... определены на
оо оо
спектре Ле^„Хп, то ? нр И) сходится фф ряды Y, и\(~1) (ХЛ
р-1 p=i v '
сходятся, где k = 1, 2 s и \ = 1, 2, ..., т&.
Кроме того, если
есел; / и k, то
и наоборот.
Мы можем теперь применить эту теорему к получению од-
одного важного результата, который даст возможность оправдать
наше изложение теории функций от матриц. Следующая теорема
показывает общность данного в § 5.3 определения, которое при
первом знакомстве могло показаться несколько произвольным.
Действительно, читатель обнаружит, что описанные в следую-
следующей теореме свойства часто используются при определении
функции ог матрицы. Наш подход допускает определение f(A)
для более широкого класса функций /, чем описанный в тео-
теореме 5.6.3.
Теорема 5.6.3. Пусть матрица Ле^„х„ имеет собствен-
собственные значения %и Х2, •••, /W. Если функция f имеет ряд Тейлора
в точке Ко'.
р=0
5.6. ПОСЛЕДОВАТЕЛЬНОСТИ И РЯДЫ МАТРИЦ 173
с кругом сходимости jЛ, — Я-о| = ^ и если \К} — Яо|<г, / =
= 1, 2 п, то f(A) определена и
о=0
Доказательство. Как хорошо известно, при сделанных
предположениях / имеет производные всех порядков в точках
Я, для которых \К — Яо| < г, и эти производные имеют ряды
Тейлора, которые могут быть получены почленным дифференци-
дифференцированием ряда для f. Таким образом, так как \\j— Хо|< г для
каждого /, / определена на спектре матрицы А.
Если записать ир(Х)= ар(К—Ао)р, то ир несомненно опре->
делена на спектре А, р = 0, 1, 2, ..., и ряды
Z и^-'ЧЧ). fe=l, 2, .... s; /=1, 2, .... mk,
оо
все сходятся. Из теоремы 5.6.2 теперь следует, что У. и„(А)
р=0
сходится и имеет сумму f(A). ^
Если ряд Тейлора для f в начале координат сходится для
всех точек на комплексной плоскости (радиус сходимости бес-
бесконечен), то f называется целой функцией и представление для
f(A) в виде ряда будет сходиться для всех А ^9Рпхп- Наиболее
важные функции такого рода — это тригонометрические и экспо-
экспоненциальная функции. Таким образом, из соответствующих ре-
результатов для скалярных функций мы получаем, что для всех
Л,— <z>
= y
O=0 D=0
A2p+] , „ x^ A2p
B/7+1)!' v^~
P=0 p=0
Если собственные значения матрицы А равны Ки ¦ ¦ ¦, Яп, то
из биномиальной теоремы и логарифмического ряда получаем,
что при \Х}\ •< 1 для / = 1, 2, .... п имеем
р-1
]74 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
5.7. Свойства некоторых элементарных функций
Получив обычные разложения в степенные ряды для некото-
некоторых элементарных функций с матричными аргументами, мы
ставим вопрос: будут ли столь же обычные тождества между
этими функциями верными в матричном случае? Например,
следует ли из тождества sin2A + cos2k = 1, что sinM-f-
+ соэ2Л = /, и из ехе~х — 1, что еАе~А = /? Ответ на эти во-
вопросы (и целый класс таких вопросов) делается в следующей
теореме.
Теорема 5.7.1. Пусть G(uu и2, ..., щ) — многочлен от
«1, . . ., щ и \\, ...,// — определенные на спектре матрицы
А^'&пхп функции, для которых функция g = G(fu ..., ft)
рг:вна нулю на спектре А. Тогда
G{fx(A)
Доказательство. Пусть ги г2, .... п — интерполяцион-
интерполяционные многочлены для fi, ..., fi соответственно на спектре А и
определим многочлгн h = G(ru ..., гг). Тогда rv(A) = fv(A),
v = 1, 2, ..., /, так что
G{ft{A), ..., f,(A))=*G(ri{A) r,{A)) = h(A).
Но g равна нулю на спектре А и, как мы видим, hug прини-
принимают одинаковые значения на спектре А. Следовательно,
h(A) = 0. <
Для упомянутых выше частных случаев мы выбираем сна-
сначала f 1 (К) = sin К, f2(X) — cosX и G(u , и,) — и\ -\-и\ — 1, чтобы
доказать, что для каждой матрицы A^Wnxn имеем sin2A-f-
-fcosM=/. Взяв fl(X) = e\ f2(K) = e~^ и G(uu и2) = щи2—\,
получаем еАе~А = /. Таким образом, егА =:(еА)-1.
Мы можем обсудить также возможность извлечения с по-
помощью теоремы 5.7.1 корней степени п из некоторой матрицы.
Предположим, что р — положительное целое число, и пусть
/](Я)==Я|/р, f2(K) — K и G(uv u2) = uf — иг,где для f{ обычно вы-
выбирается некоторая однозначная ветвь функции Х1/р, хотя это
в данном случае несущественно. Если, однако, матрица А имеет
нулевое собственное значение с индексом, большим 1, то, так
как потребуются значения производных от /i в начале коорди-
координат, fi не была бы определена на спектре А. Таким образом,
если А неособая или особая с нулевым собственным значением
индекса 1, то мы определяем f1(X) = Xllp (с известным согла-
соглашением относительно выбора ветвей в собственных значениях) и
ZZ
5.8. ИСПОЛЬЗОВАНИЕ КОНТУРНЫХ ИНТЕГРАЛОВ 175
Тогда
Это рассуждение следует сравнить с определением квадрат-
квадратного корня из определенной матрицы, которое было дано в до-
доказательстве теоремы 2.14.2.
Следует, пожалуй, предупредить читателя, что наше опреде-
определение для А'1г не включает, например, всех возможных матриц
В, для которых В'2 = А. Для иллюстрации этого укажем на то,
что все вещественные симметрические ортогональные матрицы
В обладают свойством В2 = I, но не могут быть с необходимо-
необходимостью получены применением наших определений для нахожде-
нахождения Г12. Частный случай — это множество матриц, определенных
как
cos Э sin Э
Sme -cose
Упр. 1. Доказать, что для любой Ле^лХл
eiA = cos a -\- /sin 1.
Упр. 2. Если g, h — взаимно простые многочлены,
det (h (A)) Ф 0 и мы определяем рациональную функцию г как
r(k) = g(X)/h(A), то доказать, что
r(A) = g{A)[h(A)rl = [АИ)Г' g(A).
Упр. 3. Доказать, что если A<=Wnxn, то eA^+t^ = eAseAt для
любых комплексных чисел s и t.
Упр. 4. Доказать, что если А и В коммутируют, то еА+в =
= еАев, и если е<А+в^ = eAtem для всех t, то А и В коммути-
коммутируют.
5.8. Использование контурных интегралов-)
Теория функций комплексной переменной дает возможность
получить красивое выражение для компонент произвольной мат-
матрицы в <&nxn- В частности, нам потребуется теорема Коши о вы-
вычетах, которую мы сформулируем. Прежде всего, будем назы-
называть функцию f комплексной переменной z аналитической на
множестве точек D комплексной плоскости, если / непрерывно
дифференцируема в каждой точке D (или, что эквивалентно,
если / имеет сходящееся разложение в ряд Тейлора в окрестно-
окрестности каждой точки из D).
*) Читателю, который не знаком с основными теоремами о функциях
комплексной переменной, следует пропустить этот параграф, но тем не ме-
менее просмотреть упражнения в конце § 5.8.
176 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
Теорема о вычетах утверждает, что если функция / непре-
непрерывна на замкнутом контуре & и аналитична, за исключением
конечного числа полюсов, внутри 9\ то
\ f(z)dz — 2ni {сумма вычетов / в ее полюсах внутри (&).
Мы будем рассматривать матрицы A(z), элементы кото-
которых— функции комплексной переменной, и (как и в § 2.15)
определим производную (или интеграл) от матрицы как мат-
матрицу, получаемую дифференцированием (или интегрированием)
каждого элемента в A (z). Мы пишем
--
и \a{z)uz
для производной и интеграла матрицы A (z) соответственно.
Пусть А—некоторая фиксированная матрица из ^пхп- Рас-
Рассмотрим зависящую от А матрицу /?г, определенную как функ-
функция комплексной переменной z посредством
Как очевидно, Rz определена ФФг не является собственным
значением матрицы А. Эта матрица известна как резольвента
для А.
Если, в наших обычных обозначениях, А имеет компоненты
Zhj, k = 1. 2, ... , s и / = 1, 2, .. ., trik, то применение теоремы
5.4.1 (ср. упр. 1 из § 5.4) дает
Пусть c&v — окружность на комплексной плоскости с центром
Xv, не имеющая других собственных значений матрицы А внутри
или на ^v Проинтегрируем тогда обе части написанного равен-
равенства по '«Pv Матрица вычетов п2 интегралов справа равна как
раз Zv\. Таким образом, из теоремы о вычетах получаем
и идемпотентные компоненты для А задаются в виде
Но проведенное рассуждение может быть легко обобщено до
получения формул для всех компонент в виде контурных инте*
5.8. ИСПОЛЬЗОВАНИЕ КОНТУРНЫХ ИНТЕГРАЛОВ 177
гралов. Умножим сначала обе части равенства E.8.1) на
(z — %v)t @ ^ t ^ mv—1) и затем проинтегрируем их по 9V
Таким образом,
Единственные ненулевые интегралы справа — это те, для кото-
которых k = v и j = t -\- I, и этот интеграл имеет значение 2ni. Та-
Таким образом,
\ (г — Xv)' Rz dz — Bш) i\ Zv, t+i
и в общем виде
Zki = -т-—,\,о ¦ \ (z — Xk)l~l Rz dz, E.8.2)
й = 1, 2, .... s, /=1, 2, ..., mk.
Контурные интегралы могут быть также использованы для
получения третьего выражения для f(A) при подходящих функ-
функциях f. Пусть A ^'ffnxn имеет различные собственные значения
Ль . . . , Xs, и пусть ^ — замкнутый контур, содержащий Ki, . . ., Xs
внутри себя. Предположим, что функция f непрерывна на Я?
и аналитична внутри (&. Умножая обе части равенства E.8.1)
на f (z) и интегрируя по z вдоль контура W, получим
Как хорошо известно, интегральная формула Коши теперь
дает
4
Следовательно,
\ f (z) R, dz ^2zYJ
% к i
по теореме 5.4.1. Нами доказана
Теорема 5.8.1. Если А^^пхп имеет различные собствен-
собственные значения Ль ..., As, 91 — замкнутый контур, содержащий
Л], ..., %s внутри себя и I непрерывна на ^ и аналитична
внутри <8, то
178 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
Заметим, что результаты упражнений 1, 2 и 3 ниже приме-
применимы равным образом как к вещественной, так и к комплексной
переменной t.
*Упр. 1. Доказать, что
-L(eM) = AeAt =eA'A.
Упр. 2. Доказать, что
jL(A(t)J = A^A + AAi'\
и построить пример, показывающий, что, вообще говоря,
*Упр. 3. Доказать, что в случае, когда р — положительное
целое число и матрицы существуют:
A)
(ii)
*Упр. 4. Доказать, что в обозначениях § 5.8
AZkl+Zk2 = -}^\ zRzdz.
5.9. Приложения к решению диффереациалы.'ых уравнений
Мы рассмотрим сначала систему обыкновенных дифферен-
дифференциальных уравнений с постоянными коэффициентами следую-
следующего вида:
- ... -\-аыхп,
х2 = а2\Х\ -\- а22х2 + ... + а.2пхп>
хп = ап\х\ + ап1х2 "Т" • • * ~\~ аппхп>
где дсь ..., хп — функции независимой переменной t, Xj обозна-
обозначает производную Xj no t и коэффициенты aih не зависят от t.
Мы можем, очевидно, это множество уравнений заменить одним
матричным уравнением
X === АХ*
5.9. ПРИЛОЖЕНИЯ К РЕШЕНИЮ УРАВНЕНИЙ 179
Можно писать x(t) или k(t), если есть необходимость отметить
зависимость этих функций от t.
Мы можем легко убедиться в существовании решения урав-
уравнения к = Ах. Будем искать решение в виде x{t) = %.ev-t, где
% и ц не зависят от t. Тогда х>= цх и х = Ах может быть запи-
записано в виде (А — ц,/)! = 0. Таким образом, если в качестве %
взять правый собственный вектор для А с собственным значе-
значением ц, то x(t) будет решением. Кроме того, такое решение
всегда существует, потому что каждая матрица А имеет по
крайней мере одно собственное значение с соответствующим
правым собственным вектором.
Можно ли характеризовать множество всех решений урав-
уравнения к = Ах? Как можно доказать, множество всех решений
является линейным пространством размерности п. То, что это
множество — линейное пространство, проверяется очень легко,
вопрос же о размерности требует более детального рассмотре-
рассмотрения, и мы не будем этим заниматься. В данном случае обычное
доказательство основано на другой важной теореме: существует
единственное решение уравнения х = Ах, которое удовлетворяет
также начальному условию х@) — с при произвольном задан-
заданном не зависящем от t векторе с.
Покажем, как такое решение может быть вычислено. Сле-
Следующее рассуждение формальное (т. е. не строгое математи-
математически), но приводящее к такой вектор-функции, которая, как
можно убедиться после дифференцирования, оказывается ре-
решением и поэтому единственным решением. Предположим, что
вектор-решение может быть разложено в ряд Тейлора в точке
/ — 0. Таким образом, обозначая через к0 значение при t = 0
первой производной по t от х и т. д., получаем
Продифференцируем теперь равенство к = Ах последова-
последовательно для получения
и т. д. Подставляя полученные значения в ряд для x(t), по-
получаем
t2
+ tA + -^-A + .,
Таким образом, наше формальное рассуждение подсказывает,
что x(t) = eAtc может быть решением. Так как производная от
180
ГЛ. 5. ФУНКиИИ ОТ МАТРИЦ
eAi равна Аем (упр. 1 § 5.8), легко проверить, что мы действи-
действительно имеем решение уравнения х = Ах с *@) = с.
Если в теореме 5.4.1 положить теперь f(X) = eM и заметить,
что /(r)(^) = treu, г = 0, 1, 2, .... то будем иметь
= t (**.
где Zkj = ZkjC и не зависит от t. Таким образом, как мы видим,
решение будет комбинацией многочленов от t с показательными
функциями. Если А — простая матрица, то решение сводится к
и, как мы видим, каждый элемент x(t) будет линейной комби-
комбинацией показательных функций без добавлений многочленов.
Упр. 1. Найти решение уравнения х — Ах с х@)=с, если
II 6 2 2 II II 0
А = \\ -2 2 0 , с = \\ 1
I 0 0 2 I 1 1
Решение. Компоненты для А были найдены в упр. 4 из
5 В Z
§ 5.5. Векторы Zkj =
оказываются равными
2,i =
ур
из проведенного выше рассуждения
0
2
0
. «12 =
4
—4
0
И, так как А,, =4, Х2 = 2, решением будет
2 +1—4
О
о
)<
е"\
или
Рассмотрим теперь неоднородное уравнение
где элементами f будут fi(t), ..., fn(t) — заданные функции
от /, которые не все тождественно нулевые. Пусть S — прост-
пространство всех решений соответствующего однородного уравнения
х = Ах и ?Г — множество всех решений для х = Ах -f- /. Если
нам известно одно решение уе?", то - z^ZT€$z = y-\-w
для некоторого mei1, Проверка этого утверждения предостав-
5.9. ПРИЛОЖЕНИЯ К РЕШЕНИЮ УРАВНЕНИИ
181
ляется читателю в качестве упражнения. Таким образом, для
получения 9~ требуется знать лишь одно решение неоднород-
неоднородного уравнения, известное как частный интеграл, и прибавить
к сему все решения однородного уравнения, которые могут быть
выражены в виде еА1с для некоторого с.
Будем искать решение уравнения x = Ax-\-f в виде
= eAtz{t).
Если такое решение существует, то х = Ах -f- eMz, так что
емг = /, откуда
jj e~Axf (т) dx,
где c = eAt«z(@) = x(t0). Это наводит на мысль, что
х (S) = eAt ] е~At°c + \ e~Mf (т.) dx > = еА «~^с + \ еА«-*> f (x) dx
и to
будет решением уравнения к = Ах -\-f, дс(^0) = с. Это легко про-
проверяется.
Упр. 2. Найти решение уравнения х = Ax-\-f, x@) = c, если
А, с определены, как в упр. 1, и
I
О
О
Решение. Вектор емс известен из упр. 1. Для частного
интеграла имеем
dx =
Интегралы
*« ~%)е4х dx, a
0 0
легко находятся и равны а/е4', -y
ственно. Следовательно,
у (/) = teVZ + {fflWe +
)f (г) dx.
e1*—1) соответ-
соответ||
о I II о I |
Решение тогда задается в виде x{t)= eAtc^-y(i).
182
ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
Упр. 3, Пусть Аи ..., Л„е WmXm. Доказать, что и будет ре-
решением системы уравнений порядка п
(где индексы обозначают производные) Ф=> вектор х будет
решением системы первого порядка dx/dt = Ах + g, где
О / 0 ... О
0 0/
х =
„(I)
„(п-1)
Л =
о ... о /
— Ап ... — Л, — Л
Упр. 4. Если определить Я-матрицу D(X)= /Я" -)- А{кп~1-\-...
~..-\-Ап и за \а взять скрытый корень для D(K), то найдется
такой вектор q ф 0, что D(\i)q = 0. Доказать, что u(t) = qe^
•будет решением уравнения «("•> + Aiu^n~^-\- ... -{-Апи = 0.
Упр. 5. Проверить, что для неособой матрицы А
х (t) = (cos АЧЧ) х0 + (АЧг)~1 (sin Ab) ха
•будет решением уравнения х= — Ах, дс(О) = дс0, х@) = х0. Как
этот результат может быть обобщен до включения особой мат-
матрицы Л?
Упр. 6. Найти решение уравнения х = — Ax + f с ж@) = *в,
*@) = *0.
*Упр. 7. Если Л, В е ^„хп и ^ — зависящая от ^ л X «-ма-
«-матрица, то найти решение уравнения
X = А X + ХВ, X @) = С,
рассматривая матрицы вида X = eAtY(t).
Смешанные упражнения
1. Если / определена на спектре матрицы Л, то доказать, что
') = [/(Л)]'.
2. Как мы видели в упр. 1 из § 5.4,
Возводя обе части этого равенства в квадрат и используя тео-
теоремы 5.5.1 и 5.5.2, доказать, что
А2 =
+ 2kkZk3 + 2ZM).
fe=i
.(Если rrik = 1, то Zft2 = Zft3 == 0 и т. д.)
СМЕШАННЫЕ УПРАЖНЕНИЯ 183
3. Доказать, что если ряд / + А + А2 + ... сходится, то каж-
каждое собственное значение матрицы А по модулю меньше 1. (И?
биномиального разложения § 5.6 тогда следует, что
в том и только в том случае, когда все собственные значения
матрицы А по модулю меньше 1.)
4. Показать, что унитарную матрицу U можно представить
в виде U = еш, где Н эрмитова. (Если пытаться установить
аналогию между полем комплексных чисел и множеством (ал-
(алгеброй) матриц в ffnxn, то эрмитовы матрицы будут соответ-
соответствовать вещественным числам и унитарные матрицы — числам
с единичным модулем.)
[Указание. Показать, что существуют такие веществен-
вещественные числа tt|, ,.., й„ и унитарная матрица V, что
U = V diag {e'a> eia«\ V,
и положить
ah .... an}V\]
5. Для А е WnXn доказать, что существует такая веществен-
вещественная кососимметрическая матрица S с А = е8 фф А — веще-
вещественная ортогональная матрица с deM = 1.
6. Определить Мп для всех целых п и всех Я, если
1 - X + X2 1 - X II
7. Если элементы квадратной матрицы D(X) дифференци-
дифференцируемы и А(Я)= detD(k), то показать, что
и если Д (А,) Ф 0, то
Д<" {Ц
8. Предположим, что л — вещественная переменная и
в упр. 7 D — решеклг :.'.атричного дифференциального уравне-
уравнения Х(Х) = Х(Х)А(л), где А(%) существует для всех X. Дока-
Доказать, что если существует Хо, для которого А(%0)?:0, то
А,
и, следовательно, Д(Х)^=0 для всех %. (Это соотношение изве-
известно как тождество Якоби или формула Лиувилля.)
184 ГЛ. 5. ФУНКЦИИ ОТ МАТРИЦ
9. Если все собственные значения матрицы А имеют отрица-
отрицательные вещественные части, то доказать, чю
и, следовательно, что если все собственные значения матрицы А
лежат в полуплоскости Re (г) < Re (Я.), то
о
[Указание. Использовать равенство E.8.1).]
Глава 6
НОРМЫ ВЕКТОРОВ И МАТРИЦ
6.1. Матричные нормы
Во многих случаях бывает полезно иметь возможность при-
приписать матрице некоторое однозначно определенное неотрица-
неотрицательное число в качестве меры ее величины. Для комплексного
числа мы уже имеем такую меру величины в его модуле, и для
вектора х из 'ё'п величина может быть измерена длиной (х, х)и2,
введенной в § 1.3. Мы изложим аксиоматический подход к фор-
формулировке мер величин, или норм, матриц и начнем с выписы-
выписывания свойств, выполнения которых мы от такой меры требуем.
Как мы увидим, существует много возможных выборов для
нормы.
Функция с вещественными значениями, определенная на всех
квадратных матрицах Л с комплексными элементами, назы-
называется матричной нормой и обычно записывается в виде || Л Ц,
если она удовлетворяет следующим аксиомам:
0) 1|Л
(п) || с А || = | с ||| Л || для любого комплексного числа с;
(Hi) ||Л + Я||<||Л|| + Ц
(iv) ||ЛВ ||< || Л У» В |
для всех квадратных матриц Л, В одного и того порядка.
Полезно иметь в виду аналогию с модулем комплексного
числа. Аксиомы (i), (ii) и (Hi)—непосредственные обобщения,
в подтверждение этой аналогии, хогя аксиома (iv) является
более либеральной, чем соответствующий результат |а6| =
= |а||й| для комплексных чисел. Аксиома (iii) известна как
неравенство треугольника по очевидной причине.
Заметим, что во всей этой главе все рассматриваемые мат-
матрицы будут квадратными.
*Упр. 1. Доказать, что || А - В || ^ 11| А || - || В || |.
186 гл. в. нормы векторов и матриц
[Указание. Доказать сначала соответствующий результат
для комплексных чисел.]
*Упр. 2. Доказать, что вещественнозначная функция ]?
"будет матричной нормой.
Упр. 3. Доказать, что вещественнозначная функция тах|а;/|
удовлетворяет аксиомам (i), (ii) и (Hi), но не аксиоме (iv).
Упр. 4. Доказать, что для любой матричной нормы имеем
Упр. 5. Если S неособая и || •¦ || — матричная норма, то ве-
вещественнозначная функция /, определенная как f(A) =|| 5Л5~' ||,
будет матричной нормой.
Во многих отношениях аксиомы (i), (ii) и (iii) — это все, что
требуется для матричной нормы. Мы поэтому определяем веще-
егвеннозначную функцию, удовлетворяющую аксиомам (i), (ii)
и (iii) (но не обязательно (iv)), как обобщенную матричную
норму. Таким образом, матричная норма всегда будет обобщен-
обобщенной матричной нормой, но не наоборот. Упражнение 3 выше
дает пример обобщенной матричной нормы, которая не является
матричной нормой.
Наша первая теорема утверждает, что обобщенная матрич-
матричная норма будет обязательно «гладкой» функцией от матрич-
матричного аргумента в том смысле, что «малые» изменения в мат-
матричных элементах приводят к «малому» изменению в матричной
норме.
Теорема 6.1.1*). Обобщенная матричная норма непре-
непрерывно зависит от элементов матрицы, т. е. для заданного в ~> О
существует такое б > О, зависящее от е, что
\\\А\\-\\В\\\<г,
как только \ац — Ьц\ < б для всех пар индексов i, j.
Доказательство. Пусть Eij — матрица, имеющая 1 на
месте (i,j) и 0 на всех других местах (Eit=ete'fy Тогда
A-B = Z a.}-btl)Etl,
i, i
и если определить число k = max || Е{, ||, заметив, что k > 0 по
аксиоме (i), то аксиомы (ii) и (iii) будут означать, что
*) Строго говоря, в этой теореме следует зафиксировать порядок рас*
сматриваемых натрии. — Прим. перев.
6.1. МАТРИЧНЫЕ НОРМЫ ]g7
Для любого е > 0 определим б = e/kn2, где А, В лорядка п,
и рассмотрим любую пару матриц А, В, для которых
\ац — Ьи\<6, i, /=1, 2, ..., п.
Тогда
|| Л - В ||< kn4 = e.
Следовательно, по упр. 1 выше
как только | пц — Ъц | < 6. 4
Наша следующая теорема тоже имеет очень большое значе-
значение и связывает величины любых двух обобщенных матричных
норм, вычисленных для одного и того же матричного аргумента.
Эта теорема сравнения часто сводит изучение свойств общих
матричных норм к изучению одной относительно простой нормы
(ср. упр. 6 ниже).
Теорема 6.1.2. Пусть || А || и N (А) — любые две обобщен-
обобщенные матричные нормы, вычисленные в А. Тогда существуют та-
кие положительные числа т\ и г2, зависящие лишь от выбора
норм, что
г> ^ ШАГ ^ Г2
для всех Ae^nxn*)-
Доказательство. Мы применим матрицы Ец, использо-
использованные в предыдущем доказательстве. Положим р2 = ^\\ЕЦ\\,
а = max | ац |. Тогда по аксиомам (ii) и (ш) имеем
где р2 не зависит от А.
Рассмотрим теперь множество М всех матриц, для которых
а = 1, и пусть
i||S||
Множество М замкнуто и ограничено; по теореме 6.1.1 II В || не-
непрерывно зависит от элементов В, поэтому **) существует такая
матрица B0^J(, что pi = ||Boll. Аксиома (i) тогда означает^
что ро > 0 и тоже не зависит от А.
Для данной матрицы А можно записать А = а^В, где
I a^v \= а и В<=М. Тогда || А || = а || В || ^= арх. Объединяя это
с неравенством F.1.1), получаем
api <IIЛ 1|<ар2.
*) Матрицу А следует считать ненулевой. — Прим. перев.
**) См.-дополнение 1.
188 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
Подобно этому существуют такие положительные числа <7i
и q2, зависящие лишь от нормы N, что
[aq2.
Эти неравенства означают, что
^ \\А\
'' "** N(A)
тде
xpxjq2, 2 p2lqv
Упр. 6. Если Л,, А2, А3, ... — последовательность матриц из
^пхп, то при любой обобщенной матричной норме Ар—*А при
р —* оо <=> || Ар — А || —* 0 при р -> оо.
[Указание. Доказать результат для нормы из упр. 2 выше
и затем воспользоваться теоремой 6.1.2.]
N
Упр. 7. Если Ль Л2, Л3, ... e'g'nxn и Sw = X Ар для
дого положительного целого числа /V, то доказать, что У д
p=i "
сходится к матрице А 4=> при любой матричной норме || В^ —
— Л || ->0 при N —* оо.
Наиболее полезные матричные нормы — это часто те, кото-
которые просто определяются в терминах элементов матричного
аргумента. Возможно, что мера величины для матриц могла бы
быть основана на величинах их собственных значений, хотя бы
это могло оказаться не очень полезным практически. Если
jii, ..., tin — собственные значения матрицы Л, то \iA = max | \xs |
A ^ / ^ п) будет такой мерой величины и известна как спект'
ральный радиус А.
Рассмотрим матрицу Нп из упр. 3 § 5.3. Как легко видеть,
все ее собственные значения нулевые и, следовательно, спект-
спектральный радиус для Нп равен нулю. Так как Нп — ненулевая
матрица, мы убеждаемся в том, что спектральный радиус не
удовлетворяет аксиоме (i) для матричной нормы. Однако, хотя
спектральный радиус не является матричной нормой, он тесно
связан с величиной матричных норм. Действительно, матричные
нормы часто используются при получении границ для спект-
спектрального радиуса. Следующая теорема — первый результат та-
такого рода.
Теорема 6.1.3. Если A^Wnxn и \iA — спектральный ра-
радиус матрицы Л, то при любой матричной норме имеем
Доказательство. Пусть ц — собственное значение мат-
матрицы Л с \кА =|ц.|. Тогда существует такой вектор х ф'О, что
6.1. МАТРИЧНЫЕ НОРМЫ 189
Ах = jjx Определим п X «-матрицу
Ах = \\х 0 0 ... 0||.
Тогда, очевидно,
ААХ = цАж.
Используя аксиомы (ii) и (iv) для матричной нормы, получаем
а так как Ах Ф 0, аксиома (i) означает, что II Л* || =^ 0. Следо-
Следовательно,
Ы = Ил<1И||. 4
В следующей последовательности упражнений мы вводим
большое многообразие норм.
Упр. 8 (евклидова норма, или норма Фробениуса). Дока-
Доказать, чго функция
является нормой.
Решение. Читатель без затруднений проверит аксиомы (i)
и (ii) для матричной нормы. Что касается аксиомы (iii), то за-
заметим сначала, что
I аи + Ьц |2 = {аи + bit) (аи + btl) =
= Ui,\2 + \ bt, I2 + 2 Re (a,,bti) < | ац f +1 bi} f + 21 аиЪи |.
Таким образом,
H + fl||z=El^/ + ^/P<H|p+ \\B\\2 + 2\Z\aijbi
Используя неравенство Шварца, получаем
Z1/|E|i/
. i, i i, i
Следовательно, || A -f- В \\ ^ || A \\ -f || В || и аксиома (iii) вы-
выполняется.
Для аксиомы (iv) получаем
II АВ |f = ? I aikbkl 2 < Z (I I a/* I2) (El 6W I2) ,
*Л ft i, / V ft / V ft У
опять воспользовавшись неравенством Шварца, а следовательно,
|| АВ ||2< ( Е | а„ |2) (Е I 6WI2) = U |р|| В ||2.
Аксиома (iv) следует отсюда немедленно.
J90 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
Упр. 9. Доказать, что М(А) = птпах\аи\ будет матричной
нормой.
Упр. 10. Если || • II обозначает евклидову норму и М такова,
как определена в упр. 9, то доказать, что \\А || ^ М(А).
Упр. П. Если || • || обозначает евклидову норму, то доказать,
что || Л \\* = tr(A*A).
Упр. 12 (нормы Гёльдера, или р-нормы). Функция
будет обобщенной матричной нормой для р ^ 1 и матричной
нормой в том и только в том случае, когда 1 ^ р ^ 2.
(Читатель должен быть хорошо знаком с обобщением нера-
неравенства Шварца, известным как неравенство Гёльдера, перед
тем, как приступить к этому упражнению.)
Упр. 13. Еслир ;=г 2 и A/р) + A/<7)= 1, то
||ЛЯ||р<гшп{|И|р||Я||„ IIЛ ||, || fi||p}.
6.2. Векторные нормы
Мы увидим, что, как и для матриц, существует несколько
полезных мер для величины векторов в ^п. Длина такого век-
вектора, как она определена в § 1.3, как раз является одной из
полезных мер, удовлетворяющей следующим аксиомам. Эти ак-
аксиомы следует сравнить с аксиомами для обобщенной мат-
матричной нормы.
Вещественнозначная функция h, определенная на 9%,, назы-
называется векторной нормой на "S3,,, если для всех х, уе?„:
(а) А(*)>0 и Л(*) = 0<?Ф * = 0;
(б) h(cx) = \c\h(x) для любого комплексного числа с;
(в) h(x + y)^h(x) + h(y).
Упр. 1. Если h — векторная норма, то доказать, что
h(x-y)^\h(x)-h(y)\.
*Упр. 2. Если х' = || X\,Xi,... ,хп ||, то доказать, что следую-
следующие функции будут векторными нормами:
(а) p(Ac) = maxU/|;
(б) Y(*) = EU,|;
(в) Л(*) = | Ли/|2у/г = (ж, х) (евклидова норма);
(г) hp{x) = ^Z\Xi\pyp , p>\ (нормы Гёльдера).
*Упр. 3. Доказать, что евклидова векторная норма инва-
инвариантна относительно унитарных преобразований. (Как мы ви-
6.2. ВЕКТОРНЫЕ НОРМЫ
191
дели в упр. 3 из § 2.13, ортогональное преобразование в 5?3 соот-
соответствует вращению осей координат вокруг оси, проходящей
через начало координат. Мы вправе ожидать, что такое преоб-
преобразование оставляет длину вектора инвариантной.)
Упр. 4. Если Р^&пхп — эрмитова положительно определен-
определенная матрица, то доказать, что
h (*) = <*» РхI'1
будет векторной нормой.
*Упр. 5. Доказать аналоги теорем 6.1.1 и 6.1.2 для вектор-
векторных норм.
Упр. 6. Сформулировать и доказать аналоги упражнений 6
и 7 из § 6.1, применимые к векторам и векторным нормам.
Упр. 7. Если h — векторная норма на <&„ и Ле?„Хя неосо-
неособая, то доказать, что функция g, определенная как g(x)~
= h(Ax), тоже будет векторной нормой.
Очень часто встречается задача нахождения нормы вектора,
заданного в виде Ах, гдеЛе^„Хг1 и х е <&„. Приобретенный
в связи с аксиомой (iv) для матричной нормы опыт позволяет
ожидать, что будут существовать матричные нормы ||»|| и век-
векторные нормы h, для которых h(Ax)^l \\ A \\h(x). Если это так,
то мы говорим, что нормы согласованы. Дадим точное опреде-
определение: векторная норма h и матричная норма ||*|| согласованы,
если для всех х^&п и для всех А<=ФПхп имеем h(Ax)^
K\\A\\h(x).
Упр. 8. Матричная норма М(А) из упр. 9 в § 6.1 согласована
с (а) р(ж), (б) у(х), (в) h(x), которые определены в упр. 2
выше.
Решение,
(а) 9(Ах) =
F)
(в) h2 (Ax) =
^ max I E I a/k | \xk |) <
/ \ft=i /
<max I E I a!k | I p (*)< n (max | a/k \) p (x) = M (A) p (x).
l \k=i / i, k
ft=i
M(A)
\ = M(A)y(x).
alkxk
/, k
| xk |
по неравенству Шварца. Следовательно, если ||'
евклидову матричную норму, то
обозначает
Л2(Ах)< (?, |а1к?) (Е \хкР) = \\А|рh2(x) <Ж2(A)tf (x)
192 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
по упр. 10 из § 6.1. Заметим, что попутно доказана согласован-
согласованность евклидовых матричной и векторной норм.
Упр. 9. Пусть || »|| обозначает обобщенную матричную норму,
не являющуюся матричной нормой. Доказать, что не суще-
существует векторной нормы, согласованной с ||»|| *).
В обычной геометрии пространства 5?3 единичная сфера —
это множество векторов хе52з, для которых х'\ + х] + х\ = 1,
т. е. {х, х) = 1. В более общем случае, когда мы вводим некото-
некоторую норму, или длину, в 9%!, единичная сфера будет зависеть
от выбора нормы. Так, в пространстве &„ с векторной нормой h
единичная сфера Oh — это множество всех векторов х е Фп, для
которых h(x)=\. В частности, использованное в § 3.2 опреде-
определение дает единичную сферу в &п с евклидовой нормой. В более
общем случае сфера 9"н в ^п с центром х0 и радиусом г — это
множество всех векторов х, для которых h(x — х0) = г.
Поучительно рассмотреть единичные сферы в 5?2 Для вектор-
векторных норм, определенных выше в упр. 2. Однако, прежде чем
приступить к этому, следует заметить, что все определенные
там нормы могут считаться нормами Гёльдера. Ясно, что у
и h — нормы Гёльдера с р = 1 и р = 2 соответственно. Кроме
того, мы утверждаем, что р соответствует норме Гёльдера
с р = оо. Чтобы убедиться в этом, предположим, что вектор х
имеет v компонент абсолютной величины р(дс) = |х,|, и запи-
запишем затем
где е,-= |Xft|/|Xj| < 1 для некоторого k и /—1, 2, ..., n — v.
Теперь уже нетрудно видеть, что hp(x)-*-\xj\ = р(х) при р—> оо.
Возвращаясь теперь к единичным сферам в 5?2, читатель
легко проверит, что части единичных сфер в первом квадранте
для норм y, h и р таковы, как они показаны на рис. 4. Мы пре-
предоставим читателю исследовать вид единичных сфер для норм
Гёльдера с промежуточными значениями р. Читателю рекомен-
рекомендуется также представить себе вид единичных сфер в $.ъ с нор-
нормами Гёльдера.
В общем случае симметрии единичной сферы будут зависеть
от симметрии функции h(x) = Н(х\,х2, ..., хп), если ее рассмо-
рассмотреть как функцию Н от п скалярных переменных Х\, ..., хп.
Нормы Гёльдера все являются симметрическими функциями ог
компонент Х\, х2, ¦ ¦ ¦ , хп. Это эквивалентно тому, что hp(Px) =
= hp(x) для любого х и любой перестановочной матрицы Р.
Упражнение 10 дает простой пример векторной нормы, которая
не является симметрической функцией от компонент вектора.
*) В присланном письме автор сообщает, что он не имеет решения этого
упражнения. — Прим. перев.
6.2. ВЕКТОРНЫЕ НОРМЫ
193
*Упр. 10. Для дсе^п положим h(х) = |х\| + ... "+1леи—11Н-
+ 'г~'|л;п|- Доказать, что h — векторная норма на 3?п. Каков
вид единичных сфер для 522 и 523 с нормой /г?
Какую бы векторную норму ни ввести в Wn, множество то-
точек на и внутри единичной сферы, как можно доказать, будет
обладать свойством выпуклости. В 522 или 523 не представляет
затруднений убедиться в этом, и утверждение звучит правдо-
правдоподобно. Для придачи ему смысла в Фп мы должны привести
сначала несколько опреде-
определений.
Прежде всего, если
х, у^&п, то прямой сегмент,
соединяющий х и у, опреде-
определяется как множество точек
в %?„, имеющих вид tx -\-
+ A—t)y для некоторого t
в замкнутом отрезке [0, 1].
Это естественно обобщает
понятие, используемое в 5?2
и Яъ- Далее, множество век-
векторов S'^e'п выпукло, если
для каждой пары х, у е 9?
прямой сегмент, соединяю-
соединяющий х и у, тоже содер-
содержится в 2',
Наконец, В Пространстве Рис- 4- Единичные сферы в &2 для
fn с векторной нормой h />-норм.
будем называть множество
точек на и внутри единичной сферы единичным шаром (в обо-
обозначении 3Sh), т. е. &h состоит из всех дсе^п с h(x)^. I. ;
Теорема 6.2.1. Если h — векторная норма в <ёп, то еди-
единичный шар 3Su будет выпуклым множеством.
Доказательство. Пусть х, у — любые два вектора в 3Sh.
Тогда
— типичный представитель прямого сегмента, соединяющего х
и у. Мы должны лишь доказать, что г е ^/,. Имеем (используя
аксиомы (б) и (в) для векторной нормы)
и h{x), h(y)^.\, так как х, уе^. Следовательно, h(z)^>
</ + A — t)= 1, так что 2Е4 <
*Упр. 11. Множество векторов х в 13п, для которых
h(x — *о)^Л есть шар с центром дс0 и радиусом г. Доказать,,
что шар — выпуклое множество. .-¦"¦-
7 П. Ланкастер
194 гл. 6. нормы векторов и матриц
*Упр. 12. Пусть Zft — некоторое множество k различных век-
векторов в 'Fn- Наименьшее выпуклое множество H(Zh)<=$?n
с Zhs H (Zu) называется выпуклой оболочкой Zh. (Слово «наи-
«наименьшее» здесь означает, что если Zh s T = ^п и Т выпукло,
то H(Zh)<^T.) Если Zi, Z2, ..., zh — элементы из Zh, то дока-
доказать, что г <= H(Zk) <=> существуют числа 0i ^ 0, i = 1, 2, ..., k,
для которых
k k
j]e, = i и 2=2>л-
i = l i = l
ft
Решение. Пусть i?ft — множество векторов вида 52 0^
! = |
с 0,^0, 22 G4 = 1. Нетрудно доказать, что i?fc выпукло и что
Пусть теперь 0~ — любое выпуклое множество в ^п с ZftS^".
Мы получим результат, доказав, что Sh^ZT и, следовательно,
что 3?k = H(Zk). Доказательство проводится по индукции от-
относительно k и в случае k ¦= 2 следует непосредственно из опре-
определения выпуклого множества.
Читателю предоставляется доказать, что из S'h-i E^ и
ZhdST следует S?h s ^~.
6.3. Индуцированные матричные нормы
Мы исследуем теперь способ получения некоторой матрич-
матричной нормы из любой заданной векторной нормы. Если h — век-
векторная норма в Ч?п и А е ^пхп. то рассмотрим отношение
h(Ax)/h(x), определенное для каждого ненулевого xe<gV Это
отношение, очевидно, неотрицательно. Рассмотрим множество
всех чисел, получаемых из этого отношения, когда х принимает
все возможные ненулевые значения в &„, и определим *)
^f. F.3.1)
Мы докажем, что для фиксированной матрицы А это неот-
неотрицательное число определено и что получающаяся в результате
функция || -II будет матричной нормой. Мы будем называть
эту матричную норму индуцированной h. Следует обратить вни-
внимание на содержательную аналогию введенного отношения
с отношением Релея (для эрмитовых матриц), определенным
в § 3.2.
Следующие результаты непосредственно получаются из до-
дополнения 1.
*) «sup» — сокращение для супремума, или наименьшей верхней грани.
6.3. ИНДУЦИРОВАННЫЕ МАТРИЧНЫЕ НОРМЫ j.gg
Лемма. Для функции || • ||, определенной на %?пхп по
F.3.1), имеем
(i) || Л || = max (Ах)
M)
и
(ii) существует такой вектор х0, зависящий от А, что
Л(*о)=1 и ||Л||=Л(Л*о).
Доказательство. Заметим сначала, что замена х на сх
не меняет отношения h(Ax)jh(x). Таким образом, полный образ
значений функции || 41 останется тем же, если предположить
вектор х нормализованным, так что h(x) = 1. Поэтому || А || =
— suph(Ax), где наименьшая верхняя грань берется по еди-
единичной сфере Oh.
Как мы видели (упр. 5 из § 6.2), векторная норма непре-
непрерывно зависит от компонент векторного аргумента. Кроме того,
Он — замкнутое и ограниченное множество, а поэтому обе части
леммы непосредственно следуют из дополнения 1. В части (ii)
просто утверждается, что существует x0eOh, для которой мак-
максимум достигается.
Значение индуцированных норм частично объясняется
частью (в) следующей теоремы.
Теорема 6.3.1. Если Oh — единичная сфера в Wn с вектор-
векторной нормой h, то:
(а) || Л [| = max h (Ax) — матричная норма;
x^°h
(б) h и || -|1 согласованы;
(в) если N — любая согласованная с h матричная норма, то
\\A\\^N(A) для всех A<=<g>nyn.
Доказательство. 1. Мы намереваемся установить вы-
выполнимость аксиом для матричной нормы. Относительно ак-
аксиомы (i) ясно, что || А || ^ 0 и что || А || = 0 при А = 0. Если
А Ф 0, то существует такой х е ^п, что Ах #0 и/г(д;)=1. Сле-
Следовательно, || А || > 0. Аксиома (i) поэтому выполняется.
Используя аксиому (б) для векторной нормы, получаем
|| с А || = max h (с Ах) = \с\ max h (Ax) = | с \ \\А ||,
так что аксиома (ii) тоже выполняется.
Имеем тогда
h ((A + B)x) = h (Ax + Bx)^h (Ах) + h (Bx),
откуда
max h((A + В)*)<max{h(Ax) + h(Bx)}<maxh(Ax)-fmaxh(Bx).
°
Таким образом, || A + В \\ ^ || A || + || В || и получена ак-
аксиома (iii).
7*
196 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
2. Мы отступим теперь от естественного хода доказательства
и докажем часть (б) теоремы. Для любого х =? 0 определим
| = x/h (х), так что А (|) = 1. Тогда
h (Ax) = h{h (ж) АЩ = А (ж) А (Л|) < /г (ж) max A (Ay) = A (x) || Л ||,
уе0А
и это есть условие того, что А и ||»|| согласованы (хотя мы и не
утверждаем пока, что ||-Ц— матричная норма).
3. Возвратимся к аксиоме (iv) для матричной нормы. Из
части (и) леммы выводим, что существует вектор дс0 с Н(хо)=1
и h(ABxo)= \\AB || при заданных A, BefnXB, Тогда
|| ЛЯ || = А (Л (Вх0)) = А (АВхо) < || Л || А (Яжо),
ввиду только что доказанной согласованности h и ||«||. Исполь-
Используя этот результат еще раз, получаем
Таким образом, аксиома (iv) выполняется и части (а) и (б)
теоремы доказаны.
4. Для доказательства части (в) предположим, что h{yQ) — \
и А(Луо) = ||Л||. Тогда
Некоторые из наиболее важных и полезных матричных
норм — это индуцированные нормы, обсуждаемые в следующем
ряде упражнений.
Прежде чем оставить идею индуцирования матричных норм
из векторных, мы можем поставить обратный вопрос: можно ли
использовать некоторую заданную матричную норму для инду-
индуцирования согласованной векторной нормы? Это можно сде-
сделать, определяя А как
А(ж)=Н|жа'|| F.3.2)
для некоторого фиксированного вектора а Ф 0.
Упр. 1. Доказать, что функция А, определяемая равенством
F.3.2), является векторной нормой.
Упр. 2. Пусть ||-|| обозначает матричную норму, индуциро-
индуцированную векторной нормой А, и пусть Нп определено, как в § 4.13.
Доказать, что ||/|| = 1. Если дополнительно А — симметриче-
симметрическая функция от абсолютных значений компонент ее векторного
аргумента, то доказать, что || Нп || = 1.
Упр. 3. Пусть h — векторная норма, определенная в упр. 10
§ 6.2. Доказать, что если || ¦ ||—индуцированная А матричная
норма, то || Нп || = п. Найти векторную норму, для которой
II Нп || < 1 в индуцированной норме.
. 6.3. ИНДУЦИРОВАННЫЕ МАТРИЧНЫЕ НОРМЫ 197
Упр. 4. Пусть || -Ц обозначает матричную норму, индуциро-
индуцированную евклидовой нормой (эта норма известна как спектраль-
спектральная), и для А^Ч?пхп пусть %А будет спектральным радиусом
матрицы А*А. Доказать, что || Л|| = А.л2.
Решение. Матрица А*А эрмитова и определенная, так как
(A* AT = A* A
и
** [А*А) х = (Ах)* Ах = {Ах, Ах) > О
для всех х е ^п. Из теоремы 2.14.1 тогда следует, что собствен-
собственные значения для А*А вещественны и неотрицательны. Следо-
Следовательно, на самом деле %а будет собственным значением мат-
матрицы А*А.
Пусть Хи х2,... ,хп — множество ортонормированных правых
собственных векторов для А*А с соответствующими собствен-
собственными значениями Аь Яг, ..., Кп. Пусть h обозначает евклидову
векторную норму и для любого х с ft(x)=l запишем
п
х = ? IjXj. Тогда
п
А*Ах = ? IjXjXj
и
Л2 (Ах) = (Ах)* Ах = х* (А*Ах) = (I g,*,)' (? |^Л) = Z11/12 Ч
если воспользоваться тем, что x*xk = 6jk. Таким образом,
?(/>0, у=1, 2 п.
Отсюда непосредственно следует, что
\\A\\=maxh(Ax) = X't
Упр. 5. Если А—унитарная матрица, то доказать, что спект-
спектральная норма А равна 1.
Упр. 6. Если А = diag {d\, d2,... ,dn) и ||-|| — матричная
норма, индуцированная любой из норм (а), (б), (в) в упр. 2
§ 6.2, то доказать, что || А \\ — max | di |.
Упр. 7. Если А, и^&пхп и U унитарна, то доказать, что
для евклидовой и унитарной норм || А || =• || UA \\ = || AU \\ и,
следовательно, что для этих двух норм || А || инвариантна при
унитарно подобных преобразованиях.
198 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
Упр. 8. Если А — нормальная матрица и ||«|| обозначает
спектральную норму, то доказать, что || А || = цд — спектраль-
спектральному радиусу А. (Сравнить этот результат с теоремой 6.1.3.)
Если f определена на спектре матрицы А, то доказать, что
П/(Л)|| равно спектральному радиусу f(A).
*Упр. 9. Показать, что матричная норма, индуцированная
векторной нормой р(ж) = max | х,- |, задается в виде
/
\\ А \\р== max Ti\alk\.
i k
(Заметим, что берутся суммы по строкам абсолютных значений
матричных элементов, а затем выбирается наибольшая из этих
сумм.)
Решение. Пусть х — вектор с р(х) = 1. Тогда
j] | a,k \\ xk\ <
к
Таким образом, max р (Ах) ^ || A L, так что индуцированная р
р(лг)=1
норма не может превзойти ||-||р. Чтобы доказать, что они равны,
мы должны лишь показать, что существует § с р(§)=1
и р(Л|)^ || Л ||р.
Предположим, что || Л ||р = /1 \ amk I» и рассмотрим вектор |
k
с элементами
I amk \/amk, если amk ф О,
0, если amk = 0,
для k = l, 2, ..., п. Тогда рA)=1, и если А% = ц, то
i)m = Z amklk = Е | amk | = || Л ||р
k k
_ Г
~
по определению |. Таким образом,
= max \
откуда следует, что
|| Л ||р = max p (Ах).
v ()i
Упр. 10. Показать, что матричная норма, индуцированная
векторной нормой y (*) = 111 */1» задается в виде
Ц Л ||v = max X i «у* i.
ft i
6.4. АБСОЛЮТНЫЕ ВЕКТОРНЫЕ НОРМЫ
199
(Заметим, что берутся суммы по столбцам абсолютных значе-
значений матричных элементов, а затем выбирается наибольшая из
этих сумм.)
Упр. 11. Если H'lls обозначает спектральную норму и |Н1р,
||«||у определены в упр. 9 и 10, то доказать, что
Решение. Используя результат упр. 4, имеем || Л ||s =
где Ка — максимальное собственное значение матрицы А*А,
и по теореме 6.1.3 КА ^ IIЛМ ||v. Таким образом,
6.4. Абсолютные векторные нормы
Читатель, по-видимому, обратил внимание на то, что почти
все рассмотренные в упражнениях векторные нормы зависят
лишь от абсолютных значений элементов векторного аргумента.
Такие нормы называются абсолютными векторными нормами.
В общей теории норм, которую мы до сих пор излагали, не
предполагается, что обязательно имеет место этот случай. Этот
параграф будет посвящен доказательству двух свойств абсолют-
абсолютных векторных норм. Докажем сначала одну лемму, которая
часто бывает полезна и сама по себе.
Лемма. Если h — абсолютная векторная норма и мы за-
записали
h (х) = Н (хь х2, .... хп),
то Н — неубывающая функция от абсолютных значений вели-
величин Х\, Х2, . .. , Хп.
Доказательство. Сосредоточим внимание на Н как на
функции первой компоненты Х\. То же рассуждение будет при-
применимо к каждой из п переменных. Таким образом, мы предпо-
предполагаем х2, ..., хп фиксированными, полагаем
Н(х, хъ ..., xn) = f(x)
и рассматриваем поведение / при изменяющемся на веществен-
вещественной оси х.
Если утверждение леммы не выполняется, то существуют не-
неотрицательные числа р, q, для которых р < q и f(p) > f(q). Но
так как /(*) — /(l*l)> то /(~9) = /(9). так что векторы
— я
х2
и У2 =
200 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
принадлежат шару, состоящему из векторов х, для которых
h(x)^.f(q). Но шар — обязательно выпуклое множество
(упр. 12 § 6.2), а так как вектор
Р
г =
х2
Хп
очевидно, принадлежит прямому отрезку, соединяющему у\ и у2,
то h(z)sz:f(q). Но h(z) — f(p)> f(q). Полученное противоре-
противоречие доказывает лемму.
Одно из свойств абсолютной векторной нормы, которое мы
установим, называется свойством монотонности. Будем обозна-
обозначать через |лс| вектор, элементы которого — абсолютные значе-
значения элементов вектора х, и при у, 2?ЙЯ будем писать у ^ г,
если это неравенство выполняется для соответствующих эле-
элементов у и г. Подобное соглашение относится и к другим зна-
знакам неравенств. Векторная норма h называется монотонной
тогда и только тогда, когда из |ж|^|у| следует h(x)^.h(y).
Лемма означает, что это условие непременно выполняется для
абсолютных векторных норм. В следующей теореме мы пока-
покажем, что обратное утверждение гоже верно: монотонная норма
будет обязательно абсолютной.
Второе из получаемых свойств относится к индуцированной
матричной норме. Когда матричная норма вычисляется для
диагональной матрицы D = diag {du .., ,dn}, мы считаем норму
хорошей, если для нее выполняется свойство |] Z> |] = max I cfy [.
Мы покажем, что ||-|| обладает этим свойством тогда и только
тогда, когда она является нормой, индуцированной абсолютной
векторной нормой.
Теорема 6.4.1. Если h — векторная норма и ||«|| обозна-
обозначает матричную норму, индуцированную h, то следующие усло~
вия эквивалентны:
(i) h абсолютная;
(и) h монотонная;
(ш) || Z> || = max [ rf/1 для любой диагональной матрицы D =«
= diag{di, ..., dn).
Доказательство. Мы получим эквивалентность всех
свойств, показав, что из (i) следует (и), из (ii) следует (ш)
и из (ш) следует (i)-
1. Из леммы получаем, что из (i) следует (ii).
2. Для доказательства того, что из (ii) следует (iii), можем
предположить D ^Ф0. Определим; d = max | d{\. Ясно, что |Ддс|^
6.5. НИЖНИЕ ГРАНИ 201
^||, так что условие (ii) означает, что h(Dx)^.h(dx) =
= dh(\x\). Таким образом,
Если мы сможем показать, что существует вектор а, для ко-
которого h(Da)/h(a) = d, то доказательство будет закончено.
Предположим, что т — целое число, для которого d — \dm\.
Тогда
h фет) _ h (dmem) , и , ^_ и
h (em)
Следовательно, sup h (Dx)/h(x) = d, или || D || = d. Таким обра-
зом, из (ii) следует (iii).
3. Предположим теперь, что выполняется условие (iii). Для
любого вектора х существует такая диагональная матрица*) D
с |dj|=l, /=1, 2, ..., п, что \х\ = Dx. Свойство (iii) озна-
означает, что || D || = || D-1 II = 1. Имеем тогда
и, так как x^
Следовательно, h(x) = h(\x\) для любого х, так что из (iii)
следует (i). Это завершает доказательство теоремы.
Упр. 1. Если 11-11 — матричная норма, индуцированная абсо-
абсолютной векторной нормой, и \А\ — матрица с элементами \а^\,
то показать, что II А \\ ^ || \А \ ||. Будет ли эта матричная норма
монотонна в том смысле, что из |Л|^|Б| следует || А || ^ || В ||?
Ьуд
\A\:
6.5. Нижние грани
Мы начали обсуждение матричных норм с рассмотрения
меры величины матрицы или меры удаления ее от нулевой мат-
матрицы. Мера удаления матрицы от вырожденности также была
бы полезной. Таким образом, мы попытаемся найти функцию,
определенную на всех квадратных матрицах А, которая неотри-
неотрицательна и равна нулю в том и только в том случае, когда
deM = 0. С первого взгляда удивляет то, что такая мера мо-
может быть получена из определения, дополнительного к опреде-
определению индуцированной нормы в F.3.1). Однако это удивит
меньше, если вспомнить, что х фО с Ах = 0 существует в том
и только в том случае, когда deM = 0. Мы определяем
*) Полагаем dj =. 1 при х/=0 и dj = |*/|/.к^ при Х)Ф0,
202 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
нижнюю грань матрицы А относительно векторной нормы Н
(в обозначении gib,(Л)) по формуле
Если ясно, какая векторная норма подразумевается, мы бу-
будем писать gib (А). Следующий результат составляет пару с
леммой § 6.3 и доказывается тем же самым способом.
Лемма, (i) glbft(^)= min h(Ax) и
(ii) существует такой вектор у0, зависящий от А, что
А \bA h(A
Ы g() (y)
Если принять во внимание, что ||Л~М1 неограниченно возра-
возрастает по величине, когда А стремится к особой матрице, то сле-
следующая теорема будет оправдывать нашу претензию на то, что
нижняя грань является мерой удаления от вырожденности.
Теорема 6.5.1. Если \\-\\—матричная норма, индуцирован-
ная векторной нормой h, то
gib,
f
А '|, если
0, если det A = 0.
Доказательство. 1. Если det А =# О, то определим век-
вектор у через х по формуле у — Ах. Тогда для любого х Ф'О будет
А (ж) h (А-1 у) L v h{y) J \\A-l\\'
(При переходе от инфимума к супремуму использован результат
о том, что если ?& — некоторое множество положительных чисел
и .$ —множество чисел 1/а, где а е s?, то inf з? = 1/sup^.)
2. Если det Л =0, то существует такой вектор §, что А\ = 0
и ft(!)= 1. Тогда, согласно лемме, g\bh(A)= min h(Ax) = 0;
минимум достигается при х = %.
Следствие 1. Если Л,Вё?„х„, то
glhh(AB)>glbh(A)gibh(B).
Доказательство этого следствия предоставляется нитателю в
качестве простого упражнения.
Следствие 2. Если h — абсолютная норма и D =
= diag{d1( ,,., dn}, то
D) = min | dj |.
6.6. ПОЛЕ ЗНАЧЕНИЙ 203
Доказательство. Если D неособая, то dj ф 0 для каж-
каждого / и
W4 = -ах A| ^ВТ
по теореме 6.4.1.
Если D особая, то g\bh{D) = Q по теореме и, очевидно,
mini dt | = 0.
/
Упр. 1. Пусть [ilt ц-2, .... \хп — собственные значения мат-
матрицы А. Доказать, что для любой векторной нормы h имеем
glbA (A) ^ min | и, |. Доказать также, что неравенство переходит
/
в равенство, если А нормальна и h — евклидова векторная нор-
норма. (Заметим, что, объединяя этот результат с теоремой 6.1.3,
мы можем определить кольцеобразную область комплексной
плоскости, внутри которой должны лежать собственные значе-
значения матрицы А.)
6.6. Поле значений
Если Ле?пхп, то собственные значения А образуют мно-
множество из п точек (не обязательно различных) на комплексной
плоскости. Некоторые полезные представления о распределении
этих точек могут быть получены, если исходить из понятия
«поля значений» матрицы А. Условимся сначала, что всюду в
этом параграфе h будет обозначать евклидову векторную нор-
норму. Определим поле значений F(A) матрицы Л е ?Пхп как
множество всех чисел
п
х*Ах = (х, Ах) = Y. alkx,xk,
где х^Ч?п и h(x)= 1. Ссылаясь на § 3.2, мы можем также
описать F (А) как множество всех возможных значений отноше-
отношения Релея для А.
Так как F(A)—образ сферы Gh при непрерывной функции,
то (теорема 2 дополнения 1) F(A) будет замкнутым и ограни-
ограниченным множеством на комплексной плоскости. Можно также
доказать, что F(A) — выпуклое множество, но мы этого доказа-
доказательства приводить не будем. Ясно, что каждое собственное
значение \x.j матрицы А принадлежит ^(Л), /= 1, 2, ..., п, ибо
если. AXj = \ijXj и h(Xj) = 1, то
Теорема 6.6.1. Поле значений матрицы А инвариантно при
унитарно подобных преобразованиях. Таким образом, если U
унитарна, то
204 ГЛ. 6. НОРМЫ ВЕКТОРОВ И МАТРИЦ
Доказательство. Если ге F(UAU*), то существует
х<ее<&ч с h(x)=\ и z — x*UAU*x = y*Ay, где у = U*x. Но
h(y)=\ (упр. 3 § 6.2), так что z^F(A). Следовательно,
F(UAU*)^ F(A). Подобным проведенному рассуждением дока-
доказываем обратное включение, так что F (А) = F (U AU*).
Для нормальных матриц (§ 2.10) характеризовать геомет-
геометрию поля значений теперь очень легко. Следует вспомнить сна-
сначала определение выпуклой оболочки некоторого множества то-
точек на комплексной плоскости (частный случай упр. 12 § 6.2).
Теорема 6.6.2. Поле значений нормальной матрицы совпа-
совпадает с выпуклой оболочкой ее собственных значений.
Доказательство. Если А — нормальная матрица с соб-
собственными значениями рц, ..., \in, то по теореме 2.10.2 суще-
существует унитарная матрица U, для которой А = UDU* и
D = diag {ць . . ., цп}. По предшествующей теореме имеем
F(A) = F(D). Таким образом, 2eF(-4) в том и только в том
случае, когда существует х с h(x)= 1 и
Так как h (ж) = ? (х, \2 = 1, из УПР- 12 § 6-2 следует, что г при-
/-1
надлежит выпуклой оболочке собственных значений, так что
теорема доказана.
Заметим, что если в общем случае Zn — множество соб-
собственных значений матрицы A e'g'nxn, то, так как каждое соб-
собственное значение принадлежит F(A) и F(A) выпукло, из опре-
определения выпуклой оболочки получаем, что F(A)s H(Zn).
Теорема 6.6.3. Поле "значений матрицы А является отрез-
отрезком вещественной прямой тогда и только тогда, когда А
эрмитова.
Этот результат следует сравнить с теоремой 3.2.1 и упр. 3
из § 3.2.
Доказательство. Если А эрмитова, то А нормальна и,
согласно теореме 6.6.2, F(А) — выпуклая оболочка собственных
значений матрицы А. Но собственные значения А все веще-
вещественны, так что их выпуклая оболочка, очевидно, совпадает с
отрезком вещественной прямой.
Наоборот, если А е'ё'ихп, то мы полагаем
Как нетрудно видеть, В = В*, С = С* и А = В + iC. Тогда
х*Ах = х*Вх + ix*Cx и х*Вх, х*Сх вещественны. Если F(A) со-
состоит лишь из вещественных чисел, то х*Сх = 0 для каждого
xef,, и, следовательно, С = 0 (упр. 9 из § 2.9). Но С = 0
означает, что А = А*, что и требовалось доказать, ,
Глава 7
ТЕОРИЯ ВОЗМУЩЕНИЙ И ОЦЕНКИ
ДЛЯ СОБСТВЕННЫХ ЗНАЧЕНИЙ
7.1. Возмущения в решении линейных уравнений
Большая часть этой главы посвящена исследованию поведе-
поведения матричных собственных значений при возмущениях элемен-
элементов матрицы. Прежде чем приступить к нему, будет поучительно
(и, в частности, будет иметь важное значение для аналитика-
числовика) установить воздействие возмущения А и Ь на ре-
решение х уравнения Ах = Ъ. Мп предположим, что /1е?Пхп
и det/4 ф О, так что (теорема 1.16.5) х будет единственным ре-
решением уравнения Ах = Ь.
В общем случае некоторая задача считается устойчивой,
если «малые» причины (возмущения в А или Ъ) приводят к «ма-
«малым» воздействиям (возмущениям в х). Степень малости уча-
участвующих величин обычно измеряется в зависимости от их зна-
значений в невозмущенном состоянии. Таким образом, если х-\-у—
решение задачи после возмущения, то мы измеряем величину
возмущения в векторе-решении отношением h(y)/h(x) для неко-
некоторой векторной нормы h. Мы будем называть это отношение
относительным возмущением х.
Прежде чем исследовать задачу с общими коэффициентами
матрицы А, очень полезно рассмотреть задачу-прототип вариа-
вариации в коэффициентах уравнения х = Ь. Таким образом, мы
пришли к необходимости исследовать решения уравнения
(/ + уИ)| = Ъ, где М «мало» по сравнению с /. Отклонение §
от х будет, очевидно, зависеть от вида матрицы (/ + М)-1, если
это обращение существует. Имеем:
Теорема 7.1.1. Если ||-|| обозначает любую матричную нор-
норму, для которой \\I\\ = 1, и если v = ||М|| < 1, то (I -\-М)~1 су-
существует:
206 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
Доказательство. Теорема 6.1.3 означает, что для лю-
любого собственного значения ц матрицы М имеем |ц| ^С v < 1.
Более того, функция /, определенная как /(А.)= A -j-^), имеет
разложение в степенной ряд в точке % = 0 с радиусом сходимо-
сходимости, равным 1. Следовательно (теорема 5.6.3), f(M) = (/ + M)~l
существует и
(/ + М)~' = / - М + М2 - ...
Если положить SP = I — М + М2— ... ±Мр~1 (р-я частич-
частичная сумма) и заметить, что ||Mr|| ^ ||М||Г, то получим
1 — VI — V
Так как эта граница не зависит от р, то
00 1 — v
Возвратимся к нашей первоначальной задаче. Имеем
с deM =т^ 0. Предположим, что Ь переходит в Ь + k, А перехо-
переходит в А -{- F и х 7т-"у удовлетворяет уравнению
Мы вычислим верхнюю оценку для относительного возмущения
h(y)/h(x).
' Вычитая первое уравнение из второго, получаем
или
Мы предположим, что 6= \\A~l||||F|| <1 и что ||/|| = 1. Так
как тогда \\A~lF \\ ^ \\A~l || j| F || < 1, теорема означает, что
(I -\-A~lF)~l существует и что \\{I + A~lF)-1 |[ <A — б)-1. Та-
Таким образом,
y = (l -{- A~]F) A~lk — (l-\-A~]F) A~]Fx,
и если h — любая векторная норма, согласованная с || • ||, то
II л —1 II х
Чтобы получить удобное выражение для искомой меры
h(y)/h(x)—величины возмущения, мы используем то, что из
7.1. ВОЗМУЩЕНИЯ В РЕШЕНИИ ЛИНЕЙНЫХ УРАВНЕНИЧ
207
Ах = Ь следует h(b)
ким образом,
||Л||й(ж), откуда 1/А(*)<|И!1/АF). Та-
h(y) ^\\A\\\\A-
h(k)
-6
h (b)
1 -6
Первый член справа содержит относительное возмущение Ь
и последний член не зависит от правой части первоначального
уравнения. Определим теперь k(A) = ЦЛЦЦЛ-'Ц как условное
число для А (относительно нормы ||-[|) и заметим, что
\F\\ =
ИЛ) 11 F 11
\\A\\
Таким образом, окончательно получаем
k(A)
h(x)
- k (А) ||
h(k)
^ и a ii; •
Это дает нам верхнюю оценку для относительного возмуще-
возмущения х через относительные возмущения b и А и условное число
&(Л). В частности, следует отметить решающую роль при этом
условного числа. Оно участвует в оценке во всех случаях, будут
ли возмущения происходить только в Ь, только в А и в b и А
одновременно. Условное число будет иметь большое значение
также в исследовании возмущений собственных значений (§ 7.4).
Упр. 1. Доказать, что если И-'ННЛ! < 1, то ||F|I < 1И11-
Упр. 2. Если Л = diag{l, 2, 3, ..., 10}, р(Ь)=1 (норма из
упр. 2 (а) § 6.2) и известно лишь, что элементы F и k ограни-
ограничены по абсолютной величине е с е < 0, 1, то
Если дополнительно
о ^
то показать, что
р(у)
20в
- 10б
0,1
0,2
1,0
, к —
— е
0
0
, F =
г е
0 0
0 0
р (у) _ 20е
Р (*) 1 + в '
Упр. 3. Если k{A) — спектральное условное число для А, т. е.
условное число, полученное при использовании спектральной
нормы, и Х\, %п — наименьшее и наибольшее собственные значе-
значения матрицы А*А, то доказать, что k(A) = (XJh)'1'-
Упр. 4. Если линейное уравнение Ах — Ь с с1еЫ=^0 заме-
заменяется на эквивалентное уравнение Вх = А*Ь, где В = А*А, та
208 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
доказать, что это может быть сделано за счет спектрального
условного числа, т. е. что k(B) ^ k(A),
Упр. 5. Доказать, что при предположениях теоремы 7.1.1
Мр —* 0 при р -> оо. Доказать в общем случае, что М? -* 0 при
р-^-оо <=> спектральный радиус матрицы М меньше 1.
7.2. Теорема Гершгорина
Мы приступаем теперь к рассмотрению вопроса о зависимо-
зависимости собственных значений и собственных векторов матрицы А
от элементов А. Для ^6?ЛХЛ и ее собственных значений
(xi, ..., \х.п наши первоначальные результаты будут описывать
области комплексной плоскости, в которых должны лежать соб-
собственные значения. Прежде чем переходить к деталям, напом-
напомним, что мы уже имеем один такой результат. Он упомянут в
замечании к упр. 1 из § 6.5.
Первым существенным результатом является то, что соб-
собственные значения непрерывно зависят от элементов матрицы А.
Так как собственные значения — это в точности корни характе-
характеристического многочлена, то последний результат получаем
сразу же, если известно, что корни многочлена непрерывно за-
зависят от его коэффициентов. Это результат элементарной теории
алгебраических функций и не будет здесь излагаться. В § 7.5
будут приведены еще некоторые подробности, когда мы будем
рассматривать аналитические возмущения; при этом будут до-
доказаны более сильные результаты, описывающие поведение соб-
собственных значений в некоторых специальных случаях.
Следует заметить, что некоторая информация утрачивается,
когда мы имеем дело лишь с характеристическим многочленом,
ибо существует много различных матриц с заданным характе-
характеристическим многочленом. Поэтому не удивительно, что более
сильные результаты учитывают строение матриц.
Следующее упражнение иллюстрирует то, что, хотя собствен-
собственные значения непрерывно зависят от матричных элементов, они
могут тем не менее изменяться очень быстро при патологических
обстоятельствах.
Упр. 1. Рассмотрим 10 X 10-матрицу Л(е), определяемую как
функция вещественной переменной е посредством
0 1 0 ... о
0 0 1 ... 0
О 0 ... О 1
е 0 ... О О
Доказать, что собственные значения при е = Ои при е= 10~10
отличаются по абсолютной величине на 0,1. (Заметим, что раз-
7.2. ТЕОРЕМА ГЕРШГОРИНА 209
ница между Л@) и ЛA0~10) настолько мала, что она не можег
быть различима для вычислительной машины со слишком ко-
короткой длиной слов.)
Мы можем доказать теперь одну из наиболее полезных и
легко применяемых теорем, дающую оценки для собственных
значений. Она известна как теорема Гершгорина и была впер-
впервые опубликована всего лишь в 1937 г.
Теорема 7.2.1. Если A ^ffnxn и
Р/ = Е/|а/*1,
k
где X обозначает суммирование от k = 1 до п, k Ф /, то каж-
каждое из собственных значений матрицы А лежит по крайней мере
в одном из кругов
|z —ау/Кр/, / = 1, 2, ..., п,
комплексной z-плоскости. Кроме того, множество из m кругов,
не пересекающихся с остальными п — m кругами, содержит m
и только m собственных значений матрицы А.
Доказательство. 1. Пусть \i — некоторое собственное
значение матрицы А с правым собственным вектором х. Тогда
Ах = [ix, или, записывая это соотношение в виде п скалярных
равенств,
/= 1, 2, ....
Пусть \хр\ = max|х}|; тогда р-е, равенство дает
\ц — ар
k
apkxk
L lap&IU&KUpIL
Но так как # ^ 0, то | хр \ ф' 0, и мы имеем | \\. — арр | ^ рр.
Первое утверждение доказано.
2. Предположим теперь, что А = D + С, где D = diagjan,...
..., апп), и пусть B{t) = D-\-tC. Тогда 5@)= D и 5A) = Л.
Мы рассмотрим поведение собственных значений матрицы B(i)
при t, меняющемся в отрезке [0, 1J, и воспользуемся их непре-
непрерывностью как функций от t. Итак, для любого t в этом отрезке
собственные значения матрицы B(t) лежат в кругах с центрами
а.ц и радиусами tpit / = 1,2, ..., п.
Предположим, что /-й круг для Л = 5A) не пересекается
с остальными п — 1 кругами. Очевидно тогда, что /-й круг для
B(t) не пересекается со всеми остальными кругами при всех /
из [0, 1]. Но при / = 0 собственными значениями матрицы 5@)
будут аи, ..., Опп и из них ац — единственное собственное зна-
210 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
чение в /-м (вырожденном) круге. Так как собственные значения
матрицы B(t) являются непрерывными функциями от t и /-и
круг всегда не пересекается со всеми остальными кругами, то
для всех t е [0, 1] существует одно и только одно собственное
значение матрицы B(t) в /-м круге. В частности, это будет так
в случае t = 1 и В{\) = А.
Это доказывает вторую часть теоремы для т = 1. Читателю
предоставляется закончить доказательство для любого т ^ га.
Заметим, что, применяя теорему к А', получаем подобный
результат, но с использованием сумм по столбцам матрицы А,
а не сумм по строкам, для определения радиусов новых кругов.
Отметим также, что-если р — векторная норма р(х) =
= max i-^l, то индуцированная матричная норма ||«||р задается
в виде
|] А ||р = max ? I alk I
/ к
(упр. 9 из § 6.3). Но, очевидно, никакая точка из круга Герш-
горина не может быть удаленной от начала координат более чем
на расстояние ||Л||Р, а так как все собственные значения лежат
в этих кругах, то 1ИНр^Ца — спектрального радиуса матрицы
А. Это—частный случай теоремы 6.1.3. Подобно этому, приме-
применяя теорему Гершгорина к А', находим, что 1И||У^ \\,А (упр. 10
из § 6.3).
На практике значение теоремы Гершгорина часто может быть
увеличено тем, что собственные значения матрицы инвариантны
при подобных преобразованиях. Таким образом, если S — любая
неособая матрица, то применение теоремы к SAS~] может дать
дальнейшую информацию о локализации собственных значений
матрицы А. Чтобы избежать очень длинных вычислений мат-
матрицы S~l (которые могут быть лучше применены к самой А),
обычно ограничиваются рассмотрением диагональных преобра-
преобразующих матриц S.
*Упр. 2. Найти круги Гершгорина для следующей матрицы и
для ее транспонированной:
0
1
г/2
0
1
6
1
1/2
0
1
5
1/2
i
1
0
—2
Если S = diag{l, 1, 1, 4}, то вычислить SAS-1 и получить,
что А имеет собственное значение в круге |z + 2| ^-н"-
Упр. 3. Показать, что матрица А будет неособой, если
> ?'I a//s | = р;> /=1,2, .... п.
к
7.2. ТЕОРЕМА ГЕРШГОРИНА 211
(Такая матрица называется матрицей с доминирующей диаго-
диагональю.)
Упр. 4. Пусть матрица А имеет доминирующую диагональ и
dj = |ajj| — pj, /=1, 2, ..., п. Доказать, что Idet^l^sd^ ...
... dn. (Верхняя оценка для |det/4| будет получена в упр. 1
из § 7.3.)
Решение. Определим матрицу В элементами bjk = ajk/dj.
Тогда
det В = . . ' det A,
dxd2 ... dn
ИЛИ
det A = dxd2 ... dn det В.
Поставленная задача будет решена, если мы сможем показать,
что |detfi| ^ 1. Пусть ц — некоторое собственное значение мат-
матрицы В. Тогда по теореме 7.2.1 имеем
bIk !
для некоторого /. Но \\х, — Ьц\^\\ц—\Ьц\\ и, используя опре-
определения В и dj, получаем, что
Таким образом, собственные значения матрицы В все имеют
абсолютные значения не меньше 1. Но detS равен произведе-
произведению собственных значений для В (§ 2.1), так что |detB|^ 1.
Упр. 5. Доказать, что эрмитова матрица с доминирующей
диагональю, у которой все диагональные элементы положи-
положительны, будет положительно определенной.
Упр. 6. Если А = В + С, где B = diag{l, 2, 2} и
I Cjk I ^ е < -g- для /, k=\, 2, 3, то доказать, что существует
собственное значение матрицы А в круге \г—\ — гп|^ 12е2.
Упр. 7 (обобщение упр. 6). Если А = В + С, где В =
= diag{bi, ..., bn), p/ = min|i/ — bk\> 0 и |cw|<e
k?i
для k, I = 1, 2, ..., n, то доказать, что существует собственное
значение матрицы А в круге
(Заметим, что если записать А = В + t,C и снять ограничение
на С, то будет существовать собственное значение ц(?) матрицы
Л, для которого при Z,—>0
I* @=6/ + ее» + о (| с |«).
Этот результат будет улучшен в § 7.7.)
212 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
Упр. 8. Если 7(z) = do + a\z + ... + anzn, an Ф 0, и г0 — ко-
корень /, то доказать, что
|zo|<l +тах\ ak/an\.
7.3. Теорема Шура
Мы приведем теперь результат в несколько другом направле-
направлении, принадлежащий Шуру и датируемый 1909 г. Напомним
(упр. 8 из § 2.9) о разложении некоторой матрицы A ^ffnxn в
сумму эрмитовой матрицы В и косоэрмитовой матрицы С. Итак,
мы полагаем В = у (А + A*), C = -j(A — А*) и отмечаем, что
А = В + С, В* = В и С* = —С. Если А* = А, то С = 0 и все
собственные значения матрицы А вещественны. Это наводит на
мысль, что норма матрицы С может задавать верхнюю оценку
для величин мнимых частей собственных значений матрицы А.
Подобно этому, если А* = —А, то В = 0 и все собственные зна-
значения матрицы А имеют нулевые вещественные части, так что
можно ожидать, что норма матрицы В задает верхнюю оценку
для величин вещественных частей собственных значений матри-
матрицы А. Теорема Шура содержит результаты этого рода. В сле-
следующем утверждении Re(ja), 1т(ц) будут обозначать веще-
вещественную и мнимую части комплексного числа ц.
Теорема 7.3.1. Если Ле?яхп, ||«|| означает евклидову
матричную норму и рц, ..., \in — собственные значения матри-
матрицы А, то
где в = -к (А + А") и С = у (Л — А*). Равенство в любом одном
из этих неравенств влечет равенство во всех трех и реализуется
в том и только в том случае, когда А нормальна.
Доказательство. Теорема 2.10.1 информирует нас о су-
существовании таких унитарной матрицы U и верхней треугольной
матрицы А, что А = U*AU, и собственные значения матрицы А
будут элементами на главной диагонали в Д. Но евклидова
норма инвариантна при унитарных подобных преобразованиях
(упр. 7 из § 6.3), так что [|Л||2= ||Д||2. Если элементы в Д обо-
обозначить drs (r, s = 1, 2, ..., и), то
и первое неравенство доказано.
7.3. ТЕОРЕМА ШУРА
Имеем также В = у U* (А + Л*) U, так что, как и прежде.
hs 2
r=l r<s
Подобное доказательство дает также и третье неравенство.
Ясно, что равенство реализуется в каждом из трех нера-
неравенств Ф=> йщ = 0 для всех г Ф s и г, s = 1, 2, ..., п, т. е. &
том и только в том случае, когда А унитарно подобна диаго-
диагональной матрице из ее собственных значений. Утверждение
следует теперь из теоремы 2.10.2.
Следствие 1 (Хирш, 1905 г.). Если положить
р = тах|а„|, о = тах|Ьг$|> т = тах|с„]
Г, S Г, S Г, S
и если \ь — любое собственное значение матрицы А, то
| Re (\i) К па, 11т
Доказательство. Очевидно, || A f ^ ]? р2 = п2р2. Первое
Г, S
неравенство теоремы тогда дает | \х |^ ^| \ir |2V/2<|| А || <пр,
что является первым результатом следствия. Другие два ре-
результата получаются подобно первому.
Отметим, что частный случай т = 0 приводит к другому
(с превышением по мощности) доказательству того, что соб-
собственные значения эрмитовой матрицы вещественны. Подобно-
этому случай о = 0 приводит к результату, что собственные зна-
значения косоэрмитовой матрицы имеют нулевые вещественные
части.
Наконец, следует заметить, что пр совпадает с нормой М(А),
определенной в упр. 9 из § 6.1. Результат |ц,| s?[ «p является
поэтому частным случаем теоремы 6.1.3.
Следствие 2 (Бендиксон, 1902 г.). Если ЛейпХп »
т=-^-тах | ars — asr |, то для любого собственного значения и.
матрицы А имеем
214 гл. 7. теория возмущений
Доказательство. Для вещественной матрицы А третье
неравенство теоремы означает, что
r = I г, s=I
r?=s
Так как А вещественна, все ее комплексные собственные значе-
значения распадаются на комплексно сопряженные пары, так что
каждый ненулевой член в сумме слева входит в нее по крайней
мере дважды. Следовательно, 2| 1т(ц,г) |2 ^ х2п(п — 1) и след-
следствие доказано.
В заключение следует отметить, что оценки, получаемые в
следствиях, вообще говоря, менее строгие, чем соответствующие
оценки, получаемые из теоремы Гершгорина. Это хорошо иллю-
иллюстрируется применением следствия 1 к упр. 2 из § 7.2.
Упр. 1. Доказать, что | det А К nnlip", где р = тах|а„|.
Г, S
Решение. Прежде всего напомним неравенство между
.арифметическим и геометрическим средними: для любых неот-
неотрицательных чисел а\, о2, ..., а„ имеем
Если Hi, ц-2, ..., нп — собственные значения матрицы А, то
и извлечение квадратного корня приводит к результату.
Упр. 2. Если \хи \\,2, ..., \\.п — собственные значения матрицы
А "и Х\, %г, ..., ^п — собственные значения для А*А, то показать,
что
причем равенство имеет место в том и только в том случае,
когда А нормальна.
Упр. 3. В обозначениях упр. 2 показать, что А будет нор-
нормальной в том и только в том случае, когда при некоторой ну-
нумерации собственных значений Я,г = |м-г|2, г=1, 2, ..., п.
7.4. Возмущение собственных значений простой матрицы
Пусть А — простая матрица с собственными значениями
ць цг> •¦•> И"- Если тогда f7 = diag{jj,i, .-., Цп}, то существует
такая неособая матрица Р, что А — PUP~\ В теореме 6.4.1 мы
7.4. ВОЗМУЩЕНИЕ ДЛЯ ПРОСТОЙ МАТРИЦЫ 215
имели возможность характеризовать некоторый класс матрич-
матричных норм с удобными свойствами, если их применять к диаго-
диагональным матрицам, так что мы приходим к мысли оценить
1И|| для такой нормы через ||?/[|. Таким образом, если (HI—
матричная норма, индуцированная абсолютной векторной нор-
нормой, то равенство А = PUP-1 и теорема 6.4.1 означают, что
где k(P) — условное число для Р относительно ||-||, как опре-
определено в § 7.1. Однако матрица Р определена равенством
А = PUP~l не однозначно. В частности, А = QUQ-1 для любой
матрицы Q — PD, где D — некоторая неособая диагональная
матрица. Мы получим поэтому лучшую возможную оценку
если положить v (Л) = inf k (P), где инфимум берется относи-
р
тельно всех матриц Р, для которых Р~1АР диагональна. Этот
результат может рассматриваться как нижняя оценка для спек-
спектрального радиуса матрицы А и вместе с теоремой 6.1.3 дает
первую часть следующей теоремы.
Теорема 7.4.1. Если А — простая матрица, || -II — матричная
норма, индуцированная некоторой абсолютной векторной нор-
нормой h, и vD) = inf k (P), где Р~1АР диагональна, то
р
glbft(Л)<min| ii,|<v(A) glbA (Л).
Доказательство. Первая часть последнего результата в
точности совпадает с упр. 1 из § 6.5. Что касается второй части,
то равенство А = PUP~l и следствия 1 и 2 теоремы 6.5.1 озна-
означают, что
glbA (Л) > gl^ (P) glbft (P-1) min |
Теорема 6.5.1 тогда дает
Отсюда следует, что min|p,y | ^ v (Л) glbA (Л).
¦216 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
Для матрицы А общего вида доказанная теорема имеет со-
сомнительное вычислительное значение, так как величину v(A)
•оценить трудно. Однако следует заметить, что РР'1 = / озна-
означает, что k(P) = || Р || || р-1 || ^5 1, а следовательно, что v(A) ^ 1.
Если А — нормальная матрица, то мы знаем (теорема 2.10.2),
что Р может быть выбрана унитарной матрицей. Если, кроме
того, мы используем евклидову векторную норму h, а следова-
следовательно, спектральную матричную норму ||«||, то IIPI^II/5!^ 1-
Таким образом, в этом частном случае имеем v(/4)-— 1, к тео-
теорема превращается в известные случаи:
|| А || = max | ц, \, gib,, (А) = tnin | ц, |.
Следующая наша теорема наглядно показывает значение
условного числа v(^) для А как отражающего устойчивость соб-
собственных значений при возмущении матричных элементов. Нам
понадобится следующий простой результат.
Лемма. Если R, S e fnXn и Rx = Sx для некоторого нену-
ненулевого х е Wn, то для любой векторной нормы h и индуциро-
&анной ею матричной нормы ||«|| имеем
Доказательство. Используя определения матричной
.нормы и нижней грани, получаем, что
gib, (/?)< -^y- - -jjj-y < || SI
т. е. получено первое неравенство. Воспользовавшись симмет-
симметрией предположения в лемме, можем поменять местами R и S
в первом неравенстве для получения второго. 4
Теорема 7.4.2. Пусть А, Ве?пхя и А простая. Если А
.имеет собственные значения рц, ..., jj,n, ^ — собственное значе-
значение матрицы А + В и для матричной нормы, индуцированной
некоторой абсолютной векторной нормой,
r = \\B\\v(A),
то ii лежит по крайней мере в одном из кругов
|z —ц./|<г, /= 1, 2 п.
комплексной z-плоскости.
Доказательство. Так как ц — собственное значение для
А + В, то существует уф 0, для которого
(Л
7.4. ВОЗМУЩЕНИЕ ДЛЯ ПРОСТОЙ МАТРИЦЫ 217
Если A = PUP~\ где ?/ = diag {уц, ..., м,„}, то
где х = Р~гуФ0. Таким образом,
(ji/ — U)x — P~lBPx. G.4.1>
Используя лемму, получаем gIbA(p./ — U)^\P~lBP\^k{P)\\B\\,.
откуда
(
Так как это верно для каждой Р, приводящей А к диагональ-
диагональному виду, то
Следовательно, ц лежит по крайней мере в одном из кругов-
|г —Wl<r. 4
Упр. 1. Показать, что в упр. 2 из § 7.2 собственные значения
лежат в кругах с радиусом 2 и центрами в 3 =Ь д/lO, 5г и —2.
Упр. 2. Доказать и добавить к теореме 7.4.2 свойство отде-
отделимости для собственных значений матрицы A -j- В, аналогичное
свойству отделимости в теореме 7.2.1.
Если про матрицу возмущения В из теоремы 7.1.2 известно
также, что она простая, то радиус получаемых в этой теореме
кругов может быть выбран в другом виде, который указан в.
следующей теореме.
Теорема 7.4.3._ Если, в дополнение к предположениям тео-
теоремы 7.4.2, В — простая матрица с собственными значениями,
ц'> ¦ • •> Р'п,то И лежит по крайней мере в одном из кругов
¦i» . / = 1. 2, ..., n,
i ' "
где
v(A, ?)=inf k(P~]Q)
P.Q
и Р, Q приводят к диагональному виду А и В соответственно.
Доказательство. Мы можем переписать теперь
ство G.4.1) в виде
где ?/i = diag{ц', ..., ц^). Следовательно,
glbA Gi/ - ?/)< k (P-]Q) || С/,
откуда и следует результат.
218 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
Очень легко можно получить более сильную форму этой
теоремы. Заметим, что Р будет приводить к диагональному
виду А в том и только в том случае, когда Р будет приводить
к диагональному виду а/ + А для любого комплексного числа
а, и подобно этому для Q, В и —а/ + В. Так как
(а/ + А) + (- а/ + В) = А + В,
то, применяя теорему к а/ + А и —а/ + В, получаем
Следствие 1. При предположениях теоремы 7.4.3 jj, лежит
по крайней мере в одном из кругов
для любого фиксированного комплексного числа а.
Преимущество этого результата в том, что а может быть
выбрано теперь минимизирующим величину тах|ц^— <х| и, сле-
следовательно, минимизирующим площадь кругов, содержащих
собственные значения.
Случай нормальных А и В достаточно важен, чтобы оправ-
оправдать отдельное утверждение.
Следствие 2. Если при предположениях теоремы 7.4.3
матрицы А и В нормальны, то собственные значения для А + В
¦содержатся в кругах
| z — (а + цу) ] < m
max | ц'{ — а |
для любого фиксированного комплексного числа а.
Для доказательства следствия заметим', что Р и Q могут
¦быть предположены унитарными. Это означает, что P~lQ уни-
унитарна и, следовательно, если мы используем спектральную мат-
матричную норму, будем иметь v(A, В) = k(P-lQ) = 1. Результат
¦следует теперь из первого следствия.
Упр. 3. Если А — нормальная матрица с собственными зна-
значениями fii, ..., цп и В имеет все элементы равными е, то
доказать, что собственные значения для A -f- В лежат в кругах
(
n.
Упр. 4. Если А — нормальная матрица и В = diag{6b ..., bn\
вещественна, то доказать, что собственные значения для А + В
лежат в кругах
где
2а = max b, + min Ъ, и 26 = max Ъ, — min b,.
i i it
7.5. АНАЛИТИЧЕСКИЕ ВОЗМУЩЕНИЯ 219
Упр. 5. Пусть А е fflnxn и |ii, ..., |in — собственные значе-
значения матрицы -» (А + А'). Если k — спектральный радиус мат-
матрицы -j (А + А') и
minln, — nk\>2k,
то доказать, что собственные значения матрицы А вещественны.
Упр. 6. Предположим, что А, Вей?„хп, А' = А и |bjfe|^fr
для /, &=1, 2, ..., п. Если [Хь ..., [in — собственные значения
для А и
min| Ц/ — Ни |
то доказать, что собственные значения матрицы А -f- В веще-
вещественны.
7.5. Аналитические возмущения *)
Мы приведем теперь совершенно другой подход к задаче
возмущения. Предположим, что Л е Ф„х„ — невозмущенная
матрица, имеющая собственные значения \ц, ..., \in. Мы пред-
предположим, что А(?) — п X «-матрица, элементы которой являются
аналитическими функциями ? в окрестности**) ?0, и что
А (?о) = А. Для удобства и без потери общности можно считать
go = 0, так что Л@) = А Обозначим через \i\(t,), ..., |ап(?)
собственные значения матрицы A(t,). Тогда (§ 7.2), так как
собственные значения для A(t,) непрерывно зависят от элемен-
элементов А(?), можно предположить, что [Aj(?)->|Aj при g—>0 для
У= 1, 2, ..., п.
Что можно сказать о поведении функций щ(?,) для доста-
достаточно малых |?|? Как мы увидим, в некоторых важных частных
случаях функции |Aj(?) также будут аналитическими в окрестно-
окрестности ? = 0. То, что это не так в общем случае, показывает мат-
матрица
Собственные значения для A(Q — это корни многочлена
det((x/- A (S)) = |i2-S3,
т. е. [XI (О = ?/г (определяемое выбором ветви функции ?'/г) и
|А2(?)=—(Ai(?). Таким образом, мы видим, что собственные
значения несомненно не аналитичны в окрестности ? = 0.
*) Читатель, не знакомый с основными теоремами о функциях ком»
плексной переменной, может пропустить остающуюся часть этой главы.
**) Окрестность точки So — открытый круг, имеющий So Центром.
220 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
Следует заметить, что det(|iV — A(t,))—многочлен от ц, коэф-
коэффициенты которого являются аналитическими функциями ?. Из
теории алгебраических функций следует тогда, что:
(i) если jij — некратное собственное значение матрицы А,
то \ij{?,) аналитична в окрестности ? = 0;
(ii) если [Xj имеет кратность т и цкA)-*щ для k = аь ...
..., ат, то \ih('Q) будет аналитической функцией от ?'" в окре-
окрестности точки ? = 0, где I ^. т и t,'11 — одна из / ветвей функ-
функции ?'/;.
Результат (i) мы докажем вместе с некоторым результатом
о соответствующих собственных векторах. Заметим, что в ре-
результате (ii) мы можем иметь /= 1 и т>\, когда fu(?) мо-
может быть аналитической. Как и следует ожидать, именно случай
(ii) с т > 1 представляет реальные трудности для анализа.
Разложения по дробным степеням 'Q, описываемые в (ii), из-
известны как ряды Пюизье. Выполнимость этих разложений будет
предполагаться при обсуждениях в §§ 7.9 и 7.10.
Положение становится более сложным в случае, когда мы
пытаемся следить за поведением собственных векторов. Матрица
*<Н! .'I
показывает, что даже в случае, когда собственные значения ана-
литичны, правые собственные векторы не обязательно непре-
непрерывны в Z, = 0.
Тем не менее мы должны начать рассмотрение задачи о воз-
возмущении с анализа пространств, натянутых на собственные век-
векторы, поскольку эти пространства определяются компонентными
матрицами для А(?,) (§ 5.5). Основание для этого в том, что,
во-первых, резольвента RZ(Z,)— (zl — Л(^))-1 непосредственно
выражается через Л(?) и, во-вторых, при помощи равенства
E.8.2) мы можем затем исследовать компоненты матрицы для
А(?,). В частности, мы сможем вывести свойства векторов в об-
образе некоторой компонентной матрицы.
7.6. Возмущение компонентных матриц
Предположим, что некоторое невозмущенное собственное
значение \л «расщепляется» при возмущении, определяемом мат-
матрицей А(?), на различные собственные значения in(Z), ¦¦¦
.... цр(?)- Можно доказать, что сумма первых компонентных
матриц для каждого из этих собственных значений аналитична
около ? = 0, и мы показываем в упр. 1, что отдельные первые
компонентные матрицы не обязательно обладают этим свой-
свойством. Эта теорема является краеугольным камнем, на который
опирается весь наш последующий анализ задачи о возмущении.
7.6. ВОЗМУЩЕНИЕ КОМПОНЕНТНЫХ МАТРИЦ 221
Теорема 7.6.1. Пусть А(?) аналитична в окрестности ? = О
и А@) = А. Предположим, что щA), ..., цр(?) — различные
собственные значения матрицы A(Q, для которых цуA)-*ц
при ?,—> (), v = 1, 2, ..., Р, и пусть Zvi(?) — идемпотентная ком-
компонентная матрица для Л(?), соответствующая |iv(?)- Если Z —
идемпотентная компонентная матрица^для А, соответствующая
р,, и мы положили
v=l
то существует окрестность точки \ = 0, в которой имеют место
следующие разложения:
для не зависящих от ?, матриц Or\ B(r\ r = 1,2,...
Доказательство. Мы предполагаем |?0| настолько ма-
малым, чтобы можно было провести простую замкнутую кривую /,
содержащую внутри себя ;х, \ц(?,), ..., цз(^) и не содержащую
других собственных значений А или A(t,) для всех ? с |?|^
< |?о|- Записывая тогда Rz = (Iz—A)~l и /?*(?) = (/z—Л (Q)-1,
получаем (по E.8.2))
Заметим, что при ze/ элементы матрицы Rz(t,) являются
рациональными выражениями от функций ?, которые анали-
тичны около ? = 0. Таким образом, существуют такие не зави-
зависящие от Z матрицы Rz\ г = 1,2, ..., что
R.(Q = R. + ZRm) + M)+ ¦•• G.6.2)
Используя G.6.1), для получения первого результата тео-
теоремы нам следует лишь проинтегрировать этот ряд почленно по
кривой /. Это допустимо, если только каждый коэффициент Rir)
(г = 0, 1, 2, ...) интегрируем по /. Используя упр. 3 из § 5.8,
убеждаемся в том, что
/?i° (С) = -Я* (СМA) (?)/?«(?) G.6.3)
и, следовательно, чго для каждого г R^ будет линейной комби-
комбинацией матриц Rg (Aip)RzY для некоторых целых чисел р, s с
р ^ г. Но Л<р'@) не зависит от z и RZ несомненно непрерывна
222
ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
по г на /. Следовательно, R(P непрерывна на /. Интегрируя ряд
для RZ{1) по /, получаем теперь У(?) = Z + ?СA) + ?2С<2> + ....
где C(r) = ^r\jR{;)dz, г=1, 2, ...
Воспользовавшись упр. 4 из § 5.8, получаем
А (?) Г (С) = JL J 2/?г (S) <fe = /1Z + gfiO + ^ВB) + ... f G.6.4)
у
где
что завершает доказательство. Может быть доказана подобная
этой теорема, по которой из непрерывности A(t) в ? = 0 следует
непрерывность У(?) в ? = 0.
Упр. 1. Найти матрицы Z, Zn('Q), Z2i(?) и У(?) для матрицы
,,п= о g
^ ?2 0
Решение. При ? = 0 матрица А нулевая и, как легко
видеть, Z = /. Собственными значениями Л(?) будут H-i(?) = ?i/i!
и М-2(?) == — Hi (S)- Имеем тогда
ь
z
1
,2 _ ?3
Разложение на рациональные дроби дает
^Г +
Г'1'
Используя E.8.2), получаем
1 -i
Следовательно, У(^) = Zn (?) + Z2i (?) = /. Этот пример подчер-
подчеркивает тот факт, что хотя У(?) может быть аналитична по ?,
компонентное матрицы (суммой которых У(?) является) не обя-
обязательно аналитичны. В самом деле, в этом примере компонент-
компонентные матрицы имеют особенность в ? = 0. Следует также заме-
заметить, что хотя собственные значения не аналитичны в окрест-
7.7. ВОЗМУЩЕНИЕ НЕКРАТНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ 223
ности, содержащей ? — О, они все же «ведут себя лучше», чем
компонентные матрицы.
Упр. 2. Если матрица
10 ? 0 |
ооН
t, 0 1 1
имеет собственные значения ni(?), цг(?) и ц.з(?) и м-1,2 (?) —*0
при ?—>(), то показать, что можно записать
(?) ±гГ/!?3+
Если [I = 0 — исследуемое невозмущенное собственное значе-
значение, то найти Z, Zn(t,), Z\2(Z,) и F(?) и проверить, что У(?) ана-
литична в окрестности Z, = 0.
7.7. Возмущение некратного собственного значения
Мы имеем теперь возможность доказать одну теорему о воз-
возмущении, имеющую очень большое практическое значение. Обо-
Обозначения были введены в двух предшествующих параграфах.
Теорема 7.7.1. Если \i — собственное значение матрицы А
кратности 1, то для достаточно малого |?| существует такое
собственное значение ц(?) матрицы A('Q), что
существуют правый и левый собственные векторы *(?), У(?) со-
соответственно с собственным значением ц(?), для которых
Доказательство. 1. Мы предполагаем всюду далее, что
|?| настолько мало, что |j,(?) имеет кратность 1. Тогда будем
иметь y(?) = Zn(?) — компонентной матрице. Кроме того, по
терминологии § 2.5 У(?) — сопутствующая матрица, и мы мо-
можем написать
Z = xy', Y{Z) = x{i
где
y'x^y'd) ж @=
В таком случае, очевидно, имеем
224 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
так что, умножая это равенство слева на у' и справа на х, по-
получаем
. у'А (О У (О х __ й + ?6. + ?ь2 + ...
после применения теоремы 7.6.1. Коэффициенты справа за-
задаются формулами
Ъ, = у'В^х, сг = у'С^х, г = 1, 2, ...
Отсюда следует, что |л,(?) аналитична в окрестности ? = 0. Пер-
Первая часть теоремы доказана.
2. Ясно, что в утверждении теоремы x(t,) определен лишь
с точностью до ненулевой мультипликативной константы (кото-
(которая может меняться вместе с ?). Мы определим дс(?) более
точно, замечая прежде всего, что в определении матрицы У(?)
нет неопределенности. Затем мы выбираем собственные векторы
х, у с у'х — 1 и, следовательно, ху' = Z.
Тогда У(?) = x(t,)y'(t,) означает, что
а так как Y(Q-*xyf при ?-*0, то {у'х{1)) {у'(Z,)x)-> 1 при S-»0.
Таким образом^ можно предположить, что у'х(?,) и y'(Qx нену-
ненулевые для достаточно малых |?|. Теперь мы можем определить
х(?,), так его нормализуя, чтобы было
У'х @ = 1. G.7.1)
Так как Г (Q х = л E) {у' (?)*), то ff'K (?) ж = »'@ *, так что
Так как матрица F(?) аналитична в окрестности ^ = 0 и
#'У(О)дс= 1, то дс(Р тоже аналитичен в окрестности ? = 0. Тот
же самый результат получаем для у{?), так как он является
правым собственным вектором для А'(?,). Л
Мы доказали существование разложений в степенные ряды
по ? для некратного собственного значения и его собственных
векторов. Следующий шаг в анализе задачи о возмущении за-
заключается в обсуждении методов вычисления коэффициентов
этих разложений.
7.8. Оценка коэффициентов возмущения
Мы обсудим сначала одну частную задачу, которая нам
далее понадобится в нескольких местах. Если ц — собственное
значение матрицы А е 'g'nxn и Ь Ф 0, то мы должны решить
уравнение
. (ц/-Л)* = *. G.8.1)
7.8. ОЦЕНКА КОЭФФИЦИЕНТОВ ВОЗМУЩЕНИЯ 225
Как мы знаем (теорема 1.16.3), вектор-решение существует
<=> Ъ ее й? (А — ц!). Необходимое условие для существования
решения может быть сформулировано в терминах левого соб-
собственного пространства Ж для ц,. Мы пишем j/e! в том и
только в том случае, когда у'(ц/ — Л) = 0'. Ясно, что Ь должен
удовлетворять условию у'Ь = 0 для каждого у ее Ж, т. е. Ь и у
квазиортогональны для каждого у ее Ж.
Мы стремимся выразить решение х для G.8.1) через спект-
спектральные свойства матрицы А. Если \i = \iu ц2, ¦••, ц«— различ-
различные собственные значения, то мы сначала определяем матрицу
(/ —Zn) Aц — Л)-'(/ — Zn), G.8.2)
ограничение резольвенты на образ / — Z\\
(§§ 5.4 и 5.5 и равенство E.8.1)). Принимая во внимание спект-
спектральное разложение для А (упр. 1 из § 5.4)
S
А — \iZn + Z12 + 2 (HftZfti + Zk2),
после некоторых преобразований можно показать, что
цЕ — ЕА = 1 — гп. G.8.3)
Таким образом, умножая G.8.1) слева на Е, получаем
(I-Zn)x = Eb. G.8.4)
Особенно мы будем заинтересованы в векторах-решениях х,
которые удовлетворяют также условию у'х = 0 для каждого
у ее Ж. Такое решение нетрудно получить, если индекс \i ра-
равен 1, ибо в этом случае компонентная матрица Zn будет сум-
суммой сопутствующих матриц (§ 2.5). Итак, для квазибиортого-
нальных систем базисных векторов уи ..., уа (для Ж) и
х\, ..., ха (для Jf(A — ji/)) имеем
а
7„ = V v и'
/Г] / i'
Ясно теперь, что для такой Zn имеем у'х = 0 при каждом
у^Ж <=> Zn* = 0. Подстановкой в G.8.4) получаем следую-
следующий результат.
Лемма. Если ц — собственное значение индекса 1 матрицы
А и Ж — левое собственное подпространство для ц, то вектор
| = ЕЬ (где Е задается равенством G.8.2)) будет решением
уравнения (ц1 — А)х = Ь (где Ь<^&1(\к1 — А)), для которого
у'% = 0 при каждом у ei'.
226 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
Упр. 1. Если Jf* = JP([kI — A)* nJt — левое собственное под-
подпространство для [х/ — А, то доказать, что два следующих усло-
условия эквивалентны:
(i) у'Ь = 0 для каждого j/eJf.
(ii) b^VnQA'*.
Затем, используя упр. 5 на стр. 120, доказать, что уравнение
G.8.1) имеет решение Ф=> выполняется условие (i).
Упр. 2. Получить равенство G.8.3).
*Упр. 3. Если (д, = (д,1 — собственное значение А и щ,..., ц$ —
различные собственные значения А, то показать, что равенство
E.8.1.) можно записать в виде
(zl -А) = > — — + Е (z),
f\ ( )'
где ? (г) —аналитическая в окрестности ц матрица и ZnE(z) =
= E(z)Z\\ = 0. Полагая Е = Е(ц), использовать это равенство
и теорему 5.5.1 для получения G.8.3).
Предположим теперь, что выполняются предположения тео-
теоремы 7.7.1. Тогда [х имеет кратность 1, и для достаточно малых
|?| имеем
(А
Можно приравнять коэффициенты при ?п, получаемые при
перемножении этих рядов, для п = 0, 1, 2, ... Коэффициент
при ?° приводит к равенству для невозмущенного собственного
значения: Ах = цл. Приравнивание коэффициентов при ? дает
(цГ - А) «о = (Л<» - цо>/)х. G.8.5)
Если у — левый собственный вектор для ц, то мы знаем, что,
так как *<'> существует, у'(Л<'> — ц,*1'/)* = 0. Так как у'х=1,
из этого условия получаем
р1» = у'А1»х. G.8.6)
Нам известно также, что по определению вектора *(?) соот-
соотношение G.7.1) приводит к равенству
откуда следует, что
у'х^ = 0, г=1, 2, ... G.8.7)
Воспользуемся теперь результатом леммы. В данном случае
лространство Ж порождается у, так что решением уравнения
G.8.5), согласованным с условием у'дгС = 0, будет
—|х(|>/)ж.
7.9. ВОЗМУЩЕНИЕ КРАТНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ 227
Кроме того, так как Z\\ == xy\ можно записать Ex = EZ\\X
и часть (ii) теоремы 5.5.1 означает, что Ех = 0. Таким образом,
мы завершаем поиск решения для коэффициентов возмущения
первого порядка следующим образом:
цA) = 0'Л<»*, *<» = ?Л»>*. G.8.8)
Приведенное рассуждение легко обобщается до получения
рекурсивных соотношений для вычисления |л,<г> и х^ при лю-
любом г. Приравнивание коэффициентов при ?г в Л (?)*(?) =
= (л, (?)*(?) приводит к равенству
или
(ill- А)хР=*(АМ — рЩх<г-»+ ... + (Л(г) - ц(г>/) х.
Если предположить теперь, что цЯ, .... ц*''-1) и *('), . ...дсС-') из-
известны, то условие квазиортогональности для правой части при-
приводит к
|Аи=0'Л">* + у'Л*'-1>л:<»+ ... +уМ«1ж''-1> G.8.9)
для г = 1, 2, ... и дс@) = л:. По лемме тогда получаем
... +04<г-1)-ц(г-1)/)х'|» + Л<г»*]. G.8.10)
Во многих приложениях возмущения матрицы А линейны
по ?. Таким образом, мы имеем Л (?) = Л + ?i3 для некоторой
матрицы fi, не зависящей от ?. В этом случае Л'1' = fi и Л<2> =
= Л<3) = ... = 0. Равенства G.8.9) и G.8.10) превращаются
тогда в
г-1
для г = 1, 2, ... Напомним, что в этих формулах верхние ин-
индексы не обозначают производные. Например, имеем
Упр. 4. Показать, что равенство G.8.9) в случае г = 2
можно записать в виде
7.9. Возмущение кратного собственного значения
Мы можем теперь рассматривать решенной задачу об ана-
аналитических возмущениях некратного собственного значения. Ре-
Результат (i) из § 7.5 получен. Если ц — собственное значение
матрицы Л кратности т > \, то мы должны обратиться к пред-
228 гл. 7. Теория возмущений
ставлению возмущенного собственного значения ц(?), которое
стремится к [х при ?->0 (результат (ii) из § 7.5), в виде ряда
Пюизье. В § 7.6 были получены некоторые дополнительные све-
сведения о поведении компонентных матриц для возмущенных
собственных значений. Как мы убедились, хотя их сумма У(?)
аналитична для достаточно малых |?| (теорема 7.6.1), отдель-
отдельные компонентные матрицы могут иметь особенности в ? = О
(упр. 1 из § 7.6).
Предположим теперь, что на матрицу А (?) наложено допол-
дополнительное условие о том, что она эрмитова и аналитична в окре-
окрестности ? = 0. Непосредственное рассмотрение уравнений
Крши — Римана показывает тогда, что во избежание тривиаль-
нрсти Z, следует считать вещественным. Тогда возмущенные соб-
собственные значения должны быть вещественны и сопровождаю-
сопровождающие матрицы должны быть эрмитовы. Эти дополнительные
ограничения в задаче, как можно показать, означают, что воз-
возмущенные собственные значения аналитичны по ? независимо
от того, какова кратность невозмущенного собственного значе-
значения. Возмущенные сопровождающие матрицы также будут
аналитичны, и, следовательно, собственные векторы матрицы
A(t) можно считать аналитичными и ортонормированными
всюду в окрестности t, = 0. Эти важные результаты были впер-
впервые доказаны Ф. Реллихом в начале 1930-х годов. Первое дока-
доказательство*) Реллиха зависит в основном от того, что возму-
возмущенные собственные значения вещественны. Мы докажем ре-
результат (теорема 7.10.1), содержащий перечисленные выше
результаты, при помощи более современной и простой техники,
принадлежащей Като.
Мы рассмотрим сначала задачу о возмущении, не делая
предположения относительно симметричности первоначальной
матрицы. Мы докажем, что если \i — собственное значение мат-
матрицы А индекса 1 и fi;(?)— собственное значение матрицы Л(?),
для которого ц3-(?)-*ц при ? —>О, то при ?->0
МО == ii + а? + О (| С Г+A/о).
Таким образом, в разложении Пюизье для (ij(?), описанном
в результате (ii) из § 7.5, коэффициенты при Q11 равн-ы нулю
для /== 1, 2, ..., 1—1.
Прежде чем приступить к доказательству этого результата,
еще раз подчеркнем, что всюду до конца этой главы А (?) ана-
аналитична от комплексной переменной ? в окрестности Z, = 0
и /4@) = А. Кроме того, |ij(?) — собственное значение матрицы
A(Q, для которого М?)->ц ПРИ ?~*0> и w(?) имеет разложе-
•) F. Rellich, Math. Ann. 113 A937), 602.
7.9. ВОЗМУЩЕНИЕ КРАТНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ 229
ние в степенной ряд около ? = 0 по степеням 'Q1'1 для некото-
некоторого положительного целого числа /.
Лемма 1. Существует правый собственный вектор x(Z),
соответствующий jxj{'Q) для всех ? из некоторой окрестности Jf
точки 5 = 0 а обладающий такими свойствами, что при евкли-
евклидовой векторной норме h(x('Q))= 1 для ^е/ и лс(?) аналити-
чен по t,111 для ? ее Jf.
Доказательство. Положив B('Q) = A(?:)—ц3-(?)/, мо-
можем считать элементы матрицы В аналитичными по т] = ?|/7. Мы
построим некоторый вектор х, который аналитичен по г\ и обла-
обладает свойством: В(г\)х(г\) = 0 для всех ц в некоторой окрестно-
окрестности точки г) = 0.
Предположим, что В (ц) имеет ранг г в некоторой окрестно-
окрестности точки г\ = 0. Для простоты и без потери общности будем
считать, что минор порядка г
о П. 2 г\
В\12 г)
не равен нулю в некоторой окрестности г\ = 0. Рассмотрим тогда
разложение минора
Ч!:5::::;:!)
по его последней строке. Обозначим через Мл). ¦¦-, /н-i (л)
алгебраические дополнения для br+i,i{f\), ..., ftr+i, r+i ("Л) в этом
определителе. Таким образом,
г+1
Определим теперь /г+2(т])= ... =/„A1) = 0 и затем вектор
с элементами h(r\), ..., /и(т)). Заметим, что
Bh (л) / (л) = X й/* (л) /* (л) = в (|; J ;;;;;; ;г +, ) = о.
Мы получаем нуль справа для /= 1, 2, ..., г потому, что опре-
определитель имеет две одинаковые строки, и нуль для / = г+ 1, ...
..., п потому, что в этом случае имеем определитель, совпадаю-
совпадающий с минором в В порядка г+1. Таким образом, В(г\)I(г\) = 0.
Для завершения доказательства мы должны лишь показать,
что / может быть соответствующим образом нормализован. Это
предоставляется сделать читателю в качестве упражнения.
Заметим, что этой леммой можно было бы воспользоваться в
теореме 7.7.1 для доказательства того, что правый собственный
вектор дс(?) можно считать аналитическим, если известно,
что |j,(?) аналитично.
8 П. Ланкастер
230 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИЙ
Лемма 2. Для собственного вектора *(?), определенного
емме 1
в лемме 1,
A((Zn)*(C)) = O(|?|) при
Заметим, что, полагая дс = Zn* + (/ — ZX\)x, получаем пер-
первую составляющую х в образе Z\\ (которая в точности совпа-
совпадает с правым собственным подпространством для \i, если и
имеет индекс 1: теорема 5.5.3), а вторая составляющая появ-
появляется в формулировке леммы. Мы утверждаем, что величина
этой составляющей дс(?) стремится к нулю, как |?|, при Z, -> 0,
даже если величина *(?) стремится к нулю, как |?|''(.
Доказательство. Можно записать А (?) = А -f- 1К(?,),
где /С(?) аналитична около ? = 0. Тогда уравнение (А(?)—
— \ij(t,)I)x(t,) = 0 можно представить в таком виде:
(|i, (?) /- А) *(9 = ?/С (?)*(?). G.9.1)
Случай (i). Предположим, что ц;(^)^ц в окрестности
? = 0. Тогда, умножая это равенство слева на матрицу ? из
G.8.2) и используя равенство G.8.3), получаем
(/-Z,,) *(?) = ??* (?)*(?).
Так как Л(дс(?))=1, лемма следует отсюда сразу же. Един-
Единственная другая возможность есть
Случай (и). В некоторой окрестности точки ? = 0 имеем
\ij(l)^=\k, исключая ? = 0. Умножая слева равенство G.9.1) на
(\ij(?,)I — А)-] и используя выражение для резольвенты, дан-
данное в упр. 3 из § 7.8, получаем
Умножив теперь это равенство на / — Zu слева. Так как
ZnZij = Z\j и ZnE(z) = 0, то находим, что
(/-Z, ,)*(?) = ??(^E))* (?)*(?)•
Так как Е аналитична по ?1//, /С аналитична по ? и Л(д;(?))= 1,
то результат доказан также и в случае (п). Л
Умножив равенство G.9.1) на Zu слева, получим
Если предположить, что \i имеет индекс 1, то Zn*(?) обяза-
обязательно будет правым собственным вектором для А, соответ-
соответствующим (д, (теорема 5.5.3), а так как AZ\\ = ZUA, то
7.9. ВОЗМУЩЕНИЕ КРАТНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ 231
Эти два равенства означают, что для t,?=0
Следовательно, воспользовавшись евклидовой матричной нор-
нормой, имеем
h [^(^й znx(Q - ZnK
Согласно лемме 2 правая часть стремится к нулю при ?,—*0,
так что то же самое должно быть верно для левой части. Так
как lim ZnKiQ Zux (Q тоже существует, то отсюда следует,
что найдется такое число а^ что
.. I*/ <С) — I*
lim —-—= = а,.
Кроме того, полагая х = х{0) и замечая, что ZuX = x
и lim K(V) = АA] (первая производная матрица А (?) в t, = 0),
5о
получаем
Таким образом, а, язляется собственным значением матрицы
ZiiA^Zn с правым собственным вектором х. Нами доказана
Теорема 7.9.1. Пусть А(?,) — аналитическая по ? в окре-
окрестности ? = 0 матрица и А@) = А. Пусть ц — собственное зна-
значение для А индекса 1 и \ij(t,)—собственное значение для A(t,)
с (х;@) = (д,. Тогда существует такое число а.), что
при 'Q-+0 и aj — собственное значение для Z
Кроме того, каждому \x,j(l,) соответствует по крайней мере
один собственный вектор Xj(t,), для которого h(Xj (S))= I при
достаточно малом |?|:
х, хи ..., ДС/-, еЛ°(Л — м-/) и ajX = Z
Упр. 1. Найти Z\\A(l)Z\i для матрицы Л(?) в упр. 2 из § 7.6
и показать, что результат теоремы 7.9.1 согласуется с разложе-
разложениями для т,2(?). данными в этом примере.
Упр. 2. Проверить результаты теоремы 7.9.1 для матрицы
Л(?) в упр. 1 из § 7.6 и для матрицы
232 ГЛ. 7. ТЕОРИЯ ВОЗМУЩЕНИИ
Упр. 3. Доказать, что если а* — собственное значение мат-
матрицы Z\\A^Zn индекса 1, то существует такое число bj, что
и bj — собственное значение для Zn (А^ЕАМ + ABi)Zn с правым
собственным вектором х.
7.10. Редукционный процесс
Теорему 7.6.1 можно использовать в исследовании возмуще-
возмущений собственного значения индекса 1 другим способом. «Редук-
«Редукционный процесс», который мы собираемся описать, недавнего
происхождения и принадлежит Като*).
Используя G.6.1) и G.6.2), можем написать:
оо
(Iix - А (?)) Y @ = ^± \ (г - ц) Rz @ dz = -^- J (г - ц) J] Г/?Г dz.
Но У@) = Z, и если ц имеет индекс 1, то (/jx — ЛJ = 0и член
справа, который не зависит от ?, должен тоже быть равным
нулю. Таким образом, мы записываем
(IlJi-A(O)Y(O=Z'Qn^in) G.10.1)
п = \
и отмечаем, что
Для оценки этого интеграла воспользуемся G.6.3):
№ = - (/z - Л) ЛA> (/z - Л)" =
согласно упр. 3 из § 7.8, где Е{г) аналитична в окрестности ц.
Подставляя это выражение в интеграл для ^О, из теоремы
о вычетах получаем
sfW = ZAMZ. G.10.2)
Воспользовавшись G.10.1), определим теперь
г=0
*) См. дополнение 3.
7.10. РЕДУКЦИОННЫЙ ПРОЦЕСС 233
и заметим, что S& @) = ZAV>Z и s4-{Z,) аналитична в окрестно-
окрестности I =0.
С помощью разложения Пюизье для собственных значений
матрицы A('Q) можно теперь легко доказать первую часть тео-
теоремы 7.9.1. Пусть Xj(?,) — правый собственный вектор для А(?,)
с собственным значением Hj(t). Тогда Xj('Q) обязательно при-
принадлежит образу проекции У(?). Таким образом, jcj(?) =
= Y(t)xj('Q) и, умножая G.10.3) справа на *.,¦(?), получаем
Таким образом, trl (ц — ^j(S)) является собственным значением
для s4-(t), а так как таковое имеет разложение Пюизье около
? = 0 по степеням t}jl, например, то мы имеем
Кроме того, постоянный член в разложении Пюизье р,С> является
собственным значением невозмущенной матрицы ZAi^Z.
Ясно, что если ц<'> — собственное значение для ZA^Z ин-
индекса 1, то мы можем продолжить редукционный процесс еще
на один шаг и получить результат упр. 3 из § 7.9:
В противоположность методам из § 7.9 изложенный редук-
редукционный процесс имеет то преимущество, что он сохраняет сим-
симметричность. Так, предположим, что А(г) нормальна для веще-
вещественного е. Тогда У(е) = У(е)* (ср. упр. 4 из § 5.5) и, так как
А(е) и У(?) коммутируют, мы можем написать
Проверка того, что s&(t,) нормальна, является нетрудным упраж-
упражнением. Таким образом, ^@) нормальна и все собственные зна-
значения матрицы ZA^Z должны иметь индекс 1. Так как симмет-
симметричность сохраняется при редукционном процессе и невозму-
невозмущенные матрицы нормальны на каждом шаге, то собственные
значения \ij(?,) имеют разложения по целым степеням ? вблизи
? = 0. Поэтому нами доказана
Теорема 7.10.1. Пусть А(?) аналитична и нормальна
при вещественном ?. Тогда собственные значения матрицы {
аналитичны в некоторой окрестности ? = 0.
~\ Г л а в а 8
ПРЯМЫЕ ПРОИЗВЕДЕНИЯ,
РЕШЕНИЕ МАТРИЧНЫХ УРАВНЕНИИ
И ЗАДАЧИ УСТОЙЧИВОСТИ
8.1. Введение
Эта глава состоит из трех разделов, находящихся в после-
последовательной зависимости. Мы исследуем сначала некоторую но-
новую операцию, называемую прямым произведением, которая
в полной общности является бинарной операцией из @~кх1У\
X Утхп в Jbx». Однако мы ограничимся рассмотрением слу-
случая к = I, т = п. Это наиболее полезный случай в приложе-
приложениях, в котором имеются красивые результаты относительно
зависимости собственных значений матрицы-произведения or
сомножителей.
Знание прямого произведения облегчает анализ матричных
уравнений. Мы сосредоточимся здесь на линейных уравнениях
от матричной переменной, коэффициенты которых будут тоже
матрицы. Полезные результаты известны также для полино-
полиномиальных уравнений более высокой степени, которые не слиш-
слишком недоступны, но мы не будем ими заниматься, так как для
них нет непосредственного приложения.
Третий раздел имеет наибольшее практическое значение.
Матрица Ле?Пхп, все собственные значения которой имеют
отрицательные вещественные части, называется устойчивой. Это
понятие возникает при изучении решений дифференциального
уравнения к = Ах (§ 5.9), где точка обозначает дифференциро-
дифференцирование по времени. Такое уравнение с устойчивой матрицей ко-
коэффициентов А, как известно, имеет лишь устойчивые решения
в интуитивно понятном смысле. Наше прежнее изучение реше-
решения матричных уравнений будет иметь большое значение при
изложении подхода Ляпунова к задаче об устойчивости.
8.2. ПРЯМОЕ ПРОИЗВЕДЕНИЕ
8.2. Прямое произведение
235
Если ЛЕ^"тХт и В^.@~пхп, to прямое произведение А и В
(в записи А ® В) определяется как блочная матрица
021-6
а.2тВ
ат2В ... аттВ
¦¦У,
тп X тп-
В определении несомненна некоторая степень произвольности.
Так, можно спросить, почему А ® В не определяется как
Abu ... АЬ
Чп
АЬп\ ... АЬп
Ответ состоит в том, что для наших целей, используя два воз-
возможных определения, можно было бы получить параллельные
свойства и, что касается приложений, оба определения были бы
одинаково полезны. Понятие прямого произведения естественно
возникает в теории групп и в результате имеет важные прило-
приложения в физике элементарных частиц.
Нам понадобится явный вид элементов матрицы А ® В. Как
нетрудно видеть, для г, i = 1, 2, ..., т и s, j = 1, 2, ..., п эле-
элементом в строке (г— \)п-\- s и столбце (i— \)п + / будет aribSj.
Таким образом, если положить С = А ® В и
где 1 ^ г, i ^ m, I ^ s, / ^ п, то сы = aribSj.
Следующие свойства прямого произведения непосредственно
следуют из определения. Читатель может провести любую не-
необходимую проверку. Предполагается, что размерности входя-
входящих в формулы матриц таковы, что все операций определены.
(а) Если ц*=&~, то (цЛ)® В = А ®(цВ)= ц(А ® В).
(б) (А + В)® С = А ® С + В® С.
(в) А ® (В + С) = А ® В + А ® С.
(г) А ® (В ® С) = (А ® fi) ® С.
(д) (Л® 5)' = Л'® 5'.
Отметим, что, вообще говоря, прямое произведение не ком-
коммутативно. Нам понадобится еще одно свойство, которое менее
очевидно и окажется очень полезным. Оно содержится в сле-
следующей теореме.
Теорема 8.2.1. Если A, Ce5fmxm и В, Defnxn, то
(А ® В) (С ® D) = AC ® BD.
236 ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
Доказательство. Как мы видели, элемент (k,v) мат-
матрицы Е = А® В равен ekv = arubsv, где k=(r—l)n-f-s, v —
= (ы— \)n-\-v и 1 ^ г, и ^ m, I ^ s, о ^ л. Подобно этому
элемент (v, /) матрицы F = С <8> D задается в виде
где 1 sg; t sg; т, 1 ^ / ^ п.
Таким образом, элемент (&, /) матрицы G = (А ® fi) (С
равен
ёы = Tj efev/v/ == Z arlibsvcuidoj.
l I
m и
Используя выражение для v, мы пишем теперь 2j 2 вместо
1
2
0=1
2] и получаем
l
U=l 0=1
Так как AC^&"mxm, BD ^@~nxn и индексы имеют соответ-
соответствующие пределы, убеждаемся в том, что G = AC ® SD.
Эта теорема приводит к некоторым важным выводам, кото-
которые мы перечисляем в следующем следствии.
Следствие. Если А е &~тхт и В е ^"пХп. го
(i) А®:В =(А ®: 1п) Aт<& В);
(ii) det(yl ®fi) = (detA)«(detfi)m;
(iii) если дополнительно А и В неособые, то
(iv) если Л ь Л 2, ..., ЛА е Jmxm ы Ви В2у ..., Bk^ 9~nxn, то
(Л, ® В,) (Л2 ®В2) ... (Ak <g> fife) = (Л,Л2 ... Лй) ® E,52 . . . fife).
Доказательство. Часть (i) — непосредственное приме-
применение теоремы. Для части (ii) заметим, что
/m®fi = diag{fi, В, .... В},
так что det(/m®fi) = (detfi)m.
Затем нетрудно убедиться в существовании перестановочной
матрицы Р, для которой Р'{А ®/„)Р =In ® Л, а так как
detP = 1, то det(A ® /„) = det(fn ® A) = (detA)n. Результат
получается теперь взятием определителей в части (i).
Для части (iii) из теоремы получаем
(Л ® В) (Л ® Б) = 1п ® /„ = 1
1пп,
откуда и следует результат.
8 3. СОБСТВЕННЫЕ ЗНАЧЕНИЯ СОСТАВНЫХ МАТРИЦ 237
Часть (iv) получается применением обычного доказатель-
доказательства по индукции.
Упр. 1. Доказать часть (i) следствия непосредственно, ис-
используя лишь определение прямого произведения.
Упр. 2. Доказать, что 1г(Л ® Я) = (tr Л) (trfi).
Упр. 3. Положим Ат=А и определим Л^+ч = А ® А^к\
k = \, 2, ... Доказать, что
(i) ^tfe+?l = Л1&] О AW;
(ii) если А, В?в&~пХп, то (AB)W = A^B^. (Отметить про-
противоположность с (АВ)к.)
Упр. 4. Если г (А) обозначает ранг матрицы А, то показать,
что
[Указание. Воспользоваться теоремой 4.8.1.]
8.3. Собственные значения составных матриц
Рассмотрим некоторый многочлен ф от двух переменных х
и у с комплексными коэффициентами. Таким образом,
D
ф(*. у)= ? Сцх'у1
«•. 1=о
для комплексных чисел Сц и целого числа р. Если А е ?mxm
и В е ffnxn, то мы рассматриваем матрицы в fmnXmn вида
; В)= Е
г. /
Например, если ф(х, у) = 2х + л^У3, то 2х-\-хуг = 2ххуй-\-xxyz и
Одной из главных причин интереса к прямому произведению
является следующая изящно простая связь между собствен-
собственными значениями матриц Л, В и ц>(А;В).
Теорема 8.3.1. Если Хи ..., %т — собственные значения
для А е ffmxm и М-ь • • ¦ > М-» — собственные значения для
В ^ffnyn, то собственными значениями матрицы ф(Л;?) будут
тп чисел ф(Яг, \is), где г = 1, 2, ..., т и s = 1, 2, ..., л.
Доказательство. 1. Определим матрицы P^'S'mxm
Q g' так, что
и /i, /2 — матрицы в жордановой нормальной форме (§ 4.13).
Очевидно, что /{— верхняя треугольная матрица с элементами
238 ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
к\ %1т на главной диагонали и подобно этому \х[, ..., \i'm —
элементы на главной диагонали верхней треугольной мат-
матрицы ]{•
Кроме того, из определения прямого произведения следует»
что J\®J'2—тоже верхняя треугольная матрица, имеющая на
главной диагонали элементы Klr[i's для г= 1, 2, ..., т; s = 1,
2, ..., п. Отсюда получаем, что матрица ф(/ь/г) верхняя тре-
треугольная и имеет на главной диагонали элементы ц>(Кг, |lis). Но
элементы на главной диагонали верхней треугольной матрицы
являются ее собственными значениями. Следовательно, ф(/ь/2)
имеет собственные значения ф(Аг, \is). Теперь нам остается лишь
показать, что ф^ь/г) и <р(А;В) имеют одинаковые собственные
значения.
2. Применяя часть (iv) следствия теоремы 8.2.1, находим,
что
а по части (Hi) того же следствия Р~1 ® Q = (Р ® Q). Таки\г
образом,
]\ ®ji2=(P®Q) {А1 ® В')(Р ® Q)~l
и, следовательно,
Это показывает, что ф(/ь/г) и ф(Л;Л) подобны, так что они
должны иметь одинаковые собственные значения (теорема
2.4.1). <
Следующие два частных случая, вероятно, наиболее часто
используются. Если ф(х, у) = ху, то теорема означает, что соб-
собственные значения матрицы А ® В совпадают с тп числами
Xriis, где г=\, 2, ..., т; s=\, 2, ..., п. Если же ц>(х,у) =
= х + у, то получаем, что собственные значения матрицы
А ® /п + /щ ® В совпадают с тп числами Kr-\-\x,s. Матрица
А ® /п + 1т <8) В часто называется кронекеровской суммой мат-
матриц А и В.
Упр. 1. Проверить теорему 8.3.1 в случаях ф(л:,у) = \;
)
Упр. 2. Воспользовавшись примененным при доказательстве
теоремы 6.1.3 приемом, показать, что если Ах = %х и By = jxy,
то (Л ® fi)z = Я(х2, где
z/ = IUi^2y' ••• хту'\\.
Упр. 3. Исследовать собственные векторы матрицы
если дано, что Л —простая матрица.
Упр. 4. Доказать, что А ® /п и /m ® S коммутируют
8.4, РЕШЕНИЕ ЛИНЕЙНЫХ МАТРИЧНЫХ УРАВНЕНИЙ
239
Упр. 5. Если С = А ® /„ + Im ® В, то доказать, что ес =
__ ел 0 ев
Упр. 6. Пусть Ле?пх» и В е fmnxmn — блочная матрица,
каждый из т2 блоков которой равен А. Если А имеет собствен-
собственные значения щ, ..., \in (не обязательно различные), то дока-
доказать, что собственные значения матрицы В равны тщ, ..., тцп
и 0 в количестве п(т — 1).
8.4. Решение линейных матричных уравнений
Рассмотрим общее линейное матричное уравнение для не-
неизвестной матрицы Х^^пхп:
А1ХВ1 + А2ХВ2+ ... +AkXBk = C, . (8.4.1)
где Аи ..., Лй, Ви ..., Вц и С — элементы из ffnxn- Временно
рассмотрим уравнение лишь с одним членом слева: АХВ = С.
Это уравнение можно рассматривать как сокращенную запись
для п2 скалярных уравнений с п2 элементами из X. Таким об-
образом, если определить элементы из %& с помощью *)
(8.4.2)
то уравнение АХВ = С будет эквивалентно уравнению Gx = с
для некоторой G е^^хп'. Выделяя элемент г, s из АХВ, по-
получаем
Ar,XB,s —
= cr
Таким образом, коэффициент при xfj в [(г—l)n-\-s]-M уравне-
уравнении равен aribjS, т. е. матрица G задается элементами aribjS
в строке (г— \)n-\-s и столбце (г— 1)п + /, где l^r, s, i, j^n.
Сравнивая эти элементы с элементами произведения А ® В,
вид которых выяснен в § 8.2, убеждаемся в том, что G = А ® В'.
Возвращаясь к уравнению (8.4.1), видим, что оно эквивалентно
уравнению Gx = с, где
G = Л, ® S, + А2 ® В2 + ... +
(8.4.3)
Теорема 8.4.1. Считая, что х и с определяются формулой
(8.4.2), будем иметь, что множество решений уравнения (8.4.1)
*) См. § 1.15 для употребляемых здесь обозначений.
240 ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
совпадает с множеством решений уравнения Gx = с, где G
задается формулой (8.4.3).
Преобразовав линейное матричное уравнение к уравнению
вида Gx = с, мы можем применить теперь результаты из § 1.16
к задаче получения условия для существования и единственно-
единственности решения. В явном виде оно нам не понадобится.
Обратимся теперь к некоторым частным случаям. Самая про-
простая нетривиальная возможность — это уравнение АХ = С. Но
эта уравнение эквивалентно п уравнениям АХ^ — С^ для
/= 1, 2, ..., п, что охватывается анализом гл. 1. Таким обра-
образом, если А неособая, то АХ = С имеет единственное решение
Х — А~1С, и решение существует в том и только в том случае,
когда матрица (|ЛС|| имеет ранг матрицы А.
Упр. 1. Доказать, что уравнение АХ — ХА = XX имеет не-
нетривиальное решение в том и только в том случае, когда X =
= Цг — fxs, где hi, ..., (in — собственные значения для А.
8.5. Уравнение АХ-\- ХВ = С
Применяя теорему 8.4.1 к уравнению АХ-\-ХВ = С, полу-
получаем эквивалентное уравнение Gx = с, где G — A <gs I -\-1 <gs В'.
Согласно теореме 1.16.5 уравнение для X имеет единственное
решение в том и только в том случае, когда G неособая. Мы
знаем также, что G неособая в том и только в том случае, когда
ее собственные значения ненулевые (упр. 1 из § 2.1). Но, как
мы видели в § 8.3, собственные значения матрицы А ® / -j-
-j-/ ® В в точности совпадают с п2 числами Xr -\- \is, где Х\, ...
..., Хп — собственные значения матрицы А и fx;, ..., цп — соб-
собственные значения матрицы В. Таким образом, получена
Теорема 8.5.1. Уравнение АХ -f ХВ = С имеет единствен-
единственное решение фф А и —В не имеют общих собственных значе-
значений.
Существует частный случай, в котором можно получить точ-
точный вид для матрицы-решения X. Предположим, что А и —В не
имеют общих собственных значений, и рассмотрим матрицу
Z(t), определяемую как решение задачи с начальным значе-
значением:
^ = AZ + ZB, Z@) = C.
Как указывалось в упр. 7 из § 5.9, решением этого матричного
дифференциального уравнения будет
Z @ = eAtCeBi.
Предположим теперь, что iim eAtCeBt = 0 и что матрица
t-><x>
оо
Х=— \ eAtCeBt dt существует. Например, зная строение мат-
8.5. УРАВНЕНИЕ АХ + ХВ — С 241
риц eAt и ет (§ 5.9), легко видеть, что эти условия выпол-
выполняются, если вещественные части собственных значений для
А к В все отрицательны. При этих предположениях мы можем
проинтегрировать дифференциальное уравнение от t = 0 до оо
и получить С = АХ + ХВ. Таким образом, мы имеем решение
уравнения АХ + ХВ = С вида
со
Х = -( eA'CeBtdt. (8.5.1)
Ясно также, что если А и В имеют собственные значе-
значения, вещественные части которых все отрицательны, те А и
—В не имеют общих собственных значений, так что, согласно
теореме 8.5.1, существует лишь одно решение. Таким образом,
имеем:
Теорема 8.5.2. Если все собственные значения матриц А,
Bei(g'nxn имеют отрицательные вещественные части, то един-
единственное решение X уравнения АХ -f- ХВ = С задается по фор-
формуле (8.5.1).
Рассмотрим теперь случай, когда Лий имеют общие соб-
собственные значения. Тогда G = А ® / -f- / ® В' особая и решения
будут существовать при условии, что пополненная матрица
|| Gc || имеет ранг матрицы G (теорема 1.16.3). Число линейно
независимых решений определяется тогда размерностью d ну-
нулевого подпространства для G. Определение числа d — относи-
относительно трудный вопрос, и мы не будем этим заниматься. Тео-
Теорему в полном объеме и доказательство можно найти в образ-
образцовой обзорной работе Макдаффи *), где приведено доказатель-
доказательство Фробениуса; это доказательство датируется 1910 г.
*Упр. 1. Если A = PJP~l и B = QJQ-\ где /, 7 — матрицы
в жордановой нормальной форме, то доказать, что уравнения
АХ + ХВ = 0 (для X) и /У + У/ == 0 (для У) эквивалентны,
если положить У = P~{XQ.
Упр. 2. Предположим (в теореме 8.5.1), что А простая
и имеет некоторое собственное значение Кг кратности щ. Пусть
\ij — собственное значение матрицы В, для которого Я, + щ = 0,
и пусть fij имеет кратность f5j, геометрическую кратность у?
и индекс 6j. Если k — число линейно независимых решений
уравнения АХ -f- ХВ = 0, то показать, что k~^yj при а,^ pj,
и k ^ 2 при а,г > 6j.
Упр. 3. Доказать, что уравнение АХ + ХВ = 0 имеет неосо-
неособое решение ФФ IX — А и 1Х-\-В имеют одинаковые инвариант-
инвариантные многочлены.
*) См дополнение 3.
242 ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
8.6. Коммутирующие матрицы
Важным частным случаем теоремы 8.5.1 является однород-
однородная задача (С = 0), в которой fi = —А. Таким образом, для
данной матрицы А мы должны найти матрицы X, которые удов-
удовлетворяют равенству АХ = ХА, т. е. матрицы, которые комму-
коммутируют с А. Как мы видели в упр. 1 выше, если А = PJP~\
где / — жорданова нормальная форма для А, то АХ = ХА эк-
эквивалентно JY=YJ, где У = Р~1ХР.
Анализ этого редуцированного уравнения все еще остается
громоздким, и мы ограничимся рассмотрением важного частного
случая, в котором А простая. Предположим, что А е ?„х„
и имеет собственные значения ць ..v, цп- Тогда J = diag {\i\,...
..., fin} и JY = YJ дают
j, k=l,2, ..., п.
При fij ф fift это означает, что yjh = 0, а при (х3- = щ элемент
yjh может принимать любое значение. Без потери общности
можно предположить, что существует s различных значений
¦ць • • •, ц« с кратностями ось ..., as и
раз as раз
Тогда ясно, что Y имеет квазидиагональный вид
Y = diag{Yly ..., Ys},
где Yj e fa. х а{ для /=1, 2, ..., s. Существует поэтому
а? "Ь а2 + • • • ~Ь as неопределенных элементов в У, а так как
X = PYP~l, то я/?и простой матрице А линейное пространство
решений уравнения АХ = ХА имеет размерность aj-\- ... + сф
Упр. 1. Доказать последнее утверждение, рассмотрев урав-
уравнение Gy = 0, где G = J ® / — / ® /.
Упр. 2. Показать, что если Л имеет различные собственные
значения, то каждая коммутирующая с А матрица будет про-
простой.
Упр. 3. Если функция f определена на спектре матрицы
(простой или нет), то доказать, что f(A) и А коммутируют.
Предположим теперь, что каждая матрица Yj приводится
к жордановой нормальной форме следующим образом: Yj =
= QjJjQJ1- Если положить Q = diag {Q\,.. , Qs}, то, очевидно,
y = Qdiag{/1 Js}Q~l
и, следовательно,
jr = (PQ)diag{/If .... Js}(PQ)~l. (8.6.1)
8.6. КОММУТИРУЮЩИЕ МАТРИЦЫ
243
\ Так как diag {Л /s} имеет жорданову нормальную
^форму, это равенство дает некоторое представление о том, как
устроены матрицы, коммутирующие с простой матрицей А. Про-
Произведем дальнейшую специализацию и рассмотрим простые мат-
матрицы, коммутирующие с А.
Теорема 8.6.1. Простые матрицы А и X из fnxn коммути-
коммутируют ФФ они имеют общее множество из п линейно независи-
независимых правых собственных векторов.
Доказательство. Так как А простая, мы знаем, что если
А и X коммутируют, то X приводится к жорданову нормальному
виду с помощью PQ, как отмечено в (8.6.1). Так как X тоже
простая, то diag {/i,... ,/s} — диагональная матрица, так что
столбцы в PQ образуют п линейно независимых правых соб-
собственных векторов для X. Мы должны лишь показать, что то
же самое верно для А. Но это так и есть, ибо
(PQ)J{PQ)~l = P diag {nfifi;1 lisQsQJ1} P~l = PJP~l = A.
Наоборот, если А а X имеют общее множество из п линейно
независимых правых собственных векторов, то А и X, очевидно,
простые и собственные векторы определяют матрицу Р, для ко-
которой A — PUP-1, Х = РАР~Х, где U, А — диагональные мат-
матрицы. Тогда А и X коммутируют, ибо
AX = PUAP~'=PAUP~=XA. 4
Упр. 4. Если А — нормальная матрица с различными соб-
собственными значениями, то доказать, что каждая матрица, ко-
которая коммутирует с А, нормальна.
Упр. 5. Доказать, что нормальные матрицы коммутируют ФФ
они имеют общее множество ортонормированных собственных
векторов.
Упр. 6. Если JY= YJ и J = %1п + Нп (§ 4.13), то доказать,
что
г/1 у>
О Ух
О
Уг
Уп-х
У\ У2
О у,
Упр. 7. Если А и X — простые коммутирующие между собой
матрицы, то доказать, что не обязательно существует много-
многочлен р, для которого
Х = р(А).
244
ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
Упр. 8. Если А — простая матрица с s различными собствен-
собственными значениями, то доказать, что каждая матрица, коммути-
коммутирующая с А, имеет по крайней мере s линейно независимых
правых собственных векторов, общих для нее и А.
Мы докажем теперь заключительный результат, характери-
характеризующий матрицы коммутирующие с некоторой простой мат-
матрицей.
Теорема 8.6.2. Пусть А — простая матрица с различными
собственными значениями \ц, , jxs и компонентными матри-
матрицами Zi, ..., Zs соответственно. Матрица X коммутирует
с А <==> X коммутирует с каждой компонентной матрицей для
А, т. е. в том и только в том случае, когда XZj = ZjX, j = 1,
2, ..., s.
Доказательство. Предположим сначала, что XZ,—
= ZjX для /=1,2, . , s. Тогда
АХ =
X = X
t
= ХА.
Наоборот, заметим, что компонентные матрицы для А—это
многочлены от А (§ 5.4), а поэтому АХ = ХА означает, что
ZjX = XZj для каждого /. ^
Заметим, что последнее утверждение верно для произволь-
произвольной матрицы А, Таким образом, если матрица А^^пхп имеет
компонентные матрицы Zhj (в обозначениях § 5.4) и АХ = ХА,
то ZhjX = XZhj.
Упр. 9. Доказать последний результат (что из АХ = ХА сле-
следует ZhjX — XZhj), показав, что из АХ = ХА следует
для к, не являющегося собственным значением матрицы А,
и затем воспользовавшись E.8.2).
Упр. 10. Матрица R е ?Ях» называется циркулянтом, если
она имеет вид
i а2 а2 ... ап-х ап
ап п[ аг ... ап-2 ап-\
2 из п\ ... пц п{
где пи ••-, Чп — комплексные числа. Доказать, что множество
всех циркулянтов образует n-мерное подпространство в Ч?Пхп-
Упр. 11. Доказать, что если (в упр. 10) а\ = ... = an-i = 0
и ап = 1, то получающийся в результате циркулянт U унитарен,
\
87. ТЕОРИЯ УСТОЙЧИВОСТИ ЛЯПУНОВА 245
Un =W и общая матрица R, являющаяся циркулянтом, может
быть записана в виде
Упр. 12. Воспользоваться упражнениями 4 и 11 для доказа-
доказательства того, что матрица, являющаяся циркулянтом, нор-
нормальна.
Упр. 13. Доказать, что если Ri, R2— циркулянты, то RiR2 =
= R2Ri и RiR2 — циркулянт.
Упр. 14. Пусть (оь ..., con — различные корни уравнения
zn = 1. Если многочлен р определен как
(ср. упр. 11), то доказать, что собственные значения цирку-
циркулянта R равны p((dj), /= 1, 2, ..., п, и что соответствующими
правыми собственными векторами будут
дС/ = <о»-'в1+<о»-2в2+ ... +еп.
[Указание. Заметим, что Uen = ei, Uej — ej+l, j = \, 2, ...
...,n-l.]
8.7. Теория устойчивости Ляпунова
Во введении к этой главе была определена устойчивая мат-
матрица. Матрицы такого типа имеют особое значение при изуче-
изучении дифференциальных уравнений, что наглядно показывает
следующее утверждение: матрица А будет устойчивой в том
и только в том случае, когда для каждого вектора-решения
x(t) уравнения х = Ах имеем \im x(t) — Q. Решения дифферен-
циального уравнения х = Ах были подробно изучены в § 5.9.
Результат становится очевидным, если эти решения рассматри-
рассматриваются с привлечением определения устойчивой матрицы.
В дальнейшем мы будем иметь дело с квадратичными фор-
формами. Мы будем обозначать через v квадратичную форму, мат-
матрица которой (вещественная и симметрическая, § 2.12) есть V,
и подобно этому для w и W. Мы выражаем тот факт, что V
(или W) положительно определенная, записью v > 0 (или
w > 0) и подобно этому для неотрицательно определенных
форм.
Рассмотрим некоторую квадратичную форму v, вычисленную
в решении уравнения х = Ах, где ЛеЙпХп. Имеем v(x) =
= x'Vx и, следовательно,
v (х) = x'Vx + x'Vx = x'A'Vx + x'VAx = x' (A'V + VA) x.
Если положить
A'V + VA=-W, (8.7.1)
246
ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
то, очевидно, W будет вещественной и симметрической и v(x) =
Рассмотрим теперь (8.7.1) как уравнение для V. Согласно
теореме 8.5.1 при заданной матрице W единственное решение V
этого уравнения существует в том и только в том случае, когда
А и —А' не имеют общих собственных значений. Так как соб-
собственные значения для —А' — это взятые со знаком минус соб-
собственные значения для А, то справедлива
Лемма. Уравнение (8.7.1) определяет взаимно однозначное
соответствие между вещественными симметрическими матри-
матрицами V и W в том и только в том случае, когда А не имеет ну-
нулевых собственных значений и пар собственных значений д, X,
для которых ц = —%.
¦ Траектория решения
при возрастающем t
Рис. 5. Траектория для решения в случае, когда А устойчивая.
Вклад Ляпунова состоит в замечании, что при заданной
определенной форме w устойчивость матрицы А может быть
характеризована существованием определенной матрицы-реше-
матрицы-решения V для (8.7.1). Таким образом, уравнение х = Ах обладает
свойством, что lim x(t)-+ 0 для каждого вектора-решения
x(t) ФФ можно найти такие положительно определенные формы
W И V, ЧТО V (X) = —W (X) .
Чтобы убедиться в значении этого условия наглядно, пред-
предположим, что А имеет размеры 2 X 2, и рассмотрим решение
*(/) =
XI
в котором х\ и х2 — вещественнозначные функции от /. Кри-
Кривыми уровня для положительно определенной формы v будут
эллипсы в плоскости хи х2 (рис. 5). Если х0 = *(/о), то на эл-
V. 8.7. ТЕОРИЯ УСТОЙЧИВОСТИ ЛЯПУНОВА 24?
липсе v(x) = v(x0) выбирается точка, соответствующая x(t0).
Рассмотрим теперь непрерывный путь (траекторию) решения
x(t) в окрестности точки (Xi(to),x2(t0)). Если w > 0, то v < О
и путь должен входить внутрь эллипса v(x)=v(x0) при воз-
возрастающем t и, кроме того, он должен подойти на сколь угодно
близкое расстояние к началу координат при достаточно боль-
большом t.
Возвращаясь к более точному изложению, мы сформулируем
сейчас алгебраическую версию теоремы Ляпунова, которая
представляется относительно более легкой для понимания. Бо-
Более знакомый частный случай получается затем в виде тео-
теоремы 8.7.2.
Теорема 8.7.1. (i). Если матрица А е 5?nx« устойчивая и
W^&nxn положительно (неотрицательно) определенная, то
существует такая вещественная положительно (положительно
или неотрицательно) определенная матрица V, что A'V-\-
+ VA=* —W.
(ii) Пусть матрица V е 5?Пхп положительно определенная
и А е Й?пх«- Определим вещественную симметрическую мат-
матрицу W равенством A'V -\- VA — —W. Если каждому отличному
от других собственному значению матрицы А соответствует не-
некоторый правый собственный вектор а, для которого a*Wa >• О,
то А будет устойчивой.
Доказательство, (i) Так как А устойчива, из леммы
получаем, что существует единственная матрица Уе5?их„, для
которой A'V -\- VA =—W. Кроме того, можно воспользоваться
теоремой 8.5.2 и записать решение в явном виде
V = J eA''WeAt dt.
о
Следовательно,
оо
w (*) = <*, Гж>= J (eAtx, WeAtx)dt.
о
Отсюда сразу же получаем, что если w ^ 0, то v ^ 0 (и воз
можно и > 0).
Но, как известно, eAt неособая, так что eAtx Ф 0 для любого
ненулевого х и w > 0 означают, что подынтегральное выраже-
выражение положительно при каждом t. Таким образом, w > 0 озна-
означает, что v > 0.
(ii) Пусть ц — собственное значение матрицы А и Аа =» \ia
с а ф 0. Тогда имеем также а*А' = Да*. Умножая равенство
A'V + VA = —W слева и справа на а* и а соответственно,, по-
получаем
248 ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
Таким образом,
Согласно предположению a*Va > 0, а также a*Wa ~> О, так что
Re(fx)<0. Так как это верно для каждого собственного значе-
значения (х, то А будет устойчивой. Л
Следующий результат совершенно тривиально следует из
теоремы 8.7.1, но он более известен и заслуживает отдельной
формулировки.
Теорема 8.7.2. Пусть А, й^ейяхп « W положительно оп-
определенная. Тогда А будет устойчивой в том и только в том слу-
случае, когда уравнение A'V -\- VA = —W имеет решением поло-
положительно определенную матрицу V.
Доказательство. Если А устойчивая и w > О, то вы-
выполняются предположения первой части теоремы 8.7.1. Если,
наоборот, заданы положительно определенные V и W, то вы-
выполняются предположения части (И) этой теоремы, откуда
и следует результат.
Упр. 1. Обобщить теоремы 8.7.1 и 8.7.2 на комплексные мат-
матрицы А, рассматривая эрмитовы формы v и w.
При практических вычислениях выяснить вопрос о том, яв-
является ли некоторая заданная вещественная матрица А устой-
устойчивой или нет, можно при помощи решения уравнения A'V +
+ VA = —/ (или Л'У+ VA = —W для некоторого другого вы-
выбора w) относительно V и применения затем теоремы 2.14.4,
чтобы узнать, будет ли V положительно определенной или нет.
Таким образом, А будет устойчивой в том и только в том слу-
случае, когда следующие миноры матрицы V положительны:
v('V v(h2\ vn,%...,n\
V \\ )' V U, 2)' ¦¦¦' V \\, 2 n )¦
Если бы уравнение Л'У+ VA =# —/ можно было решить та-
таким образом, что элементы V явно выразились бы через эле-
элементы А, то мы получили бы прямую характеризацию устойчи-
устойчивых матриц через определители. Предлагаемый способ не
является практическим предложением для матриц общего вида,
но для относительно простых классов матриц явные критерии
устойчивости могут быть получены таким образом. В следую-
следующем параграфе мы воспользуемся этой возможностью в одном
особенно важном случае.
8.8. Критерий Рауса — Гурвица
Вопрос об устойчивости собственных значений матрицы
всегда может быть превращен в вопрос о корнях некоторого
многочлена. Для этого следует лишь заменить уравнение Ах =
8.8. КРИТЕРИЙ РАУСА - ГУРВИЦА
24$
= цх для собственного значения на характеристическое урав-
уравнение det(fx/ — А) = 0. Преимущество теоремы Ляпунова из
предыдущего параграфа состоит в том, что удается избежать
вычисления коэффициентов этого многочлена и какой-либо по-
последующей потери точности. Тем не менее важно то, что мы
получим необходимые и достаточные условия для того, чтобы
все корни некоторого многочлена лежали в левой половине ком-
комплексной плоскости. Рассмотрим приведенный многочлен с ве-
вещественными коэффициентами:
z>l + alz"-l + a2z"-2+ ... + ап.
1
Матрицы Гурвица для i определяются так:
ai 1 О
Нз = as п2 ai
аъ at а^
1 0 0 ... О О
0,2 п\ 1
«4 «3 <Ь
= аи #2 = |
Нп =
2П-1 • • • аЛ+1 «ft
где ал = 0 при k > п. Если положить также а0 = 1 и ад = О
при & < 0, то элемент (i,j) матрицы Гурвица для f есть просто
ац-j. Знаменитый критерий Рауса — Гурвица может быть сфор-
сформулирован следующим образом.
Теорема 8.8.1. Все корни многочлена f имеют отрицатель-
отрицательные вещественные части в том и только в том случае, когда
detHj = dl>0, /=1,2,..., п.
Самое удовлетворительное доказательство этой теоремы ис-
использует теорию функций комплексной переменной. Однако на-
нашей целью в этом параграфе является доказательство этой тео-
теоремы при помощи теоремы Ляпунова в виде (8.7.1). Это дока-
доказательство далеко не прямое и манипуляции с определителями
довольно громоздки. Мы поэтому приводим сокращенные до-
доказательства для необходимой последовательности лемм. Пер-
Первый из нужных результатов имеет некоторое значение сам по
себе и мы проведем его доказательство более подробно.
Теорема 8.8.2 (формула Орландо). Пусть аи а2, ..., ап —
комплексные числа и многочлен f(z) = zn-|-aiz™-1-f- ... -\-ап
имеет корни Z\, ..., zn. Тогда определитель Гурвица dn~i для f
задается в виде
п
ап — [ ^= (— 1) ± \_ \Zi —р Zfc).
i, k=\
Kk
250
ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
Доказательство. Воспользуемся индукцией относи-
относительно п. В случае п = 2 имеем хорошо известный результат
для квадратичного многочлена
dn-i = d1=a1 = — (z1 + z2).
Это есть соответствующий частный случай теоремы.
Предположим, что утверждение верно для любого приведен-
приведенного многочлена f степени п, и пусть F — приведенный много-
многочлен степени я+ 1, определяемый при некотором h по формуле
F (z) =
f (г) = z»+' + (а, + haQ) г» +
Если Z\, ..., zn — корни Для /, то zu ..., zn, zn+i = —h будут
корнями для F.
Построим следующий определитель при помощи «окаймле-
«окаймления» drA
oi 10 0 ... 0
пх а-> п\ 1 ¦
D=det
агга-1
... (-I)» A (-1)
Заменим теперь первый столбец в Она A-й столбец) —щ B-й
столбец)+ а2 C-й столбец) + ... +(—l)?ion ((п+1)-й столбец).
В результате последний элемент в этом столбце станет равен
f(h), а все остальные элементы будут нулевые. Тогда, как не-
нетрудно убедиться,
Возвращаясь к определению D, прибавим умноженный на h
столбец /¦+1 к столбцу г при /- = 1,2, ..., п — 1. В результате
получим
ai + h 1 0 0 ... о
а3 + a<Ji а2 + ha\ а\ + h \
0
О
i-i an~i
(-1)"
Заметим теперь, что главный п X «-минор этого определителя
равен определителю Гурвица А„ порядка п для F. Таким обра-
образом, мы имеем также D = (—1)ПЛИ. Воспользовавшись предпо-
8.8. КРИТЕРИЙ РАУСА - ГУРВИЦА
ложением индукции, при h = —zn+i получаем
n_, = (-l)B(B-1)/2 ft (г, + zk) П(А - zt) =
= (-!)¦
и (П+ I )/2
n + i
П B,
Введем теперь п X п-матрицу
aoa, 0
0 — a0a3
0
t, ft = 1
Kk
a2a3 ...
элементы которой задаются следующим образом:
для / + / четного
{
(— \)k+t ak-xai+!-k при />/,
и/г при / < /;
для i + / нечетного vit = 0.
Для главных миноров матрицы V пишем:
251
(8.8.1)
Лемма 1. Полагая dQ = 1, будем иметь
vj = djdj-u j= 1, 2, ..., п.
Доказательство. Переставим строки и столбцы мат-
матрицы V симметрично, переводя нечетно занумерованные столбцы
и строки в начало матрицы и четно занумерованные строки
и столбцы в ее конец. Это преобразование производится при
помощи перестановочной матрицы
Р = |
Обозначим получающуюся в результате матрицу через Dn =
= P'VP. В случаях п = 2т, п — 2т-\-\ соответственно Dn
имеет такой блочный вид:
П = I Ет °
2т | 0 Fm
9*
252
ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
где индексы обозначают порядок квадратных матриц. Имеем
теперь
v2m = det D2m = (det Em) (det Fm),
v2m+i = det D2m+1 = (det?m+I) (det Fm+l). (8>8)
Определим 2тХт- и Bт + l)X(m+ 1)-матрицы так:
0 - a,,
0 a,
— a0 — a2
Имеем
Тогда, как легко видеть,
(Xе)т QCt iJOm G.6l 1 ™,
0
•
0
aa
0
Fm
...
a2 ...
1, //2
0
0
0
0
a0
m+
K2
0
0
a,->
a,
a2
tn+
a0
— ai
0,2
— аз
a,
•
«2
=
= det Я2т+, = — det Em+l.
Полагая ao=l, из (8.8.2) теперь получаем
и в любом случае Vj — jj
Из леммы 1 и теоремы 2.14.4 непосредственно следует
Лемма 2. Если а\, ..., an вещественны, то dj > 0 (/ = I,
2,..., п) <=> V положительно определенная.
Мы введем теперь некоторую определяемую многочленом /
матрицу, которая для наших теперешних целей является более
удобным видом сопровождающей матрицы, чем тот, который
8.8. КРИТЕРИЙ РАУСА — ГУРВИЦА
использовался в § 4.11. Мы полагаем
253
А =
— а,
1
О
1
и замечаем, что «Л устойчивая» и «все корни f имеют отрица-
отрицательные вещественные части» — эквивалентные утверждения.
Лемма 3. При определенной выше А и V из (8.8.1) имеем
A'V-\-VA = —W, где -^W — неотрицательно определенная
матрица
,a3 0 a{a5
0 0 0
¦2 ¦ ' 0 a3a5
а
Доказательство. Вычисление матрицы ЛУ'+УЛ, ис-
исходя из определений А а V, приводит к первой части леммы.
Чтобы убедиться, что W неотрицательно определенная, заметим,
что
x'Wx = 2 | alXl + йз*з + а5х5 + ... |2. (8.8.3)
Лемма 4. Если dj > 0, / = 1, 2, ..., п, то А устойчива.
Доказательство. Согласно лемме 2 dj > 0 для / = 1,
2, ... , п означает, что V положительно определенная. Тогда, вос-
воспользовавшись леммой 3 и теоремой 8.7.1, часть (И), мы должны
лишь доказать, что a*Wa > 0 по крайней мере для одного пра-
правого собственного вектора, соответствующего любому задан-
заданному собственному значению ^ матрицы Л.
Но, как мы знаем (ср. упр. 2 из § 4.11), в качестве собствен-
собственного вектора можно взять а с а' = || fx"-1, .. ., ц, 1 ||. Согласно
(8.8.3) a*Wa = 0 в том и только в том случае, когда
fliM'" + азй"~3 + ... = 0.
Но dn > 0 означает, что ап =? 0 и, следовательно, \1фО. Та-
Таким образом, так как f (jx) = 0, имеем для нечетного п
254
откуда
ГЛ. 8. ПРЯМЫЕ ПРОИЗВЕДЕНИЯ
а2 at ... ап -I
а3 а5 ... ап
и для четного п
= 0,
откуда
... ап-\ 0
= 0.
Таким образом, для п нечетного и четного имеем
аха2 — а3 = 0, а^ — а5 = 0, ...
и вторые строка и столбец матрицы V нулевые. Это противоре-
противоречит нашему выводу о том, что матрица V положительно опреде-
определенная. Поэтому a*Wa =ф 0. Следовательно, А — устойчивая
матрица.
Лемма 5. Если А — устойчивая матрица, то dj > 0 для
j=l,2, ..., п.
Доказательство. Согласно первой части теоремы 8.7.1
устойчивость А и неотрицательная определенность W означают,
что Vj ^ 0, /=1, 2, ..., п. Из леммы 2 тогда следует, что
dj ^ 0, /=1,2, ..., п, и если какое-нибудь dj = 0, то dn = 0.
Мы покажем, что предположение dn = 0 приводит к противоре-
противоречию, откуда будет следовать, что dj > 0 для / = 1, 2, ..., п.
Устойчивость А означает, что не существует нулевых корней,
так что ап ?* 0. Но dn = andn-\, так что из dn = 0 следует
dn-\ = 0. В этом случае из формулы Орландо получаем, что
существует пара корней \ц, \ij, для которых \ц + [Ч — 0. Но
это противоречит предположению о том, что ц* и [ij оба имеют
отрицательные вещественные части, что и завершает дока-
доказательство.
Критерий Рауса — Гурвица, как он сформулирован в тео-
теореме 8.8.1, получается теперь объединением результатов
лемм 4 и 5,
Глава 9
НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
9.1. Введение
Матрица А е Япхп называется неотрицательной, если каж-
каждый элемент в А неотрицателен. Квадратные матрицы такого
типа возникают в множестве задач и, возможно, удивит то, что
это определяющее свойство приводит к некоторым сильным ре-
результатам об их строении. Замечательная теорема Перрона —
Фробениуса является основным результатом для неотрицатель-
неотрицательных квадратных матриц. Мы формулируем его в полной общ-
общности в виде теорем 9.2.1 и 9.2.2, но докажем лишь первую из
этих теорем. Возможно, следует предупредить читателя, что,
хотя конечный результат формулируется изящно просто и мы
не доказываем теорему Фробениуса полностью, доказательство
тем не менее наиболее громоздкое в этой книге. Несмотря на
это, приводимое доказательство содержит несколько других по-
полезных идей и, не считая теоремы Перрона — Фробениуса, дру-
другие полезные и интересные результаты получаются более
просто.
При А, В е Ящхп будем писать А ^ В(>В), если aij^bii
{>Ьц) для всех 1 г?Г /:^ т и 1 ^ / ^ п. Это согласуется
с обозначениями, введенными в § 6.4. Согласно этому обозначе-
обозначению А будет неотрицательной <=> А ^ 0. Следует заметить,
что из А ^ 0 и А ф 0 не следует, что А ~> 0.
Вспомним определение перестановочной матрицы из § 2.12.
Если Р — перестановочная матрица, то непосредственно прове-
проверяется, что Р'Р = /, т. е. перестановочная матрица обязательно
ортогональная. Как было отмечено в § 2.12, если Ле5?ИХи. то
подобное преобразование А вида Р'АР, где Р — перестановоч-
перестановочная матрица, приводит в результате просто к перестановке эле-
элементов А, причем строки и столбцы в А переставляются соот-
соответственно. При п ^ 2 матрица А называется приводимой, если
существует такая перестановочная матрица Р, что
Р'АР — \\ А" А'2
II 0 А22
256
ГЛ. 9. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
где Л1Ь А22— квадратные матрицы порядка меньше п. Если та-
такой матрицы Р не существует, то Р неприводима. Теорема Пер-
Перрона — Фробениуса относится к неприводимым неотрицатель-
неотрицательным матрицам.
Понятие приводимости имеет наиболее очевидное значение
при решении уравнения Ах = с относительно х. Ибо если А при-
приводима, то мы производим замену переменных, которую под-
подсказывает равенство (Р'АР) (Р'х) = Р'с, и получаем
А12
А22
где
Yi I
Y2 II
II Ъ
Задача сводится теперь, во-первых, к решению системы бо-
более низкого порядка А22\2 = Y2 и затем к решению уравнения
Лп?1 = Yi — Л12|2.
Ясно также, что собственные значения Ап вместе с собствен-
собственными значениями Л22 составляют собственные значения А.
Интересно, что понятие приводимости никак не связано
с величиной матрицы, а зависит лишь от расположения нуле-
нулевых и ненулевых элементов в
этой матрице. Эта идея ис-
используется в понятии направ-
направленного графа, соответствую-
соответствующего матрице. Мы наметим
лишь первые шаги в этой тео-
теории и получим вторую харак-
теризацию неприводимых мат-
матриц в упр. 3. Важное обобще-
обобщение теоремы Гершгорина со-
содержится в упр. 5.
Пусть Pi, Р2, ..., Рп — раз-
различные точки комплексной
плоскости и Ле?пх„. Для
каждого ненулевого элемента
Oij из А соединим Р, с Pj на-
Рис. 6. Направленной граф для ма-
матрицы.
правленной линией PtPj. Получающаяся в результате фигура на
комплексной плоскости будет направленным графом для А.
Иллюстрация этого приведена на рис. 6 с 3 X 3-матрицей и ее
направленным графом.
9.2. ТЕОРЕМА ПЕРРОНА — ФРОБЕНИУСА 257
Мы будем говорить, что направленный граф сильно связен,
если для каждой пары точек Piy Pj существует направленный
путь PiPkl, Pk{Pk2, .... Pkr_xPi, соединяющий Pt с Pj.
Упр. 1. (а) Если Л > О, Й ^ С и АВ определено, то АВ ^
$г АС. (б) Если А ^ О, В > 0 и АВ = 0, то А = 0.
Упр. 2. (а) Является ли граф на рис. 6 сильно связным?
(б) Привести примеры 3 X 3-матриц с (и без) сильно связ
ными графами.
Упр. 3. Доказать, что квадратная матрица неприводима <=Ф
ее направленный граф сильно связен.
*Упр. 4. Если А приводима, то доказать, что при любом по-
положительном целом р матрица Ар будет приводимой.
Упр. 5. Пусть А — неприводимая матрица из ?ях» и ц —
собственное значение А, лежащее на окружности одного из п
кругов Гершгорина (теорема 7.2.1). Доказать, что это собствен-
собственное значение лежит на окружности каждого из п кругов.
Упр. 6. Если матрица А неприводима и в обозначениях тео-
теоремы 7.2.1 \ajj\^pj для /=1,2 п со строгим неравен-
неравенством по крайней мере при одном /, то доказать, что А неособая
(ср. с упр. 3 из § 7.2).
*Упр. 7. Описать множество всех векторов у ^ 0, для кото-
которых у ^ Ах, если
л II 2 1 II
А = j и х =
Найти наибольшее число р, для которого рх ^ Ах.
9.2. Теорема Перрона — Фробениуса
Очевидно, если А ^ 0, то Ар ^ 0 при любом положительном
целом числе р. Мы можем также ожидать, что если А имеет
достаточно большую плотность ненулевых элементов, то для
достаточно большого р будем иметь Ар > 0. Наш первый ре-
результат именно такого рода.
Лемма 1. Если матрица Л е йпХ« неотрицательна и не-
неприводима, то (I + А)п~1 > 0.
Доказательство. Рассмотрим некоторый вектор у ^ 0
с у ф 0 и положим
(9.2.1)
Так как А ^ 0, то Ау ^ 0 и z имеет по крайней мере столько
же ненулевых (и, следовательно, положительных) элементов,
сколько и у. Если у еще не положительный, то мы докажем,
что z будет иметь по крайней мере на один ненулевой элемент
больше, чем у.
258 ГЛ. 9. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
Ясно, что матричные свойства, используемые в утверждении
леммы, инвариантны относительно перестановочных преобра-
преобразований Р'АР. Поэтому, предполагая, что z имеет не более по-
положительных элементов, чем у, можем записать (без потери
общности)
г =
где и > 0 и, так как z = у -\- Ay, v > 0. Если соответственно
разбить А на блоки:
то из (9.2.1) будет следовать Апи = 0. Так как и > 0 и Ап ^ 0,
это означает, что А2\ = 0, что противоречит предположению
о неприводимости А.
Повторяя это рассуждение п — 1 раз, получаем, что для про-
произвольного ненулевого у ^ 0 будет (/ -f- Л)" у > 0. Полагая
у = ej, j = 1, 2, . . ., п, убеждаемся в том, что (/ + А)п~1 > 0. ^
Для ненулевой неприводимой матрицы А рассмотрим веще-
ственнозначную функцию г, определенную на ненулевых векто-
векторах х ^ 0 формулой
/¦(*)= min
<
где {Ах)г обозначает ?-й элемент вектора Ах. Тогда г{х)^0
и при /= 1, 2, ..., п будем иметь r{x)x, ^ {Ах) 3 с равенством
при некотором /. Таким образом, хг{х)^.Ах и, кроме того,
г (х) — такое наибольшее число р, что рх ^ Ах для этого х
(ср. упр. 7 из § 9.1).
Пусть 2 обозначает множество всех ненулевых неотрица-
неотрицательных векторов порядка п. Определим тогда
r= sup r{x). (9.2.2)
Согласно определению г{х) эта функция инвариантна относи-
относительно замены х на ах при любом а > 0. Таким образом, при
вычислении введенного супремума можно рассматривать лишь
замкнутое множество Ж векторов х, для которых х ^ 0 и
?jt?=l. Таким образом, 1е^ и /¦=suprfc). Если бы
i х e^
функция г(дг) была непрерывна на ,#, мы могли бы г прирав-
приравнять величине max г {х), х^Ж (дополнение 1). Однако г{х)
может иметь разрывы в точках, где координаты х обращаются
в нуль. Мы рассмотрим поэтому множество Jf векторов у,
определенных как у = {I-\-A)n~l x, xel. Согласно лемме 1
каждый элемент из Jf будет положительным вектором, так что
9.2. ТЕОРЕМА ПЕРРОНА - ФРОБЕНИУСА 259
Jf cr &. Мы утверждаем, что Jf — замкнутое множество и что
функция г (у) непрерывна на Jf.
Для любого jgI
уг (х) = г (х) (I + А)п-' х < (/ + Л)" Ах,
так как хг(х) ^ Ах, а следовательно, уг(х) ^ Ау. Но г (у) — наи-
наибольшее число р, для которого ру^Ау, и поэтому г(х) ^ г (у).
Таким образом, г = sup r(x) ^ max r(у). Но так как JC с &,
ТО
max г (у) ^ sup r (x) = sup r (х).
уеЛ' у<т& хптМ
Следовательно,
г = max r (у) (9.2.3)
и существует такой у > 0, что г = /"(у).
Могут существовать и другие векторы в &, для которых
г(х) принимает значение г. Любой такой вектор называется
экстремальным для А. Таким образом, ненулевой вектор 2^0
будт экстремальным для А ФФ rz = Az.
Наш интерес к числу г объясняется следующим результатом.
Лемма 2. Если матрица А е 5?пХп неотрицательна и непри-
водима, то число г, определяемое формулой (9.2.2), положи-
положительно и является собственным значением для А. Кроме того,
каждый экстремальный вектор для А положителен и является
правым собственным вектором для А, соответствующим соб-
собственному значению г.
Доказательство. Пусть и' = || 1, 1,... , 1 ||. Тогда
г (и) = min? a k "> 0- Ибо, если какая-нибудь строка в А со-
i k
стоит полностью из нулей, то А будет приводимой. Так как
г ^ г {и), то г >0.
Пусть z — некоторый экстремальный вектор и х =
= (/-}- A)n~lz. Без потери общности можем считать, что z e M.
Лемма 1 означает, что х >0, и, очевидно, xeJ. Мы имеем
также Az — rz ^ 0. Если Az — rz ф 0, то (/ + А)п~1 (Az — rz) > 0.
Следовательно, Ах — гх > 0, или гх < Ах, откуда следует, что
г<Сг(х). Но это противоречит определению (9.2.2) числа г,
так что мы должны иметь Az = rz. Таким образом, любой
экстремальный собственный вектор z будет правым собствен-
собственным вектором для А с собственным значением г.
Наконец, так как Az = rz, имеем х = (I + А)п~'г — A + rf~xz
и из х > 0, г > 0 необходимо следует, что z > 0. ^
Мы можем теперь сформулировать и доказать первую часть
теоремы Перрона — Фробениуса для неприводимых матриц.
260 ГЛ. 9. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
Теорема 9.2.1. Если матрица /1еЖЛХп неотрицательна
и неприводима, то: (i) А имеет положительное собственное зна-
значение г, равное спектральному радиусу A; (ii) существует поло-
положительный правый собственный вектор, соответствующий собст-
собственному значению г; (ш) собственное значение г имеет (алгеб-
(алгебраическую) кратность 1.
Доказательство. 1. В лемме 2 было получено существо-
существование положительного собственного значения с соответствую-
соответствующим положительным собственным вектором. Мы покажем сна-
сначала, что другие собственные значения для А не могут превосхо-
превосходить г по абсолютной величине. Этим будет завершено доказа-
доказательство частей (i) и (ii) теоремы.
Если ау = Ау и у ф 0, то, так как А ^ 0, имеем | а 11 у | =
— \Ау\<^А\у\. Следовательно, |а|^г(|у|)^г, что нам и
нужно было доказать.
2. Предположим теперь, что z — произвольный правый соб-
собственный вектор, соответствующий г. Таким образом, Az = rz,
г^Ои, как и выше, г \ z | <! Л | z \.
Это означает, что |г| — экстремальный вектор и, согласно
лемме 2, |г|>0. Таким образом, z,- ф 0, i=\, 2, ..., п. Это
означает, что размерность правого собственного подпростран-
подпространства для г равна 1. В противном случае мы смогли бы найти
два линейно независимых правых собственных вектора Z\, Zo
и затем определить числа а, Р так, чтобы az\ + $z2 имел нуле-
нулевую координату. Это доказывает, что геометрическая кратность
для г равна 1. Для завершения доказательства мы используем
этот факт, чтобы показать, что если Д(Я,) — характеристический
многочлен матрицы Л, то ДО (г), производная от Д(г) в г, от-
отлична от нуля.
3. Пусть B(X) = AK — A)V. Так как Jf(h— А) имеет раз-
размерность 1, то ранг матрицы /г — А равен п—1 (теорема
1.16.2), так что существует по крайней мере один ненулевой
минор в /г — А порядка п — 1. Следовательно, В(г)фО.
Но каждый ненулевой столбец в В (г) является правым соб-
собственным вектором для А, соответствующим г (упр. 3 из § 4.5),
откуда получаем, что каждый ненулевой столбец в В(г) состоит
из ненулевых элементов, которые все имеют один и тот же
знак. Однако, применяя проведенное рассуждение к А', то же
самое свойство получаем для строк в В (г). Эти результаты
будут согласованы в том и только в том случае, когда каждый
элемент в В (г) ненулевой и одного и того же знака.
Так как В (К) (IX— А) = А(ХI, то имеем
В<!) (X) (IX -А) + В(Х) = ДО (X) I.
Полагая X = г и умножая справа полученное равенство на
g.2. Теорема перрона - фробениуса 261
правый собственный вектор г, получаем
5 (г) г = Д< >>(/•) 2. (9.2.4)
Так как В (г) иг одновременно имеют ненулевые элементы
и эти элементы в каждом из них одного и того же знака, то из
(9.2.4) следует, что А^(г)фО. Это завершает доказательство
теоремы.
Нетрудно показать, что 5(г)>0. Это следует из того, что
так как г — наибольший вещественный корень для А (Я,), то
AA)(f)>0. Применяя (9.2.4), получаем результат.
Изложенные выше обобщения результатов Перрона были
опубликованы Фробениусом в 1912 г. При этом им были дока-
доказаны также следующие результаты, дающие более детальную
информацию о строении матрицы А в случае, когда существует
несколько собственных значений с модулем г. Этот результат
формулируется здесь для полноты и доказательство его не при-
приводится.
Теорема 9.2.2. Пусть матрица /1ей„х„ неотрицательна
и неприводима и имеет собственные значения \х,\, ц2, ..., цп.
Если имеется h и только h собственных значений щ = г, ц2, ...
..., щ с модулем г и если coi, ..., со>( — различные корни сте-
степени h из единицы, то jxj = со^г, / = 1, 2, ..., h.
Кроме того, п точек комплексной плоскости, соответствую-
соответствующих \хи .. , \in, инвариантны относительно вращений около на-
начала координат с углами, кратными 2я/п. При h > 1 суще-
существует такая перестановочная матрица Р, что Р'АР имеет сим-
симметрично блочный вид
О Ап 0 ... О
О о Ло3 ... о
I 0 ... О ЛА_,,
ifti 0 . . , О О
Первоначальные результаты Перрона были опубликованы
в 1907 г. и могут быть сформулированы теперь в виде следствия
теорем 9.2.1 и 9.2.2.
Следствие. Положительная квадратная матрица А имеет
вещественное и положительное собственное значение г, которое
имеет алгебраическую кратность 1 и превосходит модули всех
других собственных значений матрицы А. Собственному зна-
значению г соответствует положительный правый собственный
вектор.
Последняя часть теоремы 9.2.2 означает, что при А > 0 мы
должны иметь п—\, и, следовательно, г превосходит модули
всех других собственных значений матрицы А.
262
ГЛ. 9. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
Упр. 1. Если А > 0 и G— компонентная матрица для А, со-
соответствующая г, то доказать, что G > 0.
Упр. 2. Если А неприводима и неотрицательна и С(Х) — при-
приведенная присоединенная матрица для IX— А, то С (г) > 0.
Упр. 3. Если /!ей„хя неприводима и D — неособая неот-
неотрицательная диагональная матрица, то (D + А)п~х > 0.
*Упр. 4. Если Ле1„х» неприводима и неотрицательна и
(Ту= Zj fl/fe, то доказать, что mincr^^r ^maxcr,- и что равен-
равенство в обоих случаях выполняется в том и только в том случае,
КОГДа О\ = G2 = ... = Оп-
Решение. Прибавляя все предшествующие столбцы в
det(/r — А) к последнему, получаем
det
г — «и — «12 ... ~- Я], га —1 Г — Ci
— «21 Г — «22 • ¦ • — «2, га —1 Т — О_,
f — art —l,rt—I f — On — 1
— «Я2 • • • — «rt, И—1 T '— Оп
= 0.
Разлагая этот определитель по последнему столбцу и обозначая
(/, /)-элемент в В (г) = Aг — А)у через й/;(г), получим
Но, как мы видели, В (г) > 0, так что bnj(r) > 0 для / = 1, 2, ...
..., /г. Отсюда следует, что либо 0] = о2 = ... = <?„, либо су-
существуют такие индексы k, I, что г <Сок и г > а,. Следова-
Следовательно, результат доказан.
Упр. 5. Воспользовавшись упр. 4, без рассмотрения харак-
характеристического многочлена доказать, что следующая матрица
имеет максимальное вещественное собственное значение 7 и что
существует собственное значение, равное 4:
3 0 10
16 11
2 0 2 0
13 14
9.3. Приводимые матрицы
Мы рассмотрим теперь вопрос о возможности устранения
предположения о том, что А неприводима, из условия тео-
теоремы 9.2.1. Заключения (i) и (п) этой теоремы приводят к ре-
результатам для приводимых матриц, потому что такую матрицу
9.3. ПРИВОДИМЫЕ МАТРИЦЫ 263
можно представить в виде предела последовательности положи-
положительных (и, следовательно, неприводимых) матриц. Нужные
нам выводы будут следовать тогда из непрерывной зависимо-
зависимости доминирующего собственного значения (и его нормализо-
нормализованного правого собственного вектора) от матричных эле-
элементов.
В противоположность этому, как мы знаем по опыту из тео-
теории возмущений в главе 7, структура матрицы (как она опреде-
определяется ее элементарными делителями) не зависит непрерывно
от матричных элементов. По этой причине заключение (Hi) тео-
теоремы 9.2.1 не приводит к полезным результатам в приводимом
случае.
Теорема 9.3.1. Если матрица А е $.пхп неотрицательна, то:
(i) А имеет вещественное собственное значение г, равное
спектральному радиусу А;
(и) существует неотрицательный правый собственный век-
вектор, соответствующий собственному значению г.
Доказательство. Определим матрицу D(()eJ?nxn сле-
следующим образом:
ч при ач > 0>
при fl|/ = 0.
Тогда D(t)>Q при t>0 и D@) = A. Пусть p(t) — максималь-
максимальное вещественное собственное значение D(t) при t > 0. Все
собственные значения D(t) будут непрерывными функциями
от t (§§ 7.2 и 7.5), а так как р(^) равно спектральному ра-
радиусу D(t) при t > 0, то lim p(/) = r будет собственным зна-
*+о
+
чением матрицы D@) — A, причем это собственное значение
равно спектральному радиусу А.
Мы знаем также (лемма 1 из § 7.9), что существует норма-
нормализованный правый собственный вектор x(t), который соответ-
соответствует р(/) и зависит непрерывно от t при t^O. Согласно тео-
теореме 9.2.1 .*(/);> 0 при ^>0 и, следовательно, x(t)^Q
в t = 0. <
Упр. 1. Что случится, если попытаться обобщить результаты
теоремы 9.2.2 на приводимые матрицы при помощи рассужде-
рассуждения о непрерывности?
п
Упр. 2. Если ^е1„Хя неотрицательна и а,- = ? alk, то до-
казать, что
min ay ^ r ^ max 0/.
[Указание. К результату упр. 4 из § 9.2 применить рассужде-
рассуждение о непрерывности.]
264 ГЛ. 9. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
Упр. 3. Если Л<=$>пхп и ajh > 0 при / ф к, то доказать,
что собственное значение р матрицы А с наибольшей веществен-
вещественной частью вещественно и имеет кратность 1. Доказать также,
что существует положительный правый собственный вектор
для А, соответствующий р. Что можно сказать, если мы имеем
лишь ctjh 5= 0 при j ф k}
9.4. Примитивные и импримитивные матрицы
В теоремах 9.2.1 и 9.2.2 выяснено, что структура неотрица-
неотрицательной неприводимой матрицы А зависит от числа h собствен-
собственных значений, модули которых равны спектральному радиусу А.
В частности, удобно различать случаи /г = 1 и h > 1. Таким
образом, неприводимая неотрицательная матрица называется
примитивной или импримитивнои соответственно тому, будет ли
/г = 1 или h > 1. Число h называется индексом импримитив-
импримитивности.
Как было отмечено в § 9.2, при А > 0 имеем h = 1, так что
каждая положительная матрица обязательно примитивна.
Индекс импримитивности находится без труда, если известен
характеристический многочлен. Предположим, что
c{X) = Xtl + alXll] + a2X'h + . . . + atlnt (9.4.1)
¦—характеристический многочлен, причем аи а2, ..., at нену-
ненулевые и п > П\ > п2 > ... > щ ^ 0.
Если Ко — произвольное собственное значение и coi, ..., соь—¦
корни степени h из единицы, то, как мы видели в теореме 9.2.2,
(Oji0, /— 1, 2, ..., h, все будут собственными значениями мат-
матрицы А. Таким образом, с (К) делится на
(Я, - со^о) (Я - оьДо) ... (А, - ©АЯ0) = Kh - Хо
без остатка. Следовательно, для некоторого многочлена g и це-
целого числа k имеем с (X) = g (Xh) Xk.
Сравнивая это равенство с (9.4.1), убеждаемся в том, что h
будет общим делителем разностей п — tij, j = 1, 2, ..., t. Пред-
Предположим, что / — наибольший общий делитель этих разностей.
Проводя тогда рассуждение в обратном направлении, получаем,
что спектр матрицы А инвариантен относительно вращений на
углы, кратные 2л//. Если h <С I, то 2л// < 2я//г и инвариантность
при вращениях на углы, кратные 2я//, не согласуется с опреде-
определением числа h. Следовательно, h = / и при записи характери-
характеристического многочлена в виде (9.4.1) получаем, что индекс им-
импримитивности h равен наибольшему общему делителю разно-
разностей п — tij, j = 1, 2, ..., t.
Например, если с(X) = X10 + а{Х7 + а2Х, аи а2ф0, то/г = 3,
и если с {X) = V0.+ ЩХ7 + а2Х -f- аь аиа2, а^фО, то h = 1,
9.4. ПРИМИТИВНЫЕ И ИМПРИМПТПВНЫЕ МАТРИЦЫ 265
Следующий результат дает несколько другую характериза-
цию примитивных матриц.
Теорема 9.4.1. Неотрицательная матрица А примитивна
в том и только в том случае, когда существует такое положи-
положительное целое число р, что Ар > 0.
Доказательство. Предположим сначала, что Ар >¦ 0
и, следовательно, что Ар неприводима. Как мы видели (в упр. 4
из § 9.1), из приводимости А следовала бы приводимость Ар,
а следовательно, Лр>0 означает, что А неприводима. Если
бы А имела индекс импримитивности h > 1, то, так как соб-
собственные значения для Ар являются р-ми степенями собствен-
собственных значений для А, Ар также имела бы индекс импримитив-
импримитивности h > 1. Но это противоречило бы теореме Перрона, при-
примененной к положительной матрице Ар. Следовательно, h=\
и А примитивна.
Наоборот, предположим, что А примитивна и, следова-
следовательно, что А имеет доминирующее вещественное собственное
значение г кратности 1 (теоремы 9.2.2 и 9.2.1). Воспользовав-
Воспользовавшись теоремой 5.4.1 и положив г — %, будем иметь
где /(Я) = ЯР и fl~l) — (/— 1)-я производная от / в %k. Из этого
равенства легко получаем, что, так как г — доминирующее
собственное значение,
АР
Hm-^- = Zn. (9.4.2)
Из упр. 3 в § 5.4 имеем также
v С (г)
и минимальный многочлен i[) задается в виде
П
1=2
Так как г — наибольший вещественный корень для ф и \р — при-
приведенный многочлен, отсюда следует, что 1ф<1'(г)>0. Так как
С (г) > 0 (упр. 2 из § 9.2), то Zn > 0. Из (9.4.2) теперь следует,
что Ар > 0 при некотором достаточно большом р.
Упр. 1. Если А примитивна и р — положительное целое
число, то доказать, что Ар примитивна.
Упр. 2. Если А ^ 0 неприводима и е > 0, то доказать при
помощи рассмотрения собственных значений, что eZ-f-Л при-
примитивна. Сравнить этот результат с леммой 1 из § 9.2.
266 ГЛ. 9. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
9.5. Стохастические матрицы
Матрица Р е ЙпХп называется стохастической, если Р^О и
t,Pu=l, ' = 1, 2, ..., п. (9.5.1)
Матрицы такого типа возникают в задачах теории вероятно-
вероятностей, которые будут рассмотрены в § 9.6. Для последующих
приложений в этом параграфе будут получены некоторые из их
наиболее полезных свойств.
Теорема 9.5.1. Неотрицательная матрица Р будет стоха-
стохастической в том и только в том случае, когда она имеет соб-
собственное значение 1 с правым собственным вектором, задавае-
задаваемым в виде и' = || 1, 1,..., 1 [|. Кроме того, спектральный радиус
стохастической матрицы равен 1.
Доказательство. Если Р стохастическая, то условие
(9.5.1) может быть, очевидно, записано в виде Ри = и. Следо-
Следовательно, 1 будет собственным значением с правым собствен-
собственным вектором и.
Наоборот, если Ри = и, то выполняется (9.5.1) и, следова-
следовательно, Р стохастическая.
Для последней части теоремы следует воспользоваться
упр. 2 из § 9.3, чтобы показать, что доминирующее веществен-
вещественное значение матрицы Р равно 1. Л
В следующей теореме мы убедимся, что широкий класс не-
неотрицательных матриц может быть при помощи простого пре-
преобразования сведен к стохастическим матрицам. Заметим, что
некоторые неотрицательные матрицы исключаются предполо-
предположением о том, что г положителен; ср. с теоремой 9.3.1.
Теорема 9.5.2. Пусть А — неотрицательная матрица с мак-
максимальным вещественным собственным значением г. Если су-
существует положительный правый собственный вектор z, соот-
соответствующий г, и мы положили Z = diag {z\,... ,zn), то
A = rZPZ~\
где Р — стохастическая матрица.
Доказательство. Пусть Р = r~]Z~]AZ. Мы должны
лишь доказать, что Р стохастическая. Так как Az = rz, то
п
Yj aijzj = rzi; i=\, 2 п.
По определению рц = г~хг^хацг^ и, следовательно,
Таким образом, Р стохастическая, и теорема доказана.
9.6. СТОХАСТИЧЕСКИЕ МАТРИЦЫ 267
Мы рассмотрим, наконец, последовательность неотрицатель-
неотрицательных матриц Р, Р2, Р3, ..., где Р стохастическая. Нас будут ин-
интересовать условия, при которых существует
р°° = Hm Pp.
Мы уже знаем, что Р°° ф 0, ибо Р имеет собственное значение,
равное 1, и Рг -* 0 при г—> оо <=Ф> все собственные значения Р
по модулю меньше 1 (упр. 5 из § 7.1).
Теорема 9.5.3. Если Р — неприводимая стохастическая
матрица, то матрица P°°=limPp существует <=ф> Р при-
примитивна.
Доказательство. 1. Как мы знаем, Р имеем максималь-
максимальное вещественное собственное значение, равное 1. Предполо-
Предположим, что р,2, ..., jx/i — собственные значения Р с модулем 1
и \ih+u ¦¦-, M-s — различные собственные значения Р с модулем,
меньшим 1, Положим f(K) = № и обозначим через Г/'
(/— 1)-ю производную от / в [Xft. Напомним, что, так как Р не-
приводима, собственное значение 1 не кратное (теорема 9.2.1,
часть (Hi). Опять воспользовавшись теоремой 5.4.1, получаем
h mk s mk
PP = ZU+ Z Zf{tl)Zki+ 2 Z/r%,- O-5.2)
Для достаточно большого р имеем
f(/-i) = El—^—nP-i+i (Q.P..9,\
и, так как |ць|<;1 для k — h-\-l, ..., s, отсюда следует, что
последний член в (9.5.2) стремится к нулевой матрице при
р-> оо.
2. Если предположить теперь, что Р примитивна, то второй
член справа в (9.5.2) будет отсутствовать, и ясно, что Р°° суще-
существует и, кроме того, Р™ = Z\\.
3. Наоборот, предположим, что известно существование Р°°.
Тогда из (9.5.2) получаем, что существует
h mk
p->oo ft = 2 / = l Й/
«2 + «з + ••¦ + mh матриц Zftj, входящих в это суммирование,
являются линейно независимыми элементами в ^„уп (теорема
5.4.1) и порождают, скажем, подпространство 91 в ?яхя. Так
как Q тоже должна принадлежать 91, то существуют такие
268 ГЛ. 9. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
h mk
числа ah, j~u что Q=? X ak,i-i^ki- Отсюда следует, что для
k = 2 j=\
каждых k и / а. , = lim f^~l)- Но для k = 2, 3, ..., h имеем
|цй|=1 (ц;,^1) и из (9.5.2) следует, что предел справа не
существует. Таким образом, получено противоречие, которое
может быть разрешено лишь при условии, что из существова-
существования Р°° следует равенство /г= 1. 4
Следует заметить, что предположение о том, что Р неприво-
дима, несущественно. Можно доказать, что собственное значе-
значение 1 матрицы Р имеет лишь линейные элементарные делители,
даже если Р приводима. Таким образом, (9.5.2) все еще выпол-
выполняется и проведенное выше рассуждение применимо. Доказа-
Доказательство более общего результата требует более глубокого рас-
рассмотрения приводимых неотрицательных матриц, чем это вхо-
входит в наши намерения.
Отметим также, что, воспользовавшись упр. 3 из § 5.4, можем
написать
я~ = С(\)
где С(Х), 1|з(Я,)—приведенная присоединенная матрица и мини-
минимальный многочлен для Р. Если В(Х) = AХ — P)v и с(Х) — ха-
характеристический многочлен матрицы Р, то многочленное тож-
тождество
В(Х) _ С(Х)
с (Л) я|з(Я)
означает, что можно также написать
С(|)A)"
Еще одна возможность возникает, если отождествить Zn
с сопутствующей матрицей G\ из теоремы 2.5.1. Таким образом,
в случае, когда Р неприводима, существуют положительные
правый и левый собственные векторы х, у соответственно с соб-
собственным значением I, для которых
у'х = 1 и Р°° = ху'. (9.5.4)
9.6. Цепи Маркова
Неотрицательные матрицы возникают во мнбгих физических
задачах. Мы коснемся вкратце одной задачи теории вероятно-
вероятностей, которая использует некоторые из полученных ранее в этой
главе теорем.
И.О. ЦП III МАРКОВА 9
Для простоты мы рассмотрим физическую систему, которая
может быть полностью описана п различными состояниями.
Обозначим эти состояния через s\, s2, .... sn. Мы предположим,
что систему возможно наблюдать в моменты времени tD < t\ <
< t2 < ... и отмечать ее состояние в каждый из этих моментов.
Мы предположим, кроме того, что абсолютная вероятность на-
нахождения системы в состоянии s, в момент времени tr для i = 1,
2, ..., п и г = 0, 1, 2, ... равна pi{tr). Так как система должна
быть в одном из п состояний в момент времени tr, то имеем
Е/7,(д = 1, г = 0, 1, 2, ... (9.6.1)
1 = 1
Предполагается, что при всех i и / мы можем определить ве-
вероятность того, что система в момент времени tr переходит в со-
состояние Si после того, как она в момент времени tr~\ находи-
находилась в состоянии Sj. Таким образом, мы предполагаем, что из-
известны условные вероятности qij(tr\tr-i), i, /=1, 2, ..., п,
перехода в момент времени tr в состояние s,-, если задано, что
в момент времени /r~i система находилась в состоянии sj. Пра-
Правила теории вероятностей тогда означают, что
п
Pl(tr)=?<lll<trUr-l)PlUr-l)
/ — 1
или в матричном виде
Pr = Q(tr,1r-i)Pr-u r=\,2,..., (9.6.2)
где положено
и Q(tr, tr-i) — матрица из &пу.п с элементами qu{tr \ /г_,).
Так как система должна перейти в одно из п состояний
в момент времени tr после того, как она была в состоянии Sj
в момент времени /,-ь то
Наконец, предположим, что известно начальное состояние
системы. Так, если начальное состояние есть Sj, то р0 = ег —
вектору с единицей на месте i и нулями на остальных местах.
Из (9.6.2) получаем, что в момент времени tr
r_,, /r_2) ... Q(/It to)Po. (9.6.4)
270 ГЛ. 3. НЕОТРИЦАТЕЛЬНЫЕ МАТРИЦЫ
Только что описанный процесс известен как цепь Маркова.
Если условные вероятности qij(tr\tr^\) не зависят от t или оди-
одинаковы в каждый момент t0, t\, t2, ..., то процесс описывается
как однородная цепь Маркова. Мы ограничимся рассмотрением
этого относительно простого случая. Отметим, что теперь можно
записать Q(tr, tr-l) = Q, r = l, 2, ...; равенство (9.6.4) пере-
переходит в pr = Qrpo и (9.6.3) означает, что матрица Q, соответст-
соответствующая однородной цепи Маркова, такова, что Q' стохастиче-
стохастическая. Для удобства мы полагаем Р = Q'.
Во многих задачах, использующих цепи Маркова, нам инте-
интересно знать предельное поведение последовательности р0, р\,
р2, ... Это приводит нас к необходимости рассматривать вопрос
о существовании lim Qr или lim P''. Если Р (или Q) неприво-
г->оо г-> оо
дима, то, согласно теореме 9.5.3, эти пределы существуют
<=> Р примитивна. Так как Р = Q', то Q имеет собственное
значение 1 и правый и левый собственные векторы х, у из
(9.5.4) будут левым и правым собственными веикторами для Q
соответственно. Таким образом, существуют правый и левый
собственные векторы §(=#) и ^li—*) Для Q с собственным
значением 1, для которых ц% = 1 и Q°° = |ti'. Имеем тогда
роо = (ц'роI, так что, каков бы ни был начальный вектор р0,
предельный вектор будет пропорционален |. Но рг удовлетво-
удовлетворяет условию (9.6.1) при каждом г, так что роо удовлетворяет
тому же условию. Таким образом, если определить положитель-
п
ный вектор \ так, что ? 1г== Ъ то роо = | при каждом воз-
возможном выборе рп.
Тот факт, что I > 0, означает, что можно закончить любым
из п состояний S], S2, ..., sn. Мы доказали, что: если Q — мат-
матрица условных вероятностей, соответствующая некоторой одно-
однородной цепи Маркова, и Q неприводима, то предельные абсо-
абсолютные вероятности pi (too) существуют фф> Q примитивна.
Кроме того, если Q примитивна, то pi(tx)>Q при t = 1, 2, ...
..., п и эти вероятности являются компонентами (должным
образом нормализованного) правого собственного вектора для
Q, соответствующего собственному значению 1.
ДОПОЛНЕНИЕ 1
НЕКОТОРЫЕ ТЕОРЕМЫ ИЗ АНАЛИЗА
В этом дополнении мы обсуждаем без доказательства неко-
некоторые важные теоремы из анализа, которыми мы воспользова-
воспользовались несколько раз в основной части книги. Эти результаты
формулируются в настолько общем виде, насколько это нужно
для наших приложений, хотя они могут быть доказаны так же
легко и в более общем контексте. Приведем сначала некоторые
определения.
Напомним, что любая векторная норма в <&п может быть
использована в качестве меры величины расстояния (§ 6,2). Для
заданной векторной нормы h на ^я мы определяем окрестность
Nr(x) точки х <= ffn как множество точек у в ffn, для которых
h (у— х) ^ г (т. е. это есть шар с центром в х и радиусом г,
см. упр. 12 из § 6.2). Если 9— некоторое множество точек в
Wn, x^Wn будет предельной точкой для 9, если каждая
окрестность для х содержит некоторую точку ре?1 с р =^ х.
Множество 9 называется замкнутым, если каждая предельная
точка для 9 принадлежит 9, и 9 ограничено, если существуют
такие К ^ 0 и x<=Wn, что h(y — *) < К для всех у е 9. Мы
можем сформулировать теперь первый результат:
Теорема 1. Пусть X— замкнутое и ограниченное множе-
множество вещественных чисел и М, m — верхняя и нижняя грани
для чисел х в М, Тогда М, in e X.
Доказательство является непосредственным выводом из
определений.
Рассмотрим теперь некоторую функцию / со значениями
в Ч?т, определенную на 9 Е Wn- Мы говорим, что / непрерывна
в^е?', если для заданного е ;> 0 существует такое б > 0, что
из у е jV6 (x) следует
А (/(»)-/(*))< в.
Мы говорим, что / непрерывна на 93, если f непрерывна в каж-
каждой точке 9*. Множество f(9)^4?m определяется условием:
a^f(9) в том и только в том случае, когда существует такая
точка Ъ е Wn, что а = f(b).
272 ДОПОЛНЕНИЯ
Теорема 2. Пусть f — определенная выше функция. Если
9?— замкнутое и ограниченное множество в ^„ и f непрерывна
на 91, то f{9}) будет замкнутым и ограниченным подмноже-
подмножеством в <j!?m.
В этой и следующей теоремах можно заменить ЧРт на 52т,
'ё'п на Sin или произвести обе замены одновременно. Последняя
теорема получается в качестве следствия теорем 1 и 2.
Теорема 3. Пусть f — непрерывная вещественнозначная
функция, определенная на замкнутом и ограниченном подмно-
подмножестве 9* в Wn- Если
М = sup / (х), m = inf / (*),
лес/ хее?
то существуют такие векторы у, геУ, что
М = /(у), m = f(z).
В этом утверждении sup f {x) обозначает супремум, или
верхнюю грань чисел }{х), где х е 9>. Подобно этому inf f (x)
обозначает инфимум, или нижнюю грань.
Согласно теореме 2, при предположениях теоремы 3 \{9})
будет замкнутым и ограниченным множеством вещественных
чисел и результат будет следовать из теоремы 1. Можно ска-
сказать, что при предположениях теоремы 3 / имеет максимум
и минимум на 9?, и мы можем записать
sup /(*) = тах/(лс), inf f (x) = minf(x).
xs^tf лес/ дгес/ лге Г
Мы приведем теперь три простых примера, показывающих,
что три условия: f непрерывна на 9*, 91 ограничено и 9Р замк-
замкнуто — все необходимы.
(а) Пусть f(x) = x, 91 — интервал @,1) и х е 91. Здесь 91
ограничено, но не замкнуто, и f непрерывна на 9я. Очевидно,
что М = 1, m = 0 и / не принимает этих значений на 9°.
(б) При f(x)—\/x и множестве 9* всех вещественных чи-
чисел, не меньших 1, имеем, что f непрерывна на 93 и 9* замкнуто,
но не ограничено. В этом случае \{9>)—полуоткрытый интер-
интервал @,1] и inf / (дс) = 0 не принадлежит f(9!).
х^&
(в) При
( х, 0<х<1,
О, х=1,
имеем 91 = [0,1], что замкнуто и ограничено, но f разрывна
ра 9Р. Здесь }{9>) = [0,1] и sup f (х) = 1 не принадлежит f{9>).
Дополнения 273
Литература к дополнению 1
В и с k R. С, Advanced Calculus, McGraw-Hill, N. Y., 1956.
Rudin W., Principles of Mathematical Analysis, McGraw-Hill, N. Y., 1964.
ДОПОЛНЕНИЕ 2
ОБОБЩЕННАЯ ОБРАТНАЯ МАТРИЦА
В этом дополнении мы введем обобщение для обращения
матриц. Это обобщенное обращение имеет некоторые важные
свойства обычного обращения, но определено не только для
особых квадратных матриц, но и для прямоугольных матриц.
Прежде чем читать это дополнение, следует быть хорошо знако-
знакомым с содержанием § 2.11.
Пусть A ^Wmxn и имеет ранг г. Выберем некоторый базис
fu fi, ••-, fr для образа, или пространства столбцов, матрицы А
и положим F = || fi,f2,... ,fr II. Заметим, что столбцами в F
можно взять любые г линейно независимых столбцов в А. Тогда
каждый столбец из А будет линейной комбинацией столбцов
из F. Таким образом, можно записать Л»/ = Fpj при некотором
векторе pje^,., /= 1, 2, ..., /г, и существует такая /г X''-мат-
X''-матрица R, что
A = FR* A)
(/-м столбцом в R* является pj). Из этого построения легко по-
получаем, что ранг R также равен г (упр. 2 из § 1.15). Кроме
того, так как Л* = RF*, убеждаемся в том, что столбцы из R
образуют базис для ffl(A*) — образа матрицы Л*. Вспоминая
B.11.1), видим, что если положить
P = F(F*F)~] F\ Q = R(R*RylR\ B)
то Pefmxm будет проекцией на $.(А) и Q<=ffnXn будет про-
проекцией на 91 (Л*).
Мы определяем теперь п X т-матрицу
A' = R(R*Ryl (F*F)~lF*. C)
Объединяя это определение с A), непосредственно убеждаемся
в том, что
АА' = F {F*F)~] F* = Р, A'A = R(R*R)'1 R* = Q. D)
Матрица А1 называется обобщенной обратной для Л. Осно-
Основание для этой терминологии состоит в том, что Р ведет себя
как единичная матрица, если ее применять к векторам из
52(Л), т. е. при хе52(Л) имеем Рх = 1х = х. Из равенства
АА1 = Р тогда видим, что А1 обладает свойством, аналогичным
274 ДОПОЛНЕНИЙ
свойству матрицы А~\ когда она определена. Кроме того,
если А неособая, то 31{А) = ЧРП) Р = I и А1 = А~1. Подобное же
рассуждение применимо к Q и 31 (А*).
Умножая равенства D) справа на Л и Л7 соответственно,
получаем следующие результаты, характеристические для об-
обратной к неособой матрице:
АА'А = А, А'АА' = А>. E)
Мы можем теперь доказать, что определение C) обобщен-
обобщенной обратной приводит к единственной матрице, удовлетворяю-
удовлетворяющей равенствам D) и E).
Теорема 1. Если А <= WmXn, Р — проекция на 31 (А) и Q —
проекция на М(А*), то существует одна и лишь одна матрица А1,
для которой
АА' = Р, A'A = Q
АА1А = А, А<АА' = А'.
Доказательство. Мы уже видели, что матрица А1, оп-
определяемая формулой C), обладает требуемыми свойствами.
Предположим, что А[ и А[ обе удовлетворяют этим четырем
равенствам.
Так как A[A = Q, to можно написать
. А[АА[ = QA{.
Кроме того, A'2A = Q и А!2АА1 — А[ означают, что QAi = А\.
Следовательно,
А\АА[ = А[. F)
Но АА\ = Р приводит к
А\АА{ = А\Р
и АА\ = Р, А\АА\ = А[ означают, что А\Р==А\. Следовательно,
А',АА', = А\.
Сравнивая это с F), убеждаемся в том, что А[ = А[. Л
Обобщенная обратная имеет красивое приложение при изу-
изучении решений, или возможно приближенных решений, уравне-
уравнения Ах = с, где А еЧРтхп. Как мы видели в теореме 1.16.3, ре-
решение этого уравнения существует 44>се^(Л). Если это так,
то вектор х0 = А1 с будет решением уравнения Ах = с, ибо
с ей? (Л) означает, что Рс = с, а поэтому
ДОПОЛНЕНИЯ 275
Конечно, ха может быть или не быть единственным решением
(теорема 1 16.5). Если он является единственным решением, то
А' = А'1 и задача не имеет большого интереса в данном кон-
тгксте.
Введем обозначение [\х\\ ={х,х)'/г для длины вектора х
(§ 1.3) и заметим, что х будет решением уравнения Ах — с Ф=>
<==> || Ах - с || == 0.
В случае сфЖ(А) можно определить приближенное реше-
решение уравнения Ах = с (или решение з смысле наименьшего
квадратичного отклонения) как вектор х = х0, для которого
|| Л* — с || минимизируется. Мы намереваемся показать, что
Хо = А'с будет таким вектором. Во всяком случае это стацио-
стационарное свойство может быть использовано для характеризации
решений в случае c^ffl(A). Действительно, мы докажем, что
Хо = А'с будет либо единственным вектором (приближенным
решением или решением, смотря какой случай представился),
для которого [I Ах — с || минимизируется, либо единственным
вектором, для которого || Ах — с || и \\x\\ обе минимизируются.
Нам понадобится следующая
Лемма. Пусть ^efmxn и Р, Q, А1 определены выше.
Тогда для произвольных векторов gefn и h <= <&m имеем:
(О II Ag + (I-P)h IP = || Ag f + || (/ - P) h IP
и
(ii) || A'h + (/ - Q) g f = || A'h IP + II (/ - Q) g IP.
Доказательство. Так как Р — проекция на 5?(А), то
/ — Р будет проекцией на ортогональное дополнение к Ы{А)
(упр. 5 из § 2.11 и теорема 2.11.1). Таким образом, в формуле
(i) Ag и (/ — P)h — ортогональные векторы из <&п. Результат
следует теперь из обобщения теоремы Пифагора (упр. 3
из § 1.3).
Для получения формулы (ii) применяем то же самое рас-
рассуждение к А1, замечая, что А11 = А и что Q — проекция на
Я(А*). Л
Теорема 2. Пусть Ле??тхп, ce?ffl и Xo = <4Jc. Тогда
каждый вектор х е Wn, x Ф х0, удовлетворяет одному из двух
условий:
(а) ||Л*-е||>||Л*0-с||
или
(б) \\Ах-с\\ = \\Ахо-с\\ и ||*||>||*о||.
Доказательство. 1. Для любого х е ^„ запишем
Ах - с = А {х - А'с) + (/ - АА') (- с).
276 ДОПОЛНЕНИЯ
Так как АА1 = Я, можно применить часть (i) леммы и по-
получить
|| Ах - с |р = || А (х - х0) ||2 + || AxQ - с |р >М*0 - с f
с равенством только в том случае, когда Ах = Ах0. Остается
лишь рассмотреть этот случай и получить условие (б).
2. В случае равенства имеем Ах = Ах0 и, так как хо — А'с,
Но из теоремы 1 имеем А1 АА1 = А', так что
А'Ах = А1 с = *0.
Таким образом, можно написать
* = х0 + (* — *0) = А'с + (/ — А'А) х.
Применяя часть (И) леммы, получаем
Следовательно, || х || ^ || х0 \\ с равенством в том и только в том
случае, когда х = х0. Л
Упр. 1. Найти обобщенную обратную к матрице
II 1 |
2 О
-1 3 |
и показать, что единственным приближенным решением урав-
уравнения Ах = с, определяемым теоремой 2, будет
__
14
10
II
о
2
Упр. 2. Обобщить понятие «приближенное решение» и за-
затем теорему 2 с тем, чтобы включить в рассмотрение уравнение
АХ = С, где А, X, С — комплексные матрицы, порядки которых
ограничены лишь условием, что написанное уравнение имеет
смысл.
Литература к дополнению 2
G r e v i 11 Т. N. Е., The pseudoinverse of a rectangular matrix, S1AM
Rev. 1 A959), 38—43.
P e n г о s e R. A., A generalized inverse for matrices, Proc. Cambridge
Phil. Soc. 5J A955), 406—413.
ДОПОЛНЕНИЯ 277
ДОПОЛНЕНИЕ 3
РЕКОМЕНДАЦИИ ДЛЯ ДАЛЬНЕЙШЕГО ЧТЕНИЯ
Справочные работы общего характера:
Гантмахер Ф. Р., Теория матриц, «Наука», М., 1967.
MacDuf f ее С. С, The theory of matrices, Chelsea, N. Y., 1946.
Маркус М., М и н к Х., Обзор по теории матриц и матричным нера-
неравенствам, «Наука», М., 1972.
Работы, относящиеся в основном к материалу глав I—4:
F i n k b e i n e r D. Т., Introduction to matrices and linear transformation,
Freeman, San Francisco, 1966.
X а л м о ш П., Конечномерные векторные пространства, Физматгиз, М.,
1963.
Hamburger H. L. and Grimshaw M. E., linear transformations
in я-dimensional vector space, Cambridge Univ. Press, London — N. Y., 1956.
Hohn F. E., Elementary matrix algebra, Macmillan, N. Y., 1964.
Mirsky L., An introduction to linear algebra, Oxford Univ. Press
(Clarendon), London — N. Y., 1961.
Perlis S, Theory of matrices, Addison-Wesley, Mass., 1958.
Глава 5:
Гантмахер Ф. Р., Теория матриц, «Наука», М., 1967.
Rinehart R. F., The equivalence of definitions of a matrix function,
Amer. Math. Monthly 62 A955), 395—414.
Глава 6:
Householder A. S., The theory of matrices in numerical analysis,
Ginn (Blaisdell), Boston, 1964.
Фаддеев Д. К., Фаддее в а Н. Н., Вычислительные методы линейной
алгебры, Физматгиз, М., 1963.
Ostrowski A. М., Ober Normen von Matrizen, Math. Z. 63 A955),
2—18.
Глава 7:
Householder A. S., The theory of matrices in numerical analysis, Ginn
(Blaisdell), Boston, 1964.
Kato Т., Perturbation theory for linear operators, Springer, N. Y., 1966.
Wilkinson J. H., The algebraic eigenvalue problem, Oxford Univ. Press
(Clarendon), London —N. Y., 1965.
Глава 8:
Беллм а н Р., Введение в теорию матриц, «Наука», М., 1976.
Гантмахер Ф. Р., Теория матриц, «Наука», М., 1967.
М с D u f f e e С. С, The theory of matrices, Chelsea, N. Y., 1959.
Ostrowski A. M. and Schneider H., Some theorems on the inertia
of general matrices, J. Math. Anal. Appl. 4 A962), 72—84.
Глава 9:
Бел лм ан Р., Введение в теорию матриц, «Наука», М., 1976.
Гантмахер Ф. Р., Теория матриц, «Наука», М., 1967.
Varga R. S., Matrix iterative analysis, Prentice-Hall. Englewood Cliffs,
N. J., 1962.
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Алгоритм деления 123
Ассоциативность 10, 18
Базис 27
Бак (R. С. Buck) 275
Беллман (R. Bellman) 279
Бендиксон (I. Bendixon) 213
Блок 21
Варга (R. S. Varga) 279
Вектор единичный 11
— нормального вида 101
— нормированный 68
— нулевой 9
— порядка и 14
— связанный 9
— собственный левый 58
¦ ограниченный 112
— — правый 54
Вектор-столбец 23
Вектор-строка 23
Векторы биортогональные 67
— квазибиортогональные 63, 68
— квазиортогональные 68
— квазиортонормированные 68
— ортогональные 14, 67
— ортонормированиые 67
Вероятность условная 269
Вид колебания 100
Возмущение линейное 227
— относительное 203
Гамбургер (Н. L. Hamburger) 277
Гамильтон (W. R. Hamilton) 126
Гаитмахер Ф. Р. 279
Гармоника нормальная 101
Грань нижняя матрицы 202
Граф направленн й 256
—¦ сильно связный " 256
Гревил (Т. N. Е. Grevill) 278
Гримшоу (М. Е. Grimshaw) 277
Дополнение алгебраическое 36
Дополнения 82
— ортогональные 82, 112
Зависимость линейная 27
Задача общей интерполяции Эрмита 157
Закон инерции Сильвестра 90
Значение собственное 54
—' — ограниченное 112
— функции на спектре матрицы 159
— А-матрицы левое 125
— — правое 125
Индекс импримитивности 264
— собственного значения 154
— формы 90
Интеграл от вектора 102
— — матрицы 176
—' частный 181
Като (Т. Kato) 228, 232, 277
Квадрика центральная 92
Кели (A. Cayley) 126
Клетка жорданова 150
Комбинация линейная 16
Коммутативность 10, 18
Компонента матрицы 164
Координаты нормальные 101
Корень скрытый 147
Косинус направляющий 10
Коши (A. L. Cauchy) 116
Кратность геометрическая 58
— скрытого корня 149
— собственного значения 57
Критерий Грама 72
— Рауса —Гурвица 249
Курант (R. Courant) 111
Ляпунов А. М. 245—247, 249
Делитель левый 123
— общий 129
наибольший (НОД) 129
—=-. правый 123
— Элементарный 147
— — линейный 148
— — нелинейный 148
Дельта кройекеровская 20
Диагональ главная 20
Дистрибутивность 18
Длина 10, 14, E
Макдаффи (С. С. MacDuffee) 241, 277
Маркус (М. Marcus) 277
Матрица 17
— Вандермонда 39
— главная 41
—' дефектная 61
— диагональная 20
¦ каноническая 137
— единичная 19
— идемпотеитная 65
— импримитивная 264
алфавитный указатель
279
Матрица квадратная 17
— квазидиагональная 146
— кососимметрическая 74
— косоэрмитова 74
— многочленов 122
— неособая 40
— неотрицательная 255
— неприводимая 256
— нилъпотентная 66
— нормальная 80
— нулевая 19
— обратная 40
— — обобщенная 273
— определенная 93
— —' неотрицательно 93
положительно 93
— ортогональная 74
—' особая 40
— перестановочная 87
—' приводимая 255
— примитивная 265
—' присоединенная 39
— — приведенная 129
— простая 61
— прямоугольная 17
— с доминирующей диагональю 211
—' симметрическая 74
— скалярная 19
— сопровождающая 144, 252
— сопутствующая 64
—¦ стохастическая 266
— транспонированная 17
— треугольная 39
— унитарная 74
— устойчивая 234, 245
— элементарная 136
— эрмитова 74, 228
Матрицы Гурвица 249
— коммутирующие 18
— подобные 59
— —• ортогонально 78
унитарно 78
— соответствующие 18
Минк (Н. Mine) 277
Мннор 38, 41
— главный 41
Мирский (L. Mirsky) 277
Многочлен аннулирующий 128
— инвариантный 141
— Лагранжа 157
— минимальный 128
— неприводимый 129
— приведенный 128
— с матричным аргументом 64
— характеристический 5-1
Многочлены взаимно простые 129
Множество выпуклое 193
— замкнутое 271
— ограниченное 271
Монотонность абсолютной векторной нормы
200
Независимость линейная 27
Неравенство Шварца 15, 44
Норма векторная 190
— — абсолютная 199
— Гёльдера 190. 192
— евклидова 189
— матричная 185
• индуцированная 194
~ — обобщенная 186
— спектральная 186
— Фробениуса 189
Нормы согласованные 191
Область значений матрицы 25
Оболочка выпуклая 193
Образ матрицы 25
Окрестность 271
Оператор самосопряженный 76
Операция бинарная 12
¦ замкнутая 13
— элементарная левая 135
— — правая 135
Оси квадрики главные 93
Островский (А. М. Ostrowski) 277
Отношение Релея 106
обобщенное 109
— эквивалентности 60
Пенроуз (R. A. Penrose) 276
Перестановка 34
Перлис (S. Perlis) 277
Перрон (О. Perron) 262
Подпространства дополнительные 82
Подпространство 16
— аннулируемое 25
— собственное 16
Поле алгебраически замкнутое 55
— значений 203
Порядок матрицы 17
— минора 41
Последовательность матриц расходящаяся
170
¦ сходящаяся 170
Правило параллелограмма 10
Преобразование 24, 60
—• конгруэнтное 86
— подобия 59
— эквивалентное 135, 136
Проекция 15, 84
Произведение внешнее 24
— внутреннее 14, 24
— прямое 235
— скалярное 14
Производная вектора 99
— матрицы 99, 176
— определителя 52
Пространство бесконечномерное 28
— линейное 11
, натянутое на систему векторов 16
— —, порожденное системой векторов 16
— собственное левое 58
—¦ — правое 58
-- столбцов 25
Радиус спектральный 188
Разбиение 21
— квадратной матрицы симметричное 22
Разложение определителя по столбцу 36
строке 36
—' спектральное 163
Размерность 28
Райнхарт (R. F. Rinehart) 277
Ранг матрицы 46
—• по минорам 46
столбцам 45
— —¦ строкам 45
— формы 90
— ^.-матрицы 140
Раус (Е. J. Routb) 116
Резольвента 176
116
резольвента 1/ь
Релей (Lord Raylegh) wu
Реллих !F. Rellich) 228
Рефлексивность подобия матриц
Решение нетривиальное 24
- приближенное ~
60
,— - „ смысле наименьшего
квадратичного отклонения 275
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Решение тривиальное 24
Рудин (W. Rudin) 273
Ряд матриц 172
¦ расходящийся 172
¦ сходящийся 172
— Пюизье 220
Связь 112
Сегмент прямой 193
Сигнатура 90
Симметричность подобия матриц 60
След 56
Сложение векторов 13
Смит (Н. J. S. Smith) 141
Спектр матрицы 63
Стационарность отношения Релея 109
Степень ^-матрицы 122
Сумма векторов 10
— кронекеровская 238
— матриц 17
— прямая 82
Сфера единичная 106, 192
Теорема Аполлония 16
— Гершгорина 209
— Кели — Гамильтона 126
— Куранта — Фишера 115, 119
— о вычетах 176
— — параллелограмме 16
— об остатке 125
— Перрона — фробениуса 259—261
— Пифагора 15
— спектральная 64
— Шура 212
Теплиц (О. Toeplltz) 79
Тождество Коши 44
— Якоби 183
Точка предельная 271
Транзитивность подобия матриц 60
Транспозиция 34
Угол 10, 67
Уилкинсон (J. П. Wilkinson) 277
Умножение матриц 17, 18
— па скаляр 13, 17
Уравнение неоднородное 24
— однородное 24
— характеристическое 24
Уравнения алгебраические линейные 24
Фаддеев Д. К. 277
Фаддеева В. Н. 277
Финкбейиер (D. Т. Finkbeiner) 277
Фишер (Е. Fischer) 111
Форма каноническая Смита 141
— квадратичная 86
— нормальная естественная вторая 150
—' первая 146
жорданова 150
— эрмитова 85
Формула Бине — Коши 41, 47
— Лиувилля 183
— Орландо 249
Фробениус (G. Frobenius) 126, 141, 241, 261
Функция 12
— аддитивная 36
— аналитическая 175
— непрерывная 271
— однородная 36
—, определенная на спектре 159
— от матрицы 160
— целая 173
Халмош (P. R. Halmos) 277
Хаусхолдер (A. S. Householder) 277
Хирш (К. A. Hirsch) 213
Хон (F. E. Hohn) 277
Цепь Маркова 270
— —¦ однородная 270
Циркулянт 244
Частное левое 123
— правое 123
Частота собственная 100
Число условное 207 ^
— — спектральное '2^''^
Шар 193, 271
— единичный 193
Шнейдер (Н. Schneider) 277
Шур (I. Schur) 79, 212
Эквивалентность матриц 140
— Я-матриц 136
Элемент матрицы 17
га-ка чисел упорядоченная 9
р-норма 190
^.-матрица 122
— регулярная 122