/
Автор: Полищук В.И.
Теги: математика линейная алгебра дифференциальные уравнения векторная алгебра
Год: 2013
Текст
В.И. Полищук
ЛИНЕЙНАЯ АЛГЕБРА
Версия 3
Санкт-Петербург
2013
© В.И. Полищук
© Факультет физики и нанотехнологий СПбГПУ
© Академический физико-технологический университет РАН
Не рекомендовано Научно-Методическим советом по математике
Министерства образования и науки РФ в качестве учебного пособия
для студентов высших учебных заведений, обучающихся по
направлению 0101 — «Математика» и 0107 — «Физика»
Typeset by TTTeX2s
Оглавление
1 Основные структуры 8
1.1 Аддитивная группа........................................... 8
1.2 Линейное пространство....................................... 9
1.3 Алгебра.................................................... 12
1.4 Норма...................................................... 13
1.5 Задачи .................................................... 14
2 Комплексные числа 16
2.1 Нормированное пространство (С.............................. 16
2.2 Нормированная алгебра (С................................... 17
2.3 Сопряжение. Поле С......................................... 20
2.4 Комплексная экспонента..................................... 20
2.5 О связи с геометрией....................................... 21
2.6 Задачи .................................................... 23
3 Полиномы 25
3.1 Определение полинома....................................... 25
3.2 Деление с остатком......................................... 27
3.3 Идеалы в алгебре полиномов ................................ 28
3.4 Теоремы о делимости........................................ 28
3.5 Алгоритм Евклида........................................... 31
3.6 Об интерполяции............................................ 32
3.7 Теорема Даламбера.......................................... 33
3.8 Мономы Тейлора ............................................ 36
3.9 Производная полинома....................................... 37
3.10 Задачи ................................................... 39
3
4
ОГЛАВЛЕНИЕ
4 Конечномерное пространство 41
4.1 Полнота и конечномерность................................... 41
4.2 Независимость............................................... 42
4.3 Базис и размерность......................................... 44
4.4 Признаки базисности......................................... 47
4.5 База и ранг................................................. 48
4.6 Задачи ..................................................... 49
5 Полиномиальные разложения 51
5.1 Теорема о разложении........................................ 51
5.2 Рациональные дроби.......................................... 53
5.3 Задачи ..................................................... 54
6 Алгебра остатков 56
6.1 Конечномерные алгебры полиномов............................. 56
6.2 Возможность интерполяции.................................... 58
6.3 Система Вандермонда ........................................ 59
6.4 Функциональное исчисление................................... 60
6.5 Полиномиальная экспонента................................... 62
6.6 Задачи ..................................................... 63
7 Матрицы 64
7.1 Начальная терминология...................................... 64
7.2 Операции над матрицами ..................................... 66
7.3 Идемпотентные матрицы....................................... 69
7.4 Блочные матрицы............................................. 69
7.5 Матричное уравнение......................................... 71
7.6 Эквивалентные преобразования................................ 72
7.7 Задачи ..................................................... 74
8 Метод Гаусса 76
8.1 Теорема Гаусса-Иордана...................................... 76
8.2 Единственность гауссовой формы.............................. 78
8.3 Триада пары {А, В}.......................................... 81
8.4 Решения уравнения АХ=В...................................... 82
8.5 Однородная система ......................................... 84
8.6 Пересечение оболочек........................................ 85
ОГЛАВЛЕНИЕ
5
8.7 Гауссова инверсия........................................... 87
8.8 Критерии обратимости........................................ 89
9 Линейное отображение 91
9.1 Основные определения........................................ 91
9.2 Изоморфизмы................................................. 93
9.3 Теорема о ранге и дефекте................................... 95
9.4 Сопряженное пространство ................................... 97
9.5 Матрица отображения......................................... 99
9.6 Задачи .................................................... 102
10 Объем 104
10.1 Аксиоматизация объема..................................... 104
10.2 Простейшие свойства объема................................ 106
10.3 Существование объема...................................... 109
10.4 Детерминант оператора .................................... 111
11 Определители 113
11.1 Основные свойства......................................... 113
11.2 Транспонирование и определитель........................... 114
11.3 Применение определителей ................................. 116
11.4 Детерминант и определитель................................ 116
11.5 Ранг и определитель....................................... 117
11.6 Задачи ................................................... 117
12 Вычисление определителей 119
12.1 Альтернанта Вандермонда................................... 119
12.2 «Трехдиагональная» матрица................................ 120
12.3 Континуанта............................................... 121
12.4 Формула Лагранжа-Сильвестра............................... 123
12.5 Задачи ................................................... 126
13 Симметричные и эрмитовы формы 128
13.1 Определения и примеры форм ............................... 128
13.2 Матрицы Грама............................................. 130
13.3 Квадратичные формы ....................................... 132
13.4 Диагонализация форм....................................... 133
6
ОГЛАВЛЕНИЕ
13.5 Закон инерции. Сигнатура.................................. 133
13.6 Задачи ................................................... 136
14 Положительные формы 137
14.1 Формулы Фурье............................................. 137
14.2 Критерий независимости.................................... 138
14.3 Унитарные матрицы ........................................ 141
14.4 Евклидово пространство.................................... 142
14.5 Ортогональность .......................................... 143
14.6 Коградиент и градиент..................................... 146
14.7 Взаимные базисы........................................... 147
14.8 Задачи ................................................... 148
15 Основные классы операторов 150
15.1 Унитарный оператор........................................ 150
15.2 Симметричный оператор..................................... 153
15.3 Собственные подпространства................................153
15.4 Спектральная теорема...................................... 155
15.5 Спектральная функция...................................... 157
15.6 Эрмитово-сопряженный оператор ............................ 158
15.7 Полярное представление.................................... 160
15.8 Задачи ................................................... 161
16 Ориентированное пространство 162
16.1 Смешанное произведение.................................... 162
16.2 Абсолютный объем.......................................... 164
16.3 Векторное произведение.................................... 166
16.4 Задачи ................................................... 169
17 Спектральная теория 170
17.1 Аннуляторы.................................................170
17.2 Операторное разложение единицы............................ 172
17.3 Спектральные подпространства.............................. 173
17.4 Корневые подпространства.................................. 174
17.5 Диагональный оператор..................................... 175
17.6 Нильпотентный оператор.................................... 177
17.7 Задачи ................................................... 178
ОГЛАВЛЕНИЕ
7
18 Теория Жордана 179
18.1 Существование разложения................................. 179
18.2 Единственность разложения................................ 180
18.3 Базис Жордана............................................ 181
18.4 Решение задачи........................................... 183
18.5 Построение базиса........................................ 185
18.6 Единственность формы..................................... 187
18.7 Задачи .................................................. 188
19 Дифференциальные уравнения 189
19.1 Предисловие.............................................. 189
19.2 Пространство решений..................................... 189
19.3 Задача Коши.............................................. 192
20 Оператор эволюции 195
20.1 Действительная экспонента................................ 195
20.2 Дифференциальное свойство ............................... 196
20.3 Динамическая система..................................... 198
20.4 Фазовая плоскость ....................................... 199
20.5 Задачи ...................................................202
Глава 1
Основные структуры
Аддитивная группа. — Линейное пространство. — Подпростран-
ства. — Сумма. — Прямая сумма. — Прямое дополнение. — Нор-
мированное пространство. — Алгебра. — Нормированная алгебра.
1.1 Аддитивная группа
Определение. Группа — это множество G, состоящее из элементов ж,
?/,... с заданной на нем операцией G х G Д- G, которая подчинена
следующим требованиям.
1. Для произвольных элементов ж, ?/, z из множества G выполнено
равенство (ж о у) о z = х о (у о z) (ассоциативность).
2. Множество G содержит нейтральный элемент О, взаимодействие
с которым оставляет каждый х из G неизменным: 0ох = хоО = х.
3. Для произвольного элемента х найдется противоположный ему
элемент х' такой, что х'ох = хох' = 0.
Определение. Группу G называют коммутативной или абелевой, ес-
ли операция о переместительна, т.е. обладает следующим свойством.
4. Для произвольных элементов х, у из G выполнено равенство ком-
мутативности X о у = у О X .
Замечание. Часто, если речь идет о коммутативной группе, операцию о назы-
вают сложением, а символ о заменяют на плюс. В этом случае противоположный
8
1.2. ЛИНЕЙНОЕ ПРО СТРА НОТЕ О
9
элемент х' обозначают —х, а сумму х + (—у} называют разностью элементов х и у и
обозначают х — у. При использовании такой записи G обычно называют аддитивной
группой.
Упражнения.
1. Проверьте, что множество G+ — {0,1,2, 3, 4} с операцией о взятия остат-
ка от деления обычной суммы элементов на 5 является абелевой группой
и для каждого элемента этой группы найдите противоположный.
2. Покажите, что в любой группе имеется лишь один нейтральный эле-
мент.
3. Докажите, что в любой группе всякий элемент обладает единственным
противоположным.
4. Проверьте, что в аддитивной группе — (х — у) — у — х.
1.2 Линейное пространство
Определение. (Действительное) линейное пространство — это ад-
дитивная группа X, для элементов которой определено умножение на
скаляр, т. е. отображение R х X —> X такое, что для произвольных ска-
ляров а, fi и произвольных х и у из X выполнены равенства
5. a(fix) = (afi)x;
б. (а + fi)x = ах + fix',
7. а(х + у) = ах + ау,
8. 1 х = х.
Замечание. В дальнейшем нейтральный элемент аддитивной группы X (нулевой
вектор) обозначается символом 0, нулевой скаляр — символом 0. Элементы линейно-
го пространства X (синонимы: векторы, точки) обозначаются, как правило, строч-
ными буквами латинского алфавита, а скаляры — строчными греческими буквами.
Синоним термина «линейное пространство» — термин «векторное пространство».
Греческий алфавит
Аа альфа Bfi бэта Гу гамма Ад дельта Ее эпсилон ZC, дзета
Ну эта &й тэта Il йота К ж каппа ЛА лямбда Му мю
Nv ню Оо омикрон кси ТГтг пи Pq ро Ест сигма
Тт тау Yv ипсилон Ф(р фи хи пси Пш омега
10
ГЛАВА 1. ОСНОВНЫЕ СТРУКТУРЫ
Упражнение. Покажите, что 0 х = А 0 = 0.
Примеры.
1. Важный пример линейного пространства представляет функциональное
пространство. Так называют всякий класс У функций с числовыми
значениями и общей областью определения Р, замкнутый относитель-
но «поточечных» операций умножения на число и сложения функций.
Пусть, например, D — {1,..., п} и У — IRn, т. е. У состоит из всевозмож-
ных отображений k i—> Xk- Операции сложения и умножения на скаляр
[Х1... хп] + [щ ... уп] = [xi + щ . хп + ?/„];
А[яд ... хп] = [Ляд ... Ахга]
превращают IR/; в линейное пространство, которое мы будем называть
координатным пространством строк.
2. Линейное пространство С[а; 6] состоит из всех непрерывных функций,
определенных на отрезке [а; 6] с «поточечными» операциями сложения
и умножения на число.
Определение. Подмножество Хо линейного пространства X называет-
ся подпространством в X, если Хо является линейным пространством
с операциями сложения и умножения на скаляр, взятыми из X.
Примеры.
1. Множество Л [а, 6] линейных неоднородных функций и Со [а, 6] — мно-
жество непрерывных на отрезке [а, 6] функций с нулевыми значениями
на концах отрезка являются подпространствами в пространстве С[а, &].
2. Нечетные и четные функции на IR образуют подпространства Odd(H) и
Even(H) в функциональном пространстве F(H) всех функций на IR.
3. Строки [xi...xn], подчиненные условиям яд = = хп и, соответ-
ственно, xi + + хп — 0 составляют подпространства в координатном
пространстве строк JRn.
Определение. Подпространства Х7 (1 j т) дизъюнктны, если
для Xj £ Xj равенство ад + + хт = 0 возможно лишь когда все
слагаемые Xj нулевые.
Определение. Суммой подпространств Х7 называется множество
Xi X X Хт {ад X X хт . ад £ Xi,..., хт £ Хт|.
1.2. ЛИНЕЙНОЕ ПРО СТРА НОТЕ О
11
Из этого определения видно, что сумма подпространств сама является
подпространством.
Определение. Сумма Xi + + Хш называется прямой и записывает-
ся как Xi Ф Ф Хт, если все подпространства X, (прямые слагаемые
суммы) дизъюнктны.
Теорема 1.1. Если X = Xi Ф Ф Xm (т. е. если пространство X
представимо прямой суммой подпространств), то каждый элемент
х е X однозначно представйм суммой Z Xj, в которой Xj е Xj.
о Вычитая почленно из представления х = х\ + + х'т равенство
х = яд + + хт, находим, что (х^ — яд) + + (х'т — хт) = 0. Ввиду
дизъюнктности подпространств, все разности нулевые.
Определение. Если X = Х1Ф- -Ф Хш, то единственным образом опре-
деляемый из разложения х = яд + + хт элемент Xj называется ком-
понентой элемента х в подпространстве Xj или проекцией х на Xj (па-
раллельно остальным слагаемым прямой суммы).
Определение. Если X = Xi ФХ2, то говорят, что каждое из двух под-
пространств Xj дополняет другое (или является прямым дополнением
другого) до пространства X.
Упражнения.
1. Докажите, что все пары подпространств из Примеров на стр. 10 дизъ-
юнктны.
2. Установите равенство С[а,Ь] = Л [а, 6] ф Со [а, Ь].
3. Покажите, что F(B) = Odd(B) ©Even(B) и найдите четную и нечет-
ную компоненты функции ехр.
Определение. Флагом называют всякую возрастающую по включению
цепочку подпространств U Z.
Пример. Флаг образуют «нарастающие» суммы подпространств
Xi != Xi + Х2 — Xi + Х2 + Хз != != Xi + Х2 + Хз + + Хт.
12
ГЛАВА 1. ОСНОВНЫЕ СТРУКТУРЫ
1. 3 Алгебра
Определение. Алгебра А — это линейное пространство, для элементов
которого определено умножение., т. е. операция Дх А —> А, обладающая
свойствами
9. а (ху) = (ах)у = х(ау);
10. (xy)z = x(yz);
11. (ж + y)z = xz + yz',
12. x{y + z) = xy + xz.
Алгебру А называют коммутативной, если для любых ее элементов
х, у выполнено равенство ху = ух.
Определение. Линейное подпространство Ао А называется под-
алгеброй алгебры А, если вместе с каждой парой своих элементов оно
содержит их произведение.
Упражнение. Покажите, что хО = Ох = 0.
Определение. Алгебра А униталъна, если в ней существует элемент
е Ф 0, нейтральный относительно умножения, а именно, для каждого х
из А выполнены равенства ех = хе = х.
Упражнение. Установите единственность единицы.
Пример. Алгебра С[а;Ь] функций t н-> x(t), непрерывных на отрезке [а; Ь]
с «поточечными» операциями - это унитальная алгебра с единицей e(t) = 1
на отрезке [а; Ь]. Ее подалгебра Со [а; Ь] (см. Пример 1 на стр. 10) унитальной
алгеброй не является.
Определение. Говорят, что элемент х унитальной алгебры А обладает
обратным элементом х', если х'х = хх' = е.
Упражнение. Покажите, что если обратный элемент х1 существует, то он
единствен. {Обозначение: х' — х-1)
Определение. Унитальная алгебра А называется алгеброй с делением,
если всякий ненулевой ее элемент обладает обратным.
14. НОРМА
13
Определение. Линейное подпространство Ао А называется идеалом
коммутативной алгебры А, если при любых oq е До и а е А произведение
аоа принадлежит До- Идеал, отличный как от алгебры А, так и от ее
нулевой подалгебры О, называется собственным.
Пример. Пусть алгебра С[а; 6] (с «поточечными» операциями) состоит из
всех непрерывных на отрезке [а; Ь] функций. Подалгебра Со [а; &], введенная
в Примере 1, стр. 10, представляет собой собственный идеал алгебры С[а;Ь].
Определение. Идеал До А называется главным идеалом (порожден-
ным элементом а0 е До)5 если До = : «£ Л}. Элемент а0 называют
порождающим главный идеал До-
1.4 Норма
Определение. Линейное пространство X называется нормированным,
если на X задана числовая функция || • || : X —> R+ такая, что
1. ||т|| = 0 =^> х = 0 (невырожденность);
2. ||ах|| = |а| ||х|| для всех а е R (однородность);
3. ||т + у\\ ||т|| + \\у|| (согласованность со сложением).
Функция || || называется нормой. Ее значение ||т|| на элементе х — нор-
мой х. Свойство 3 называют (первым) неравенством треугольника.
Замечание. Норму ||т|| вектора х иногда обозначают символом |т|, называя ее
длиной (или модулем) вектора х.
Определение. Функцию р(х,у) = ||т — у\\ называют расстоянием или
метрикой на X, порождаемой нормой || ||.
Примеры.
1. Пример нормы в линейном пространстве С[а,Ь]: для непрерывной на
[а, Ь] функции х положим ||х|| = max |x(t)|.
2. Приведем три простых примера норм в пространстве R2.
(а) Евклидова норма: ||х II + х%-
14
ГЛАВА 1. ОСНОВНЫЕ СТРУКТУРЫ
(Ь) АУ-норма (L-норма): ||х|| = |xi| + |х2|-
(с) Равномерная норма: ||х|| = max{|xi|, |ад|}-
Вот как выглядит сфера S — {х : ||х|| = 1} для каждой из этих норм:
Упражнение. Проверьте, что функции, определенные в примерах, удовле-
творяют требованиям Определения на стр 13.
Определение. Алгебра А называется нормированной, если А является
нормированным линейным пространством, норма в котором согласована
с умножением: \\ху\\ ||ж|| \\у\\. Если алгебра А унитальна, накладыва-
ется дополнительное требование ||е|| = 1.
1.5 Задачи
1. Проверьте, что множество Gx — {1,2,3, 4} с операцией о взятия остат-
ка от деления обычного произведения элементов на 5 является абелевой
группой и для каждого элемента этой группы укажите противополож-
ный (обратный).
2. Найдите проекцию функции / из С[0,1] на подпространство А[0,1] па-
раллельно подпространству Со [0,1].
3. Какова Xi-компонента строки X = [яд ... хп] при разложении IR/; в сум-
му — Xi Ф Х2 — {X : Xi — — хп] ф {X : х± + + хп — 0}?
4. Докажите, что пространство Т-антипериодических функций h на ЕЕ
(т. е. h(x + T") — —h(x)} дополняет пространство Т-периодических функ-
ций g на ЕЕ до пространства 2Т-периодических функций f на R.
5. Покажите, что норма нулевого элемента 0 равна нулю.
6. Докажите избыточность требования || || ^ 0.
1.5. ЗАДАЧИ
15
7. Проверьте, что расстояние @(х,у) — ||х — у\\ обладает свойствами:
(a) у(х, х) — 0;
(Ь) х ф у => р(х, у) > 0;
(с) q(x,z) р(х,у) + Q(y,z).
8. Докажите второе неравенство треугольника: | ||х|| — \\у\\ | ||х — у\\.
9. Покажите, что функция <р(х) — ||х|| непрерывна относительно метрики
q(x, у) — ||х — у\\ (т. е. <д(х) —> если у(х, а) —> 0).
10. Пусть норма в IR2 задана равенством |а| = |xi| + |х2|. Покажите, что
для произвольной нормы || || в Н2 найдется число А Е Н, при всех х
обеспечивающее неравенство ||х|| < А | х |.
11. Пусть X = [а?1 Х2] £ К2 и || || — произвольная норма в линейном про-
странстве Е<2- Докажите непрерывность функции ^(^1,^2) — ||Х||.
12. Пусть норма в IR2 задана равенством |Х| = |ад| + |х2|. Покажите, что
для произвольной нормы || || в Н2 найдется число В Е Н, при всех X
обеспечивающее неравенство | X | В||Х||.
13. Пусть || || и || ||' — какие-то две нормы в линейном пространстве IR2 -
Всегда ли существует число С такое, что || ||' С || ||?
14. Докажите, что для обратимого элемента алгебры ||х||-1 < ||х“11|.
15. Покажите, что пространство С[а,Ь] с нормой ||х|| = max|x(t)| умноже-
ние в котором определено «поточечно», является (коммутативной, уни-
тальной) нормированной алгеброй.
16. Покажите, что идеал Со[щ&] алгебры С[а;Ь] не является главным.
17. Пусть х — произвольный ненулевой элемент нормированной алгебры.
Всегда ли сходится последовательность ап — д/||хп|| ?
Глава 2
Комплексные числа
Алгебраическая, декартова, полярная и показательная формы
комплексного числа. — Умножение векторов на плоскости. — Гео-
метрический смысл умножения. — Сопряжение. — Экспонента.
2.1 Нормированное пространство С
Обозначим символом С линейное пространство R2, наделенное евклидо-
вой нормой | |. Элементы пространства С будем называть комплексны-
ми числами. Обозначив Z = (1; 0), г = (0; 1), можно комплексное число z
представить в форме z = al + (Зг. Такую запись называют алгебраиче-
ской формой z, в отличие от формы z = (а,/3), называемой декартовой.
Определение. Число Re z = а называют действительной частью ком-
плексного числа z = al + /3i, а число Im г = /3 — его мнимой частью.
Комплексные числа с ненулевой мнимой частью называются мнимыми
числами. Комплексные числа с нулевой действительной частью называ-
ются чисто мнимыми.
Замечание. Данные определения — один из многих примеров расхождения ма-
тематической терминологии и семантики повседневной речи: мнимая часть никогда
не бывает мнимым числом, а чисто мнимое число может не быть мнимым.
Согласно устоявшейся традиции, действительное а отождествляется с
комплексным числом al. Это (не ведущее к каким-либо недоразуме-
ниям) соглашение позволяет считать прямую R частью плоскости С.
Вектор I в записи обычно опускают и пишут z = а + /Зг.
16
2.2. НОРМИРОВАННАЯ АЛГЕБРА С
17
Для z ф 0 перейдем к полярным координатам в (С:
а = г cos 19
(3 = г sin тЗ
Здесь г = |г|, а полярный угол й определен с точностью до 2л.
Определение. Запись z в виде \z\ (cos$ + zsin$) называют полярной
или тригонометрической формой г, а угол arg (г) = й — аргументом
комплексного числа z.
Эйлер1) предложил обозначать вектор cos й + zsin$ символом егД Оче-
видно, |ег1? | = 1 для любого й.
Замечание. Символ е"1 сформирован из двух компонент: действительного чис-
ла е (основание натурального логарифма) и чисто мнимого гй. Двухуровневая запись
создает впечатление, что е1'1 = ехр(г$)- Пока, однако, правая часть этого равенства
лишена для нас какого-либо смысла.
Определение. Запись комплексного числа z в виде z = \z\ еП> называ-
ется показательной формой z.
2.2 Нормированная алгебра С
Поставим задачей так определить перемножение элементов (С, чтобы
нормированное линейное пространство (С стало нормированной алгеброй
с единицей I. Возникают вопросы:
Возможно ли вообще это сделать? Если да, то сколькими способами?
Предполагая вначале ответ на первый вопрос положительным, ответим
на второй. Пусть г2 = А + дг. Очевидно, |г| = 1, так что для всех х
из R, ввиду согласованности нормы с умножением, должно выполняться
неравенство
|г2 + тг|2 = \i(x + z)|2 < (|z| |т + z|)2 = |т + z|2 = х2 + 1.
С другой стороны, его левая часть преобразуется к такому виду:
|г2 + тг|2 = |(А + дг) + тг|2 = |А + (д + т)г|2 = А2 + (х + д)2 .
i) Euler, Leonhard (1707-1783) — швейцарский математик
18
ГЛАВА 2. КОМПЛЕКСНЫЕ ЧИСЛА
Следовательно, А2 + (ж + д)2 + х2 + 1, так что линейная неоднородная
функция f(x) = 2цх + (Л2 + д2 — 1) не принимает положительных
значений. Последнее возможно лишь при д = 0. Итак, г2 = Л. Тогда, по
свойству нормы,
2 + д/(1 + Л)2 + 4 = |(1 +А) + 2г| = 11 + 2г + г21 = |(1 + г)21 + |(1 + г)|2 = 2.
Отсюда следует, что А = — 1. Таким образом, С может быть нормиро-
ванной алгеброй только при условии г2 = —1.
Проверим, что умножение, определяемое правилом г2 = —1, т. е.
+1+2 = («1 + ^10(^2 + /^) = (СДС^2 — /^1/^2) + (^1^2 + CEl/^2)^ (2-1)
действительно превращает С в нормированную алгебру и, тем самым,
положительно ответим на вопрос, поставленный на стр. 17. Надлежит
проверить свойства 9-12 (см. стр. 12) и убедиться, что норма | | согла-
сована с умножением, т. е. доказать неравенство
1^1^21 ЫЫ (2.2)
Замечание. Полагая /3 = 0 в декартовой записи умножения
(а, /3)(д, 5) = (ад — /35, аб + /Зд) (2-3)
приходим к равенству (а, 0)(д,5) = а(д, 5), означающему, что умножение (слева) на
комплексное число (а, 0) = al дает тот же результат, что и умножение на а е К.
Подставляя в (2.1) полярные формы Zk = (&k,/Зк) = \zk\ (cosi9k + 9sini9k)
и вынося за скобки модули |zfc|, видим, что произведение ziz2 равно
|^i| 1^21((cos cos $2 — sin^i sini92) + 9(cos i9i sini92 + cos i92 sini9i)), (2.4)
т. e. правило умножения (2.1) может быть также записано в виде
^1^2 = |+||+| (cos(i9x + 192) + г 841(191. + 192)). (2.5)
Тем самым, при умножении комплексных чисел их модули перемножа-
ются, а их аргументы складываются:
j \wz\ = |w||z|
I arg(wz) = arg(w) + arg(z).
2.2. НОРМИРОВАННАЯ АЛГЕБРА С
19
Таким образом, модуль при переходе от прямой R к плоскости (С сохра-
няет свойство мультипликативности: модуль произведения равен произ-
ведению модулей. Неравенство (2.2) — очевидное следствие мультипли-
кативности модуля.
Что касается аргумента, то он ведет себя подобно логарифму: аргумент
произведения равен сумме аргументов (ненулевых) сомножителей. По-
казательная форма позволяет наиболее выразительно записать закон
умножения:
(ге"’)(^) = (2.6)
Равенство (2.6) ведет к ряду важных выводов.
Во-первых, оно раскрывает геометрический смысл умножения: при ум-
ножении каждого комплексного числа на гег1? плоскость (С изотропно
растягивается в г раз и поворачивается на угол д.
Во-вторых, правая часть равенства не меняется при перестановке мо-
дулей, равно как и при перестановке аргументов. Следовательно, ком-
плексное умножение коммутативно.
В-третьих, ввиду ассоциативности действительных операций, комплекс-
ное умножение также ассоциативно:
zi(z2z3) = в2взе‘^+^ = в1в2езе^1+^3'>
(г122)2з = в1в2е'^+^взеР3 = .
Ассоциативность и коммутативность комплексного умножения позволя-
ют для произвольных комплексных w, z и любого действительного а на-
писать равенства = ((al)w)z = w((al)z). В силу замечания на
стр. 18, их можно переписать так: a(wz) = (aw)z = w(az). Тем самым,
установлено свойство 9 (см. стр. 12). Ввиду коммутативности умноже-
ния, для доказательства того, что С — нормированная алгебра доста-
точно проверить только один из законов дистрибутивности, например,
равенство w(zi + z2) = wz± + wz2. Если w = 0, равенство справедливо.
Если же w = ге11р ф 0, оно сводится к соотношению
ег(фХ + ^2) = + e^z2 .
Согласно геометрическому смыслу операций, левая часть соотношения
есть результат поворота на угол диагонали параллелограмма с векто-
рами сторон д и г2, тогда как в правой — диагональ параллелограмма,
векторы сторон которого получены поворотом тех же z-\_ и z2 на тот же
угол <д.
20
ГЛАВА 2. КОМПЛЕКСНЫЕ ЧИСЛА
2.3 Сопряжение. Поле С
Сопоставим вектору z = х + iy = ге1® плоскости С симметричный ему
относительно действительной прямой R вектор ~z = х — iy = ге_гД
Определение. Отображение : : называется сопряжением.
Правило (2.6) приводит к равенству z~z = г2 = |г|2, из которого видно,
что любой ненулевой элемент нормированной алгебры С имеет обрат-
ный элемент г-1 = |д|-2д. Таким образом, коммутативная нормиро-
ванная алгебра С является алгеброй с делением. В частности, она пред-
ставляет собой поле, т. е. аддитивную группу, ненулевые элементы кото-
рой образуют коммутативную группу по умножению, причем последнее
связано со сложением распределительным законом.
Упражнение. Проверьте следующие свойства операции z н-> ~z\
z — z-, z — z о z e R; 4- ^2 = 4- ^2;
^2 = ^1^2; Zi/z2 = Zifa .
2.4 Комплексная экспонента
Определение. Для комплексного числа z = х + iy по определению по-
ложим ехр(д) = ez = ех егу = ех cos у + i ех sin у.
Из определения и правила умножения комплексных чисел следуют ра-
венства:
ezi+z2 _ еХ1+х2 еУу1+у-2) _ ^еХ1 eX2^eiyi е1У2^ _ exi eiyi еХ2 eiy-2 _ e^lg^2 .
ехр(О) = cos 0 + zsinO = 1; | ехр(д)| = |еж| \егу| = ех 1 = exp(Re z).
По правилу дифференцирования вектор-функций, для t е R
D exp(tz) = (eLx costy)' + i(eLx sinty)' =
= (etxx cos ty — etxy sin ty) + i(etxx sin ty + etxy cos ty) =
= etx (x (cos t у + z sin ty)) + у (z cos ty — sin ty)) =
= etx (cos ty + z sin ty) (x + iy) = z exp(tz).
По форме это равенство совпадает со своим действительным аналогом.
2.5. О СВЯЗИ С ГЕОМЕТРИЕЙ
21
2.5 О связи с геометрией
Приведем лишь один из множества примеров использования системы (С
в геометрии. Известно, что некоторые довольно сложные задачи плани-
метрии становятся элементарными после их «перевода» на векторный
язык. Векторный подход приобретает дополнительные возможности по-
сле внесения в векторное пространство (С структуры поля. Эти возмож-
ности демонстрирует доказательство следующей красивой теоремы 2).
Центры правильных треугольников, внешним образом построенных на
сторонах произвольного треугольника, служат вершинами правильно-
го треугольника.
о Соединим центры А, В, С построенных на плоскости С правильных
треугольников с вершинами исходного треугольника согласно рисунку,
на котором £ обозначает комплексное число ехр(гтг/3):
По построению, £с + с = а + £а + b + sb. Разделив на 1 + £ обе части,
получим равенство с = а + Ь. Из очевидных соотношений ££ = 1 = £ + £
следует, что
АС = £с — а = £а — ££а + d = е((1 — £)а + Ь) = Цен + Ь) = еАВ
т. е. вектор АС получается из вектора АВ поворотом на тг/З, что и до-
казывает теорему.
В свою очередь, многие утверждения, относящиеся к алгебре комплекс-
ных чисел, удобно формулировать, пользуясь языком геометрии.
2) ее открытие историки науки приписывают Наполеону Бонапарту (1769-1821).
22
ГЛАВА 2. КОМПЛЕКСНЫЕ ЧИСЛА
Пусть w — ненулевое комплексное число. Рассмотрим график G урав-
нения Im(z/w) = 0. Очевидно, отношение z/w действительно тогда и
только тогда, когда векторы z и w коллинеарны. Следовательно, G —
проходящая через начало О прямая с направляющим вектором w.
Определение. Полуплоскостью назовем всякое подмножество точек
плоскости С, задаваемое неравенством Im(z/w) < с, где с — произволь-
ное действительное число.
Упражнение. Каков геометрический смысл числа q — |с|?
Определение. Непустое ограниченное пересечение нескольких полу-
плоскостей называют выпуклым многоугольником.
Упражнение. Нарисуйте многоугольник Т — {z : Im(z/w) 1}.
W3 =1
Следующий результат принадлежит Гауссу3).
Теорема 2.1. Если zi, ..., zn — точки выпуклого многоугольника Р и
di, ..., ап — произвольные положительные числа, то все корни урав-
нения
Ё Uj (г — Zj)~r = 0
j=i
лежат в многоугольнике Р.
о В основе доказательства лежит элементарная импликация
Im(z) > 0 =^> Im(l/z)<0. (2.7)
Пусть многоугольник Р образован пересечением полуплоскостей
Pr = {z : Im(z/wr) cr} (1 г т).
Предположим, что точка z не принадлежит какой-то полуплоскости Рг,
т. е. допустим, что Im(z/wr) > сг, в то время как при всех j справед-
ливы неравенства Im(zj/wr) < сг. Почленным вычитанием найдем, что
Im((z — Zj)/wr) > 0. Из (2.7) и положительности Uj следует неравенство
Im(ftjWr(z — Zj)-1) < 0. Суммируя по j, видим, что выполняется нера-
венство Im (wr 2i aj (z ~ < 0- Последнее противоречит условию
теоремы. Таким образом, z принадлежит каждой из полуплоскостей Рг,
а значит — их общей части Р.
3) GauB, Johann Carl Friedrich (1777-1855) — немецкий математик
2.6. ЗАДАЧИ
23
2.6 Задачи
1. Опишите геометрически подмножество С, определяемое условием
(a) {z + l/z : \z\ = 1} (b) 5 \z\ |4z — 9|
(c) |^ + 2|^2|^-1| (d) |1 + ^2|<|2^|
2. Решите уравнение, представив ответ в алгебраической форме:
(а) -? = 24 - 70z (b) 22 = 7 — 24 г
(с) z1 — 5 — 12 г (d) z1 — 12 — 5г
3. Пусть точки 2Д, 2^2 лежат на окружности \z\ — 1. Найдите множество
всевозможных значений суммы |zi + z^|2 + |zi — z^|2.
4. Пусть |zi| = |^2| = |2д| = 1 и 2у + ^2 + 2Д = 0. Найдите множество
всевозможных значений суммы S — | z\ — z^ | + | z^ — z^ | + | z^ — z\ |.
5. Найдите показательную форму мнимых чисел, считая, что |<д| < тг.
(a) sin — i cos (b) 1 + cos + i sin (с) V3 + 2 + i
6. Каково число z, если модуль числа (г — z)/{i + z) равен единице, а его
аргумент равен
7. Представьте в алгебраической форме, не использующей круговых
функций и операции деления, число 4 sin 18° — 4г cos 18°.
8. Найдите наибольшее и наименьшее значения функции /, определяемой
на окружности |z| = 1 равенством f(z) — |n + bz\, в котором а и b —
заданные комплексные числа.
9. Представьте корни уравнения z^ + 1 + (z + I)4 = 0 в показательной
форме.
10. Пусть е — ехр(г^), где п Е IV. Упростите выражение
А — 1 + Ек + s2fc + + к
считая число к целым и таким, что sk А 1.
24
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
ГЛАВА 2. КОМПЛЕКСНЫЕ ЧИСЛА
Сверните суммы, считая, что <р ф ктг (к ей).
(а) С — 1 + cos 2<д + cos 4<д + cos 6<д + + cos 2(п — 1)<д
(b) S — sin 2<д + sin 4<д + sin 6<д + + sin 2(п — 1)<д
Упростите выражения, в которых t — tg <р:
(а) А = S (-l)fcC“t2fc = 1 - C2t2 + С’У - СУ + • • •
(b) В = У (-l)kC2k+1t2k+1 = c\t - c3t3 + с3ё-------
кУ)
Упростите дробь D в предположении, что х ф k/N, где TV е IN.
sinx + sin3x + sin5x + + sin(2n — l)x . .
D = ------------------------------(n e IN).
cos x + cos 3x + cos 5x + + cos(2n — l)x
Найдите все корни уравнения (z — i)n — (z + г)п.
Вычислите суммы
А = s (~Ус2к В = S (~1)кС2к+1 с = S (У)кс2к+1
кУ) кУ) кУ)
Найдите значение суммы У (—1)А cosn
к=0
Пусть е — ехр(г^), где п Е IN. Упростите произведения
С — (1 — г)(1 — £2)(1 — г3) (1 — £п х)
D — (1 + г)(1 + г2)(1 + г3) (1 + гп-1).
В окружность радиуса R вписан правильный n-угольник. Найдите про-
изведение длин его сторон и диагоналей с общей вершиной.
Правильный n-угольник вписан в окружность радиуса 1. Найдите про-
изведение длин всех его диагоналей и сторон.
В окружность единичного радиуса вписан правильный n-угольник. Най-
дите сумму квадратов длин всех его сторон и диагоналей.
В окружность единичного радиуса вписан правильный n-угольник. Най-
дите сумму длин всех его сторон и диагоналей.
Глава 3
Полиномы
Теорема единственности. — Идеалы в алгебре полиномов. — Про-
стейшие теоремы о делимости. — Алгоритм Евклида. — Теоре-
ма Даламбера. — Формула Тейлора. — Производная. — Признак
кратности корня. — Задача интерполяции (постановка).
3.1 Определение полинома
Пусть X — некоторая алгебра с единицей е. Введем класс R[X] функций
р : X —> X, допускающих представление
р(х) = S а^хк (х е X) (3-1)
к=0
в котором ад е R, а т° = е (даже при х = 0).
Поскольку X — алгебра, класс R[X] является функциональной алгеброй,
т.е. алгеброй с «поточечными» операциями, взятыми из X.
Определение. Элементы алгебры R[X] будем называть действитель-
ными полиномами.
Теорема 3.1. Если действительный полином тождественно равен ну-
лю, то равны нулю все коэффициенты в представлении (3.1).
о При п = 0 полином имеет вид р(х) = аое. Если коэффициент а0
отличен от нуля, то умножая на а^1 обе части равенства р(х) = 0, по-
лучим е = 0, что невозможно. Следовательно, п 1. Докажем теорему
25
26
ГЛАВА 3. ПОЛИНОМЫ
от противного. Не снижая общности считаем, что ап = 1. Положим
Л = SZ=o 1°^! (так чт0 1) и найдем значение р(х) при х = Ле:
р(Ае) = X afc(Ae)fc = ( S (хкХк ) е
А:=0 \ к=0 /
Как и выше, из условия р(х) = 0 заключаем, что X акХк = 0. Последнее
к=0
равенство (в сочетании с условием ап = 1 и оценкой А 1) позволяет
составить цепочку неравенств
Хп
п—1 ,
X акХк
к=0
тъ—1 тъ—1
S Ь|А^ A"’1 S Ы = А’^-ЦА - 1)
k=Q к=0
которая (после сокращения на Хп ') приводит к тому, что 1^0. <з
Следствие. Два действительных полинома совпадают тогда и толь-
ко тогда, когда совпадают наборы их коэффициентов.
Совершенно аналогично вводится алгебра С[Х] комплексных полино-
мов, на которую без каких-либо изменений переносится доказательство
Теоремы 3.1. Эта теорема (единственности) делает корректным следу-
ющее определение.
Определение. Если в представлении (3.1) ап Ф 0, то число ап называ-
ют старшим коэффициентом полинома р, моном апхп — его старшим
членом, а число п = deg р — степенью полинома р.
Для нулевого полинома понятие «степень» не определяется. Старший
член произведения полиномов получается перемножением их старших
членов, так что степень «подобна» логарифму: degpg = degp + deg q и
выполнено неравенство deg(p + q) max{degp, deg q} (полиномы p, q,
p + q предполагаются ненулевыми).
Очевидна важная теорема о делителях нуля в алгебре полиномов.
Теорема 3.2. Если произведение двух полиномов тождественно равно
нулю, то по меньшей мере один из них — нулевой.
Определение. Полином со старшим коэффициентом 1 называют нор-
мализованным или унитарным.
В заключение раздела уместно сделать следующее
Замечание. Пусть наряду с алгебрами R[X] и С[Х] рассматриваются алгебры
R[Y] и C[Y]. Поскольку полином однозначно определяется набором коэффициентов,
любое полиномиальное тождество в алгебре X будет верным и в алгебре Y. Поэтому
вполне достаточно ограничиться выводом тождеств для случая X = (С.
3.2. ДЕЛЕНИЕ С ОСТАТКОМ
27
3.2 Деление с остатком
Теорема 3.3. Для нормализованного полинома q и произвольного по-
линома р существует единственная пара полиномов s и г, удовлетво-
ряющих равенству р = qs + г, где либо deg г < deg q, либо г = 0.
о Установим вначале существование полиномов s и г. При р = 0 возь-
мем s = г = 0. Если р / 0 и deg q = 0, то q = 1 и равенство р = qs + г
выполнено при s = р, г = 0. При р / 0 и deg q 1 проведем по степеням
degp индукцию с базой degp = deg q — 1 (s = 0, г = p). Пусть deg q = n.
При p(x) = axn+m + , где a / 0 и m 0, введем полином p равенством
p(x) = p(x) — axmq(x). Степень p меньше степени p. По предположению
индукции, р = qs + г, где либо deg г < deg q, либо г = 0. Тогда
р(х) = р(х) + axmq(x) = q(x)(s(x) + ахт) + г(х)
и обозначение з(т) = з(т) + ахт завершает доказательство.
Докажем теперь единственность пары s, г. Пусть р = qs + г и одновре-
менно р = qs + г , тогда г — г = q(s — s). Предположение s ф s приводит
к неравенству deg q + deg(s — s) = deg(r — r) < deg q, что невозможно.
Но тогда s = s, откуда следует, что г = г. <1
Определение. Полином г в равенстве р = sq + г, определяемый усло-
вием « deg г < deg q, иначе г = 0 », называют остатком от деления р
на q и обозначают res(p) (mod q) (читается: вычет р по модулю q).
Тот факт, что при делении pi и р2 на полином q получается один и тот
же остаток г, записывают в виде сравнения: pi = р2 (mod q). Очевидно,
сравнение по фиксированному модулю q является отношением эквива-
лентности на множестве полиномов.
Определение. Говорят, что полином р делится на полином d, суще-
ствует полином q такой, что р = dq.
В случае, когда р делится на d, говорят также, что р кратен d или d
— делитель р или d делит р. Сокращением двух последних фраз явля-
ются записи d \р и р = 0 (mod d). Ясно, что нулевой полином делится
на любой полином и что полином нулевой степени является делителем
произвольного полинома.
28
ГЛАВА 3. ПОЛИНОМЫ
Определение. Тривиальными делителями в алгебре полиномов назы-
вают полиномы нулевой степени. Полиномы, не имеющие других дели-
телей, называют неразложимыми или неприводимыми.
Пример. Полином р(х) — х2 + х + 6 неприводим в алгебре Н[Х] (в отличие
от полинома q(x) — х2 + х — 6).
Из определения делимости видно, что если р и q делятся на d, то и сумма
р + q делится на d. Кроме того, если р делится на q, a q делится на d, то
и р делится на d.
3.3 Идеалы в алгебре полиномов
Теорема 3.4. В алгебре полиномов любой собственный идеал являет-
ся главным, причем нормализованный полином, порождающий этот
идеал, определен единственным образом.
о Пусть Q — собственный идеал алгебры полиномов Р. Множество
= {deg q : q е Q} состоит из натуральных чисел и, следовательно,
содержит минимальный элемент п. Пусть q е Q — нормализованный по-
лином степени п. По теореме о делении с остатком, любой элемент р е Q
представим в виде р = qs + г, где либо г = 0, либо deg г < deg q = п.
Поскольку q е Q, то (по определению идеала) qs также лежит в Q. Но Q
— линейное пространство, так что и остаток г принадлежит Q. Ввиду
минимальности п, неравенство deg г < п невозможно. Следовательно,
г = 0 и Q — главный идеал Р, порожденный полиномом q. Допустим, Q
порождается также некоторым нормализованным полиномом q. Тогда
каждый из нормализованных полиномов q и q кратен другому. Послед-
нее возможно только если q = q.
3.4 Теоремы о делимости
Пусть pi, ..., рт — заданный набор ненулевых полиномов. Рассмотрим в
алгебре Р всех полиномов подмножество Q, составленное из полиномов
вида q = aipi + + атрт, где полиномы Uj независимо пробегают Р.
34- ТЕОРЕМЫ О ДЕЛИМОСТИ
29
Определение. Элементы множества Q мы будем называть комбинаци-
ями полиномов pi, ..., рт.
Очевидно, Q — идеал алгебры Р, содержащий все pj. Согласно Теоре-
ме 3.4, идеал Q порождается единственным нормализованным полино-
мом d. В частности, d делит каждый из полиномов pj.
Определение. Полином d называется наибольшим общим делителем
полиномов pi, ..., рт и обозначается gcd(pi, ..., рт). х)
Замечание. Поскольку d е Q, имеет место (вообще говоря, не единственное) ли-
нейное представление
gcd(pi, ..., рт) = агрг Ч-\-атрт (3.2)
где щ — какие-то полиномы.
Из равенства (3.2) видно, что полином d = gcd(pi, ..., рт) делится на
любой общий делитель полиномов pj. Это поясняет, почему d называют
наибольшим общим делителем для рт, ..., рт.
Упражнения. Докажите, что
1. Если нормализованный полином d делится на любой общий делитель
полиномов pj и степень его минимальна среди полиномов, обладающих
таким свойством, то d — gcd(pi, ..., рт).
2. Если среди всех общих для полиномов pj делителей нормализованный
полином d имеет максимальную степень, то d — gcd(pi, ..., рт).
Определение. Если gcd(p, q) = 1, то полиномы р, q называют взаимно
простыми.
Теорема 3.5. Полиномы р и q взаимно просты тогда и только тогда,
когда для некоторых полиномов а и b выполнено равенство ар + bq = 1.
о Пусть р и q взаимно просты. Равенство (3.2) обеспечивает существо-
вание полиномов а и b таких, что ар + bq = 1. Это равенство также и
достаточно для взаимной простоты полиномов р и q. Действительно, ес-
ли ар+bq = 1, то нормализованный полином d = gcd(p, q) делит единицу
и, следовательно, сам является единичным полиномом. <з
i) greatest common divisor (англ.)
30
ГЛАВА 3. ПОЛИНОМЫ
Теорема 3.6. Полином d является наибольшим общим делителем по-
линомов р и q тогда и только тогда, когда р = du и q = dv, где и и v
— взаимно простые полиномы.
о Пусть р = du и q = dv, где и, v взаимно просты. Тогда для некоторых
а и b выполнено тождество 1 = аи + bv. Умножая обе его части на d,
получаем тождество d = ар + bq. Из него видно, что d делится на любой
общий делитель полиномов ри q. Следовательно, d = gcd(p, q). Обратно,
если d = gcd(p, q), то p = du, q = dv и возможно линейное представление
d = ap + bq = adu + bdv. Сокращая на d, видим, что и, v взаимно просты:
1 = аи + bv. <]
Теорема 3.7. Если произведение полиномов ps делится на взаимно
простой с р полином q, то s делится на q.
о Поскольку gcd(p, q) = 1, найдутся а и Ь, для которых 1 = ар + bq.
Умножая обе части равенства на s, видим, что s = a(ps) + bqs. Пер-
вое слагаемое правой части делится на q по условию, второе, очевидно,
также делится на q. Следовательно, их сумма s делится на q. <з
Следствие. Если полином р делится на каждый из попарно взаимно
простых полиномов qj, то р делится и на произведение q = q±- qm
этих полиномов.
о Если произведение р = q±si делится на полином q2 взаимно простой
с щ, то Si делится на q2 и т.д. По индукции устанавливаем делимость р
на 7 = qr--qm.
Теорема 3.8. Если полиномы р и q взаимно просты с полиномом s, то
произведение pq также взаимно просто с s.
о Перемножая равенства ар + bs = 1 и cq + ds = 1 почленно, получим
равенство (ар + bs)(cq + ds) = (ac)(pq) + (bcq + apd + bds)s = 1, t. e.
полиномы pq и s удовлетворяют критерию взаимной простоты.
Применением индукции нетрудно получить
Следствие. Если каждый из полиномов pj взаимно прост с каждым
из полиномов qk, то произведение pi---pm взаимно просто с произве-
дением qr--qn. В частности, если р и q взаимно просты, то рт и qn
также взаимно просты.
3.5. АЛГОРИТМ ЕВКЛИДА
31
3.5 Алгоритм Евклида
Эффективный способ отыскания полинома d = gcd(p, q) состоит в по-
следовательном делении с остатком.
Теорема 3.9. Пусть degp deg q и р = qs + г, где либо deg г < deg q,
либо г = 0. Тогда gcd(p, q) = gcd(g, г).
о Из равенства р = qs + г видно, что всякий делитель общий для q и г
является общим делителем р и q, а из представления г = p—qs видно, что
делитель общий для р и q является общим делителем q и г. Итак, пары
{р, q] и {7, г} имеют одно и то же множество общих делителей. Поэтому
наибольшие общие делители пар совпадают: gcd(p, q) = gcd(g,r). <i
Доказанная теорема позволяет, сохраняя наибольший общий делитель
пары, переходить к парам полиномов все меньших степеней. Посколь-
ку неограниченно понижать степень невозможно, описанный процесс с
необходимостью оборвется. Это может произойти только если на оче-
редном шаге получится нулевой остаток:
р = qs + г0
q = r0SQ + Г1
Го = + г2
............................... (3.3)
Гп—2 Гп— ±Sn— 1 + Тп
Гп—1 гnsn Т d
rn = da + 0
Теорема 3.9 утверждает, что gcd(p, q) = gcd(d, 0) = d, т. e. что наиболь-
шим общим делителем р и q является последний ненулевой остаток в
процессе Евклида. Формулы (3.3) позволяют не только найти наиболь-
ший общий делитель d полиномов р и 7, но также построить линейное
представление d = ap+bq, выразив d комбинацией полиномов pnq. Дей-
ствительно, первое равенство показывает, что остаток г о является ком-
бинацией делимого р и делителя q. Подставив представление г о = р — qs
во второе равенство, видим, что также является комбинацией р и q.
Действуя по индукции, предположим, что тд_1 и ц — тоже комбинации
полиномов р и q. Подставив Гк-i и ц в равенство Гк-i = TkSk + П;+1,
убеждаемся, что и тд+1 представляет собой комбинацию полиномов р
и q. Таким образом, остаток d в предпоследнем равенстве, в конечном
итоге, будет представлен комбинацией исходных полиномов р и q.
32
ГЛАВА 3. ПОЛИНОМЫ
3.6 Об интерполяции
Определение. Скажем, что полиномы риг имеют в точке Л контакт
порядка к, если их разность делится на полином b(z) = (z — X)k+1.
Из этого определения видно, что контакт некоторого порядка предпо-
лагает контакты всех меньших порядков.
В действительном случае наличие в точке Л контакта нулевого порядка
означает, что графики у = р(х) и у = г (ж) пересекаются в точке с
абсциссой Л. Контакт первого порядка говорит о существовании в этой
точке общей для обоих графиков касательной. Геометрический смысл
контакта второго порядка — существование в точке с абсциссой Л общей
обоим графикам соприкасающейся параболы.
Полином г не превышающей к степени (или нулевой полином) будем
называть направляющей порядка к для полинома р в точке X, если по-
линомы р и г имеют в этой точке контакт порядка к. Понятие «направ-
ляющая» естественно обобщает понятие «касательная». Класс всех по-
линомов с общей направляющей порядка к обычно называют к-струей.
Шарль Эрмит2) поставил и решил задачу о слиянии нескольких струй,
т. е. построил по заданным в различных точках Л направляющим г\ по-
лином минимально возможной степени, установив попутно единствен-
ность такого полинома.
Сформулируем ту же задачу алгебраически. Пусть задано конечное мно-
жество Л точек плоскости С и каждой точке Л е Л сопоставлено нату-
ральное число п(А). Множество пар {А,п(А)} можно представлять себе
как набор частиц А, снабженных зарядами (массами) п(А). Пусть для
каждого А задан полином г\ такой, что либо г\ = 0, либо degTA < п(А).
Обозначим b\(z) = (z — А)П(Л\ Контакт порядка п(А) — 1 полинома р с
полиномом г\ в точке А означает, что г\ — остаток от деления р на Ь\.
Таким образом, задача Эрмита приобретает следующее алгебраическое
прочтение.
Требуется установить существование полинома минимальной степе-
ни, дающего при делении на полиномы Ь\ заданные остатки г\ и дока-
зать единственность такого полинома.
В любом учебнике арифметики рассматривается или, по меньшей ме-
ре, упоминается знаменитая китайская теорема об остатках (chinese
2) Hermite, Charles (1822-1901) — французский математик
3.7. ТЕОРЕМА ДАЛАМБЕРА
33
Рис. 3.1: Две 1-струи и результат их слияния
remainder theorem). Задача Эрмита является ее (почти дословным) по-
линомиальным аналогом.
Упражнение. Проверьте, что полином f(z) — 3z — 4z2 + 2z3 осуществля-
ет изображенное на рис. 3.1 слияние двух 1-струй с направляющими 3z (в
точке А = 0) и z (в точке А = 1).
3.7 Теорема Даламбера
В этом и следующем за ним разделах полиномиальные алгебры С[Х] и
R[X] рассматриваются в предположении X = (С.
Теорема 3.10. Если полином р не принимает нулевого значения ни в
одной точке комплексной плоскости, то degp = 0.
о Предположим, что degp 1. Согласно одному из вариантов класси-
ческой теоремы анализа (теоремы Вейерштрасса), непрерывная функ-
ция |р | (неограниченно растущая на бесконечности) принимает мини-
мальное значение в некоторой точке zq. Другими словами, при всех z
выполнены неравенства 0 < |р(д0) | М~о + ~)|- Рассмотрим полином
, ч р(р) + z) т п
q(z) — --—г— — Oq + a±z + + asz ,
РЫ
ненулевые мономы которого расположим по возрастанию степеней. За-
метим, что s > 1, иначе р(д0 + д) = 0 при а0 + aizm = 0. По опреде-
лению q, для всех z выполнена оценка |д(д)| q(0) = а0 = 1, т. е. ни в
34
ГЛАВА 3. ПОЛИНОМЫ
какой точке г* функция |д(г)| не может принять значение меньшее еди-
ницы. Указав такую точку г*, мы опровергнем предположение degp 1
и, тем самым, теорема будет доказана. Введем положительные числа а
и г, определив их равенствами
а = max lad 1 min Iml = ars, (3.4)
(XjsSs 1 J 1 (XjsSs 1 J 1 4 7
из которых видно, что г 1/sn < 1/s < 1/2. Пусть теперь г* — лю-
бой корень уравнения a^z171 + |ni\rm = 0. Очевидно, |г*| = г. Применяя
свойства модуля в сочетании с оценкой |оц\rm < ar < 1/s < 1/2 и соот-
ношениями (3.4), приходим к цепочке неравенств
к(г*)1 = |1 + cliZ™ + + asz*\ = |1 — |tzi\гт + + asz* \ <
< (1 — |ni|rm) + (s — l)nrm+1 = 1 — arm+1 + (ars — |оц\)rm =
= 1 — arm+1 + (min \aj | — |ni|)rm 1 — arm+1 < 1
Теорема Даламбера3) доказана. <з
Следствие. Произвольный полином р положительной степени пред-
ставйм в eudep(z) = (г—zq)s(z), где z0 — некоторое комплексное число,
as— другой полином.
о Согласно теореме, р(г0) = 0 для некоторого zQ. Разделим с остат-
ком p(z) на z — z0 : p(z) = (z — Zq)s(z) + г, где г — постоянный полином.
Полагая z = z0, находим, что г = 0 и, тем самым, p(z) = (г — Zq)s(z). <з
Последовательно применяя п раз это следствие, для нормализованного
полинома р степени п получаем представление
p(z) = (z - Zi) (z - zk) (z - zn) (3.5)
Определение. Комплексные числа Zj называются корнями (или нуля-
ми) полинома р.
Пусть p(z) = zn + arzn~4 + + an_\Z + an. Раскрывая скобки в (3.5), на
основании теоремы единственности мы приходим к формулам Виета41),
3) d’Alembert, Jean Le Rond (1717-1783) — французский математик и философ
4) Viete, Frangois (1540-1603) — французский математик
3.7. ТЕОРЕМА ДАЛАМБЕРА
35
выражающим коэффициенты a,j полинома р через его корни.
<21 = — S Zi
а2 = S ZiZj
< а3 = - Е ZiZjZk
ап ( 1) ^1^2 zn
Собирая одинаковые сомножители, запишем (3.5) в виде
p(z) = (г — £i)mi (г — zs)ms (S rrij = ri) (3.6)
Определение. Тождество (3.6) называется каноническим разложени-
ем нормализованного полинома р (над полем С), а натуральные числа
rrij — кратностями соответствующих корней Zj. Множество пар {zj,rrij}
будем называть спектром полинома р.
Теорема 3.11. Число а является корнем кратности т полинома р,
если и только если p(z) = (г — a)mq(z), где q(a) Ф 0.
о Пусть p(z) = (г — a)mq(z), где q(a) ф 0. Сомножитель (г — а) не
входит в каноническое разложение
q(z) = (z- zt)mi (z - zs)ms (3.7)
полинома 7, иначе q(a) = 0. Следовательно, произведение
p(z) = (г - a)m(z - Z1)mi (г - zs)ms (3.8)
представляет собой каноническое разложение полинома р и кратность
корня а равна т. Обратно, если а — корень кратности т полинома р, то
имеет место разложение (3.8). Введя полином q равенством (3.7), видим,
что q(d) ф 0. <]
Теорема 3.12. Если а — корень кратности т действительного поли-
нома р, то а также является корнем р, причем той же кратности.
о По условию теоремы, выполнено тождество р(г) = (г — а)т S ckzn~k,
где S ckan~k ф 0. Так как p(z) = p(z) и можно разрывать черту сопряже-
ния над операциями, то p(z) = (z — a)m S ckzn~k и S ckan~k Ф 0. Заменяя
в последнем тождестве z на г, находим, что p(z) = (г — а)т S ckzn~k, где
S ckan~k Ф 0. Теорема доказана. <з
Содержание этой теоремы обычно передают фразой: «спектр действи-
тельного полинома симметричен относительно действительной оси».
36
ГЛАВА 3. ПОЛИНОМЫ
Теорема 3.13. Произвольный нормализованный действительный по-
лином представим произведением действительных сомножителей ви-
да (х — Xj)mj и (ж2 + акх + (Зк)Пк.
о Пусть Xj — различные действительные корни нормализованного дей-
ствительного полинома р и wij — соответствующие им кратности. Со-
гласно Теореме 3.12, каноническое разложение полинома р имеет вид
р(х) = П(ж - Xj)mj П(ж - zk)nk(x — zk)nk
j к
где zk — мнимые корни р, апк — соответствующие кратности. При отсут-
ствии у р действительных корней «пустое» первое произведение счита-
ем равным единице. Сомножители (х — zk)(x — zk) второго произведения
преобразуются к виду х2 + акх + Д, где ак = —2 Rezk и /Зк = \zk|2. <1
3.8 Мономы Тейлора
Определение. Для п е Z введем мономы Тейлора5) tn равенствами
М^) = 5 (п °)’ = ° (п < °)-
Ясно, что всякий полином р может быть представлен как р = £ cktk и
к^О
такое представление единственно. Видно также, что при всех целых к
ktk(z) = ztk-^z) (3.9)
Теорема 3.14. Тождественно по х, у выполнено равенство
tn(x + у) = tn(x)t0(y) + Д-ДтДДД Н--h t0(x)tn(y)
о Для п = 0 равенство, очевидно, выполнено. Предполагая, что оно
выполнено при п = к — 1, установим его справедливость для п = к.
Умножая поочередно на х и у обе части равенства
Д-1(т + у) = Д-1(т)^оЫ н---h ^о(ж)Д-1(д)
ввиду (3.9) представим ж Д_Дж + у) и ytk_i(x + у) как
кtk(x)t0(y) + (к - 1)Д_Дж)Д(Д +.....+ 1 Д(ж)Д_ДД и
1Д-1(т)Д(Д Н-----h (к - 1)Д(т)Д_1(Д + kt0(x)tk(y)
5) Taylor, Brook (1685-1731) — английский математик
3.9. ПРОИЗВОДНАЯ ПОЛИНОМА
37
соответственно. Складывая представления почленно, еще раз пользу-
ясь (3.9) и сокращая на к, мы завершаем индукционный переход.
Замечание. Доказанное тождество, записываемое как
(х + у)п = У -^хкуг = У Р )хкуп-к = У Скхкуп~к,
k+r=n ’ ’ fc=0 4 7 fc=0
обычно называют формулой бинома.
3.9 Производная полинома
Определение. (Первой) производной полинома р = S называется
полином р' = S Cktk-i- Производная натурального порядка т определя-
ется индуктивно: если рС1-1) = q, т0 р("0 = Д
Из этого определения немедленно следуют соотношения
t<p = t„_m, (ap)w = ар<-т\ (р + 9)<го) = p(m) +
Теорема 3.15. Для всякого полинома р и произвольных комплексных
чисел а и h выполнено тождество Тейлора
р(а + h) = S p(m\a)tm(h) (3.10)
т^О
о Пусть р = S Cktk- Согласно Теореме 3.14 и определению производ-
ной, справедливы равенства
р(а -|- h) S Cktk(a -I- h) S Ck S tk—m(cb)tm(h)
k^O k^O m^O
= S tm(h) S cktk-m(a) = S tm(h)p^m\a).
m^O k^Q m^O
Тождество (3.10) доказано. <з
Формула Тейлора позволяет получить эффективный признак кратно-
сти корня полинома.
Теорема 3.16. Кратность а как корня полинома р равна т тогда и
только тогда, когда выполнены условия
р(а) = р(а) = = р(т-1)(а) = 0; р(т\а) ф 0.
38
ГЛАВА 3. ПОЛИНОМЫ
о Введем полиномы г и q следующими равенствами
Ф) = s P(fc)W; Ф) = s ——ту---------------------р^к\а).
к<т К'. к^т к\
Полагая в (3.10) h = z — a^ получаем равенство p(z) = (z — a)mq(z)-\-r(z).
По Теореме 3.11, число а является корнем кратности т полинома р, если
и только если г = 0 и q(a) ф 0. Ввиду равенства q(a) = p(m\a)/m!, эти
требования равносильны условиям теоремы. <з
Следствие. При дифференцировании полинома кратность каждого его
корня уменьшается на единицу.
Из формулы Тейлора нетрудно получить правило Лейбница6) диффе-
ренцирования произведения полиномов.
Теорема 3.17. Производная (pq)^ произведения полиномов р и q мо-
жет быть найдена по «формуле бинома» (pq)^ = S (^)p^q^m~k\
k=Q
о Применяя поочередно формулу Тейлора к р и q, получаем равенства
р(а + h) = S Р^^а)^-- q(a + h) = S фф)-?-
k'. r^o г!
Перемножая их почленно, находим для полинома pq представление
(рфа + Д) = S tm(h) 7гЛ(г)
т^О , k'.rl
k+r=m
Согласно теореме единственности для полиномов и тождеству (3.10),
k+r=m
что и требовалось. <з
Следствия.
1. Для полиномов р и q выполнено равенство (pq)1 = p'q + pq'.
6) von Leibniz, Gottfried Wilhelm (1646-1716) — немецкий математик и философ
3.10. ЗАДАЧИ
39
2. Имеет место равенство (щ -рп)' = S (• • -рг_др'гРг+1''' )•
3. Для любого р выполнено равенство (рпУ =
Упражнение. Докажите эти следствия.
В заключение раздела обсудим возможность понижения степени поли-
нома в уравнении р(г) = 0 с сохранением корней уравнения. Следующая
теорема содержит конструктивное решение этой задачи.
Теорема 3.18. Если полином w таков, что р = w gcd(p',p), то все
корни w простые, а уравнения p(z) = 0 и w(z) = 0 равносильны.
о Пусть p(z) = (z — Zi)mi (z — zs)ms. Введем взаимно простые поли-
номы q(z) = (z — Zi) (z — zs) и s(z) = S тпь П (z — Zj).
k jAk
Корни полинома q простые и уравнение q(z) = 0 равносильно уравнению
p(z) = 0. Пусть d(z) = (z — Zt)7711-1 (z — Zg)7713-1, тогда p = dq и p' = ds.
Поскольку q и s взаимно просты, gcd(p',p) = d, так что w = q. <i
3.10 Задачи
1. Докажите, что всякий полином либо взаимно прост с неприводимым
полиномом, либо делится на него.
2. Докажите, что если два нормализованных полинома неприводимы, то
они либо взаимно просты, либо совпадают.
3. Докажите, что если произведение делится на неприводимый
полином </, то один из сомножителей делится на q.
п— 1 „ ,
4. Вычислите сумму X ctg —.
k=i 71
2m • —2 k
5. Покажите, что при всех натуральных т число 3 X sin 2 2Д+1 также
является натуральным и кратным 8.
6. Пусть е — ехр(г^), где п Е IV. Упростите выражение
В = 1 + 2ek + 3s2fc + + п^п~^к,
считая число к целым и таким, что ек ф 1.
40
ГЛАВА 3. ПОЛИНОМЫ
7. Вычислите суммы Ап — Е Сзк, Вп — Е Сзк+2, Сп — Е Сзк+1.
к^О к^О к^О
8. Найдите каноническое разложение действительных полиномов
х2п — 1, x2n+1 — 1, x2n+1 + 1, х2п + 1.
9. Вычислите произведения П/Й sin ПЙ cos П£=1 sin
О" сод к7Г II"1 con (2fc+1)7r- | Г 1 nin (2fc + 1)7r
1 lfe=l cos 2n+l’ 1 lfc=0 C0S 4n ’ 1 lfc=0 Sln 4n •
10. Пусть степень полинома f меньше n и hq, ..., an-i — вершины правиль-
ного n-угольника, вписанного в окружность с центром а.
Докажите, что ± Е f(am) = f (а).
т=0
11. Для каких пар натуральных чисел {т; п} полином p(z) — (z + l)n — zn — 1
делится на полином q(z) — (z2 + z + l)m?
12. Верно ли, что если полином Р(г) = f(zn) (где f — некоторый полином)
делится на z — 1, то он делится и на zn — 1?
13. Докажите, что строго положительный на IR нормализованный полином
представйм суммой квадратов двух действительных полиномов.
14. Верно ли, что корни действительного полинома z2 + pz + q лежат в от-
крытом единичном круге тогда и только тогда, когда точка (р, <?) при-
надлежит треугольнику |р| — 1<д<1?
15. Покажите, что если все корни полинома f принадлежат выпуклому мно-
гоугольнику Р, то корни всех его производных f№) также принадлежат
многоугольнику Р.
16. При каком выборе действительного полинома q все корни полинома
р(х) = 1 + х + х2 + x3q(x) действительны?
Глава 4
Конечномерное пространство
Оболочка. — Полнота. — Конечномерность. — Независимость. —
«Прополка». — Теорема о замещении. — Базисы. — Размерность.
— Координаты. — Формула размерностей. — Признаки базисно-
сти. — База набора. — Ранг набора.
4.1 Полнота и конечномерность
Определение линейного пространства приведено на стр. 9. Если в нем
под скалярами понимать элементы поля (С, то придем к понятию ком-
плексного линейного пространства. В случаях, когда выводы теории
справедливы вне зависимости от поля скаляров, будем употреблять для
этого поля «нейтральное» обозначение S.
Определение. Набором {61, ..., bk} называют всякое конечное упоря-
доченное множество элементов bj линейного пространства.
Определение. Оболочкой набора {61, ..., bk} называется подпростран-
ство span{6i, ..., bk} = {/3ibi + + fikbk /3j £ S}. Элементы оболочки
называют (линейными) комбинациями векторов bj.
Определение. Комбинация /3^ + + fikbk нулевая, если ее значение
— нуль, эта комбинация тривиальна, если /31 = = Д = 0.
Определение. Набор {сд, ..., сд} элементов пространства X полон, ес-
ли span{ci, ..., Ck} = X.
Замечание. Очевидно, полнота набора сохраняется при перестановке его элемен-
тов и добавлении в набор новых элементов.
41
42
ГЛАВА 4. КОНЕЧНОМЕРНОЕ ПРОСТРАНСТВО
Определение. Пространство конечномерно, если в нем можно найти
полный набор элементов.
Упражнение. Докажите, что сумма двух конечномерных подпространств
произвольного линейного пространства конечномерна.
4.2 Независимость
Определение. Набор {«i, ..., аг} независим, если всякая нулевая ком-
бинация его элементов тривиальна.
Замечание. Очевидно, что независимый набор не может содержать нулевого эле-
мента, что его независимость сохраняется при перестановке элементов и что всякий
поднабор независимого набора также независим.
Теорема 4.1 (критерии независимости). Пусть {a-i, .ап} — набор
элементов, Sr = span{ai, ..., ar}, a <S0 — одноточечное подпростран-
ство {$}.
Следующие утверждения равносильны:
(а) набор {cii, ..., ап} независим;
(Ь) никакой элемент не принадлежит оболочке остальных;
(с) все компоненты флага So Сп различны.
о Доказательство следует схеме (а) =^> (6) =^> (с) =^> (а).
(а) =^> (6) Если ar = Xjaj, то, взяв Xr = —1, получим нетривиаль-
ную нулевую комбинацию Е XjUj = 0.
(6) =^> (с) Если So = Si, то набор {щ, ..., аг} содержит нулевой эле-
мент ai. Если Sk-i = Sk для некоторого k > 1, то (щ е span{ai, ..., ak-i}.
Следовательно, So cz cz <S2 cz cz Sn.
(с) =^> (а) Пусть Aifti + + Xnan — какая-то нетривиальная нулевая
комбинация элементов набора {щ, ..., ап] и Хг — последний ненуле-
вой коэффициент. Тогда Ахоц + + Xrar = 0 и ar е так как
ar = yitti Т Т yr—iar—i, где jij = —XjlXr. Следовательно, предполо-
жение о существовании нетривиальных нулевых комбинаций приводит
к совпадению Sr \ и Sr.
4.2. НЕЗАВИСИМОСТЬ
43
Флаг <S0 с <Si с <S2; порождаемый независимым набором {щ а2}
Определение. Набор {«i, ..., ап} будем называть зависимым, если он
не является независимым набором.
Теорема 4.2 (критерии зависимости). Пусть {a-i, ..., ап} — некоторый
набор элементов, <Sr = span{ai, ..., ar}, a <S0 = {$}. Следующие выска-
зывания равносильны:
(а) набор {cii, ..., ап} зависим;
(Ь) некоторый элемент принадлежит оболочке остальных;
(с) либо ui = 0, либо один из элементов набора является комбинацией
независимых предыдущих.
о Каждое из предложений (а), (Ь), (с) представляет собой отрицание
соответствующего предложения предыдущей теоремы. Если равносиль-
ны предложения, то равносильны и отрицания этих предложений.
Теорема 4.3 (о «прополке»). Если набор {«i, .ап} содержит хо-
тя бы один ненулевой элемент, то из этого набора можно выделить
независимый поднабор с той же оболочкой.
о Воспользуемся индукцией по числу элементов набора. Рассмотрим
флаг <S0 (см. формулировку Теоремы 4.1). Начиная с
г = 0, сравниваем <Sr и <Sr+i. При совпадении подпространств удаляем
из набора элемент аг+1 и переходим к поднабору с той же оболочкой, но
44
ГЛАВА 4. КОНЕЧНОМЕРНОЕ ПРОСТРАНСТВО
с меньшим на единицу числом элементов. Процесс остановится, когда
все компоненты очередного флага будут различными.
Определение. Примененный в доказательстве теоремы алгоритм бу-
дем именовать прополкой заданного набора.
Теорема 4.4 (о замещении). Пусть {сд, сп} — полный набор эле-
ментов. Для независимого набора {оц, ..., ат} выполнено неравенство
т ^п, причем в случае строгого неравенства можно построить пол-
ный независимый набор {оц, ..., ат }, пополнив набор {оц, ..., ат}
элементами набора {ci, ..., сп}.
о Поместим в начало полного набора последний элемент независимо-
го. Набор {amci, ..., сп} зависимый, поскольку ат принадлежит обо-
лочке остальных элементов набора. Так как ат Ф 0, «прополка», остав-
ляя ат в наборе, с необходимостью удаляет из него по меньшей мере
один из элементов Cj. В результате мы получаем полный независимый
набор {ат, ..., } с числом элементов не большим п. Выполняя эти
действия т раз, мы приходим к полным независимым наборам
... }
... }
t«i«2........ J
в каждом из которых не больше, чем п элементов и в каждый из которых
(кроме, возможно, последнего) обязательно входят какие-то Cj.
Следствие. Произвольное подпространство Хо конечномерного про-
странства X само конечномерно.
о Если Хо = {0}, теорема доказана. Иначе, произвольный независи-
мый набор элементов Хо не полон и его можно неограниченно увеличи-
вать, что противоречит теореме.
4.3 Базис и размерность
Определение. Пространство X называется тривиальным или нуле-
вым, если оно состоит только из нулевого вектора, иначе его называют
нетривиальным.
4-3. БАЗИС И РАЗМЕРНОСТЬ
45
Определение. Набор элементов пространства X называется базисом
этого пространства, если он одновременно полон и независим.
Теорема 4.5. В нетривиальном конечномерном пространстве X суще-
ствует базис.
о По определению конечномерного пространства, в X существует пол-
ный набор элементов {щ, ..., сп}. По крайней мере один из этих элемен-
тов отличен от нуля, иначе пространство X тривиально. Следовательно,
процессом «прополки» из набора {щ, ..., сп] с оболочкой X можно вы-
делить независимый поднабор {61, ..., bm] с той же оболочкой X, т. е.
базис X. <]
Теорема 4.6 (о дополнении). Каждое подпространство Хо конечномер-
ного пространства X обладает дополнением, т. е. существует подпро-
странство Xi такое, что X = ХоФХь
о Если Хо тривиально, то Xi = X, если Хо = X, то Xi = {0 }. Иначе
пусть X = span{ci, ..., сп} и пусть {щ, ..., ат} — базис Хо- По Теоре-
ме 4.4, набор {«1, ..., ат] можно дополнить элементами полного набора
{ci, ..., сп} до базиса {щ, ..., ат, 6Х, ..., br} пространства X.
Положим Xi = span{6i, ..., br] и проверим, что имеет место разложение
X = Хо Ф Xi. Подпространства Хо и Xi дизъюнктны, так как, ввиду
независимости набора {«i, ..., am,bi, ..., br}, из равенства
О = + + Amtzm) + (д1^1 + + yrbr)
следует, что обе комбинации тривиальны. Далее, произвольный эле-
мент х пространства X является линейной комбинацией элементов пол-
ного набора {<21, ..., am,bi, ..., Ьг}:
х = cii(2i Т Т остат + (3\b\ Т Т /3ГЬГ =
= ((41(21 + + CEm(2m) + (/3161 + + firbr) = Xq + Xi ,
где Xj — элемент Х7. <i
Теорема 4.7. Все базисы линейного пространства состоят из одного
и того же числа элементов.
о Пусть {<21, ..., ат} и {61, ..., Ьп} — два произвольных базиса в X.
Поскольку набор {«i, ..., ат} независим, а набор {61, ..., bn} полон, то
согласно Теореме 4.4, т п. Аналогично, п т.
46
ГЛАВА 4. КОНЕЧНОМЕРНОЕ ПРОСТРАНСТВО
Определение. Общее для всех базисов конечномерного пространства X
число их элементов называется размерностью X и обозначается dim X.
Размерность тривиального пространства, по определению, равна нулю
(его несуществующий базис «насчитывает» 0 элементов). Говорят, что
пространство X п-мерно, если dimX = п.
Пример. Размерность действительного пространства С равна двум, а
размерность комплексного пространства (С — единице.
Теорема 4.8. Всякий элемент х пространства X с базисом {61? ..., bn}
однозначно представйм линейной комбинацией
x = f31(x)b1-\--\-(Зп(х)Ьп. (4.1)
о Представление х = Дбх + + /ЗпЬп возможно ввиду полноты базиса,
предположение о существовании другого представления
ж = /3^61 + + б'пЬГ1
приводит к нетривиальной нулевой комбинации £ (/3'- — /37) bj. <i
Определение. Числовая функция (3j в равенстве (4.1) называется j-й
координатной функцией в базисе {61? ..., bn}, а ее значение /37(т) — j-й
координатой элемента х в этом базисе.
Теорема 4.9. Пусть X = ХафХь и {щ, ..., ат], {61? ..., bn} — бази-
сы соответствующих подпространств. Тогда {щ, ..., am,bi, ..., bn} —
базис пространства X.
о Произвольный элемент х е X однозначно представйм в виде
х = "Г хь = сдщ X X атат X /Зх^х X X /3rbr.
Следовательно, во-первых, набор {щ, ..., am,bi, ..., bn} полон, а во-
вторых, элемент 0 представйм только тривиальной комбинацией.
Следствия (о прямых суммах).
1. Размерность прямой суммы равна сумме размерностей прямых
слагаемых: dim(Xa®Xb) = dimXa X dimXfe.
2. Если Хх, Х2 — дизъюнктные подпространства пространства X и
dim Хх X dim Х2 = dim X, то Хх Ф Х2 = X.
44- ПРИЗНАКИ БАЗИСНОСТИ
47
Замечание. Эти свойства без труда переносятся на прямые суммы произвольного
числа слагаемых.
Теорема 4.10 (размерность суммы). Если конечномерное пространст-
во X является суммой своих подпространств U иУ, то
dimX = dimZ7 + dim У — dim(Z7 п У)
о Пусть }У = U rZ vi Z z у дополняет УУ до подпространства У.
Докажем дизъюнктность пространств U и Z.
Из представления нуля суммой 0 = и + z элементов из U и Z видно,
что и = (—z) е Z с= У, т. е. и е U п У. Таким образом, представление
О = и + z является разложением нуля в сумму элементов дизъюнктных
подпространств УУ и Z, что возможно только при условии и = z = 0.
Покажем теперь, что произвольный элемент х е X можно представить
суммой элементов из U и Z. По условию, х = и + v, где и е Z7, и е У. По
построению, v = w + г, где w е УУ, z е Z. Значит, х представим суммой
и + (w + z) = й + г, где й = и + w е U.
К выводу формулы для размерности суммы
Итак, выполнены равенства % = U@Z nV = W®Z. Вычисляя размер-
ности участвующих в них пространств, приходим к равенствам
dimX = dimZ7 + dimJ3; dim У = dim W + dim Z .
Остается исключить из них размерность пространства Z.
4.4 Признаки базисности
Теорема 4.11. Если {щ, ..., ak} — набор элементов конечномерного
пространства X, то любые два из следующих предложений влекут
третье:
48
ГЛАВА 4. КОНЕЧНОМЕРНОЕ ПРОСТРАНСТВО
(а) к = dim X;
(b) набор {cii, ..., Ok} независим;
(с) набор {cii, ..., Ok} полон.
о Покажем, что (а) л (Ь) => (с). По условию (а), базис X насчитывает
к элементов. Если набор {щ, ..., ак} неполный, существует вектор
не входящий в span{cii, ..., ак}. Но тогда {щ, ..., щ+1} — независимый
набор, в котором элементов больше, чем в базисе X. Согласно Теоре-
ме 4.4, это невозможно.
Истинность импликации (Ь) л (с) => (а) прямо следует из определения
базиса.
Проверим, что (с) л (а) =^> (Ь). Если набор {щ, ..., Ок} зависим, по тео-
реме о «прополке», из него можно выделить полный независимый (т. е.
базисный) поднабор с меньшим числом элементов. Но, ввиду (а), всякий
базис X может состоять только из к элементов.
Следствия (признаки базисности).
1. Полный набор с числом элементов, равным размерности простран-
ства, является базисом этого пространства.
2. Независимый набор с числом элементов, равным размерности про-
странства, является базисом этого пространства.
4.5 База набора и его ранг
Определение. Набор элементов b а = {«i, ..., ат} называется базой
набора а, если span(b) = span(a) и набор b независим. Иными словами,
база набора — это базис его оболочки, составленный из элементов это-
го же набора. База называется канонической, если всякий не вошедший
в нее ненулевой элемент набора а принадлежит оболочке предшествую-
щих ему элементов базы.1)
Замечание. Из сказанного следует, что во всех базах набора одинаковое число
элементов и что каноническая база определяется заданным набором однозначно.
Определение. Рангом набора {«i, ..., ат} называют размерность его
оболочки span{cii, ..., ат}.
!) Именно такова база, получаемая из набора а «прополкой».
4-6. ЗАДАЧИ
49
Очевидно, ранг набора равен числу элементов в любой его базе.
Определение. Элементарными преобразованиями набора называют
(1) добавление/удаление нулевого элемента;
(2) перестановку элементов;
(3) умножение одного из элементов на ненулевой скаляр;
(4) замену элемента его суммой с другим элементом.
Теорема 4.12. При элементарных преобразованиях ранг набора сохра-
няется.
о Покажем, что при элементарных преобразованиях сохраняется обо-
лочка набора {ai, ..., ат}. Для первых трех преобразований это оче-
видно. Для замены aj = Uj + (Д проверим равенство
span{cii, ..., aj ...} = span{cii, ..., a,j ...}.
Элемент оболочки исходного набора может быть записан как
+ Ajtij + Afctifc + =
= + АДсд- + Ok) + (Afc — Aj)afc + =
= + XjOj + Afctifc + ,
т. e. он принадлежит оболочке преобразованного набора.
Аналогично, так как произвольный элемент оболочки преобразованного
набора может быть приведен к виду
' ' ' + [LjUj + Цк^к + = + /lj(aj + + ДаДА; + =
= ' ' ' + /IjUj + (/Zj + Дк)<^к + = + fJ,jUj + Hkd’k + ' ' ' ,
то он принадлежит оболочке исходного набора.
4.6 Задачи
1. Постройте базис пространства всех действительных многочленов р, сте-
пень которых ниже п и таких, что р(1) = pz(0) = 0.
2. Пусть а, b — различные действительные числа, Раь — пространство дей-
ствительных многочленов р таких, что degp < п и р(а) = р(Ь). Найдите
dimPab, указав при этом какой-либо базис пространства Раь-
50
3.
4.
5.
6.
7.
8.
9.
10.
11.
ГЛАВА 4. КОНЕЧНОМЕРНОЕ ПРОСТРАНСТВО
Покажите, что полиномы щ, ..., рп, заданные равенствами
Pk(z) = ---{z- zk_2){z - Zk-i^Z - zk+1)(z - zk+2)
(где z\, ..., zn — различные комплексные числа), образуют независи-
мый набор в комплексном пространстве Рп, состоящем из всевозможных
полиномов степени меньшей п.
Пусть Xk(z) — pk(z\/pk(zk), где рк — полиномы, введенные в предыду-
щей задаче. Покажите, что Лх, ..., Хп — базис линейного пространства
Рп — {р : degp < п} и найдите координаты полинома / Е Рп в
этом базисе.
Постройте полином f минимальной степени так, чтобы при при всех
0 к < п выполнялось равенство f(k} — 2к.
Постройте полином f минимальной степени так, чтобы при при всех
1 к п выполнялось равенство /(&) = 1/к.
Некоторый полином f степени меньшей п в точках 1, ..., п принимает
целые значения. Верно ли, что / : Z —> Z ?
Полином / степени п в точках 0, I2, 22, ..., п2 принимает целые значе-
ния. Верно ли, что /(А;2) Е Z при всех целых к?
Найдите полином /, если deg f < п и при всех 1 к п выполнены
равенства /(ехр(г^)) = к.
Пусть p{z) — (z — Hi) (z — an), где числа щ,..., an различны. Для
каждого т из множества {0,..., п} найдите значение суммы
Пусть Рп — {/ : deg / < п} и р, q — произвольно заданные полиномы.
Вычислите размерность пространства С — {ар + bq : а, b Е Рп}.
Глава 5
Полиномиальные разложения
Теорема о разложении. — Полиномиальное разложение единицы.
— Рациональные функции. — Разложение на простые дроби. —
Разложение на простейшие дроби.
5.1 Теорема о разложении
Теорема 5.1. Пусть полиномы q±, qs попарно взаимно просты,
а полиномы Q и Qr определены равенствами Q = q± qs, Q = qrQr
(1 < r s). Произвольный полином p степени, меньшей degQ, мо-
жет быть представлен, и притом единственным образом, комбина-
цией р = aiQi + + asQs, в которой либо deg Uj < deg qj, либо Uj = 0.
о Выделим в пространстве Pq полиномов степени меныпей deg Q под-
пространство Pj полиномов, кратных Qj. Один из базисов Pj образован
полиномами bij (г) = zlQj(z), где 0 < i < degc/j. Поэтому dim Ру = deg с/j.
Проверим дизъюнктность подпространств Pj. Пусть нулевой полином
представлен комбинацией 0 = a±Qi + + asQs. Все отличные от OjQj
слагаемые правой части кратны qj, следовательно, OjQj также делит-
ся на qj. Если полином aj ненулевой, то он (ввиду взаимной просто-
ты qj и Qj) кратен qj, что противоречит условию deg Оу < degQj. Тем
самым, разложение нуля по подпространствам Pj тривиально. Дизъ-
юнктность подпространств Pj установлена. Подсчитаем размерность их
прямой суммы: dim ф Pj = Е dim Ру = Е deg qj = degQ = dimP^. Та-
ким образом, Pq = Pi ф Ф P.s (см. Следствие 2 на стр. 46). <з
Следствие. В частности, полиномами q-i,... ,qs однозначно определе-
51
52
ГЛАВА 5. ПОЛИНОМИАЛЬНЫЕ РАЗЛОЖЕНИЯ
ны полиномы Uj такие, что (aj Ф 0) =^> (deg a? < degtp) и 1 = £ pQ.j-
Определение. Тождество 1 = £ pj, в котором pj = OjQj будем на-
зывать полиномиальным разложением единицы, порождаемым попарно
взаимно простыми полиномами qr.
Теорема 5.2. При г j полином pi делится на qj.
о По определению, pi = UiQi, а полином Qi делится на qj. <i
Теорема 5.3. При г j имеют место сравнения
PiPj = 0 (mod Q) и р2 = pj (mod Q).
о Действительно, PiPj = Pi(ajQj) = 0 (mod Q), поскольку множитель,
дополняющий Qj до Q, присутствует в полиноме pi. Для проверки вто-
рого сравнения достаточно, умножив нар7 обе части равенства £ pi = 1,
сослаться на уже установленное первое.
Пример. Пусть qi(z) = z2 и q2(z) = (z - I)2, тогда Qi = q2 и Q2 = qi-
Как легко проверить, (2z + l)Qi + (3 — 2z)Q2 — 1. Ввиду единственности
разложения, pi(z) — 2z3 — 3z2 + 1 и p2(z) — 3z2 — 2z3.
Докажем теорему о разложении полинома, обобщающую теорему о де-
лении с остатком.
Теорема 5.4. Пусть полиномы q±, ..., qs попарно взаимно просты, а
полиномы Q и Qr определены равенствами
Q = qi---qs, Q = qrQr (i^r^s).
Произвольный полином Р может быть представлен и притом един-
ственным образом в виде комбинации Р = aQ + a±Qi + + asQs, в
которой либо degaj < degqj, либо Uj = 0.
о По теореме о делении с остатком, полином Р однозначно представим
в виде Р = aQ + р, где либо degp < degQ, либо р = 0. Согласно Теоре-
ме 5.1, полином р, в свою очередь, единственным образом выражается
комбинацией р = a±Qi + + asQs, где degUj < deg qj, либо Uj = 0. <i
5.2. РАЦИОНАЛЬНЫЕ ДРОБИ
53
5.2 Рациональные дроби
Определение. Рациональной дробью называется функция /, предста-
вимая во внешности некоторого круга отношением двух полиномов.
Пример. Отношения и определяют одну и ту же рациональную
дробь, поскольку они совпадают вне круга |г| > 1.
Ясно, что равенства p/q = г/s и ps = qr равносильны.
Определение. Рациональная дробь называется правильной, если в ка-
ком-то представлении (а значит, и во всех) степень числителя меньше
степени знаменателя.
Теорема 5.5. Любая рациональная дробь представима суммой полино-
ма и правильной дроби.
о Деление р на q с остатком дает р = qs + г, т. е. = s + где дробь
правильная.
Теорема 5.6. Пусть полиномы q±, ..., qs — попарно взаимно просты
и в произведении дают полином Q. Для всякого полинома р степени
меньшей deg Q найдется единственный набор полиномов аг таких, что
либо аг = 0, либо degar < deg qr и
о Определим полиномы Qr равенствами Q = qrQr. В соответствии с
Теоремой 5.1 (стр. 51), для всякого полинома р степени меньшей degQ
найдется единственный набор полиномов аг такой, что либо аг = О,
либо degar < deg qr и р = S arQr. Остается разделить обе части этого
равенства на Q.
Следствие. Пусть полиномы р, Q действительны, дробь p/Q правиль-
ная и каноническое разложение Q имеет вид
Q(z) = П(х - а,)”’ П(х2 + (3jZ +
г j
Тогда
p(z) adz} bdz)
= S 7---+ S ~FZ>---------(5-1)
Q(z) i (z - j (z2 + /3jZ + 7^)">
где deg Ui < mi и deg bj < 2nj.
54
ГЛАВА 5. ПОЛИНОМИАЛЬНЫЕ РАЗЛОЖЕНИЯ
Определение. Тождество (5.1) называется разложением рациональной
дроби p/Q на простые дроби над полем R.
Дроби в правой части тождества при необходимости можно подвергнуть
дальнейшему разложению.
Теорема 5.7. Правильная дробь 6(г)/(г2+/3г+7)п представима суммой
дробей вида (Аг + pk)/(z2 + ftz + y)fc, где А, д е R, а к п.
о Если deg b > 2, разделим b(z) с остатком на (г2 + ftz + 7):
b(z) = с(г)(г2 + {3z + 7) + (Xz + д)
Отсюда видим, что (ХХт)" = (гХХ)-1 + (XlX)"' По ИНДУКЦ™
приходим к заключению теоремы. <з
Еще проще доказывается
Теорема 5.8. Правильная дробь a(z)/(z—a)m представима суммой дро-
бей вида v/(z — а)к, где v е R, а к т.
о Для доказательства достаточно разложить полином а (г) по степе-
ням разности (г — а). <1
Следствие. В условиях следствия к Теореме 5.6, выполнено однознач-
но определенное тождество
p(z} тк Пкт nr X Z + п
= Е Е 7---+ Е Е / 9 Q5.2
Q{z) к m=i (г — ак)т г n=i (z2 + (5rz + дД™
Определение. Тождество (5.2) называется разложением правильной
рациональной дроби p/Q на простейшие дроби над полем R.
Замечание. Как мы видим, задача разложения полинома р в комбинацию У arQr
эквивалентна задаче разложения дроби p/Q на простые дроби У ar/qr. В частности,
задача разложения единицы эквивалентна задаче разложения правильной дроби 1/Q
на простые компоненты.
5.3 Задачи
1. Разложите правильную рациональную дробь 4(г 4 на простые сла-
гаемые.
5.3. ЗАДАЧИ
55
2. Разложив соответствующие дроби на простые, постройте разложение
единицы, определяемое полиномами Qi(z) = zn и — (l — z)n сначала
при п — 3, а затем в общем случае.
3. Самостоятельно сформулируйте и докажите теорему о разложении пра-
вильной рациональной дроби на простейшие над полем С.
4. Разложите на простейшие над полем С рациональную дробь
1
22//' _ ]_
5. Разложите ту же дробь на простейшие над полем Л.
6. Разложите на простейшие над полем Л рациональную дробь
(2п)!
z2(z2 + l2)(z2 + 22) (z2 + п2)
7. Разложите ту же дробь на простейшие над полем С.
Глава 6
Алгебра остатков
Разрешимость задачи интерполяции. — Система Вандермон-
да. — Функциональное исчисление в алгебре остатков. — По-
линомиальная экспонента.
6.1 Конечномерные алгебры полиномов
Пусть Р — алгебра всех комплексных полиномов с «поточечно» опреде-
ленными операциями сложения и умножения. Подпространство Рп по-
линомов степени меньшей п, алгеброй уже не является: результат пе-
ремножения двух полиномов из Рп может «выпасть» из этого подпро-
странства. Обсудим структуру «внутреннего» умножения в Рп, которое
на полиномах малой степени совпадает с обычным. Предположив, что
удалось определить умножение *, превращающее Рп в коммутативную
алгебру Р*, построим п-мерное представление алгебры Р элементами
алгебры Р*, тождественное на Рга, т. е. отображение р р из Р в Р*,
обладающее следующими свойствами:
Р
р + q
ар
РЯ
р на Рп (тождественность)
р + q (аддитивность)
а р (однородность)
р * q (мультипликативность).
(6.1)
Теорема 6.1. Существует нормализованный полином Q такой, что
р = resp (mod Q). Полином Q определен однозначно, причем deg Q = п.
с> Подпространство Р° = {р е Р : р = 0} представляет собой идеал в
56
6.1. КОНЕ ЧНОМЕРНЫЕ А ЛГЕБРЫ ПОЛИНОМОВ
57
алгебре Р. Действительно, по свойству мультипликативности, произве-
дение qpo произвольного полинома q на полином р из Р° принадлежит
подпространству Р°, поскольку qp0 = q*po = q*O = O. В алгебре Р
любой идеал — главный, так что Р° состоит из произведений Q s, где Q
— нормализованный полином, однозначно определяемый рассматривае-
мым отображением Р^>Рп. Из равенства Q = 0 видно, что degQ п,
иначе, из тождественности на Рп следовало бы, что Q = Q / 0. Взяв
p(z) = z‘\ положим q = р—р ф 0. Из (6.1) следует, что q = 0, т. е. q = Q s
и п = deg q = deg Q deg Q + deg s n. Следовательно, deg Q = n. <i
Обратно, пусть задан нормализованный полином Q степени п.
Определение. Для произвольных полиномов pi и /л2 из Рп обозначим
через pi * р2 остаток от деления произведения pip2 на полином Q.
Теорема 6.2. Операция * превращает конечномерное векторное про-
странство Рп в унитальную коммутативную алгебру Pq.
о Очевидны равенства pi*p2 = P2*Pi и 1 *р = р. Остается проверить,
что для произвольных а из С и pj из Р выполнены следующие три
соотношения:
(а) a(pi * р2) = (арД * р2 = pi * (ар2);
(6) (pi * р2) * р3 = pi * (р2 * Рз);
(с) (pi+р2) *Рз = Pi *Рз+Р2 *Рз-
Умножая на а сравнение pip2 = pi * р2, имеем (api)p2 = a(pi * р2),
откуда и следует первое равенство пункта (а). Второе устанавливается
аналогично. Умножая на полином р3 сравнение pip2 = pi * р2 и на pi
сравнение р2р3 = р2 * р3, видим, что (pi * р2)р3 = Р1(Р2 * Рз)- Следо-
вательно, при делении на Q полином (pi * р2)р3 дает тот же остаток,
что и полином pi(p2 *Рз), так что выполнено равенство (6). Складывая
почленно сравнения pip3 = pi * р3 и р2р3 = р2 * р3, получаем сравнение
(pi + р2)р3 = pi * рз + р2 * р3. Поскольку степень правой части меньше,
чем degQ, выполнено равенство (с). <i
Замечание. Построенную алгебру Pq называют фактор-алгеброй алгебры Р по
идеалу QP и обозначают Р/QP. Очевидно, в алгебре Pq (в отличие от алгебры Р)
имеются нетривиальные делители нуля.
58
ГЛАВА 6. АЛГЕБРА ОСТАТКОВ
6.2 Возможность интерполяции
Теперь мы в состоянии установить однозначную разрешимость интер-
поляционной задачи Эрмита, предложив заодно один из способов ее ре-
шения.
Теорема 6.3. Пусть задан набор s точек Xj е (С, каждой из которых
сопоставлены число п? е 1N и полином Tj такой, что deg тд < , либо
Tj = 0. Существует единственный полином h минимальной степени,
дающий при делении на qj(z) = (z — Xj)nj остатки Tj(z).
о Пусть 1 = S pj — разложение единицы (стр. 52), определяемое поли-
номами 71, ..., qs. Обозначив Q = qx- qs, образуем алгебру Pq, после
чего определим полином h равенством h = ^fpi * Поскольку Pi, гi —
элементы алгебры Pq, полином h также ей принадлежит. Найдем оста-
ток от деления h на qj. Используя равенство pj = 1 —Pi, преобразуем
полином h к виду h = pj * щ + X^i^jPi * тд = щ + X^i^jPi * (т\ — rj). По
определению операции *, существуют полиномы Sij такие, что
Pi (р ~ rj) = so qi--qs + Pi* (п - щ).
Согласно Теореме 5.2, при i ф j полином pi делится на qj, следовательно,
при i ф j все полиномы pi * (тд — тд) также кратны qj. Тогда, как это
видно из равенства h = тд + YP^jPi * (тд — тд), остаток от деления h
на qj равен щ. Предположим, что h — какой-то другой полином той же
или меньшей степени, дающий заданные остатки щ при делении на qj.
Тогда разность h — h делится на произведение Q этих попарно взаимно
простых полиномов. Но полином h — h степени меньшей deg Q, может
делиться на полином Q только при h = h. <з
Пример. Построим полином h по заданным в точках Ai = 0 и Д-2 = 1 на-
правляющим ri(z) — 3z и r2(z) = z, предполагаемым направляющими первого
порядка. Вначале составляем полином Q(z) — z2(z — I)2. Соответствующее
разложение единицы рассматривалось в примере на стр. 52, где было уста-
новлено, что pi(z) — 2z3 — 3z2 + 1 и P2^z) — 3z2 — 2z3. Вычислим полиномы
Pi * тд и p2 * тд. Разделив произведения p±ri и Р2Г2 с остатком на полином Q,
найдем, что (pi*ri)(z) = 3z3 — 6z2 + 3z, (р2*тд)(^) = 2z2 — z3. В соответствии
с формулой h — £ pj * rj, h(z) — 3z — 4z2 + 2z3.
График сужения полинома h на отрезок [0; 1] представлен на рис. 3.1 (стр. 33)
«средней линией» правой фигуры. Эта фигура заполнена графиками полино-
мов с теми же направляющими, но степени на единицу большей, чем deg h.
6.3. СИСТЕМА ВАНДЕРМОНДА
59
6.3 Система Вандермонда
Остановимся вкратце на вычислительной стороне интерполяции. Как и
выше, А1, ..., Xs — различные числа, qj(z) = (д — Xj)nj , где ni, ..., ns
— заданные натуральные числа и пусть Q = q^- qs. Как было уста-
новлено в предыдущем разделе, существует единственный полином h
степени, меньшей deg Q, дающий при делении на полиномы qj заданные
остатки Vj. Тождество Тейлора, записанное в виде суммы
h(z) = £
к<п
у.к ЛЯ(А).
тН(г-А)
показывает, что остаток г (г) от деления h(z) на (г — Х)п равен первому
слагаемому этой суммы, так что г^(А) = Д^(А). Поэтому Теорема 6.3
может быть переформулирована следующим образом.
Теорема 6.4. Пусть Ai, ..., A.s — комплексные, a ni, ..., ns — нату-
ральные числа. Полином h степени deg h < + + ns однозначно
восстанавливается по значениям r^\Xj), где (0 А; < п?, 1 J s).
Пусть ni + + ns = п. Обозначим через хт неизвестные коэффициенты
полинома h(z) = £ xmzm. Дифференцируя к раз это равенство, для
каждой из точек z = Xj, (1 < j s) получаем nj линейных уравнений
S = = (0 ^/.< »,) (6.2)
т<п
Определение. Так построенную по направляющим г±, ..., rs систему
из п линейных уравнений с п неизвестными мы будем называть систе-
мой Вандермонда.1)
Как следует из Теоремы 6.4, система Вандермонда всегда совместна и
решение ее единственно.
Пример. Обратившись к примеру предыдущего раздела, еще раз построим
полином Эрмита h(z) по направляющим ri(z) — 3z и r2(z) = z, заданным
в точках Ai = 0 и А2 = 1 соответственно. Поскольку Д(А1) = О, Л/(А1) = 3,
ДА2) = ЛДА2) — 1, система Вандермонда выглядит так:
r CgА?х0 + CPAjxi + CgX^x2 + CgX^x3 = О
C'jAjxi + С^Х}х2 + С^х3 = 3
" С0°А^0 + ДДх! + С2°А^2 + С3°А^з = 1
С, А2®1 + С2Х2Х2 + СзА2®з = 1
i) Vandermonde, Alexandre-Theophile (1735-1796) — французский музыкант и ма-
тематик
60
ГЛАВА 6. АЛГЕБРА ОСТАТКОВ
Так как Ai = 0, из первых двух уравнений сразу же находим xq — 0, х± — 3.
С учетом равенства А2 = 1, система упрощается к виду
\ х2 + х3 - -2
1 2х2 + Зхз — —2
позволяющему, легко определив значения х2 — —4, х3 — 2, заключить, что
полином Эрмита h(z) равен Е xmzm — 3z — 4z2 + 2z3.
6.4 Функциональное исчисление
Пусть 42 — открытое (не обязательно связное) подмножество плоско-
сти (С. Понятие производной от функции f : 42 —> (С вводится в ком-
плексном анализе в полной аналогии с соответствующим понятием дей-
ствительного анализа.
Нам понадобятся всего два фундаментальных положения комплексного
анализа.
Теорема 6.5. Функция f : 62 (С, дифференцируемая в каждой точке
открытого множества 62, бесконечно дифференцируема в 62 .
В дальнейшем такие функции мы будем называть регулярными в 62.
Теорема 6.6. Пусть функция f : 62 62 регулярна. Для произвольных
п е 1N и Хе 62 найдется регулярная в 62 функция v такая, что
f(z) = S f (fc)(A) tk(z - A) + (z - X)nv(z),
k<n
где tk — мономы Тейлора.
Если функции f и g регулярны в 42, то функции fg и af + (5 g также ре-
гулярны. Поэтому регулярные в 42 функции образуют (коммутативную)
функциональную алгебру 7Г(42).
Замечание. Алгебра J7( 42) может содержать нетривиальные делители нуля. Пусть
42 = (С\К, а / и g — индикаторы2) верхней и, соответственно, нижней открытых по-
луплоскостей. Очевидно равенство fg = 0, тогда как f и g — ненулевые элементы
алгебры J7(42).
2) индикатор множества М — функция, равная единице на М и нулю вне М.
6-4- ФУНКЦИОНАЛЬНОЕ ИСЧИСЛЕНИЕ
61
Следующее предложение обобщает теорему о делении с остатком.
Теорема 6.7. Пусть все корни полинома Q(z) = (г — Ai)ni (г — Xs)ns
лежат в Q. Произвольная функция f е Т-’(С) однозначно представима
суммой вида q + Qu, где и е Т-’(С) и q — полином такой, что либо
deg q < degQ, либо q = 0.
о Пусть f = qi + Qui (г = 1, 2). Положим q = щ — q2, и = z/2 — и±, тогда
q = Qu. Из формулы дифференцирования произведения следует, что
= 0 при к < Hj, так что (по признаку делимости) q делится
на каждый из полиномов (г — XQnj и, в итоге, на Q. Следовательно,
q = 0. Единственность представления установлена. Для доказательства
его существования по направляющим
k<TLj
построим полином Эрмита h. Согласно Теореме 6.6, найдется регуляр-
ная в С функция Uj такая, что f(z) = rj(z) + (z — Xj)njUj(z). По определе-
нию полинома Эрмита, h(z) = Tj(z) + (z — Xj)njSj(z), где Sj — некоторый
полином. Обозначим g = f—h, тогда g(z) = (z — Xj)njVj(z), где Vj e T-’(C).
Определим полиномы Qj равенствами Q(z) = (z — Xj)njQj(z). Умножая
на g обе части разложения единицы 1 = 2 UjQj, приходим к тождеству
f = h + Qu, где функция и = Е UjVj регулярна в С. <з
Пусть 7Г(Г2) — функциональная алгебра регулярных функций и Р* —
конечномерная коммутативная алгебра полиномов с операциями «+»
(обычного сложения) и «*» (некоторого умножения).
Определение. Под функциональным исчислением понимается отобра-
жение 7Г(С)^»Р* такое, что для любых /, g из 7ДС) и си, (д из С спра-
ведливы равенства
/ = f при f е Р* af = a f f + g = f + p fg = f *g
Теорема 6.7 позволяет легко построить функциональное исчисление, ис-
ходя из заданного полинома с корнями в С. Именно, достаточно, по-
ложив f = q в представлении f = q + Qu, определить «умножение»
полиномов формулой р * q = res(pg) (mod Q).
Замечание. Как можно показать (см. ниже раздел Задачи), всякое функцио-
нальное исчисление задается некоторым нормализованным полиномом Q с корнями,
лежащими в открытом подмножестве fl Q (С и сопоставляет каждой регулярной в 11
функции f полином Эрмита /, построенный по направляющим, структура которых
вполне определяется функцией f и полиномом Q.
62
ГЛАВА 6. АЛГЕБРА ОСТАТКОВ
6.5 Полиномиальная экспонента
Функциональное исчисление позволяет механически переносить адди-
тивно-мультипликативные соотношения из алгебры Т-’(С) в фактор-
алгебру VfQP. Например, для полиномов sin и cos будет выполнено
соотношение sin + cos = 1 (mod Q). Рассмотрим семейство регуляр-
ных функций еДд) = exp(tz). Очевидно, eset = es+t, так что семейство
полиномов et обязано обладать групповым свойством
eset = es+t (mod Q).
(6.3)
Определение. Семейство полиномов z i—> et(z) назовем полиномиаль-
ной экспонентой, заданной полиномом Q.
Пример. Построим экспоненту, заданную полиномом Q(z) — z2 + cj2, где
cj > 0. Исходя из факторизации Q(z) — (z + iw)(z — ш), находим разложение
единицы: 1 = ^j(z + icz) + ^j(z-icz) = p+(z)+p-(z). Направляющие (нулевого
порядка) — это значения функции et(z) = exp(t^) в точках +zcj. Следователь-
но, et(z) = p+(z)elcvt + P-(z)elcvt = sincjt + coscjt. Обычная экспонента et(z)
обладает следующими свойствами:
e0(z) = 1; et(z) = zet(z); es(z)et(z) = es+t(z).
Убедимся в наличии аналогичных свойств у полиномиальной экспоненты
ёДг) = sincjt + coscjt
Действительно, очевидно, что ёо(^) = 1. Далее,
z et(z) — щ(^) = sincjt + cj sincjt = sincjt (z2 + cj2) = 0 (mod Q),
Поэтому ^et(z) = zet(z). Проверим свойство (6.3). С одной стороны,
es+t(z) — (sincjs coscjt + coscjs sincjt) + coscjs coscjt — sincjs sincjt.
С другой стороны, раскрывая скобки в произведении es(z) et{z), имеем
es (z) Q (z) — ^2 sin cjs sin cjt + (sin cjs cos cjt + cos cjs sin cjt) + cos cjs cos cjt.
Вычтя первое равенство из второго, придем к сравнению
es{z) e.i{z) — es+i(z) — sincjs sincjt {z2 + cj2) = 0 (mod Q).
6.6. ЗАДАЧИ
63
6.6 Задачи
1. Укажите задаваемое полиномом Q(z) — (z2 — I)2 разложение единицы
и с его помощью постройте полином Эрмита по направляющим первого
порядка r±(z) — 2 (z + 1), заданным в точках +1 соответственно.
2. По направляющим первого порядка r±(z) = 2 (z + 1), заданным в точ-
ках z — +1 соответственно, постройте полином Эрмита при помощи
системы Вандермонда.
3. Найдите экспоненту щ(г), заданную полиномом Q(z) — z3 — z2. Про-
верьте, что q(z) = zet(z).
4. Пусть У(Г2)—— представление алгебры регулярных в Q функций
элементами конечномерной алгебры Р* полиномов с операциями «+»
(обычного сложения) и «*» (некоторого коммутативного умножения).
Покажите, что существует нормализованный полином Q с корнями в Q
такой, что р* q = res(pq) (mod Q).
Глава 7
Матрицы
Основные типы матриц. — Сложение и умножение матриц. —
Идемпотентные матрицы. — Блочные матрицы. — Простейшие
матричные уравнения. — Обратная матрица. — Запись линейных
систем. — Эквивалентные преобразования.
7.1 Начальная терминология
Определение. Пусть т, п — натуральные числа. Матрицей А размера
т х п с элементами = aij из поля скаляров S называется функция
А : {1... т} х {1... п} —> S.
Определение. Матрица размера 1 х п называется строкой длины п, а
матрица размера т х 1 — столбцом высоты т.
Матрицу удобно представлять таблицей
<Дц «12
«21 Q22
О^1п
О^2п
А
Oim2 ' ' ' Oimn
составленной из т строк длины п и п столбцов высоты т. Строки
матрицы А составляют некоторый набор элементов координатного про-
странства Sn, а столбцы Aj — набор элементов координатного простран-
ства S'".
64
7.1. НА ЧАЛЬНАЯ ТЕРМИНОЛОГИЯ
65
Определение. Представление А = [Ах... Ап] называется столбцовой
записью матрицы А.
Определение. Пространством столбцов С(к) матрицы А называется
подпространство span{Ai... Ага} с= S'". Аналогично определяется про-
странство строк 7ДА) матрицы А.
Определение. Матрица О называется нулевой, если все ее элементы
— нули поля S.
Определение. Матрица размера п х п называется квадратной матри-
цей порядка п.
Определение. Числа ац называют диагональными элементами квад-
ратной матрицы А, а их сумму tr А — следом матрицы А.
Определение. Квадратная матрица А называется верхнетреугольной,
если = 0 при i > j, нижнетреугольной, если = 0 при i < j.
Квадратная матрица А называется треугольной1), если она верхнетре-
угольная или нижнетреугольная.
Определение. Квадратная матрица D называется диагональной, если
она верхнетреугольная и нижнетреугольная одновременно.
Определение. Диагональная матрица Е = [Ех Ега] называется еди-
ничной, если каждый ее диагональный элемент — единица поля S. Столб-
цы Ej называют единичными столбцами.
Замечание. Очевидно, С(Е) = 8те, так что набор столбцов {Ех ••• Ете} является
базисом 8те. Это — стандартный базис координатного пространства.
Определение. Подматрицу матрицы А образуют элементы, лежащие
в пересечении выделенных строк с выделенными столбцами и зануме-
рованные в естественном порядке.
Определение. Верхнетреугольная матрица [Gx GJ гауссова, если
из условия Gfc ф Efc, следует, что k-я строка матрицы — нулевая.
Замечание. Таким образом, гауссова матрица G — это верхнетреугольная мат-
рица, каждый диагональный элемент которой — единица (нуль), причем остальные
элементы столбца (строки) — нули. Поэтому, если диагональ какой-то квадратной
подматрицы Gq гауссовой матрицы G является частью диагонали матрицы G, то
подматрица Gq тоже гауссова.
!) См. Замечание 2.1 на стр. 16
66
ГЛАВА 1. МАТРИЦЫ
Пример. Вот гауссова матрица G пятого порядка, с выделенными в ней
двумя гауссовыми подматрицами U и W третьего и второго порядков соот-
ветственно.
1 0 0 0 -1
0 1 0 0 -1
G = 0 0 1 0 0 = U V О W (7-1)
0 0 0 1 2
0 0 0 0 0
7.2 Операции над матрицами
Так как матрица — это числовая функция, заданная на декартовом про-
изведении двух отрезков натурального ряда, всевозможные матрицы
одного размера с элементами из одного поля скаляров образуют функ-
циональное линейное пространство над этим полем. Другими словами,
сумма двух матриц одного размера и произведение матрицы на число
определяются «поэлементно».
Определение. (Унарная) операция перехода от (т х п)-матрицы А к
(п х т)-матрице Ат по правилу (А7),/,. = А^ называется транспониро-
ванием матрицы А. Матрица симметрична, если она не меняется при
транспонировании.
Очевидно, транспонирование, подобно комплексному сопряжению, яв-
ляется линейной инволюцией: (ЛА + дВ)т = ЛАТ + дВт; (Ат)т = А.
Определение. Скажем, что упорядоченная пара матриц {А, В} (с эле-
ментами из одного поля) согласована, если в А столько же столбцов,
сколько в В — строк.
Замечание. Ясно, что пара {Вт, Ат} согласована вместе с {А, В}.
Для согласованных пар матриц можно ввести умножение. Определим
вначале операцию умножения матрицы на столбец.
Определение. Пусть в = [/?!•• (дг /Д]т и пара {А, В} согласована.
Произведением АВ называется столбец
АВ = Д[А1 + + ДАГ + • • • + /3ПАП , (7-2)
представляющий собой линейную комбинацию столбцов матрицы А с
элементами столбца В в качестве коэффициентов.
7.2. ОПЕРА ЦИИ НАД МА ТРИЦА МИ
67
Замечание. Тем самым, столбец АВ имеет столько же элементов, сколько строк у
матрицы А. В частности, если А — матрица-строка, то столбец АВ имеет ровно один
элемент, т. е. представляет собой квадратную матрицу порядка 1. Без риска смешения
понятий такую матрицу часто отождествляют с ее единственным элементом.
Понятие произведения матрицы на столбец позволяет описать пространство С(А)
столбцов матрицы А как множество всевозможных столбцов вида АХ, т. е. как образ
(множество значении) функции f : Хн4 АХ (X е 8те).
Примеры.
1. Найдем произведение матрицы Е = [Ei Еп] на согласованный с Е стол-
бец А = [ад ага]т:
ЕА — ад Ei + + otn • Ега — А . (7-3)
2. Вычислим произведение матрицы А = [Ai Ап] на согласованный с мат-
рицей А единичный столбец Е7:
AEj = 0 Ai + + 1 Aj + + 0 Ага = Aj . (7-4)
Располагая уже понятием «произведение матрицы на столбец», опреде-
лим понятие «произведение двух матриц».
Определение. Пусть матрицы {А, В} согласованы, причем
В = [Bi В7 Вр]
где Bj е В". Произведением АВ называется матрица
АВ = [ABi АВ7 ABJ , (7.5)
составленная из произведений матрицы А на последовательные столбцы
матрицы В.
Замечание. Тем самым, у матрицы АВ столько же строк, сколько их у
матрицы А и столько столбцов, сколько их у матрицы В. Следовательно,
если согласованы пары {А, В} и {В, С}, то согласованы также и пары
{А, ВС} и {АВ, С}.
Примеры.
1. Вычислим произведение единичной матрицы Е на согласованную с ней
матрицу А. Ввиду равенства (7.3),
ЕА E[Ai Ага] [EAi EAn] [Ai Ап] А
68
ГЛАВА 1. МАТРИЦЫ
2. Вычислим произведение матрицы А на согласованную с ней единичную
матрицу. Согласно (7.4), АЕ = [AEi АЕД = [Ai АД = А.
Сравнивая элементы обеих частей равенства (7.5), лежащие в пересе-
чении z-й строки с м столбцом, приходим, с учетом (7.2), к формуле,
выражающей элемент (АВ)^ матрицы-произведения через элементы со-
множителей:
п
(АВ).. = Е air/3rj. (7.6)
J r = L
Теорема 7.1 (ассоциативности). Для согласованных пар {А, В} и {В, С}
выполнено равенство (АВ)С = А(ВС).
о С одной стороны, сумма S всех чисел вида A^BsrCrj равна
s = S f S AZSBJcrj = Е (AB)-rCrj = ((АВ)С)...
Г \ S / г J
С другой стороны,
8 = Е Ais( Е BsrcA = Е АДВС) = (А(ВС)Ц.
Следовательно, (АВ)С = А(ВС). <з
Теорема 7.2 (дистрибутивности). Если матрицы В и С одного размера,
а пары {А, В} и {C,D} согласованы, то выполнены оба закона дистри-
бутивности: А(В + С) = АВ + АС; (В + C)D = BD + CD.
о Действительно, согласно правилу умножения (7.6),
(А(В + С))г? = Е АДВ + С)г? = Е AzrBrj+E AzrCrj = (АВ)г7+(АС)г?.
J гр J гр р J J
Второй закон дистрибутивности доказывается аналогично.
Связь умножения с операцией транспонирования устанавливает
Теорема 7.3. Для согласованной пары матриц {А, В} выполнено соот-
ношение (АВ)Т = ВТАТ.
> (ВТАЩ. = Е (ВТ)ДАТЦ = Е AjrBrs = (АВ)= (AB)J.
Замечание. Согласованность пары {А, В} не означает, что пара {В, А} согласова-
на. Даже если это так, то не всегда АВ = В А. Например, для А е К2 у симметричных
матриц АТА и ААТ разный порядок, так что АТА ф ААТ.
Определение. Разность [А, В] = АВ — В А, где А, В — квадратные мат-
рицы одного порядка, называется коммутатором матриц А и В. Гово-
рят, что А и В коммутируют или что А и В перестановочны, если
[А,В] = О.
1.3. ИДЕМПОТЕНТНЫЕ МАТРИЦЫ
69
7.3 Идемпотентные матрицы
Определение. Матрицей, дополнительной к квадратной матрице Q,
назовем матрицу Q' = Е — Q, где Е — единичная матрица.
Ясно, что Q" = Q и что Q'Q = QQ'.
Определение. Квадратная матрица Q идемпотентна, если все ее сте-
пени Q", (n е IN) совпадают.
Простейшие примеры: квадратная нулевая и единичная матрицы.
Замечание. Очевидно, равенство QZQ = О является критерием идемпотентности,
так что матрица, дополнительная к идемпотентной, также идемпотентна.
Теорема 7.4. Любая гауссова матрица G = [Gi Gra] идемпотентна.
о Согласно определению гауссовой матрицы (стр. 65), для каждого г
либо GJ. = Ог (если Gr = Ег), либо строка Gr — нулевая. Поэтому при
всех к имеем равенства (G'G)fc = Е GrfcG(. = О^, откуда G'G = 0. <з
7.4 Блочные матрицы
Если столбцы матриц А = [Ai Аг] и В = [Bi Bs] имеют одну вы-
соту, то можно составить матрицу [А| В] = [Ai Ar| Bi Bs]. Соста-
вив аналогично матрицу [C|D] = [Ci Cr| Di Ds] и расположив ее
столбцы под соответствующими столбцами матрицы [А| В], мы придем
к блочной или клеточной матрице
Определение. Подматрицы А, В, С, D называют клетками матри-
цы М.
Определение. Блочная матрица (7.7) называется ступенчатой, если
В = О или С = О.
Определение. Матрица М блочно-диагоналъна, если А и D — квадрат-
ные подматрицы, а В = С = О.
70
ГЛАВА 1. МАТРИЦЫ
Пусть матрица М определена равенством (7.7) и размеры клеток блоч-
ной матрицы N совпадают с размерами соответствующих клеток мат-
рицы М:
в + т
D +V
S Т
и V
с + и
Очевидно, так что формально запись суммы таких клеточных матриц
идентична записи суммы числовых матриц одного размера.
Аналогично ведут себя и произведения блочных матриц при опреде-
ленных условиях, наложенных на клетки сомножителей. Именно, пусть
блочная матрица М по-прежнему определена равенством (7.7), клетки S
и Т блочной матрицы N состоят из столбцов высоты г, а клетки U и V
— из столбцов высоты s. Выполнено равенство
С D U V
AS + BU АТ + BV
CS + DU CT + DV
так что формально запись произведения клеточных матриц совпадает с
записью произведения матриц числовых. Вычислим, например, элемент
(MN)^, предполагая, что z-я строка матрицы М пересекает клетки А и
В, а J-й столбец матрицы N пересекает клетки S и U. Согласно прави-
лу (7-6) умножения матриц, (MN)V = (AS)^. + (BU)^. = (AS + BU)-r
Точно так же устанавливается совпадение элементов в остальных трех
клетках правой части равенства с соответствующими элементами его
левой части.
Применим клеточный формализм к анализу гауссовой матрицы
(7.8)
разбитой на блоки так, чтобы клетки U и W были квадратными. Пример
такого разбиения — в равенстве (7.1) на стр. 66.
Теорема 7.5. Для матрицы G в (7.8) выполнены равенства UV = V,
VW = О, (а значит, и равносильные им равенства U'V = О, VW' = V).
о Замена клетки W нулевой матрицей дает гауссову матрицу Go, из
идемпотентности которой следует, что
7.5. МАТРИЧНОЕ УРАВНЕНИЕ
71
Из идемпотентности G с учетом равенства UV = V находим, что
U V
О W
и V и V UV + VW
О W О W О W
Отсюда VW = О и оба равенства установлены.
Понятия настоящего раздела без труда обобщаются на блочные мат-
рицы, образованные т горизонтальными и п вертикальными рядами
клеток.
7.5 Простейшее матричное уравнение
Определение. Уравнение АХ = В, в котором А, В — заданные матри-
цы с одинаковым числом строк, а матрица X неизвестна, назовем про-
стейшим уравнением 1-го типа. Простейшим уравнением 2-го типа
назовем уравнение YC = D, в котором С, D — заданные матрицы с оди-
наковым числом столбцов, а матрица Y неизвестна.
Особый интерес представляет простейшее уравнение, в правой части
которого стоит нулевая или единичная матрица.
Определение. Простейшее уравнение с нулевой правой частью назы-
вают однородным уравнением.
Пусть матрица А имеет т строк и п столбцов и Е — обозначение еди-
ничной матрицы, порядок которой определяется контекстом.
Определение. Любое решение X уравнения АХ = Е называют правой
обратной матрицей для А. Любое решение Y уравнения YA = Е назы-
вают левой обратной матрицей для А.
Замечание. Из этого определения следует, что каждая из матриц X и Y должна
иметь п строк и т столбцов.
Теорема 7.6. Если матрица А имеет как правую обратную матрицу
X, так и левую обратную матрицу Y, то X = Y.
о X = EX = (YA)X = Y(AX) = YE = Y. <i
Определение. Матрица V обратна к матрице А, если она одновре-
менно является как правой, так и левой обратной для А.
72
ГЛАВА 1. МАТРИЦЫ
Замечание. Если матрица V существует, то она единственна. В самом деле, пусть
наряду с V обратной к А является некоторая матрица W. Рассматривая V как левую
обратную, a W как правую обратную для А, заключаем, по Теореме 7.6, что W = V.
Обратную к А матрицу принято обозначать символом А-1.
Определение. Матрица А называется обратимой, если существует А-1.
Таким образом, матрица А обратима тогда и только тогда, когда най-
дется матрица V такая, что обе матрицы AV и VA — единичные. Отсюда
ясно, что и V = А-1 обратима, причем V-1 = А.
Замечание. Как выяснится в дальнейшем, всякая обратимая матрица с необхо-
димостью квадратна.
Очевидно, для взаимно обратных матриц А и V выполнены соотношения
AVA = A; VAV = V. (7.9)
Определение. Говорят, что матрицы А, V взаимно полу обратны, если
они связаны равенствами (7.9).
Теорема 7.7. Если одна из двух взаимно полуобратных матриц обра-
тима, то эти матрицы взаимно обратны.
о Пусть для матриц А и V выполнены соотношения (7.9). Если мат-
рица А-1 существует, то, умножая первое из соотношений поочередно
слева и справа на А-1, найдем, что VA = Е = AV.
Замечание. Поскольку транспонирование меняет тип матричного уравнения с
1-го на 2-й и наоборот, ниже мы ограничиваемся анализом уравнений 1-го типа.
7.6 Эквивалентные преобразования
Как и выше, А — обозначение матрицы с т строками и п столбцами:
®т1 @т2
О^тп
1.6. ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ
73
Определение. Матрица А называется основной матрицей для уравне-
ния АХ = В, а блочная матрица [А| В] — расширенной матрицей этого
уравнения.
Матрицы позволяют в сжатом виде представить систему скалярных
линейных уравнений, а именно, если ввести в рассмотрение матрицу-
столбец неизвестных X и столбец свободных членов В
х = [№ • Х„]т е S" В = [/Ш... Д„]т е S’",
то система
011X1 + 012X2 + + ОЛпХп — (31
021X1 + О22Х2 + + O2nXn — /?2
< ............................................ (7.Ю)
t OmlXl “Ь Om2X2 4“ ' ' ' 4“ Omnyn (Зт
запишется как матричное уравнение АХ = В, полная информация о ко-
тором перенесена в матрицу [А| В]. Вспоминая правило умножения мат-
рицы А = [Ai... Ап] на столбец X, получаем векторную форму систе-
мы (7.10): В = XiAi + + ХпАга, вскрывающую геометрический
смысл системы (7.10), решения {xi, • • •, Хп} которой — это наборы коэф-
фициентов, позволяющие выразить заданный столбец В линейной ком-
бинацией заданных столбцов А7. Отсюда следует, что система (7.10)
имеет решение в том и только в том случае, когда столбец свобод-
ных членов принадлежит пространству столбцов основной матрицы
системы. Записав обе части матричного уравнения АХ = В в столбцо-
вой форме [AXi... AXfc] = [Bi... В^], можно интерпретировать его
как набор линейных систем АХ7 = В, (где 1 A j к) с общей основной
матрицей А. Следовательно, матричное уравнение АХ = В имеет реше-
ние в том и только в том случае, когда каждый из столбцов матрицы В
принадлежит пространству столбцов матрицы А.
С разрешимостью системы скалярных уравнений и разрешимостью мат-
ричного уравнения АХ = В связана следующая терминология.
Определение. Уравнение АХ = В разрешимо (система (7.10) совмест-
на), если существует хотя бы одно решение X. Уравнение, имеющее бо-
лее, чем одно решение называют неопределенным. Уравнение, имеющее
в точности одно решение — определенным.
74
ГЛАВА 7. МАТРИЦЫ
Замечание. Проблематика, возникающая в теории систем линейных уравнений:
(1) Как выяснить, совместна ли данная система?
(2) Если система совместна, то как описать все ее решения?
Наивное представление о линейных системах предполагает, что
(а) Система, в которой уравнений меньше, чем неизвестных, неопределенная.
(Ь) Система, в которой уравнений больше, чем неизвестных, несовместна.
(с) Система, в которой уравнений столько же, сколько неизвестных, является опре-
деленной.
Однако, все эти три утверждения ложны.
Исчерпывающий ответ на оба поставленные выше вопроса дает метод, связанный с
именами Гаусса и Иордана2). В основе любой из многочисленных модификаций этого
метода3) лежат так называемые эквивалентные преобразования матрицы.
Определение. Эквивалентными (или элементарными) преобразова-
ниями заданной матрицы М называют элементарные преобразования
набора ее строк, рассматриваемых как элементы пространства 7\L(M)
(см. стр. 49).
Любое из эквивалентных преобразований обратимо и, тем самым, вы-
полненное над матрицей М = [А| В], оно осуществляет переход от урав-
нения АХ = В к некоторому равносильному уравнению.
Определение. Будем говорить, что матрица М эквивалентна матри-
це N и писать М ~ N, если N получается из М цепочкой эквивалентных
преобразований.
Очевидно, введенное отношение рефлексивно, симметрично и транзи-
тивно.
7.7 Задачи
1. Сумма элементов каждого столбца обратимой матрицы порядка п равна
единице. Чему равна сумма всех элементов обратной матрицы?
2. Найдите сумму всех элементов действительной матрицы А, зная, что
все диагональные элементы квадратной матрицы В = АТА — нули.
2) Jordan, Wilhelm (1842-1899) — немецкий геодезист
3) Не будет большим преувеличением сказать, что каждый вычислитель исполь-
зует свой вариант метода
7.7. ЗАДАЧИ
75
3. Пусть А — действительная матрица. Верно ли, что множества решений
однородных систем с основными матрицами А и АТА совпадают?
4. Пусть R — такая ненулевая матрица, что R2 = R. Для каких А е С
существует (Е — AR)-1 ? Найдите эту матрицу, выразив ее через R и А.
5. Докажите обратимость матрицы порядка т
и вычислите элементы матрицы (т + 1)А 1
6. Верно ли, что след tr(AB) = Е (АВ)уу произведения квадратных матриц
А и В не зависит от порядка сомножителей?
7. Докажите, что след подобных квадратных матриц М и В-1 МВ одина-
ков.
8. Вне диагонали матрицы А порядка п стоят единицы, а на диагонали —
числа 1 — п. Выразите матрицу А" через матрицу А.
9. Пусть Р — действительная идемпотентная матрица и [Рт, Р] = О. Верно
ли, что матрица Р симметрична?
10. Шестьдесят четыре спичечных коробка, половина из которых перевер-
нута этикетками вниз, сложены в виде шахматной доски. Разрешается
перевертывать разом любой вертикальный или горизонтальный ряд ко-
робков, а также переставлять параллельные ряды. Как получить кон-
фигурацию, в которой перевернуты только коробки, расположенные по
периметру?
11. Куб с длиной ребра 3 разбит на единичные клетки плоскостями, па-
раллельными граням куба. Центральная клетка поражена вирусом. По-
сле уничтожения клетки вирус перемещается в одну из непораженных
смежных. Может ли вирус уничтожить все клетки?
12. Рассмотрев введенную Гамильтоном4) систему Н комплексных матриц
вида w — [ ДД], убедитесь в ее замкнутости относительно сложения
и умножения матриц, а также обращения ненулевых матриц. Покажите,
как в Н можно ввести мультипликативную норму. Проверьте, что при
действительных щ г по правилу и + iv w система Н с сохранением
операций и нормы переходит в систему комплексных чисел С.
4) Hamilton, William Rowan (1806-1865) — ирландский математик и астроном
Глава 8
Метод Гаусса
Теорема Гаусса-Йордана. — Единственность гауссовой формы. —
Ранг матрицы. — Триада пары матриц. — Решение матричного
уравнения. — Пересечение оболочек. — Гауссова инверсия. — Об-
ращение матриц. — Критерии обратимости.
8.1 Теорема Гаусса-Йордана
Теорема 8.1 (Гаусс, Иордан). Произвольная матрица М эквивалентна
некоторой гауссовой матрице G.
о Пусть п — число столбцов матрицы М. Для нулевой матрицы М
утверждение тривиально. Для М ф О приведем алгоритм, реализую-
щий «конструктивное» доказательство теоремы. Лидером строки будем
называть ее первый ненулевой элемент. Алгоритм составим из двух по-
следовательных этапов. На 1-м этапе по М строится эквивалентная мат-
рица М , все строки которой ненулевые, причем лидеры этих строк на-
ходятся в различных столбцах, остальные элементы которых — нули.
Первый этап состоит из однотипных циклов. Удалив нулевые строки М
и присвоив переменной цикла £ значение 1, в отдельном цикле следует:
(1) найти лидер Sk в строке S = [si зга];
(2) каждую другую строку Т заменить на s/Д — GS ;
(3) удалить нулевые строки матрицы (если они появились);
(4) если получилась матрица из £ строк, завершить 1-й этап, иначе,
увеличив £ на единицу, вернуться к п. (1).
76
8.1. ТЕОРЕМА ГАУССА-ЙОРДАНА
77
Итак, результат первого этапа — матрица М, все строки которой ненуле-
вые, причем лидеры строк находятся в различных столбцах, остальные
элементы которых — нули. На втором этапе надлежит:
(а) для каждого ранее найденного значения к заменить к-ю строку квад-
ратной нулевой матрицы порядка п строкой матрицы М с лидером на
к-м месте;
(Ь) разделить элементы каждой ненулевой строки на ее лидер.
Таким образом, в результате второго этапа мы получаем верхнетре-
угольную матрицу G, лидер каждой ненулевой строки которой нахо-
дится на диагонали и равен 1, причем остальные элементы столбца, со-
держащего этот лидер — нули.
Замечание. Ввиду п. (2), на выходе каждого цикла ненулевым оказывается в
точности один элемент /с-го столбца матрицы, столбец этот не меняется под дей-
ствием последующих циклов и все значения к в различных циклах различны.
Из доказанной теоремы очевидным образом вытекает следующая
Теорема 8.2 (эквивалентности). Если (т х п)-матрица М эквивалент-
на гауссовой матрице G, а О и Q — нулевые матрицы размеров т х к
и п х к соответственно, то однородные уравнения MX = О и GX = Q
равносильны.
Замечание. Использованный в доказательстве теоремы алгоритм порой ведет к
быстрому росту элементов преобразуемых строк и на практике неудобен. Обычно
цепочку элементарных преобразований строят, исходя из специфики матрицы М и
не стремясь к жесткой алгоритмичности процесса, успешный исход которого гаран-
тирован определенностью цели и ее принципиальной достижимостью.
Таким образом, выбором наиболее целесообразной последовательности эквивалент-
ных преобразований полностью распоряжается вычислитель.
Определение. Гауссова матрица G, эквивалентная матрице М, назы-
вается гауссовой формой матрицы М.
Упражнения. Убедитесь, что
1. Матрица [А| В] и гауссова матрице G эквивалентны:
"10-1 0 3 ’ "10-1 0 3 ’
5 2 3 2 7 0 1 4 1 —4
[А| В] = 7 3 5 3 9 G 0 0 0 0 0
2 1 2 1 2 0 0 0 0 0
3 1 1 1 5 0 0 0 0 0
78
ГЛАВА 8. МЕТОД ГАУССА
2. Матрица G из равенства (7.1) на стр. 66 является гауссовой формой
матрицы 1 1 0 1 0
-1 1 1 1 2
[А|В] = -1 0 1 —2 -3
0 1 0 1 1
8.2 Единственность гауссовой формы
Пусть m — набор столбцов М7 некоторой матрицы М и G = [Gi... G J
— гауссова форма М. Поднабор т' с; т определим так:
т' = {М, : G, = ЕД
Теорема 8.3. Элементы набора т' линейно независимы.
о Нулевая комбинация элементов набора т' — это нулевая комбина-
ция XiMi + + угаМга элементов т, в которой при М7 ф т' стоит ко-
эффициент Xj = 0. Но, по Теореме 8.2, уравнение %iMi + + угаМга = О
равносильно уравнению XiGi + + yraGra = О. Поскольку в послед-
нюю комбинацию столбцы Gj Ф Е? входят с нулевыми коэффициентами,
а столбцы единичной матрицы независимы, остальные коэффициенты
комбинации также нули.
Теорема 8.4. Поднабор т' — каноническая база набора т и, в частно-
сти, базис пространства С(М).
о Из идемпотентности матрицы G следует, что GG' = О. Согласно тео-
реме эквивалентности, MG' = О. Последнее равенство перепишем как
М = MG. Следовательно, М7 = (MG)7 = MGy = £ G^M^. Матрица G
верхнетреугольная и последнее равенство можно уточнить:
М7=ёсг7Мг. (8.1)
г=1
Для М7 е т' равенство (8.1) тавтологично: G^ = dij. При М7 ф т' J-я
строка матрицы G нулевая, Gjj = 0 и равенство принимает вид
М7 = VGijMi, (8.2)
г=1
8.2. ЕДИНСТВЕННОСТЬ ГАУССОВОЙ ФОРМЫ
79
т. е. каждый не вошедший в набор т' столбец М7 выражается линейной
комбинацией предыдущих столбцов матрицы М. Далее, если в этой ли-
нейной комбинации ф т', то строка матрицы G с номером i нулевая
и Gij = 0. Тем самым, в комбинации (8.2) присутствовать с ненулевым
коэффициентом могут лишь столбцы Mj, входящие в набор т' и, сле-
довательно, поднабор т' подпадает под определение канонической базы
набора in.
Замечание. Отметим, что, как это видно из (8.2), коэффициенты разложения
столбца Mj по предшествующим ему столбцам как раз и составляют столбец Gj.
Теорема 8.5. Гауссова форма матрицы единственна.
о Пусть М ~ G, где матрица G гауссова. Так как каноническая база
единственна и представляет собой базис пространства С(М), а коорди-
наты вектора во всяком базисе определены однозначно, то однозначно
определены и все столбцы гауссовой формы G. <з
Следствие. Эквивалентные гауссовы матрицы совпадают.
Тем самым, несмотря на недетерминированность процесса элементар-
ных преобразований матрицы М, конечный результат процесса (матри-
ца G) вполне детерминирован.
Важнейшей числовой характеристикой матрицы является ее ранг.
Определение. Размерность пространства 7ДМ) строк матрицы М на-
зывается ее строчным рангом.
Строчный ранг (row rank) матрицы М обозначим r-rk (М).
Теорема 8.6. Если М эквивалентна гауссовой матрице G, в которой
к ненулевых строк, то r-rk (М) = к.
о Поскольку строки G получены из строк М цепочкой эквивалент-
ных преобразований (сохраняющих оболочку набора), 7ДМ) = 7\L(G).
Независимость набора ненулевых строк G (полного в 7\L(G)) следует из
того, что лидеры строк (единицы) находятся на диагонали верхнетре-
угольной матрицы G, так что ни одна из строк не может быть выра-
жена комбинацией нижележащих. Таким образом, к ненулевых строк
матрицы G образуют базис пространства 7\L(G) и выполнено равенство
r-rk(M) = dimT^(M) = dimT^(G) = к. <з
80
ГЛАВА 8. МЕТОД ГАУССА
Определение. Размерность пространства С(М) столбцов матрицы М
называется ее столбцовым рангом.
Столбцовый ранг (column rank) М обозначим с-гк(М).
Теорема 8.7. Если М эквивалентна гауссовой матрице G, в которой I
единичных столбцов, то c-rk (М) = I.
о Утверждение прямо следует из Теоремы 8.4.
Из определения G видно, что число ненулевых строк в гауссовой мат-
рице равно числу единичных столбцов и совпадает с числом единиц на
ее диагонали. Поэтому r-rk (М) = c-rk(M) = tr(G).
Определение. Общее значение строчного и столбцового рангов матри-
цы М называется рангом матрицы М и обозначается гк(М).
Замечание. Совпадение строчного и столбцового рангов ведет, в частности, к
равенству rk (М) = гк (Мт).
Объединим две последние теоремы:
Теорема 8.8. Если матрица М эквивалентна гауссовой матрице G,
то rk (М) = tr(G).
Примеры.
1. Для матриц [А| В] и G из Упр. 1, (стр. 78) гк([А| В]) = 2.
2. Ранг [А| В] из Упр. 2 (на той же стр.), согласно Теореме 8.8, равен 4.
Теорема 8.9. Ранг произведения матриц не превосходит ранга каж-
дого из сомножителей.
о Покажем вначале, что С(АВ) С(А) Действительно, из правила
умножения матриц следует, что каждый столбец (АВ)^ произведения
АВ принадлежит пространству столбцов матрицы А:
(АВ)^ = АВ;/ = BijAi + + BnjAn £ С(А).
Следовательно, С(АВ) = span{(AB)x... (AB)fc} cz С(А). Так как размер-
ность подпространства С (АВ) не выше размерности содержащего его
пространства С (А), то rk (АВ) < rk(A), т. е. ранг произведения не боль-
ше ранга первого сомножителя. Но тогда
rk (АВ) = rk (ВТАТ) < rk (Вт) = rk (В),
8.3. ТРИАДА ПАРЫ {А, В}
81
что и завершает доказательство.
Перейдем к упомянутому в Замечании 7.5 (стр. 72) утверждению о том,
что только квадратная матрица может иметь обратную.
Теорема 8.10. Если матрица А имеет правую обратную, то число
строк матрицы А не больше числа ее столбцов.
о Пусть А имеет т строк и п столбцов, тогда правая обратная мат-
рица X с п строками и т столбцами удовлетворяет уравнению АХ = Е,
где Е — единичная m-матрица. Покажем, что т < п. Из c-rk (А) < п и
Теоремы 8.9 выводим: т = rk (Е) = rk (АХ) A rk (А) = c-rk (А) А п.
Следствие. Матрица Аст строками и п столбцами может иметь
обратную матрицу X только при т = п.
о Согласно теореме, т п. Рассматривая матрицу А как правую об-
ратную для X, заключаем, что п (число строк матрицы X) не больше
числа ее столбцов т. <1
8.3 Триада пары {А, В}
Пусть заданы матрицы А = [Ах... Ага] и В = [Bi... В^] с одинаковым
числом строк т. Единственность гауссовой формы позволяет однознач-
но сопоставить блочной матрице [А | В] эквивалентную ей гауссову мат-
рицу G. Разобьем матрицу G на клетки
U V
О W
G =
так, чтобы подматрицы U и W были квадратными порядков п и к со-
ответственно. Тем самым, матрицы U и W — гауссовы, причем U —
гауссова форма матрицы А, поскольку, согласно первому замечанию на
стр. 77, одинаковые цепочки элементарных преобразований, применяе-
мых к двум различным матрицам [А | В] и [А | В] в ходе процесса Гаусса,
одинаково изменяют их левую клетку А.
Определение. Матрицы {U,V,W} образуют гауссову триаду для па-
ры матриц {А, В}.
Остановимся на алгебраических свойствах матриц U, V, W.
82
ГЛАВА 8. МЕТОД ГАУССА
Теорема 8.11. Матрицы А, В, U, U', W, W' и V, связаны следующими
мультипликационными соотношениями:
UV = VW' = V; U'V = VW = О ;
AU' = О AV = BW' AU = А .
(8-3)
(8-4)
о Достаточно доказать лишь равенства (8.4), поскольку соотношения
(8.3) уже установлены в Теореме 7.5 на стр. 70.
Из равенства GG' = О, теоремы эквивалентности и правила умножения
блочных матриц следует, что матрица-произведение
[А| В] G'= [А| В]
U' -V
О W'
= [AU'| - AV + BW']
нулевая, т. е. AU' = О и AV = BW'. Первое из этих равенств позволяет
записать тождество A (U + U') = А как AU = А. <з
8.4 Решения уравнения АХ=В
В терминах гауссовой триады, построенной по матрице [А| В], легко от-
ветить на оба поставленных на стр. 74 вопроса относительно уравнения
АХ = В. х)
Теорема 8.12. Пусть А - (тех п) -матрица, В — матрица размера
т х к, и {U,V,W} — триада пары {А, В}. Критерием разрешимости
уравнения АХ = В является равенство W = О, и если уравнение разре-
шимо, то все его решения описываются формулой X = V + U'P, где Р
— произвольная матрица размера п х к.
о Из правила умножения блочных матриц и Теоремы 8.2 следует, что
уравнение АХ = В, которое можно представить в виде
равносильно уравнению
г) В дальнейшем через О обозначаются нулевые матрицы, размеры которых ясны
из контекста. То же относится к обозначению Е единичных матриц
8-4- РЕШЕНИЯ УРАВНЕНИЯ АХ=В
83
Другими словами, уравнение АХ = В равносильно системе
их
W
V
о
(8-5)
Необходимость условия W = О установлена. Покажем теперь, что оно
достаточно для разрешимости уравнения, проверив заодно, что мат-
рица вида X = V + U'P, где Р — произвольная (п х /с)-матрица, удо-
влетворяет уравнению АХ = В. Действительно, из (8.4) следует, что
АХ = AV + (AU')P = BW' + О = В Е = В.
Убедимся, наконец, что формула X = V + U'P дает все решения урав-
нения АХ = В (в случае его разрешимости). Пусть Хо — произвольно
заданное решение. Покажем, что можно выбрать матрицу Р так, чтобы
выполнялось равенство V + U'P = Хо. Положим Р = Хо, тогда из перво-
го соотношения (8.5), V = UX0 и, следовательно, выполнены равенства
V + и'Х0 = (U + U')X0 = ЕХ0 = Хо. <]
Пример. Проверим на разрешимость уравнение с расширенной матрицей
[А|В] = 1 0 -1 5 2 3 7 3 5 2 1 2 3 1 1 0 3 2 7 3 9 1 2 1 5
и, в случае разрешимости, найдем все его решения. Как предлагалось уста-
новить в Упражнении 1 на стр. 78, матрица [А| В] эквивалентна гауссовой
матрице
1 0 -1 0 1 4 0 0 0 0 3 1 —4 0 0
0 0 0 0 0 0 0 0 0 0
Следовательно, W = О, уравнение разрешимо, и все его решения содержатся
в выражении
X = V + U'P =
О 3
1 —4
О О
О О
О О
О О
1
—4
1
Р 8
Q t
г и
84
ГЛАВА 8. МЕТОД ГАУССА
с произвольными параметрами р, д, г,
s, t, и. Окончательно,
г 3 + и
1 — 4г —4 — 4и
г и
где г, и — произвольные числа.
8.5 Однородная система уравнений
Здесь, как и выше, А — (тп х п)-матрица, U — гауссова форма А.
Определение. Система линейных уравнений (7.10) называется одно-
родной, если все ее свободные члены — нули.
Так как рассматриваемая однородная система равносильна однородной
системе с основной матрицей U и всегда разрешима (О — одно из ее ре-
шений), то ее расширенная матрица эквивалентна гауссовой матрице G
с клеткой V = О и нулевой последней строкой. Следовательно, в одно-
родном случае формулировка Теоремы 8.12 значительно упрощается:
Теорема 8.13. Решения системы АХ = О даются формулой X = U'P,
где Р — произвольный п-столбец.
Очевидно, решения однородной системы АХ = О образуют некоторое
подпространство Л7(А) в координатном пространстве
Определение. Л7(А) называется нуль-пространством матрицы А.
Теорема 8.14. Пусть U — гауссова форма А. Размерность простран-
ства Af(А) равна числу нулевых строк в матрице U, а ненулевые столб-
цы матрицы U' образуют базис A7(A)? так что Л7(А) = C(U').
о У гауссовой матрицы U столько же нулевых строк, сколько ненуле-
вых столбцов у U', поэтому достаточно доказать только вторую часть
утверждения. Формула X = U'P = + + an\J'n показывает,
что любое решение X представляет собой линейную комбинацию столб-
цов U', которую можно рассматривать как комбинацию ненулевых столб-
цов матрицы U'. Следовательно, набор таких столбцов полон в простран-
стве решений. Независимость же этого набора — следствие того факта,
что последние ненулевые элементы столбцов (единицы) находятся на
диагонали верхнетреугольной матрицы U', так что ни один из столбцов
не может быть линейной комбинацией предыдущих.
8.6. ПЕРЕСЕЧЕНИЕ ОБОЛОЧЕК
85
Пример. Поэтапно (А —> U —> U') реализуем процесс решения однородной
системы с квадратной основной матрицей А:
1 3-3 2 4 ] 1002-5
-3-1 7 0 -6 0 10 1 0
А = 1 2-3 1 4 -+U = 0011-3 —>
2 1-5 0 5 0 0 0 0 0
1 1-3 0 4 0 0 0 0 0
000-25
000-10
-и' = 000-13
0 0 0 1 0
0 0 0 0 1
Решения системы — это всевозможные линейные комбинации двух ненулевых
столбцов матрицы U7:
000-25 а -2 5
000-10 Р -1 0
X = U'P = 000-13 = А -1 + д 3
0 0 0 1 0 А 1 0
0 0 0 0 1 0 1
Итак, нуль-пространство Л/”(А) матрицы А состоит из столбцов с элементами
Х1 = 5/7 - 2Л
Х2 = -А
< Хз = Зд — А
Х4 = А
Х5 = Д
где А, д — произвольные числа.
8.6 Пересечение оболочек
Применим гауссову триаду к решению одной часто возникающей в прак-
тике вычислений задачи. Пусть в S" выделены два подпространства, за-
данные как пространства столбцов матриц А и В. Требуется указать
какую-либо матрицу, пространство столбцов которой совпадает с пере-
сечением двух заданных подпространств.
86
ГЛАВА 8. МЕТОД ГАУССА
Теорема 8.15. Для произвольных матриц А, В с одним числом строк
выполнены равенства С(А\Г) = С(А)п С (В) = C(BW'), в которых V, W
— элементы триады, определяемой упорядоченной парой {А, В}.
о Заметим, что ввиду (8.4), AV = BW', так что достаточно проверять
любое из двух равенств теоремы.
Пусть некоторый столбец Z принадлежит как пространству С (А), так и
пространству С (В). Это означает существование столбцов X и Y таких,
что одновременно Z = АХ и Z = BY. Столбцы X и Y, следовательно,
удовлетворяют уравнению
равносильному (по Теореме 8.2) условию
U V
О W
= [их - VY I - WY] = [О|О],
из которого, в свою очередь, следует равенство Y = W'Y. Умножая обе
части последнего равенства слева на В, видим, что Z е C(BW'), посколь-
ку Z = BY = (BW')Y. Пусть теперь Z — элемент C(AV) = C(BW'). Тогда
одновременно Z = (AV)S = АХ и Z = (BW')T = BY. Следовательно, Z —
общий элемент пространств С (А) и С (В). <з
Пример. Найдем пересечение подпространств С (А) и С (В) для матриц А
и В из Упражнения 2 (стр. 78). Гауссова форма матрицы [А| В] приведена на
стр. 66. Согласно Теореме 8.15, следует найти какое-нибудь из двух произве-
дений
1 О
1 1
О 1
1 О
О -1
О -1
О О
О -2
О О
О 1
О -1
или
О -2
О О
О 1
О -1
Вывод: искомое пересечение — одномерное пространство, порождаемое столб-
цом [—2 0 1—1 ]т.
8.7. ГАУССОВА ИНВЕРСИЯ
87
8.7 Гауссова инверсия
Как уже отмечалось, уравнение АХ = В представляет особый интерес,
когда В = О или В = Е. Случай В = О уже рассмотрен, обратимся к
случаю В = Е.
Определение. Отображение А i—> {U, V, W}, сопоставляющее матрице
А триаду пары {А,Е}, назовем инверсией А, а компоненты V и W, со-
ответственно, инверсором и дискриминантом матрицы А.
Теорема 8.16. Матрицы А, V, U, U', W и W подчиняются следующим
правилам умножения
1 и V U' 2 А W' W
и и V О V и V ° (8-6)
А А W' О W' А W' О
U' О О U' W О О W
(левые сомножители расположены в левых столбцах «таблиц умно-
жения», а правые — в верхних строках таблиц).
о Напомним, прежде всего, что гауссовы матрицы U и W вместе с
дополнительными к ним матрицами U' и W' с необходимостью идемпо-
тентны. Следует проверить лишь равенства VA = U и WA = О табли-
цы 2, поскольку все остальные соотношения либо уже установлены в
Теореме 8.11 на стр. 82, либо легко следуют из идемпотентности мат-
риц U и W. Действительно, по теореме эквивалентности, из очевидного
равенства
VA — U
WA
заключаем, что
так что выполнены равенства VA = U и WA = О.
Следствие. Матрицы AV и VA идемпотентны, а матрицы А и V
взаимно полуобратны.
о По таблице умножения, AV = W', VA = U, a W' и U идемпотентны.
Кроме того, AVA = AU = A, VAV = UV = V и А, V взаимно полуобрат-
ны.
88
ГЛАВА 8. МЕТОД ГАУССА
Следствие. Подпространства АДА) n C(V) и JV(V) п С(А) триви-
альны.
о Если AY = О и Y = VX, то (ввиду равенства V = VAV) имеем:
Y = VX = (VAV)X = VA(VX) = V(AY) = О.
Аналогично, с учетом равенства А = AVA, устанавливается дизъюнкт-
ность подпространств АДУ) и С (А). <з
Как показывает следующая теорема, роль дискриминанта W состоит в
том, что значение WY позволяет сделать вывод о разрешимости урав-
нения АХ = Y.
Теорема 8.17. Условие WY = О необходимо и достаточно для разре-
шимости уравнения АХ = Y. Если оно выполнено, то решения уравне-
ния имеют вид X = VY + U'P, где Р — матрица свободных парамет-
ров.
о Пусть Y = АХ. Тогда, согласно таблице (8.6), выполнены равенства
WY = W(AX) = (WA)X = О. Убедимся, что X = VY + U'P удовлетво-
ряет уравнению АХ = Y. Действительно, из соотношений (8.6) следует,
что АХ = (AV)Y + (AU')P = W'Y = Y — WY = Y. Покажем, что равен-
ство X = VY + U'P дает все решения уравнения. Пусть Хо — одно из
решений. Взяв за матрицу параметров Р матрицу Хо, найдем, что
VY + U'P = VY + (Е - VA)X0 = Хо - V(AX0 - Y) = Хо .
Утверждение доказано.
Замечание. Последнее предложение аналогично Теореме 8.12 (стр. 82), но отли-
чается от нее универсальностью: тогда как Теоремой 8.12 удобно пользоваться для
уравнения с конкретной правой частью Y = В, формула X = VY + U'P пригодна
сразу для всех разрешимых уравнений АХ = Y с общей матрицей А в левой части.
Следствие. Пространство столбцов матрицы А совпадает с нулъ-
пространством Af(W) ее дискриминанта W.
о Принадлежность Y пространству С (А) равносильна разрешимости
уравнения АХ = Y, которая, в свою очередь, равносильна принадлеж-
ности Y пространству JV(W). <i
Важное свойство инверсора V выясняется в следующем предложении.
8.8. КРИТЕРИИ ОБРАТИМОСТИ
89
Следствие. Если матрица А обратима, то V = А А
о Это вытекает из Теоремы 7.7 и Следствия 8.7 Теоремы 8.16.
Упражнение. Найдя гауссову форму матрицы
1-2-1 2 3 1 0 0 0 0
-1-1 1 2 -1 0 10 0 0
[С|Е] = 1-1012 0 0 10 0
110-11 0 0 0 10
1 0 0 0 1 0 0 0 0 1
проверьте, что U = Е, W — О и
0 0-1-1 3
11-2 2 0
V = -1 0 2 0 - 1 = С-1.
11-2 1 1
0 0 1 1 - 2
8.8 Критерии обратимости матрицы
Установить (или опровергнуть) существование матрицы А-1, исходя из
той или иной информации о матрице А, помогают признаки обратимо-
сти, предоставляемые следующей теоремой.
Теорема 8.18. Пусть А — квадратная матрица. Перечисленные ниже
высказывания равносильны:
(а) у матрицы А существует левая обратная;
(Ь) уравнение АХ = О имеет единственное решение;
(с) гауссова форма А является единичной матрицей;
(d) ранг матрицы А совпадает с ее порядком;
(е) уравнение АХ = В разрешимо при любой правой части;
(f) у матрицы А существует правая обратная;
(g) существует А-1.
о Доказательство построим по следующей циклической схеме:
(a)^(b)^(c)^(d)^(e)^(f)^(g)^(a).
90
ГЛАВА 8. МЕТОД ГАУССА
(а)=>(Ь). Умножая слева обе части равенства АХ = О на левую обрат-
ную к А матрицу, находим, что X = О.
(Ь)=>(с). Согласно правилам умножения (8.6), матрица U' удовлетворяет
уравнению AU' = О, имеющему (по условию) только решение U' = О.
Следовательно, U = Е — U' = Е.
(c)^(d). Пусть п — порядок матрицы А. Из оценки Теоремы 8.9 и
таблицы (8.6) имеем п = rk(E) = rk(U) = rk(VA) < rk(A) < п, отку-
да rk(A) = п.
(d)^>(e). Поскольку п = rk(A) — число элементов в базе набора столбцов
{Ai... Ага}, все п столбцов независимы и по ним можно разложить лю-
бой элемент координатного пространства S". Следовательно, для произ-
вольной матрицы В размера п х к все уравнения АХ7 = В, разрешимы.
(e)=>(f). Если уравнение АХ = В разрешимо при любой правой части,
то, в частности, разрешимо и уравнение АХ = Е, так что матрица А
имеет правую обратную.
(f)^>(g). К настоящему моменту установлена импликация (a)=>(f), т. е.
доказано: если у матрицы есть левая обратная, то есть и правая. По
условию (f), S — правая обратная для А, тогда А — левая обратная для S
и у S есть правая обратная: AS = SA = Е. Согласно Теореме 7.6, А = А,
так что AS = SA = Е, т. е. S = А-1.
(g)=>(a). Импликация тривиальна.
Глава 9
Линейное отображение
Теорема о ранге и дефекте. — Условия изоморфизма. — Критерии
обратимости оператора. — Сопряженное пространство. — Матри-
ца отображения. — Вычисление ранга. — Двойственность опера-
ций над отображениями и матрицами.
9.1 Основные определения
Определение. Пусть X, У — линейные пространства над общим полем
скаляров S. Функция F : X —> У называется линейным отображением
из У в У, если для любых Ai, А2 е S и ад, т2 е X выполнено равенство
F(AiTi + А2т2) = Ai.F'(ti) + A2F(t2).
Пример. Если X = У — V (пространство всех полиномов), то соответствие
F '.pi-^p1, сопоставляющее каждому полиному р его производную р', очевид-
но, является линейным отображением из X в у.
Так как линейные отображения — это прежде всего функции, то для
них определены «поточечно» выполняемые алгебраические операции.
Определение. Произведением отображения F на скаляр А называется
отображение (AF)(t) = А F(x) (очевидно, линейное).
Определение. Суммой F + G отображений б \ X У \\ G \ X У
называется линейное отображение х i—> F(x) + G(x).
Упражнение. Проверьте, что множество hom(X, У) всех линейных отобра-
жений из X в У с определенными выше умножением на скаляр и сложением
является линейным пространством.
91
92
ГЛАВА 9. ЛИНЕЙНОЕ ОТОБРАЖЕНИЕ
Определение. Пусть X —> У —> Z — два линейных отображения. Ра-
венством (FoG*) (ж) = F(G*(t)) определяется композиция FoG функций
F и G*, называемая произведением F на G.
Упражнение. Проверьте, что произведение FoG является линейным отоб-
ражением из X в Z.
Замечание. Подобно тому, как в анализе мы часто опускаем функциональные
скобки (sinх, Inх наряду с sin(x), 1п(т)), в алгебре образ F(x) элемента х обычно
записывается как Fx. Символ композиции в записи произведения опускается всегда,
подобно знаку умножения в элементарной алгебре. Всюду в дальнейшем FG = FoG.
Теорема 9.1. В ситуациях, представленных диаграммами
Х^,уГ,2 и
g2 f2
выполнены равенства F (Gn-I-G^) = F G\-\- F G2 и (F\-\- F^G = F\G F2G.
о Для x e X, согласно определениям произведения, суммы и свойству
линейности отображения F, имеем
(F(G*i + G*2))(t) = F((G*i + G*2)(t)) =
= Ftfi^x) + G*2(t)) = F(G*x(t)) + F(G*2(t)) =
= (FGJ(x) + (FG*2)(t) = (FG*i + FG2)(x) .
Ввиду произвольности x, первое равенство установлено. Второе доказы-
вается аналогично.
Теорема 9.2. Для последовательных отображений W X У Z
произведения (FG)H и F(GH) совпадают.
о Для w е W, по определению произведения линейных отображений,
((FG)H)w = (FG)(Hw) = F(G(Hw)) = F((GH)w) = (F(GH))w.
Ввиду произвольности w, равенство установлено.
Определение. Ядром ker F отображения F : X —> У называется множе-
ство всех элементов пространства X, переводимых функцией F в нуль.
Упражнение. Покажите, что kerF — подпространство в X.
Определение. Если подпространство ker F конечномерно, его размер-
ность называют дефектом отображения: def F = dim(kerF).
9.2. ИЗОМОРФИЗМЫ
93
Определение. Образом imF отображения F : X —> У называется
множество значений функции F.
Упражнение. Покажите, что imF — подпространство в у.
Схема общего линейного отображения F : X —> У
Определение. Если подпространство imF конечномерно, его размер-
ность называют рангом линейного отображения: rkF = dim(imF).
Упражнения.
1. Опишите ядро и назовите дефект отображения из примера 9.1, стр. 91.
2. Пусть х* — решение неоднородного уравнения Fx — у. Покажите, что для
любого его решения х найдется единственный элемент xq из ker F такой, что
X — X* + Xq.
9.2 Изоморфизмы
Определение. Линейное отображение F : X —> У называется изомор-
физмом из пространства X в пространство У, если ker F = {$}, а
im F = У.
Упражнение. Пусть X У Z — два изоморфизма. Покажите, что их
произведение FG — изоморфизм из X в Z.
Замечание. Пусть отображение Fq является сужением изоморфизма F : X —> X
на Xq Q X. Поскольку kerFo — ker F = {$}, то Fq является изоморфизмом из Хо в
подпространство imFo-
94
ГЛАВА 9. ЛИНЕЙНОЕ ОТОБРАЖЕНИЕ
Условие тривиальности ядра запрещает «слипание» образов различных
элементов пространства X, гарантируя тем самым существование об-
ратного отображения F-1 : У —> X. Таким образом, изоморфизм можно
определить как линейное взаимно однозначное отображение X на У (ли-
нейную биекцию пространств).
Теорема 9.3. Если F — изоморфизм из X в У, то F-1 : У X явля-
ется изоморфизмом из У в X.
о Проверим линейность отображения F 1. Для произвольных у-^ из У
ввиду условия imF = У можно указать такие элементы из X, что
У1 = Fx-у и у2 = Fx2- По свойству линейности F, для произвольных
скаляров Л12 выполнено равенство
F(AiTi + Л2Т2) = AiF(ti) + A2F(t2) = А1Щ + А2Д2,
из которого немедленно следует соотношение
F 1 : А1Щ + Х2У2 1—> X]Xi + А2т2 = AiF + A2F гу2-
Ядро F-1 тривиально: при F~ry = 0, у = F^F^y) = F0 = 0. <i
Пример. Базис {&i, ..., bn} задает отображение <2ьСД — [А(ж)... /Зга(х)]т,
очевидно, линейное. Покажем, что imQb = Ж". Действительно, для любого
столбца [xi... хДт можно указать элемент х — Xi&i + + хпЪп простран-
ства X, из координат которого в базисе b составлен этот столбец. Тривиаль-
ность же ker Qb равносильна тому очевидному обстоятельству, что только
нулевой вектор 0 может иметь нулевой столбец координат.
Определение. Построенный выше изоморфизм будем называть ко-
ординатным изоморфизмом и обозначать через Q (без индекса, если
ясно, о каком базисе идет речь).
Определение. Говорят, что пространство X изоморфно пространству У
и пишут X ~ X, если существует изоморфизм из X в у.
Теорема 9.4. Изоморфность линейных пространств является отно-
шением эквивалентности.
о Тождественное отображение F — очевидный изоморфизм из X в X,
так что X ~ X и отношение изоморфности рефлексивно.
9.3. ТЕОРЕМА О РАНГЕ И ДЕФЕКТЕ
95
Если X ~ У, то существует изоморфизм F из пространства X в У. Но
тогда F-1 — изоморфизм из У в X, т. е. X ~ У и отношение симмет-
рично.
Если X ~ У и У ~ Z, то найдется цепочка изоморфизмов X У —> Z,
так что FG реализует изоморфность X ~ Z, устанавливая тем самым
транзитивность рассматриваемого отношения. <з
Теорема 9.5. Пространство У изоморфно конечномерному простран-
ству У тогда и только тогда, когда У конечномерно и dim У = dim X.
о В случае dim X = 0 доказательство тривиально. Пусть в случае нату-
ральной размерности X ~ У и F — соответствующий изоморфизм. Взяв
в X какой-либо базис а = {«i, ..., ап}, составим набор b = {61, ..., bn}
из образов bj = Faj элементов а и покажем, что это базис У.
Пусть у — произвольный элемент пространства У. По определению изо-
морфизма, найдется х е X такой, что у = Fx. Разлагая х по базису а и
пользуясь линейностью F, получаем представление у линейной комби-
нацией элементов набора Ь: у = Fx = F (Е otjUj) = Е ajFaj = Е otjbj.
что и доказывает полноту набора Ь. Проверим его независимость.
Пусть Е Xjbj — нулевая комбинация элементов набора Ь. Покажем, что
она тривиальна. Действительно, F (Е XjUj) = Е XjFaj = Е Xjbj = 0.
Следовательно, Е XjUj е kerF = {0}, комбинация Е XjUj независимых
элементов Uj нулевая и все Xj — нули.
Итак, b — базис У и dim У = п = dim X. Пусть dim У = dim X = п. Если
взять два базиса а = {«i, ..., ап} и b = {61, ..., bn} в пространствах X
и У соответственно, то координатные изоморфизмы Qa и позволят
написать соотношения X ~ S" ~ У. По транзитивности, X ~ У.
9.3 Теорема о ранге и дефекте
Содержание первой части доказательства Теоремы 9.5 можно передать
фразой: «изоморфизм переводит базис в базис». А Замечание на стр.93
позволяет обобщить это предложение, сказав: «сужение Fo изоморфиз-
ма F на подпространство Хо X сохраняет размерность Хо, переводя
всякий базис этого подпространства в базис образа Fo».
Теорема 9.6. Для линейного отображения F из конечномерного X в
произвольное У выполнено равенство rk F + def F = dim X.
96
ГЛАВА 9. ЛИНЕЙНОЕ ОТОБРАЖЕНИЕ
о Обозначим Хо = ker F и X* = im F. По теореме о прямом допол-
нении, существует подпространство X* X такое, что X = Хо Ф X*.
Обозначив F* сужение F|X* отображения F на подпространство X*,
проверим, что F* является изоморфизмом из X* в X*- Для любого у*
из X* найдется такой ж, что у* = Fx. По определению прямой суммы,
х = х0 + ж*. Но тогда
у* = Fx = F(t0 + Ж*) = Fx0 + Ft* = Ft* = F*t* ,
откуда imF* = X* = imF. Выберем т* e ker F* cz ker F. Взяв tq = — t*,
получим 0 = Tq + т*. Из единственности разложения нуля по прямым
слагаемым заключаем, что т* = 0. Таким образом, kerF* = {0} три-
виально nF* — изоморфизм. По теореме о размерности прямой суммы
и с учетом сохранения размерности при изоморфизме F* приходим к
цепочке равенств
dim X = dim(Xo Ф X*) = dim Хо + dim X* =
= dim(ker F) + dim X* = def F + dim(im F) = def F + rk F ,
завершающей доказательство теоремы.
Теорема 9.7. Для линейного отображения F : X —> X из п-мерного
пространства X в произвольное пространство X следующие три утвер-
ждения равносильны:
(dimX = ^ (dimX = ^
(а) г - изоморфизм (о) < (с) <
I rk F = п I def F = О
о Доказательство проведем по схеме (а) =^> (6) =^> (с) =^> (а).
(а) =^> (6) : По определению изоморфизма, imF = X, а так как изомор-
физм сохраняет размерность (см. стр. 95), то dimX = п. Кроме того,
rk F = dim(im F) = dim(X) = n
(6) =^> (с) : Действительно, согласно теореме о ранге и дефекте, выпол-
нено равенство def F = dim X — rk F = n — n = 0.
(с) =^> (a) : Проверим, что kerF = {d}, a imF = X- В самом деле,
по определению дефекта, dim(kerF) = def F = 0, т. е. ker F = {d}. Да-
лее, по теореме о дополнении, X = imFф^, где Z — дополнение imF
9-4- СОПРЯЖЕННОЕ ПРОСТРАНСТВО
97
до У. Применяя теорему о ранге и дефекте, устанавливаем тривиаль-
ность пространства Z'.
dim Z = dim У — dim(im F) = n — rk F = dim X — rk F = def F = 0.
Следовательно, У = imF и теорема доказана.
Определение. Линейное отображение F : X —> X называется линей-
ным оператором. Если оператор F является изоморфизмом, то он на-
зывается обратимым, а изоморфизм F-1 называется обратным опера-
тором для F.
Теорема 9.8 (критерии обратимости). Для произвольного линейного опе-
ратора F : X —> X в п-мерном пространстве У следующие утвержде-
ния равносильны:
(а) оператор F обратим;
(b) rkF = dimX;
(с) def F = 0.
о Это — переформулировка только что доказанной теоремы примени-
тельно к частному случаю У = X.
9.4 Сопряженное пространство
Определение. Векторное пространство, состоящее из всевозможных
линейных числовых функций на X обозначают X* и называют сопря-
женным к X или дуальным к X пространством. Элементы простран-
ства X* называют линейными функционалами. Применяют и такие си-
нонимы как линейные формы и ковекторы.
Пример. Определенный формулой 6 : / н-> /(0) функционал на C(R) назы-
вается дельта-функцией Дирака.
Теорема 9.9. Координатная функция является линейной формой.
о Пусть bi... bn — какой-то базис X и Д ... /Зп — координатные функ-
ции, порождаемые этим базисом. По определению функций /3j, имеет
место равенство Хх + цу = Е (5j(Xx + yy)bj. Складывая почленно разло-
жения Хх = Е X/3j(x)bj и цу = Е y/3j(y)bj, получаем следующее равен-
ство: Хх + цу = Е(А/37(т) + y/3j(y))bj. Из единственности разложения
по базису bi... bn вытекает, что (ЗДХх + цу) = Х(ЗДх) + y/3j(y), т. е. /3j —
линейная форма.
98
ГЛАВА 9. ЛИНЕЙНОЕ ОТОБРАЖЕНИЕ
Теорема 9.10. Функционалы (3-]_, ..., (Зп образуют базис в X*.
о Убедимся в независимости функционалов (3j. Вычислим значение
комбинации /3 = Л1Д + + Хп/Зп на векторе Ьг. Так как Д(6Г) = dir, то
/3(ЬГ) = S Аi/3i(br) = Хг. Таким образом, если комбинация (3 нулевая, то
она тривиальна.
Убедимся теперь в полноте набора Д, ..., (Зп. Пусть е X*. Для лю-
бого х из X выполнено равенство р(х) = (Е (3j(x)bj) = У Д(т)<д(67).
Следовательно, = У p(bj)/3j е врап{Д, ..., /Зп}. <i
Следствие. Размерность пространства, дуального к конечномерному
пространству X, равна размерности X.
Определение. Базис {Д, Д} пространства X*, составленный из
координатных функций, порожденных базисом {Д, bn} простран-
ства X, называется дуальным к базису {Д, ..., bn}.
Итак, каждому базису основного пространства естественным образом
сопоставлен базис сопряженного пространства. Закономерно поинтере-
соваться, всякий ли заданный в сопряженном пространстве базис можно
рассматривать как дуальный к некоторому базису основного простран-
ства? Положительный ответ на этот вопрос дает следующая
Теорема 9.11. Пусть заданы функционалы оа, ..., сип, образующие ба-
зис пространства X*. Всегда существует базис а17 ..., ап простран-
ства X такой, что порождаемые им координатные функции совпада-
ют с заданными функционалами otj.
о Рассмотрим отображение F : X —> S", заданное равенством
Fx = У aj(x)Ej , (9-1)
в котором Ej — элементы стандартного базиса S" (столбцы единичной
матрицы Е) и проверим тривиальность ядра ker F. Если Fxq = О, то
комбинация независимых векторов Е7 нулевая и, следовательно, все ее
коэффициенты — нули. Пусть теперь р — произвольный линей-
ный функционал. Поскольку функционалы ..., ап образуют базис
пространства X*, можно разложить р по этому базису р = У и
тогда всякий линейный функционал обращается на элементе Xq в нуль:
^(ж0) = У XjOtj(x0) = 0. В частности, в нуль обращаются все коорди-
натные функции, порождаемые произвольным базисом пространства X.
Итак, Xq = 0, т. е. ядро отображения F тривиально.
9.5. МАТРИЦА ОТОБРАЖЕНИЯ
99
Далее, поскольку dimX = dimX* = п = dimSn, отображение F являет-
ся изоморфизмом. Элементы а? = F-1Ej составляют базис в X (так как
изоморфизм F-1 переводит базис в базис). Применяя F-1 к обеим ча-
стям равенства (9.1), видим, что х = Е аДт)Е-1Е7 = Е а7(т)а7 для
всех ж, т. е. базис «1, ..., ап дуален к базису а^, ..., ап.
Замечание. Базис а±, ..., ап функционалами otj определяется однозначно. Дей-
ствительно, пусть ci, ..., сп — еще один базис пространства X с теми же координат-
ными функциями aj. Заменяя в тождестве х = S аДа?)с^ элемент х на aj, видим, что
dj Е Е SijCi ^'.i ‘
9.5 Матрица отображения
Координаты х в каком-либо базисе линейного пространства служат сред-
ством представления вектора х одномерным числовым массивом. Об-
разно выражаясь, столбец координат является «числовым портретом»
вектора. Подобно тому, как одно и то же лицо в разных ракурсах име-
ет разные портреты, одному и тому же вектору в различных базисах,
вообще говоря, сопоставляются различные столбцы координатного про-
странства.
Желание создать числовой портрет линейного отображения приводит к
понятию матрицы этого отображения. Во-первых, портрет оказывает-
ся двумерным, во-вторых, для его создания уже недостаточно одного
базиса.
Ниже Ха — обозначение линейного пространства X, в котором выделен
базис а = {щ, ..., ат}. Соответственно, Хь обозначает пространство У с
базисом b = {61, ..., Ьп}. Пусть F — линейное отображение из Ха в Хь-
Разлагая образы элементов а по базису b пространства значений Хь,
получаем равенства
п
Fdj = Е ^bi (1 < j т) (9.2)
г=1
Определение. Матрица Еац = [<д/7] называется матрицей линейного
отображения F : Ха —> Хь-
Определение. Если F — оператор в Ха, то Fa = Faa называется мат-
рицей оператора F : Ха —> Ха.
Замечание. В определении матрицы Fab содержится следующий «рецепт» ее по-
строения:
100
ГЛАВА 9. ЛИНЕЙНОЕ ОТОБРАЖЕНИЕ
(1) разложить образ у-го базисного элемента пространства определения X по базису
пространства значений X;
(2) коэффициенты разложения записать в j-й столбец Fab-
Другими словами, Fab имеет следующую столбцовую структуру:
Fab = [QFar... QFam], (9.3)
где Q — координатный изоморфизм пространства 34>-
Примеры.
1. Пусть Е — единичный (тождественный) оператор в пространстве Ха, то-
гда QEaj — Qaj — Ej, так что Еа = Е: в любом базисе матрица единичного
оператора единична.
2. Пусть Е — тождественное отображение из Ха в Хц, тогда столбцы Еац
составлены из координат элементов базиса а в базисе Ь.
Определение. Матрица Еаь тождественного отображения Е из Ха в Хь
называется матрицей замены базиса.
Теорема 9.12 (вычисление ранга). Ранг отображения F : Ха —> 34
совпадает с рангом матрицы Еац.
о Представив образ F в виде span{Fai, ..., Fam}, воспользуемся (в
применении к (ft) уже отмеченным ранее свойством изоморфизма со-
хранять размерность подпространств. С учетом структуры Fab (см. ра-
венство (9.3)) устанавливаем совпадение ранга отображения F со (столб-
цовым) рангом Fab-
dim(span{Fcii, ..., Fam}) = dim(span{(ftFai, • • •, QbF^m}) = rkFab-
Теорема доказана.
Разумеется, кроме вычисления ранга, понятие матрицы отображения
позволяет решать и другие задачи. Одна из них — вычисление коорди-
нат образа элемента по координатам этого элемента.
Теорема 9.13. Пусть F : Ха —> 34- Обозначим X u Y столбцы коор-
динат элементов х и у = Fx в базисах а и b соответственно. Тогда
выполнено равенство Y = FabX.
о Обозначим X = [сд, ..., ат]т и Y = [ft, ..., ft]T. С одной стороны,
у = Е i /3ibi. С другой стороны, элемент у = Fx можно представить
9.5. МАТРИЦА ОТОБРАЖЕНИЯ
101
в виде F^jajPj) = 'LjOCjFaj = S j ajXFTijbi = ЕДЕj ^a^bi Ввиду
единственности разложения элемента у по базису, выполнено равенство
Д = S PijOtj. В его правой части — z-й элемент столбца FabX. <з
j
Замечание. Содержание доказанной теоремы можно выразить правилом: «чтобы
найти координатный столбец образа, следует умножить матрицу отображения на
координатный столбец прообраза». Применяя его к отображению В : _Та —> Хь,
получаем правило пересчета координат при замене базиса.
Следствие. Чтобы найти столбец координат вектора в базисе Ь, сле-
дует умножить матрицу Еаь на столбец его координат в базисе а.
Теорема 9.14. Пусть из пространства Ха в пространство 34 дей-
ствуют линейные отображения F и G, а отображение Н = XF + pG
— их линейная комбинация. Тогда в обозначениях F = Fab, G = Gab,
Н = Наь справедливо матричное равенство Н = AF + дС.
о Пусть 7u> Fj — элементы матриц F, G, Н соответственно. Со-
гласно определению матрицы Н линейного отображения 11.
Haj = (XF+yG)aj = XFaj+yGaj = AS Pijbi+y'F Ppbi = S (Ад^+д7^)4 ,
i i i
т.е. r]ij = Xcpij + yr/ij, что и требовалось доказать. <з
Теорема 9.15. Пусть Ха 34 —* Zc — два линейных отображения
и Н = FG. Тогда в обозначениях G = Gab, F = Fbc; Н = Нас выполнено
матричное равенство Н = FG.
о Пусть 7г д Fj — элементы матриц F, G, Н соответственно. Найдем
матрицу Н линейного отображения Н:
Haj = (FG)aj = F^rlrjbr) =
S r 7rjFbr S r X'rj S i tpirC-i S i (S r Tir'Xrj') C-i •
Согласно определению матрицы H, ryj = Er <Д^7д5 т. e. H = FG. <i
Замечание. Последние две теоремы обычно выражают фразами: «матрица ли-
нейной комбинации отображений равна линейной комбинации их матриц» и «мат-
рица произведения отображений равна произведению их матриц». Тем самым под-
черкивается полная аналогия алгебраических действий над отображениями с соот-
ветствующими действиями, выполняемыми над матрицами этих отображений.
102
ГЛАВА 9. ЛИНЕЙНОЕ ОТОБРАЖЕНИЕ
Теорема 9.16. Пусть G — изоморфизм, обратный к изоморфизму F,
т.е. Ха Хь ~► Ха. Тогда FabGba = Е, т.е. матрица отображения,
обратного к изоморфизму, обратна матрице этого изоморфизма.
о Поскольку FG = Е, а матрица единичного оператора в любом ба-
зисе единична, применение теоремы о матрице композиции приводит к
равенству FabGba = Еа = Е. <з
Следствие. Матрицы Еьа и Еаь взаимно обратны.
о Применяя к диаграмме Ха Д- Хь Ха, утверждение теоремы, за-
ключаем, ЧТО EabEba = Е. <3
Теорема 9.17. Пусть F — линейный оператор в пространстве X. То-
гда его матрицы Fa и Fb, вычисленные для двух различных базисов это-
го пространства, связаны равенством EabFa = FbEab-
о Очевидное тождество EF = FE иллюстрируется такой коммутатив-
ной диаграммой:
а к
Е Е
т, Е—к т.
Применяя к этой схеме теорему о матрице композиции, получим нужное
соотношение, которое (ввиду предыдущего Следствия) можно предста-
вить в виде Fb = EabFaEba = E“^FaEba. <]
Определение. Квадратные матрицы А и В подобны, если существует
матрица С такая, что В = С-1 АС.
Используя это определение, можно сформулировать последний резуль-
тат так: «матрицы одного и того же оператора в различных базисах
подобны».
9.6 Задачи
1. Оператор действует в пространстве всех квадратных матриц второго
порядка по правилу А н-> Ат. Найдите матрицу М этого оператора в
базисе 61 = Щ] 62 = [»J] 63 = [?§] b4 = [8?J-
9.6. ЗАДАЧИ
103
2. Пусть А, В — операторы в конечномерном линейном пространстве X,
причем известно, что АВ — изоморфизм. Какой из трех операторов А,
В и В А изоморфно преобразует X?
3. Оператор F действует в пространстве всех многочленов по правилу
F : р н-> р + р' + р" + + р^ +
Докажите, что оператор F-1 существует и найдите прообраз р много-
члена (Fp)(x) = хп.
4. Пусть операторы А, С известны и В — оператор, обратный к Е — С А.
Найдите обратный к Е — АС оператор В, выразив его через А, В и С.
5. Вычислите дефект оператора В, действующего в пространстве всех квад-
ратных матриц порядка п по правилу S : М и-> Мт + М.
6. Вычислите дефект оператора А, действующего в пространстве всех квад-
ратных матриц порядка п по правилу А : М н-> Мт — М.
Глава 10
Объем в линейном пространстве
Определение и простейшие свойства. — Признак независимости
векторов. — Теорема пропорциональности. — Формула Крамера.
— Существование объема. — Детерминант оператора. — Детерми-
нант и разрешимость линейного уравнения.
10.1 Аксиоматизация объема
Перед тем, как определить понятие «объем параллелепипеда» в п-мер-
ном пространстве аксиоматически, обсудим мотивировку аксиоматики
на примере трехмерного пространства X, элементами которого являют-
ся векторы в обычном геометрическом смысле этого слова, т. е. направ-
ленные отрезки. Будем воспринимать тройку векторов а, 6, с как тройку
исходящих из одной вершины направленных ребер параллелепипеда с
объемом (абс). Объем как числовая функция трех векторных аргумен-
тов X х X х X —> R обладает естественными алгебраическими свойства-
ми однородности и аддитивности. Однородность выражается в том, что
при растяжении одного из ребер параллелепипеда в Л раз во столько
же раз возрастает его объем: (пб(Ас)) = X(abc). Свойство аддитивно-
сти поясняется рисунком, изображающим две стопки писчей бумаги с
одинаковым числом листов в каждой. Объем левой выражается суммой
(abci) + (п6с2), тогда как объем правой стопки равен (a6(ci + с2)).
104
10.1. А КСИ ОМ А ТИЗА ЦИЯ ОБ ЪЕМА
105
а а
К аддитивности объема
Одновременное наличие у объекта однородности и аддитивности, как
известно, называется свойством линейности этого объекта. Сформули-
руем теперь три основные свойства функции «объем», дав, тем самым,
этому понятию аксиоматическое определение.
Определение. Пусть X — конечномерное пространство над полем ска-
ляров S. Заданная на X" и принимающая значения в S функция п век-
торных аргументов (яд тга) называется объемом в X, если
(1) эта функция линейна по каждому аргументу;
(2) при совпадении двух аргументов она обращается в нуль;
(3) она не является тождественно нулевой: (яд хп) 0 0.
Замечание. Аксиома (1) комментировалась выше, аксиома (2) означает, что при
совпадении двух исходящих из одной вершины ребер параллелепипед вырождается,
наконец, аксиома (3) требует существования параллелепипедов ненулевого объема.
Последующие свойства объема представляют собой уже теоремы.
(4) при перестановке двух аргументов объем умножается на (—1);
(5) при добавлении к одному из аргументов комбинации остальных
объем не меняется;
(6) набор элементов 61, ..., bn независим тогда и только тогда, когда
объем (61 Ьп) отличен от нуля;
(7) если некоторая функция, обладающая свойствами (1) и (2), обра-
щается в нуль на независимом наборе, то это — нулевая функция;
(8) если функция (яд хп) линейна по каждому аргументу и обраща-
ется в нуль при совпадении соседних аргументов, то существует един-
ственный скаляр А такой, что (яд хп) = А (яд хп) тождественно;
(9) порождаемые базисом 61, ..., bn координатные функционалы /3j
удовлетворяют тождеству /3j(x)(bi -bn) = ( bj_± х bj+i ).
106
ГЛАВА 10. ОБЪЕМ
Определение. Числовые функции к векторных аргументов, облада-
ющие свойствами (1) и (2) называют антисимметричными к-форма-
ми. Имея в виду аксиому (2) или равносильное ей свойство (4), говорят
об антисимметричности объема. Свойство (6) представляет собой кри-
терий независимости набора из п элементов n-мерного пространства.
Свойство (8) назовем теоремой о пропорциональности объемов, а свой-
ство (9) — формулой Крамера1).
Замечание. Свойство (5) можно охарактеризовать как неизменность объема па-
раллелепипеда при деформации сдвига, производимого параллельно одной из гра-
ней. Пропорциональность объемов показывает, что различных объемов в простран-
стве не так много: если объявить объем некоторого «эталонного» параллелепипеда
единичным, то объемы всех параллелепипедов тем самым будут заданы однозначно.
Знакопеременность объема, на первый взгляд противоречащая привычному о нем
представлению, не только не является недостатком теории, но напротив, оборачи-
вается преимуществом, подобным возникающему в арифметике при введении в нее
отрицательных чисел или в физике при введении разноименных зарядов.
10.2 Простейшие свойства объема
Теорема 10.1 (об антисимметричности). При перестановке любых двух
аргументов объем умножается на (—1).
о Действительно, раскрывая скобки, по аксиоме (2) получаем
О = ( (а + Ь) (а + Ь) ) =
= (а---а---) + (---а---6---) + (---6---а---) + (---6---6---) =
= ( а b ) + ( b а ).
Следовательно, ( а b ) = — ( b а ). <1
Теорема 10.2 (о сдвиге). При добавлении к произвольному аргументу
линейной комбинации остальных объем сохраняется.
о Прибавим к элементу Хк линейную комбинацию остальных и рас-
i) Cramer, Gabriel (1704-1752) — швейцарский математик
10.2. ПРОСТЕЙШИЕ СВОЙСТВА ОБЪЕМА
107
кроем скобки по свойству линейности:
( -Ek—1 ( Т S ) ^к+1 )
\ V jAk JJ /
( ' ' ' ^к—1%к %к+1 ' ) Т S ' %k—l%j %к+1 ' ' ' )
jAk
= ( Хк_ГХкХМ ) ,
поскольку в каждой скобке, стоящей под под знаком суммирования, при-
сутствуют два одинаковых элемента. <з
Теорема 10.3 (о нулевой форме). Антисимметричная п-форма, нуле-
вая на базисном наборе элементов 61, ..., Ъп, равна нулю тождествен-
но.
о Разложим каждый элемент хк произвольного набора ад, ..., хп по
базису 61, ..., Ьп и вычислим значение объема (ад хп), раскрывая скоб-
ки по свойству линейности. Каждое из образовавшихся пп слагаемых бу-
дет нулевым: одни потому что содержат одинаковые базисные элементы,
другие — потому что содержат сомножитель, лишь перестановкой аргу-
ментов отличающийся от (61 -bn). Итак, условие теоремы приводит к
тождеству (ад хп) = 0.
Теорема 10.4 (признак независимости). Набор 61, ..., bn в п-мерном
пространстве независим тогда и только тогда, когда (61 • -bn) Ф 0.
о Покажем сначала, что условие (61 • • • 6га) Ф 0 влечет независимость
набора 61, ..., Ьп. Действительно, 61 Ф 0 и, если какой-то элемент bk
является комбинацией предыдущих, то
(61 bn) (61 bk—i(s j=i Xjbj)bk^i • • • bn)
= S kjZi ^j(bi bk_1bJbk+1 bn) = о,
поскольку в каждом слагаемом есть, как минимум, два одинаковых эле-
мента.
Обратно, пусть 61, ..., bn — независимый набор. Так как число элемен-
тов в нем равно размерности пространства, то набор этот — базис X и
предположение (61 bn) = 0 (по теореме о нулевой форме) приводит к
противоречию с аксиомой (3).
108
ГЛАВА 10. ОБЪЕМ
Теорема 10.5 (пропорциональности). Пусть функция (ад ад) ли-
нейна по каждому аргументу и обращается в нуль при совпадении со-
седних аргументов. Существует единственный скаляр Л такой, что
выполнено тождество (ад хп) = А(ад хп).
о Покажем вначале, что при перестановке соседних аргументов функ-
ции ее значение умножается на (—1). Действительно, раскрывая скобки
в равенстве ( (а + Ь)(а + Ь) ) = 0, имеем
( аа ) + ( ab ) + ( Ьа ) + ( bb ) = 0.
Крайние слагаемые левой части, по условию теоремы, исчезают, отку-
да следует, что ( ab )=—( Ьа ). Теперь покажем, что при
совпадении любых двух аргументов функция (ад хп) обращается в
нуль, т. е. является антисимметричной. Пусть совпадающие аргументы
разделены какими-то к другими. Последовательно переставляя сосед-
ние аргументы, получим: {-а---а--- ) = (—l)fc( аа ) = 0.
Взяв произвольный базис 61, ..., bn, образуем из двух антисимметрич-
ных форм третью: [ад хп] = (ад xn)(bi bn) — (bi ЬДДщ xn).
Поскольку [bi bn] =0, форма [ад xn] — нулевая, так что
(xi xn)(bi 6ra) = (6X bn)(xi xn).
Разделив обе части на (6i • • • bn) Ф 0, видим, что А = (bi 6ra)/(6i bn).
Единственность А очевидна: из тождества (ад хп) = А (ад хп) и ана-
логичного ему тождества (ад хп) = д(ад хп) немедленно следует,
что (А — д)(ад хп) = 0 и, поскольку форма (xi---xn) ненулевая, с
необходимостью А = д.
Теорема 10.6 (Крамер). Для координатных функций (dj, порождаемых
базисом 61, ..., Ьп, выполнено тождество
!3j(x)(bi 6га) = (6i 67-1 х bj+i ---bn).
о Как следует из представления х = £^=i А(ж)6г, для любого х
(61 67-1 х bj+i bn) = (6i 6j_i (£ ™=1 (3i(x)bi) bj+i -bn) =
£ i=i {di(%) ( bj—i bj bj-^-i ) {dj (x) (6i bj—i bj bj-^-i bn),
поскольку в каждое из остальных слагаемых заведомо входят по мень-
шей мере два одинаковых элемента.
10.3. СУЩЕСТВОВАНИЕ ОБЪЕМА
109
10.3 Существование объема
До сих пор мы извлекали следствия из аксиом объема, не задаваясь
вопросом о возможности реализации этих аксиом, т. е. о существова-
нии объекта, наделенного декларируемыми свойствами. Следующие две
теоремы устанавливают существование объемов в пространстве любой
натуральной размерности.
Теорема 10.7 (подготовительная). Если в одном из двух изоморфных
конечномерных пространств X ~ У существует функция объема, то
такая функция существует и в другом из них.
о Пусть (щ уп) — объем в пространстве У и F : X —> У — изо-
морфизм. Покажем, что тогда в пространстве X также существует объ-
ем. Рассмотрим антисимметричную форму <дд хУ) = (Fxi Fxn}
и покажем, что она отлична от тождественного нуля. Пусть 6Х, ..., bn
— какой-то базис в у. Так как отображение F-1, как и всякий изо-
морфизм, переводит базис в базис, элементы aj = F Чц образуют ба-
зис в X. Форма <YX хп~), принимает на этом базисе ненулевое значе-
ние: (di аУ) = (Fai Fan) = (6Х • • • bn) ф 0. Следовательно, для
<YX хУ) выполнены все аксиомы объема. <1
Теперь достаточно установить существование объема в координатном
пространстве S", поскольку любое n-мерное пространство над полем S
ему изоморфно.
Определение (объем в S1). Стандартный объем |Х| «набора», состоя-
щего из единственного элемента X е S определим равенством |Х| = X.
Собираясь определить стандартный объем в S1+n = S х Sn индуктивно,
будем записывать элементы этого пространства в виде
где х е S , X е Г .
Очевидно, что У : Y н-> у — линейная форма на S1+n, а В : Y X -
линейное отображение из S1+n в S".
Определение. Считая, что стандартный объем |ХхХ2 Хга| в Sn уже
определен, для произвольного набора п + 1 элементов Yo Yra коорди-
натного пространства S1+n определим стандартный объем рекурсивной
110
ГЛАВА 10. ОБЪЕМ
формулой разложения:
|Y0 Yra| = xo|XiX2 Xn| — xi |Х0Х2 Хга| +
+ X2IX0X1 Хга| — + (—l)nXn|X0Xi Хп_11.
Теорема 10.8 (существования). Стандартный объем в S1+n является
антисимметричной (п+1) -формой, принимающей значение 1 на стан-
дартном базисе этого пространства.
о Входящие в правую часть формулы разложения функции
+p(Y0 YJ = хр | Хр_хХр+1 | = ДYp) | B(Yp_1)B(Yp+1) |
линейны по каждому аргументу Ym. В самом деле, если значение индек-
са р отлично от т, то <др(- Ym ) = | • • • B(Ym) | и <рр линейна
по ¥ш как композиция двух линейных функций. Внешней функцией
этой композиции является стандартный объем в S" (линейный по пред-
положению индукции), а внутренней — линейное отображение В. Ли-
нейность же (рт обеспечена линейностью формы (5:
'' Ym ) = Д Ym) I B(Ym_x)B(Ym+1) I = C /3(Ym).
Из того, что комбинация линейных форм сама является линейной фор-
мой, следует линейность стандартного объема
|Y0 • • • Y„| = Sp=0(—l)p<pp(Yo • • • Y„)
по каждому его векторному аргументу. Тем самым, выполнена аксио-
ма (1). Убедимся в антисимметричности стандартного объема. Пусть
два соседних аргумента Ym и Ym+i совпадают. Тогда Хт = Хт+i и
Хш = Xm+i. Согласно предположению индукции, форма |XiX2---Xn|
антисимметрична, так что правая часть формулы разложения сводит-
ся к сумме двух слагаемых, отвечающих значениям индекса р = т и
р = т + 1:
(-1)’"х™| • • •хго_1х,„+1хго+2 • • • I + (-1)’"+Дго+1| • хт_1хтхт+2 • • • |.
Сумма эта, очевидно, равна нулю. Таким образом, антисимметричность
стандартного объема установлена. Чтобы проверить, что выполнена ак-
сиома (3), вычислим значение формы |Y0 Yn| на стандартном базисе
10.4- ДЕТЕРМИНАНТ ОПЕРАТОРА
111
пространства S1+n, предполагая, что |Ei Ега| = 1 на стандартном ба-
зисе пространства S" . По формуле разложения,
|G0 Gn| = 1 |ЕХ Еп|-0-1Eo En| + - +(-If -0-|O En_x| = L
Существование объема в пространстве S1+n установлено.
10.4 Детерминант оператора
Теорема 10.9. Для каждого оператора F в конечномерном простран-
стве X и произвольной формы объема (ад хп) существует единствен-
ный скаляр A(F) такой, что на X" выполнено тождество
(Fx-i • Fxn) = A(F) (ад xn).
При этом число A(F) не зависит от выбора объема.
о Линейная по каждому Xj форма (Еад Fxn) антисимметрична,
поэтому первая часть утверждения немедленно следует из теоремы про-
порциональности. Для доказательства инвариантности A(F) относитель-
но выбора объема достаточно сослаться на ту же теорему, согласно ко-
торой, для другого объема [ ад хп] должно выполняться тождество
[ад хп] = д(ад • • • хп), в котором д ф 0. Отсюда
[Fxr • Fxn] = /a(Fx1 • Fxn) = yX(F) (ад ад) = A(F) [ад xn],
так что число A(F) не зависит от выбора формы объема.
Определение. Коэффициент пропорциональности A(F) называется де-
терминантом F и обозначается det(F) или detF.
Пример. Найдем детерминант единичного оператора:
(det F) (ад хп) = (Ехх Ехп) = (ад хп),
откуда det Е — 1.
Замечание. Из определения детерминанта ясен его наглядный смысл, а именно:
если V(7Z) = (ад • • • хп} — объем параллелепипеда П с ребрами Xj и П — парал-
лелепипед с ребрами Fxj , то равенство У (71) = (Еад--- Fxn) = (detF) • V(FF)
показывает, что детерминант оператора F — это коэффициент изменения объема
при деформации пространства, осуществляемой этим оператором.
112
ГЛАВА 10. ОБЪЕМ
Ввиду сделанного замечания, при двух последовательно производимых
деформациях пространства X с коэффициентами ki и к2 объем парал-
лелепипеда сначала изменяется в ki раз а затем еще в к2 раз. Итого, он
изменяется в кД2 раз. Дадим формальный вывод этого геометрически
очевидного факта.
Теорема 10.10. Для произвольных операторов А и В в конечномерном
пространстве выполнено равенство det(AB) = det(A) det(B).
о По определению детерминанта,
det(AB) (ад хп) = (ABxi АВхп) =
= det(A) (Bxi Вхп) = det(A) det(B)( ад хп)
Следовательно, det(AB) = det(A) det(B). <з
Следствие. Если оператор F в конечномерном пространстве обра-
тим, то det В / 0 u det(F-1) ф 0, причем det(F-1) = 1/detF.
о det(F-1) det(F) = det(F-1F) = detF = 1, откуда и следует сформу-
лированное утверждение.
Покажем теперь, что верно и обратное:
Теорема 10.11. Если детерминант линейного оператора F отличен
от нуля, то этот оператор обратим.
о Пусть А, ..., bn — какой-либо базис X. Найдем координату /3j (ж) в
разложении х е ker F по этому базису. По формуле Крамера,
(det F)/3j(t)(6i -bn) = (det F)(6i x bn) =
= (Fbi ---Fx--- Fbn) = (Fbi ---0--- Fbn) = 0.
Все координаты (ЗДх) элемента x оказались нулями, поэтому x = 0 и
ядро оператора F тривиально. Остается сослаться на признак обрати-
мости оператора.
Глава 11
О пре де лите л и
Основные свойства. — Определитель и транспонирование. — Опре-
делитель ступенчатой матрицы. — Формулы Крамера для квад-
ратных систем и для обратной матрицы. — Вычисление детерми-
нанта оператора. — Определитель и ранг.
11.1 Основные свойства
Пусть А — произвольная квадратная матрица порядка п с элементами
из поля скаляров S.
Определение. Определителем | А| матрицы А называется детерминант
оператора А, задаваемого в пространстве S" правилом .1 : X АХ.
Связь нового понятия «определитель» с введенным ранее понятием «объ-
ем» устанавливает следующая
Теорема 11.1. Определитель |А| матрицы А равен значению стан-
дартного объема, вычисленного по набору ее столбцов: | А| = |АХ Ага|.
о Ввиду нормированности стандартного объема и согласно определе-
нию детерминанта оператора,
| А | = det А = (det А) А = (det А) |ЕХ Ега| =
= |АЕХ АЕга| = |АЕХ АЕга| = |АХ Ага|,
что и требовалось.
113
114
ГЛАВА 11. ОПРЕДЕЛИТЕЛИ
Благодаря тому, что определитель при желании можно интерпретиро-
вать и как объем, и как детерминант, ряд его свойств получается про-
стым перечислением ранее установленных свойств этих объектов:
1° определитель |А| линеен по каждому столбцу Aj,-
2° при перестановке двух столбцов матрицы ее определитель умно-
жается на (—1);
3° при добавлении к одному из столбцов линейной комбинации осталь-
ных определитель не меняется;
4° набор столбцов матрицы независим тогда и только тогда, когда
ее определитель отличен от нуля;
5° для произвольных квадратных матриц А и В одного порядка вы-
полнено равенство |АВ| = |А| |В|;
6° если матрица А обладает обратной А-1, то определители обеих
отличны от нуля, причем |А_ 11 = |А|-1;
7° матрица с ненулевым определителем обратима;
8° для матрицы А с элементами верхней строки а0 ... ап выполне-
на формула разложения |А| = £™=0(—1)рор|А^|, в которой А^ —
подматрица, получаемая из А удалением верхней строки и столбца с
номером р.
9° если S = (С и А — матрица, все элементы которой комплексно
сопряжены соответствующим элементам А, то выполнено равенство
|А| = |А| (получаемое индукцией из 8°).
11.2 Транспонирование и определитель
Теперь сформулируем и докажем теорему, позволяющую добавить к это-
му списку ряд дополнительных свойств. Они получаются из перечислен-
ных заменой слова «столбец» словом «строка».
Теорема 11.2. Определитель матрицы М не меняется при ее транс-
понировании: |М| = |МТ|.
о Пусть матрица А с элементами apq транспонирована относительно
матрицы В с элементами (3pq. Двумя способами найдем сумму S всех
чисел вида
од OjS |Ег Ej | |Ег E.s | = fdsj | Er Es | | E; Ej |.
11.2. ТРАНСПОНИРОВАНИЕ И ОПРЕДЕЛИТЕЛЬ
115
Здесь каждый индекс независимо от остальных меняется от 1 до n, а Е&,
как обычно, — столбцы единичной матрицы. Проведем в левой части ра-
венства суммирование сначала по индексам строк, а затем по индексам
столбцов. Пользуясь линейностью и антисимметричностью определите-
ля, с учетом равенства |Ei Ега| = 1 получаем
S = Е Е а1ГЕг Е «JSE7 |Er---Es| = Е |АГ As| |ЕГ Es| = |А|-п!
г... s i j г... s
Аналогично поступая с правой частью равенства, выражаем сумму S
через определитель матрицы В:
S = S S /3„Er---S /За,Еа |Е, • • Ej| = S |Вг • • • Bj| • |Е; • •-Е,| = |В| -п!
i...j г s i...j
Следовательно, |А| = |В|. <з
Следствие. Если матрица А треугольная, то определитель |А| равен
произведению ее диагональных элементов.
о Ввиду сохранения | А| при транспонировании А, достаточно рассмот-
реть случай нижнетреугольной матрицы А порядка п . В соответствии
с формулой разложения, |А| = ац|А(п)|, где А^11) получается из А уда-
лением первой строки и первого столбца. Применяя ту же формулу
к А^11) и последующим подматрицам все меньших порядков, находим,
что IА| = «и «„„. <1
Обобщением этого следствия, весьма полезного при вычислении опре-
делителей, является теорема об определителе ступенчатой матрицы.
Теорема 11.3. Определитель ступенчатой матрицы равен произведе-
нию определителей ее диагональных блоков:
о Отправляясь от очевидных тождеств
и применяя теорему о мультипликативности определителя к произведе-
нию матриц
X С
О Y
Е О
О Y
X С
О Е
приходим к требуемому результату.
116
ГЛАВА 11. ОПРЕДЕЛИТЕЛИ
11.3 Применение определителей
Если А — квадратная матрица порядка п и |А| ф 0, то, как это выше
было установлено, линейная система АХ = Y однозначно разрешима
при любой правой части Y е S". Следующая теорема предоставляет
явную формулу для вычисления элементов столбца неизвестных X.
Теорема 11.4 (Крамер). Пусть матрица А системы АХ = Y с неиз-
вестными %1, ..., хп квадратна, |А| ф 0 и матрица Аг получается из
матрицы А заменой ее г-го столбца столбцом свободных членов Y. То-
гда Xi = |А*|/|А|.
о Поскольку |А| Ф 0, столбцы Ах, ..., Ага матрицы А независимы и
образуют базис пространства S". Как известно, уравнению АХ = Y
можно придать форму Y = %ХАХ + + угаАга. Тем самым, неизвест-
ные Xi можно рассматривать как координаты вектора Y в базисе столб-
цов Ai, Ага: Xi = A(Y). Применяя формулу Крамера из теории
объемов, находим ft(Y) |АХ Ага| = | A^-iYA^+i | = |Аг|, откуда и
следует, что Xi = ЛОО = |А*|/|А|. <з
Теорема 11.5 (формула Крамера для А-1). Пусть |А| ф 0 и матри-
ца Alj получается из матрицы А заменой ее г-го столбца столбцом Е7.
Тогда элементы Xij матрицы А-1 могут быть найдены по формуле
= | A/J |/| А|.
о Будем рассматривать матрицу А-1 = [Хх... Хга] как правую обрат-
ную к матрице А, тогда
[АХ!... АХ„] = A[Xt... Х„] = ДА-1 = Е = [Ej... Е„],
т. е. АХ,, = Ej. Остается применить к этой линейной системе формулу
Крамера из предыдущей теоремы.
11.4 Детерминант и определитель
Теорема 11.6. Детерминант оператора А, действующего в конечно-
мерном линейном пространстве, равен определителю матрицы этого
оператора, вычисленной в произвольном базисе этого пространства.
11.5. РАНГ И ОПРЕДЕЛИТЕЛЬ
117
о Пусть 61, ..., Ьп — произвольный базис X, Q — соответствующий
координатный изоморфизм, А = [Ах... Ап] — матрица оператора А в
базисе 61, ..., Ьп. В таком случае, Q(bj) = a Q(Abj) = Aj. Зададим
форму объема в X равенством (яд хп) = |<5(яд) <5(тга)|, тогда
(V--M = |<Ж)---Ж)1 = |ЕХ - -EJ = i.
По определению детерминанта, находим
det(A) = det(A)(6i -bn) = (A6i Abn) =
= = lAi-.-A^I = |A|,
что и требовалось. <з
11.5 Ранг и определитель
Теорема 11.7. Ранг матрицы равен максимальному порядку ее невы-
рожденных квадратных подматриц.
о Пусть т — максимальный порядок невырожденных квадратных под-
матриц данной матрицы, аг — ее ранг.
Покажем вначале, что т А г. Пусть Q — невырожденная квадратная
подматрица порядка т. Если бы продолжения столбцов Q до столб-
цов исходной матрицы были зависимы, то, очевидно, были бы зависи-
мы и столбцы Q, что противоречит невырожденности этой подматрицы.
Следовательно, продолжения независимы и (столбцовый) ранг заданной
матрицы не меньше т.
Покажем теперь, что г А т. Выделив базу из г столбцов заданной мат-
рицы, получаем подматрицу ранга г, следовательно, строчный ранг этой
подматрицы также будет равен г и можно выделить из нее г независи-
мых строк, образовав тем самым невырожденную квадратную подмат-
рицу исходной матрицы.
11.6 Задачи
1. Пусть А, В — операторы в конечномерном линейном пространстве X,
причем известно, что АВ — изоморфизм. Используя детерминанты,
118
ГЛАВА 11. ОПРЕДЕЛИТЕЛИ
определите, какой из трех операторов ВЛ, А, В изоморфно преобра-
зует X?
2. Найдите все значения z, при которых столбцы матрицы М(г) линейно
зависимы, если
Z О1 02 Гп — 1
Z 0 •• 0
М(г) = 02 0 Z 0
Гп—1 0 0 •• Z
3. Строками квадратной матрицы А (г) являются наборы различных од-
ночленов вида zn такие, что в каждом столбце матрицы присутствует
единица. Докажите, что корни многочлена |А(г)| по модулю больше
Глава 12
Вычисление определителей
Альтернанта Вандермонда. — «Трехдиагональная» матрица. —
Континуанта. — Связь с алгоритмом Евклида. — Формула
Лагранжа-Сильвестра как аппарат функционального исчисления.
12.1 Альтернанта Вандермонда
В различных разделах алгебры и анализа возникает матрица А с эле-
ментами ttij = ж*-1 (1 Z, J п)
1 1 1 1
ЗД 3?2 ' ' ' Хп—х Хп
^п—2 ~,п—2 . . . п—2 п—2
Щ '-''2 ' ' ' ‘-'п —1 ‘-'п
п—1 п—1 . . . п—1 п—1
^1 ’'2 ' ' ' '-ц—1 ''п
так наз. альтернанта Вандермонда. Найдем ее определитель
|А| Vn(xi? • • • ? хп).
Если хотя бы два аргумента функции Vn совпадают, становятся одинако-
выми соответствующие столбцы матрицы и ее определитель обращается
в нуль. Поэтому вычисление определителя Vn(xi,... ,хп) будем прово-
дить в предположении, что все числа Xj различны. Из формулы разло-
жения по элементам последнего столбца, примененной к определителю
119
120
ГЛАВА 12. ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ
P(z) = 4г(ял,... ,жга_1,г), видим, что Р — многочлен степени п — 1 со
старшим коэффициентом 14-1 и корнями яд,... ,xn-i. Следовательно,
P(z) = (z - хг) (z - Tra-1) 14-1
Полагая в этом тождестве z = я?га, мы приходим к рекуррентной фор-
муле 14 = (хп — яд) (хп — xn_i) 14-1, позволяющей (с учетом базового
равенства 14 = х2 — яд) по индукции заключить, что
4г (яд, • • •, я?га) п (яд яд).
j<k
12.2 «Трехдиагональная» матрица
К вычислению определителей этого типа сводится значительное коли-
чество задач. Обозначим через zAi определитель
ai + bi 1 0
a2bi «2 + 4 1
0 азЪ2 «з + 4
«п-2 + 4-2 1 0
Un—ibn—2 «n-i + 4-i 1
0 dnbn—1 an + b.
Представив первую строку суммой [д 0 0] + [4 1 0], используем
аддитивность определителя: zAi = сщдА2 + 4- Здесь Д2 — определитель
матрицы, получаемой из исходной удалением первой строки и первого
же столбца, а 4 — определитель матрицы, получаемой удалением слага-
емого сд в угловом элементе исходной матрицы. Определитель 4 вычис-
лить нетрудно: из каждой j-й строки, начиная с J = 2, следует вычесть
предыдущую, умноженную на сд. В результате получается верхнетре-
угольная матрица с элементами 4, • • •, 4 на диагонали. Следователь-
но, выполнено равенство Z4 = <2iZA2 + 4 • • • 4- Совершенно аналогично
продолжаем его до серии равенств:
zAi = <21Д2 + 4 4
Д2 = (22/Аз + 4 4
1 dn—l^n + 4—14
an -|- bn
12.3. КОНТИНУАНТА
121
Подставляя каждое из них в предыдущее, находим для Z\i выражение
Z\i = (21(22 ’ ’ ’ (2ra_i(2ra + (21(22 ’ ’ ’ ап-1Ьп + • • • + (21^2 ' ' ' Ьп-1Ьп + Ъ^Ъ-2 ’ ’ ’ Ьп-1Ьп.
12.3 Континуанта
Определение. Континуанта [So • • -Яг], построенная по набору поли-
номов So,... , Sn — это определитель «трехдиагональной» матрицы S
такого вида: ’ So 1 0 •• 0 0 0 "
-1 Si 1 •• 0 0 0
0 -1 s2 •• 0 0 0
S =
0 0 0 •• • Sn-2 1 0
0 0 0 •• -1 Sn-1 1
0 0 0 •• 0 -1 sn_
Выбор ненулевого полинома d сопоставляет этой матрице по формулам
рп = Snd, рп_г = Sn_ppn + d, ... pi = Sip2 + Рз, Po = Sopi + p2
пару полиномов p0, Pi таких, что degp0 degpi и gcd(p0,pi) = d.
Обратно, для заданных p0, pi таких, что degp0 degpi вычисление
gcd(p0,Pi) по алгоритму Евклида порождает систему равенств
Ро = SoPi + р2, Pl = S1P2 + Рз, • • •, Рп-1 = Sn_ppn + d, рп = Snd (12.1)
единственным образом определяющую полиномы Sr и d = gcd(p0,pi).
Матрицу S можно рассматривать как основную матрицу системы (12.1)
с неизвестными pi, р2,... ,Рп, d и столбцом свободных членов [р0 0 ... 0]т.
Применяя формулы Крамера, получаем следующее утверждение.
Теорема 12.1. Неизвестные системы линейных уравнений (12.1) свя-
заны равенствами pj = d Сгде
С™ = [S3---Sn] uO^j (12.2)
Следствия.
1. Подставляя (12.2) в (12.1), полагая = 1 при Р = n + 1 и = О
при k > п + 1, приходим к равенствам = Sk-\C£ + С^+1, где k е 1N.
122
ГЛАВА 12. ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ
2. Разделив k-e равенство на С£ Ф 0, получим рекурсию
ггп /rin ___ п
^k-1/^k — ^к-1
из которой для 1 < к п имеем
1 * * * *$п] _ Z7 п ! р< п _ Q
гл q "I ^-'к — 1/^к —1
1
1
1
1
.. + _
Sn-i +
Sk Н--------
Sk+i +
Практическое вычисление континуанты несколько облегчается сле-
дующим предложением.
Теорема 12.2 (о факторизации). Выполнены равенства
Sk 1
1 О
1 n—1
к
1 n—1
T'k+1 ^k+1 _
где 0 к n. В частности (при к =
pin рп-1
°0 °0
0П 0П — 1
So 1
1 о
Ввиду Следствия 12.3, выполнено
m pn-1
k-1 ^k-1
V n pi n—1
к ^k
Sn-1
1
Sn-1
1
sr
1
s7
1
матричное равенство
с n I п
ьк-1^к + Сд+1
Q Z'TTl—1 । Z77I—1
+Cfc+1
cr1
(12-3)
(12-4)
Sk-1
1
к+1
переход от
д-1
Z7 n— 1 ’
ufe+l _
k к k — 1 в формуле (12.3).
обеспечивающее индуктивный
Базу для индукции «сверху вниз» доставляет значение к = п.
Теорема 12.2 позволяет получить явный вид коэффициентов в линейном
представлении gcd (р0, Pi) •
Теорема 12.3. Пусть degp0 degpi и Sq, ..., Sn_i — последователь-
ные неполные частные, порождаемые применением алгоритма Евклида
к полиномам р0, щ Тогда
gcd(p0,Pi) = (-l)"([So • • • S„_1]Pi - [Si • • -S„-i]po)-
к
к
1
О
к
1
О
1
О
1
о
1
О
12.4- ФОРМУЛА ЛАГРАНЖА-СИЛЬВЕСТРА
123
о В силу мультипликативности определителя, из соотношения (12.4)
следует, что C^Cq-1 — С^С^1 = (—1)п. Умножая обе части этого ра-
венства на полином d = gcd(p0,Pi)5 с учетом Теоремы 8.12 приходим к
требуемому соотношению.
12.4 Формула Лагранжа-Сильвестра
Пусть а, ..., ш — различные точки плоскости (С, п(а), ..., п(сд) — за-
данные натуральные числа и Q(z) = {z — a)n(<a4> (д—о;)п^\ Как извест-
но, существует единственный полином Д(г) = У xmzm степени, меньшей
п = degQ, дающий при делении на полиномы (г — А)п(л) заданные остат-
ки Гд(г). Коэффициенты хт этого полинома могут быть найдены из си-
стемы Вандермонда (стр. 59)
S СктХт-кхт = 1 г?’(A), A g ш}, 0 « к < п(А),
0^т<п
которая всегда однозначно разрешима и, следовательно, обладает невы-
рожденной основной матрицей (напомним, что С^'п = 0 при т < к):
1 0 1 0
a 1 1
a2 2<t Ш2 2cj Ф 0. (12.5)
an~r (n — l)<rn-2 (n — l)cjn-2
Определение. Матрицу, определитель которой находится в левой ча-
сти соотношения (12.5) будем называть матрицей Вандермонда, а сам
определитель — определителем Вандермонда.
Пример. Построим матрицу Вандермонда, определяемую полиномом седь-
мой степени Q(z) — (z — a)2(z — /5)3(z — у)2:
1 0 1 0 0 1 0
a 1 d 1 0 7 1
a2 2a d2 2d 1 72 27
[Vq|V,3|V7] = a3 3<r2 d3 3d2 3d 73 З72
a4 4q3 d4 4/13 6d2 74 4y3
a5 5<r4 d5 5d4 10d3 75 5y4
a6 6cd d6 6d5 15d4 76 6y5
124
ГЛАВА 12. ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ
Замечание. Видно, что набор коэффициентов в каждом из блоков Va, V^, V7,
«вырезан» из треугольника Паскаля и что всякая угловая подматрица матрицы Ван-
дермонда также является матрицей Вандермонда (меньшего порядка).
Если п(А) = 1 для каждой точки А е {а, ..., о;}, матрица Вандермонда
превращается в альтернанту с определителем П (г-д).
Если Q(z) = (z — а)п, то матрица Вандермонда нижнетреугольна и ее
определитель равен единице.
Можно показать (см. ниже раздел Задачи), что в общем случае опре-
делитель Вандермонда вычисляется по формуле
П Л - Л”М”('‘) (12.6)
Так, для матрицы последнего примера он равен (у — /3)б(у — а)4(/3 — а)6.
Пусть полином h (deg h < п) при делении на полиномы (г — А)п(л) дает
остатки г\. Введем матрицу-столбец
и линейные операторы = ^Dfc, где D — дифференцирование.
Определение. Матрицей Лагранжа-Сильвестра, построенной для по-
линома h (deg/z < п) назовем квадратную матрицу M(z) следующей
блочно-столбцовой структуры:
М(г) = [I(z) | Г01(а)... | ... | Го1(^)... ].
Очевидно, порядок такой матрицы равен п + 1.
Теорема 12.4. Определитель А(г) = |М(г) | = 0 (тождественно).
о Линейность определителя по столбцам позволяет вычислять его про-
изводные, дифференцируя элементы первого столбца:
£Д<Ч(Л = [ГДz) | Г01(а)... Г^Да) | ... | Г01(ш)... Г„(шМ1Н ].
12.4- ФОРМУЛА ЛАГРАНЖА-СИЛЬВЕСТРА
125
Ввиду антисимметричности, Д^(А) = 0 при 0 < к < п(А), так что
полином Д(д) делится на (г — А)П(Л) при всех А е {а, ..., а?}, т. е. делится
на полином Q(z). Поскольку deg Д < degQ, полином Д нулевой. <з
Так как при разложении определителя |М(д)| по элементам первого
столбца коэффициентом при h(z) будет ненулевой определитель (12.5),
полином h(z) выражается через остатки гд(д) посредством равенства
Д(д) = 0. Это обстоятельство позволяет легко построить полином Эр-
мита по его направляющим (метод Лагранжа-Сильвестра).
Пример. Возвращаясь к ранее решенной (двумя разными способами) за-
даче, заново построим полином Эрмита по направляющим (1-го порядка)
ri(z) — 3z и r2(z) = z, заданным в точках Ai = 0 и А2 = 1 соответственно.
Разложив по первому столбцу определитель матрицы Лагранжа-Сильвестра,
приравняем его нулю, откуда и найдем полином Д:
h(z) 0 3 11
1 10 10
г 0 111
z2 0 0 1 2
z3 0 0 1 3
— h(z) — 3z + 4,z2 — 2z3
=^> h(z) — 3z — 4z2 + 2z3.
Теорему 12.4 можно использовать в функциональном исчислении. Пусть
{а, ..., } с 12, где 12 — некоторое открытое подмножество комплексной
плоскости, f е У(12) и направляющая в точке А имеет вид
0<А’<п(А)
Заменяя в Теореме 12.4 h(z) полиномом f(z), приходим к тождеству
/Г) Ж) Г(«) !/"(«) • • ГА ГМ •••
1 1 0 0 1 0
Z а 1 0 1
z2 а2 2а 1 ш2 2ш = 0 (12.7)
Z3 а3 За2 За ш3 Зег2
п-2 ап~2 СД2а"-3 С3_2а”~4 •• шп~2 сД2ш"-3 •••
zn-l ап~г ш71-1
126
ГЛАВА 12. ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ
Определение. Равенство (12.7) называется формулой Лагранжа-Силь-
вестра.
Для экспоненты ёДг), определяемой полиномом
Q(z), имеем равенство
щ(д) eat 1 1 z а z2 а2 z3 а3 teat 0 1 2a 3a2 t2 at 2; 0 0 1 3q 1 01 ai2 ai3 te^ 0 1 2ai 3ai2 = 0 (12.8)
zn~2 ап~2 Ci_2a"“3 СД2а”~4 •• ain~2 C1_2W"-3 •••
zn~r an~r Щ1 r.n-2 cLi«"-3 •• ain~r . ,n—2
Замечание. Из формулы (12.8) видно, что экспонента щ(г) представляет собой,
с одной стороны, полином по z с переменными коэффициентами, зависящими от Д
с другой — линейную комбинацию функций вида с полиномиальными по z
коэффициентами.
Пример. Возвращаясь к примеру на стр. 62, построим экспоненту, заданную
полиномом Q(z) — z2 + ai2 при помощи формулы (12.8).
?t(z)
1
Z
g—iut
1 1
—iai iai
— 2гщщ(г) + (z — iai)e l0jL
(z + =
= 2iaiet (z) — 2iz sin art — 2iai cos ait — 0.
Следовательно, щ(д) = sin cut + cos ait.
Приведенными примерами вычисления и применения определителей мы
и ограничимся в этом начальном курсе, отсылая желающих глубже по-
знакомиться с предметом к рекомендованной литературе.
12.5 Задачи
1. Пусть А, В, С, D — столбцы из С"'. Дополните формулу
|Е +АВТ + CDT| =
АТВ
СТВ
ATD
CTD
+ ! + •••
12.5. ЗАДАЧИ
127
до верного равенства, используя исключительно буквы А, В, С, D и
символы {+ ;т}.
2. Вычислите определитель матрицы С порядка п с элементами
7Г
Ckr — $kr + COS — (к + г)
П
3. По направляющим первого порядка r±(z) = 2 (z + 1), заданным в точ-
ках z — ±1 соответственно, найдите полином Эрмита методом Лагран-
жа-Сильвестра.
4. Используя формулу Лагранжа-Сильвестра, постройте задаваемое по-
линомом Q(z) = (z2 — I)2 разложение единицы.
Указание. Возьмите f(z) постоянной в каждой из окрестностей +1.
5. По формуле (12.8) постройте экспоненту для полинома Q(z) — z3 — z2.
6. Докажите формулу (12.6) для определителя Вандермонда.
Указание. Используйте индукцию по п, где п — порядок матрицы Вандер-
монда.
Глава 13
Симметричные и эрмитовы
формы
Определения и примеры. — Матрицы Грама. — Матричная запись
форм. — Инвариантность определителя Грама. — Квадратичная
форма. — Поляризация. — Канонический базис. — Закон инерции.
— Сигнатура. — Теорема Якоби.
13.1 Определения и примеры форм
Определение. Числовая функция X х X —> R, сопоставляющая скаляр
(ж, у) каждой упорядоченной паре {ж; у} элементов ж, у действительного
линейного пространства X, называется билинейной формой на X, если
она линейна по любому из своих аргументов ж, у.
Определение. Билинейная форма (ж, у) симметрична (антисиммет-
рична), если тождественно по ж, у выполнено равенство (д,ж) = (х,у)
(соответственно, равенство (д, ж) = — (ж,?/)).
Теорема 13.1. Билинейная форма однозначно представима суммой
симметричной и антисимметричной форм.
о Пусть выполнено тождество (х,у) = А(х,у) + S(x,y), в котором А
и S — соответственно антисимметричная и симметричная формы. Ме-
няя местами ж и у, найдем, что (д,ж) = — А(х,у) + S(x,y). Складывая
(вычитая) почленно эти тождества, находим, что с необходимостью вы-
128
13.1. ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ Ф ОРМ
129
полняются равенства
2А(т,?/) = (ж, у) х) (13.1)
25(т,?/) = (ж, д) + (д, х) (13.2)
Обратно, определив форму А равенством (13.1), а форму S — посред-
ством равенства (13.2), видим, что это антисимметричная и симметрич-
ная формы. Очевидно, (х,у) = А(х,у) + S(x,y). <i
Всевозможные билинейные формы на X образуют некоторое линейное
пространство 13 функций на X х X, причем антисимметричные и, соот-
ветственно, симметричные формы образуют в 13 подпространства, кото-
рые мы обозначим А и 5. В этих обозначениях содержание доказанной
теоремы передается формулой 13 = А Ф S.
Примером антисимметричной формы может служить форма объема в
пространстве размерности 2.
Определение. Числовая функция X х X —> (С называется эрмитовой
формой на комплексном линейном пространстве X, если она линейна по
первому аргументу и (?/, х) = (х, у) тождественно по х и у.
Упражнение. Проверьте, что для эрмитовой формы (ж, у) справедливо
тождество (ж, Ху + yz) = А(т, у) + д(т, z).
Примеры.
1. Пусть X — пространство непрерывных комплекснозначных функций,
заданных на отрезке [0; 1]. Для функций х, у из X равенством
1 _____
(х,?/) = ^x(t)y(t)dt.
о
определена эрмитова форма.
2. Если К — непрерывная действительная функция на Q — [0; 1] х [0; 1],
значения которой не меняются при перестановке аргументов, то для
функций х и у из действительного пространства X = С*[0; 1] равенство
(х,у) — УУ K(s,t)x(<s)y(t) ds dt
Q
задает симметричную билинейную форму на X.
130
ГЛАВА 13. СИММЕТРИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ
3. Пусть X = и А — матрица порядка п с действительными элементами.
Вычисляя для произвольных столбцов X, Y из IR" произведение XTAY,
мы получаем матрицу первого порядка, единственный элемент которой
является значением билинейной формы на X. Тип симметричности этой
формы соответствует типу симметричности матрицы А.
4. Если X — действительное линейное пространство, а и i/i — фиксиро-
ванные элементы пространства X* (линейные формы), то билинейную
форму (х,у) можно образовать, например, так: (х, у) = ср(х)^(у). Она
называется тензорным произведением линейной формы на линейную
форму и обозначается (х) i/i. При = ifi эта форма симметрична.
5. В обозначениях предыдущего примера рассмотрим антисимметричную
билинейную форму, значения которой вычисляются по правилу
<д(х) ср(у)
<ф(у)
Такая форма называется внешним произведением формы д на форму г/1
и обозначается ср л г/i. Очевидна антикоммутативность внешнего про-
изведения: WA ср — —ср л 1/1.
/ ч 1
(х,у) = 2
13.2 Матрицы Грама
Пусть на комплексном линейном пространстве X определена эрмитова
форма {ж; у} (х,у) и р — произвольное натуральное число. Отправ-
ляясь от двух наборов векторов х^.. .хр и у^.. .ур, образуем матрицу
(Ж1Л1) (Т1,Д2) (Ж1ЛР)
А (ж2Л1) (х2,у2) (х2,ур)
G(ti ... тр|?/1 ...ур) =
(хР,У1) (хр,у2) (хр,ур)
Определение. Матрицу G(x-i... xp\y-i.. .ур) называют матрицей Гра-
ма х) формы (х, у), построенной по наборам х±.. ,хр и гр.. .ур.
Теорема 13.2. Определитель |О(ад ... ... ур)\ не меняется при пре-
образованиях вида
Хр <— Хр — Хр -|- X OirXr\
г<р
Ур < Ур Ур Т /Згу^1
г<р
i) Gram, Jorgen Pedersen (1850-1916) — датский математик
13.2. МАТРИЦЫ ГРАМА
131
о Преобразование набора ад, ..., хр приводит к тому, что к последней
строке матрицы Грама прибавляется комбинация предыдущих ее строк.
Аналогично, преобразование набора т/i, • • •, уР прибавляет к последнему
столбцу матрицы комбинацию предыдущих ее столбцов. Как известно,
при любом из таких преобразований определитель сохраняется.
Определение. Пусть ад, ..., хр — произвольный набор элементов. Мат-
рицу Г(ад... хр) = С(ад ... xp\xi ... хр) называют матрицей Грама фор-
мы (х,у), построенной по набору ад, ..., хр.
Замечание. Согласно этому определению, = (xi,Xj) = (xj,Xi) = Vji, так
что имеет место равенство Гт = Г. Отсюда видно, что все диагональные элементы
матрицы Г действительны.
Определение. Матрицу А такую, что Ат = А называют эрмитово-
симметричной.
Замечание. Действительная эрмитово-симметричная матрица симметрична.
Теорема 13.3. При добавлении к последнему элементу набора ад, ..., хр
произвольной комбинации предшествующих элементов определитель
|Г(ад... Хр)| не меняется.
о Пусть хр = хр + S arxr\ ур = ур + S otryr. Согласно Теореме 13.2,
имеет место тождественное по всем аргументам ад, уг равенство:
|С(ад .. .Хр\ух.. .ур)\ = |С(ад .. .хр\уг. ..ур)\
При Уг = хг (г = 1 . . .р) получим |Г(аД . . . жД | = |Г(аД . . . Хр)|. <]
Пусть пространство X конечномерно и в нем выбран некоторый базис
61, ..., Ьп. Обозначим X, Y столбцы, составленные из координат /3j(x),
/3j(y) элементов ж, у в базисе ..., bn. Другими словами, X = Qx,
Y = Qy, где Q — координатный изоморфизм относительно выбранного
базиса. Выразим значение (ж, у) через координаты элементов ж, у.
Теорема 13.4. Пусть X = Qx, Y = Qy, Г = Г(6Х... Ьп). Для эрмитовой
формы (х, у) справедливо представление (х, у) = XTFY.
о Разлагая элементы х, у по базису, находим сначала координатное, а
затем и матричное представление формы (х,у)\
(х, у) = ( X (3j(x)bj , X (3k(y)bk ) =
\ j k /
= S S (Bj(x)/3k(y)(bj, bk) = X /3j(x) X rjk/3k(y) = xTrY
j k j k
что и требовалось.
132
ГЛАВА 13. СИММЕТРИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ
Замечание. Если матрица Г диагональна, то (Д, ЬД = 0 при j' ф к и координат-
ная запись формы значительно упрощается:
(ж, у) = S Ггг/Х(ж)/Х(т/) (13.3)
Определение. Базис 61, ..., Ъп пространства X называется канониче-
ским относительно эрмитовой формы (х,у), если матрица Г диагональ-
на.
13.3 Квадратичные формы
Определение. Пусть (ж, у) — эрмитова форма на комплексном линей-
ном пространстве X. Действительная функция q(x) = (х,х) называется
квадратичной формой, порождаемой формой (х,у).
Теорема 13.5. Квадратичная форма q порождается единственной эр-
митовой формой.
о В самом деле, пусть q порождается эрмитовой формой (х,у). Тогда
для произвольных элементов х, у
q(x + у) - q(x - у) = (х + у,х + у) - (х - у,х - у) = 2(т, у) + Ду, х).
Заменив в этом тождестве у на iy и умножив обе части на i, получим
iq(x + iy) — iq(x — iy) = 2(т, у) — Ду, х).
Почленное сложение двух тождеств приводит к формуле поляризации:
Дх, у) = q(x + у) + iq(x + iy) — q(x — у) — iq(x — iy),
позволяющей восстановить эрмитову форму (х, у) по известной квадра-
тичной форме q(x) = (х,х). <1
Следствие. Ненулевая эрмитова форма порождает ненулевую квад-
ратичную форму.
Следующее предложение непосредственно вытекает из Теоремы 13.4 и
замечания к ней.
Теорема 13.6. Если квадратичная форма q порождается эрмитовой
формой (х, у) и Г — матрица Грама формы (х, у) в некотором базисе
Д, ..., Ьп, то имеет место матричное представление q(x) = ХТГХ.
Если при этом базис Д, ..., Ъп канонический, то координатная запись
формы q имеет вид q(x) = X |Д.(т)|2д(6г).
13.4- ДИАГОНАЛИЗАЦИЯ ФОРМ
133
13.4 Диагонализация форм
Теорема 13.7. Для любой эрмитовой формы, заданной на конечномер-
ном пространстве, можно построить канонический базис.
о Проведем индукцию по размерности X. При dim X = 1 в базисе всего
один элемент, порядок матрицы Грама равен единице и матрица диаго-
нальна. Пусть доказываемое утверждение справедливо для всех про-
странств размерности п — 1. Покажем, что тогда оно верно и в случае
dim X = п. Если форма (ж, у) нулевая, матрица Г тоже нулевая и, тем са-
мым, диагональна. Если форма (ж, у) ненулевая, то (согласно следствию
из Теоремы 13.5), в X существует элемент х' такой, что (ж', х') ф 0. Обо-
значив X' одномерное подпространство, порожденное ненулевым век-
тором х', построим подпространство X" = {х" : (ж", ж') = 0} и покажем,
что х = х' е х".
Проверим дизъюнктность X' и X". Пусть 0 = /Зх' + х" — разложение
нуля. Тогда (ДДх1) + (ж",ж') = ($,Д) = 0. Так как (ж",ж') = 0, а
(Д, ж') ф 0, коэффициент /3 нулевой и разложение элемента 0 по подпро-
странствам X' и X" тривиально. Далее, для произвольного х очевидно
разложение х = Хх' + (ж — Хх') (где Л = (ж, Д)/(Д, Д)), компоненты
которого принадлежат, соответственно, подпространствам X' и X". Сле-
довательно, X = X' ф X". По теореме о размерности прямой суммы,
dimX = dimX' + dimX" = dimX" + 1. Таким образом, dimX" = п — 1 и,
согласно предположению индукции, в X" существует базис 61, ..., bn_i
такой, что {bj, bk) = 0 при j ф к. Дополняя его вектором Ьп = х', полу-
чаем канонический базис bi, ..., Ьп формы (х,у). <1
Замечание. Доказанная теорема никоим образом не обеспечивает единственно-
сти канонического базиса.
13.5 Закон инерции. Сигнатура
Вообще говоря, у эрмитовой формы бесконечно много канонических ба-
зисов. Однако, определенные их характеристики сохраняются при пере-
ходе от одного базиса к другому.
Теорема 13.8. Для любой эрмитовой формы число положительных
элементов матрицы Грама во всех канонических базисах одинаково.
134
ГЛАВА 13. СИММЕТРИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ
о Сгруппируем элементы каждого из двух произвольных базисов, ка-
нонических для формы (т,Д, включив в первую группу элементы ба-
зиса, на которых квадратичная форма q(x) = (х,х) положительна, а во
вторую — остальные его элементы:
q(ar)>0 q(br)>0
a-i.. .ак ak+i ...ап Ъг... bm Ьт^1 . . . Ьп
q(ar)^O q(br)^O
Пусть x — общий элемент для подпространств А = span{ni, ..., ак} и
В = span{6m+i, ..., bn}. Тогда
к п
ж = Е arar = Е firbr
1 т+1
Вычислим q(x), исходя из обоих представлений элемента х. Согласно
Теореме 13.6, с учетом знаков чисел q(ar) и q(br), имеем
к п
О < Е |сц.|2Дщ) = q(x) = Е 1Я1ММ О
1 т+1
Отсюда видно, что сумма неотрицательных чисел |ау|2д(щ) равна нулю.
Поскольку все q(ar) положительны, это возможно лишь если равны ну-
лю все аг. Но тогда х = агаг = 0 и дизъюнктность подпространств
А и В установлена. Остается принять во внимание, что
к + (п — т) = dim Л + dim Б = бпп(Л ф В) dimX = п,
откуда к т. По аналогичным соображениям, т к.
Следствие. Для любой эрмитовой формы число отрицательных эле-
ментов матрицы Грама во всех канонических базисах одинаково.
о Канонический для формы (ж, у) базис остается таковым и для фор-
мы (х,у) = —(х,у), матрица Грама которой противоположна матрице
Грама исходной формы.
Доказанное предложение, называемое законом инерции эрмитовых (и
порождаемых ими квадратичных) форм позволяет ввести следующее
Определение. Для эрмитовой формы (ж, у) с матрицей Грама Г в кано-
ническом базисе 61, ..., Ьп триплет а = {сг_сгосг+}, где через а±, а0 обо-
значены количества положительных, отрицательных и нулевых диаго-
нальных элементов матрицы Г, называется сигнатурой эрмитовой фор-
мы (ж, у) (и квадратичной формы q). Числа а±, а0 называются, соответ-
ственно, положительным, отрицательным и нулевым индексами инерции
эрмитовой формы (х,у) (и квадратичной формы q).
13.5. ЗАКОН ИНЕРЦИИ. СИГНАТУРА
135
Замечание. Очевидно, сумма ст_ + <jq + <т+ равна порядку матрицы Г, т. е.
размерности пространства, на котором задана эрмитова форма.
Определение. Подпространство J\[ = {х \ (Уу) (%, у) = 0} называ-
ется ядром эрмитовой формы (ж, у) (и порождаемой ею квадратичной
формы q). Эрмитова (квадратичная) форма невырождена, если ее ядро
тривиально.
Как по матрице эрмитовой формы (х,у), построенной в некотором ба-
зисе a-i, ..., ап (не предполагаемом каноническим) вычислить ее сигна-
туру? В ряде случаев ответить на этот вопрос позволяет следующая
теорема, принадлежащая Карлу Якоби2).
Теорема 13.9. Пусть щ, ..., ап — базис пространства, на котором
задана эрмитова форма (х,у). Обозначим d0 = 1, dk = |Г(ох... о^)|-
Считая выполненным условие d±- dn Ф 0, положим у k = dk/dk-\. Най-
дется базис 61, ..., Ьп, для которого Г(61... bn) = diag(^>i... уп).
о Предположим, что существует набор п векторов = Е j=1 Xkjaj (где
1 < k п, Хк = 1), Для которого (bk,Oi) = д^Ук при i к. Так как
он построен элементарными преобразованиями базиса, сохраняющими
оболочку X, то набор 61, ..., bn является базисом. Убедимся, что он ка-
нонический, а именно, Г(61... bn) = diag(^>i... уп). При к < г
к .
(61 • • • 6га) (6Г, Ьк) (6г, Е Xj'Hj) (br, ак) дкгУк-/
т. е. матрица Г треугольная. Поскольку Гт = Г, матрица Гт также тре-
угольная. Итак, Г = diag(£i... уп).
Остается проверить исходное предположение о существовании коэффи-
циентов хк (гДе г к п) таких, что во-первых, = 1, а во-вторых
(Е XjHj , щ) = &1кУк при i < к или, в развернутой форме, проверить, что
для каждого к < п система
r(ni,ni)xJ + + (ак^Хк = 0
(«1, a2)Xi + + (ак, а2)Хк = О
Лаъак)Х1 + + (ак,ак)Хк = Qk
2) Jacobi, Carl Gustav (1804-1851) — немецкий математик
136
ГЛАВА 13. СИММЕТРИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ
имеет решение вида {yf, Х%, • • •, Xk-n 0- Определитель dk такой системы
отличен от нуля, поэтому система разрешима и ее решение Xi-> • • • > Хь
единственно. При этом, как следует из формулы Крамера, Хь = 1-
Следствие. При «условии регулярности» dy dn Ф 0 сигнатура фор-
мы имеет вид а = {н, 0, п — н}, где н — число перемен знака в последо-
вательности d0, ..., dn.
Замечание. Числа dk обычно называют угловыми минорами матрицы Г.
Определение. Квадратичная форма неотрицательна, если неотрица-
тельна функция q(x) = (х, х) и положительна, если q(x) > 0 при х ф 0.
13.6 Задачи
1. Покажите, что <р /\^ — антисимметричная часть формы
2. Верно ли, что невырожденность квадратичной формы равносильна не-
вырожденности матрицы Г?
3. Покажите, что размерность ядра квадратичной формы равна ее нуле-
вому индексу инерции.
4. Перенесите результаты раздела на симметричные билинейные формы,
заданные на действительном пространстве.
5. Верно ли, что форма Примера 1 (на стр. 129) положительна?
6. Пусть в Примере 2 (стр. 129) K(s,t) — coscj(s — t). При каких действи-
тельных значениях параметра ш форма (х, у) положительна?
Глава 14
Положительные формы
Нормальный базис. — Формулы Фурье. — Критерий Грама. —
Неравенства Шварца, Коши и Буняковского. — Критерий Сильве-
стра. — Евклидово пространство. — Расстояние до линейной обо-
лочки. — Градиент. — Взаимные базисы.
14.1 Формулы Фурье
Теорема 14.1. Эрмитова форма на конечномерном пространстве X
положительна тогда и только тогда, когда существует базис X, в
котором матрица Грама этой формы единична.
о Пусть в некотором базисе ei, ..., еп матрица Грама единична. Ес-
ли X — столбец координат Xj ненулевого элемента х в этом базисе, то из
координатной записи квадратичной формы видна ее положительность:
q(x) = ХТГХ = ХТЕХ = ХТХ = S |дД > 0.
С другой стороны, для произвольно заданной положительной формы в
любом каноническом базисе оц, ..., ап все диагональные элементы q(aj)
матрицы Грама Г(«1... ап) положительны. Применив нормировку, т. е.
введя элементы е7 равенствами y/q(aj) Cj = Uj, мы перейдем к базису
Ci, ..., еп, для которого Г(б1... еп) = Е. <з
Определение. Базис, в котором матрица Грама положительной фор-
мы единична, будем называть базисом, нормальным относительно этой
формы.
137
138
ГЛАВА Ц. ПОЛОЖИТЕЛЬНЫЕ ФОРМЫ
Следующее предложение поясняет целесообразность работы именно с
нормальным базисом: в таком базисе вычислять координаты вектора,
значение формы на заданной паре векторов или находить элементы мат-
рицы оператора особенно легко.
Теорема 14.2. Пусть ei, ..., еп — нормальный базис положительной
формы, £1, ..., еп — дуальный к нему базис, F — матрица произволь-
ного оператора F в базисе ei, ..., еп. Выполнены равенства:
£г(х) = (х,ег); (14.1)
(х,у) = £(х,ег)(ег,у); (14.2)
Fij = (Fe^ei). (14.3)
о Вычисляя значение эрмитовой формы (х, ег), ввиду нормальности
базиса, находим: (x,er) = (% Ej(x)ej, er) = £ £j(x)(ej,er) = £г(%), что
доказывает формулу (14.1). Применяя ее к координатной записи формы
в нормальном базисе ei, ..., еп, получаем равенство (14.2):
(ж, у) = s £r(x)£r(y) = S (ж, er)(y, er) = S (ж, ег)(ег, у).
Наконец, согласно (14.1) и правилу вычисления элементов матрицы опе-
ратора, Fij = £i(Fcj) = (Fej,Ci). Теорема доказана полностью. <i
Определение. Равенства (14.1), (14.2) и (14.3) будем называть, соот-
ветственно, 1-й, 2-й и 3-й формулами Фурье.1)
14.2 Критерий независимости
До сих пор мы могли проверить линейную независимость набора эле-
ментов а-i, ..., as либо приводя по Гауссу матрицу, составленную из ко-
ординатных столбцов этих элементов, либо (при s = dimX) вычисляя
объем на аргументах ..., а8. Располагая заданной в пространстве X
положительной формой, можно проверить независимость любого набо-
ра даже в том случае, когда пространство не является конечномерным.
Теорема 14.3. Пусть Г = Г(щ ... as) — матрица Грама положитель-
ной формы. Следующие предложения равносильны:
i) Fourier, Jean Baptiste Joseph (1768-1830) — французский физик и математик
14-2. КРИТЕРИЙ НЕЗАВИСИМОСТИ
139
(а) |Г| ф О (Ь) Набор оц, ..., as независим (с) |Г| > 0.
о Докажем теорему согласно «циклу» (а)^>(Ь)^>(с)^>(а).
(а)=>(Ь) Пусть известно, что |Г| ф 0. Покажем, что набор элементов
«1, ..., as независим. Допустим, что линейная комбинация этих эле-
ментов с коэффициентами Xj равна нулю: Xiai + + Xs^s = 0. По-
следовательно вычисляя значения эрмитовой формы (£ Xiac aj) ПРИ
j = 1, ..., s, придем к системе уравнений с определителем |ГТ| ф 0
(<21, <21)Х1 + + (щ, cii)Xs = 0
(^1, ^)%1 + + (щ, Cl2)Xs = 0
t(ai,as)xi Н----h (as,as)xs = 0
имеющей (по теореме Крамера) только тривиальное решение.
(Ь)^(с) Пусть теперь известно, что набор ..., а8 независим. Обра-
зуем подпространство Xs = span{ai, ..., as} с; X. Выбрав в Xs произ-
вольный нормальный базис ei, ..., es, обозначим через U (невырожден-
ную) матрицу единичного отображения относительно базисов ..., as
и ei, ..., es. По правилу построения матрицы линейного отображения,
ее элемент ЕД есть /-коэффициент в разложении образа базисного
элемента по базису ei, ..., es. Согласно 1-й формуле Фурье, этот ко-
эффициент равен (а7-,еД. Найдем 1Д, применив 2-ю формулу Фурье:
Г/j (^г, ®j) S (щ, er)(tij, er) S UHUrj- S ЕДЕД' (U U)..
r=l r=l r=l 2
Из факторизации Г = UTU матрицы Г, мультипликативности определи-
теля и условия |U| Ф 0 следует, что |Г| = |UTU| = |UT| |U| = |U| |U| > 0.
(c)=>(a) Это следствие тривиально. <i
Замечание. Если базис ai, ..., as пространства Xs уже нормален, то матрица Г
единична и UTU = Е.
Определение. Матрица U, подчиненная условию UTU = Е, называется
унитарной. Унитарная матрица, все элементы которой действительны,
называется ортогональной.
Таким образом, ортогональную матрицу можно определить, как матри-
цу, обратную к своей транспонированной.
Сформулируем следствие Теоремы 14.3.
140
ГЛАВА Ц. ПОЛОЖИТЕЛЬНЫЕ ФОРМЫ
Следствие. Матрица замены нормального базиса на нормальный уни-
тарна.
Следующий критерий Сильвестра2) представляет собой пример приме-
нения доказанных выше Теорем 13.9 и 14.3.
Теорема 14.4. Пусть а17 ..., ап — базис пространства, Гд. — матри-
ца эрмитовой формы (х,у), построенная по набору щ, ..., щ. Условие
dk = |П| > 0 (1 < к п) необходимо и достаточно для положитель-
ности формы (х,у).
о Пусть известно, что форма положительна. Применяя к независимо-
му поднабору di, ..., ак Теорему 14.3, заключаем, что |Г^| > 0. Необ-
ходимость условия установлена. Его достаточность — прямое следствие
Теоремы 13.9.
Установим полезное в математическом анализе неравенство Шварца 3).
Теорема 14.5. Для произвольных элементов а, Ъ пространства X с
заданной на нем положительной эрмитовой формой (х, у) выполнено
неравенство (а, Ь) (6, а) (а, а) (Ь, Ь), равенство в котором означает ли-
нейную зависимость а и Ь.
о Если набор а, b независим, то, согласно Теореме 14.3,
(а, a)(b, b) — (а, b)(b, а) =
(а, а) (а, Ъ)
(6, а) (6, Ь)
= |Г(щ 6)| > 0.
В силу той же теоремы, равенство (а, а) (Ь, Ь) — (а, 6) (6, а) = 0 (отрицание
условия (а)) равносильно зависимости а и Ь.
Примеры.
1. В случае, когда X = Сп, а (х, у) — £ хгуг, неравенство Шварца принимает
форму | £ад.Дг|2 < (S |яу|2)(£ |?д|2) и называется неравенством Коши4).
2. Если X = С [а, Ь], а (х, у) — x(t)y(t)p(t)dt, где р — непрерывная положи-
тельная функция, неравенство Шварца преобразуется к виду
j x(t)y(t)p(t)dt < j |x(t)|2p(t)c/t j |?/(t)|2p(t)c/t
2) Sylvester, James Joseph (1814-1897) — английский математик
3) Schwarz, Karl Hermann Amandus (1843-1921) — немецкий математик
4) Cauchy, Augustin Louis (1789-1857) — французский математик
14-3. УНИТАРНЫЕ МАТРИЦЫ
141
и называется неравенством Буняковского.5).
14.3 Унитарные матрицы
Понятие унитарной матрицы введено выше, на стр. 139, здесь мы оста-
новимся на некоторых важных свойствах таких матриц.
Теорема 14.6. Класс унитарных матриц одного порядка замкнут от-
носительно операции умножения.
о Пусть U, V — унитарные матрицы одного порядка. Проверим уни-
тарность матрицы W = UV. Используя ассоциативность умножения,
получаем
WTW = (VTUT)UV = VT(UTU)V = VTEV = VTV = E,
т. e. произведение W унитарно.
Определение. Матрицу М* = МТ называют эрмитово-сопряженной
(также эрмитово-транспонированной) относительно М.
Замечание. Из этого определения следует, что операция М н-> М* явля-
ется инволюцией (т. е. М** = М) и что для согласованной пары матриц
{А, В} справедливо равенство (АВ)* = В*А*.
Теорема 14.7. Матрица U* обратна унитарной матрице U и тоже
унитарна.
о Определяющее свойство унитарной матрицы UTU = Е можно за-
писать в виде равенства U*U = Е, означающего, что матрицы U* и U
взаимно обратны. В частности, UU* = Е и (U*)*(U*) = UU* = Е. Сле-
довательно, матрица U* = U-1 унитарна.
Поскольку единичная матрица унитарна, установлено, что класс всех
унитарных матриц одного порядка является группой относительно опе-
рации умножения матриц.
Определение. Мультипликативная группа всех унитарных матриц по-
рядка п обозначается U (п) и называется полной унитарной группой. Ее
действительные элементы (ортогональные матрицы) составляют полную
ортогональную группу О(п).
5) Буняковский, Владимир Яковлевич (1804-1889) — российский математик
142
ГЛАВА Ц. ПОЛОЖИТЕЛЬНЫЕ ФОРМЫ
Теорема 14.8. Если матрица U унитарна и е = |U|, то ее = 1.
ё£ = |й||и| = |йци| = |йтци| = |и’и| = |Е| = 1.
Определение. Мультипликативная группа всех унитарных матриц по-
рядка п с определителем 1 обозначается SU(п) и называется специаль-
ной унитарной группой. Ее действительные элементы образуют специ-
альную ортогональную группу SO(n).
14.4 Евклидово пространство
Определение. Евклидовым называется конечномерное пространство X,
на котором зафиксирована положительная форма (ж, у). Ее значение на
паре аргументов {а, Ь} называют скалярным произведением а на Ъи обо-
значают а Ь. Если а b = 0, то говорят, что а и b взаимно ортогональ-
ны и пишут а _1_ Ь. Базис ei, ..., ега, нормальный относительно формы
(х,у) = х у, называют ортонормированным.
Замечание. Таким образом, в случае действительного евклидова пространства
скалярное произведение — это положительная билинейная форма, в комплексном
случае — положительная эрмитова форма. Комплексное евклидово пространство
называют также унитарным.
Как и для всякой положительной формы, для скалярного произведения
справедливо неравенство Шварца
(а b)(b а) < (а а)(Ь Ь) (14.4)
и три формулы Фурье. Формула для разложения элемента х по орто-
нормированному базису ei, ..., еп:
х = (ж ei)ei + + (ж еп)еп (14-5)
Формула для вычисления скалярного произведения а b по известным
координатам а е3и b е3ортонормированном базисе ei, ..., еп:
а - b = (а ci)(6 ci) + + (а еп)(Ь еп) (14.6)
Формула, позволяющая найти матрицу А произвольного оператора А в
ортонормированном базисе ei, ..., еп:
ai3 = (Ае3) ei (14.7)
Скалярное произведение естественным образом порождает норму в про-
странстве X.
14.5. ОРТОГОНАЛЬНОСТЬ
143
Определение. Число |ж| = д/т • х называется евклидовой нормой эле-
мента х. Равенством £>(т,?/) = \х — у\ вводится евклидова метрика.
Теорема 14.9. Функция х |т| является нормой на X.
о Положительность и однородность очевидны. Проверим, что выпол-
нено неравенство треугольника. Из неравенства Шварца (14.4) следуют
неравенства Не(т у) |т у\ |т||?/|, так что
|т + ?/|2 = (х + у) (ж + у) = х х + 2 Не(т у) + у у
М2 + 2 \х\\у\ + |?/|2 = (|т| + |?/|)2
Таким образом, |т + y| =s I т| + \у\-
Пример. В пространстве С*[0,1], состоящем из непрерывных комплексно-
значных функций на [0,1] рассмотрим форму (х, у) из Примера 1 на стр. 129.
Пусть /, g непрерывны на [0,1]. Оболочка X = span{/, g} cz С*[0,1] является
евклидовым пространством со скалярным произведением х у — (х,у). Для
этого пространства неравенство \х + у\ |х| + \у\ имеет вид
дДо l/W +РЙ|2^ д/Sj I/WR + д/So Ш12(й
и называется неравенством Минковского.6)
14.5 Ортогональность
На евклидово пространство переносятся многие понятия и факты эле-
ментарной геометрии. Вот, например, аналог теоремы Пифагора.
Теорема 14.10. Если элементы яд, ..., хр евклидова пространства по-
парно ортогональны, то |яд + + тр|2 = |яд|2 + + |тр|2.
о Доказательство получается простым раскрытием скобок в правой
части равенства |ti + + тр|2 = (яд + + хр) (яд + + хр) с учетом
того, что Xi Xj = 0 при i ф j. <з
Определение. Подпространства X' и X" пространства X взаимно ор-
тогональны, если х' X х" для любых х' е X', х" е X".
6) Minkowski, Hermann (1864-1909) — немецкий математик
144
ГЛАВА Ц. ПОЛОЖИТЕЛЬНЫЕ ФОРМЫ
Теорема 14.11. Взаимно ортогональные подпространства дизъюнкт-
ны, так что из произвольного набора таких подпространств можно
составить прямую сумму.
о Пусть Xj попарно ортогональны, Xj е Xj и х± + + хр = 0. По тео-
реме Пифагора, |ti|2 + - + |тр|2 = |$|2 = 0, откуда видна тривиальность
разложения нуля.
Определение. Ортогональным дополнением к подпространству Хо ев-
клидова пространства X называется множество
Xq = {х : (Vt0 е Хо) т±т0}
Упражнение. Проверьте, что Хо замкнуто относительно операций, инду-
цированных из X, т.е. является подпространством пространства X.
Теорема 14.12. Для любого подпространства Хо X выполнено ра-
венство X = Хо Ф Xq 7).
о Пусть ei, ..., ет — ортонормированный базис подпространства Хо-
Выбрав элемент х из X, положим х0 = (х ejei + + (х ет)ет. Оче-
видно, Xq е Хо как линейная комбинация базисных элементов этого под-
пространства. Проверим, что разность х± = х — х0 принадлежит Xq •
Действительно, вектор х± ортогонален каждому вектору е?:
Х± 6j = (х — Xq) 6j = X 6j — S (ж 6r)(er 6j) =
= x Cj — S (x er)drj = x Cj — x Cj = 0.
Следовательно, вектор x± ортогонален каждому элементу подпростран-
ства Хо = span{ei, ..., ет}, т. е. принадлежит подпространству Xq .
Итак, всякий вектор х представим суммой xq + х± элементов подпро-
странства Хо и ортогонального ему Xq . Поскольку эти подпространства,
согласно Теореме 14.11, дизъюнктны, разложение х = х0+х± определено
однозначно.
Определение. Пусть Хо — подпространство евклидова пространства X.
Компонент х0 в разложении х = х0 + х± заданного в X элемента х
по прямым слагаемым Хо и Xq называется ортогональной проекцией
вектора х на подпространство Хо-
7) т.е. ортогональное дополнение Xq является одним из многих возможных пря-
мых дополнений к подпространству Xq.
14.5. ОРТОГОНАЛЬНОСТЬ
145
Теорема 14.13 (о наилучшем приближении). Пусть х — заданный эле-
мент евклидова пространства X и ж0 - его ортогональная проекция
на подпространство Хо- Для элемента ж0 е Хо, отличного от ж0, вы-
полнено неравенство |ж — ж0| < |ж — ж0|.
о Поскольку х± = (ж — ж0) X (ж0 — ж0), то, в силу Теоремы 14.10,
|ж - ж0|2 = |(ж - ж0) + (ж0 - ж0)|2 = |ж± + (ж0 - ж0)|2 =
= |ж±|2 + |ж0 - ж0|2 > |ж±|2 = |ж - ж012,
откуда и следует доказываемое неравенство.
Следствие. Полагая ж0 = 0, видим, что |ж_|_| = |ж — ж0| < |ж|, т.е.
«перпендикуляр короче наклонной».
Определение. Пусть ж0 — ортогональная проекция ж на подпростран-
ство Xq. Число г0 = |ж_ь| называется расстоянием от элемента ж до
подпространства Xq.
Нередко в приложениях подпространство задается как оболочка незави-
симого набора. Найдем формулу, выражающую расстояние от элемен-
та ж до заданного подпространства.
Теорема 14.14. Пусть So = {0}, элементы ai, ..., ап независимы, Sk
— оболочка набора ai, ..., ak и rk — расстояние от ak до подпрост-
ранства Sk-i. Если Гд. = Г(«1... ak), a dk = |Г&|, то гп = у/dn/dn-i-
о Согласно Теореме 13.3, определитель матрицы Грама, построенной
для набора щ, ..., ап, не изменится, если его последний элемент ап за-
менить элементом а^ = ап — а®п, где — проекция ап на Sn-i-
ai ai ai a%
a2 ai U2 U2
ai an-1 ai an
a2 an-i a2 an
dn
an—i ' ai an—i a2 an—i an—i an—i an
an ' ai an a2 an an—i an an
146
ГЛАВА Ц. ПОЛОЖИТЕЛЬНЫЕ ФОРМЫ
а\-а\ ai <22 ttn-i О
<22 <21 <22 <22 ' ' ' <22 ' <2п-1 О
&п— 1 ' &п—1 ' ' &п—1 ' &п—1 О
О О О 1ап |2
Разлагая определитель по последнему столбцу, получаем соотношение
dn = ^n-i|^n|2 = dn-ir^ из которого и вытекает доказываемое утвер-
ждение. <з
Следствие. Выполнено неравенство dn |щ|2 |<2га|2 .
о Применяя к каждому из сомножителей в правой части равенства
dn = г2 г2 следствие Теоремы 14.13, получаем требуемую оценку. <з
Теорема 14.15. Определитель матрицы А с комплексными элемента-
ми Oiij ограничен по абсолютной величине произведением
(14-8)
о Рассмотрим каждый столбец А7 матрицы А как элемент евклидова
пространства С" со скалярным произведением X Y = XTY. Составим
для набора Ai, ..., Ап матрицу Грама Г = АТА. Согласно Следствию 2
из Теоремы 14.14,
|А| |А| = |Г| = cl„ |АД • • • |А„|2 = (s |«г1|2) • • • (s |аг„|2)
Принадлежащее Ж. Адамару8) неравенство (14.8) установлено.
14.6 Коградиент и градиент
Пусть X — действительное евклидово пространство. Каждому векто-
ру v сопоставим линейный функционал (А г) (ж) = х и. Из свойств
скалярного произведения очевидна линейность отображения г н-> А г из
основного пространства X в сопряженное пространство X*.
Определение. Линейное отображение А : X —> X* назовем когради-
ентном.
8) Hadamard, Jacques Salomon (1865-1963) — французский математик
14-7. ВЗАИМНЫЕ БАЗИСЫ
147
Теорема 14.16. Коградиент является изоморфизмом.
о Поскольку размерности пространств X и X* совпадают, достаточно
убедиться в тривиальности ядра ker А. Пусть Аг> — нулевой ковектор,
тогда v v = (А г) (г) = 0, т. е. v = 0.
Замечание. Тем самым, отображение Д обладает обратным: для любого ковек-
тора ср найдется единственный вектор и, реализующий тождество = x-v (назы-
ваемое представлением Рисса9) ковектора функционала </>)•
Определение. Линейное отображение V = А-1 называют градиентом.
Пример. Представление Рисса ср(г) — г • \7 ср придает следующий физи-
ческий смысл понятию «градиент». Пусть ср — скалярное линейное поле и
r(t) = го + tv — траектория точки, перемещающейся с единичной скоростью v.
Согласно неравенству Шварца, (d/dt) cp(r(t)) — cp(v) — v V<£> < |V<£>|, причем
равенство достигается на орте г, сонаправленном с градиентом. Таким обра-
зом, \7ср — вектор скорости изменения скалярного поля ср в направлении его
быстрейшего роста.
Теорема 14.17. Пусть Д1, ..., hn — базис евклидова пространства X и
ту, ..., уп — дуальный ему базис ковекторов. Градиент линейного функ-
ционала ср может быть найден из тождества Чср = £ <д(Дг)Х7 ту.
о Применив функционал к разложению х = £ ту(х)бг произволь-
ного вектора х по базису /д, ..., Дга, найдем, что ср(х) = £ Ty(x)cp(hr),
т. е. = £ cp(hr) ту. Остается подействовать на обе части этого функци-
онального равенства линейным отображением V : X* —> X.
14.7 Взаимные базисы
Определение. Базисы 61, ..., bn и hi, ..., hn пространства X взаим-
ны10), если bi hj = dij, где 5ij — символ Кронекера.
Теорема 14.18. Для любого базиса hi, ..., hn евклидова пространст-
ва X найдется единственный взаимный базис bi, ..., bn с элементами
bj = Ъту, где ту, ..., уп — дуальный к hi, ..., hn базис.
9) Riesz, Frigyes (1880-1956) — венгерский математик
10) употребляют также термин «биортогональны»
148
ГЛАВА Ц. ПОЛОЖИТЕЛЬНЫЕ ФОРМЫ
о Соотношения ортогональности следуют из определения градиента:
hi bj = hi Vг]j = T]j(hi) = dij. Умножив обе части равенства
Л161 + + \jbj + + Xnbn = О
скалярно на hj, получим Xj = 0. Независимость (а значит, и базисность)
набора 61, ..., Ьп установлены.
Докажем единственность взаимного базиса. Пусть базис 6'15 ..., Ь'п так
же взаимен базису /д, ..., hn. Вычитая почленно равенство hi bj =
из равенства hi b'j = dij, получим ортогональность разности bj — 6'
каждому базисному вектору hi, что возможно лишь когда b'j = bj.
Замечание. Если базис hi, ..., hn ортонормированный, то bj = hj при всех j.
Теорема 14.19. Матрица единичного отображения относительно па-
ры взаимных базисов {hi, ..., hn} и {bi, ..., bn} совпадает с матрицей
Грама r(hi...hn).
о Следует показать, что z-я координата вектора hj в базисе bi, ..., bn
равна hi hj. Действительно, умножая скалярно обе части равенства
hj = У Xrbr на hi, приходим к равенству hi-hj = У Xrhi-br = У Xr5ir = Xi,
что и требовалось.
14.8 Задачи
1. Пусть в С"' n-матрицами А и В заданы положительные квадратичные
формы Z н-> ZTAZ и Z и-> ZTBZ, а матрица С получена поэлементным
умножением А и В. Будет ли форма Z н-> ZTCZ положительной?
2. Невырожденная симметричная n-матрица А с действительными эле-
ментами такова, что для любого X выполнено неравенство ХТАХ 0.
Верно ли, что равенство в нем возможно лишь при X = О?
3. Верно ли, что в условиях предыдущей задачи все диагональные элемен-
ты матрицы строго положительны?
4. Проверьте, что в евклидовом пространстве имеет место тождество па-
раллелограмма |х + ?/|2 + |х — ?/|2 — 2|Д2 + 2\у\2.
5. Покажите, что если в некотором действительном конечномерном нор-
мированном пространстве выполнено тождество параллелограмма, то
14.8. ЗАДАЧИ
149
существует (единственное!) скалярное произведение, порождающее нор-
му этого пространства, т. е. превращающее данное нормированное про-
странство в евклидово.
Глава 15
Основные классы операторов
Унитарный оператор. — Симметричный оператор. — Критерии
симметричности и унитарности. — Собственные подпространства.
— Спектральная теорема. — Принцип Куранта-Фишера. — Под-
счет точек спектра на промежутке. — Полярная факторизация.
15.1 Унитарный оператор
Пусть X и У — комплексные евклидовы пространства с нормами | | и
|| || соответственно.
Определение. Линейное отображение U : X —> У называется изомет-
рией, если оно сохраняет расстояния между элементами:
\\Ux — Ux'\\ = \х — х'\
Замечание. Полагая в этом определении х' = 0, видим, что U сохраняет нор-
му элемента: ||Гя;|| = |т|. Обратно, если линейное отображение V сохраняет норму
каждого элемента, то оно является изометрией, поскольку
||Va? — Va/|| = ||V(a? — Л)|| = | х — х'\.
Теорема 15.1. Если оператор U является изометрией, то он обра-
тим, причем U~l так же представляет собой изометрию.
о Для доказательства обратимости U достаточно проверить тривиаль-
ность ядра kerL/: (Ux = 0) => (|т| = \Ux\ = 0) =^> (х = 0). Далее, пусть
V = U~\ тогда для произвольного элемента х выполнены равенства
|ГЛ| = |L/(Vkc)| = |(L/V)t)| = \Ех\ = |т|,т. е. V — изометрия.
150
15.1. УНИТАРНЫЙ ОПЕРАТОР
151
Теорема 15.2. Следующие утверждения равносильны:
(а) В некотором ортонормированном базисе матрица U унитарна.
(Ь) Оператор U является изометрией.
(с) Оператор U сохраняет скалярное произведение: Ux Uy = х у.
(d) В произвольном ортонормированном базисе матрица U унитарна.
о Доказательство теоремы проведем по схеме (a)^>(b)^>(c)^>(d)^>(a).
(a)^>(b) Пусть оператору U в некотором ортонормированном базисе со-
ответствует унитарная матрица U. Взяв произвольный элемент ж, обо-
значим через X столбец координат элемента х в этом базисе. Тогда UX
— столбец координат образа Ux. По формуле Фурье,
Дж|2 = Ux • Ux = (UX)TUX = XT(UTU)X = XTX = |ж|2.
(b)=>(c) Изометрия U сохраняет квадратичную форму q(x) = х-х. Сле-
довательно, сохраняется и полярная к ней эрмитова форма х у.
(c)^>(d) Пусть ci, ..., ега — произвольный ортонормированный базис.
Набор элементов Д = UCj представляет собой другой ортонормирован-
ный базис: Д fj = Uci Uej = Ci е7 = 5ij. По формуле Фурье (равен-
ство (14.7) на стр. 142), элементы ВД матрицы оператора U в базисе
ei, ..., еп равны (Uej) е* = Д • е*, т. е. столбцы матрицы U составлены
из координат базисных элементов Д в базисе ei, ..., еп. Тем самым, U
— матрица перехода между нормальными базисами, а такие матрицы
унитарны (см. Следствие на стр. 140).
(d)^(a) Импликация тривиальна.
С учетом Теоремы 14.8, получаем
Следствие. Если оператор U — изометрия, то |det(L/)| = 1.
Замечание. Органическая связь унитарных матриц с операторами изометрии
объясняет применение к последним термина унитарные операторы. Им мы и бу-
дем пользоваться в дальнейшем.
Теорема 15.3. Изометрия По из подпространства Хо X в простран-
ство X является сужением некоторого унитарного оператора V.
о Обозначив Хо = imBo, рассмотрим две ортогональных прямых сум-
мы Хо Ф Х_|_ = Хо Ф Хт = X. Поскольку ядро По тривиально, то (по
теореме о ранге и дефекте) dimXo = dimXo- Но тогда совпадают и раз-
мерности прямых дополнений Хт и Хт- Пусть ex, ..., ет и Д, ..., fm
152
ГЛАВА 15. ОСНОВНЫЕ КЛАССЫ ОПЕРАТОРОВ
— произвольные ортонормированные базисы подпространств Xj_ и ЗА.
соответственно. Для вектора х = х0 + S агег = х0 + х± положим
Vx = VqXq + s arfr = Уъ + У1_
Проверим, что V линейно продолжает Vq на X. Действительно, так как
Хх = Хх0 + S (агХ)ег, то V(Хх) = Vq(Xxq) + S (arX)fr = XV х. Далее, если
у = До + S то V(x + у) = Уо(То + До) + S («г + Pr)fr = Vx + Vy.
Убедимся в унитарности V. По теореме Пифагора, |Пт|2 = |До|2 + |Д_г|2-
Ввиду равенств \у±_\2 = У |ау|2 = |т±|2 и с учетом изометричности Vq,
имеем |Пт|2 = |И)В)|2 +1^±|2 = |т0|2 + |ж±|2 = |т|2, так что V — унитарный
оператор. <з
Определение. Операторы АиВ конгруэнтны, если для произвольных
жид выполнено равенство \Ах — Ау\ = \Вх — Ву\, т.е. если А и В
одинаково меняют расстояние между точками пространства.
Пример. Унитарный оператор конгруэнтен единичному.
Замечание. Очевидно, конгруэнтность АиВ равносильна тому, что |Аж| = |£>ж|
для произвольного х.
Теорема 15.4. Следующие два утверждения равносильны.
(а) Операторы А и В конгруэнтны.
(Ь) Существует унитарный оператор V такой, что В = V4.
о Доказательство выполняем в последовательности (а)=>(Ь)=>(а).
(а)=>(Ь) Из х е ker А следует, что \Вх\ = |Ат| = 0. Отсюда видно, что
ker А ker В. По той же причине ker В ker А. Следовательно, у опера-
торов А и В общее ядро Xq. Пусть у = Ах — элемент из im А. Положим
Voy = Вх. Отображение у i—> Voy определено корректно: если у = Ах'
и х' А х, то х' = х + Xq, где Xq е Xq. Но тогда Вх' = Вх + Вх0 = Вх.
Отображение Уо линейно: если у = АМад + А2Ат2 = A(AiTi + А2т2),
то А1У0Д1 + А2У0Д2 = AiBti + А2Вт2 = В(А1ЯД + А2т2). Тем самым,
УоД = XiVoyi + А2У0Д2- Наконец, линейное отображение Уо является изо-
метрией: |Уод| = \Вх\ = \Ах| = |д|. Согласно Теореме 15.3, ТЬ — сужение
на подпространство imA X некоторого унитарного оператора V. Та-
ким образом, VAx = Вх для произвольного х, т. е. В = VA.
(Ь)^>(а) |Ат| = |У(Ат)| = |(Ш)т| = \Вх\ для всех х, т. е. А и В конгру-
энтны.
15.2. СИММЕТРИЧНЫЙ ОПЕРАТОР
153
15.2 Симметричный оператор
Другой важный класс операторов в комплексном евклидовом простран-
стве составляют симметричные операторы, среди которых следует вы-
делить неотрицательные и положительные.
Определение. Оператор А называется симметричным (или эрмито-
вым) , если для произвольных ж, у выполнено равенство
(Ат) у = х (Ау)
Если при этом квадратичная форма q(x) = х Ах не принимает отри-
цательных значений, оператор А называется неотрицательным. Если
квадратичная форма q(x) положительна, оператор А называется поло-
жительным.
Теорема 15.5. Следующие утверждения равносильны:
(а) В некотором ортонормированном базисе матрица оператора А эр-
митово-симметрична.
(Ь) Оператор А симметричен.
(с) В произвольном ортонормированном базисе матрица оператора А
эрмитово-симметрична.
о Доказательство проведем по схеме (а)^>(Ь)^>(с)^>(а).
(а)^>(Ь) Пусть оператору А в некотором ортонормированном базисе со-
ответствует эрмитово-симметричная матрица А. Взяв произвольные эле-
менты ж, у, обозначим через X, Y столбцы их координат в этом базисе.
Тогда АХ, AY — столбцы координат элементов Ах, Ау и, по формуле
Фурье (14.6), Ах у = (AX)TY = XTATY = ХТА Y = XTAY = х Ay,
откуда следует симметричность оператора А.
(Ь)^(с) Пусть известно, что оператор А симметричен и ei, ..., еп — про-
извольный ортонормированный базис. Согласно формуле Фурье (14.7),
Aij = (Aej) Ci = Cj (Aei) = (Aei) 6j = Aji, так что A = A*.
(c)=>(a) Импликация тривиальна.
15.3 Собственные подпространства.
Пусть F — некоторый оператор в линейном комплексном пространстве X
(не обязательно евклидовом).
154
ГЛАВА 15. ОСНОВНЫЕ КЛАССЫ ОПЕРАТОРОВ
Определение. Число Л называется собственным числом или собствен-
ным значением оператора F, если подпространство ker(F — AF) содер-
жит ненулевые элементы. Эти элементы называют собственными век-
торами оператора F, соответствующими числу А. При этом подпро-
странство Хд = ker(F —AF) называют собственным подпространством
оператора F, отвечающим собственному числу А.
Определение. Множество пар (A, dim Зд) называют геометрическим
спектром оператора F.
Теорема 15.6. Множество собственных чисел оператора F совпадает
с множеством корней уравнения det(F — zE) = 0.
о Ядро ker(F — zE) — это пространство решений х однородного урав-
нения (F — zE)x = 0, а это однородное уравнение имеет решение х Ф 0
тогда и только тогда, когда det(F — zE) = 0. <i
Теорема 15.7. Функция %(z) = det(F — zE) — полином, степень ко-
торого равна размерности пространства X.
о Детерминант оператора может быть вычислен как определитель его
матрицы F = [Fi, ..., Fra], построенной в произвольном базисе про-
странства X:
Х(г) = |(FX - гЕх) (F™ ~ гЕп)| = (-<|ЕХ Еп| + + |FX Fn| =
= (-z)n |E| + + |F| = (-< + + det F .
Здесь n — размерность пространства X.
Следствие. У произвольного оператора (в комплексном пространстве
положительной размерности) всегда есть по меньшей мере один соб-
ственный вектор.
Определение. Полином % называется характеристическим полино-
мом оператора F.
Замечание. Если из контекста неясно, характеристический полином какого опе-
ратора имеется в виду, характеристический полином оператора F будем обозначать
символом xf-
Определение. Спектр полинома xf называют алгебраическим спек-
тром оператора F.
15.4- СПЕКТРАЛЬНАЯ ТЕОРЕМА
155
Всюду ниже А — симметричный оператор в пространстве положитель-
ной размерности.
Теорема 15.8. Собственные значения симметричного оператора А
действительны.
о Для собственного вектора ж, отвечающего значению Л, имеем:
А|т|2 = (Ат) х = (Ат) т = т (Ат) = т (Ат) = А|т|2
Сократив на |т|2 ф 0, получим нужный результат. <з
Теорема 15.9. Собственные подпространства симметричного опера-
тора попарно ортогональны.
о Пусть Ti, Т2 — собственные векторы симметричного оператора А,
соответствующие различным собственным значениям Ai и А2, так что
Axj = XjXj. Ввиду симметричности А и действительности А7 , выполнены
равенства
(Ai - A2)(ti т2) = (AiTi) • т2 - Ti • (А2т2) = (АтД • т2 - тх • (Ат2) = 0 .
Остается разделить на ненулевую разность Ах — А2.
Следствие. Собственные подпространства симметричного операто-
ра дизъюнктны, так что из них можно составить прямую (ортого-
нальную) сумму.
15.4 Спектральная теорема
Теорема 15.10. Прямая сумма всех собственных подпространств Хд
симметричного оператора А совпадает с X:
= * (15.1)
А
о Обозначим Хо левую часть (15.1). Это подпространство содержит
все собственные элементы оператора А, поэтому в ортогональном до-
полнении Xq собственных векторов нет. Подпространство Xq перехо-
дит в себя под действием оператора А. Действительно, пусть х± е Xq .
156
ГЛАВА 15. ОСНОВНЫЕ КЛАССЫ ОПЕРАТОРОВ
Так как любой элемент xq е Хо можно представить суммой £ тд, в ко-
торой х\ е Хд, то, поскольку х\ х±_ = О,
Xq Ах± = А (Е Х\) = (Е Ах\) = £ Хх\ х± = 0.
Таким образом, (х е эД (а х е Xq). Любой оператор в нетриви-
альном пространстве имеет собственный вектор. У оператора A|Xq соб-
ственных векторов нет, поэтому Xq = {$}, т.е. Xq = X.
Следствия.
1. Для произвольного симметричного оператора А можно указать ор-
тонормированный базис ei, ..., еп, состоящий из собственных векто-
ров оператора, так что его матрица имеет вид diag(Ai, ..., Ага).
2. Базис ei, ..., еп является каноническим базисом квадратичной фор-
мы q(x) = х Ах, т.е. сигнатура {сг_, сг0, сг+} формы q(x) определяется
числом отрицательных, нулевых и положительных собственных чи-
сел Xj с учетом их кратности.
о Выделив в прямых слагаемых Хд левой части равенства (15.1) орто-
нормированные базисы е*, ..., соединим их в набор, упорядо-
ченный по возрастанию А:
Поскольку Ае^ = Ае^, матрица А оператора А в построенном базисе
диагональна, причем на диагонали расположены по возрастанию соб-
ственные числа Xj оператора А.
Матрица Грама Г(б1... еп) формы х -Ау составлена из элементов вида
Ci Aej = Xjdij, т. е. совпадает с А. <з
Замечание. Вычисление с помощью матрицы А характеристического полинома
x(z) = det(A — zE) = П(А — z)n(A)
вскрывает смысл показателей п(А): кратность А равна размерности собственного
подпространства Таким образом, геометрический и алгебраический спектры
симметричного оператора совпадают.
Теорема 15.11. Пусть L^uR^ - подпространства, построенные по
точкам спектра симметричного оператора А, не большим собствен-
ного числа ц и, соответственно, не меньшим ц :
15.5. СПЕКТРАЛЬНАЯ ФУНКЦИЯ
157
На единичных сферах подпространств Llt и R.lt выполняются неравен-
ства х - Ах ц и ц х - Ах соответственно.
о Элемент х подпространства представим суммой х = И^Ху,
каждый элемент которой лежит в соответствующем собственном под-
пространстве. Применяя к обеим частям этого равенства оператор А,
видим, что Ах = Е vx„.
Ввиду попарной ортогональности подпространств Х,У и теоремы Пифа-
гора, имеем для сужения квадратичной формы х х -Ах на /?Л оценку:
х - Ах = ( Е яд) • ( Е z+гд) = Е г/|ад|2 ц Е |ад|2 = д|т|2.
Второе неравенство доказывается аналогично. <з
Замечание. Установленное свойство собственных чисел называют минимаксным.
15.5 Спектральная функция
Определение. Спектральная функция S симметричного оператора А
определяется на оси R равенством
S(t) = Е п(А) l(t - А) = Е п(А),
A X<t
в котором п(А) — размерность собственного подпространства Хд, сум-
мирование ведется по различным точкам А спектра А, а 1 — индикатор
полуоси (0; +оо) (функция Хевисайда).
Из монотонности и непрерывности слева функции 1 вытекают следую-
щие свойства спектральной функции:
(а) функция S не убывает и непрерывна слева;
(b) limS = 0, limS = Е n(A) = dimX;
— 00 +оо
(с) разность S(b) — S(a) есть число точек спектра оператора А на про-
межутке [а; Ь).
Теорема 15.12. Значение спектральной функции S(t) совпадает с ин-
дексом cr_(t) квадратичной формы q(x, t) = х (A — tE) х.
158
ГЛАВА 15. ОСНОВНЫЕ КЛАССЫ ОПЕРАТОРОВ
о Элемент матрицы Грама Г(£) квадратичной формы q(x,t) относи-
тельно ортонормированного базиса собственных векторов ei, ..., еп опе-
ратора А равен е^-(А—tE) ej = (Xj—t) dij, где Xj — собственное значение,
соответствующее собственному вектору е7 . Поэтому матрица Грама диа-
гональна и число ее отрицательных элементов равно S(t).
Закон инерции в сочетании с теоремой Якоби приводит к следующему
способу вычисления спектральной функции.
Следствие. Пусть ., bn — произвольный базис, Vk(t) ~ постро-
енная по набору 61, ..., bk матрица Грама формы х (А — tE) у. Если
d0(t) = 1 и dk(t) = |rfc(t)| ф 0 для всех к, то S(t) есть число перемен
знака в последовательности d0(t), ..., dn(t).
Замечание. Так как dk — многочлен (степени к), то сформулированное выше
условие нарушается разве лишь в конечном числе точек t е К.
Пример. Рассмотрим в пространстве С3 симметричный линейный оператор,
сопоставляющий столбцу X столбец АХ, где
2 1 -1
1 —2 3
-13 0
и найдем количество его собственных значений на промежутке [1; 3). Вычис-
лим угловые миноры матрицы А — tE: do(t) — 1, d±(t) — 2 — t, d%(t) — t2 — 5,
d3(t) — —t3 + 15t — 22. Составим таблицу для определения сигнатуры cr_(t).
t di (t) d2(t) d3(t) a_(t)
1 1 1 -4 -8 1
3 1 -1 4 —4 3
Число точек спектра на [1; 3) равно разности сг_(3) — <т_ (1) = 3 — 1 = 2.
15.6 Э рмитово-сопряженный оператор
Пусть L — некоторый оператор в комплексном евклидовом простран-
стве X. Фиксируя произвольный вектор у, образуем линейный функ-
ционал <ру(х) = (Lx) у. Для него справедливо представление Рисса
<ру(х) = х Х7сру. Тем самым, возникает преобразование L*(y) =
пространства X, позволяющее записывать равенство ipy(x) = х в
виде (Lx) у = х (L*y).
15.6. ЭРМИТОВ О-СОПРЯЖЕННЫЙ ОПЕРА ТОР
159
Теорема 15.13. Преобразование L* : у Х7(ру линейно.
о Для произвольных скаляра Л и вектора х выполнены равенства
х L*(Xy) = (Lx) (Ху) = X (Lx) у = Хх L*y = х (XL*у)
Ввиду произвольности х, отображение однородно: L*(Xy) = XL*у. Ана-
логично, для любых векторов т/1? у2 выполнены равенства
х L*(yr + у2) = (Lx) (ух + у2) = (Lx) ух + (Lx) у2 =
= х L*yx + х L* у2 = х (L*yx + L*y2)
Так как элемент х произволен, отображение L* аддитивно, т. е. для вся-
ких Ух, у2 справедливо L*(yr + у2) = L*yr + L*y2. <з
Определение. Оператор L* называется эрмитово-сопряженным к опе-
ратору L.
Теорема 15.14. Операция эрмитова сопряжения обладает следующи-
ми свойствами.
(а) Эрмитово сопряжение является инволюцией: L** = L.
(Ь) Оператор А симметричен, если и только если А* = А.
(с) Для всякого оператора L пространство X представимо ортогональ-
ными разложениями X = im L ф ker L*, X = im L* ф ker L.
(d) (LA/)‘ = M*L* для произвольных операторов L и M.
(е) Для любого оператора L операторы L*L и LL* симметричны.
о Утверждение (а) следует из равенств
х L**y = L*x у = у L*x = (Ly) х = х Ly
и единственности представления ковектора скалярным произведением.
Проверим утверждение (Ь). Пусть известно, что оператор А симметри-
чен. Тогда х А*у = (Ат) у = х Ау. Ввиду произвольности х, для вся-
кого у выполнено равенство А*у = Ау. Следовательно, А* = А. Пусть
теперь известно, что А* = А. Симметричность А видна из тождества
(Ат) у = т А*у = х Ау.
Вывод первого из представлений пункта (с) начнем с очевидного равен-
ства X = imZ/ф (imL)-1. Представление будет получено, если доказать,
160
ГЛАВА 15. ОСНОВНЫЕ КЛАССЫ ОПЕРАТОРОВ
что (imL)-1- = kerb*. Условие у е (imL)-1- равносильно тому, что для
произвольного х выполнено равенство (Lx) у = 0. Это равенство, в
свою очередь, равносильно тому, что х L*у = 0 для произвольного ж,
т. е. тому, что L*y = 0. Второе представление выводится аналогично.
Справедливость утверждения (d) следует из тождества
х (LM)*y = (LMx) у = (Мх) -L*y = x- M*L*y
Из свойств (а), (Ь) и (d) выводим утверждение (е):
(L*L)* = L*L** = £*£, (LL*)* = L**L* = LL*
Теорема полностью доказана.
15.7 Полярное представление
Теорема 15.15. Произвольный линейный оператор L в комплексном
евклидовом пространстве X может быть представлен произведением
L = VA, в котором V и А — унитарный и неотрицательный операторы
соответственно.
о Пусть ei, ..., еп — ортонормированный базис, составленный из соб-
ственных векторов симметричного оператора L*L и Ai, ..., Хп — соот-
ветствующие собственные значения. Поскольку квадратичная форма
(L* Lx) х = (Lx) (Lx) = \Lx\2
неотрицательна, все Xr 0. Рассмотрим линейный оператор А, сопо-
ставляющий элементу х значение У л/АДт ег)ег. Он симметричен:
(Ат) у = У -\fXr(x er)(er у) = х У л/Хг(у ег)ег = х Ау
и неотрицателен: (Ах)-х = У д/А71х-ег |2 0. Кроме того, из определения
оператора А видно, что Абд. = у/Х/ул и A2er = Хгег. Операторы А2 и L*L
совпадают на всех базисных элементах е^, так что А2 = L*L. Операто-
ры А и L конгруэнтны: (Ат) Ат = т А2т = т L*Lx = (Lx) Lx.
По Теореме 15.4, существует унитарный оператор V такой, что L = VA.
Теорема доказана.
Следствие. Произвольный линейный оператор L в комплексном ев-
клидовом пространстве X может быть представлен произведением
L = BU, где В — неотрицательный, a U — унитарный оператор.
15.8. ЗАДАЧИ
161
о Согласно доказанной теореме, L* = WB, где W и В — унитарный и
симметричный неотрицательный операторы соответственно. Применяя
операцию эрмитова сопряжения к обеим частям этого равенства, имеем
L = (WB)* = B*W* = BW* = BU,
где U = W* — унитарный оператор.
Замечание. Двойственность действий, выполняемых над операторами и матри-
цами позволяет заключить, что произвольная матрица L представима произведени-
ями VA и BU, где матрицы U, V унитарны, матрицы А, В эрмитово-симметричны,
а формы ХТАХ, ХТВХ неотрицательны.
15.8 Задачи
1. Пусть матрицы Грама для базисов сд, ..., и &i, ..., bn евклидова
пространства совпадают. Докажите, что существует унитарный опера-
тор U такой, что для всех г выполнены равенства br — Uar.
2. Пусть L — матрица линейного оператора L в некотором ортонормиро-
ванном базисе комплексного евклидова пространства. Покажите, что L*
является матрицей оператора L* относительно того же базиса.
3. Оператор нормален, если он перестановочен с сопряженным. Покажите,
что L нормален тогда и только тогда, когда L и L* конгруэнтны.
4. Покажите, что в случае, когда |L| 0, представления L = VA и L = BU
определены однозначно.
5. Разложите в произведение BU симметричной матрицы В на унитарную
матрицу U заданную матрицу
L =
-2 14
10 5
Глава 16
Ориентированное пространство
Смешанное произведение. — Ориентация. — Координатная запись
смешанного произведения. — Тождество Грама. — Геометрический
смысл определителя Грама. — Векторное произведение. — Тожде-
ство Лагранжа. — Двойное векторное произведение.
В этой главе термин «евклидово пространство» означает исключительно
действительное евклидово пространство.
16.1 Смешанное произведение
Определение. Функция объема (ад хп) на евклидовом пространстве
называется смешанным произведением, если найдется ортонормирован-
ный базис ei, ..., еп, для которого (ei еп) = 1.
Теорема 16.1. Если объем (ад -хп) в евклидовом пространстве явля-
ется смешанным произведением, то для любого ортонормированного
базиса f-i, ..., fn выполнено равенство (Д fra)2 = 1.
о Пусть ei, ..., еп — ортонормированный базис, о котором говорится
в определении смешанного произведения. Линейный оператор U введем
равенством Ux = Очевидно, Uek = fk- По теореме Пифагора,
|Е/ж|2 = Х(ж'еа)2 = 1ж|2’ так чт0 U — унитарный оператор. Следователь-
но, det(L/) = ±1 и (/i -fn) = (L/ei Uen) = det(L/)(ei еп) = ±1, что
и требовалось.
Теорема 16.2. В евклидовом пространстве X положительной размер-
ности существуют ровно два смешанных произведения.
162
16.1. СМЕША ИНОЕ ПРОИЗВЕДЕНИЕ
163
о Покажем вначале, что в X существует хотя бы одно смешанное про-
изведение. Известно, что в каждом конечномерном пространстве есть
функция объема. Пусть [ад -хп] — такая функция и пусть щ, ..., еп
— какой-то ортонормированный базис. Очевидно, что тогда
(Т1 хп) = [ ад X га]/[ 61 6 J
— смешанное произведение.
Покажем теперь, что в пространстве X есть по меньшей мере два сме-
шанных произведения. Наряду с (ад -ад), смешанным произведением
будет также и —(ад---ад), поскольку эта функция объема принимает
значение 1 на ортонормированном базисе —61, ..., еп.
Покажем, наконец, что в X есть ровно два смешанных произведения.
Предположим, что (ад хп) — какое-то отличное от (ад хп) сме-
шанное произведение. По свойству пропорциональности объемов, суще-
ствует единственный скаляр Л, обеспечивающий тождество
(Т1 хп} = А(ад хп)
Вычисляя обе его части на ортонормированном базисе, находим, соглас-
но предыдущей теореме, что Л = ±1. По условию, Л Ф 1, следовательно,
(ад -ад) =-(ад -ад).
Определение. Евклидово пространство X ориентировано, если в нем
выбрано и зафиксировано одно из двух возможных смешанных произ-
ведений.
Определение. Базис 61, ..., Ъп ориентированного пространства назы-
вается правым, если (£д bn) > 0 и левым, если (£д bn) < 0.
Замечание. Таким образом, на произвольном правом ортонормированном базисе
заданное в X смешанное произведение принимает значение единица.
Теорема 16.3. Пусть Xj — столбец координат элемента Xj в правом
ортонормированном базисе, тогда (ад -хп) = |Хх - Хга|, где в правой
части равенства — определитель матрицы, составленной из столб-
цов Xj (стандартный объем в Rn).
о Пусть отображение Q : X —> В" сопоставляет каждому элементу х
столбец X его координат в правом ортонормированном базисе ei, ..., еп.
Очевидно, Qej = Е7. С одной стороны, форма \Qx± Qxn\ на бази-
се ei, ..., еп принимает значение |Qei Qen\ = |ЕХ Ега| = |Е| = 1.
164
ГЛАВА 16. ОРИЕНТИРОВАННОЕ ПРОСТРАНСТВО
С другой стороны, по свойству пропорциональности объемов, для неко-
торого Л выполнено тождество |<Эяд -Qxn\ = A(^i -хп). Подставляя
в него Xj = Cj, находим А = 1.
Следовательно, (яд -хп) = \Qx± -Qxn\ = |Xi - Хга|. <з
Теорема 16.4 (тождество Г рама). Для матрицы Грама билинейной фор-
мы х у, построенной по наборам и±, ..., ип и гд, ..., vn векторов ори-
ентированного пространства размерности п выполнено тождество
|G(wi.. .Ига|щ .. .vn)\ = (u1 -ип)(щ -vn).
о Фиксируя набор элементов гд, ..., ип, рассмотрим антисимметрич-
ную форму |С(гд.. .un\xi... яд)| от аргументов яд, ..., хп. По свойству
пропорциональности объемов, для некоторого А выполнено тождество
|С(гд.. .ига|т1.. . яд)| = А(яд -хп).
Заменяя в нем хг элементами правого ортонормированного базиса ег,
получаем равенство А = |С(гд... ип | ei... ега)| = |Ui... Ura|, где Ur —
столбец координат иг в базисе ei, ..., еп (согласно формуле Фурье). Как
следует из предыдущей теоремы, |Ui... Ura| = (ui ип). <i
Следствие. Для любых векторов гд, ..., ип в п-мерном ориентиро-
ванном пространстве |Г(гд ... ип)\ = (гд ип)2.
16.2 Абсолютный объем
Определение. Функцию К(яд, ..., хп) = | (яд -я;га)|, определенную на
элементах n-мерного ориентированного евклидова пространства X ра-
венством , назовем абсолютным объемом в X.
Замечание. Абсолютный объем (в отличие от участвующего в его определении
смешанного произведения) на любом ортонормированном базисе принимает значение
единица. В каждом евклидовом (не обязательно ориентированном!) пространстве,
тем самым, существует единственный абсолютный объем.
Это замечание делает корректным следующее
Определение. Пусть ..., ат — элементы евклидова пространства X.
Абсолютным объемом параллелепипеда с ребрами а^, ..., ат назовем
число |(сд am)|, где (яд -я;т) — любое из двух возможных смешан-
ных произведений в евклидовом пространстве врап{сд, ..., ат} (со ска-
лярным произведением, взятым из X).
16.2. АБСОЛЮТНЫЙ ОБЪЕМ
165
Согласно следствию из Теоремы 16.4, имеет место соотношение
К(щ, ..., ат) = д/|г(а1 ’' -«ш)|, (16.1)
раскрывающее геометрический смысл определителя матрицы Грама.
Определение. Объем V(a,b) обозначим S(a,b) и назовем площадью
параллелограмма со сторонами а, Ь.
Формула (16.1) для площади принимает следующий вид
Да, 6) = У|Г(а6)| = v/|a|2|&|2 - (а • 6)2
Объем П(а), очевидно, равен «длине» |а| вектора а.
Теорема 16.5. Пусть евклидово пространство Z разложено в прямую
ортогональную сумму подпространств X размерности т и У размер-
ности п. Если U, V, W — абсолютные объемы в пространствах У, У,
Z соответственно, то
W(ti, ..., хт,уг, ..., уп) = U(xu ..., хт) V(yu ..., уп).
о Построим матрицу Грама Г(яд ... хт щ ... уп). По условию, все эле-
менты матрицы вида Xi -yj равны нулю. Следовательно, матрица Грама
блочно-диагональна:
Г(т1.. .xmy-i.. .уп) =
Остается применить теорему об определителе ступенчатой матрицы и
сослаться на формулу (16.1).
Замечание. При т = 2 и п = 1 доказанная теорема утверждает, что объем
прямой призмы с параллелограммом в основании равен произведению площади ос-
нования на длину ребра, ортогонального основанию.
Остаток главы посвятим важному для физики трехмерному случаю. В
трехмерном евклидовом ориентированном пространстве 8 помимо опе-
раций линейного пространства определена бинарная операция скаляр-
ного и тернарная операция смешанного умножения векторов. Каждое
из этих умножений приводит к скалярному результату. Под векторной
алгеброй мы понимаем структуру, получаемую из пространства 8 внесе-
нием в него бинарной операции векторнозначного умножения. При этом
существенна трехмерность пространства 8.
166
ГЛАВА 16. ОРИЕНТИРОВАННОЕ ПРОСТРАНСТВО
16.3 Векторное произведение
Определение. По упорядоченной паре векторов {а, Ь} пространства 8
построим функционал ^(х) = (abx). Вектор а х b = Vifi называется
векторным произведением вектора а на вектор Ь.
Теорема 16.6. Вектор а х b ортогонален обоим сомножителям.
о Соотношения (а х Ь) а = (aba) = 0 и (а х Ь) b = (abb) = 0 следуют
из антисимметричности объема.
Теорема 16.7. Операция умножения [a.b] fi х b обладает следую-
щими алгебраическими свойствами:
1. Л (а х Ь) = (Ха) х b = а х (ХЬ);
2. а х (Ь + с) = а х b + а х с;
3. (а + b) хс = ахс + Ьхс;
4. a xb = —(Ь х а);
5. а х а = 0.
о Согласно определению векторного произведения, все эти соотноше-
ния выражают равенства градиентов некоторых функционалов. Следо-
вательно, для их доказательства достаточно убедиться в равенстве са-
мих функционалов:
1. (Л (а х Ь)) х = Л (abx) = ((Ха)Ьх) = (а(ХЬ)х);
2. (а(Ь + с)х) = (abx) + (асх);
3. ((а + Ь)сх) = (асх) + (Ьсх);
4. (abx) = — (Ьах);
5. (аах) = 0 х.
Истинность этих равенств прямо следует из определения векторного
произведения и свойств скалярного и смешанного произведений.
Теорема 16.8. Условие а х b = О необходимо и достаточно для колли-
неарности векторов а и Ь.
16.3. ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ
167
о Пусть а || Ь. Не снижая общности, можно считать, что b = Ха. Тогда
axb = axXa = X(axa) = O. Обратно, если а х b = 0, но а $ Ъ, то до-
полнив {а, Ь} до базиса {а, 6, с} пространства £, придем к противоречию:
О = (а х 6) с = (abc) ф 0.
Теорема 16.9. Если a$buc = axb, то упорядоченный набор {а, 6, с}
представляет собой правый базис пространства 8.
о Неравенство (abc) = (ох0-с = с- с^О переходит в равенство
только если с = а х b = 0. Но тогда, согласно Теореме 16.8, а || 6, что
противоречит условию. Следовательно, (abc) >0. <1
Теорема 16.10 (тождество Лагранжа). Для векторов и, v, х, у евкли-
дова пространства 8 выполнено тождество
о Если х || ?/, то строки матрицы G(uv | х у) пропорциональны и ее
определитель равен нулю, тогда как правая часть равенства (16.2) равна
нулю ввиду Теоремы 16.8. Поэтому считаем, что набор {ж, у} независим
и его можно дополнить до базиса {х, т/, z}. В тождестве Грама
и X
и у
и Z
V X
V у
V Z
W X
w у
W Z
= (uvw)(xyz)
возьмем w равным х х у. После деления обеих частей на (xyz) Ф 0
тождество перейдет в равенство
о
и X V X
и у V у
и Z V Z
о
1
= (uvw) = (и х v) w = (и х v) Дх х у),
левая часть которого, очевидно, равна |G(wr | ху)\. <1
Теорема 16.11. Норма вектора х х у равна площади параллелограмма
с векторами сторон х, у.
о Полагая и = ж, v = у в (16.2), получаем равенство
из которого и следует утверждение теоремы.
168
ГЛАВА 16. ОРИЕНТИРОВАННОЕ ПРОСТРАНСТВО
Теорема 16.12. Пусть в некотором правом ортонормированном бази-
се векторы а и b имеют координаты о^, а2, о3 и Д, (32, /З3 соответ-
ственно, тогда координаты 71, д2, 73 вектора с = ах b в том же базисе
могут быть найдены как коэффициенты при Xi, %27 Хз в разложении
по первой строке определителя
Xi Х2 Хз
СД СИ2 С13
= 71X1 + 72X2 + 7зХз
/31 /З2 /З3
о Обозначим через х вектор с координатами Xj- В соответствии с
Теоремой 16.3 о представлении смешанного произведения в правом ор-
тонормированном базисе, в левой части равенства стоит произведение
(xab) = (abx) = (axb)-x = c-x = Х1Х1 + 72X2 + 7зХз-
Следующая полезная теорема предотвращает «наслоение» векторных
произведений в формулах.
Теорема 16.13. Для произвольных векторов а, Ь, с пространства £
выполнено тождество1)
ах (6 х с) = Ь(а с) — с (а Ь)
(16.3)
о Согласно тождеству Лагранжа (16.2), два линейных функционала
<д(и) = (их а) (6 х с) = (ua(bxc)) = (а(Ьхс)и) = (а х (Ь х с)) - и,
и b а b
и с а - с
Ди) =
= (и • Ь)(а • с) — (и • с)(а Ь) =
= и (Ь (а с) — с (а Ь)) = (Ь (а с) — с (а Ь)) и
совпадают. Следовательно, совпадают их градиенты.
Теорема 16.14 (тождество Якоби). Для произвольных а, Ь, с из про-
странства 8 выполнено тождество
а х (6 х с) + b х (с х а) + с х (а х Ь) = 0 .
(16.4)
о Достаточно сложить почленно тождество (16.3) с тождествами
b х (с х а) = с(Ъ а) — а(Ъ с)
с х (а х Ь) = а (с b) — b (с а)
полученными из (16.3) циклическими перестановками а, Ь, с.
х) В правой его части скаляры по традиции пишут справа от векторов
16.4- ЗАДАЧИ
169
Определение. Алгебра, умножение в которой антикоммутативно, а ус-
ловие ассоциативности заменено соотношением (16.4), называется алгеб-
рой Ли.
Векторная алгебра представляет собой простейший пример алгебры Ли.
16.4 Задачи
1. При каких р преобразование трехмерного ориентированного евклидова
пространства по правилу г р х г + (р-г)р является изометрией?
2. Найдите объем V параллелепипеда в евклидовом пространстве В4 с реб-
рами а = (2; 1; 1; 0), b = (0; 1; 0; -1), с = (-1; 0; 3; 2).
3. В условиях предыдущей задачи найдите расстояние от элемента с до
подпространства span{a, b} евклидова пространства В4 (со стандартным
скалярным произведением).
4. В трехмерном ориентированном евклидовом пространстве с постоянны-
ми и некомпланарными скоростями с? (1 j 3) движутся три плоско-
сти (x—Cjt)-Cj — 0. С какой скоростью с движется точка их пересечения?
Какова величина |с|?
5. Постройте полярную факторизацию оператора, преобразующего трех-
мерное ориентированное евклидово пространство по правилу г рх г.
где |р| = 1.
6. Покажите, что для оператора А : х н-> ст х х, где ш — произвольный орт,
при каждом натуральном п выполнено равенство Дп+4 = Ап.
7. Для каких пар {а, Ь} отображение Т(х) — а х х + b имеет неподвижные
точки? Найдите такие точки для каждой пары.
8. Определив в классе квадратных матриц порядка п антикоммутативную
операцию [А, В] = АВ — ВА, проверьте для нее соотношение (16.4).
Глава 17
Спектральная теория
Аннуляторы. — Операторное разложение единицы. — Спектраль-
ные и корневые подпространства. — Диагональный и нильпотент-
ный операторы. — Неравенство Кэли-Гамильтона. — Нильпотент-
ное возмущение.
17.1 Аннуляторы
Пусть А — произвольный оператор в комплексном линейном простран-
стве X, не обязательно конечномерном.
Определение. Нормализованный полином -0 называется аннулятором
элемента х, если ф(А)х = 0.
Определение. Аннулятор элемента х называется его минимальным
аннулятором, если не существует аннулятора х степени, меньшей deg ф.
Теорема 17.1. Для любого элемента х конечномерного пространст-
ва X существует единственный минимальный аннулятор.
о Для х = 0 аннулятором будет единичный полином: степень его,
конечно, понизить нельзя, а других нормализованных полиномов той
же степени просто нет. При х ф 0 рассмотрим набор
последний элемент которого принадлежит оболочке независимых пре-
дыдущих: Атх = aiAm~1x + + am_iAx + атх. Очевидно, полином
'ifj(z) = zm — a\Zm~r — — am_iz — ат является аннулятором элемента х.
Для аннулятора меньшей степени <д(г) = zk — ДД-1 — — Д, зави-
симость в последовательности АД обнаруживалась бы раньше. Един-
170
17.1. АННУЛЯТОРЫ
171
ственность минимального аннулятора -0 обеспечена однозначностью раз-
ложения вектора Атх по независимым предыдущим векторам последо-
вательности А*х. <з
Теорема 17.2. Любой аннулятор элемента х делится на его мини-
мальный аннулятор.
о Пусть -0 — минимальный аннулятор х, а — другой его аннулятор.
По теореме о делении с остатком, = ifiy + у, где либо у = 0, либо
deg у < deg <ф. Последнее невозможно, поскольку у — аннулятор х:
у(А)х = р(А)х — у(Ауф(А)х = 0 ,
и степень его не может быть ниже степени аннулятора ф.
Определение. Нормализованный полином р называется аннулятором
оператора А, если он является аннулятором каждого элемента ж, т. е.
если (ДА) — нулевой оператор.
Определение. Аннулятор рл оператора А называется его минималь-
ным полиномом, если не существует аннулятора А меньшей степени.
Теорема 17.3. Минимальный полином оператора А, действующего в
конечномерном пространстве, существует и единствен.
о Пусть х = S /3j(x)bj — разложение х по базису {А, ..., bn}, ifij —
минимальный аннулятор bj и р = C^j — нормализованное наименьшее
общее кратное всех полиномов Д,. Для произвольного х
р(А)х = S (5j(x)p(A)bj = S Д(т)СДА)(^(А)бД = 0.
Итак, р — один из аннуляторов оператора А. Пусть -0 — другой его
аннулятор. Будучи аннулятором каждого bj, полином -0, согласно Тео-
реме 17.2, делится на каждый из полиномов i^j, а значит, делится и на
их наименьшее общее кратное р. Следовательно, deg р — минимально
возможная степень аннулятора А. Пусть р — отличный от р аннулятор
той же степени, тогда разность р — р нормализованных полиномов р
и р, аннулируя А, имеет меньшую степень, что невозможно.
Замечание. Отметим вполне конструктивный характер Теоремы 17.1 и опираю-
щейся на нее Теоремы 17.3.
Теорема 17.4. Множество собственных чисел оператора А совпадает
с множеством корней его минимального полинома р.
172
ГЛАВА 17. СПЕКТРАЛЬНАЯ ТЕОРИЯ
о Пусть Л — корень 72, т. е. 79(2) = д(г) (г —Л). Найдется д, для которого
х = т](А) у ф 0, иначе у аннулирует А, имея меньшую, чем ср степень.
Тогда х — собственный вектор, отвечающий значению Л:
(А — ХЕ) х = (А — ХЕ) у(А) у = 72(A) у = 0 .
Обратно, пусть Л — произвольное собственное значение оператора А
их — собственный вектор, отвечающий значению Л. Из определения
собственного вектора следует, что ^(z) = z — X — минимальный анну-
лятор х. Поэтому полином 72, являясь аннулятором каждого элемента
пространства, должен (согласно Теореме 17.2) делиться на z — Л.
17.2 Операторное разложение единицы
Определение. Равенство Е = Е Ру, в котором операторы Pv дизъ-
юнктны (т. е. Р^Р„ = О при д ф и) — называется операторным раз-
ложением единицы.
Замечание. Во-первых, очевидна перестановочность операторов Р„, во-вторых,
умножая обе части равенства У Pv = Е на Р^, видим, что операторы Рм идемпо-
тентнът. Р^ = Рм.
Теорема 17.5. Операторное разложение единицы порождает разло-
жение пространства X в прямую сумму подпространств Х„ = imP;,.
о Действительно, всякий элемент х представим суммой элементов под-
пространств Хр. х = Ex = (£ Р„) ж = S Ррх. Проверим тривиальность
разложения нуля. Пусть 0 = S ум, где у^ — элемент подпространства
imPM, т.е. у^ = P^z^. Последовательно находим:
Ух = P\Zx = PxZ\ = Рд S Р^ = РхХ2 у^ = Р\0 = 0.
Предложение доказано.
Пусть X = ф Хд (где индекс Л е (С принимает конечное число различных
значений) — некоторое разложение пространства X в прямую сумму под-
пространств Хд и х = S х\ — соответствующее разложение элемента х
на компоненты тд е Хд.
Определение. Отображение ()н : х xft называется проектором из
пространства X на подпространство Х/7 (параллельно остальным сла-
гаемым прямой суммы фХд).
17.3. СПЕКТРАЛЬНЫЕ ПОДПРОСТРАНСТВА
173
Теорема 17.6. Проекторы Qx являются линейными операторами, в
сумме дающими разложение единицы. При этом пп<Эд = Хд.
о Складывая равенства ах = Щ а хх и /Зу = £ /Зух (хх,ух е Хд)
почленно, ввиду однозначности разложения элемента а х + (Зу в сумму
элементов подпространств Хд, приходим к равенству
Qx(ax + (Зу) = а хх + (Зух = aQx(x) + (3Qx(y),
устанавливающему линейность отображения Qx. Далее, равенство
(£ <5д) х = £ Qxx = £ хх = х = Ех,
справедливое для произвольного х е X, говорит о том, что £ Qx = Е.
При Л Ф у компонент xfl в подпространстве Хд — нулевой, поэтому
выполнены равенства QxQ^x = Qxx^ = 0 = Ох, откуда QXQ^ = О.
По определению, пнбД Хд. Обратно, всякий х из Хд является своим
собственным компонентом в Хд, т. е. Хд пп<Эд. <1
Итак, всякому разложению пространства в прямую сумму отвечает раз-
ложение единичного оператора в сумму дизъюнктных проекторов и об-
ратно, всякому разложению единичного оператора в сумму дизъюнкт-
ных проекторов соответствует разложение пространства в прямую сум-
му образов этих проекторов.
17.3 Спектральные подпространства
Всюду ниже для минимального полинома оператора А используется обо-
значение <р(г) = П(г — у)™^ = (г — X)m^yx(z).
Взаимно простые сомножители (г — хуАА порождают полиномиальное
разложение единицы (см. стр. 52)
1 = £ Рд , где рх = ахух (17.1)
А
Согласно Теореме 5.3, при у ф Л для компонентов р^, рх полиномиаль-
ного разложения (17.1) выполнены сравнения рурх = 0 (mod р). При
замене каждой степени z соответствующей степенью оператора А эти
сравнения переходят в операторные равенства. В частности, полиноми-
альное разложение единицы (17.1) переходит в операторное разложение
единицы
Е = ХРх-, РХР. = О- (А^д) (17.2)
174
ГЛАВА 17. СПЕКТРАЛЬНАЯ ТЕОРИЯ
Л=Рл(А) = ^д(А)ал(А). (17.3)
Определение. Операторы Р\ = р\(А) называют спектральными про-
екторами, отвечающими оператору А.
Разложение (17.2), в соответствии с Теоремой 17.5, порождает разложе-
ние X = фХд = ф пнРд.
Определение. Подпространства Хд называются спектральными под-
пространствами оператора А.
17.4 Корневые подпространства
Спектральные подпространства можно описать и без привлечения спек-
тральных проекторов. Пусть Л — собственное значение оператора А.
Определение. Пространство У\ = ker(A — ХЕ)т(А> называется корне-
вым подпространством оператора А, соответствующим точке Л.
Замечание. Собственное подпространство ker(A — ХЕ) является, очевидно, ча-
стью корневого подпространства У\.
Теорема 17.7. Корневое подпространство Ух переходит в себя под дей-
ствием оператора А.
о Действительно, пусть элемент х входит в Ух, тогда для его образа Ах
имеем (А — ХЕ)т(А Дх = А(А — ХЕ)т(Ах = 0,т.е. Ах тоже принадлежит
подпространству У\.
Теорема 17.8. Корневое подпространство Ух совпадает со спектраль-
ным подпространством У\.
о Согласно (17.3), (А — ХЕ)т(Арх = (А — ХЕ)т(А ^х(А)ах(А), поэтому
(А — ХЕ)т(Арх = (д(А)нд(А) = О. Таким образом, получаем включение
Хд = пнРд ker(A — ХЕ)т^ = У\. Проверим обратное включение.
Поскольку произведение рр(А) содержит множитель (А — ХЕ)т(А\ для
произвольного х из ker(А — ХЕ)™^ При р А Л выполнено равенство
Ррх = а^(А)р^(А)х = 0. Следовательно, х = S Руг = Р\х принадлежит
подпространству ПнРд = Хд. <1
Замечание. Содержание теоремы можно выразить, сказав, что (г — Д)т(Л) анну-
лирует сужение А на спектральное подпространство Хд.
17.5. ДИАГОНАЛЬНЫЙ ОПЕРАТОР
175
Теорема 17.9. Степень (z — X)m^ является минимальным полиномом
для сужения А|Хд оператора А на подпространство Хд.
о Аннулятор (г — хуАА должен делиться на минимальный полином,
поэтому последний имеет вид (г — A)fc, где к т(А). Если к < т(А),
то степень (г — А)т(л)-1 аннулирует каждый элемент х из ini Ед. То-
гда полином ^(z) = %д(г)(г — А)т(л)-1 — аннулятор А. Действительно,
9?д(А)(А — ХЕ)7111^-1 Р\ = (р\(А)О = О. Для проектора же Pfl при д ф А
выполнены равенства ^(А)РМ = (А — АЕ)т(А)-19?д(А)Рм = О, поскольку
полином Дд(А) содержит множитель (А — цЕ)т^ и
(Л - = аАА)(А - = «,.(ЛМЛ = О.
Поэтому г/i (А) = £ ъДА^Рх = О, и аннулируя А, делится на мини-
мальный полином д.
Таким образом, предположение к < т(А) приводит к абсурдному вы-
воду о делимости полинома i/i(z) = (г — А)т(л)-1дд(г) на минимальный
полином д(г) = (г — А)т(л)дд(г). <з
17.5 Диагональный оператор
Как отмечалось в 17.4, собственное подпространство ker(A—АЕ) являет-
ся частью спектрального подпространства Хд. Поскольку подпростран-
ства Хд дизъюнктны, собственные подпространства тем более дизъюнкт-
ны, так что из них можно образовать прямую сумму.
Определение. Оператор D называется диагональным, если прямая сум-
ма его собственных подпространств совпадает с X.
Теорема 17.10. Следующие предложения равносильны.
(1) Оператор D диагоналей.
(2) Все корни минимального полинома D простые.
(3) Для некоторого разложения единицы D = £ АРд.
(4) В некотором базисе матрица D диагональна.
о Схема доказательства: (1)^>(2)^>(3)^>(4)^>(1).
(1)=>(2) Если оператор D диагоналей, произвольный элемент х может
быть представлен суммой х = £ хх собственных векторов хх — элемен-
тов ядер ker(Z) — АЕ). Полином ^(г) = П(^ — А) является аннулятором
176
ГЛАВА 17. СПЕКТРАЛЬНАЯ ТЕОРИЯ
каждого жд, поскольку ^(Р) содержит множитель (Р — ХЕ). Следова-
тельно, 'ifi(z) аннулирует произвольный х = Е жд, т. е. является аннуля-
тором D и делится на минимальный полином ip(z) оператора D. Так как
у ф нет кратных корней, их нет и у д.
(2)=>(3) В случае простых корней ker(P — ХЕ)тР^ = ker(P — ХЕ) при
всех Л, так что подпространство Хд = пнРд одновременно является соб-
ственным. Для произвольного элемента ж равенство
Dx = D \ Yi Р\] х = Yi D(P\x) = Е А(Рдж) = ( Е АРд ) ж,
\ А ) А А \Х )
показывает, что D — линейная комбинация спектральных проекторов.
(3)=>(4) Пусть D = Е АРд для некоторого разложения единицы. Соглас-
но Теореме 17.5, разложению Е = Е Рд соответствует разложение X на
спектральные подпространства Хд = imP\. Выберем в каждом Хд про-
извольный базис. Элемент базиса, имея вид b = Р\с, является для D
собственным: Db = (Е дРД Рдс = АРд с = ХЬ. Соединяя базисы подпро-
странств Хд, получаем базис X, составленный из собственных векторов
оператора Р, а в базисе собственных векторов матрица оператора, оче-
видно, диагональна.
(4)^>(1) Если матрица оператора D диагональна в каком-то базисе Ь, то
все векторы из b — собственные. Разобьем b в объединение наборов Ьд,
условившись включать в Ьд собственные элементы, отвечающие одному
и тому же А. Ясно, что Хд = эран{Ьд} — собственное подпространство,
отвечающее значению А, а прямая сумма всех Хд равна X.
Следствие. В базисе b матрица оператора D — zE также диагональ-
но, поэтому Xd(z) = П(А — z)n(x\ гдеп(Х) — размерность собственного
подпространства Хд.
Теорема 17.11. Оператор В перестановочен с диагональным опера-
тором D = Е АРд тогда и только тогда, когда он перестановочен с
каждым из спектральных проекторов Р\ этого оператора.
о Пусть операторы В и D перестановочны. Покажем, что для произ-
вольных точек спектра Аид выполнено равенство
= Р^ВРх . (17.4)
17.6. НИЛЬПОТЕНТНЫЙ ОПЕРАТОР
177
Ввиду дизъюнктности проекторов, DPV = vPv = PVD. Поэтому при
условии Л ф д
(А - ОР>.ВР» = (АРл)ВРм - =
= РЛПВРМ - РЛВРР„ = РЛ(ВВ - В£>)Р„ = О ,
т.е. выполнено равенство (17.4). При А = д оно тривиально. Суммируя
теперь в (17.4) по всем д, приходим (с учетом свойства Е Р^ = Е) к
заключению: Р\В = В Р\. <з
17.6 Нильпотентный оператор
Определение. Оператор В называется нильпотентным, если его ми-
нимальный полином имеет вид д(г) = zm. Число z/(B) = т называется
индексом нильпотентности оператора В.
Теорема 17.12. Для произвольного нильпотентного оператора В вы-
полнена оценка ДВ) dimX.
о Допустим, что т = ДВ) 1. Тогда Вт-1 О, как следует из
определения индекса ДВ). Существует поэтому элемент х, для которого
все векторы цепочки х, Вх, ..., Вт~1х ненулевые.
Пусть ст_гВт~гх + + cm_iBm~1x = 0, где ст_г ф 0. Действуя на
обе части равенства оператором Вг~1, заключаем, что Вт-1т = 0. Мы
пришли к противоречию, показывающему, что нетривиальная нулевая
комбинация векторов набора х, Вх, В2, ..., Вт~1х невозможна, так что
набор этот независим и т < dimX.
Следствие. Кратность т(А) корня минимального полинома не пре-
восходит размерности спектрального подпространства Хд, а степень
минимального полинома не выше размерности пространства X.
о Согласно Теореме 17.9, сужение (А — АВ)|Хд нильпотентно с индек-
сом т(А). Поэтому выполнено неравенство m(A) < dim Ха. Кроме того,
deg = S m(A) A S dim Ха = dimX.
Оценку m(A) < dim Ха назовем неравенством Кэли-Гамильтона1).
«Квазинулевой» характер нильпотентного оператора отражается в сле-
дующей теореме о нильпотентном «возмущении».
i) Cayley, Arthur (1821-1895) — английский математик
178
ГЛАВА 17. СПЕКТРАЛЬНАЯ ТЕОРИЯ
Теорема 17.13. Если операторы А и D перестановочны, а их разность
В = А — D нилъпотентна, то характеристические полиномы этих
операторов совпадают: ха = Xd-
о Пусть В"1 = О, Az = А — zE и Dz = D — zE, тогда все эти операто-
ры перестановочны и Az — Dz = В. Пользуясь мультипликативностью
детерминанта, из тождества
А™ = Аш _ (Втуп = (Az _ + . . . +
находим: Ха (г) = det(Az — тВ) det(A™-1 + +
Допустим вначале, что z не есть собственное значение оператора А, то-
гда в левой части равенства — ненулевая постоянная, в то время как в
правой — произведение двух полиномов от т. Следовательно, оба они
постоянны по г, в частности, det(Az — тВ) не зависит от т. Полагая
поочередно т = 0 и т = 1, приходим к равенству
Xa(z) = det Az = det(Az - В) = det Dz = Xd(z) .
Полиномы ха и Xd-i совпадающие в С (за возможным исключением кор-
ней первого из них), совпадают всюду в С.
При z = 0 получаем
Следствие. Если разность коммутирующих операторов А и D ниль-
потентна, то det А = det В.
17.7 Задачи
1. Пусть оператор А обратим, а коммутирующий с ним оператор В ниль-
потентен. Покажите, что оператор А + В обратим и выразите (А + В)-1
через А и В.
2. Докажите, что оператор, совпадающий с ему обратным, диагоналей.
3. Некоторая нечетная степень действительной матрицы А равна Е — А.
Может ли определитель |А| быть отрицательным? Нулевым?
4. Пусть операторы А и В коммутируют. Верно ли, что у них есть общий
собственный вектор?
Глава 18
Теория Жордана
Разложение Жордана. — Теорема Кэли-Гамильтона. — Един-
ственность разложения. — Опорные подпространства. — Баш-
ня как прямая сумма секций. — Базис Жордана. — Формулы
Фробениуса.— Единственность жордановой формы.
18.1 Существование разложения
Определение. Если А = D + В, где BD = ВВ, оператор D диагона-
лей, а оператор В нильпотентен, то говорят, что оператор А допускает
разложение Жордана1).
Замечание. Ясно, что все три оператора, участвующие в разложении,
попарно перестановочны.
Теорема 18.1. Любой оператор допускает разложение Жордана.
о Пусть Р\ — спектральные проекторы, порождаемые оператором А.
Положим D = Е АРд, В = А — Е = Е (А — ХЕ)Рх и проверим ниль-
потентность оператора В. Пусть т = maxm(A). Как следует из Теоре-
мы 17.9, (А — ХЕ)тРх = О. Поэтому
/ \ т
Вт = ГЕ (А - XE)P\j = Е (А — ХЕ)тРх = О ,
что и требовалось.
i) Jordan, Marie Ennemond Camille (1838-1922) — французский математик
179
180
ГЛАВА 18. ТЕОРИЯ ЖОРДАНА
Теорема 18.2. Характеристический полином оператора А является
его аннулятором.
о Пусть А = D + В — разложение Жордана для оператора А. По
Теореме 17.13 и следствию из Теоремы 17.10, характеристический по-
лином ХА-, совпадая с xd, имеет вид %(z) = П(г — А)П(Л\ где п(А) —
размерность Хд. По Теореме 17.12, т(А) < п(А), так что минималь-
ный полином tp(z) = П(г — Х)т^А делит полином %(z). Тем самым,
у(А) = ^(А)ср(А) =0. <]
Замечание. Это утверждение обычно называют теоремой Кэли-Гамильтона.
18.2 Единственность разложения
Теорема 18.3. Разложение Жордана произвольного оператора един-
ственно.
о Пусть множество М cz (С конечно, £ = Е — операторное разло-
жение единицы, в котором д пробегает М, и пусть выполнено равенство
А = £ yQp, + С*, где С — нильпотентный оператор, перестановочный с
оператором А.
Теорема будет доказана, если мы установим, что М совпадает со спек-
тром А, а слагаемые в прямой сумме X = являются корневыми
подпространствами оператора А.
С учетом свойств разложения единицы имеем
(А - /aE)Q^ = ^£ hQ„ + С - £ = CQ^ .
По Теореме 17.11, оператор С перестановочен с каждым из проекто-
ров Q^. Пользуясь этим, для каждого натурального к получаем равен-
ство (А - /iE)kQ^ = CkQ^. Пусть k(ja) — минимальное к, при котором
выполнено равенство CkQ^ = О, тогда
(Л - = О , (18.1)
так что с= ker(A — цЕ)к^\ а (г - у)к^ — минимальный анну-
лятор некоторого элемента из подпространства imQ^. Следовательно,
18.3. БАЗИС ЖОРДАНА
181
минимальный полином (р делится на (г — а значит, и на произве-
дение = П (г — Кроме того, полином А является аннулятором
оператора А: действительно, если 'ф(г) = (z)(z — то
V>(A) = ф(А) S Q,. = Е МА)(А ~ = О .
д д
Таким образом, полиномы 6' и д совпадают, так что М — спектр опе-
ратора А и к(д) = т(д). Проверим включение ker(A — дЕ)к^ cz imQ^.
Пусть (А — дЕ)к^ х = 0. С одной стороны, ввиду равенства (18.1), раз-
ность у = х — Q^x аннулируется полиномом (г — С другой сторо-
ны, полином так же аннулирует элемент у. Действительно, Д/(^)
содержит все множители (г — н)к^\ для которых и ф д. Поэтому, опять-
таки ввиду (18.1), при и ф д выполнено ty^A^Qv = О и
^(А)д = ^М(А) Е Q^x = Е 4a(A)Q„x = О .
иАц vAp.
Поскольку взаимно простые аннуляторы (г — д)к^ и элемента у
обязаны делиться на его минимальный аннулятор, последний равен еди-
нице, а значит, у = х — Q^x = 0, т. е. х е imQ^. <з
Теорема 18.3 позволяет сформулировать следующее
Определение. Операторы D и В, однозначно определяемые разложе-
нием Жордана А = D + В, называются, соответственно, диагональной
и нильпотентной частями А.
18.3 Базис Жордана
Фиксируя собственное значение Л оператора А, обозначим через У соот-
ветствующее Л корневое подпространство. Сужение В оператора А — ХЕ
на ЗА очевидно, представляет собой нильпотентный оператор в подпро-
странстве У с индексом нильпотентности т(А). Анализ структуры опе-
ратора В является предметом теории Жордана.
Определение. Ненулевое подпространство ЗА У назовем опорным,
если выполнены следующие два условия.
1. Для неотрицательных к образы2) ВкУ0 подпространства ЗА при по-
следовательных применениях В дизъюнктны.
2) В этом разделе удобно обозначать через FZ образ подпространства Z при
отображении F.
182
ГЛАВА 18. ТЕОРИЯ ЖОРДАНА
2. Если для натурального к подпространство ВкУ0 нетривиально, то
отображение В : Вк~1У0 ВкУ0 является изоморфизмом.
Пусть 34) — некоторое опорное подпространство.
Определение. Башней Т с основанием 34) будем называть прямую сум-
му 34) Ф ВУ§ ф В234) Ф подпространства 34) и его последовательных
образов.
Очевидно, 7~ — инвариантное подпространство для В, т. е. Вх е 7”если
элемент х принадлежит 74
Определение. Слагаемые В-7 34) называются этажами башни Т с ос-
нованием 34)-
Как это следует из Определения 18.3, каждый нетривиальный этаж
представляет собой изоморфную копию основания 34)-
Определение. Число d = dim 34) назовем шириной башни, а минималь-
ное значение Д, для которого этаж Bhy0 тривиален, — ее высотой.
Выбор в подпространстве 34) произвольного базиса щ, ..., gd определяет
в подпространстве В-7 34) базис В^д^ ..., Bjgd-
Определение. Секцией назовем башню ширины h = 1.
Определение. Базис g башни 7~ высоты Д, образованный соединением
базисов gr = {ду,Вду, ..., Bh~1gj} секций
Sj = spanfe, ..., B^gj} (1 < j d)
называется каноническим базисом башни 74
В базисе g матрица сужения оператора В на башню Т является блочно-
диагональной. Количество ее (одинаковых) диагональных клеток равно
ширине d башни 7~, а порядок каждой такой клетки равен высоте h
этой башни. Клетка представляет собой матрицу сужения оператора В
на отдельную секцию башни 'Г. Для оператора В и, соответственно,
оператора В + ХЕ клетки имеют следующий вид
“ООО--- 0 0“ 1 0 0 0 0 0 1 0 00 ООО-" 00 ООО--- 10_ и “А 0 0 0 0“ 1 А 0 0 0 0 1 А 0 0 0 0 0 А 0 ООО--- 1 А_
18.4- РЕШЕНИЕ ЗАДАЧИ
183
В^Уо = spanfB^-1^ ... B^bd}
В2Уо — span{B2&i... B2bd}
ВУо — span{B&i... Bbd}
Уо = span{&i... bd}
Башня T высотой h и шириной d
Теория Жордана ставит целью представить пространство У прямой сум-
мой башен различной высоты.
18.4 Решение задачи
Введем пространства Zr = ВУ + кег Вг (0 < г т). Поскольку ядра
операторов Вг образуют возрастающую по включению последователь-
ность подпространств (флаг), такую же последовательность образуют
подпространства Zr: ВУ = ZQ cz cz cz Zm_i cz Zm = у. Обозна-
чим как Уг произвольно составленное из элементов ядра кег Вг дополне-
ние Zr_x до Zr\ Zr = Zr_y Ф J4 (Уг кег Вг). Тем самым, для всех
к < т имеет место разложение Z^ в прямую сумму Z^ = -ЗоФЭЛФ- • -©Ук-
При к = т разложение принимает форму
У1®---®Ут®ВУ = У. (18.2)
Теорема 18.4. Для всех 1 к < т выполнены равенства
ВкУк+1®---®ВкУ,п®Вк+1У = Вку. (18.3)
о Представим произвольный элемент у* из У суммой, соответствую-
щей разложению (18.2): щ + + ут + By = у* (yr е J4), после чего
подействуем на обе части равенства оператором Вк. Так как Уг cz кег />',
равенство потеряет к первых слагаемых левой части:
Вкук+1 + + Вкут + Вк+1у = Вку„
184
ГЛАВА 18. ТЕОРИЯ ЖОРДАНА
Таким образом, любой элемент подпространства ВкУ представим сум-
мой элементов подпространств ВкУк+1... ВкУт и Вк+1У. Убедимся в
единственности такого представления. Пусть имеется некоторое разло-
жение нуля
О = Вку^+1 + + Вкут + Вк+1у = Bk(yjk+i + + Ут + Ву) = Вку*
Записывая элемент у* ядра ker Вк cz Zk = 34 Ф • Ф У к Ф ВУ сначала
в виде суммы у* = ух + + уь + Ok+i + • • • + 0т + By, а затем в виде
суммы у* = Oi + + Ок + Ук+1 + + Ут + By, ввиду однозначности
разложения у* по слагаемым суммы (18.2), заключаем, что разложение
нуля тривиально.
Следствие. Выписывая разложение (18.2), а вслед за ним разложения
(18.3) для всех 1 < к < т
У1Ф У? ©•• ву2®-- Ф Ут—1 Ф вут_1 ® Ут © ВУт ф ф ву у в2у = ву
гут—2~\'/ & Ут-1 ® Вт-2Ут Вт~1Ут ф ф вт~гу = вт~2у вту = вт~гу,
и подставляя каждое из равенств в предыдущее, приходим к разложе-
нию пространства У в прямую сумму компонентов В:1Ук.
Эту сумму удобно представлять в форме диаграммы, из которой оче-
видно, что при каждом значении г подпространства ВкУг дизъюнктны.
Дизъюнктность же подпространств 1т В и Уг видна, например, из ра-
венства (18.2).
Теорема 18.5. Каждое подпространство Уг либо тривиальное, либо
опорное.
о Покажем, что для к < г отображение В : Bk~ryr ВкУг является
изоморфизмом. Пусть у — элемент Уг и В(Вк~1у) = Вку = 0. По постро-
ению, опорное подпространство Уг тривиально пересекается с подпро-
странством Zr_i. Тем более, у него нет ненулевых общих элементов ни
с одним из подпространств ker Вк, вложенных в подпространство Zr~i.
Следовательно у = 0, ядро линейного отображения В : Вк~1Уг ВкУг
тривиально и отображение является изоморфизмом.
18.5. ПОСТРОЕНИЕ БАЗИСА
185
Вт~'ут
тэт—2л] & Ут-1 вт~2ут
В2у3
ВУ2 ВУз
Х1 у2 Уз
В2Ут_! в2ут
ВУт-1 ВУт
Ут-1 Ут
Диаграмма «Замок Жордана»
Следствие. Если подпространство Уг нетривиально, то подпростран-
ство тг = Уг® ВУГ ф ВГ~1УГ представляет собой башню с основа-
нием Уг, так что подпространство У расщепляется в прямую сумму
башен.
Определение. Соединение канонических базисов всех башен называет-
ся каноническим базисом корневого подпространства У = У\ = Хд. Со-
единение канонических базисов всех спектральных подпространств Хд
называется каноническим базисом оператора А.
Итак, в каноническом базисе матрица оператора А имеет блочно-диаго-
нальную гнездовую структуру. Спектральным подпространствам соот-
ветствуют блоки верхнего уровня. Они состоят из диагональных блоков
среднего уровня, отвечающих различным башням. Наконец, блок каж-
дой башни составлен из диагонально расположенных одинаковых мат-
риц, порядок которых равен высоте башни, а число таких матриц — ее
ширине.
18.5 Построение базиса
Как видно из диаграммы на стр. 185, для построения канонического
базиса достаточно по каждой точке Л спектра А построить базисы [34-]
оснований башен Тг- Пусть далее т = т(А), а В = А — ХЕ. Исходя из
Определения 18.3, для построения базисов [Хг] следует:
(а) найти базис [X] подпространства У = ker Вт;
186
ГЛАВА 18. ТЕОРИЯ ЖОРДАНА
(Ь) найти базис [ВУ| подпространства ВУ;
(с) найти базисы [кег Вк] ядер кег Вк при 1 < к < тп;
(d) найти каноническую базу набора [BJ{|[kerB] [kerBm];
(е) удалить из нее поднабор [ВУ|.
Примеры.
1. В пространстве X = Р.-} полиномов степени меньшей 5 найдем канониче-
ский базис для оператора В = D2, где D — оператор дифференцирования.
Минимальный полином ip(z') — z3. так что У — кег В3 = Р5. Составим после-
довательность из базисов ВУ — Рз, кег В = Р2, кег В2 = Р4, кег В3 = Р5:
z Z2 Z3'
1 1! 2? зГ
z z2 z3 z±~
1----------------
1! 2! 3! 4!
1 — —
1! 2!
Выделим каноническую базу:
3! J L 4! ’
Удалив базис ВУ. получим векторы опорных подпространств
A Z3
Ф) = , v(z) =
Базис Жордана:
[?/ Ви | v Bv B2v\ —
z3 z
ЗГ 1!
4! 2! 1
Матрица оператора D2 в базисе Жордана:
J = ’ 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 10 0 0 0 0 1 0
2.
Построим базис Жордана оператора А
умножения матрицы
5 13 1
6140
-8 -3 —4 -3
_ -10 —1—7 0 _
на столбцы из С4.
Вычислив минимальный полином p(z) = (z + l)(z — I)3, находим спектр опера-
тора А. Корневое подпространство X-i одномерно. Его базис состоит из един-
ственного столбца С4 — собственного вектора, отвечающего точке А = — 1:
18.6. ЕДИНСТВЕННОСТЬ ФОРМЫ
187
C'J = [3 1 — 5 — 4]. Определив оператор В равенством В — А — Е, найдем
базис подпространства У — Xi = ker В3 и базис подпространства ВУ:
О 0 1
О 1 О
-1 -1 —2
1 О О
-1 -1
—2 -1
1 1
3 2
Составим последовательность базисов ВУ, кегВ, кегВ2, кегВ3
Выделим из нее базовый набор
и, удалив из него базис ВУ, найдем (единственный!) вектор Ci опорного ба-
зиса = [0 0 — 1 1]. Составим базис, элементы которого — столбцы
матрицы
0-203
С = [С1С2С3С4] = [Ci BCi B2Ci С4] =
16 4-4
Вычислив С \ убеждаемся, что
С-1АС -
10 0 0
110 0
0 11 0
0 0 0 -1
18.6 Единственность формы
Обозначим через dk = dim 34 ширину башни 74 т. е. число клеток по-
рядка к в рассматриваемом спектральном блоке. Следующий результат
принадлежит Фробениусу3).
3) Frobenius, Ferdinand Georg (1849-1917) — немецкий математик
188
ГЛАВА 18. ТЕОРИЯ ЖОРДАНА
Теорема 18.6. Число dk клеток порядка к в спектральном блоке опре-
деляется равенством dk = rkBfc-1 — 2rkBfc + rkBfc+1.
о Обозначим Qk = rkBfc. Из диаграммы видно, что образ оператора Вк
есть прямая сумма всех этажей с номерами большими к. Поэтому, по
теореме о размерности прямой суммы, мы имеем
di + Д? + + ^4 + ''' + dm—i + dm = Qq — Q[
dk + dk+i + + dm-i + dm = Qk-i ~ Qk
dk+i + + dm-i + dm = Qk — Qk+i
dm—l dm Qm—2 Qm—1
dm Qm—1 Qm
Остается вычесть из каждого равенства последующее.
Следствие. Из этой теоремы вытекает, что каноническая матрица
оператора единственна (с точностью до перестановки клеток.)
Замечание. Из формул Фробениуса следует также нетривиальный вывод о вы-
пуклости невозрастающей последовательности Qk = rkBfe.
18.7 Задачи
1. Найдите жорданову форму оператора В : р н-> р”. действующего в про-
странстве Ру полиномов степени меньшей 7.
2. В пространстве (С4 задан оператор Т умножения на матрицу
3 0 2-2“
-2-10 2
0-45-2
3 -4 7 -5 _
Найдите диагональную и нильпотентную части оператора Т.
3. Найдите жорданову форму оператора Т без построения жорданова ба-
зиса (по формулам Фробениуса).
4. Найдите жорданов базис для оператора Т.
5. Для оператора U, действующего в пространстве Рп (полиномов степени
меньшей п) по правилу (Up)(x) — р(х + 1), укажите жорданову форму,
построив какой-либо базис Жордана.
Глава 19
Дифференциальные уравнения
Элементарное уравнение и его решения. — Структура решений
линейного однородного уравнения. — Детерминизм Коши. — Кри-
терий Вронского. — Решение задачи Коши.
19.1 Предисловие
Традиционный для теории дифференциальных уравнений, но по суще-
ству — алгебраический, материал этой главы включен в контекст ли-
нейной алгебры по следующим причинам.
Во-первых, он иллюстрирует реализованную в предыдущем изложении
идею спектрального расщепления абстрактного линейного простран-
ства примером расщепления конкретного (чрезвычайно полезного в при-
ложениях) функционального пространства.
Во-вторых, он лишний раз демонстрирует взаимопроникновение совер-
шенно различных и самостоятельно развившихся направлений матема-
тики: с одной стороны, язык линейной алгебры предельно сокращает из-
ложение теории линейного однородного дифференциального уравнения,
с другой стороны — стандартные методы этой теории, в свою очередь,
позволяют упростить алгоритмы построения некоторых ранее введен-
ных алгебраических объектов.
19.2 Пространство решений
Определение. Однородным дифференциальным уравнением, определя-
189
190
ГЛАВА 19. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
емым полиномом
p(z) = zn + а^-1 + + ап = п(г - Л)т^ = (г - X)m^x(z),
А
называется уравнение
72(D) х = х^ + aix^n~^ + + апх = 0 , (19.1)
в котором х : t x(t) — п раз дифференцируемая комплекснозначная
функция на R, D — операция дифференцирования.
В действительности, все решения (19.1) бесконечно дифференцируемы.
Теорема 19.1. Множество X решений уравнения (19.1) является под-
пространством функционального пространства С*00^), причем произ-
водная принадлежит оболочке span{T^m-1\ ..., х^т~п^} для любого
натурального т п.
о Базу для индукции по т при т = п доставляет исходное уравне-
ние. Пусть уже известно, что функция х обладает т производными
и выполнено условие х^ е span{T^m-1\ х^т~п^}. Тогда функции
набора ..., а значит, и линейная их комбинация х^
могут быть продифференцированы по меньшей мере еще один раз. При
этом производная д;(т+1) выразится линейной комбинацией производных
меньшего порядка.
Следствие. Если х — решение уравнения (19.1) и при 0 < т < п вы-
полняются равенства х^т\0) = 0, то х^т\0) = 0 и при всех т п.
Замечание. Пространство X устойчиво относительно дифференцирования: ес-
ли х — решение уравнения (19.1), то Dx — также его решение.
Определение. Элементарным уравнением, соответствующим корню Л
полинома 72, назовем дифференциальное уравнение
D’a"(a)x = (D — ХЕ)т(х)х = 0 . (19.2)
Обозначим через Хд пространство всех решений такого уравнения.
Теорема 19.2. Пространство Хд является подпространством про-
странства X.
19.2. ПРОСТРАНСТВО РЕШЕНИЙ
191
о Пусть х удовлетворяет уравнению (19.2). Применив к обеим его ча-
стям оператор <^a(D), найдем, что <ДП)т = 0. <i
Пространство Хд нетрудно описать явно.
Теорема 19.3. Пространство Хд состоит из всевозможных функций
вида x(t) = p(t) exp(Xt), где р — полином степени меньшей т(А).
о В пространстве САДИ) определим оператор F умножения на функ-
цию ехр(—Xt): (Fu)(t) = ехр(—Xt)u(t). Для произвольной функции и
имеем DFu = FD и — XFu = F(D — ХЕ)и. Примем для оператора D — ХЕ
обозначение Пд, тогда DF = FDA, и
D'"F = Dm-1FDA = Dm-2FDx = ... = FDF .
zv Л Л
Тем самым, уравнения Dm(Fx) = 0 и = 0 равносильны. Первое
же из уравнений, в свою очередь, равносильно утверждению, что Fx —
полином, степень которого меньше т.
Замечание. В частности, набор функций вида tmext, где 0 <т< т(Х) является
одним из базисов пространства Хд.
Теорема 19.4. В пространстве Хд существует базис вида
хх, DA;rA, ... , D”(a)-4 (Da = D - ХЕ).
о Функции xm(t) = F1 exp(At)/m!, где 0 < т < т(А), образуют базис
пространства Хд. Пусть F — оператор умножения, использованный при
доказательстве предыдущей теоремы. Тогда
(FDATm)(t) = (DFTm)(t) = (F7m!)' = (Fxm_^t),
т. e. DATm = xm_i. При x\ = Tm(A)_i получаем требуемое.
Следствие. Полином (г — Х)т^ является минимальным аннулятором
элемента х\.
Рассматривая оператор дифференцирования D исключительно на функ-
циях из X, можно, в силу (19.1), характеризовать полином р как анну-
лятор оператора D. Покажем, что р — минимальный полином для D.
Теорема 19.5. Минимальный полином оператора D существует и сов-
падает с полиномом р, порождающим уравнение (19.1).
192
ГЛАВА 19. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
с> Пусть ф — какой-то аннулятор D. Тогда -0 является аннулятором
каждого вектора, в частности, аннулятором элемента тд, участвующего
в формулировке Теоремы 19.4, и для каждого Л обязан делиться на по-
лином (г — Х)тО — минимальный аннулятор соответствующего элемен-
та х\. Но в этом случае делится и на — наименьшее общее кратное
всех таких полиномов.
Теорема 19.6. Пространство X решений уравнения (19.1) распадается
в прямую сумму подпространств Хд, состоящих из решений элемен-
тарных уравнений (19.2), так что каждое решение х уравнения (19.1)
однозначно представимо формулой
x(t) = S Px(t) exp(At), degj^ < m(A).
A
При этом dimX = degp.
о Согласно спектральной теореме, X = Ф ker = фХд. По теореме
о размерности прямой суммы, dimX = S dimXд = S т(А) = deg%? = п.
Теорема доказана.
Следствие. Соединяя базисы {eAi, t eXt. ..., ext}, мы получаем ба-
зис пространства всех решений однородного уравнения (базис Эйлера).
Замечание. Поскольку функция tm exp(Xt) представима сходящимся на К степен-
ным рядом, то сходящимся на К рядом по степеням t представимо любое решение
уравнения (19.1).
19.3 Задача Коши
Каждому решению х уравнения (19.1) сопоставим строку X начальных
условий. Очевидно, С : х X = [т(0) т'(0) т"(0)... ж(п-1)(0)]. — линей-
ное отображение из X в Rra. Задача Коши состоит в обращении отобра-
жения С.
Теорема 19.7. Для любой строки X е Rn найдется единственное ре-
шение х уравнения (19.1), подчиненное условию С(х) = X.
о Говоря языком линейной алгебры, теорема утверждает, что линей-
ное отображение С — изоморфизм. Согласно Теореме 19.6, размерности
пространств X и Rra совпадают, поэтому достаточно убедиться в триви-
альности ядра отображения С.
19.3. ЗАДАЧА КОШИ
193
W(4) =
Допустим, что какому-то решению х соответствует нулевой набор на-
чальных условий. Следствие Теоремы 19.1 утверждает, что тогда про-
изводные всех порядков функции х обращаются в нуль при t = 0. Как
было указано в замечании к Теореме 19.6, любое решение х уравне-
ния (19.1) представимо сходящимся на R рядом £ cmtm. Такой ряд с
необходимостью является рядом Тейлора функции х: его коэффициен-
ты вычисляются по формуле ст = ^т^(О) = 0 и, следовательно, этот
ряд может быть только нулевым.
Полученный выше базис Эйлера не всегда бывает удобен, поэтому же-
лательно располагать критерием, который позволял бы судить о базис-
ности того или иного набора решений уравнения (19.1). Такой критерий
предоставляет Теорема 19.8, принадлежащая Вронскому1).
Определение. Матрицей Вронского для системы п — 1 раз диффе-
ренцируемых на промежутке (а; 6) функций Xj называется квадратная
матрица
Ti(t) x2(t) xn(t)
T'i(t) x'2(t) x'n(t)
T2n-1\t) _
Определитель w(t) = | W(t) | матрицы Вронского называют вронскианом.
Теорема 19.8. Решения хъ ... ,хп уравнения (19.1) независимы если и
только если ш(0) Ф 0.
о Обе части теоремы доказываются методом «от противного».
(а) Если функции ад,..., хп не образуют базиса, то для этих элементов
n-мерного пространства X существует нетривиальная нулевая комбина-
ция одХ1(Р) + a2x2(t) + + anxn(t) = 0, дифференцируя которую п — 1
раз, получаем нетривиальную нулевую комбинацию столбцов матрицы
Вронского: ciiWi(t) + a2W2(t) + + araWra(t) = О. Следовательно, при
всех t, в частности, при t = 0 матрица составлена из зависимых столбцов
и определитель ее равен нулю.
(Ь) Если ш(0) = 0, то линейная система W(0)X = О имеет нетриви-
альное решение X = [уд у2 ... уга]т. Комбинация х решений ад,..., хп
уравнения (19.1) x(t) = XiTi(t)+y2T2(t) + - -+xra^i(t) удовлетворяет, оче-
видно, нулевым начальным условиям. В силу единственности решения
i) Ноёпе-Wroriski, Jozef Maria (1776-1853) — польский философ и математик
194
ГЛАВА 19. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
задачи Коши, х — нулевая комбинация. Поскольку она нетривиальна,
решения Xj зависимы и не образуют базиса.
Конструкция, аналогичная предложенной Вронским, позволяет, исходя
из произвольного базисного набора элементов пространства X, дать яв-
ную формулу для решения задачи Коши.
Теорема 19.9. Пусть x-i,... ,хп — произвольный базисный набор реше-
ний уравнения (19.1). Решение х задачи Коши с начальными условия-
ми т(т)(0) = хт, где 0 < т < п, может быть найдено из уравнения
x(t) Xi(t) Tra(t)
Х0 Ti(0) тга(0)
Xi Д(0) Д(°)
^п—1 Д"~До) •• • Д”До)
(19.3)
о При разложении определителя по верхней строке x(t) приобретает
ненулевой коэффициент w(0), следовательно, х принадлежит X как ли-
нейная комбинация решений Xi,... ,хп. Продифференцируем обе части
равенства (19.3) т раз, после чего положим t = 0 и вычтем из верхней
строки строку, содержащую хт:
(0) — Хт 0 0)
Xq Ti(0) тга(0)
Xi z'i(0) х'„(0)
^п—1 Д"~До) •• • Д"“До)
Разлагая определитель по верхней строке, видим, что
(ДДо) — xm) и>(0) = 0 ,
т.е. для х выполнены начальные условия т^(0) = хт.
Глава 20
Оператор эволюции
Модифицированная формула Лагранжа-Сильвестра для экспо-
ненты. — Дифференциальное свойство экспоненты. — Динамиче-
ская система. — Задача Коши и ее решение. — Примеры.
20.1 Действительная экспонента
Если экспонента ёДг) задана действительным полиномом Q(z), некото-
рые корни которого мнимые, вместо формулы (12.8) удобно применять
ее модифицированный вариант.
Теорема 20.1. Пусть х\,... ,хп — произвольный базис пространства
решений линейного дифференциального уравнения Q(D) х = 0. Полино-
миальная экспонента e(t, z) может быть найдена из равенства
е(С z) Tl(t) Tra(t)
1 Ti(0) тДО)
Z ®i(o) Д(о)
zn-l Д"~До) •• • Д"’До)
(20.1)
о Согласно Теореме 19.9, для произвольного базиса Т1,...,жга равен-
ство (20.1), определяет решение e(t,z) уравнения Q(JD)x = 0 с началь-
ными условиями (Dme)(0, г) = где 0 т < п.
Покажем, что e(t, z) = et(z). В качестве базиса ад,..., хп возьмем базис,
состоящий из серий вида {^trext : 0 < г < т(А)}. Для базисной функции
195
196
ГЛАВА 20. ОПЕРАТОР ЭВОЛЮЦИИ
a?(t) = eXt имеем известное из курса анализа представление:
хк \т—г
„.(-Л _ у Л л-к+г _ уу л________>т __ уу лгг \m—r tm
~ ~ Ч rlfm Ч т
к^О TIKI т^г Т'ЛТП — Г Г. т^г
Согласно формуле Тейлора, т^т\0) = 0 при т < г и т^т\0) = C*^Am-r
при т г, так что (20.1) совпадает с формулой Лагранжа-Сильвестра
для экспоненты. Ввиду единственности решения задачи Коши, при лю-
бом выборе базиса ад,..., хп функция e(t, z) совпадает с et(z). <i
Пример. Построим экспоненту, определяемую полиномом Q(z) — z3 + z.
Базис пространства решений однородного уравнения х + х — 0 составим из
функций 1, sint, cost. Вычисляя определитель
et(z) 1 sint cost
110 1
г 0 1 0
z1 0 0 -1
находим et(z) — 1 + zsint + z2(l — cost).
20.2 Дифференциальное свойство
Получим теперь для полиномиальной экспоненты аналоги свойств, при-
сущих обычной экспоненте e(t, z) = exp(zt), а именно, De(t, z) = ze(t, д),
e(0, z) = 1, где D, как и выше, — дифференцирование по t.
Теорема 20.2. Полиномиальная экспонента e(t,z) = et(z), заданная
полиномом Q, удовлетворяет соотношениям
(De)(z,t) = ze(t, z) (mod Q), e(0, z) = 1. (20.2)
о Как уже отмечалось, e(t, z) — решение уравнения Q(D) x = 0 с на-
чальными условиями
(Dme)(0, z) = zm , где 0 m < n .
(20.3)
Из (20.1) видно, что e(t, z) = Uo(t) + Ui(t)z + + wra_i(t)^n-1, где Uj —
линейные комбинации базисных функций хт. Равенства (20.3) означают,
что функция Wj(t) удовлетворяет уравнению Q(D)t = 0 и условиям
(D%)(0) = djk (0 к < п).
(20.4)
20.2. ДИФФЕРЕНЦИАЛЬНОЕ СВОЙСТВО
197
Пусть Q(z) = zn + a\zn~x + + ап, тогда
Q(D)e(t, z) = (Dne)(^, t) + ai(Dn-1e)(^, £) + + ane(t, z) = 0
и при t = 0 с учетом (20.3) имеем (Dne)(0, z) + a-]zn~]- + + an = 0, t. e.
(Dne)(0,z) + Q(z) = zn. (20.5)
Рассмотрим функцию f(z,t) = (De)(z, t) + Q(z)un_i(t) — ze(t,z). По-
скольку все слагаемые в правой части — решения уравнения Q(D) х = 0,
функция f тоже является его решением. Найдем начальные условия для
решения f. При 0 тп < п — 1из (20.3) и (20.4) следует, что
(D"7)(0, z) = (Dm+1e)(0, z) + Q(z)(D"X_x)(0) - ^(D™e)(0, z) =
= zm+1 + Q(z) 0 - г zm = 0,
а из (20.4) и (20.5) получаем значение
(D—г/)(0, ^) = (Пгае)(0,г) +Q(^)(Dra-4-i)(0) -^D^e)^,^ =
= (Ппе)(0,г) + ^(г)-1-гп = 0,
Таким образом, f — нулевое решение уравнения Q(D)t = 0 и, тем са-
мым, ze(t, z) = un_i(t)Q(z) + (De)(z,t). В сочетании с (20.3) при m = 0
имеем равенства (De)(z,t) = ze(t, z) (mod Q), e(0,z) = 1. <i
Теорема 20.3. Условия (20.2) вместе с требованием dege(-,t) < degQ
однозначно определяют полиномиальную экспоненту et(z).
о Пусть e(t,z) — какой-то полином по z с гладко зависящими от t ко-
эффициентами, обладающий свойствами (20.2). Полином f(z,t) степени
меньшей deg Q определим сравнением
f(z,t) = e(t, z)e_t(z) (mod Q). (20.6)
Поскольку коэффициенты полинома Q постоянны, сравнения по моду-
лю Q можно дифференцировать по параметру t. Ввиду условий (20.2),
(D/)(z, t) = ze(t, — e(t, z) ze_t(z) = 0 (mod Q)
Из неравенства deg D/ < deg Q следует, что полином D/ нулевой, т. е.
f(z,t) = /(0,z). Поэтому f(z,t) = е(0, г)ёо(^) = 1 и сравнение (20.6)
переходит в сравнение 1 = e(t,z)e_t(z) (mod Q). Умножая обе части
последнего на ёДг), с учетом группового свойства полиномиальной экс-
поненты, имеем et(z) = e(t, z)et(z)e_t(z) = e(t,z)e0(z) = e(t,z) (mod Q).
Так как степени обоих полиномов ниже degQ, полиномы e(t, г) и ёДг)
совпадают.
198
ГЛАВА 20. ОПЕРАТОР ЭВОЛЮЦИИ
20.3 Динамическая система
Определение. Функцию ж : R —> X со значениями в евклидовом про-
странстве X назовем производной от функции х : R —> X, если для
каждого вектора v скалярная функция х v является производной от
скалярной функции х г. Пусть А — линейный оператор, заданный в
пространстве X. Линейной динамической системой называется уравне-
ние х = Ах. Любое решение этого уравнения называют траекторией.
Задача Коши заключается в отыскании траектории по заданному на-
чальному состоянию ж(0).
Пусть Q — минимальный полином оператора А и ёДг) — экспонента,
порождаемая этим полиномом.
Определение. Операторной экспонентой будем называть зависящее
от действительного параметра t семейство операторов E(t) = et(A).
Замечание. Таким образом, если ёДг) = S ak(t)zk, то E(t) — линейная комбина-
ция У степеней оператора А с гладкими коэффициентами ak(t). Ясно, что
операторы A, Е(Е) и E(t) перестановочны при любых значениях параметров s л t
и что для всякого собственного вектора а оператора А, отвечающего собственному
значению а, выполнено равенство et(A) а = Е ak (t)Aka = У аДЬ)ака = et(a)a. Со-
гласно интерполяционному свойству полиномиальной экспоненты, ё^(а) = eat, так
что для вектора а выполнено равенство ёДА) а = eata.
Обозначим E(t) = S ak(t)Ak.
Теорема 20.4. Экспонента E(t) обладает следующими свойствами:
Е(0) = Е, E(t) = AE(t), E(s)E(t) = E(s + t).
о При замене степеней z в полиномиальных сравнениях предыдущего
пункта соответствующими степенями оператора А сравнения превраща-
ются в точные операторные равенства.
Замечание. Эта теорема показывает, что операторное семейство E(t) является
однопараметрической группой (относительно умножения операторов). В приложе-
ниях, как правило, применяют выразительное обозначение E(t) = eAt, называя при
этом А генератором группы eAt.
Теорема 20.5. Для произвольного начального состояния х0 задача Ко-
ши однозначно разрешима, а именно, x(t) = E(t)x0.
20-4- ФАЗОВАЯ ПЛОСКОСТЬ
199
о Проверим, что функция x(t) = E(t) х0 действительно решает по-
ставленную задачу. По свойствам операторной экспоненты,
x(t) = E(t)xg = AE(t)x0 = Ax(t)\ т(0) = Е’(0)то = Ех0 = х0.
Убедимся теперь в единственности решения. Пусть x(t) — некоторое
решение задачи Коши. Покажем, что вектор-функция Е(—t)x(t) посто-
янна. Действительно, по правилу дифференцирования произведения,
D(E'(—t)x(t)) = E(—t) x(t) — E(—t)x(t) =
= E(—t) Ax(t) — AE(—t)x(t) = E(—t) Ax(t) — E(—t)Ax(t) = O.
так что E(—t)x(t) = т(0). Применяя оператор E(t) к обеим частям ра-
венства, видим, что x(t) = E(t)x(0). <]
Замечание. Таким образом, динамическая система подчиняется принципу ла-
пласовского1) детерминизма: начальное состояние системы ДО) предопределяет ее
эволюцию x(t) = eAtx(0). Поэтому операторную экспоненту eAt часто называют опе-
ратором эволюции.
Пример. Как известно из курса физики, траектория r(t) точки твердого
тела, вращаемого с угловой скоростью ст, описывается уравнением г — со х г.
Его можно записать как г — Аг, где Аг — со х г. Поэтому r(t) — eq (Л)г(О).
Считая угловую скорость со единичной, найдем явный вид траектории r(t).
Так как А2г — (со г) со — г, то А3г = —со х г — —Аг, т.е. Q(z) — z3 + z —
минимальный полином для А, порождающий уравнение х + х — 0. Соответ-
ствующая экспонента щ(д) = 1 + zsint + z2(l — cost) найдена в предыдущем
примере. Заменяя ее аргумент z оператором А, получаем выражение
r(t) — et(A) vq — (El + sint А + (1 — cost) A2) tq =
= 'Го + sin t (co x tq) + (1 — cos t) co x (co x Tq) =
= COS t To + sin t (co X To) + (1 — cos t) (co • Го) co.
20.4 Фазовая плоскость
В классической динамике одномерное движение системы, состоящей из
единственной материальной точки, характеризуется парой {q(t),p(t)}
(координата-импульс). При этом начальное состояние {</(0),р(0)} пред-
определяет дальнейшую эволюцию системы. Всевозможные состояния
i) Laplace, Pierre-Simon (1749-1827) — французский математик, физик и астроном
200
ГЛАВА 20. ОПЕРАТОР ЭВОЛЮЦИИ
заполняют фазовое пространство Ф. При Ф = R2, говорят о фазовой
плоскости. Пусть скорость х изменения состояния линейно зависит от
положения точки х на фазовой плоскости, т. е. x(t) = Ax{t\ где А — опе-
ратор умножения действительной ненулевой матрицы на столбцы из R2.
Нам будет удобно распространить его до оператора умножения этой мат-
рицы на столбцы из (С2 (со стандартным скалярным произведением).
Вид траекторий x(t) = eAtx(fi) определится спецификой генератора А.
Пусть степень минимального полинома Q оператора А равна единице,
тогда А = аЕ, где а е R, каждый вектор а Ф 0 собственный и тра-
ектории eata представляют собой лучи, расходящиеся из точки 0 (при
положительном а), либо сходящиеся к ней (при а отрицательном).
Если degQ = 2, то полином Q, совпадая с ул(-)5 действителен и воз-
можны следующие три случая.
(1) Q(z) = (z — Л) (г — д), где Лид действительны и различны;
(2) Q(z) = (z — у)2, где у — действительное число;
(3) Q(z) = (z — i/)(z — Ф) = (z — а)2 + о;2, где г = а + гсщ ш > 0.
К случаю (1) : слева Хц > 0, справа Хц < О,
В случае (1) на плоскости есть диагонализирующий оператор А базис
векторов а и 6, отвечающих значениям Лид. Пусть х0 = аоа + /ЗоЬ, тогда
x(t) = eAtx0 = aoeAta + ^eAtb = aoeAia +
Если сщ = Д) = 0, траектория вырождается в точку d, если лишь один
из этих параметров нулевой, траектория представляет собой луч, колли-
неарный соответствующему вектору. При а0/30 ф 0 обозначим а = aoeAi
и (3 = координаты точки x(t) в косоугольных декартовых коорди-
натах, оси которых определены векторами а и Ь. Исключая параметр t,
получаем уравнения траекторий
20-4- ФАЗОВАЯ ПЛОСКОСТЬ
201
Если, например, у = 0, траектории представляют собой прямые с на-
правляющим вектором а.
Фазовый портрет в случае (2).
В случае (2) по формуле Лагранжа-Сильвестра для экспоненты
ё((г)
1
Z
е^ te*
1 О
7 1
= et(z) - - te^\z - д),
откуда видно, что e-7ieAi = E+tiA—yE'). Заметим, что на плоскости су-
ществует вектор 6, для которого а = (А-'уЕ)Ъ ф 0, иначе минимальным
был бы полином г-д. Вектор а для оператора А является собственным,
поскольку (Л — уЕ)а = Q(A)b = 0. Пусть (а + yb = 0. Действуя на обе
части равенства оператором А — уЕ, получаем уа = 0, откуда у = 0.
Поэтому векторы а и b независимы. Разложим по ним вектор началь-
ного состояния Xq = aQa + /3О6. Применяя к обеим частям разложения
оператор e~yteAt = Е + ДЛ —дЕ), имеем e~ytx(t) = аоа + /3О(6 + to). Сле-
довательно, в косоугольных декартовых координатах а, /3, оси которых
заданы векторами а и 6, траектория описывается уравнениями
(A =(<Tq + /ЗдДб^
р =р^1
по которым ее параметрически заданный график легко строится сред-
ствами анализа. Отметим, что при д = 0 все траектории — прямые с
направляющим вектором а.
В случае (3), согласно модифицированной формуле Лагранжа-Сильвест-
ра для действительной полиномиальной экспоненты,
et (z) eat cos иЛ eat sin cot
1 1 0
z а ш
= ^et(z)
weat coscot — eat sin cot(z — ст),
202
ГЛАВА 20. ОПЕРАТОР ЭВОЛЮЦИИ
откуда следует, что e~ateAt = cos аЛЕ + sinwtB, где В = (А — аЕ).
Так как (А — аЕ)2 + ш2Е = Q(A) = О, оператор В2 равен —Е. Выбрав
в R2 произвольный ортонормированный базис {/, р}, введем оператор
Тх = (х f) f + (х д) Bf, тогда Т f = f, Тд = В/ и траектория с на-
чалом / принимает вид x(t) = Тeat(cos cot f + smart g). Покажем, что T
— невырожденное преобразование (изоморфизм). Действительно, допу-
стим, что (т /) f + (т р) В/ = 0. Применяя В к обеим частям, найдем,
что (т-/) Bf — (х-д) f = 0. Вычитая из первого равенства, умноженного
на (х /) второе, умноженное на (х р), видим, что (х /)2 + (х р)2 = 0.
Следовательно, |т|2 = 0 и преобразование Т невырождено.
К случаю (3) : слева а = 0, справа а Ф 0.
Как известно, любое линейное невырожденное преобразование плоско-
сти получается изометрией с последующим растяжением (сжатием) во
взаимно ортогональных направлениях. При а = 0 траектория с нача-
лом f описывается уравнением x(t) = Т (cos art f + sinaAp), т.е. пред-
ставляет собой единичную окружность, растянутую (сжатую) во взаим-
но ортогональных направлениях, не зависящих от выбора /. Поэтому
фазовый портрет динамической системы складывается из соосных эл-
липсов с центрами в начале координат. При а А 0 в полярных координа-
тах уравнение r(t) = eat (cos ait f + sin xrt g) записывается как д = ехр(юр)
(где к = а/сд), т.е. задает логарифмическую спираль. В этом случае фа-
зовый портрет состоит из линейно деформированных логарифмических
спиралей.
20.5 Задачи
1. Пусть в действительном евклидовом пространстве задан оператор А та-
кой, что при всех действительных t оператор exp(At) сохраняет скаляр-
ное произведение. Покажите, что тогда для всех х, у выполнено равен-
ство х -Ау — —у -Ах.
20.5. ЗАДАЧИ
203
2. Пусть Н — симметричный оператор в комплексном евклидовом про-
странстве. Покажите, что при любом t Е IR оператор elHt унитарный.
3. Найдите вектор-функцию x(t), удовлетворяющую дифференциальному
уравнению х W = (х (t)-p)p с условием х(0) = <?, если |р| = 1.
4. Может ли траектория динамической системы
{х —2у — х
у =3х - 2у,
стартуя из точки (—2, —1), достичь точки (1,2)?
5. Для каких пар {<т,/3} значений параметров динамическая система
{х —х cos а — ytgfl
у —х ctg (3 — у cos а
описывает периодическое движение?
6. Разбейте плоскость параметров (trA, |А|) на части, соответствующие
рассмотренным выше случаям качественно разных фазовых портретов
системы X — АХ.