cover
series title
title
Оглавлени
Предислови
1 - Матрицы и определител
2 - Линейные пространств
3 - Системы линейных уравнени
4 - Евклидовы пространств
5 - Линейные оператор
6 - Итерационные методы рашания линейных систем и задач на собственные значени
7 - Билинейные и квадратичные форм
8 - Тензор
9 - Элементы теории груп
Алфавитный указател
Текст
                    

КУРС ВЫСШЕЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ Под редакцией А. Н. ТИХОНОВА, В. А. ИЛЬИНА, А. Г. СВЕШНИКОВА ВЫПУСК 6 ЛИНЕЙНАЯ АЛГЕБРА МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1978
В. А. ИЛЬИН, Э. Г. ПОЗНЯК ЛИНЕЙНАЯ АЛГЕБРА издание второе, стереотипное Допущено Министерством ткигего и среднего специального образования СССР в качестве учебника для студентов еыеших учебных заведений, обучающихся по специальностям вфизика», ^Прикладная математика» МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУР Ы 1978
517.1 И 46 УДК 512.8 Линейная алгебра. Ильин В. А., Позняк Э. Г. Изд. 2-е, стереотипное, серия «Курс высшей математики и математической физики», Главная редакция физико-математической литературы издательства «Наука», М., 19/8, 304 стр. Книга содержит материал по линейной алгебре, входящий в программу для студентов специальности «Прикладная матема- тика» и физических специальностей университетов. В ней изучаются матрицы и определители, линейные системы уравнений, конечномерные линейные и евклидовы пространства, линейные функционалы и линейные операторы в указанных пространствах, теория билинейных и квадратичных форм, теория тензоров, классификация поверхностей второго порядка и вопро- сы теории представлений групп. В связи с возросшей ролью вычислительных методов в книге излагаются итерационные методы решения линейных систем уравнений и соответствующих задач на собственные значения, а также метод регуляризации А. Н. Тихонова в применении к некорректным задачам линейной алгебры. Илл. 1. 20203—120 053 (02)-78 БЗ-21-24—78 © Главная редакция физико-математической литературы издательства «Наука», 1978. с изменениями.
ОГЛАВЛЕНИЕ Предисловие ....................................................... 9 Введение . . . . ..................................................11 Глава 1. Матрицы и определители ............................... 12 § 1. Матрицы ................................................... 12 1. Понятие матрицы (12). 2. Основные операции над матрицами и их свойства (13). 3. Блочные матрицы (17). § 2. Определители ............................................ 18 1. Понятие определителя (19). 2. Выражение определителя непо- средственно через -его элементы (25). 3. Теорема Лапласа (26). 4. Свойства определителей (29). 5. Примеры вычисления определи- телей (32). 6. Определитель суммы и пройзведения матриц (36). 7. Понятие обратной матрицы (38). § 3. Теорема о базисном миноре матрицы........................ 39 1. Понятие линейной зависимости строк (39). 2. Теорема о базис- ном миноре (40). 3. Необходимое и достаточное условие равен- ства нулю определителя (42). Глава 2. Линейные пространства.................................... 43 § 1. Понятие линейного пространства.............................43 1. Определение линейного пространства (43). 2. Некоторые свойства произвольных линейных пространств (47). § 2. Базис и размерность линейного пространства.................48 1. Понятие линейной зависимости элементов линейного простран- ства (48). 2. Базис и координаты (50). 3. Размерность линейного пространства (51). 4. Понятие изоморфизма линейных прост- ранств (53). § 3. Подпространства линейных пространств..................... 55 1. Понятие подпространства и линейной оболочки (55). 2. Новое определение ранга матрицы (58). 3. Сумма и пересечение под- пространств 58). 4. Разложение линейного пространства в пря- мую сумму подпространств (60). § 4. Преобразование координат при преобразовании базиса п-мерного линейного пространства........................................ 62 1. Прямое и обратное преобразование базисов (62). 2. Связь между преобразованием базисов и преобразованием соответствую- щих координат (64). Глава 3. Системы линейных уравнений............................ . 66 § 1. Условие совместности линейной системы......................66 1. Понятие системы линейных уравнений и ее решения (66).
6 ОГЛАВЛЕНИЕ 2. Нетривиальная совместность однородной системы (69). 3. Усло- вие совместности общей линейной системы (70). § 2. Отыскание решений линейной системы......................... 71 1. Квадратная система линейных уравнений с определителем основ- ной матрицы, отличным от нуля (71). 2. Отыскание всех реше- ний общей линейной системы (75). 3. Свойства совокупности решений однородной системы (77). 4. Заключительные замечания о решении линейных систем (82). Глава 4. Евклидовы пространства ,............84 § 1. Вещественное евклидово пространство и его простейшие свойства 84 1. Определение вещественного евклидова пространства (84). 2. Простейшие свойства произвольного евклидова простран- ства (87). § 2. Ортонормированный базис конечномерного евклидова пространства 91 1. Понятие ор'тонормйрованного базиса и его существование (91). 2. Свойства ортонормированного базиса (94). 3. Разложение «-мер- ного евклидова пространства на прямую сумму подпространства и его ортогонального дополнения (96). 4. Изоморфизм «-мерных евклидовых пространств (96). § 3. Комплексное евклидово пространство .........................98 1. Определение комплексного евклидова пространства (98). 2. Неравенство Коши—Буняковского. Понятие нормы (100). 3. Орто- ’ нормированный базис и его свойства (101). § 4. Метод регуляризации для отыскания нормального решения линей- ной системы ................................................ 102 Глава 5. Линейные операторы .................................... ... 109 § 1. Понятие линейного оператора. Основные свойства...............109 1. Определение линейного оператора (109). 2. Действия над линей- ными операторами. Пространство линейных операторов (109). 3. Свойства множества L(V, V) линейных операторов (110). § 2. Матричная запись линейных операторов.........................117 1. Матрицы линейных операторов в заданном базисе линейного пространства V (117). 2. Преобразование матрицы линейного опе- ратора при переходе к новому базису (119). '3. Характеристиче- ский многочлен линейного оператора (J22). § 3. Собственные значения и собственные векторы линейных опера- 123 торов § 4. Линейные и полуторалинейные формы в евклидовом пространстве 126 1. Специальное представление линейной формы в евклидовом про- странстве (126). 2. Полуторалинейные формы в евклидовом про- странстве. Специальное представление таких форм (127). § 5. Линейные самосопряженные операторы в евклидовом пространстве 130 1. Понятие сопряженного оператора (130). 2. Самосопряженные операторы. Основные свойства (131). 3. Норма, линейного опера- тора (133). 4. Дальнейшие свойства самосопряженных операто- ров (134). 5. Спектральное разложение самосопряженных опе- раторов. Теорема Гамильтона — Кэли (140). 6. Положительные операторы. Корни т-й степени из оператора (142). § 6. Приведение квадратичной формы к сумме квадратов ..........144 § 7, Унитарные и нормальные операторы ..........................146 § 8. Канонический вид линейных операторов . . . ...............151 § 9. Линейные операторы в вещественном евклидовом пространстве 155 1. Общие замечания (156). 2. Ортогональные операторы (161).
ОГЛАВЛЕНИЕ 7 Глава 6. Итерационные методы решения линейных систем и задач на собственные значения............................ . . .165 § 1. Итерационные методы решения линейных систем...............166 1. Метод простой итерации (метод Якоби) (166). 2. Общий неявный метод простой итерации (169). 3. Модифицированный метод про- стой итерации (177). 4. Метод Зейделя (180). 5. Метод верхней релаксации (180). 6. Случай несимметричной матрицы А (181). § 2. Решение полной проблемы собственных значений методом вращений 181 Глава 7. Билинейные н квадратичные формы........................187 § 1. Билинейные формы........................................187 1. Понятие билинейной формы (187). 2. Представление билиней- ной формы в конечномерном линейном пространстве (188). 3. Пре- образование матрицы билинейной формы при переходе к новому базису. Ранг билинейной формы (190). § 2. Квадратичные формы.................................. 191 § 3. Приведение квадратичной формы к сумме квадратов.........193 1. Метод Лагранжа (194). 2. Метод Якоби (197). § 4. Закон инерции квадратичных форм. Классификация квадратичных форм....................................................... 199 1. Закон инерции квадратичных форм (199). 2. Классификация квадратичных форм (201). 3. Критерий Сильвестра знакоопреде- ленности квадратичной формы (203). § 5. Полилинейные формы......................................205 § 6. Билинейные и квадратичные формы в евклидовом пространстве 206 1. Предварительные замечания (207). 2. Приведение квадратич- ной формы к сумме квадратов в ортогональном базисе (207). 3. Одновременное приведение двух квадратичных форм к сумме квадратов в линейном пространстве (208). 4. Экстремальные свойства квадратичной формы (209). § 7. Гиперповерхности второго порядка........................ 212 1. Понятие гиперповерхности второго порядка (212). 2. Парал- лельные переносы в евклидовом пространстве. Преобразование ортонормированных базисов в ортонормированные (214). 3. Пре- образование общего уравнения гиперповерхности второго порядка при параллельном переносе (216). 4. Преобразование общего уравнения гиперповерхности второго порядка при переходе от ортонормированного базиса к ортонормированному (217). 5. Инва- рианты общего уравнения гиперповерхности второго порядка (219). 6. Центр гиперповерхности второго порядка (222). 7. Стандарт- ное упрощение любого уравнения гиперповерхности второго по- рядка путем преобразования ортонормированного базиса (223). 8. Упрощение уравнения центральной гиперповерхности второго порядка. Классификация центральных гиперповерхностей (224). 9. Упрощение уравнения нецентральной гиперповерхности вто- рого порядка. Классификация нецентральных гиперповерхно- стей (226). Глава 8. Тензоры................................................ 230 § 1. Преобразование базисов и координат........................230 1. Определители Грама (230). 2. Взаимные базисы. Ковариантные и контравариантные координаты векторов (231). 3. Преобразо- вания базиса и координат (235). § 2. Понятие тензора. Основные операции над тензорами..........237 1. Понятие тензора (237). 2. Примеры тензоров (239). 3. Основ- ные операции над тензорами (241).
8 ОГЛАВЛЕНИЕ § 3. Метрический тензор. Основные операции векторной алгебры в тен- зорных обозначениях............................................246 1. Понятие метрического тензора в евклидовом пространстве (246). 2. Операция поднятия и опускания индексов с помощью метри- ческого тензора (248). 3. Ортонормированные базисы в Еа (250). 4. Дискриминантный тензор (252). 5. Ориентированный объем (254). 6. Векторное произведение (254). 7. Двойное векторное произведение (255). § 4. Метрический тензор псевдоевклидова пространства ......... 256 1. Понятие псевдоевклидова пространства и метрического тензора псевдоевклидова пространства (256). 2. Галилеевы координаты. Преобразования Лоренца (258). 3. Преобразования Лоренца про- странства Е(!, з) (259). § 5. Тензор момента инерции.................................. 262 Глава 9. Элементы теории групп................................ . 265 § 1. Понятие группы. Основные свойства групп..................265 1. Законы композиции (265). 2. Понятие группы. Некоторые свойства групп (266). 3. Изоморфизм групп. Подгруппы (270). 4. Смежные классы. Нормальные делители (271). 5. Гомоморфизмы. Фактор группы (272). § 2. Группы преобразований....................................277 1. Невырожденные линейные преобразования (277). 2. Группа линейных преобразований (278). 3. Сходимость элементов в группе GL(n). Подгруппы группы 0L(n) (279). 4. Группа ортогональных преобразований (280). 5. Некоторые дискретные и конечные под- группы ортогональной группы (282). 6. Группа Лоренца (284). 7. Унитарные группы (287). § 3. Представления групп.................................... 288 1. Линейные представления групп. Терминология (289). 2. Ма- трицы линейных представлений. Эквивалентные представления (290). 3. Приводимые и неприводимые представления (290). 4. Характеры (292). 5. Примеры представлений групп (294). Алфавитный указатель .......................................... 298
ПРЕДИСЛОВИЕ Эта книга возникла в результате переработки курса лекций, читавшихся авторами в МГУ. Отметим некоторые особенности изложения. Изложение начинается с изучения матриц и определителей, причем определитель n-го порядка вводится по индукции через определитель (п—1)-го порядка с помощью формулы разложения по первой строке. При этом легко доказывается теорема о разло- жении по любой другой строке и по любому столбцу (схема доказательства этой теоремы оказывается совершенно аналогич- ной схеме доказательства теоремы Лапласа). Традиционное опре- деление детерминанта непосредственно через его элементы явля- ется простым следствием данного в этой книге определения. Изучению линейных систем предшествует теория линейных пространств и преобразований базисов и координат векторов в таких пространствах. При изучении линейных систем мы сразу же знакомим читателя не только с обычной, но и с матричной формой записи системы и вывода формул Крамера. Изучение вещественных и комплексных евклидовых прост- ранств завершается доказательством теоремы А. Н. Тихонова об отыскании нормального решения линейной системы. При изучении линейных операторов излагаются все основные аспекты спектральной теории в конечномерных евклидовых про- странствах. Теорема о приведении.матрицы к жордановой форме доказывается с.помощью предложенного А. Ф. Филипповым корот- кого метода, основанного на индукции. Книга содержит специальную главу, посвященную итерацион- ным методам, в которой с единой точки зрения рассматриваются важнейшие итерационные методы решения линейных систем (явный и неявный методы простой итерации, метод Зейделя, метод верх- ней релаксации) и устанавливаются условия сходимости этих методов. Для общего неявного метода простой итерации выяс- няются установленные А. А. Самарским условия получения наи- более быстрой сходимости. Приводится доказательство сходимости
10 ПРЕДИСЛОВИЕ метода вращений для решения полной проблемы собственных значений. Изложение теории билинейных и квадратичных форм завер- шается приведением к каноническому виду уравнений гиперпо- верхностей второго порядка в n-мерном пространстве. При изучении тензоров, наряду с традиционным материалом, излагается важная для приложений тензорная форма записи основных операций векторной алгебры. Здесь же даются понятия псевдоевклцдова пространства, галилеевых координат и преобра- зования Лоренца. Книга завершается изложением элементов теории групп и их представлений. Следует отметить, что данная книга примыкает к выпуску «Аналитическая геометрия», хотя и может читаться независимо от него. Авторы приносят глубокую благодарность А. Н. Тихонову и А. Г. Свешникову за большое количество ценных замечаний, Ш. А. Алимову, вклад которого в эту книгу далеко вышел за рамки обычного редактирования, Л. Д. Кудрявцеву, С. А. Ло- мову и особенно А. А. Самарскому за весьма полезные крити- ческие замечания и ценные советы, Е. С. Николаеву, Д. Д. Со- колову и Е. В. Шнкину за большую помощь при написании некоторых разделов этой книги. В. Ильин, Э. Позняк 30 января 1974 г.
ВВЕДЕНИЕ В этой книге мы будем иметь дело с внешне различными объектами: Г) с матрицами (или прямоугольными таблицами из чисел), 2) с алгебраическими формами, включающими в себя так называемые линейные, билинейные и квадратичные формы, 3) с так называемыми линейными (и, в частности, с евклидовыми) прост- ранствами и с линейными преобразованиями в таких простран- ствах. Элементарные представления об этих объектах читатель имеет из курса аналитической геометрии. В самом деле, в курсе анали- тической геометрии изучались квадратные матрицы второго и третьего порядков и отвечающие этим матрицам определители. Линейная и квадратичная формы представляют собой соответ- ственно однородную линейную и однородную квадратичную функ- ции нескольких независимых переменных (например, координат вектора). Примером линейного пространства может служить сово- купность всех геометрических векторов на плоскости (или в про- странстве) с заданными операциями сложения этих векторов и умножения их на числа. Если для совокупности таких векторов задано еще и скалярное произведение, то мы придем к понятию евклидова пространства. Примером линейного преобразования в таком пространстве может служить переход от одного декартова прямоугольного базиса к другому. Несмотря на внешнее различие, перечисленные совокупности объектов тесно связаны между собой: большинство утверждений допускает равносильную формулировку для каждой из этих сово- купностей. Наиболее отчетливо эта связь выявляется при изуче- нии произвольных линейных и евклидовых пространств (и линей- ных преобразований в таких пространствах). Однако более конкретная матричная трактовка результатов непосредственно связана с фактическими вычислениями (и, в част- ности, с решением линейных систем уравнений). Именно поэтому мы начинаем наше рассмотрение с изучения матриц и неодно- кратно возвращаемся впоследствии к матричной трактовке ре- зультатов.
ГЛАВА 1 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ В этой главе изучаются таблицы из чисел, называемые м а т- рицами и играющие в дальнейшем важнейшую роль. Здесь вводятся основные операции над матрицами и детально изуча- ются свойства так называемых определителей, являющихся основной числовой характеристикой квадратных матриц. § 1. Матрицы 1. Понятие матрицы. М атр ице й называется прямоугольная таблица из чисел, содержащая некоторое количество т строк и некоторое количество п. столбцов. Числа тип называются порядками матрицы. В случае, если т = п, матрица называется квадратной, а число m — п — ее порядком. В дальнейшем для записи матрицы будут применяться либо сдвоенные черточки, либо круглые скобки: «и «12 . . . а1п «21 «22 • • • «2/1 ami ат2 • • • атп а11 «12 • * • а1п «21 «22 * ♦ • «2м «/я 1 ат2 • • • атп Впрочем, для краткого обозначения матрицы часто будет ис- пользоваться либо одна большая латинская буква (например, Л), либо символ ||а,7||, а иногда и с разъяснением: Л=||а(7|| — = (a17)(i=l, 2, ..., m; j=l, 2, ..., n). Числа a(7, входящие в состав данной матрицы, называются ее элементами. В записи а,7 первый индекс i означает номер строки, а второй индекс /— номер столбца. В случае квадратной матрицы а11 °12 • • • а1п аг1 а22 • • • агп 0 1) anl апг • • • апп
МАТРИЦЫ 13 S 1] вводятся понятия главной и побочной диагоналей. Главной диагональю матрицы (1.1) называется диагональ аи а22.. ,апп, идущая из левого верхнего угла этой матрицы в правый нижний ее угол. Побочной диагональю той же матрицы называ- ется диагональ ani a(n_1)a. . .ain, идущая из левого нижнего угла в правый верхний угол. 2. Основные операции над матрицами и их свойства. Прежде всего договоримся считать две матрицы равными, если эти матрицы имеют одинаковые порядки и все их соответствующие элементы совпадают. Перейдем к определению основных операций над матрицами. а) Сложение матриц. Суммой двух матриц Л=||а/7| (» = 1, 2, ..., т\ /=1, 2, ..., п) и B = ||bzy|| (i = 1, 2, ..., т; / = 1, 2, ..., п) одних и тех же порядков тип называется матрица С = Цс,7|| (i = 1, 2.т\ j = 1, 2, ..., п) тех же порядков тип, элементы с,7 которой равны си = ац + ьц (1=1, 2, nr, j = l, 2, ..., и). (1.2) Для обозначения суммы двух матриц используется запись С = А + В. Операция составления суммы матриц называется их сложением. Итак, по определению а11 °12 вл ааа aml ат2 • aln • °2n + &21 i>12 f>22 • amn &т1 bm2 • • • ^in • • • ^2Л _ • • • ^тп (flii + bu) (ац 4- 612) ... (ajn -j- bln) (a21 + *21) (a22 4* 622) ••• (a2n + ^2n) + (am2 + ^л>г) ••• (amn + ^mn) Из определения суммы матриц, а тоинее из формулы (1.2) непосредственно вытекает, что операция сложения матриц обла- дает теми же свойствами, что и операция сложения веществен- ных чисел, а именно: 1) переместительным свойством: Л4-В = В + Л, 2) сочетательным свойством: (А 4~В) + С = Л + (В + С). Эти свойства позволяют не заботиться о порядке следования слагаемых матриц при сложении двух или большего числа матриц. б) Умножение матрицы на число. Произведе- нием матрицы Л=||а(у[| (< = !, 2, ..., т\ / = 1, 2, ..., п) на вещественное число X называется матрица C==||cz/|| (i= 1, 2, ..., т; /=1, 2, ...,«), элементы с,у- которой равны (» —1, 2, ..., m; /==1,2, ..., n). (1.3)
14 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Для обозначения произведения матрицы на число использу- ется запись С = ХЛ или С —АХ. Операция составления произ- ведения матрицы на число называется умножением матрицы на это число. Непосредственно из формулы (1.3) ясно, что умножение мат- рицы на число обладает следующими свойствами; 1) сочетательным свойством относительно числового множителя: (Хр.) А — X (рЛ); 2) распределительным свойством относительно суммы матриц: Х(Л + В) = ХЛ + %В; 3) распределительным свойством относительно суммы чисел: (X -j- р) А = X А -р рЛ. Замечание. Разностью двух матриц Л и В одинаковых порядков тип естественно назвать такую матрицу С тех же порядков тип, которая в сумме с матрицей В дает матрицу Л. Для обозначения разности двух матриц используется естественная запись: С = А — В. Очень легко убедиться в том, что разность С двух матриц Л и В может быть получена по правилу С — А + (— 1)-В. в) Перемножение матриц. Произведением мат- рицы Л = ||а//|| (i = 1, 2, ..., т\ / —1, 2.п), имеющей по- рядки, соответственно равные тип, на матрицу В = || || (i = 1, 2, n; j=l, 2, ..., р), имеющую порядки, соответственно равные пир, называется .матрица C = ||c,7j| (i = 1, 2..т; j = 1, 2, ..., р), имеющая порядки, соответственно равные тир, и, элементы сц, определяемые формулой = (i = l, 2, .... m; j = 1, 2, ..., р). (1.4) Для обозначения произведения матрицы Л на матрицу В используют запись С = Л-В. Операция составления произведения матрицы Л на матрицу В называется перемножением этих матриц. Из сформулированного выше определения вытекает, что мат- рицу А можно умножить не на всякую матрицу В: необходимо, чтобы число столбцов матрицы Л было равно числу строк мат- рицы В. В частности, оба произведения Л-В и В-А можн» опреде- лить лишь в том случае, когда число столбцов Л совпадает с числом строк В, а число строк Л совпадает с числом столбцов В. При этом обе матрицы Л-В и В-Л будут квадратными, но по- рядки их будут, вообще говоря, различными. Для того чтобы оба произведения А-В и В-А не только были определены, нои имели одинаковый порядок, необходимо и достаточно, чтобы обе
S 1] МАТРИЦЫ 15 матрицы А и В были квадратными матрицами одного и того же порядка. Формула (1.4) представляет собой правило составления эле- ментов матрицы С, являющейся произведением матрицы А на матрицу В. Это правило можно сформулировать и словесно: элемент с у, стоящий на пересечении i-й строки и j-го столбца матрицы С —А-В, равен сумме попарных произведений соответ- ствующих элементов i-й строки матрицы А и j-го столбца мат- рицы В. В качестве примера применения указанного правила приведем формулу перемножения квадратных матриц второго порядка II Oii 012 II || 6ц || || (Оц611 ai2b21) (On6i24-ai2&22) | II a2i а2г II || 62i 622 II II (021611-4-022621) (021612+0226^2) 1 Из формулы (1.4) вытекают следующие свойства произведения матрицы А на матрицу В: 1) сочетательное свойство: (АВ)С = А (ВС); 2) распределительное относительно суммы матриц свойство: (А + В)С = АС + ВС или А(В + С) = АВ + АС. Распределительное свойство сразу-вытекает из формул (1.4) и (1.2), а для доказательства сочетательного свойства достаточно заметить, что если Л=Ца/у[| (1=1, 2, ..., т; j — 1, 2, ..., n)t (/ = 1,2, ..., n; fe= 1, 2, .. .,р),С = ||с»г||(&= 1,2.....,p; l—l, 2, ..., г), то элемент da матрицы (AB)C в силу (1.4) P / л \ равен du = 2(2 aijbjk )' cw> a элемент d'it матрицы А (ВС) равен \/=l / n ( p \ d'u =2 ait ( 2 1. но тогда равенство du=d'u вытекает из воз- ;=1 \А=1 / можности изменения порядка суммирования относительно j и k. Вопрос о перестановочном свойстве произведения матрицы А на матрицу В имеет смысл ставить лишь ,для квадратных матриц Л и В одинакового порядка (ибо, как указывалось выше, только для таких матриц А. и В оба произведения АВ и В А определены и являются матрицами одинаковых порядков). Элементарные при- меры показывают, что произведение двух квадратных матриц одинакового порядка не обладает, вообще говоря, перестановочным свойством. В самом деле, если положить А — то АВ — I 0 0 ||, а А —1| 0 J ||. Здесь мы укажем, однако, важные частные случаи, в которых справедливо перестановочное свойство*). *) Две матрицы, для произведения которых справедливо перестановочное свойство, принято называть коммутирующими.
>6 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. I Среди квадратных матриц выделим класс так называемых диагональных матриц, у каждой из которых элементы, рас- положенные вне главной диагонали, равны нулю. Каждая диа- гональная матрица порядка п имеет вид D diо ... о О di . . . О (1.5) 0 0 . . . dn где d,, d2, ..dn — какие угодно числа. Легко видеть, что если все эти числа равны между собой, т. е. dt = d2 = ... =dn — d, то для любой квадратной матрицы А порядка п справедливо ра- венство AD = DA. В самом деле, обозначим символами с,-7- и с'с} элементы, стоящие на пересечении t-й строки и /-го столбца матриц AD и DA соответственно. Тогда из равенства (1.4) и из вида матрицы D получим, что cij — a/jd, Cij dfljj — dUjj, (1-6) t. e. Cjf—Сц. Среди всех диагональных матриц (1.5) с совпадающими элемен- тами d1 = d2= ... =dlt = d особо важную роль играют две мат- рицы. Первая из этих матриц получается приб1=1, называется единичной матрицей n-го порядка и обозначается симво- лом Е. Вторая матрица получается при d = 0, называется нуле- вой матрицей n-го порядка и обозначается символом О. Таким образом, Е = 1 о ... о о 1 ; . . о о о ... о о о ... о О = о о ... 1 о о ... о В силу доказанного выше АЕ = ЕА и АО —О А. Более того, из формул (1.6) очевидно, что АЕ = ЕА = А, АО — ОА=О. (1-7) Первая из формул (1.7) характеризует особую роль единичной матрицы Е, аналогичную той роли, которую играет число 1 при перемножении вещественных чисел. Что же касается особой роли нулевой матрицы О, то ее выявляет не только вторая из формул (1.7), но и элементарно проверяемое равенство*) А + О = О + А = А. В заключение заметим, что понятие нулевой матрицы можно вводить и для неквадратных матриц (нулевой называют любую матрицу, все элементы которой равны нулю). *) Это равенство является прямым следствием формулы (1.2).
S 11 МАТРИЦЫ 17 3. Блочные матрицы. Предположим, что некоторая матрица А =||а,у|| при помощи горизонтальных и вертикальных прямых разбита на отдельные прямоугольные клетки, каждая из которых представляет собой матрицу меньших размеров и называется блоком исходной матрицы. В таком случае возникает возмож- ность рассмотрения исходной матрицы А как некоторой новой (так называемой блочной) матрицы А = ЦЛар||, элементами Лар которой служат указанные блоки. Указанные элементы мы обо- значаем большой латинской буквой, чтобы подчеркнуть, что они являются, вообще говоря, матрицами, а не числами и (как обыч- ные числовые элементы) снабжаем двумя индексами, первый из которых указьщает номер «блочной» строки, а второй — номер «блочного» столбца. Например, матрицу аи “12 “13 “14 I а1& а1В “21 “22 “23 “24 : “25 “2в Л — О31 Ода “33 а34 i а3& а3в а41 а42 а43 а44 ! а45 а4в “51 “б2 “53 а64 ! “55 “бб можно рассматривать как блочную матрицу Ди Д121| Л = . . , Я21 Л22 || элементами которой служат следующие блоки: “и “12 “13 “14 ^11 — “21 “22 “23 “24 “з1 “32 “зз “34 Л2т = “41 “42 “43 “44 “б1 “б2 “53 “54 “15 I “25 “35 а4Ь “55 а1в II а2в II а3в а4в “бв Замечательным является тот факт, что основные операции с блочными матрицами совершаются по тем же правилам, по которым они совершаются с обычными числовыми матрицами, только в роли элементов выступают блоки. В самом деле, элементарно проверяется, что если матрица Л =|| а,у || является блочной и имеет блочные элементы Лар, то при том же разбиении на блоки матрице ХЛ =||Ха,у|| отвечают блочные элементы ХЛар *). Столь же элементарно проверяется, что если матрицы А и В имеют одинаковые порядки и одинаковым образом разбиты на блоки, то сумме матриц А и В отвечает блочная матрица с эле- *) При этом блочные элементы ХДар сами вычисляются по правилу умно- жения матрицы Дар на число X.
18 МДТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. I ментами = Дар + Вар (здесь Лар и Ва$—блочные элементы матриц А и В). Пусть, наконец, А и В—две блочные матрицы такие, что число столбцов каждого блока Ла₽ равно числу строк блока Вр? (так что при любых а, 0 и у определено произведение матриц /lapBpv). Тогда произведение С = АВ представляет собой матрицу с элементами Са?, определяемыми формулой Cay = S Лдр-Вру. ₽ Для доказательства этой формулы достаточно расписать левую и правую ее части в терминах обычных (числовых) элементов матриц А и В (предоставляем это сделать читателю). В качестве примера применения блочных матриц остановимся на понятии так называемой прямой суммы квадратных матриц. Прямой суммой двух квадратных, матриц А и В по- рядков тип соответственно HasbiBaeTCHj квадратная блочная матрица С порядка тфп, равная Для обозначения прямой суммы матриц А и В используется запись С = Л фВ. Из определения прямой суммы матриц А и В очевидно, что эта сумма, вообще говоря, не обладает перестановочным свой- ством. Однако элементарно проверяется справедливость сочета- тельного свойства: (ЛфВ)фС = Лф(ВфС). С помощью свойств операций над блочными матрицами легко проверяются следующие формулы, устанавливающие связь между операцией прямого суммирования и операциями обычного сло- жения и перемножения матриц: (Ат ф Л„) + (Вт ф Вп) = (А„ + Вт)©(А„ + Вп), (Ат ф А„) (Вт фВ„) = АтВт<£)А„Вп (в этих формулах Ат и Вт—произвольные квадратные матрицы порядка т, а Л„ и Вп—произвольные квадратные матрицы порядка п). Проверку этих формул мы предоставляем читателю. § 2. Определители Целью настоящего параграфа является построение теории определителей любого порядка п. Хотя читатель (из курса ана- литической геометрии) уже знаком с определителями второго и третьего порядков, мы будем вести изложение так, чтобы избег-
S 2] ОПРЕДЕЛИТЕЛИ 19 нуть каких-либо ссылок. Знакомство с определителями второго и третьего порядков разве лишь облегчит восприятие излагае- мого ниже материала. 1. Понятие определителя. Рассмотрим произвольную квадрат- ную матрицу любого порядка п: аи 012 , • а1п А = а21 022 • ‘ а2п (1-8) ап1 ОП2 ‘ i апп С каждой такой матрицей свяжем вполне определенную числен- ную характеристику, называемую определителем, соответствую- щим этой матрице. Если порядок п матрицы (1.8) равен единице, то эта матрица состоит из одного элемента а1± и определителем первого порядка соответствующим такой матрице, мы назовем величину этого элемента. Если далее порядок п матрицы (1.8) равен двум, т. е. если эта матрица имеет вид оц а12 Qai а22 (1.9) то определителем второго порядка, соответствующим такой мат- рице, назовем число, равное alta22—a12a2i и обозначаемое одним из символов *) A = detA = |au 012 I а21 в22 Итак, по определению Д = det А = = aila22-a12a2i. (1.10) Формула (1.10) представляет собой правило составления опре- делителя второго порядка по элементам соответствующей ему матрицы. Словесная формулировка этого правила такова: опре- делитель второго порядка, соответствующий матрице (1.9), равен разности произведения элементов, стоящих на главной диаго- нали этой матрицы, и произведения элементов, стоящих на по- бочной ее диагонали**). *) В отличие от матрицы для обозначения определителя употребляют не сдвоенные, а одинарные черточки. **) Напомним, что главной диагональю квадратной матрицы назы- вается диагональ, идущая из левого верхнего в правый нижний угол (т. е. в случае матрицы (1.9) аца22), а побочной—диагональ, идущая из левого нижнего в правый верхний угол (т. е. в случае матрицы (1.9) a2ia12).
20 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 В дальнейшем изложении мы будем говорить об элементах, строках или столбцах определителя, подразумевая под этими терминами соответственно элементы, строки или столбцы отве- чающей этому определителю матрицы. Перейдем теперь к выяснению понятия определителя лю- бого порядка п, где 2. Понятие такого определителя мы введем индуктивно, считая, что нами уже введено понятие опре- делителя порядка п—1, соответствующего произвольной квад- ратной матрице порядка п—1. Договоримся называть минором любого элемента а{/ матрицы n-го порядка (1.8). определитель порядка п—1, соот- ветствующий той матрице, которая получается из матрицы (1.8) в результате вычеркивания i-й строки и j-го столбца (той строки и того столбца, на пересечении которых стоит элемент ац). Минор элемента а^ будем обозначать символом Mj. В этом обо- значении верхний индекс обозначает номер строки, нижний — номер столбца, а черта над М означает, что указанные строка и столбец вычеркиваются. Определителем порядка п, соответствующим мат- п рице (1.8), назовем число, равное 2 (—l)1+/°i/M} и обозначаемое j = i символом А = det А = ац ац ... а21 °22 ап1 апг • О1п а2п апп (111) Итак, по определению A = det А = Яц а12 ... а1п а21 й22 • • а2л ani ап2 • • • апп п £(-l)iVayMi. (1.12) /=1 •Формула (1.12) представляет собой правило составления опреде- лителя порядка п по элементам первой строки соответствующей ему матрицы и по минорам М} элементов первой строки, явля- ющимся определителями порядка п—1. Заметим, что при п = 2 правило (1.12) в точности совпадает с правилом (1.10), ибо в этом случае миноры элементов первой строки имеют вид: М1 = а22, М} = а21. Естественно возникает вопрос, нельзя ли использовать для получения величины определителя (1.11) элементы и отвечаю- щие им миноры не первой, а произвольной i-й строки матрицы (1.8). Ответ на этот вопрос дает следующая основная теорема.
S 2] ОПРЕДЕЛИТЕЛИ 21 Теорема 1.1. Каков бы ни был номер строки ... ..., п), для определителя п-го порядка (1.11) справедлива фор- мула *) Д = det А = 5 (—1 )'+/ а(7М<, (1.13) /=| называемая разложением этого определителя по i-U строке. Замечание. Подчеркнем, что в этой формуле показатель степени, в которую возводится число (—1), равен сумме номеров строки и столбца, на пересечении которых стоит элемент а(7. Доказательство теоремы 1.1. Формулу (1.13) нужно доказать лишь для номеров 4 = 2, 3, ..., n**)i При п — 2 (т. е. для определителя второго порядка) эту формулу нужно доказать лишь для номера 4 = 2, т. е. при п — 2 нужно доказать лишь формулу 2 __ _ _ Д = det А = 2 (—1)2+/a2jM2j== — a21Ml + a2iM%. i= i Справедливость этой последней формулы сразу вытекает из выражений для миноров матрицы (1.9) Mi = ai2, Л^=ац, в силу которых правая часть этой формулы совпадает с правой частью (1.10). Итак, при п = 2 теорема доказана. Доказательство формулы (1.13) для произвольного п > 2 про- ведем по индукции, т. е. предположим, что для определителя порядка п—1 справедлива формула вида (1.13) разложения по любой строке, и, опираясь на это, убедимся в справедливости формулы (1.13) для определителя порядка п. При доказательстве нам понадобится понятие миноров матрицы (1.8) цорядка п—2. Определитель порядка п—2, соответствую- щий той матрице, которая получается из матрицы (1.8) в резуль- тате вычеркивания двух строк с номерами и i2 и двух столб- цов- с номерами и ja, называется минором (п—2)-го по- рядка и обозначается символом Л//*/’. Определитель n-го порядка Д вводится формулой (1.12), при- чем в этой формуле каждый минор М} является определителем порядка П—1, для которого по предположению справедлива формула вида (1.13) разложения по любой строке. Фиксировав любой номер i (i =2, 3, ..., п), разложим в фор- муле (1.12) каждый минор УИ/ по i-й строке основного опреде- лителя (1.11) (в самом миноре М} эта строка будет (i— 1)-й). *) По смыслу теоремы «2э2. **) Ибо при i=l правая часть (1.13) по определению равна det А.
22 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 В результате весь определитель Д окажется представленным в виде некоторой линейной комбинации *) миноров (п —2)-го по- рядка М]к с нес.овпадающими номерами / и k, т. е. в виде**) Д=£ S 0/Лд- (1-14) /=1 k <i Для вычисления множителей Qjk заметим, что минор М)к полу- чается в результате разложения по (i—1)-й строке***) только следующих двух миноров (п— 1)-го порядка, отвечающих элементам первой строки матрицы (1.8): минора Л/;- и минора Мк (ибо только эти два минора элементов первой строки содержат все столбцы минора Л1/л). _ _ В разложениях миноров Mj и тИ* по указанной (i — 1)-й строке выпишем только слагаемые, содержащие минор Af/t (остальные не интересующие нас слагаемые обозначим многоточием). Учи- тывая при этом, что элемент aik минора М} стоит на пересечении (i—1)-й строки и (k—1)-го столбца этого минора****), а эле- мент а(7 минора А1£ стоит на пересечении (i — 1)-й строки и /-го столбца этого минора *****), мы получим М} = (-1)(/-1,+<А"1Ч^+ • • - , (1-15) 44ft = (-l)w-1,+/al7^ + ••• (116) Вставляя (1.15) и (1.16) в правую часть (1.12) и собирая коэффициент при мы получим, что множитель QJk в равен- стве (1.14) имеет вид = (-1 )*+'+/+» \aijaik-aikaiy]. (1.17) Для завершения доказательства теоремы покажем, что и пра- вая часть (1.13) равна сумме, стоящей в правой части (1.14), с теми же самыми значениями (1.17) для QJk. Для этого в правой части (1.13) разложим каждый минор (п—1)-го порядка М} по первой строке. В результате вся *) Напомним, что линейной комбинацией каких-либо величин назы- вается сумма произведений этих величин на некоторые вещественные числа. **) Так как минор Mjk совпадает с Мк^, то мы переберем все миноры (га—2)-го порядка с данными номерами строк 1 и I, изменяя j от 1 до га и для каждого j беря все возможные k < j. ***) В матрице (1.8) эта строка будет i-й. ****) Ибо в миноре Mj отсутствуют первая строка и /-й столбец ма- трицы (1.8) и j < k. ***»*) Ибо в миноре Мк отсутствует первая строка матрицы (1.8), а един- ственный отсутствующий в этом миноре столбец матрицы (1.8) имеет номер fe > /.
s 2] ОПРЕДЕЛИТЕЛИ 23 правая часть (1.13) представится в виде линейной комбинации с некоторыми коэффициентами 0/А тех же самых миноров 2 2 (1.18) '}= 1 k < / и нам остается вычислить множители Qjk и убедиться в справед- ливости для них формулы (1.17). Для этого заметим, что минор получается в результате разложения по первой строке только следующих двух миноров (п— 1)-го порядка, отвечающих элементам i-й строки матрицы (1.8): минора М1, и минора Af* (ибо только эти два минора эле- ментов i-й строки содержат все столбцы минора Mfy. В разложениях миноров М‘/ и М& по первой строке выпишем только слагаемые,-содержащие минор М}к (остальные не интере- сующие нас слагаемые обозначим многоточием). Учитывая при этом, что элемент а1к минора М1} стоит на пересечении первой строки и (k— t)-ro столбца *) этого минора, а элемент а1} минора Aft стоит на пересечении первой строки и j-го столбца **) этого минора, мы получим ^/ = (—(1.19) М = (-1)1+Ч/-Л$+ ... (1.20) Вставляя (1.19) и (1.20) в правую часть (1.13) и собирая коэффициент при М&, мы получим, что $]k в сумме (1.18) опре- деляется той же самой формулой (1.17), что и в равенстве (1.14). Теорема 1.1 доказана. Теорема 1.1 установила возможность разложения определи- теля п-го порядка по любой его строке. Естественно возникает вопрос о возможности разложения определителя п-го порядка по любому его столбцу. Положительный ответ на этот вопрос дает следующая основная теорема. • Теорема 1.2. Каков бы ни был номер столбца 2, ... ..., п), для определителя п-го порядка (1.11) справедлива фор- мула А = det А = 2 (-l)'’+/a,7Mj, (1.21) *) Ибо j < k и в миноре Mlj отсутствует j-й столбец матрицы (1.8). •*) Ибо j < k, а у минора Мк отсутствует лишь А-й столбец матрицы (1.8),
24 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (ГЛ. 1 называемая разложением, этого определителя по j-м у столбцу. Доказательство. Достаточно доказать теорему для j = 1, т. е. установить формулу разложения по первому столбцу А=2 (1.22) 1 ибо если формула (1.22) будет установлена, то для доказатель- ства формулы (1.21) для любого /=2, 3, ..., п достаточно, по- меняв ролями строки и столбцы, дословно повторить схему рас- суждений теоремы 1.1. Формулу (1.22) установим по индукции. При п = 2 эта формула проверяется элементарно (так как при м = 2 миноры элементов первого столбца имеют вид A4J =д22, Mi = a12, то при п = 2 правая часть (1.22) совпадает с правой частью (1.10)). Предположим, что формула разложения по первому столбцу (1.22) верна для определителя порядка п—1 и, опираясь на это, убедимся в справедливости этой формулы для определителя по- рядка п. С этой целью выделим в правой части формулы (1.12) для определителя n-го порядка Д первое слагаемое а в каж- дом из остальных слагаемых разложим минор (п—1)-го порядка М] по первому столбцу. В результате формула (1.12) будет иметь вид Д = аиМ\ + 22 0,7^ЙГ/, (1 -23) (=21=2 где Q/j — некоторые подлежащие определению коэффициенты. Для вычисления 0,7 заметим, что минор Af 1/ получается при разложе- нии по первому столбцу только одного из миноров (п—1)-го порядка, отвечающих первой строке*),— минора М}. Запишем в разложении минора М} (при / 2) по первому столбцу только то слагаемое, которое содержит минор M\‘j (остальные не интере- сующие нас слагаемые обозначим многоточием). Учитывая, что элемент а(1 минора М} (при j 2) стоит на пересечении (i— 1)-й строки и первого столбца этого минора, мы получим, что при />2 ЛГ} = (—1 )<'-!’+1ааЛ11<+... (1-24) Вставляя (1.24) в правую часть (1.12) (из которой исключено первое слагаемое) и собирая коэффициент при М\1,, мы получим, *) При этом минор Л?} предполагается исключенным.
s 2J ОПРЕДЕЛИТЕЛИ 25 что коэффициент 017 в формуле (1.23) имеет вид 017 = (-1)‘+/+^1Ар (1 25) Остается доказать, что и правая часть (1.22) равна сумме, стоящей в правой части (1.23) с теми же самыми значениями (1.25) для 0/у. Для этого в правой части (1.22) выделим первое слагаемое апЛ41, а в каждом из остальных слагаемых разложим минор (п—1)-го порядка М{ по первой строке. В результате правая часть (1.22) представится в виде суммы первого слагаемого ЦцМ} и линейной комбинации с некоторыми коэффициентами 0,у миноров (п—2)-го порядка М1^, т. е. в виде л л + S 2 е./МН, (1.26) i = 2 /=2 и нам остается вычислить множители 0,7 и убедиться в справед- ливости для них формулы (1.25). Для этого заметим, что минор Mij получается в результате разложения по первой строке только одного из миноров п — 1-го порядка, отвечающих первому столбцу,— минора М^. Запишем в разложении минора М\ (при iZ>2) по первой строке только то слагаемое, которое содержит минор Л41) (остальные не инте- ресующие нас слагаемые обозначим многоточием). Учитывая, что элемент минора Ml стоит на пересечении первой строки и (/ — 1)-го столбца этого минора, мы получим, что при ij>2 , Mi = (-l)1+‘>-l’a1/Mlj+ ... (1.27) Вставляя (1.24) в правую часть (1.22), из которой исключено первое слагаемое, и собирая коэффициент при МЦ, мы получим, что 017 в сумме (1.26) определяется той же самой формулой (1.25), что и в равенстве (1.23). Теорема 1.2 доказана. 2. Выражение определителя непосредственно через его эле- менты. Установим формулу, выражающую определитель n-го по- рядка непосредственно через его элементы (минуя миноры). Пусть каждое из чисел а1( а2, ..., а„ принимает одно из зна- чений 1, 2, причем среди этих чисел нет совпадающих (в таком случае говорят, что числа av a2, ..., a„ являются некоторой перестановкой чисел 1, 2, ..., п). Образуем из чисел ах, а2, . все возможные пары а/х, и будем говорить, что пара а,<ху образует беспорядок, если «(>ау при i < j. Общее число беспорядков, образованных всеми парами, которые можно составить из чисел a1F a2, ..., a„, обозначим символом У («о a2, . . ., a„).
26 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 С помощью метода индукции установим для определителя n-го порядка (1.11) следующую формулу: A=detA= s (_i)JV(a1.a1. (1.28) an as, .. an (суммирование в этой формуле идет по всем возможным пере- становкам ctj, а2, ..., а„ чисел 1, 2, ..., п; число этих пере- становок, очевидно, равно п!). В случае п — 2 формула (1.28). элементарно проверяется (в этом случае возможны только две перестановки 1, 2 и 2, 1, и, поскольку АГ(1, 2) =0, N (2, 1) — 1, формула (1.28) переходит в равенство (1.10)). С целью проведения индукции предположим, что формула (1.28) при п>2 справедлива для определителя порядка (п — 1). Тогда, записав разложение определителя n-го порядка (1.11) по первому столбцу *): A = det Л= 2 (— l)“,+1aaiiM“>, (1.29) «1=1 мы можем,, в силу предположения индукции, представить каж- дый минор (п — 1)-го порядка 7И1‘ в виде = S (-!)"<“« ••••“л)ааг2 ... аа п (1.30) --------% (суммирование идет по всем возможным перестановкам ос2,.. .,ап (п — 1) чисел, в качестве которых берутся все натуральные числа от 1 до п, за исключением числа aj. Так как из чисел а1г a2, ...,ап, кроме пар, образованных из чисел a2, ...,an, можно образовать еще только следующие пары dj a2, a* a3, ..., a^, и поскольку среди чисел a2, ..., a„ найдется ровно (ос*—1)чисел,меньших числа avто N(alta2, ...,a„)= =JV(a2, ...,«„) + «!—1. Отсюда вытекает, что(—1)N (“2 “п)(—1 )“>+1 = (— 1 )N(a*’ , и, вставляя (1.30) в (1.29), мы в точности получим формулу (1.28). Тем самым вывод формулы (1.28) завершен. В заключение заметим, что в большинстве курсов линейной алгебры формула (1.28.) положена в основу понятия определителя n-го порядка. 3. Теорема Лапласа**). В этом пункте мы установим заме- чательную формулу, обобщающую формулу разложения определи- теля1 n-го порядка по какой-либо его строке. *) Индекс, по которому производится суммирование, на этот раз нам удобно обозначить буквой aj. **) П. С. Лаплас—выдающийся французский астроном, математики физик (1749—1827).
S 2] ОПРЕДЕЛИТЕЛИ 27 С этой целью введем в рассмотрение миноры матрицы п-го порядка (1.8) двух типов. Пустьй—любой номер, меньшийп, а 1\, i2, .... г\и j\, j2,..., jk — произвольные номера, удовлетворяющие условиям 1 < i2 <... . . .<tft<n, 1^/1</а<...</А^п. Миноры первого типа М/.Д'.'.’у* являются определителями порядка k, - соответствующими той матрице, которую образуют элементы матрицы (1.8), стоящие на пересечении k строк с но- мерами ij, i2, ...,ik и k столбцов с номерами /2, ...,/*. Миноры второго типа являются определителями порядка n—k, соответствующими той матрице, которая полу- чается из матрицы (1.8) в результате вычеркивания k строк с номерами i\, i2, и k столбцов с номерами jit j2.fa. Миноры второго типа естественно назвать дополнитель- ными по отношению к минорам первого типа. Теорема 1-3 (теорема Лапласа). При любом номере k, меньшем п, и при любых фиксированных номерах строк fa, fa, ... ..., fa таких, что 1 fa < fa < /.. < fa^n, для определителя п-го порядка (1.11) справедлива формула ...fa называемая разложением этого определителя по k строкам fa, fa, .. .,fa. Суммирование в этой формуле идет по всем возможным значениям индексов fa, fa, ..., /fc, удовлетворяю- щим условиям l^fa<. fa<.. < fa^n. Доказательство. Прежде всего заметим, что формула (1.31) является обобщением уже доказанной нами формулы раз- ложения определителя п-го порядка по одной его строке с но- мером ij, в которую она переходит при k = 1 (при этом минор М1л совпадает с элементом az/ , а минор Mj'—это введенный выше минор элемента aiJt). Таким образом, при А = 1 формула (1.31) доказана. Доказа- тельство этой формулы для любого k, удовлетворяющего нера- венствам 1 < k < п, проведем по индукции, т. е. предположим, что формула (1.31) справедлива для (/г —1) строк, и, опираясь на это, убедимся в, справедливости формулы (1.31) для k строк. Итак, пусть 1 < k < п и фиксированы какие угодно k строк матрицы (1.8) с номерами i\, fa, . .., fa, удовлетворяющими усло- вию 1 <ix < fa < ... < ik^n. Тогда по предположению для (fe—1) строк с номерами справедлива формула Д= 2 (- ir+--+^->+'i+--+^-i-м^^рй^^а.зг) '*.fa-i
28 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 (суммирование идет по всем возможным значениям индексов /1> удовлетворяющим условиям 1 <-•-< /\-1^п)- Разложим в формуле (1.32) каждый минор .. ./^31 п0 СТР°* ке, имеющей в матрице (1.8) номер ik. В результате весь опре- делитель А будет представлен в виде некоторой линейной ком- бинации миноров с коэффициентами, которые мы обозначим через 0У1.. , т. е. для А будет справедливо равенство *) ‘-.2 ел ' .........>к и нам остается вычислить коэффициенты и убедиться в том, что они равны 0/. •••/*=(—1)“+ +‘А+/,+ ’+М7. t 0 -33) С этой целью заметим, что минор (л—/г)-го порядка ЛТ/* . _ .у* получается в результате разложения по строке с номером ik только следующих k миноров (п—£-|-1)-го порядка: ^:::м«ч)") (s=i,2, ...k), (1.34) ибо каждый из остальных содержащих строку is миноров (n—k+1)- го порядка не содержит всех строк и всех столбцов минора ’?*• В разложении каждого минора (1.34) по строке матрицы (1.8) с номером 1к выпишем только то слагаемое, которое содержит минор Л4/* .’ ’/* (остальные не интересующие нас слагаемые обоз- начим многоточием). Учитывая при этом, что в каждом миноре (1.34) элемент а, стоит на пересечении [tft—(k—1)]-й строки и [/,—(s—1)]-го‘столбца этого минора***), мы получим Al(без,,)-(— 1) aik/sM ... *) Суммирование в этом равенстве, как и выше, идет по всем возможным значениям индексов /1(.... jh, удовлетворяющим условию 1 «С h < /» < ... ... < ik^n. **) Символом ‘' fk^3 j ) обозначается минор, отвечающий пересе- чению строк с номерами ilt .... ik-i и всех столбцов с номерами'у1, /2, . , /*, за исключением столбца с номером js, а символом (1.34) дополнительный к нему минор. ***) Это вытекает из того, что строке с номером ik предшествует (k—1) строк, а столбцу с номером js предшествует (s—1) столбцов минора . . *Д~(без j )> к котоРомУ минор (1.34) является дополнительным.
ОПРЕДЕЛИТЕЛИ 29 S 2] Теперь нам остается учесть, что в формуле (1.32) каждый минор (1.34) умножается на множитель 1 Ч -. -ik (без is) и после этого суммируется по всем s от 1 до k. Имея также в виду, ЧТО (—1)2-«*-«» = 1> мы получим, что [k 1 2 (-!)*« Замечая, что сумма в квадратных скобках представляет собой разложение минора по его последней £-й строке, мы окончательно получим для 9/г. .у формулу (1.33). Теорема Лап- ласа доказана. Замечание. В полной аналогии с формулой (1.32) запи- сывается и выводится формула разложения определителя по каким-либо k его столбцам. 4. Свойства определителей. Ниже устанавливается ряд свойств, которыми обладает произвольный определитель n-го порядка. 1°. Свойство равноправности строки столбцов. Транспонированием любой матрицы или определителя на- зывается операция, в результате которой меняются местами строки и столбцы с сохранением порядка их следования. В резуль- тате транспонирования матрицы А получается матрица, называемая транспонированной по отношению к матрице А и обозначаемая символом Д'. В дальнейшем мы договоримся символом | А |, | В |, |Д'|... обозначать определители квадратных матриц А, В, А'... соответ- ственно. Первое свойство определителя формулируется так: при транспонировании величина определителя сохраняется, т. е. |А'| = |Л|. Это свойство непосредственно вытекает из теоремы 1.2 (доста- точно лишь заметить, что разложение определителя | А | по пер- вому столбцу тождественно совпадает с разложением определи- теля | Д' | по первой строке). Доказанное свойство означает полную равноправность строк и столбцов и позволяет нам все последующие свойства устанав- ливать лишь для строки быть уверенными в справедливости их и для столбцов. 2°. Свойство антисимметрии при перестановке двух строк (или двух столбцов). При перестановке мес- тами двух строк (или двух столбцов) определитель сохраняет свою абсолютную величину, но меняет знак на противоположный,.
30 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. I Для определителя второго порядка это свойство проверяется элементарно (из правила (1.10) сразу вытекает, что определители аИ °12 I и I Й21 й22 I a31 а22 I I а11 а12 I отличаются лишь знаком). Считая, что п > 2, рассмотрим теперь определитель п-го по- рядка (1.П) и предположим, что в этом определителе меняются местами две строки с номерами г\ и i2. Записывая формулу Лап- ласа разложения по этим двум строкам, будет иметь • д = .2(1,35) При перестановке местами строк с номерами и i2 каждый оп- ределитель второго порядка в силу доказанного выше ме- няет знак на противоположный, а все остальные величины, стоящие под знаком суммы в (1.35), совсем не зависят от эле- ментов строк с номерами it и i2 и сохраняют свое значение. Тем самым свойство 2° доказано. 3°. Линейное свойство определителя. Будем го- ворить, что некоторая строка (а±, а2, ..., ап) является линей- ной комбинацией строк (Ьг, Ь2, ..., b„), (clt с2, ..., сп), ... ..., ^di, d2, :.dn) с коэффициентами А, р, ..., у, если aj = ЛЬу + рсу-]- ... +vdy для всех j = 1, 2, ..., п. Линейное свойство определителя можно сформулировать так: если в определителе п-го порядка Д некоторая i-я строка (ait, ai2, ..., ain) является линейной комбинацией двух строк (bit b2, ..., Ьп) и (с\, с2, ..., сп) с коэффициентами А и р, то Д = ХД^ + рД2, где — определитель, у которого i-я строка равна (&j, Ь2, ..., Ьп), а все остальные строки те же, что и у Д, а Д2 — определитель, у которого i-я строка равна (cf, с2, .... сп), а все остальные строки те же, что и у Д. Для доказательства разложим каждый из трех определителей Д, Д1 и Д2 по t-й строке и заметим, что у всех трех определи- телей все миноры М\ элементов i-й строки одинаковы: Но отсюда следует, что формула Д =ХД1 + рД2 сразу вытекает из равенств о,7 = %Ь/ + рс/ (7 = 1,2, . ..,п). Конечно, линейное свойство справедливо и для случая, когда i-я строка является линейной комбинацией не двух, а нескольких строк. Кроме того, линейное свойство справедливо и для столбцов определителя. Доказанные три свойства являются основными свойствами Определителя, вскрывающими его природу. Следующие пять свойств являются логическими следст- виями трех основных свойств.
§2] ОПРЕДЕЛИТЕЛИ 31 Следствие 1. Определитель с двумя. одинаковыми строками (или столбцами) равен нулю. (В самом деле, при перестановке двух одинаковых строк, с одной стороны, определитель Д не изменится, а с другой стороны, в силу свойства 2° изменит знак на противоположный. Таким образом, Д=—Д, т. е. 2Д=0или Д = 0. Следствие 2. Умножение всех элементов некоторой, строки (или некоторого столбца) определителя на число X равносильно умножению определителя на это число X. Иными словами, общий множитель всех элементов некоторой строки (или некоторого столбца) определителя можно вынести за знак этого определителя. (Это свойство вытекает из свойства 3° при р. =0.) Следствие 3. Если все элементы некоторой строки (или неко- торого столбца) определителя равны нулю, то и сам определи- тель равен нулю. (Это свойство вытекает из предыдущего при X — 0.) Следствие 4. Если элементы двух строк (или двух столбцов) определителя пропорциональны, то определитель равен нулю. (В самом деле, в силу следствия 2 множитель пропорциональ- ности можно вынести за знак определителя, после чего останется определитель с двумя одинаковыми строками, который равен нулю согласно следствию 1). Следствие 5. Если к элементам некоторой строки (или не- которого столбца) определителя прибавить соответствующие эле- менты другой строки (другого столбца), умноженные на произ- вольный множитель к, то величина определителя не изменится. (В самом деле, полученный в результате указанного прибавления определитель можно в силу свойства 3° разбить на сумму двух определителей, первый из которых совпадаете исходным, авто- рой равен нулю в силу пропорциональности двух строк (или столбцов) и следствия 4.) Замечание. Следствие 5, как и линейное свойство, допу- скает более общую формулировку, которую приведем для строк: если к элементам некоторой строки определителя прибавить со- ответствующие' элементы строки, являющейся линейной комбина- цией нескольких других строк этого определителя (с какими угод- но коэффициентами), то величина определителя не изменится. Следствие 5 широко применяется при конкретном вычислении определителей (соответствующие примеры будут приведены в сле- дующем пункте). Прежде чем сформулировать еще одно свойство определителя, введем полезное понятие алгебраического дополнения данного элемента определителя. Алгебраическим дополнением данного элемента а определителя n-го порядка (1.11) назовем число, равное (— 1)'Mj и обозначаемое символом А,у.
32 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 Таким образом, алгебраическое дополнение данного элемента может отличаться от минора этого элемента только знаком. С помощью понятия алгебраического дополнения теоремы 1.1 и 1.2 можно переформулировать так: сумма произведений эле- ментов любой строки (любого столбца) определителя на соответ- ствующие алгебраические дополнения этой строки (этого столбца) равна этому определителю. Соответствующие формулы разложения определителя по i-й строке и по /-му столбцу можно переписать так: Д = S an^ij (Для любого i = l, 2, ..., п), /=1 п (1.13') Д = 2 aij^if (ДЛЯ любого / = 1, 2, ..., п). (1.21') Теперь мы можем сформулировать последнее свойство опре- делителя: 4° Свойство алгебраических дополнений сосед- них строк (или столбцов). С умма произведений элементов какой-либо строки (или какого-либо столбца) определителя на соответствующие алгебраические дополнения элементов любой дру- гой строки (любого другого столбца) равна нулю. Доказательство проведем для строк (для столбцов оно про- водится аналогично). Записывая подробно формулу (1.13') аа . а1п а21 а22 • а2п ^«2^12 + •• + О -36) &п1 ап2 • • апп заметим, что поскольку алгебраические дополнения A,-2,...,Aia не зависят от элементов i-й строки аа, аг-2, ..., а,-п, то равенство (1.36) является тождеством относительно ailt ai2, ...,а1п и со- храняется при замене чисел а(1, а,-2, .. ., ain любыми другими п числами. Заменив а(1, ai2, ..., ain соответствующими элементами любой (отличной от i-й) fe-й строки aki, а^2, ..., акп, мы полу- чим слева в (1.36) определитель с двумя одинаковыми строками, равный нулю согласно следствию 1. Таким образом, Aiiakt + ^t2ak2 + • • • + ^i9akn — О (для любых несовпадающих i и k). 5. Примеры вычисления определителей. При конкретном вы- числении определителей широко- используются формулы разло- жения по строке или столбцу и следствие 5, позволяющее, не изменяя величины определителя, прибавлять к любой его строке (или столбцу) произвольную линейную комбинацию других его
§ 2] ОПРЕДЕЛИТЕЛИ 33 строк (или столбцов). Особенно удобно использовать формулу разложения по тем строкам (или столбцам), многие элементы которых равны нулю. В частности, если в данной строке отли- чен от нуля только один элемент, то разложение по этой строке содержит только одно слагаемое и сразу сводит вопрос о вы- числении определителя порядка п к вопросу о вычислении оп- ределителя порядка (гг — 1) (минора, стоящего в указанном сла- гаемом). Если в данной строке отличны от нуля несколько элементов, отвечающих пересечению этой строки с несколькими столбцами, то, применяя к указанным столбцам следствие 5, мы можем, не изменив определителя, обратить в нуль все элементы данной строки, за исключением одного. Перейдем к конкретным примерам. Пример 1. Пусть требуется вычислить следующий опреде- литель четвертого порядка: 4 99 83 1 д_ 0 8 16 О 60 17 134 20 * 15 43 106 5 Вычитая из первого столбца утроенный последний столбец, будем иметь 1 99 83 1 . _ 0 8 16 0 Л ~ 0 17 134 20 ’ 0 43 106 5 Далее естественно разложить определитель по первому столбцу. В результате получим Д= 1- 8 16 0 17 134 20 43 106 5 Теперь в определителе третьего порядка вычтем из второго столбца удвоенный первый столбец. Прй этом будем иметь 8 17 43 Д = 0 0 100 20 20 5 Разлагая, наконец, последний определитель третьего порядка по первой строке, окончательно получим Д = 8- 100 20 20 5 = 8(500— 400) = 800.
34 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. I Пример 2. Вычислим так называемый треугольный определитель, у которого все элементы, лежащие выше главной диагонали, равны нулю ац 0 ... О О O22 * •1 О О я(ге-1>1 “(«-1)2 ••• я(л-1)(л-1> О агЛ ап2 ••• ап(п-Г) аПП Разлагая определитель Д„ по последнему столбцу, мы получим, что он равен произведению элемента апп на треугольный опре- делитель (п — 1)-го порядка Д„_£, равный оц 0 *., О ^21 я22 • • О а(П-1>2 ••• а(п-1>(п-1) Последний определитель мы снова разложим по его последнему столбцу, в результате чего убедимся в том, что он равен про- изведению элемента ln_iy на треугольный определитель (п—2)-го порядка Лп_2. Продолжая аналогичные рассуждения, мы придем к следующему выражению для исходного определи- теля. Дл — Я11О22 • • • апп- Итак, треугольный определитель равен произведению элемен- тов, стоящих на его главной диагонали. Замечание 1. Если у определителя Д равны нулю все элементы, лежащие ниже главной диагонали, то этот опреде- литель также равен произведению элементов, лежащих на его главной диагонали (убедиться в этом можно по схеме, изло- женной выше, но примененной не к последним столбцам, а к последним строкам; можно и просто произвести транспониро- вание Д и свести этот случай к рассмотренному выше). Аналогичным способом устанавливается,'что определитель, у которого равны нулю все элементы, лежащие выше (или ниже) побочной диагонали, равен произведению числа (>—D/з и всех элементов, лежащих на этой диагонали. А О В С Пример 3. Обобщением треугольного определителя второго порядка может служить определитель 2п-го порядка следующей блочной матрицы квадратные матрицы п-го порядка, а О—нулевая квадратная матрица п-го порядка. Убедимся в том, что для указанного , в которой А, В и С—произвольные
S 2] ОПРЕДЕЛИТЕЛИ 35 определителя справедлива формула А О 2 Uc =| А||С| *). (1-37) Привлекая теорему Лапласа, разложим определитель, стоящий в левой части (1.37), по первым п строкам. Так как определи- тель, у которого хотя бы один столбец состоит из нулей, равен нулю, то в формуле разложения (1.31) будет отлично от нуля только одно слагаемое, причем это слагаемое (в силу того, что (—1)(1+...+л)+(1+-+л; = 1) будет как раз равно | А11С |. Замечание 2. Аналогичными рассуждениями легко убе- диться в справедливости формулы A R С ° = (—1)" | В || С | (1.38) (Л, В, С и О имеют тот же смысл, что и выше). Для этого следует разложить определитель, стоящий в левой части (1.38), по последним п строкам и учесть, что (_1)[<Л+1)+ ... + 2л]+[1+ ... + Л] =- (_1рп (2П+1)/2 — (_|)Лф Пример 4. Вычислим теперь так называемый определи- тель Вандермонда A(х:1, хг, х„) = 1 ч о Ч 1 Х2 Х2 1 ХП Хп (1.39) Вычитая первый столбец из всех последующих, будем иметь A(xv х2, ...,%„) = п-1 Хп „П-1 П—1 Х1 Х-2 1 0 . 0 Xi (х2— Х1) < (х„ —Х1) xl (xl-xD . . (x2-xD X?-1 (хГ-хГ) . . (хГ-хГ1 Далее естественно произвести в результате чего мы получим разложение по первой строке, A (xi, х2, (х2~ Xj) (Х3 — X,) ... (х„ —Xj) (х22-х?) (xl-xD ... (х2-х2) (хГ-хГ1)’ (хГ-хГ) ... (хГ-хГ1) *) Напомним, что символами | А |, | В |, | С |, ... мы договорились обо- значать определители матриц А, В, С, ... соответственно.
36 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. I Вычитая теперь из каждой строки предыдущую строку, умно- женную на Хр получим Д(хп х2, ... х„) = (х2 —Х1) (х3 — X]) ... (х„ —Xi) Х2(х2 —Xj) х3(х3 —Х1) ... хп(х„ — Xj) Xi 2(х2 —Х1) х3 2(х3 —Xj) ... хпп~2(хп— Х1) Далее мы можем вынести за знак определителя общий множи- тель первого столбца, равный (х2— х^), общий множитель вто- рого столбца, равный (х3—Xj), ..., общий множитель (п— 1)-го столбца, равный (х„—xj. В результате получим Д(хп х2, ..., х„) = (х2—х1)(х3—х3)...(х„—х2)-Д(х2, х,...х„). Со стоящим в правой части определителем Д(х2, х3, ...,х„) поступим точно так же, как и с Д (xt, х2, ..., х„). В результате получим, что &(х2, х3....х„) = (х3—х2).. ,(х„—х2)-Д(х3.....х„). Продолжая аналогичные рассуждения далее, окончательно получим, что исходный определитель (1.39) равен Д (^1» Х2, • • • 1 Хп) == — (х2 хх) (х3 Xj) ... (х„ хх) (х3 х2)... (х„ х2).. • (хп х„_1). 6. Определитель суммы и произведения матриц. Непосредст- венно из линейного свойства определителя вытекает, что опре- делитель суммы двух квадратных матриц одного и того же по- рядка п A =|ja<7|| и В =||^у|| равен сумме всех различных опре- делителей порядка п, которые могут, получиться, если часть строк (или столбцов) брать совпадающими с соответствующими строками (или столбцами) матрицы А, а остальную часть — совпадающими с соответствующими строками (или столбцами) В. Докажем теперь, что определитель матрицы С, равной про- изведению квадратной матрицы А на квадратную матрицу В, равен произведению определителей матриц А и В. Пусть порядок всех трех матриц А, В и С равен п, и пусть О—нулевая квадратная матрица порядка п, а (—1)£ следующая матрица: -1 о ... о 0—1 ... о О О ... —1 (-!)£ = В силу примера 2 из предыдущего пункта определитель матрицы (—1)£ равен числу (—!)".
5 2] ОПРЕДЕЛИТЕЛИ 37 Рассмотрим следующие две блочные квадратные матрицы порядка 2н: ||(-1)£ в| И |(-Ц£ о|- В силу формул (1.37) и (1.38) из предыдущего пункта оп- ределители этих матриц равны |(—1)Е в| = 1 Н51’ |(-0£ §|-(-1)”|(-1)£||С|=|С|. Таким образом, достаточно доказать равенство определителей I А 01 I А С| [(-!)£ й| И |(-1)£ ОГ И Подробнее эти два определителя можно записать так: «if «12 ... а1п 0 0 ... 0 «21 «22 «2п 0 0 ... 0 ani «Z12 • • • ®пп 0 0 ... 0 — 1 0 ... 0 6ц &12 ... bln 0 — 1 ... 0 &21 &22 bin 0 0 ... —1 Ьщ ЙЛ2 ••• Ь/in (1.40) «и «12 • «1„ с11‘ «12 ... Cln «21 «22 • • ‘ «271 «21 «22 • • c2n «П1 «712 апп СП1 СЛ2 « • * cnn — 1 0 ... 0 0 0 ... 0 0 — 1 ... 0 0 0 ... 0 0 0 ... —1 0 0 ... 0 Для того чтобы убедиться в равенстве этих двух определи- телей, достаточно заметить, что первые п столбцов у этих оп- ределителей совпадают, а каждый столбец второго определителя (1-40) с номером n~rk (где k— 1, 2.....п) в силу формулы п Cjj == 5 anPk/< получается в результате прибавления к (п + &)-му столбцу первого определителя (1.40) линейной комбинации первых п его столбцов с коэффициентами, соответственно рав- ными bki, bk2, ..., bkn. Таким образом, определители (1.40) равны в силу следствия 5 из п. 3.
38 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 В заключение заметим, что непосредственно из формулы (1.37) вытекает, что определитель прямой суммы 1л®а1"|о в| двух матриц А и В равен произведению определителей этих матриц. 7. Понятие обратной матрицы. Пусть А—квадратная матрица п-го порядка, а Е—единичная квадратная матрица того же порядка (см. п. 2 § 1). Матрица В называется правой обратной по отношению к матрице А, если АВ = Е. Матрица С называется левой обратной по отношению к матрице А, если СА—Е. Так как обе матрицы А и Е являются квадратными матри- цами порядка п, то матрицы В и С (при условии, что они су- ществуют) также являются квадратными матрицами порядка п. Убедимся в том, что если обе матрицы В и С существуют, то они совпадают между собой. В самом деле, на основании равенств (1.7) (см. п. 2 § 1), соотношений АВ^=Е, СА = Е и сочетательного свойства произведения матриц, получим С = СЕ = С(АВ)=(СА)В = ЕВ = В. Естественно возникает вопрос об условиях на матрицу А, при выполнении которых для этой матрицы существуют как левая, так и правая обратные матрицы*). Теорема 1.4. Для того чтобы для матрицы А существовали левая и правая обратные матрицы, необходимо и достаточно, чтобы определитель det А матрицы А был отличен от нуля. Доказательство. 1) Необходимость. Если для ма- трицы А существует хотя бы одна из обратных матриц, напри- мер В, то из соотношения А-В=Е мы получим, что det A - det В = = det£ = l **), откуда вытекает, что det Д=/=0. 2. Достаточность. Пусть определитель А = det А отличен от нуля. Обозначим, как и выше, символом алгебраические дополнения элементов а^ матрицы А и составим матрицу В, в t-й строке которой стоят алгебраические дополнения г-го столбца матрицы А, поделенные на величину определителя А: dif д д 412 А22 Д Д Ani Д Дп2_ Д (1.41) -*414 А$п Апп д д д *) И, стало быть, эти матрицы совпадают. **) det Е — 1 в силу примера 2 из п. 5 этого параграфа.
S 3] ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 39 Убедимся в том, что эта матрица В является как правой, так и левой обратной по отношению к матрице А. Достаточно доказать, что оба произведения АВ и ВА явля- ются единичной матрицей. Для этого достаточно заметить, что у обоих произведений любой элемент, не лежащий на главной диагонали, равен нулю, ибо после выноса множителя 1/А этот элемент равен сумме произведений элементов одной строки (или одного столбца) на соответствующие алгебраические дополнения другой строки (или другого столбца). Что же касается элемен- тов, лежащих на главной диагонали, то у обоих произведений АВ и В А все такие элементы равны единице в силу того, что сумма произведений элементов и соответствующих алгебраических до- полнений одной строки (одного столбца) равна определителю. Теорема доказана. Замечание 1. Квадратную матрицу Л, определитель det А которой отличен от нуля, принято называть невырожденной. Замечание 2. Впредь мы можем опустить термины «левая» и «правая» и говорить просто о матрице В, обратной по отношению к невырожденной матрице А и определяе- -мой соотношениями АВ = В А — Е. Очевидно также, что свойство быть обратной матрицей взаимно в том смысле, что если В яв- ляется обратной для А, то А является обратной для В. Матрицу, обратную к матрице Л, впредь мы будем обозначать символом Л-х. § 3. Теорема о базисном миноре матрицы 1. Понятие линейной зависимости строк. Выше мы уже до- говорились называть строку *) Л = (а1, а2.ап) линейной ком- бинацией строк B = (t>i, b2, ..., Ьп), . .., С=(с1, с2, ..., сп), если для некоторых вещественных чисел X, .,., р, справедливы равенства aj = kbj+ ... + цсу- (/= 1, 2, ..., га). (1.42) Указанные га равенств (1.42) удобно записать в виде одного равенства Л = ХВ+...+цС. (1.43) Всякий раз, когда будет Встречаться равенство (1.43), мы будем понимать его в смысле га равенств (1.42). Введем теперь понятие линейной зависимости строк. Определение, Строки А = (а1, а2, ..., ап), В = (Ьг, Ь2, .Ь„), . . ., С = (сп с2, ..., с„) назовем линейно зависимыми, если найдутся такие числа а, 0, ..., у, не все равные нулю, что спра- ведливы равенства ' ’ аа/ + рЬ/ + ... = 0 (/= 1, 2, ..., га). (1.44) *) Каждую строку можно рассматривать как матрицу. Поэтому естест- венно использовать для обозначения строк большие латинские буквы.
40 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. I п равенств (1.44) удобно записать в виде одного равенства аЛ+££+ ... +уС=О, (1.45) в котором О = (0, 0, .... 0) обозначает нулевую строку. Строки, не являющиеся линейно зависимыми, называются линейно независимыми. Можно дать и «самостоятельное» определение линейной независимости строк: строки А, В, ..С называются линейно независимыми, если равенство (1.45) возможно лишь в случае, когда все числа равны а, р, . -у равны нулю. Докажем следующее простое, но важное утверждение. Теорема 1.5. Для того чтобы строки А, В, . .., С были ли- нейно зависимы, необходимо и достаточно, чтобы одна из этих строк являлась линейной комбинацией остальных строк. Доказательство. 1) Необходимость. Пусть строки А, В, ..., С линейно зависимы, т. е. справедливо равенство (1.45), в котором хотя бы одно из чисел а, р, ..., у отлично от нуля. Ради определенности допустим, что а^О. Тогда поделив (1.45) на а и введя обозначения Х =— р/а, ..., р. = — у /а, мы можем переписать (1.45) в виде Л = ХВ+...+рС, (1.46) а это и означает, что строка Л является линейной комбинацией строк В, ..., С. 2) Д ост ат о ч н ост ь.. Пусть одна из строк (например, Л) является линейной комбинацией остальных строк. Тогда най- дутся числа X, ...,|л такие, что справедливо равенство (Г.46). Но это последнее равенство можно переписать в виде (—1)Л + ХВ+...+рС = О*). Так как из чисел —1, X, ...,|i одно отлично от нуля, то по- следнее равенство устанавливает линейную зависимость строк Л, В, ...,С. Теорема доказана. Конечно, во всех проведенных выше рассуждениях термин «строки» можно заменить термином «столбцы». 2. Теорема о базисном миноре. Рассмотрим произвольную (не обязательно квадратную) матрицу а11 а12 • • • а1П Д __ а21 ^22 • • fl2rt (| 47) ami ат2 • • • атп Минором А-го порядка матрицы Л будем называть оп- ределитель /г-го порядка с элементами, лежащими на пересечении j Здесь О=(0, 0, .... 0)—нулевая строка.
ТЕОРЕМА О БАЗИСНОМ МИНОРЕ МАТРИЦЫ 41 §.з] любых k строк и любых k столбцов матрицы А. (Конечно, k не превосходит наименьшее из чисел /пип.) Предположим, что хотя бы один из элементов а/у, матрицы А отличен от нуля. Тогда найдется такое целое положительное число г, что будут выполнены следующие два условия: 1) у ма- трицы А имеется минор r-го порядка, отличный от нуля, 2) всякий минор (г + 1)-го и более высокого порядка (если таковые сущест- вуют), равен нулю. Число г, удовлетворяющее требованиям 1) и 2), назовем рангом матрицы А*). Тот минор. r-го порядка, который отличен от нуля, назовем базисным минором (конечно, у матрицы А может быть несколько миноров r-го порядка, отличных от нуля). Строки и столбцы, на пересечении которых стоит базисный минор, назовем соответственно базисными строками и базисными'столбцами. Докажем следующую основную теорему. Теорема 1.6 (теорема о базисном миноре). Базисные строки (базисные столбцы) линейно независимы. Любая строка (любой столбец) матрицы А является линейной комбинацией базисных строк (базисных столбцов). Доказательство. Все рассуждения проведем для строк. Если бы базисные строки были линейно зависимы, то по теореме 1.5 одна из этих строк являлась бы линейной комби- нацией других базисных строк, и мы могли бы, не изменяя величины базисного минора, вычесть из этой строки указанную линейную комбинацию и получить строку, целиком состоящую из нулей, а это противоречило бы тому, что базисный минор отличен от нуля. Итак, базисные строки линейно независимы. Докажем теперь, что любая строка матрицы А является ли- нейной комбинацией базисных строк, Так как при произвольных переменах строк (или столбцов) определитель сохраняет свой- ство равенства нулю, то мы, не ограничивая общности, можем считать, что базисный минор находится в левом верхнем углу матрицы (1.47), т. е. расположен на первых г строках и первых г столбцах. Пусть /—любое число от 1 до n, a k—любое число от 1 до т. Убедимся в том, что определитель (г Д- 1)-го порядка Л11 а12 а1Г °1J tlai ^22 ••• ^2 Г a2j «rt ^Г2 • • * &ГТ arJ Qkl ak2 ••• akr akj (1.48) *) Ранг матрицы Л, все элементы которой — нули, по определению равен нулю.
42 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. 1 равен нулю. Если /<+ или k^r, то указанный определитель будет равен нулю в силу того, что у него будет два одинаковых столбца или две одинаковые строки. Если же оба числа / и k превосходят г, то (1.48) является минором матрицы А порядка (г+1), а всякий такой минор равен нулю (по определению базисного минора). Итак, определи- тель (1.48) равен нулю при всех / от 1 до п и всех k от 1 до т. Но тогда, разложив этот определитель по последнему столбцу и обозначив не зависящие от номера j алгебраические дополне- ния элементов этого столбца символами А^=с1г А^=с2, ... .. .Arj- — cr, A^ = cr+i, мы получим, что + ^2^2/+ • • • “Ь ^r + i^hj О (для всех / = 1,2, ..., п). Учитывая, что в последних равенствах алгебраическое дополнение cr+i = Akj совпадает с заведомо от- личным от нуля базисным минором, мы можем поделить каждое из этих равенств на cr+i. Но тогда, вводя обозначения л ci 7 7 сг Л, ------, Ал ==-----, • • • » Л. --- , сг + 1 сг + 1 сг + 1 мы получим, ЧТО °kj — + • • • + '^•rarj (для всех / = 1, 2, ..., п), а это и означает, что k-я строка является линейной комбинацией первых г (базисных) строк. Теорема доказана. 3. Необходимое и достаточное условие равенства нулю опре- делителя. Теорема 1.7. Для того, чтобы определитель п-го порядка А был равен нулю, необходимо и достаточно, чтобы его строки (столбцы) были линейно зависимы. Доказательство. 1) Необходимость. Если опре- делитель п-го порядка А равен нулю, то базисный минор его матрицы имеет порядок г, заведомо меньший п. Но тогда хотя бы одна из строк является не базисной. По теореме 1.6 эта строка является линейной комбинацией базисных строк. В эту линейную комбинацию мы можем включить и все остав- шиеся строки, поставив перед ними нули. Итак, одна строка является линейной комбинацией осталь- ных. Но тогда по теореме 1.5 строки определителя линейно зависимы. 2) Достаточность. Если строки А линейно зависимы, то по теореме 1.5 одна строка Л,- является линейной комбина- цией остальных строк. Вычитая из строки А,- указанную линей- ную комбинацию, мы, не изменив величины А, получим одну строку, целиком состоящую из нулей. Но тогда определитель А равен нулю (в силу следствия 3 из п. 4 § 2). Теорема доказана.
ГЛАВА 2 ЛИНЕЙНЫЕ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с опе- рацией сложения свободных векторов и с операцией умножения вектора на вещественное число, а также со свойствами этих операций. В настоящей главе изучаются множества объектов любой природы, для элементов которых каким-либо способом (причем, безразлично каким) определены операция сложения элементов и операция, умножения элемента на вещественное число, причем указанные операции обладают теми же свойст- вами, что и соответствующие операции над геометрическими векторами. Такие множества, называемые линейными про- странствами, обладают целым рядом общих свойств, кото- рые и будут установлены в настоящей главе. § 1. Понятие линейного пространства 1. Определение линейного пространства. Множество R элемен- тов х, у, 2, ... любой природы называется линейным (ила аффинным) пространством, если выполнены следующие три требования: I. Имеется правило, посредством которого любым двум эле- ментам х и у множества R ставится в соответствие третий элемент Z этого множества, называемый суммой элементов х и у и обозначаемый символом z — x-(-y. II. Имеется правило, посредством которого любому элементу х множества R и любому вещественному числу X ставится в соот- ветствие элемент а этого множества, называемый произведе- нием элемента х на число X и обозначаемый символом и — 'Кх'или и — хК. III . Указанные два правила подчинены следующим восьми ак- сиомам: Г. х-\-у =у-\-х (переместительное свойство суммы); 2°. (х+.j) + г = х 4(j + <?) (сочетательное свойство суммы);
44 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 3°, существует нулевой элемент 0 такой, что х-\-0 — х для любого элемента х (особая роль нулевого элемента); 4°. для каждого элемента х существует противополож- ный элемент х' такой, что х-}-х' = 0; 5°. 1-х — х для любого элемента х (особая роль числового множителя 1); 6°. Х(рх) = (Хр)х (сочетательное относительно числового множителя свойство); 7°. (Х + р) х = %х + рх (распределительное относительно суммы числовых множителей свойство); 8°. % (x+j) = Хх + Лу (распределительное относительно суммы элементов свойство). .Подчеркнем, что при введении понятия линейного простран- ства мы абстрагируемся не только от природы изучаемых объек- тов, но и от конкретного вида правил образования суммы эле- ментов и произведения элемента на число (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам, сформулирован- ным в данном выше определении). Если же природа изучаемых объектов и вид правил образо- вания суммы элементов и произведения элемента на число ука- заны *), то мы будем называть линейное пространство кон- кретны м. Приведем примеры конкретных линейных пространств. Пример 1. Рассмотрим множество всех свободных векторов в трехмерном пространстве. Операции сложения указанных век- торов и умножения этих векторов на числа определим так, как это было сделано в аналитической геометрии (сложение векто- ров определим по правилу «параллелограмма»; при умножении вектора на вещественное число X длина этого вектора умно- жается на |Х|, а направление при Х>0 остается неизменным, а при X<0— изменяется на противоположное). Элементарно проверяется справедливость всех аксиом 1°—8° (справедливость -всех аксиом, за исключением аксиомы 5°, уста- новлена в курсе аналитической геометрии**), справедливость аксиомы 5° не вызывает сомнений.) Таким образом, множество всех свободных векторов в прост- ранстве с так определенными операциями сложения векторов и умножения их на числа представляет собой линейное простран- ство, которое мы будем обозначать символом В3. Аналогичные множества векторов на плоскости и на прямой, также являющиеся линейными пространствами, мы будем обоз- начать соответственно символами В3 и Вг. *) Разумеется, эти правила должны быть указаны так, чтобы были спра- ведливы свойства 1°—8°, перечисленные в данном выше определении в виде аксиом. **) См. выпуск «Аналитическая геометрия», гл. 2, § 1, п. 2.
§ и ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 45 Пр и мер 2. Рассмотрим множество {л} всех положитель- ных вещественных чисел. Определим сумму двух элементов х и у этого множества как произведение вещественных чисел х а у (понимаемое в обычном в теории вещественных чисел смысле). Произведение элемента х множества {х} на вещественное число X определим как возведение положительного вещественного числа х в степень X. Нулевым элементом множества {х} будет являться вещественное число 1, а противоположным (для данного эле- мента х) элементом будет являться вещественное число 1/х. Легко убедиться в справедливости всех аксиом 1°—8°. В са- мом деле, справедливость аксиом 1° и 2° вытекает из перемести- тельного и сочетательного свойств произведения вещественных чисел; справедливость аксиом 3 и 4° вытекает из элементарных равенств х-1=х, х- —=1 (для любого вещественного х > 0); аксиома 5° эквивалентна равенству х1 = х; аксиомы 6° и 7° спра- ведливы в силу того, что для любого х > 0 и любых веществен- ных X и р имеют место соотношения (хц)х = хХц, x<л + м, = хл-хи; наконец, справедливость аксиомы 8° следует из того, что для любых положительных х и у и для любого вещественного X имеет место равенство (ху)к = хкук. Итак, мы убедились, что множе- ство {х} с так определенными операциями сложения элементов и умножения их на числа является линейным пространством. Пример 3. Важный пример линейного пространства дает множество А", элементами которого служат упорядоченные сово- купности п произвольных вещественных чисел (хп х2, ..., хп). Элементы этого множества мы будем обозначать одним символом х, т. е. будем писать x = (xv х2, ..., х„), и при этом называть вещественные числа xv х2, ...,хп координатами элементах. В анализе множество Ап обычно называют n-мерным коор- динатным пространством*). В алгебраической трактовке множество Ап можно рассматривать как совокупность всевозмож- ных строк, каждая из которых содержит п вещественных чисел (что мы уже и делали в § 3 гл. 1). Операции сложения элементов множества Ап и умножения этих элементов на вещественные числа определим правилами: Ui. Ч.....*П) + (У1. Уг...Уп^^ + Уп xa+ys, - х„ + у„), X(х1; х2, ...» ^п) = ^х2, ..., Ххл). Предоставляем читателю элементарную проверку справедли- вости всех аксиом 1°—8° и того факта, что нулевым элементом рассматриваемого множества является элемент 0 = (0, 0, ...,0), а противоположным для элемента (хп х2, ..., х„) является эле- мент (—хх, —х2, .... — х„). *) См. выпуск «Основы математического анализа», часть 1, гл. 14, § 1, п. 4.
46 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Пример 4. Рассмотрим далее множество С [а, Ь] всех функ- ций x = x(t), определенных и непрерывных на сегменте a^i <Zb. Операции сложения таких функций и умножения их на веще- ственные числа определим обычными правилами математического анализа. Элементарно проверяется справедливость аксиом 1°—- 8°*), позволяющая заключить, что множество С[a, fcj является линейным пространством. Пример 5. Следующим примером линейного пространства может служить множество {Р„ (/)} всех алгебраических многочле- нов степени, не превышающей натурального числа п, с опера- циями, определенными так же, как в предыдущем примере. Заме- тим, что множество {Р„(0}> если его рассматривать на сегменте a^t^b, является подмножеством линейного пространства С [а, 6], рассмотренного в примере 4. Замечание 1. Для разъяснения изучаемого понятия линей- ного пространства укажем примеры множеств, по той или иной причине не являющихся линейными пространствами: а) множество всех векторов пространства с исключением век- торов, коллинеарных некоторой прямой I (ибо в пределах этого множества нельзя складывать векторы, симметричные относи- тельно указанной прямой /); б) множество всех многочленов степени, точно равной нату- ральному числу п (сумма двух таких многочленов может ока- заться многочленом, степени ниже п); в) множество всех многочленов степени, не превышающей натурального п, все коэффициенты которых положительны ^эле- менты такого множества нельзя умножить на отрицательные вещественные числа). Замечание 2. Отметим, что элементы произвольного линей- ного пространства принято называть векторами. То обстоя- тельство, что часто термин «вектор» употребляется в более узком смысле, при этом не приводит к недоразумениям, а, напротив, взывая к сложившимся геометрическим представлениям, по- зволяет уяснить, а зачастую и предвидеть ряд результатов, справедливых для линейных пространств произвольной при- роды. Замечание 3. В сформулированном нами определении линейного пространства числа X, р, ... брались из множества вещественных чисел. Поэтому определенное нами простран- ство естественно назвать вещественным линейным про- странством. При более широком подходе можно брать X, р,... из множества комплексных чисел. При этом мы придем к понятию комплексного линейного пространства. *) В частности, нулевым элементом пространства С [а, 6] является функ- ция, тождественно равная нулю на сегменте a<t<b.
§ 11 ПОНЯТИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА 47 2. Некоторые свойства произвольных линейных пространств. Из аксиом 1°—8° в качестве логических следствий можно полу- чить ряд утверждений, справедливых для произвольных линей- ных пространств. В качестве примера установим два утверждения. Теорема 2.1. В произвольном линейном пространстве суще- ствует единственный нулевой элемент и для каждого элемента х существует единственный противоположный элемент. Доказательство. Существование хотя бы одного нулевого элемента утверждается в аксиоме 3°. Предположим, что существуют два нулевых элемента О* и 02. Тогда, полагая в акси- оме 3° сначала х = 0г, 0 = 02, а затем х = 02, 0 = 0i( мы полу- чим два равенства 0-j-4-03 = О^, 02 + 0i=02, левые части которых (в силу аксиомы Г) равны. Стало быть, в силу транзитивности знака = равны и правые части двух последних равенств, т. е. 0i=02, и единственность нулевого элемента установлена. Существование для каждого элемента х хотя бы одного противоположного элемента у утверждается в аксиоме 4°. Пред- положим, что для некоторого элемента х существует два проти- воположных элемента у± и у2, так что ж 4-34 = 0 и x-f-_y2=0. Но тогда в силу аксиом 3°, 2° и 1° у± =J44-O=J4 + (*+.Ms) = = 4-х) 4-^=0+ j2=j2 4-0= J2, т- е- и единствен- ность для каждого элемента х противоположного элемента дока- зана. Теорема доказана. Теорема 2.2. В произвольном Линейном пространстве 1) нулевой элемент 0 равен произведению произвольного эле- мента х на вещественное число 0; 2) для каждого элемента х противоположный элемент равен произведению этого элемента х на вещественное число —1. Доказательство. 1) Пусть х—произвольный элемент, а у—ему противоположный. Последовательно применяя аксиомы 3°, 4°, 2°, 5°, 1°, 7° .и снова 5° и 4°, будем иметь ж-0 ==ж-04-0 = = x-04-(xH-j)=(x-04-x) 4-J=(x-04-x-l)4-^=x(04-l)+j = = х-1 4-J = х4-.У =0, т. е. ж-0 = 0. 2) Пусть х—произвольный элемент, J = (—1)-х. Используя аксиомы 5°, 7°, 1° и уже доказанное равенство ж-0 = 0, получим равенство jr-bji=x + (-l)jr = 1 -ж4-(—1) х =[1 4- (—1)]ж = = 0-х = х-0 = 0, которое и доказывает (в силу аксиомы 4°), что у—элемент противоположный х. Теорема доказана. Отметим в заключение, что аксиомы 1°—4° позволяют дока- зать существование и единственность разности любых двух элементов линейного пространства х и у, которая определяется как элемент г, удовлетворяющий условию х-\-у = х *). (Таковым элементом служит сумма z = X-\-(— l)3>.j *) Достаточно дословно повторить доказательство, данное в теории веще- ственных чисел (см. выпуск «Основы математического анализа», часть I, гл. 2, § 2, п. 3).
48 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 § 2. Базис и размерность линейного пространства 1. Понятие линейной зависимости элементов линейного про- странства. В курсе аналитической геометрии *) было введено понятие линейной зависимости векторов, а в п. 1 § 3 предыдущей главы — понятие линейной зависимости строк (или, что то же самое, элементов пространства А\ рассмотренного в примере 3 из п. 1 § 1 настоящей главы). Обобщением этих понятий является понятие линейной зави- симости элементов совершенно произвольного линейного про- странства, к выяснению которого мы и переходим. Рассмотрим произвольное вещественное линейное простран- ство с элементами х, у, ..., г, .... Линейной комбинацией элементов х, у...........z про- странства R мы будем называть сумму произведений этих эле- ментов на произвольные вещественные числа, т. е. выражение вида ах + Р_у+ ... + yz, (2.1) где а, 0, ..., у — какие угодно вещественные числа. Определение 1. Элементы х, у, ..., г пространства R назы- ваются линейно зависимыми, если найдутся такие веще- ственные числа а, 0, ..., у, из которых хотя бы одно отлично от нуля, что линейная комбинация элементов х, у, ..., z с ука- занными числами является нулевым элементом пространства R, т. е. имеет место равенство ах + 0у+...+уг = 0. (2.2) Элементы х, у, . .., z, не являющиеся линейно зависимыми, мы будем называть линейно независимыми. Дадим другое определение линейно независимых векторов, построенное на логическом отрицании содержания определения 1. Определение 2. Элементы х, у, ..., z пространства R на- зываются линейно независимыми, если линейная комбина- ция (2.1) является нулевым элементом пространства R лишь при условии а = 0= ...=у=О. Теорема 2,3. Для того чтобы элементы х, у, ..., z прост- ранства R были линейно зависимы, необходимо и достаточно, чтобы один из этих элементов являлся линейной комбинацией остальных элементов. Доказательство. 1) Необходимость. Пусть эле- менты х, у, ..., z линейно зависимы, т. е. справедливо равен- ство (2.2), в котором хотя бы одно из чисел а, 0, . .., у отлично от нуля. Пусть, ради определенности, ау=0. Тогда, поделив (2.2) на а и введя обозначения -----—.....ц, =----—, мы можем а г а ’ *) См. выпуск «Аналитическая геометрия», гл. 2, § 1, п. 3.
$ 21 БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 49 переписать (2.2) в виде х = ку + ... + уг, (2.3) а это и означает, что элемент х является линейной комбинацией элементов у, ..., z. 2) Достаточность. Пусть один из элементов (например, х) является линейной комбинацией остальных элементов. Тогда най- дутся числа X, ..., у,, такие, что справедливо равенство (2.3). Но это последнее равенство можно переписать в виде (—1) х 4-+ ... 4~ у.£ = 0. (2.4) Так как из чисел (—1), X, ..., у. одно отлично от нуля, то равенство (2.4) устанавливает линейную зависимость элементов х, у, ..., z. Теорема доказана. Справедливы два элементарных утверждения: 1. Если среди элементов х, у, . .., z имеется нулевой элемент, то эти элементы линейно зависимы. В самом деле, если, напри- мер, х — 0, То равенство (2.2) справедливо при а = 1, 0 = . ..= = у=0. 2. Если часть элементов х, у.....z являются линейно зави- симыми, то и все эти элементы являются линейно зависимыми. В самом деле, если, например, элементы у, . .., z линейно зави- симы, то справедливо равенство + ... +уг =0, в котором не все числа 0, ..., у равны нулю. Но тогда с теми же числами 0, ..., у и с а = 0 будет справедливо равенство (2.2). В заключение рассмотрим вопрос о линейной зависимости элементов пространства Ап, введенного в примере 3 п. 1 § 1. Докажем, что п элементов указанного пространства в1 = (1, 0, 0, ..., 0), е2=(0, 1, 0, ..., 0), е3 = (0, 0, 1 0), (2.5) е„ = (0, 0, 0, .... 1) являются линейно независимыми, а совокупность п элементов (2.5) и еще одного произвольного элемента х = (х1( х2, ... ..., х„) пространства Ап уже образует линейно зависимую си- стему элементов. Рассмотрим линейную комбинацию элементов (2.5) с какими- либо числами а2, а2, а3, ..., а„. В силу аксиом эта линейная комбинация представляет собой элемент а&+а2е2 + . .. +«„<?„ = («!, а2, .... а„), который является нулевым лишь при условии а2 =а2= ... =ап=0. Но это и означает линейную независимость элементов (2.5).
50 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Докажем теперь, что система, состоящая из п элементов (2.5) и еще одного произвольного элемента х = (xt, х2, ..., хп) пространства Ап, уже является линейно зависимой. В силу тео- ремы 2.3 достаточно доказать, что элемент х = (хг, х2, ..., хп) представляет собой линейную комбинацию элементов (2.5), а это очевидно, ибо в силу аксиом х = (xit х2, ..., х„) = x^i + х2е2 + ... + Хпеп. 2. Базис и координаты. Рассмотрим произвольное веществен- ное линейное пространство R. Определение. Совокупность линейно независимых элементов еь е2, ... ,еп пространства R называется базисом этого прост- ранства, если для каждого элемента х пространства R найдутся вещественные числа xit х2, ..., хп такие, что справедливо ра- венство х = x^i + х2е2 + ... + хпеп. (2.6) При этом равенство (2.6) называется разложением эле- мента х по б а з и су е2, ..., е„, а числа х1( х2, ..., хп называются координатами элемента х (относительно базиса &i> в2, ..., еп). Докажем, что каждый элемент х линейного пространства R может быть разложен по базису е2, е2, ...,еп единствен- ным способом, т. е. координаты каждого элемента х относи- тельно базиса eit е2, ...,еп определяются однозначно. Допустим, что для некоторого элемента х наряду с разло- жением (2.6) справедливо еще и другое разложение по тому же самому базису х = х2е2-4-х2е24- ... 4-хпеп. (2.7) Почленное вычитание равенств (2.6) и (2.7) приводит нас к соотношению *) (^—<) е2 4- (х2—х2) е2 4- ... 4- (х„—х'п) еп = 0. (2.8) В силу линейной независимости базисных элементов ef,e8,... ...,е„, соотношение (2.8) приводит к равенствам хх—xJ=O, х2—х2 = 0, ..., хп—х„ = 0 или xi = x{, х2 = х8, ..., хп = х’п. Един- ственность разложения по базису доказана. Значение базиса заключается также и в том, что операции сложения элементов и умножения их на числа при задании базиса превращаются в соответствующие операции над числами—координатами этих элементов. Именно справедливо следующее утверждение. *) Возможность почленного вычитания равенств (2.6) и (2.7) и производи- мой группировки членов вытекает из аксиом 1°—8°.
§2] БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 51 Теорема 2.4. При сложении двух любых элементов линейного пространства R их координаты (относительно любого базиса пространства R) складываются; при умножении произвольного элемента на любое число А, все координаты этого элемента умно- жаются на А.. Доказательство. Пусть eit ег, ...,еп — произвольный базис пространства R, х = х^ + х2е3 + ... + х„е„ п.у = у1е1 + + +ег + • • • +упвп — любые два элемента этого пространства. Тогда в силу .аксиом 1°—8° х +.У — (xi+z/i) ei + (х2 +#г) е2 + • • • + (+»+#») еп> Хх = (А.хх) ех + (А.х2) е2 + ... + (А,х„) еа. В силу единственности разложения по базису теорема дока- зана. Приведем примеры базисов конкретных линейных пространств. Из аналитической геометрии известно, что любые три некомп- ланарных вектора образуют базис в линейном пространстве В3 всех свободных векторов (это пространство рассмотрено в при- мере 1 п. 1 § 1). Заметим далее, что совокупность п элементов (2.5), рассмот- ренных в конце п. 1, образует базис в линейном пространстве Ап, введенном в примере 3 п. 1 § 1. В самом деле, в конце предыдущего пункта доказано, что элементы (2.5) линейно независимы и что любой элемент х= =(xit х2, ..., х„) пространства Ап представляет собой некоторую линейную комбинацию элементов (2.5). Убедимся, наконец, что базис линейного пространства {х}, введенного в примере 2 п. 1 § 1, состоит из одного элемента, в качестве которого можно взять любой ненулевой элемент этого пространства (т. е. любое положительное вещественное число х0, не равное 1). Достаточно доказать, что для любого положительного вещественного числа х найдется вещественное число А, такое, что x = xj*). Но это очевидно: достаточно взять A, = logXox. 3. Размерность линейного пространства. Как и выше, будем рассматривать произвольное вещественное линейное простран- ство R. Определение 1. Линейное пространство R называется п-мерным, если в нем существует п линейно независимых эле- ментов, а любые (п+1) элементов уже являются линейно зави- симыми. При этом число п называется размерностью прост- ранства R. *) Напомним, что произведение элемента х9 на число X определяется как число хо.
52 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Размерность пространства 7? обычно обозначают символом dim 7?. Определение 2. Линейное пространство R называется бес- конечномерным, если в нем существует любое число линейно независимых элементов *). В настоящей книге мы будем изучать в основном пространства конечной размерности п. Бесконечномерные пространства состав- ляют предмет специального изучения. (Они изучаются в гл. 10 и 11 выпуска «Основы математического анализа», часть II.) Выясним связь между понятием размерности пространства и введенным в предыдущем пункте понятием базиса. Теорема 2.5. Если R—линейное пространство размерности п, то любые п линейно независимых элементов этого пространства образуют его базис. Доказательство. Пусть еп е2, ..., еп—любая система п линейно независимых элементов пространства R (существование хотя бы одной такой системы вытекает из определения 1). Если х—любой элемент R', то, согласно определению 1, система (n + 1) элементов х, elt е2, ..., е„ линейно . зависима, т. е. найдутся не все равные нулю числа а0, av аг, ...,а„ такие, что справедливо равенство аах+а1е1 + <х2е2 + • • • Ч-апе„ = 0. (2.9) Заметим, что число а0 заведомо отлично от нуля (ибо в против- ном случае из равенства (2.9) вытекала бы линейная зависимость элементов е±, е2, ..., еп). Но тогда, поделив равенство (2.9) на а, и положив Y -—21 Г Y — — 2s 1 а0 ’ 2 «„’’" а0 ’ мы получим из (2.9) х = х1е1 + х2е2 + ... +хпе„. (2.10) Так как х—произвольный элемент 7?, то равенство (2.10) дока- зывает, что система элементов elt е2, ...,еп является базисом пространства 7?. Теорема доказана. Теорема 2.6. Если линейное пространство R имеет базис, состоящий из п элементов, то размерность R равна п. Доказательство. Пусть система п элементов ег, е2, .. .,еп является базисом пространства R. Достаточно доказать, что любые (n-f-1) элементов этого пространства х2, х2, ..., хп + 1 линейно зависимы**). Разложив каждый из этих элементов по *) Для обозначения того, что пространство R является бесконечномерным, используют следующую символику: dim/?=<». **) Ибо базисные элементы «1, е2,~.е„ образуют систему п линейно независимых элементов пространства R.
S 2] БАЗИС И РАЗМЕРНОСТЬ ЛИНЕЙНОГО ПРОСТРАНСТВА 53 базису, будем иметь + °12^2 + • • + а1п^п’ ^21^1 + ^22^2 + * * ’ + *П + 1 ^(п+ 1) 1^1 4“ ^(п + 1) 2 ®2 + ' • • + Чкп + 1) п &п> где aii( ai2, ..., a(„+i)n— некоторые вещественные числа. Очевидно, линейная зависимость элементов х15 х2, . ..,x„+f эквивалентна линейной зависимости строк матрицы аИ а12 • • а1п Д __ а21 а22 • • • а2п atn + i)i а(п + 1)2 а(п + 1)п Но строки указанной матрицы заведомо линейно зависимы, ибо порядок базисного минора этой матрицы (содержащей (п+1) строк и п столбцов) не превосходит п, и хотя бы одна из (п-f-l) ее строк не является базисной и по теореме о базисном миноре *) представляет собой линейную комбинацию базисных (а стало быть, и всех остальных) строк. Теорема доказана. Обращаясь к примерам, рассмотренным в конце предыдущего пункта, мы теперь можем сказать, что размерность простран- ства В3 всех свободных векторов равна трем, размерность про- странства Ап равна п, а размерность пространства {х} равна единице. Примером бесконечномерного пространства может служить линейное пространство С [а, Ь] всех функций x = x(t), определен- ных и непрерывных на сегменте a^t^b (см. пример 4 из п. 1 § 1). В самом деле, для любого номера п система (п + 1) эле- ментов этого пространства 1, t, t2....tn является линейно независимой (ибо в противном случае некоторый многочлен Со + С11 +С2/2+ ... +С„/Л, не все коэффициенты Со, Сп ..., Сп которого равны нулю, оказался бы тождественно равным нулю на сегменте a^.t^.b'). 4. Понятие изоморфизма линейных пространств. В этом пункте мы покажем, что различные линейные пространства одной и той же размерности п в смысле свойств, связанных со введенными в этих пространствах операциями, по существу не отличаются друг от друга. Так как в линейных пространствах введены лишь операции сложения элементов и умножения элементов на числа, то есте- ственно сформулировать следующее определение. *) См. теорему 1.6 из п. 2 § 3 гл. 1,
54 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Определение. Два произвольных вещественных линейных про- странства R и R' называются изоморфными, если между элементами, этих пространств можно установить взаимно одно- значное соответствие *) так, что если элементам х и у простран- ства R отвечают соответственно элементы х' и у' простран- ства R', то элементу х+у отвечает элемент х'~Ьу', а эле- менту Кх при любом вещественном X отвечает элемент Кх’. Заметим, что если линейные пространства R и R' изоморфны, то нулевому элементу R отвечает нулевой элемент R’ и наоборот. (В самом деле, пусть элементу х пространства R отвечает неко- торый элемент х' пространства R'. Тогда элементу 0-х прост- ранства R отвечает элемент 0-х' пространства /?'.) Отсюда следует, что если в случае изоморфизма элементам х, у, z пространства R отвечают соответственно элементы х', у', ...,z' пространства R', то линейная комбинация ах + + ... 4-yz является нулевым элементом пространства R тогда и только тогда, когда линейная комбинация ccx' + Pj' + •.. . ,.+уг' является нулевым элементом пространства R'. Но это означает, что если пространства R и R' изоморфны, то максимальное число линейно независимых элементов в каждом из этих пространств одно и то же. Иными словами, два изоморфных пространства обязаны иметь одинаковую размерность. Стало быть, пространства разной размерность не могут быть изоморфны. Докажем теперь следующее утверждение. Теорема 2.7. Любые два п-мерных вещественных линейных пространства R и R' изоморфны. Доказательство. Выберем в R какой-либо базис eit е2, ...,еп, а в R'—какой-либо базис е[, е'2, ...,е'п. Поставим в соответствие каждому элементу х = xlei-]-x2e2 + . .. +х„еп пространства R элемент х' = х1е[ + х,ва + • • - +х„вп простран- ства R' (т. е. мы берем в качестве х' тот элемент R', который имеет относительно базиса е[, е'2, .. .,е'п те же самые координаты, что и элемент х относительно базиса е±, е2, .... е„). Убедимся в том, что установленное соответствие является взаимно однозначным. В самом деле, каждому элементу х про- странства R однозначно соответствуют координаты xt, х2.хп, которые в свою очередь определяют единственный элемент х' пространства R'. В силу равноправности пространств R и R' каждому элементу х' пространства R' в свою очередь соответ- ствует единственный элемент х пространства R. *) Напомним, что соответствие между элементами двух множеств R и R' называется взаимно однозначным, если при этом соответствии каж- дому элементу R отвечает один и только один элемент R', причем каждый элемент R' отвечает одному и только одному элементу R.
j з] подпространства линейных пространств 55 Остается заметить, что если элементам х и у пространства R отвечают соответственно элементы х' и у' пространства R', то в силу теоремы 2.4 элементу х+у отвечает элемент х'+у', а элементу кх отвечает элемент Ххг. Теорема доказана. Из приведенного нами рассмотрения следует, что единственной существенной характеристикой конечномерного линейного про- странства является его размерность. § 3. Подпространства линейных пространств 1. Понятие подпространства и линейной оболочки. Предпо- ложим, что некоторое подмножество L линейного пространства R удовлетворяет следующим двум требованиям: Г. Если элементы х и у принадлежат подмножеству L, то h сумма х+у принадлежит этому подмножеству. 2°. Если элемент х принадлежит подмножеству L, а X — любое вещественное число, то и элемент 7.x принадлежит под- множеству L. Убедимся в том, что подмножество L, удовлетворяющее тре- бованиям 1° и 2°, само является линейным пространством. Достаточно убедиться в справедливости для элементов подмно- жества L аксиом 1°—8° из определения линейного пространства. Все указанные аксиомы, кроме аксиом 3° и 4°, заведомо спра- ведливы для элементов подмножества L, поскольку они справед- ливы для всех элементов пространства R. Остается проверить выполнение аксиом 3° и 4°. Пусть х—любой элемент подмно- жества L, а X—любое вещественное число. Тогда в силу требо- вания 2° элемент Хх также принадлежит L. Остается заметить, что (в силу теоремы 2.2) этот элемент Хх при X = 0 превращается в нулевой элемент пространства R, а при Х =—1 превращается в противоположный для х элемент. Таким образом, подмно- жеству L принадлежит нулевой элемент и противоположный (для каждого элемента х) элемент, а это и означает, что для элементов подмножества L справедливы аксиомы 3° и 4°. Тем самым полностью доказано, что подмножество L само является линейным пространством. Определение. Подмножество L линейного пространства R, удовлетворяющее требованиям Г и 2°, называется линейным подпространством (или просто подпространством) пространства R. Простейшими примерами подпространств могут служить: 1) так называемое нулевое подпространство, т. е. под- множество линейного пространства R, состоящее из одного нуле- вого элемента; 2) все пространство R (которое, конечно, можно рассматривать как подпространство).
56 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Оба эти подпространства принято называть несобствен- ными. Укажем примеры подпространств более содержательного вида. Пример 1. Подмножество {.?„(/)} всех алгебраических многочленов степени, не превышающей натурального числа п *), в линейном пространстве С[а,Ь] всех функций x = x(t), опре- деленных и непрерывных на сегменте a^t^b**) (справедли- вость для элементов подмножества требований 1° и 2° не вызывает сомнений). Пример 2. Подмножество В2 всех свободных векторов, параллельных некоторой плоскости, в линейном пространстве В3 всех свободных векторов ***) (справедливость для элементов В3 требований Г и "2° очевидна). Пример 3. Пусть х, у, ..., Z—совокупность элементов некоторого линейного пространства R. Л инейной оболочкой элементов х, у, .... z будем называть совокупность всех линей- ных комбинаций этих элементов, т. е. множество элементов вида ах + Р> + ... + уг, где а, р, у — какие угодно вещественные числа. Договоримся обозначать линейную оболочку элементов х, у, ..., z символом L (х, у, ..., z). Для линейной оболочки произвольных элементов х, у, ..., z линейного пространства R, очевидно, выполняются требования 1° и 2°, сформулированные в начале настоящего пункта. Поэтому всякая линейная оболочка является подпространством основного линейного пространства R. Это подпространство, очевидно, содержит элементы X, у, ..., z, на которых построена линейная оболочка L(x, у, ..., z). С другой стороны, всякое подпрост- ранство, содержащее элементы х, у, ..., Z, обязано содержать и все линейные комбинации этих элементов. Поэтому линейная оболочка элементов х, у, ..., z является наименьшим под- пространством, содержащим элементы х, у, .... z. Конкретным примером линейной оболочки может служить линейная оболочка элементов 1, t, t2, .. .,tn линейного прост- ранства С [а, 6] всех функций x=x(t), определенных и непре- рывных на сегменте a^t^Zb. Эта линейная оболочка, очевидно, представляет собой множество \Рп (0} всех алгебраических много- членов степени, не превышающей п. Другие примеры подпространств будут рассмотрены в п. 3 настоящего параграфа. *) Это подмножество введено в примере 5 п. 1 § 1 настоящей главы. **) Пространство С (a, Ь] введено в примере 4 п. 1 § 1 этой главы. ***) Множества В2 и В9 были введены в примере 1 п. 1 § 1 этой главы.
§ 31 ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 57 Рассмотрим вопрос о размерности подпространства (и, в част- ности, линейной оболочки). Можно утверждать, что размерность любого подпространства п-мерного линейного пространства R не превосходит размерности п пространства R (ибо всякая линейно независимая система элементов подпространства является одновременно независи- мой системой элементов всего пространства R). Более точно можно утверждать, что если подпространство L не совпадает со всем п-мерным линейным пространством R, то размерность L строго меньше п. Это вытекает из того, что если размерности L и R обе равны п, то всякий базис подпространства L, поскольку он состоит из п элементов, является (в силу теоремы 2.5) базисом и всего пространства R. Заметим, что если во всем пространстве R выбран базис eit е2, ...,еп, то базисные элементы подпространства L, вообще говоря,, нельзя выбирать из числа элементов ev е2, ..., еп (ибо в общем случае ни один из элементов elt е2, е„ может не принадлежать L). Однако справедливо обратное утвержде- ние: если элементы elt е2, ..., ек составляют базис k-мерного подпространства п-мерного линейного пространства R, то этот базис можно дополнить элементами ек+1, . . ., е„ пространства R так, что совокупность элементов еи ..., ек, ek+i, ..., еп будет составлять базис всего пространства R. Докажем это утверждение. Если k < п, то найдется элемент еА+1 пространства R такой, что элементы еи е2, ..., ек, ек+1 линейно независимы (в противном случае пространство R оказа- лось бы fe-мерным). Далее, если /г+1 <п, то найдется элемент ей+2 пространства R такой, что элементы е1( е2, ..., eh, ек+1, ek+t линейно независимы (в противном случае пространство R оказа- лось бы (k + 1)-мерным). Продолжая аналогичные рассуждения, мы докажем сформулированное утверждение. В заключение докажем важную теорему о размерности линей- ной оболочки. Теорема 2,8. Размерность линейной оболочки L(x, у, ..., z) элементов х, у, ..., z равна максимальному числу линейно неза- висимых элементов в системе элементов х, у, ..., г. В част- ности, если элементы х, у, .. ., г линейно независимы, то раз- мерность линейной оболочки L(x, у....г) равна числу элемен- тов х, у, ..., z (а сами эти элементы образуют базис линейной оболочки L(x, у, ..., z)). Доказательство. Допустим, что среди элементов х, у,... г имеется г линейно независимых элементов (обозначим их через Xj, х2, ..., хг), а любые (г +1) из элементов х, у, ..., г лийейно зависимы. Тогда каждый из элементов х, у, ..., z пред- ставляет собой некоторую линейную комбинацию элементов xit
58 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2- х2, .... хг *), и поскольку по определению каждый элемент линейной оболочки L(x, у, ...,.?) представляет собой некоторую линейную комбинацию элементов х, у.......г, то каждый эле- мент указанной линейной оболочки представляет собой некоторую линейную комбинацию одних только элементов xt, х2, . . , хг. Но это и означает, что система линейно независимых элементов Xi, х2, ..., хг образует базис линейной оболочки L (х, у, . z) и что размерность L(x, у, z) равна г. Теорема доказана. 2. Новое определение ранга матрицы. В § 3 главы 1 мы опре- делили ранг произвольной матрицы А как поря'док ее базис- ного ми нора, т. е. как число г, удовлетворяющее требованию существования у матрицы А отличного от нуля минора порядка г и отсутствия у этой матрицы отличных от нуля миноров порядка, большего г. В этом пункте мы убедимся, что ранг произвольной матрицы А равен максимальному числу линейно независимых строк (или столбцов) этой матрицы. Отсюда будет следовать новое определение ранга матрицы как максимального числа линейно независимых строк (или столбцов) этой матрицы**). Проведем все рассуждения для строк (для столбцов они ана- логичны). Рассмотрим в линейном пространстве Ап (введенном в примере 3 п. 1 § 1) линейную оболочку базисных строк про- извольной содержащей т строк и п столбцов матрицы А и пред- положим, что число базисных строк равно г. Из теоремы 1.6 о базисном миноре вытекает, что любая строка матрицы А является элементом указанной линейной оболочки, а из линей- ной независимости г базисных строк и из теоремы 2.8 вытекает, что размерность указанной линейной оболочки равна г. Стало быть, любые (г -j-1) элементов указанной линейной оболочки (и, в частности, любые (г + 1) строк матрицы Л) линейно зави- симы.. А это и означает, что число г представляет собой макси- мальное число линейно независимых строк. 3. Сумма и пересечение подпространств. Пусть и Ь2— два произвольных подпространства одного и того же линейного про- странства R. Совокупность всех элементов х пространства R, принадле- жащих одновременно и L2, образует подпространство простран- ства 7?***), называемое пересечением подпространств и L2. *) Это устанавливается с помощью тех же самых рассуждений, которые были проведены при доказательстве теоремы 2.5. **) В частности, отсюда будет следовать весьма нетривиальная теорема о том, что у любой матрицы максимальное число линейно независимых строк совпадает с максимальным числом линейно независимых столбцов. ***) Ибо элементы этой совокупности удовлетворяют требованиям 1° и 2°, сформулированным в начале п. 1.
$ 3] ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 59 Совокупность всех элементов пространства R вида y-j-z, где у—элемент подпространства Lit az—элемент подпространства L2, образует подпространство пространства 7?*), называемое сум- мой подпространств и Ь2. Пример. Пусть R—линейное пространство всех свободных векторов (в трехмерном пространстве), — подпространство всех свободных векторов, параллельных плоскости Оху, L2— подпро- странство всех свободных векторов, параллельных плоскости Охг. Тогда суммой подпространств Lf и L2 будет являться все про- странство 7?**), а пересечением подпространств Lt и Ь2 будет являться множество всех свободных векторов, параллельных оси Ох. Справедливо следующее утверждение. Теорема 2.9. Сумма размерностей произвольных подпрост- ранств Li и L2 конечномерного линейного пространства R равна сумме размерности пересечения этих подпространств и размер- ности суммы этих подпространств. Доказательство. Обозначим через Lo пересечение L{ и L2, а через L—сумму Lt и L2. Считая Lo fe-мерным, выберем в нем базис е1г е2, .... ек. (2.11) Используя утверждение, доказанное в п. 1, дополним базис (2.11) до базиса e.t, • • •, ek, gi.gt (2.12) в подпространстве Lt и до базиса е1( ..., ек, f i, ..., fa, (2.13) в подпространстве L2. Достаточно доказать, что элементы ffi, .... gt, elt ..., ек, fi.f„ (2.14) являются базисом суммы L подпространств L2 и Ь2 ***). Ддя этого в свою очередь достаточно доказать, что элементы (2.14) линейно независимы и что любой элемент х суммы L представляет собой некоторую линейную комбинацию элементов (2.14). Сначала докажем, что элементы (2.14) линейно независимы. *) См. предыдущую сноску. **) В самом деле, любой вектор х пространства 7? представляет собой линейную комбинацию х = ai + +yk базисных векторов I, J, к параллель- ных осям Ох, £>у и Ог соответственно, причем вектор otf-j-py принадлежит Llt а вектор ук принадлежит Д2. ***) Ибо при этом размерность L, равная в сумме с размер- ностью Lo, равной к, будет равна сумме размерностей k-^-l и к-j-m подпро- странств tj и L2.
60 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Предположим, что некоторая линейная комбинация элемен- тов (2.14) представляет собой нулевой элемент, т. е. справедливо равенство “iffi +•••+“/& + Mi + • • • + М* + fi + • + 4„fm = 0 (2.15) или “iffi + • • • + atgi + Mi + • • • + = — 71 л — • • — Vm A • (2.16) Так как левая часть (2.16) является элементом Llt а правая часть (2.16) является элементом Z,2, то как левая, так и правая часть (2.16) принадлежит пересечению £0 подпространств Lt и L2. Отсюда следует, в частности, что правая часть (2.16) представ- ляет собой некоторую линейную комбинацию элементов (2.11), т. е. найдутся такие числа Хх, ..., что — Vi fi— • • • — 4mfm = + .. • + /-kek. (2.17) В силу линейной независимости базисных элементов (2.13) равен- ство (2.17) возможно лишь в случае, когда все коэффициенты 71, 7m > ^i> •••> равны нулю. Но при этом из (2.15) мы получим, что aigi+ ••• +afgi + Mi+; - +М*==0- (218) В силу линейной независимости базисных векторов (2.12) равен- ство (2.18) возможно лишь в случае, когда все коэффициенты ах, .... ар 0j, .. •, равны нулю. Тем самым мы установили, что равенство (2.15) возможно лишь в случае, когда все коэф- фициенты ах, ..., v,t, Pj, ..., Pft, 7V ..., ym равны нулю, а это и доказывает линейную независимость элементов (2.14). Остается доказать, что любой элемент х суммы L представ- ляет собой некоторую линейную комбинацию элементов (2.14), но это сразу следует из того, что этот элемент х представляет собой (по определению L) сумму некоторого элемента подпро- странства Lj, являющегося линейной комбинацией элементов (2.12), и некоторого элемента х2 подпространства Z,2, являюще- гося линейной комбинацией элементов (2.13). Теорема доказана. Возвращаясь к примеру, рассмотренному перед формулиров- кой теоремы 2.9, заметим, что в этом примере размерность каждого из подпространств и L2 равна двум, размерность их суммы равна трем, а размерность их пересечения равна единице. 4. Разложение линейного пространства в прямую сумму под- пространств. Пусть и R2— два подпространства линейного n-мерного пространства R. Определение. Будем говорить, что пространство R пред- ставляет собой прямую сумму подпространств Rtu R2, если
§31! ПОДПРОСТРАНСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ 61 каждый элемент х пространства R может быть единствен- ным способом представлен в виде суммы x = Xi + x2 (2.19) элемента xL подпространства Rt и элемента х2 подпростран- ства R2. Тот факт, что R представляет собой прямую сумму Rt и Ra символически записывают так: Последнее равенство обычно называют разложением про- странства R в прямую сумму подпространств Rt и R2. Так пространство R всех, свободных векторов (в трехмерном пространстве) можно разложить в прямую сумму подпространства Rt всех векторов, параллельных плоскости Оху и подпростран- ства R2 всех векторов, параллельных оси Oz. Теорема 2.10. Для того чтобы п-мерное пространство R пред- ставляло собой прямую сумму подпространств R^ и R2, доста- точно, чтобы пересечение Rt и R2 содержало только нулевой эле- мент и чтобы размерность R была равна сумме размерностей подпространств Rt и R2. Доказательство. Выберем некоторый базис eit .... ek в подпространстве Rt и некоторый базис glt . gt в подпрост- ранстве R2. Докажем, что объединение этих базисов в!.....ek, g,.....gt (2.20) представляет собой базис всего пространства R. Так как по усло- вию теоремы размерность всего пространства R равна сумме A-J-/ размерностей Rt и R2, то достаточно (в силу теоремы 2.5) дока- зать линейную независимость элементов (2.20). Предположим, что некоторая линейная комбинация элементов (2.20) представляет собой нулевой элемент, т. е. справедливо равенство +afteft4-₽1g14-...+₽lgrt=0, (2.21) или + • • • +<МА = — ... —pzg-z. (2.22) Так как левая часть (2.25) является элементом Rit а правая — элементом R2, а пересечение Rx и R2 содержит лишь нулевой элемент, то как левая, так и правая часть (2.25) представляет собой нулевой элемент, а это (на основании линейной независи- мости элементов каждого из базисов ..., ek и glt ..., gt) возможно лишь при условии ai= ... =aft = 0, ... —pz =0. (2.23)
62 ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2 Тем самым мы установили, что равенство (2.21) возможно лишь при условии (2.23), а это и доказывает линейную независимость элементов (2.20) и тот факт, что элементы (2.20) образуют базис всего пространства /?. Пусть теперь х—любой элемент 7?. Разложив его по базису (2.20), будем иметь х = \е1+ • • - + ^-kek + HiST + • • • + 1Ч£) или х = х± + х2, где = Х1е1 + • • • + '/-kek—элемент Rb а х2 = + • • • +pzg7~элемент /?2. Остается доказать, что представление (2.19) является единст- венным. Предположим, что, кроме (2.19), справедливо и еще одно представление X — Xi~\~Xi, (2,24) где xi—элемент Rit a xi—элемент R2. Вычитая (2.24) из (2.19), получим, что 0 = хх—xi + x2—xi, или Xi—xi — х2— xi. Так как в левой части последнего равенства стоит элемент Rit а в правой—элемент R2, и поскольку пересечение Rt и R2 содержит лишь нулевой элемент, то * из этого равенства следует, что Xi—xi = 0, х'2—лг2 = 0, т. е. = x2 — xi- Теорема доказана. Замечание. В случае, когда пространство R представляет собой не прямую, а обычную сумму подпространств Rt и R2, представление (2.19) любого элемента х пространства R также справедливо, но не является, вообще говоря, единственным. Пусть, например, R представляет.собой трехмерное простран- ство всех свободных векторов, Rt—подпространство всех век- торов, параллельных плоскости Оху, a R2—подпространство всех векторов, параллельных плоскости Охг. В предыдущем пункте мы выяснили, что R представляет собой сумму (но, конечно, не прямую сумму) подпространств Rt и R2. Обозначим через I, J, k базисные векторы, параллельные осям Ох, Оу и Ог соответственно, и разложим произвольный элемент х простран- ства R по базису i, j, k. Найдутся вещественные числа а, 0 и у такие, что x = aZ + 0j+’yfe, так что, с одной стороны, х= =Xi + x2, где Xi=ai+fij—элемент ajr2=y£—элемент R2, с другой стороны, x = x[ + xi, где x[ = $J—элемент 7?1, а х2= =а« + 07—элемент R2. § 4. Преобразование координат при преобразовании базиса /z-мерного линейного пространства 1. Прямое и обратное преобразование базисов. Пусть eit ег.....еп и ei, ei, е’п—два произвольных базиса п-мер- ного линейного пространства R. Как всякий элемент простран- ства R, каждый элемент ei, ei, ..., е’п может быть разложен по базису eit е2, ..., еп. Предположим, что элементы ei, ei, . .,е'п
ПРЕОБРАЗОВАНИЕ БАЗИСА ЛИНЕЙНОГО ПРОСТРАНСТВА 63 выражаются через ег, е2, ..., еп с помощью формул 4- . ~Ь 'I ®2 = ^21^1 ~Ь ®22^2 Н~ • • • I (2 25) = Пл jCf * **)Ь <Т„2®2 “Ь • • • “Ь^лп^п" J Это означает, что переход от первого базиса eit е2, ..., еп ко второму базису е[, е2, е'п> задается матрицей аа аи • • • а1п Д = Л21 Й22 • • • Й2Л ' (2.26) «„1 ап2 • • • ®пв Подчеркнем, что определитель А матрицы (2.26) заведомо отличен от нуля*), ибо в противном случае в силу теоремы 1.7 строки этой матрицы (а стало быть, и базисные элементы ei, е2, ..е'п) оказались бы линейно зависимыми. Убедимся в том, что обратный переход от второго базиса е[, е2, е'п к первому базису е2, е2, ..., еп, осуществляется с помощью матрицы В, обратной к матрице А. Напомним, что матрица В, обратная к матрице А, введена в п, 7 § 2 гл. 1 и имеет вид ^11 ^21 ^Л1 д д д Ац А22 Ani д д •“ д (2.27) •^1 л А2а А„„ Д Д •“ д где через А обозначен определитель матрицы 4, а через Aik — алгебраическое дополнение элемента aik этого определителя. Умножим уравнения (2.25) соответственно на алгебраические дополнения Д^, A2j-, ..., Anj элементов /-го столбца определи- теля А и после этого сложим эти уравнения. В результате полу- чим (для любого номера /, равного 1,2.........п) п ^1АуА-е2А2/-\-... +е^4пу = 2 Ъ(ацАу + аггАг/+ • • +ani^n/)‘ i=l Учитывая, что сумма произведений элементов i-ro столбца на соответствующие алгебраические дополнения элементов /-го столб- ца равна нулю при i^=/ и равна определителю А при *) Такую матрицу в п. 7 § 2 гл. 1 мы договорились называть невы- р ажд енной. **) См. свойство 4° из п. 4 § 2 гл. 1.
ЛИНЕЙНЫЕ ПРОСТРАНСТВА 1ГЛ. 2 получим из последнего равенства • • • +еи^л/ = в/А, откуда ^41/ > 2 / • ^4 п j ej = -Te^ + ~e2+ ...+-£-е'п (/ = 1, 2, .... п) или подробнее «1 = + • • • +4^ е'п' е2 = ^-е[ + ^-е;+...+^е', > ( еп-^е'+^е2+...+^е;г. , Формулы (2.28) и устанавливают, что обратный переход от базиса el, е2, ..е„ к базису elt е2, ..., е„ осуществляется с помощью матрицы (2.27), обратной к матрице А. Эту обратную к А мат- рицу мы кратко будем обозначать символом Л-1. 2. Связь между преобразованием базисов и преобразованием соответствующих координат. Пусть, каки выше, базис elr е2)... , еп преобразуется в базис е’г, е2..е'п с помощью невы- рожденной матрицы (2.26), так что обратное преобразование базисов задается матрицей (2.27). Пусть далее х—произволь- ный элемент рассматриваемого линейного пространства 7?, (%i, х2, хп)—его координаты относительно первого базиса «1, е2, ..., еп, (х[, х2, ..., х'п)—его координаты относительно второго базиса е[, е2, .... е'п, так что х — x^iх2б2~I- • • • И"х2б2 Н- • • • ^п^п* Подставив в это равенство вместо элементов е,, е2, ..., е„ их выражения, определяемые формулами (2.28), получим x=xje;4-x^+ ... +х'пе’п=х1 + ( е;) + + х2 (^е[ + ^-е2 + ... +^- е'п} + Из последнего равенства (в силу единственности разложения по базису е'2, е2, ..., е'п) сразу же вытекают формулы перехо- да от координат (xt, х2....х„) относительно первого базиса к
§ 4] ПРЕОБРАЗОВАНИЕ БАЗИСА ЛИНЕЙНОГО ПРОСТРАНСТВА 65 координатам (х[, х’2, ..., х'п) относительно второго базиса: Ли Д Л21 д Л12 д Л23 Ха + . . . х2 + . • • 1 д -Ляп Д Х„, Хп, > (2.29) д Хл п! д Лла д х2 4-... - | Ann г д Хп- Формулы (2.29) показывают, что переход от координат (хг, х2, хп) к координатам (х'1г х'2, х'п) осуществляется с по- мощью матрицы Л12 ^1п Л д Л2а Агп Д д , Л21 д АП1 Алп I Д Д “• Д транспонированной к обратной матрице (2.27). Мы приходим к следующему выводу: если переход от первого базиса ко второму осуществляется с помощью невырожденной матрицы А, то переход от координат произвольного элемента относительно первого базиса к координатам этого элемента относительно второго базиса осуществляется с помощью мат- рицы (Л'1)', транспонированной к обратной матрице Д-1.
ГЛАВА 3 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Из элементарного курса и из курса аналитической геометрии читатель знаком с системой двух линейных уравнений с двумя неизвестными и с системами двух и трех линейных уравнений с тремя неизвестными*). Целью настоящей главы является изучение системы произвольного числа т линейных уравнений с произвольным числом п неизвестных. Мы сначала установим необходимое и достаточное условие существования хотя бы одного решения (или, как говорят, сов- местности) такой системы, а затем займемся отысканием всей совокупности ее решений. В § 4 главы 4 будет рассмотрен важный для приложений случай приближенного задания всех коэффициентов системы и ее свободных членов. Для этого случая будет изложен метод регуляризации А. Н. Тихонова, позволяющий найти так называемое нормальное (т. е. наиболее близкое к началу координат) решение указанной системы с точностью, соответст- вующей точности задания коэффициентов и свободных членов. В главе 6 будет дано представление о численных (итерацион- ных) методах решения систем линейных уравнений. § 1. Условие совместности линейной системы 1. Понятие системы линейных уравнений и ее решения. В общем случае система т линейных уравнений с п неизвестными (или кратко линейная система) имеет следующий вид: ^'12^'2 Н- • • • Н” @inXn 'bit 'j а21Х1 “I" ^22^2 ‘ • "I- a2nXn = ^2» I (3 |) amix1 + am2x2+ ...+amnxn = bm. I ') См. выпуск «Аналитическая геометрия», дополнение к главе 1.
§ 1] УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 67 При этом через Xj, х2.хп обозначены неизвестные, подлежащие определению (число их п не предполагается обязательно равным числу уравнений т); величины alit ai2, атп, называемые коэффициентами системы, и величины bit b2, ...,Ьт, называемые свободными членами, предполагаются извест- ными. Каждый коэффициент системы aif имеет два индекса, пер- вый из которых i указывает номер уравнения, а второй j — номер неизвестного, при котором стоит этот коэффициент. Система (3.1) называется однородной, если все ее свобод- ные члены bit b2, ...,Ьт равны нулю. Если хотя бы один из свободных членов bit b2, ..Ьт отли- чен от нуля, то система (3.1) называется неоднородной. Система (3.1) называется квадратной, если число т составляющих ее уравнений равно числу неизвестных п. Решением системы (3.1) называется такая совокупность п чисел Cj, с2, ..., сп, которая при подстановке в систему (3.1) на место неизвестных хп х2, ..., хп обращает все уравнения этой системы в тождества. Не всякая система вида (3.1) имеет решения. Так, система линейных уравнений Xf+xa = 1, Xi + x2 =2 заведомо не имеет ни одного решения (ибо если бы существовало решение этой системы, то при подстановке этого решения в левых частях обоих уравнений стояли бы одинаковые числа, и мы получили бы, что 1=2). Система уравнений вида (3.1) называется совместной, если она имеет хотя бы одно решение, и несовместной, если у нее не существует ни одного решения. Совместная система вида (3.1) может иметь или одно реше- ние, или несколько решений. Два решения совместной системы вида (3.1) с!1’, с2 \ ...,Сп> и с£2>, с(2У, ..., Сп2) называются различными, если нарушается хотя бы одно из равенств с?’ = с12’, с£п=с22>, ..., Совместная система вида (3.1) называется оп ре де лен ной, если она имеет единственное решение. Совместная система вида (3.1) называется неопределен- ной, если у нее существуют по крайней мере два различных решения. Весьма удобно записывать линейную систему (3.1) в матричной форме. Для этого используем введенное в п. 2 § 1 гл. 1 понятие произведения двух матриц (таких, что число столбцов первой из этих матриц равно числу строк второй из матриц). В качестве
68 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 перемножаемых матриц возьмем две матрицы: матрицу ап “1» • • • Gin д_ а21 ^22 (3-2) ^/п-2 -••• ^тп содержащую т строк и п столбцов и составленную из коэффи- циентов при неизвестных (такую матрицу мы в дальнейшем будем называть основной матрицей системы (3.1)) и матрицу X, содержащую п строк и 1 столбец, т. е. один столбец вида Х1 х2 (3.3) х. Согласно правилу перемножения двух матриц *) произведение АХ матрицы (3.2) на матрицу (3.3) представляет собой матрицу, содержащую т строк и 1 столбец, т. е. один столбец следующего вида: + • • • ~hainxn aalx14~Q22*2+ • • +a2nxn «хпЛ 4“ ^л12^а “Ь •»• "Ь &тпхп (3.4) Система равенств (3.1) означает, что этот столбец (3.4) совпадает со столбцом (3.5) Ь т Таким образом, в матричной записи систему (3.1) можно заменить одним эквивалентным ей матричным уравнением ДХ = В, (3.6) в котором матрицы А, X и В определяются соотношениями (3.2), (3.3) й (3.5). Решение матричного уравнения (3.6) заключается в отысканий такого столбца (3.3), который при заданной матрице (3.2) и заданном столбце правых частей (3.5) обращает уравнение (3.6) в тождество. В этом и в следующем параграфах мы выясним в отношении линейной системы (3.1) следующие три вопроса: 1) способ установления того, является система (3.1) совмест- ной или нет, ) См. п. 2 § 1 гл. 1, формулу (1.4),
> (3.7) § 1] УСЛОВИЕ СОВМЕСТНОСТИ ЛИНЕЙНОЙ СИСТЕМЫ 69 2) способ установления того, является система (3.1) (в случае ее совместности) определенной или нет, 3) способ отыскания единственного решения совместной си- стемы (3.1) (в случае ее определенности) и отыскания всех ее решений (в случае ее неопределенности). 2. Нетривиальная совместность однородной системы. Начнем с рассмотрения однородной линейной системы вида (3.1), т. е. системы «Л + «13*2 + • • • + а1пхп = О, ^21^1 “Ь &22Х2 ”Ь • • • Ч~ ^2п^п = Ят1Х1 Ч~ ат2Х2 Ч- • • • 4“ атпХп ~ О- Сразу же отметим, что эта система всегда совместна, ибо она всегда обладает так называемым тривиальным (или нуле- вым) решением х1 = х2 = ... = х„ = 0*). Возникает вопрос о том, при каких условиях однородная си- стема (3.7) имеет, кроме указанного тривиального решения, еще и другие решения (т. е. является «нетривиально совмест- ной»). Этот вопрос решается довольно просто. Заметим, что сущест- вование нетривиального решения системы (3.7) эквивалентно линейной зависимости столбцов матрицы (3.2) (ибо линейная зависимость столбцов матрицы (3.2) означает, что существуют числа xlt х2, ...,хп, не все равные нулю и такие, что справед- ливы равенства (3.7)). Но в силу теоремы 1.6 о базисном миноре линейная зави- симость столбцов матрицы (3.2) будет иметь место тогда и только тогда, когда не все столбцы этой матрицы являются базисными, т. е. тогда и только тогда, когда порядок г базисного минора матрицы (3.2) меньше числа п ее столбцов. Мы приходим к следующей теореме. Теорема 3.1. Однородная система (3.7) имеет нетривиальные решения тогда и только тогда, когда ранг г матрицы (3.2) меньше числа п ее столбцов. Следствие. Квадратная однородная система**) имеет не- тривиальные решения тогда и только тогда, когда определитель, составленный из коэффициентов при неизвестных, равен нулю. В самом деле, в случае квадратной однородной системы (3.7), т. е. при т = п ранг г матрицы (3.2) будет меньше числа т = п *) Действительно, подставив в систему (3.7) нули на место всех неиз- вестных Xj, х2, .... хп, мы обратим в тождества все уравнения этой системы. **) То есть система (3.7), у которой число уравнений т равно числу неизвестных п.
70 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 тогда и только тогда, когда определитель этой матрицы равен нулю. 3. Условие совместности общей линейной системы. Установим теперь необходимое и достаточное условие совместности общей (вообще говоря, неоднородной) системы вида (3.1). С этой систе- мой связаны две матрицы: матрица А, определяемая соотноше- нием (3.2), которую принято называть основной матрицей системы (3.1) (она составлена из коэффициентов при неизвест- ных), и матрица aii 012 > •>' airfii а21 аМ • • ‘ °2л^2 (3 gj arai Х1т% J • * ^mn^m которую'принято называть расширенной матрицей си- стемы (3.1) (она получается из основной матрицы путем добав- ления к этой матрице столбца (3.5) свободных членов). Справедлива следующая основная теорема. Теорема 3.2 (теорема Кронекера — Капелла). Для того чтобы линейная система (3.1) являлась совместной, необходимо и достаточно, чтобы ранг расширенной матрицы этой системы был равен рангу ее основной матрицы. Доказательство. 1) Необходимость. Пусть система (3.1) совместна, т. е. существуют такие числа с±, са, ..., crt, что справедливы равенства ^ii^i H“^i2^2 4” • • • + а1Псп = bit Я-21Д 4~ ^22^2 4” • • • 4-a2nCn = ^2’ 4- ат2с2 4- . .. атпсп — Ьт. Обозначим через г ранг основной матрицы системы (3.1) и рассмотрим линейную оболочку L г базисных столбцов этой матрицы. В силу теоремы 1.6 о базисном миноре любой столбец основной матрицы принадлежит указанной линейной оболочке L. Иными словами, любой столбец расширенной матрицы (3.8), кроме последнего ее столбца, принадлежит указанной линейной оболочке L. Из равенств (3.9) следует, что и последний столбец расши- ренной матрицы (3.8) принадлежит линейной оболочке L (ибо этот последний столбец в силу равенств (3.9) линейно выражается через все столбцы основной матрицы и поэтому линейно выра- жается через ее базисные столбцы). Таким образом, все столбцы расширенной матрицы (3.8) при- надлежат указанной линейной оболочке L. В п. 2 § 3 гл. 2 мы уже установили, что размерность указанной линейной оболочки L ранга г. Это оццачает, что любые г +1 столбцов расширенной
$ 2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 7] матрицы (3.8) линейно зависимы, т. е. ранг расширенной матрицы (равный максимальному числу линейно независимых столбцов этой матрицы) также равен числу г. Необходимость доказана. 2) Достаточность. Пусть ранги основной и расширенной матриц совпадают. Тогда г базисных столбцов основной матрицы будут являться базисными столбцами и расширенной матрицы (3.8) *). По теореме 1.6 о базисном миноре последний столбец расширенной матрицы (3.8) представляет собой некоторую линей- ную комбинацию указанных г базисных столбцов. Стало быть, последний столбец расширенной матрицы (3.8) представляет собой некоторую линейную комбинацию и всех столбцов основной матрицы (3.2)**), т. е. существуют числа clt с2, ..., сп такие, что справедливы равенства (3.9). Последние равенства означают, что числа Cj, с2, ..., сп представляют собой решение системы (3.1), т. е. эта система является совместной. Теорема полностью до- казана. § 2. Отыскание решений линейной системы Теорема Кронекера — Капелли устанавливает необходимое и достаточное условие совместности линейной системы, но не дает способа нахождения решений этой системы. В этом параграфе мы займемся отысканием решений линейной системы (3.1). Сначала мы рассмотрим простейший случай квад- ратной системы линейных уравнений с отличным от нуля опре- делителем основной матрицы, а затем перейдем к отысканию совокупности всех решений общей линейной системы вида (3.1). 1. Квадратная система линейных уравнений с определителем основной матрицы, отличным от нуля. Пусть дана квадратная система линейных уравнений ^12-^2 "4“'• • • "4” ainxn ^1» 'l a21Xi а22Х2 + • • • + а2пХП = ^2 > l (3 10) ап1Х1 “Ь ап2Х2 + • • • + аппХП = Ьп / с отличным от нуля определителем А основной матрицы aii а12 • ‘ < а1п л= °21, “22 Л2*. . (з.н) ani ап2 • • • апп *) Ибо указанные г базисных столбцов линейно независимы, а большего чем г числа линейно независимых столбцов расширенная матрица не имеет. **) Не изменяя линейной комбинации г базисных столбцов, мы можем добавить к ней все небазисные столбцы с множителями, равными нулю.
72 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 Докажем, что такая система имеет и притом единственное решение, и найдем это решение. Сначала докажем, что система (3.10) может иметь только одно решение (т. е. докажем единственность решения системы (3.10) в предположении его существования). Предположим, что существуют какие-либо п чисел хг,х2,..., х„ такие, что при постановке этих чисел в систему (3.10) все урав- нения этой системы обращаются в тождества (т. е. существует некоторое решение системы (3.10) х2, ..., хп). Тогда, умножая тождества (3.10) соответственно на алгебраические дополне- ния Д1У, A2j, ... , AnJ- элементов /-го столбца определителя Д ма- трицы (3.11) и складывая затем получающиеся при этом тождества, мы получим (для любого номера /, равного 1,2, ..., п) S xi (а1И1/ + а2/^2/+ • • • +ап/^я/) = bjAy + Ь2А2/- А- • • • A-b„Anj. Учитывая, что сумма произведений элементов i-ro столбца на соответствующие алгебраические- дополнения элементов /-го столбца равна нулю при i =# / и равна определителю Д матрицы (3.11) при / = /*), мы получим из последнего равенства Xj-A — ЬгАц + b2A2j -+-...+ bnAnj. (3.12) Обозначим символом Ду(Ь() {или более кратко символом Ду) определитель, получающийся из определителя Д основной матрицы (3.11) заменой его j-го столбца столбцом из свободных членов blt b2, ..Ьп (с сохранением без изменения всех остальных столб- цов Д). Заметим, что в правой части (3.12) стоит именно определи- тель Ду (6,)**), и это равенство принимает вид ХуД = Ду (/=1,2, ..., и). (3.13) Поскольку определитель Д матрицы (3.11) отличен от нуля, равенства (3.13) эквивалентны соотношениям Д / Xj = ± (/ = 1, 2, ..., п). (3.14) Итак, мы доказали, что если решение хи х2, --.,хп системы (3.10) с определителем Д основной матрицы (3.11), отличным от нуля, существует, то это решение однозначно определяется фор- мулами (3.14). Формулы (3.14) называются формулами Крамера. *) См. свойство 4е из п. 4 § 2 гл. 1. **) Чтобы убедиться в этом, достаточно записать разложение определи- теля Ду (Ь,) по элементам /-го столбца.
$ 2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 73 Еще раз подчеркнем, что формулы Крамера пока получены нами в предположении существования решения и доказывают его единственность. Остается доказать существование решения системы (3.10). Для этого в силу теоремы Кронекера—Капелли достаточно доказать, что ранг основной матрицы (3.11) равен рангу расширенной матрицы *) aii а12 • • ain^i yl _ а21 а2а • • • а2п^2 (3 J 5) Oni ап2 • • • ' аппЬп но это очевидно, ибо в силу соотношения Д^О, ранг основной матрицы равен п, а ранг содержащей п строк расширенной ма- трицы (3.15) больше числа п. быть не может и потому равен рангу основной матрицы. Тем самым полностью доказано, что квадратная система линейных уравнений (3.10) с определителем основной матрицы, отличным от нуля, имеет и притом единственное решение, опре- деляемое формулами Крамера (3.14). Доказанное нами утверждение еще проще устанавливается матричным способом. Для того чтобы сделать это, заменим (как и в п. 1 § 1) систему (3.10) эквивалентным ей матричным урав- нением АХ = В, (3.16) где А—основная матрица системы (3.11), а X и В—столбцы Х1 Хг первый из которых подлежит определению, а второй задан. Так Как определитель Д матрицы А отличен от нуля, то су- ществует обратная матрица А~г (см. п. 7 § 2 гл. 1). Предположим, что существует решение системы (3.10), т. е. существует столбец X, обращающий в тождество матричное уравнение (3.16). Помножая указанное тождество слева на обрат- ную матрицу А~*, будем иметь Д-1(ДХ) = Л~1В. (3.17) Учтем теперь, что в силу сочетательного свойства произведения трех матриц (см. п. 2 § 1 гл. 1) и в силу соотношения А~1А = Е, *) Существует и другой способ доказательства существования решения системы (3.10), заключающийся в проверке того, что числа ж,, xit ..., хп, определяемые формулами Крамера (3.14), обращают в тождества все урав- нения системы (3.10).
74 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 где Е—единичная матрица (см. п. 7 § 2 гл. I), Л"1 (АХ) = (Л-Ъ4) X = EX = X, так что мы получим из (3.17) Х = А~1В. (3.18) Развертывая равенство (3.18) и учитывая вид обратной матрицы *), мы и получим для элементов столбца X формулы Крамера. Итак, мы доказали, что если решение матричного уравнения (3.16) существует, то оно однозначно определяется соотношением (3.18), эквивалентным формулам Крамера. Легко проверить, что столбец X, определяемый соотношением (3.18), в самом деле является решением матричного уравнения (3.16), т. е. при подстановке в это уравнение обращает его в тождество. В самом деле, если столбец X определяется равен- ством (3.18), то ЛХ = Л(Л-1В) = (ЛЛ~1)В = £В = В. Итак, если определитель А матрицы А отличен от нуля (т. е. если эта матрица является невырожденной), то существует и притом единственное решение матричного уравнения (3.16), опре- деляемое соотношением (3.18), эквивалентным формулам Крамера. Пример. Найдем решение квадратной системы линейных уравнений х4 2х2 -f- Зх3 -4- 4х4 = 30, \ —х4 + 2х2— Зх3 + 4х4 = 10, I Х2 Хд + Х4 3, | Xj + я2+ х3 + х4 + 10 J с отличным от нуля определителем основной матрицы 12 3 4 1 2 —3 4 0 1—11 11 11 Поскольку 30 2 10 2 3 1 10 1 1 2 —1 2 0 1 1 1 Д4 = Дз = 30 10 3 10 2 2 1 1 3 —3 — 1 1 3 —3 —1 1 ') См. формулу (1.41) из п. 7 § 2 гл. 1.
ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 75 § 21 то в силу формул Крамера единственное решение рассматривае- мой системы имеет вид х^=1, х2 = 2, х3 = 3, х4~4. Основное значение формул Крамера состоит в том, что они дают явное выражение для решения квадратной системы линей- ных уравнений (с определителем, отличным от нуля) через коэф- фициенты уравнений и свободные члены. Практическое исполь- зование формул Крамерй связано с довольно громоздкими вычис- лениями (для решения системы п уравнений с п неизвестными приходится вычислять (n+ 1)определитель n-го порядка). К этому следует добавить, что если коэффициенты уравнений и свобод- ные члены представляют собой лишь приближенные значения каких-либо измеряемых физических величин или округляются в процессе вычислений, то использование формул Крамера может привести к большим ошибкам и в ряде случаев является неце- лесообразным. В § 4 гл. 4 будет изложен метод регуляризации, принадле- жащий А. Н. Тихонову и позволяющий находить 'решение ли- нейной системы с точностью, соответствующей точности задания матрицы коэффициентов уравнений и столбца свободных членов, а в главе 6 дается представление о так называемых итерацион- ных методах решения линейных систем, позволяющих решать эти системы при помощи последовательных приближений неиз- вестных. В заключении отметим, что в этом пункте мы исключили из рассмотрения случай обращения в руль определителя А основной матрицы системы (3.10) Этот случай будет содержаться в общей теории систем т линейных уравнений с п неизвестными, изла- гаемой в следующем пункте. 2. Отыскание всех решений общей линейной системы. Рас- смотрим теперь общую систему т линейных уравнений с п неиз- вестными (3.1). Предположим, что эта система совместна и что ранг ее основной и расширенной матриц равен числу г. Не огра- ничивая общности, мы можем предположить, что базисный минор основной матрицы (3.2) находится в левом верхнем углу этой матрицы (общий случай сводится к этому случаю посредством перестановки в системе (3.1) уравнений и неизвестных). Тогда первые г строк как основной матрицы (3.2), так и расширенной матрицы (3.8) являются базисными строками этих матриц*), и по теореме 1.6 о базисном миноре каждая из строк расширенной матрицы (3.8), начиная с (г + 1)-й строки, является линейной комбинацией первых г строк этой матрицы. В терминах системы (3.1) это означает, что каждое из урав- нений этой системы, начиная с (г4-1)-го уравнения, является *) Так как ранги основной и расширенной матриц оба равны г, то’базис- ный минор основной матрицы будет одновременно являться базисным минором и расширенной матрицы.
76 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 линейной комбинацией (т. е. следствием) первых г уравнений этой системы (т. е. всякое решение первых г уравнений системы (3.1) обращает в тождества и все последующие уравнения этой системы). Таким образом, достаточно найти все решения лишь первых г уравнений системы (3.1). Рассмотрим первые г уравнений системы (3.1), записав их в виде ailxi ~i~^i2X2 Н- • • • ~halrXr = ai(r + VXr+i • • ainXn> O-21Xl O-22X2 X2rXr ~ ^2 ^2(г+1)-^Г+1 • • • &2nXn’ (3.19) ^nxl । ar2X2 r • • • + &rrxr ar(r + Dxr + i &rnxn' Если, мы придадим неизвестным xr+i, ..., хп совершенно про- извольные значения сг+1, . .., с„, то система (3.19) превратится в квадратную систему г линейных уравнений для г неизвестных хг, х2, ..., хг, причем определителем основной матрицы этой сис- темы является отличный от нуля базисный минор матрицы (3.2). В силу результатов предыдущего пункта эта система (3.19) имеет единственное решение, определяемое формулами Крамера, т. е. для произвольно выбранных сг+1, . .., сп существует единственная совокупность г чисел сг, с2, ..., сг, обращающих в тождества все уравнения системы (3.19) и определяющихся формулами Крамера. Чтобы записать это единственное решение, договоримся обоз- начать символом Mj (dj) определитель, получающийся из базисного минора М матрицы (3.2) заменой его /-го столбца столбцом из чисел dly d2, ..., d;, ...,dr (с сохранением без изменения всех остальных столбцов М), Тогда записывая решение системы (3.19) с помощью формул Крамера и пользуясь линейным свойством определителя, мы получим 9 =7Г a<(r+i)Cr+i— • • • —«/А) = = ~М cr+iMj (a.jir+1y)—... cnMj (#,„)] (3.20) 0 = 1, 2, .... г). Формулы (3.20) выражают значения неизвестных Xj — Cj (/=1, 2, ..., г) через коэффициенты при неизвестных, свободные члены и произвольно заданные параметры сг+1, ..., сп. Докажем, что формулы (3.20) содержат любое решение системы (3.1). В самом деле, пусть с2, с2, ..., с®, с“+1, ..., сйп—произволь- ное решение указанной системы. Тогда оно является решением и системы (3.19). Но из системы (3.19) величины с?, с®, ...,с? определяются через величины с?+1, ..., однозначно и именно по формулам Крамера (3.20). Таким образом, при сг+1 = с®+1, ...
§ 21 ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ п (/= 1, 2; . . ., п), (3.21) ..., с„ = с,® формулы (3.20) дают нам как раз рассматриваемое решение с?, ..., с®, с?+1, ..., с%. Замечание. Если ранг г основной и расширенной матриц системы (3.1) равен числу неизвестных п, то в этом случае соотношения (3.20) переходят в формулы М7(6,) ci ~ А1 определяющие единственное решение системы (3.1). Таким образом, система (3.1) имеет единственное решение (т. е. яв- ляется определенной) при условии, что ранг г основной и расши- ренной ее матриц равен числу неизвестных п (и меньше числа уравнений т или равен ему). Пример. Найдем все решения линейной системы Х4 х2 -|- х3 х4 = 4, х4 4- х2 4~ 2х3 4~ Зх4 = 8, 2х4 4- 4х2 + 5х3 4- 10х4 — 20, 2xj — 4х2 + х3 — 6х4 = 4-. Нетрудно убедиться в том, что ранг как основной, так и расши- ренной матрицы этой системы равен двум (т. е. эта система совместна), причем можно считать, что базисный минор М. стоит в левом верхнем углу основной матрицы 1 —1 1 1 = 2. М = (3.23) Но тогда, отбрасывая два последних уравнения и задавая произ- вольно с3 -и с4, мы получим систему х4—х2 = 4—с3 + с4, 1 Xj + x2 = 8—2с3— Зс4, J из которой в силу формул Крамера получаем значения х4 с4 — 6 g-c8 -С4, х2 = с2 = 2 2г4. (3.22) Таким образом, четыре числаг ^4г 2 с3 2с4, с3, с, при произвольно заданных значениях с3 и с4 образуют решение системы (3.21), причем строка (3.23) содержит все решения этой системы. 3. Свойства совокупности решений однородной системы. Рас- смотрим теперь однородную систему т линейных уравнений с п неизвестными (3.7), предполагая, как и выше, что матрица (3.2)
78 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 \ имеет ранг, равный г, и что базисный минор М расположен в левом верхнем углу этой матрицы. Поскольку на этот раз все 6,- равны нулю, вместо формул (3.20) мы получим следующие формулы: <7 = — + +с„Му(й(.„)] (j = l, 2....г), (3-24) выражающие значения неизвестных Xj — Cj (/ — 1,2, ..., г) через коэффициенты при неизвестных и произвольно заданные значения cr+i, . ..,сп. В силу доказанного в предыдущем пункте формулы (3.24) содержат любое решение однородной системы- (3.7). Убедимся теперь в том, что совокупность всех решений одно- родной системы (3.7) образует линейное пространство. Пусть Xt = (xl1’, ..., х#’) и Хг — (х[3), ..., xj?)—два произволь- ных решения однородной системы (3.7), а А— любое веществен- ное число. В силу того, что каждое решение однородной системы (3.7) является элементом линейного пространства Ап всех упоря- доченных совокупностей п чисел, достаточно доказать, что каж- дая из двух совокупностей Xi + Х2 = (х<» + х12>, ..., х«’ +х‘„2>) и АХ, = (Ах?», .... Ах'») также является решением однородной системы (3.7). Рассмотрим любое уравнение системы (3.7), например i-e урав- нение, и подставим в это уравнение на место неизвестных эле- менты указанных совокупностей.-Учитывая, что Х\ и Ха — реше- ния однородной системы, будем иметь п п п 2 а,7 № + Х'П = 2 ai/xF + 2 аих? = °. S a.j [И1’] = х .2 аих? = °. 7=1 7=1 а это и означает, что совокупности Xi + X2 и АХх являются решениями однородной системы (3.7). Итак, совокупность всех решений однородной системы (3.7) образует линейное пространство, которое мы обозначим симво- лом R. * Найдем размерность этого пространства R и построим в нем базис. Докажем, что в предположении о том, что ранг матрицы однородной системы (3.7) равен г, линейное пространство R всех решений однородной системы (3.7) изоморфно линейному прост- ранству Ап~г всех упорядоченных совокупностей (п—г) чисел*). ') Пространство Ат введено в примере 3 п. 1 § 1 гл. 2
§ 2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 79 Поставим в соответствие каждому решению (ct, .. .,сг, сг+1,... ..., с„) однородной системы (3.7) элемент (cr+i, ..сп) простран- ства Ап~г. Поскольку числа ., сп могут быть выбраны про- извольно и при каждом выборе с помощью формул (3.24) одно- значно определяют решение системы (3.7), то установленное нами соответствие является взаимно однозначным. Далее заметим, что если элементы (с^Д, ..., с“’) и (с£’ь ... ..., с^’) пространства Ап~г отвечают элементам (ср’, ..., с)1', .......с“>) и (с(2), .... с121, ..., с1пу) пространства R, то из формул (3.24) сразу же следует, что элементу (4+1 + 4+п • • • ..., с^’ + с^) отвечает элемент (с(1) + с!2’, 4+1+ + 4+к •••< ^1)4-Сп)), а элементу (M+i..М?') при любом вещественном X отвечает элемент (Хс!1*, ..., XcJ.1’, Хс'/Д, .... Хе*,1’). Тем самым доказано, что установленное нами соответствие яв- ляется изоморфизмом. Итак, линейное пространство R всех решений однородной системы (3.7) с п неизвестными и рангом основной матрицы, рав- ным г, изоморфно пространству Ап~г, и, стало быть, имеет размерность п — г. Любая совокупность из (п — г) линейно независимых решений однородной системы (3.7) образует (в силу теоремы 2.5) базис в пространстве R всех решений и называется фундаменталь- ной совокупностью решений однородной системы (3.7). Для построения фундаментальной совокупности- решений можно отправляться от любого базиса пространства Ап~г. Отве- чающая этому базису совокупность решений системы (3.7) в силу изоморфизма будет линейно независимой и поэтому будет являться фундаментальной совокупностью решений. Особо выделяют фундаментальную совокупность решений си- стемы (3.7), отвечающую простейшему базису ех = (1, 0, 0.0), е2 — (0, 1,0..0), ... еп_г = (0, 0, 0, . 1) пространства Ап~г и называемую нормальной фундаментальной сово- купностью решений однородной системы (3.7). При сделанных выше предположениях о ранге и расположе- нии базисного минора, в силу формул (3.24), нормальная фунда- ментальная совокупность решений однородной системы (3.7) имеет вид: М __ АД (а< (Г+ 2)) м М г (а; (Г+ i>) in М , 1, и, . . ., , АД (й/(Г+2)) Q | Q\ М ’ ’ * • • • ’ I ’ (3.25)
80 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 По определению базиса любое решение X однородной системы (3.7) представимо в виде X=C1X1 + C2Xi+... + Cn_rX„-r, (3.26) где Сг,С2, ...,Сп-г—некоторые постоянные. Поскольку в фор- муле (3.26) содержится любое решение однородной системы (3.7), то эта формула дает общее решение рассматриваемой одно- родной системы. Пример. Рассмотрим однородную систему уравнений х4 — хг + х3 — Х4 = 0, ) х4 “I- х2 2х3 Зх4 = 0,. I 2Xj +.4х2 + 5х3 + 10х4 =0, Г (3.27) 2xj — 4х2+ х3— 6х4 = 0, I соответствующую неоднородной системе (3.21), разобранной в примере в конце предыдущего пункта. Там мы выяснили, что ранг г матрицы этой системы равен двум, и взяли в качестве базисного минор, стоящий в левом верхнем углу указанной матрицы. Повторяя рассуждения, проведенные в конце предыдущего пункта, мы получим вместо формул (3.22) соотношения 3 1 о Щ 2 ^3 ^4» ^2 2 ~С4, справедливые при произвольно выбранных с3 и с4.-С помощью этих соотношений (полагая сначала с3 —1, с4=0, а затем с3=0, с4 = 1) мы получим нормальную фундаментальную совокупность двух решений системы (3.27): 1, °), Х2 = (—1, —2, 0, 1). Общее решение однородной системы (3.27) имеет вид Х=С^-^, —1, 1, О) +С2(-1, —2, 0, 1), (3.28) где Q и С2 — произвольные постоянные., В заключение этого пункта установим связь между реше- ниями неоднородной линейной системы (3.1) и соответствующей ей однородной системы (3.7)*). Докажем следующие д в а ут- верждения. Г. Сумма любого решения неоднородной системы (3.1) с любым решением соответствующей однородной системы (3.7) представ- ляет собой решение системы (3.1). *) С теми же самыми коэффициентами при неизвестных.
§ 21 ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 81 В самом деле, если с,, ...,сп — решение системы (3.1), а dit ...,dn—решение соответствующей ей однородной системы (3.7), то, подставив в любое (например, в i-e) уравнение системы (3.1) на место неизвестных числа q + dj, ..ca-\-dn, получим п п п 2 а(7 (С/ + dj) = 2 a.jCj + 2 А = bi + ° = bi> /=1 /=1 /=1 что и требовалось доказать. 2°. Разность двух произвольных решений неоднородной системы (3.1) является решением соответствующей однородной систе- мы (3.7). В самом деле, если с[, ..., с’п и с[.сп—два произвольных решения системы (3.1), то, подставив в любое (например, в i-e) уравнение системы (3.7) на место неизвестных числа с[—с21... С'п—с"п, получим 2 «.• j (c'l—c^ = 2 aijC'i— 2 aifCj = bt—bt =0, 7 = 1 7=1 /=1 что и требовалось доказать. Из доказанных утверждений вытекает, что, найдя одно реше- ние неоднородной системы (3.1) и складывая его с каждым реше- нием соответствующей однородной системы (3.7), мы получим все решения неоднородной системы (3.1). Другими словами, сумма частного решения неоднородной системы (3.1) и общего решения соответствующей однородной системы (3.7) дает общее решение неоднородной системы (3.1). В качестве частного решения неоднородной системы (3.1) естественно взять то его решение *) X» •••’ °’ °’ •••’ °)’ (3,29) которое получится, если в формулах (3.20) положить равными нулю все числа сг+1, ...,сп. Складывая это частное решение с общим решением (3.26) соответствующей однородной системы, мы получим следующее выражение для общего решения неод- нородной системы (3.1): х = х0+c.Xi+с2х2 +... + Сп_гХп_г. (3.30) В этом выражении Хо обозначает частное решение (3.29), Cit С2, ...,Сп_г—произвольные постоянные, а А\, Х2, ...,Хп_г — элементы нормальной фундаментальной совокупности решений (3.25) соответствующей однородной системы. *) При этом предполагается, как и выше, что ранги основной и расши- ренной матриц системы (3.1) равны г и что базисный минор находится в ле- вом верхнем углу этих матриц.
82 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 3 Так, длй рассмотренной в конце предыдущего пункта неоднородной системы (3.21) частное решение вида (3.29) равно Х0 = (6, 2, 0, 0). Складывая это частное решение с общим ре- шением (3.28) соответствующей однородной системы (3.27), мы получим следующее общее решение неоднородной системы (3.21): Х = (6, 2, 0, 0) + Cf(-|, -у, 1, 0)+С2(-1, —2, 0, 1). (Здесь-Cj и С2 — произвольные постоянные.) 4. Заключительные замечания о решении линейных систем. Развитые в предыдущих пунктах методы решения линейных систем упираются в необходимость вычисления ранга матрицы и нахождения ее базисного минора. После того как базисный минор найден, решение сводится к технике вычисления опреде- лителей и к использованию формул Крамера. Для вычисления ранга матрицы можно использовать следую- щее правило: при вычислении ранга матрицы следует пере- ходить от миноров меньших порядков к минорам больших поряд- ков-, при этом, если уже найден отличный от нуля минор М порядка k, то требуют вычисления лишь миноры порядка (&+1), окаймляющие*) этот минор М; в случае равенства нулю всех окаймляющих миноров порядка (&+1} ранг матрицы равен /г**). Укажем и другое правило вычисления ранга матрицы. Заме- тим, что со строками (столбцами) матрицы можно производить три элементарные операции, не изменяющие ранга этой матрицы: 1) перестановку двух строк (или двух столбцов), 2) умножение строки (или столбца) на любой отличный от нуля множитель, 3) прибавление к одной строке (столбцу) произволь- ной линейной комбинации других строк (столбцов)***). Будем говорить, что матрица 1|а,7||, содержащая т строк и п столбцов, имеет диагональный вид, если равны нулю все ее элементы, отличные от аг1, а22, ..., агг, где r=min{/n, п]. Ранг такой матрицы, очевидно, равен г. Убедимся в том, что посредством трех элементарных опера- ций любую матрицу А = ац ащ ^тп (3.31) *) То есть содержащие внутри себя минор М. **) В самом деле, в указанном случае все строки (столбцы) матрицы принадлежат линейной оболочке ее k строк (столбцов), на пересечении кото- рых стоит минор М, а размерность указанной линейной оболочки равна k. ***) Эти три операции не изменяют ранга матрицы вследствие того, что операции 1) и 2) не изменяют максимального числа линейно независимых строк (столбцов) матрицы, а операция 3) обладает тем свойством, что линей- ная оболочка всех строк (столбцов), имевшихся до проведения этой опера- ции, совпадает с линейной оболочкой, всех строк (столбцов), полученных после проведения этой операции.
§ 2] ОТЫСКАНИЕ РЕШЕНИЙ ЛИНЕЙНОЙ СИСТЕМЫ 83 можно привести к диагональному виду (что и позволяет вычис- лить ее ранг). В самом деле, если все элементы матрицы (3.31) равны нулю, то эта матрица уже приведена к диагональному виду. Если же у матрицы (3.31) есть отличные от нуля элементы, то путем перестановки двух строк и двух столбцов можно добиться того, чтобы был отличен от нуля элемент alt. Умножая после этого первую строку матрицы на afxl, мы превратим элемент в еди- ницу. Вычитая далее из /-го столбца матрицы (при /=2, 3, ..., п) первый столбец, умноженный на а^, а затем вычитая из i-й строки (при i =2, 3, ..., п) первую строку, умноженную на ailt мы получим вместо (3.31) матрицу следующего вида: 1 о ... о О аза • •. Я2п в-тч < < • й-тп О Совершая уже описанные нами операции с матрицей, взятой в рамку, и продолжая действовать аналогичным способом, мы после конечного числа шагов получим матрицу диагонального вида. Изложенные в предыдущих пунктах методы решения линей- ных систем, использующие в конечном итоге аппарат формул Крамера, могут привести к большим погрешностям в случае, когда значения коэффициентов уравнений и свободных членов заданы приближенно или когда производится округление этих значений в процессе вычислений. В первую очередь это отно- сится к случаю, когда матрица, отвечающая основному опреде- лителю (или базисному минору), является плохо обуслов- ленной (т. е. когда «малым» изменениям элементов этой ма- трицы отвечают «большие» изменения элементов обратной матрицы). Естественно, что в этом случае решение линейной системы будет неустойчивым (т. е. «малым» изменениям значений коэффициентов уравнений и свободных членов будут отвечать «большие» изменения решения). Отмеченные обстоя- тельства приводят к необходимости разработки как других (от- личных от формул Крамера) теоретических алгоритмов отыскания решения, так и численных методов решения линейных систем. В § 4 главы 4 мы познакомимся с методом регуляри- зации А. Н. Тихонова отыскания так называемого нормаль- ного (т. е. наиболее близкого к началу координат) решения линейной системы. В главе 6 будут изложены основные сведения о так назы- ваемых итерационных методах решения линейных систем, позволяющих решать эти системы при помощи последователь- ных приближений неизвестных.
ГЛАВА 4 ЕВКЛИДОВЫ ПРОСТРАНСТВА Из курса аналитической геометрии читатель знаком с поня- тием скалярного произведения двух свободных векторов и с че- тырьмя основными свойствами указанного скалярного произве- дения. В настоящей главе изучаются линейные пространства любой природы, для элементов которых каким-либо способом (причем, безразлично каким) определено правило, ставящее в соответствие любым двум элементам число, называемое ска- лярным произведением этих элементов. При этом важно только, чтобы это правило обладало теми же четырьмя свойст- вами, что и правило составления скалярного произведения двух свободных векторов. Линейные пространства, в которых опре- делено указанное правило, называются евклидовыми про- странствами. В настоящей главе выясняются основные свойства произвольных евклидовых пространств. § 1, Вещественное евклидово пространство и его простейшие свойства 1. Определение вещественного евклидова пространства. Вещест- венное линейное пространство R называется вещественным евклидовым пространством (или просто евклидовым про- странством), если выполнены следующие два требования: I. Имеется правило, посредством которого любым двум эле- ментам этого пространства х и у ставится в соответствие вещественное число, называемое скалярным произведением этих элементов и обозначаемое символом {X, у). II. Указанное правило подчинено следующим четырем аксиомам: 1°. (х, у) ~(у, х) (переместительное свойство или симметрия). 2°., (xx4-x2, ^) = (х1, j) + (x2, у) (распределительное свой- ство). 3°. (%х, у) = Х(х, у) для любого вещественного X. 4°. (х, х) > 0, если х—ненулевой элемент', (X, X) = 0, если х — нулевой элемент.
§ I] ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 85 Подчеркнем, что при введении понятия евклидова простран- ства мы абстрагируемся не только от природы изучаемых объек- тов, но и от конкретного вида правил образования суммы эле- ментов, произведения элемента на число и скалярного произве- дения элементов (важно лишь, чтобы эти правила удовлетворяли восьми аксиомам линейного пространства и четырем аксиомам скалярного произведения). Если же природа изучаемых объектов и вид перечисленных правил указаны, то евклидово пространство называется конк- ретным. Приведем примеры конкретных евклидовых пространств. Пример 1. Рассмотрим линейное пространство В3 всех сво- бодных векторов. Скалярное произведение любых двух векторов определим так, как это было сделано в аналитической геометрии (т. е. как произведение длин этих векторов на косинус угла между ними). В курсе аналитической геометрии была1* доказана справедливость для так определенного скалярного произведения аксиом Г — 4°*). Стало быть, пространство В3 с так определен- ным скалярным произведением является евклидовым простран- ством. Пр и мер 2. Рассмотрим бесконечномерное линейное про- странство С [а, 6] всех функций х (t), определенных и непрерывных на сегменте a^.i^.b. Скалярное произведение двух таких функций x(t) и y(t) определим как интеграл (в пределах от а до Ь) от произведения этих функций ъ ^x(t)y(i)di. (4.1) а Элементарно проверяется справедливость для так определенного скалярного произведения аксиом 1°—4°. В самом деле, спра- ведливость аксиомы Г очевидна; справедливость аксиом 2° и 3° вытекает из линейных свойств определенного интеграла; спра- ь ведливость аксиомы 4° вытекает из того, что интеграл J х2 (/) dt а от непрерывной неотрицательной функции х2 (I) неотрицателен и обращается в нуль лишь тогда, когда эта функция тождест- венно равна нулю на сегменте a^i^b**) (т. е. является нулевым элементом рассматриваемого пространства). Таким об- разом, пространство С [а, &] с так определенным скалярным произведением представляет собой бесконечномерное евклидово пространство. *) См. выпуск «Аналитическая геометрия», гл. 2, § 2, и. 3. ”*) См. выпуск «Основы математического анализа», часть 1, свойства 1° и 2° из п. 1 § 6 гл. 10.
86 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Пример 3. Следующий пример евклидова пространства дает n-мерное линейное пространство Ап упорядоченных сово- купностей п вещественных чисел, скалярное произведение двух любых элементов х = (xf, х2, ..., хп) и у = (yit у2, уп) кото- рого определяется равенством (х, у) = хгУ1 + х2у2 + ... + хпуп. (4.2) Справедливость для так определенного скалярного произведения аксиомы 1° очевидна; справедливость аксиом 2° и 3° легко про- веряется (достаточно вспомнить определение операций сложения элементов и умножения их на числа: (Xi, х2, . ... Х„) + (У1, у2, • yu) = (Xi + yi, Х2 + у2, ...,Хп + уп), X (xit х2, х„) = (Хх2, Хх2, . .., Ххя)); наконец, справедливость аксиомы 4° вытекает из того, что (X, х)=х?+х!+- • .-j-Хл всегда является неотрицательным числом и обращается в нуль лишь при условии Xi —х2 = ... =хп = 0. Рассмотренное в этом примере евклидово пространство часто обозначают символом Еп. Пример 4. В том же самом линейном пространстве Ап введем скалярное произведение любых двух элементов х = =(Xi, х2, ..., х„) и у = (у1,уг,---,у„) не соотношением (4.2), а другим более общим способом. Для этого рассмотрим квадратную матрицу порядка п а11 й12 • • а1п Д _ Й21 ^22 * • * ^2П ani ап2 '• >> апп Составим с помощью матрицы (4.3) однородный многочлен вто- рого порядка относительно п переменных х2, ..., хп 2 2 (4.4) i = 1 fe = 1 Забегая вперед, отметим, что такой многочлен называется квадратичной формой (порождаемой матрицей (4.3))*). Квадратичная форма (4.4) называется положительно определенной, если она принимает строго положительные значения для всех значений -переменных х2, х2, .... хп, одновре- менно не равных нулю**). Так как при хг =х2 = ... =хп = 0 квадратичная форма (4.4), очевидно, равна нулю, то можно ска- зать, что положительно определенная квадратичная форма обра- щается в нуль лишь При условии Xi = х2 = . .. =хп ==0. *) Квадратичные формы систематически изучаются в главе 7 этой книги. **) В главе 7 этой книги будет указано необходимое и достаточное усло- вие положительной определенности квадратичной формы.
S л ВЕЩЕСТВЕННОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 87 Потребуем, чтобы матрица (4.3) удовлетворяла двум условиям: 1°. Порождала положительно определенную квадратичную форму (4.4). 2°. Была симметричной (относительно главной диагонали), т. е. удовлетворяла условию aik = aki для всех t = l, 2, ...,п и всех k = 1, 2, ..., п. С помощью матрицы (4.3), удовлетворяющей условиям 1° и 2°, определим скалярное произведение двух любых элементов х = (хъ х2, ..., хв) и j>=(t/i, у2.уп) пространства Ап соот- ношением п п (X, У) = 2 S (4.5) «'=1 fe=l Легко проверить справедливость для так определенного ска- лярного произведения всех аксиом 1° — 4°. В самом деле, акси- омы 2° и 3°, очевидно, справедливы при совершенно произвольной матрице (4.3); справедливость аксиомы Г вытекает из условия симметричности матрицы (4.3), а справедливость аксиомы 4° вытекает из того, что квадратичная форма (4.4), представляющая собой скалярное произведение (х, х), является положительно определенной. Таким образом, пространство Ап со скалярным произведе- нием, определяемым равенством (4.5), при условии симметрич- ности матрицы (4.3) и положительной определенности порожда- емой ею квадратичной формы, является евклидовым пространством. Если в-качестве матрицы (4.3) взять единичную матрицу, то соотношение (4,4) перейдет в (4.2), и мы получим евклидово пространство Еп, рассмотренное в примере 3. 2. Простейшие свойства произвольного евклидова простран- ства. Устанавливаемые в этом пункте свойства справедливы для совершенно произвольного евклидова пространства как конеч- ной, так и бесконечной размерности. Теорема 4.1. Для любых двух элементов х и у произвольного евклидова пространства справедливо неравенство (X, уУ^(Х, х){у, у), (4.6) называемое неравенством Доши — Буняковского. Доказательство. Для любого вещественного числа X, в силу аксиомы 4° скалярного произведения, справедливо не- равенство (Ах— у, Хх—j)>0. В силу аксиом 1°—3° последнее неравенство можно переписать в виде V(x, х)-2А(х, _у) + (Л
88 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Необходимым и достаточным условием неотрицательности по- следнего квадратного трехчлена является неположительность его дискриминанта, т. е. неравенство * *) (х, у)2 — (х, х){у, jOCO. (4.7) Из (4.7) сразу же вытекает неравенство (4.6). Теорема доказана. Наша очередная задача — ввести в произвольном евклидовом пространстве понятие нормы (или д л и н ы) «каждого элемента. Для этого введем понятие линейного нормированного про- странства. Определение. Линейное пространство R называется норми- рованным, если выполнены следующие два требования: I. Имеется правило, посредством которого каждому элементу х пространства R сплавится в соответствие вещественное число, называемое нормой {или длиной) указанного элемента и обо- значаемое символом //х||. II. Указанное правило подчинено следующим трем аксиомам: Г. |[х|] > 0, если х—ненулевой элемент; ||х|| = 0, если х—ну- левой элемент. 2°. ||Ах|| = |Х|||х|| для любого элемента х и любого веществен- ного числа X. : 3°. Для любых двух элементов х и у справедливо следующее неравенство: к+уКИШ (4.8) называемое неравенством треугольника {или не равен- ством Минковского). Теорема 4.2. Всякое евклидово пространство является нор- мированным, если в нем норму любого элемента х определить равенством ||x||=j/IJ~n: (4.9). Доказательство. Достаточно доказать, что для нормы, определенной соотношением (4.9), справедливы аксиомы 1°—3° из определения нормированного пространства. Справедливость для нормы аксиомы Г сразу вытекает из аксиомы 4° скалярного произведения. Справедливость для нормы аксиомы 2° почти непосредственно вытекает из аксиом 1° и 3° скалярного произведения. ’ Остается убедиться в справедливости для нормы аксиомы 3°, т. е. неравенства (4.8). Будем опираться на неравенство Коши — Буняковского (4.6), которое перепишем в виде |(>, у)[<У&Гх) У&Уь (4.7') *) В случае (х, х)==0 квадратный трехчлен вырождается в линейную функцию, но в этом случае элемент х является нулевым, так что (х, _У)=0 и неравенство (4.7)-также справедливо.
$ 1] ВЕЩЕСТВЕННОЙ ЕВКЛИДОВО ПРОСТРАНСТВО 89 С помощью последнего неравенства, аксиом 1°—4° скалярного произведения и определения нормы получим IIX + у II = K(x+j, x+J)=/(x7 х) + 2 (х, >)+(>, у) < (X, х) + 2/(х, х)-У (у, у) + (у, » = - У [у (X, X) + У (у, j)J2 = У(х, х) + У (у, у) = II х II II- Теорема доказана. Следствие. Во всяком евклидовом пространстве с нормой эле- ментов, определяемой соотношением (4.9), для любых двух эле- ментов х и у справедливо неравенство треугольника (4.8). Заметим далее, что в любом вещественном евклидовом пространстве можно ввести понятие угла между двумя произ- вольными элементами х и у этого пространства. В полной ана- логии с векторной алгеброй, мы назовем углом <р между эле- ментами х и у тот (изменяющийся в пределах от 0 до л) угол, косинус которого определяется соотношением (х, v) (х, у) со5ф=ШГ7Ш У(^У Данное нами определение угла корректно, ибо в силу нера- венства Коши — Буняковского (4.7') дробь, стоящая в правой части последнего равенства, по модулю не превосходит единицы. Далее договор имея называть два произвольных элемента х й у евклидова пространства Е ортогональными, если скалярное произведение этих элементов (х, у) равно нулю (в этом случае косинус угла <р между элементами х и у будет равен нулю). Снова апеллируя к векторной алгебре, назовем сумму х+>* двух ортогональных элементов х и у гипотенузой прямоугольного треугольника, построенного на элементах х и у. Заметим, что во всяком евклидовом пространстве справед- лива теорема Пифагора: квадрат гипотенузы равен сумме квадратов катетов. В самом деле, поскольку х и у ортогональны и (х, _у)=0, то в силу аксиом и определения нормы llx+jll2 = (*+j. х+^) = = (х, х) + 2(х, j) + (j, j)=(x, ж) + (л-У) ЧИ1* + № Этот результат обобщается и на п попарно ортогональных элементов х1( хг, ..., х„: если гг = Xj + х2 + -.. + хи, то Ь||2 = (Х1 + ха + . . . +xn, Xi + XaH- . . . + Х„) = = (Xv Хх) + (х2, х2) + ... + (Х„, Х„) = IIХг ||2 4-||х21|2 4- ... + II х„||2. В заключение запишем норму, неравенство Коши — Буняков- ского и неравенство треугольника в каждом из конкретных евклидовых пространств, рассмотренных в предыдущем пункте.
90 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 В евклидовом пространстве всех свободных векторов с обыч- ным определением скалярного произведения норма вектора а совпадает с его длиной |а|, неравенство Коши—Буняковского приводится к виду (а, 6)2^|а|2|6|2 *), а неравенство треуголь- ника—к виду |a + ftK|a| + |&| **). В евклидовом пространстве С [а, Ь] всех непрерывных на сег- менте а t b функций х = х (/) со скалярным произведением (4.1) норма элемента x = x(t) равна /~ь $ х2 (0 dt, а а неравенства Коши —Буняковского и треугольника имеют вид Ь -12 ft ft J х (t) у (t) I J x2 (0 dt J y2 (/) dt, „0 J fl fl ]/" $ [* (0+y <0]a dt< x* (0 dt + ]/" S У2 (0 di- a a a Оба эти неравенства играют важную роль в различных разделах математического анализа. В евклидовом пространстве Еп упорядоченных совокупностей п вещественных чисел со скалярным произведением (4.2) норма любого элемента х~(хъ х2, ..., х„) равна kll=Kx!+xi+... +х2, а неравенства Коши — Буняковского и треугольника имеют вид (x1yi + xiyi+ ... +хпуп)2 < (хЦ-х|+ ... +х2) (^+^+ ... +у2п), Kfa + yj2 + (х2 + У2)2 + • • • + + Z/J2 < _____._____ ^l^Xi + xl-j- . . . Х„ + ]А/1 + yl + . . . +Ул- Наконец, в евклидовом пространстве упорядоченных совокуп- ностей п вещественных чисел со скалярным произведением (4.5) норма любого элемента x=(xit х2, ..., х„) равна***) *) Для скалярного произведения векторов (a, b) = | а 11 &'| cos <р это неравенство тривиально вытекает из того,, что cos2<p<l. **) Если сложить векторы а и Ъ по правилу треугольника, то это нера- венство тривиально сводится к тому, что одна сторона треугольника не пре- восходит суммы двух других его сторон. ♦**) Напоминаем, что при этом матрица (4.3) симметрична и порождает положительно определенную квадратичную форму (4.4).
5 2] ОРТОНОРМИРОВАННЫЙ БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 91 а неравенства Коши —Буняковского и треугольника имеют вид ' n n \2 / n n \ f •n n \ Zj а1кх(Ук ) ( S 2) aikxixk ) ( S 2 а1кУ1Ук ) » .i = 1 A = 1 / \i=lk=l / \i = 1 k = 1 / i = 1 k= i п i= 1 k= 1 2j апйЕУк- 1 = 1k = 4 § 2. Ортонормированный базис конечномерного евклидова пространства В этом параграфе будут изучаться евклидовы пространства конечной размерности п. Распространение изучаемых здесь результатов на бесконечномерные евклидовы пространства выхо- дит за рамки этой книги и является предметом специального изучения. (Такие" пространства изучаются в главах 10 и И вы- пуска «Основы математического анализа, часть 2».) 1. Понятие ортонормированного базиса и его существование. В главе 2 было введено понятие базиса.«-мерного линейного пространства. В линейном пространстве все базисы являлись равноправными, и у нас не было оснований предпочитать один базис другому. В евклидовом пространстве существуют специальные, особо удобные базисы называемые ортонормированными бази- сами. Эти базисы играют ту же роль, что и декартов прямоуголь- ный базис в аналитической геометрии. Перейдем к определению ортонормированного базиса. Определение. Будем говорить, что п элементов eY, е2, ..., еп п-мерного евклидова пространства Е образуют ортонормиро- ванный базис этого пространства, если эти элементы по- парно ортогональны и норма каждого из этих элементов равна единице, т. е. если f 1 при i =k, (е{, = < _ (4.10) ‘ (0 при i =/= k. ' ' Для того чтобы установить корректность сформулированного определения, следует доказать, что входящие в это определение элементы е±, е2, ..., еп образуют один из базисов рассматри- ваемого «-мерного пространства Е, а для этого в силу теоре- мы 2.5 достаточно доказать, что эти элементы eit е2, ..., еп линейно независимы, т. е. что равенство а1в1 + а2е2+ • • • +а„е„ = 0 (4.11) возможно, лишь когда =а2 = . .. = а„ = 0.
92 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Докажем это. Пусть k—любой из номеров 1, 2, п. Умножая равенство (4.11) скалярно на элемент ек и пользуясь аксиомами скалярного произведения и соотношениями (4.10), мы получим, что aft = 0. Докажем теперь следующую основную теорему. Теорема 4.3. Во всяком п-мерном евклидовом пространстве Е существует ортонормированный базис. Доказательство. Согласно определению, размерности в пространстве Е найдется п линейно независимых элементов flt ft.....fn Докажем, что можно построить п элементов ех, е2, ..., еп, линейно выражающихся через fx, f2, ..., fn и образующих ортонормированный базис (т. е. удовлетворяющих соотношениям (4.Ю)). Проведем доказательство возможности построения таких эле- ментов ех, е2, ..., еп методом математической индукции. Если имеется только один элемент /х, то для построения элемента ех с нормой, равной единице, достаточно нормировать элемент/х, т. е. умножить этот элемент на число [K(/i, А)]-1» обратное его норме*). Мы получим при этом элемент ех = = IKUwT)]- 1 fx с нормой, равной единице. Считая, что т — целое число, меньшее п, предположим, что нам удалось построить т элементов ех, е2, .... ет, линейно выражающихся через flt f2, . .., fm попарно ортогональных и имеющих нормы, равные единице. Докажем, что к этим элемен- там ех, е2, ..., ет можно присоединить еще один элемент ест+1, линейно выражающийся через fx, f2, .... fm+x, ортогональный к каждому из элементов е1( е2, ети имеющий норму, рав- ную единице. Убедимся в том, что этот элемент ест+1 имеет вид + 1 + 1 [/и + 1 (fт + 1< {fm + v ~(А+1. еМ (4.12) где am+1—некоторое вещественное число. В самом деле, элемент ет + 1 линейно выражается через /j, f2, ..., fm+1 (в силу того, что он линейно выражается через ех, е2, ..., ет, fm+1, а каждый из элементов ех, е2, ..., ет линейно выражается через fx, f2, ..., fm). Отсюда сразу же следует, что при am+1=^0 элемент ет+1 заве- домо не является нулевым (ибо в противном случае явля- лась бы нулевым элементом некоторая линейная комбинация линейно независимых элементов fx, f2, ..., fmJrX, в которой в силу (4.12) отличен от нуля коэффициент при/от+1). *) Напомним, что среди линейно независимых элементов flt f2, не может быть нулевого элемента, так что норма /х больше нуля.
$ 21 ОРТОНОРМИРОВАННЫЙ БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 93 Далее из того, что элементы elt е2...ет попарно ортого- нальны и имеют нормы, равные единице, и из соотношения {4.12) сразу же вытекает, что скалярное произведение (ет+1, eh) равно нулю для любого номера k, равного 1, 2, .... т. Для завершения индукции остается доказать, что число ат+1 можно выбрать так, что норма элемента (4.12) будет равна еди- нице. Выше уже установлено, что приага+1=^=0 элемент ет+1, а, стало быть, и элемент, заключенный в (4.12) в квадратные скобки, не является нулевым. Стало быть, для того чтобы нормировать элемент, заключен- ный в квадратные скобки, следует взять число аст+1 обратным положительной норме этого заключенного в квадратные скобки элемента. При этом норма ет+1 будет равна единице. Теорема доказана. Доказанная теорема приводит к следующему осуществляемому шаг за шагом алгоритму построения по данной системе п линейно независимых элементов j\, f2, ..., fn системы п попарно ортого- нальных элементов еи е2, ..., еп, норма каждого из которых равна единице: «£ = Л . V(fl. fl) ’ е2 = , где g2 =/2—(/2, et) V(gl, g?) e3= —, где £з=Л— (Л. e2)e2 —(Л, eje,; V (gs. gs) Y (gn. gn) Указанный алгоритм обычно называют процессом орто- гонализа-ции линейно независимых элементов/1(/2, Замечание. Конечно, в каждом n-мерном евклидовом про- странстве Е существует много ортонормированных базисов. Дей- ствительно, если например, строить ортонормированный базис процессом ортогонализации одних и тех же линейно независимых элементов /1( /2, ..., то, начиная процесс ортогонализации с различных элементов fk, мы придем к различным ортонорми- рованным базисам. Ниже, в п. 2 § 7 гл. 7 будет рассмотрен вопрос о том, как связаны между собой различные ортонорми- рованные базисы данного евклидова пространства Е. Примером ортонормированного базиса может служить де- картов прямоугольный базис евклидова пространства всех
94 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 свободных векторов или совокупность п элементов = (1, 0, 0, .... 0), е2=(0, 1,0, ..., 0), е„=(0, 0, 0, 1) евклидова пространства Еп всех упорядоченных совокупностей п вещественных чисел со скалярным произведением (4.2).- 2. Свойства ортонормированного базиса. Пусть eit е2, . . еп — произвольный ортонормированный базис n-мерного евклидова пространства Е, а х иу—два произвольных элемента этого про- странства. Найдем выражение скалярного произведения (х, у) этих элементов через их координаты относительно базиса > • ••> . Обозначим координаты элементов х и у относительно базиса eit е2, ..., е„.соответственно через xit х2, ..., хп и у2, ..., уп, т. е. предположим, что х =х1е1 + х2е2+ ... + х„е„, у=У1е2 + + у2е2+...+упеп. Тогда (х> у) =(х1е1 + х2е2+ ... + х„е„, yiei+y2e2+ ... + «/„е„). Из последнего равенства в силу аксиом скалярного произведения и соотношений (4.10) получим (п п \ п п S Xfii, s укек =22 (е(ек) = 1 = 1 я = 1 / i = 1k=1 = xiZ/i + x21/a+ • • • Итак, окончательно, (X, у) =xryt + х2у2+ ...+хпуп. (4.13) Таким образом, в ортонормированием базисе скалярное произ- ведение двух любых элементов равно сумме произведений соответ- ствующих координат этих элементов. Рассмотрим теперь в n-мерном евклидовом пространстве Е совершенно произвольный (вообще говоря, не ортонормирован- ный) базис f2, ..., fn и найдем выражение скалярного про- изведения двух произвольных элементов х и _у через координаты этих элементов относительно указанного базиса. Обозначим координаты элементов х и у относительно базиса >fn соответственно через хй х2, ..., хп и yit у2, уп, т. е. предположим, что x=x1f1 + x2f2 + ... + xnfn, у =y1fi + y2f2++ Vnfn- Пользуясь аксиомами скалярного произведения, получим (X, y) = {.X1f1-^X2f2 +••.+«/„/„) = (п п\пп ^iXifi, Ё ykfk}=^ 2iXiyk(fi, fk). i = l k = 1 J i = 1 k=1
{fi, Л) = { s 2] ОРТОНОРМИРОВАННЫЙ БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 95 Таким образом, в произвольном базисе fit f2, .. .,fn скалярное произведение двух любых элементов х = х1/1+х2/2 +... -\-x„fn и у = yj\ + y2f2 + ... + ynfn определяется равенством п п (*..У)=5 S (4-14) i = 1 k = 1 в котором матрица J aik [| (г = 1, 2, ..., п; k — 1, 2, имеет элементы aik -(ft, Л)- Последнее утверждение приводит к следующему результату: для того чтобы в данном базисе fl, ft..fn евклидова прост- ранства Е скалярное произведение двух любых элементов было равно сумме произведений соответствующих координат этих эле- ментов, необходимо и достаточно, чтобы базис j\, f2....fn был ортонормированным. В самом деле, выражение (4.14) переходит в (4.13) тогда и только тогда, когда матрица ||а/А|| с элементами а1к = (/ь является единичной, т. е. тогда и только тогда, когда выпол- нены соотношения 1 при i —k, О при устанавливающие ортонормированность базиса flt f2, ..., fn. Вернемся к рассмотрению произвольного ортонормированного базиса ех, е2, ..., е„ n-мерпого евклидова пространства Е. Выяс- ним смысл координат произвольного элемента х относительно указанного базиса. Обозначим координаты элемента х относительно базиса eit е2, •••> вл через Xj, х2, ..., хп, т. е. предположим, что x=x1e1 + x.ie2 + ... +хпеп. (4.15) Обозначим далее через k любой из номеров 1, 2, ..., п и умножим обе части (4.1,5) скалярно на элемент ек. На основании аксиом скалярного произведения и соотношений (4.10) получим (*, ек)=( s Xfii, е*)= S Xi(ei, ек)=хк." Таким образом, координаты произвольного элемента относи- тельно ортонормированного базиса равны скалярным произведе- ниям этого элемента на соответствующие базисные элементы. Поскольку скалярное произведение произвольного элемента х на элемент е, имеющий норму, равную единице, естественно назвать проекцией элемента х на элемент е, то можно сказать, что координаты произвольного элемента относительно ортонормированного базиса равны проекциям этого элемента на соответствующие базисные элементы.
96 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Таким образом, произвольный ортонормированный базис обла- дает свойствами, вполне аналогичными свойствам декартова пря- моугольного базиса. 3. Разложение л-мерного евклидова пространства на прямую сумму подпространства и его ортогонального дополнения. Пусть G—произвольное подпространство n-мерного евклидова прост- ранства Е. Совокупность F всех элементов у пространства Е, ортогональ- ных к каждому элементу х подпространства G, называется ортогональным дополнением подпространства G. Заметим, что ортогональное дополнение F само является под- пространством Е (ибо из ортогональности каждого из элементов и у2 элементу х, очевидно, вытекает, что и любая линейная комбинация элементов уг и у2 ортогональна элементу х). Докажем, что всякое п-мерное евклидово пространство Е представляет собой прямую сумму своего произвольного подпро- странства G и его ортогонального дополнения F. Выберем в G произвольный ортонормированный базис eir е2, . ек. В ейлу доказанного в п. 1 3 гл. 2 этот базис можно дополнить элементами fk+1, ...., fn пространства Е до базиса во всем Е. Произведя процесс ортогонализации элементов ег.....ек, • • , fn> мы получим ортонормиро- ванный базис et, ..., ек, ек+1, ..., е„ всего пространства Е. Разложив произвольный элемент х пространства Е по этому базису, т. е. представив его в виде х = + ... + 4- + xk+iek+i + • • + хпе„, мы получим, что этот элемент х одно- значно представим в виде х = х' + х", где х' = х1е1 + ... + хкек совершенно определенный элемент G, а х” = xk+1ek+i+. • +хпе„ — совершенно определенный элемент ортогонального дополнения F (каждый элемент ek+i, ..., еП ортогонален к любому из элемен- тов elt ..., ек, а потому ортогонален любому элементу G; поэтому и линейная комбинация хк+1ек+1 +... + хпе„ ортогональна к лю- бому элементу G, т. е. является совершенно определенным эле- ментом F). 4. Изоморфизм л-мерных евклидовых пространств. В этом пункте мы покажем, что различные евклидовы пространства одной и той же размерности п в смысле свойств, связанных со введенными в этих пространствах операциями, по существу не отличаются друг от друга. Поскольку в евклидовых пространствах введены лишь опера- ции сложения элементов, умножения элементов на числа и ска- лярного перемножения элементов, то естественно сформулировать следующее определение. Определение. Два евклидовых пространства Е и Е’ назы- ваются изоморфными, если между элементами этих прост- ранств можно установить взаимно однозначное соответствие так,
s 2] ОРТОНОРМИРОВАННЫЙ БАЗИС ЕВКЛИДОВА ПРОСТРАНСТВА 97 что если элементам х и у пространства Е отвечают соответ- ственно элементы х' и у1 пространства Е', то элементу х+у отвечает элемент х'+у', элементу кх (при любом веществен- ном к) отвечает элемент \х' и скалярное произведение (х, у) равно скалярному произведению (х', у'). Таким образом, евклидовы пространства £ и Е’ изоморфны, если они изоморфны как линейные пространства *) и если этот изоморфизм сохраняет величину скалярного произведения соот- ветствующих пар элементов. Теорема 4.4. Все евклидовы пространства одной и той же размерности п изоморфны между собой. Доказательство. Достаточно доказать, что любое п-мер- ное евклидово пространство Е' изоморфно евклидову простран- ству Еп упорядоченных совокупностей п вещественных чисел со скалярным произведением (4.2). Согласно теореме 4.3 в евкли- довом пространстве Е' существует ортонормированный базис e'i, е'2, .... е'п- Каждому элементу х’ = xtei+х2е'2 + •. + хпе„ пространства Е' поставим в соответствие п вещественных чисел Xj, хг, ..., х„, т. е. вполне определенный элемент х = (х1, х2, ... ..., хп) пространства Еп. Установленное соответствие будет взаимно однозначным. Кроме того, из теоремы 2.4 вытекает, что если элементам х’ = = (х1( х2, ..., хп) и у’=(ylt у2, •... уп) пространства £'**) отвечают соответственно элементы х = (хп х2, ..., х„) и у = = (У1> Р2» •••> Уп) пространства £”, то элементу х’ 4-у' отвечает элемент x + jr, а элементу Хх' отвечает элемент Хх. Остается доказать, что для соответствующих пар элементов х’, у' и х, у сохраняется величина скалярного произведения. В силу ортонормированности базиса ej, е2, ;.., е'п и формулы (4.13) (х', у') = х1у1 + х2у2 + . . . +хпуп. С другой стороны, в силу формулы (4.2) определяющей ска- лярное произведение в пространстве £л, (х, y)=x1yi + x2y.2+ ... +хпуя. Теорема доказана. Доказанная теорема позволяет утверждать, что если в каком- нибудь конкретном n-мерном евклидовом пространстве £' дока- зана теорема, сформулированная в терминах операций сложения, умножения на числа и скалярного перемножения элементов^ то эта теорема справедлива и в совершенно произвольном «-мерном евклидовом пространстве Е. *) См. п. 4 § 2 гл. 2. **) Координаты этих элементов берутся относительно базиса ₽i, ез, ..., е’п.
98 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 § 3. Комплексное евклидово пространство 1. Определение комплексного евклидова пространства. В конце п. 1 § 1 гл. 2 мы уже указывали, что если в определении ли- нейного пространства числа X, ц, ... брать не из множества вещественных чисел, а из множества всех комплексных чисел, то мы придем к понятию комплексного линейного пространства. На базе комплексного линейного пространства строится комп- лексное евклидово пространство, играющее фундаментальную роль в теории несамосопряженных линейных преобразований. Для введения комплексного евклидова пространства следует ввести в комплексном линейном пространстве понятие скалярного произведения двух его элементов/подчиненное соответствующим четырем аксиомам. Определение. Комплексное линейное пространство R назы- вается комплексным евклидовым пространством, если выполнены следующие два требования'. I. Имеется правило, посредством которого любым двум эле- ментам х и у этого пространства ставится в соответствие комплексное число, называемое скалярным произведе- нием этих элементов и обозначаемое символом <х, у). II. Указанное правило подчинено следующим четырем аксиомам: 1°- (X, у) = (у, х)*). 2°. (X1 + X2, J)=(X1, у) + (ха, у). 3°. (Хх, у) = Х (х, у). 4°. (х, ,х) представляет собой вещественное неотрицательное число, обращающееся в нуль лишь в случае, когда х—нулевой элемент**). Логическими следствиями аксиом 1°—3° являются следующие два соотношения: (х,Ху)Л(х,у), (х, yi+y2) = (x, Jj + (x, у2). В самом деле, из аксиом 1° и 3° заключаем, что (х, Ху) = (ky, х) = Х(у, х) = Х(х, у), *) Здесь и в дальнейшем символом а обозначается число, комплексно сопряженное с а. **) Аксиома 1° отличается от соответствующей аксиомы 1° вещественного евклидова пространства. Легко убедиться в том, что при переходе к комп- лексному пространству невозможно сохранить без изменения все три аксиомы 1а, З4 и 4а вещественного скалярного произведения^ В самом деле, при на- личии аксиом (х, у) = (у, х) и (Хх, у) = К (х,у), мы получили бы, что (х, Ху)= = (Ху, х) = Х(у, х) = Х(х, у). Но тогда оказалось бы, что (Хх, Хх) = Х2(х, у), и, стало быть, при Х = / мы получили бы, что (ix, ix) =—(х, х), а это про- тиворечило бы аксиоме 4Q о неотрицательности (у, .у) для любого элемента у,
S 3] КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО 99 а из аксиом Г и 2° получим, что (X, +Уг) = (У1+Уг, х) = (yt, X) н- (у2, X) = (X, J,) + (X, у2). Приведем примеры конкретных комплексных евклидовых пространств. Пример 1. Рассмотрим совокупность С*[а, Ь] всех функ- ций 2=z (0, определенных для значений t из сегмента а t «С b и принимающих комплексные значения г(/) =х(/)Н-й/(0 такие, что вещественные функции x(t) и y(f) являются непрерывными на этом сегменте. Операции сложения этих функций и умноже- ния их на комплексные числа заимствуем из анализа. Скалярное произведение двух любых таких функций определим соотношением & (МО, г2(0) = $М0М0^« а Нетрудно убедиться в справедливости для так определенного скалярного произведения всех аксиом 1°—4°, из чего следует, что рассматриваемая совокупность представляет собой комплекс- ное евклидово пространство. Пример 2. Рассмотрим комплексное линейное пространство А", элементами которого служат упорядоченные совокупности п комплексных чисел xit х2, ..., хпс такими же определениями операций сложения элементов и умножения их на числа, как и в случае вещественного линейного пространства Ап. Скалярное произведение двух любых элементов х — — (xf, х2, ..., хп) и у = (yit у2, .... уп) определим соотношением (х, y)=x1yi + x2yss+ . ..+хпуп. (4.16) Справедливость для так определенного скалярного произве- дения аксиом 1°—3° проверяется совершенно элементарно. Спра- ведливость аксиомы 4° вытекает из соотношения (х, х) = x^t + х2х2 + •.. + хпхп = | Xi ]2 +1 х2 |а + ... +1 хп I*. Стало быть, пространство А" со скалярным произведением (4.16) является комплексным евклидовым пространством. Пример 3. В том же самом комплексном линейном прост- ранстве А" можно ввести скалярное произведение не соотноше- нием (4.16), а более общим соотношением *) (х, У) -= S S aikx-yk, (4.17) 1=1 k = 1 в котором Лaik||—произвольная матрица, состоящая из комплекс- ных чисел aik, удовлетворяющих условию aik — aki, такая, что *) (4.17) переходит в (4.16), когда матрица ||а(-*|| является единичной.
100 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 квадратичная форма /= 1«=1 для всех комплексных xlt х2, ...,х„ принимает вещественные неотрицательные значения и обращается в нуль лишь при усло- вии |х1|2 + |х2|2+...+|хя|2 =0. Предоставляем читателю проверку того, что так определенное скалярное произведение удовлетворяет аксиомам Г—4°. 2. Неравенство Коши — Буняковского. Понятие нормы. До- кажем, что для любых двух элементов х и у произвольного ком- плексного евклидова пространства справедливо неравенство Коши — Буняковского*) |(X,J)|2<(X, х)(у, у). (4.18) На основании аксиомы 4° для любого комплексного числа К справедливо неравенство (kx—у, кх—^)>0. (4.19) Так как в силу аксиом 1°—3° и их логических следствий (Хх— у, kx—y) =kk(x, х)—к(х, у)—к (у, х) + (у,у) = = |Х|2(х, х)—X (х, у) —к(х,у)-Ь(у, у), то неравенство (4.19) принимает вид |Х|2(х, х) — к(х,у) — к(х, у) + (у,у)^0. (4.20) Обозначим через (р аргумент комплексного числа (х, у) и представим это число в тригонометрической форме**) (х, j)=](x, у) | (cos <р + i sin <p). (4.21) Положим теперь комплексное число X равным X = /(cos<p — isintp), (4.22) где t — произвольное вещественное число. Из соот- ношений (4.21) . и (4.22) очевидно, что |Х| = |(|, Х(х, _у) = — Х(х, _у) = /|(х, j)|. Поэтому при выбранном нами X неравен- ство (4.20) переходит в неравенство /2(Х, х)-2/1 (х, у) 1 + СУ, j) >0, (4.23) *) Поскольку (х, у) является, вообще говоря, комплексным числом, то нельзя записывать неравенство Коши — Буняковского в виде (4.6). **) Понятия аргумента и тригонометрической формы комплексного числа разбираются, например, в§ 1 гл. 7выпуска «Основыматематического анализа», часть I.
§ 3] КОМПЛЕКСНОЕ ЕВКЛИДОВО ПРОСТРАНСТВО Ю| справедливое при любом вещественном t. Необходимым и доста- точным условием неотрицательности квадратного трехчлена, стоя- щего в левой части (4.23), является: неположительность его дискриминанта, т. е. неравенство |(х, _р)(2— (х, х)(у, у) ^0, эквивалентное неравенству (4.18). С помощью неравенства Коши — Буняковского (4.18) и рас- суждений, полностью аналогичных доказательству теоремы 4.2, устанавливается, что всякое комплексное евклидово пространство является нормированным, если в нем норму любого элемента х определить соотношением IIX || =/(Ж, X). ' (4.24) В частности, во всяком комплексном евклидовом пространстве с. нормой, определяемой соотношением (4.24), справедливо нера- венство треугольника .11*+.У1К1И1+11И Замечание. Подчеркнем, что введенное для веществен- ного евклидова пространства понятие угла <р между двумя про- извольными элементами х и у теряет смысл для комплекс н огю евклидова пространства (вследствие того, что скалярное произ- ведение (х, у) является, вообще говоря, комплексным числом). 3. Ортонормированный базис и его свойства. Элементы х и у произвольного комплексного евклидова пространства будем на- зывать ортогональны ми, если скалярное произведение (х, у) этих элементов равно ну Лю. Ортонормированным базисом «-мерного комплексного евкли- дова пространства назовем совокупность его элементов е1г е2, ... ..., еп, удовлетворяющих соотношениям ( 1 при i —k, (eh е*) = < n . ' (4.25) ' ‘ * (0 при i^k ' (т. е. попарно ортогональных и имеющих нормы, равные единице). Как и в п. 1 § 2, доказывается, что эти элементы линейно независимы и потому образуют базис.. В полной аналогии с доказательством теоремы 4.3 (т. е. с по- мощью процесса ортогонализации) устанавливается существование в произвольном «-мерном комплексном евклидовом пространстве ортонормированного базиса. Выразим скалярное произведение двух произвольных элемен- тов х и у «-мерного комплексного евклидова пространства через их координаты (хп х2, ..., х„) и (уг, у2, ..., уп) относительно ортонормированного базиса elt е2, ..., е„. Так как ж —х1е1 -{~хгв3 4*... -}-х„еп, у = yi&iу^2 4~ • • • + Уп&п*
102. ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 то в силу аксиом 1° — 4° и соотношений (4.25) получим / п п \ п п (X, у) = [ 2 xiet> s укек =22 Х;ук (eif ек) = \;=1 *=1 / i=ifc=i ~ xiUi + Х2#2 + • • • +ХпУп- Выразим далее координаты хг, ...,хп произвольного эле- мента х относительно ортонормированного базиса е2, .,еп. Умножая разложение этого элемента по базису х=х1е1 + + х2е2 + ... +хпеп скалярно на ек и пользуясь соотношениями (4.25), получим (для любого k, равного 1,2, . .., п) (п \ п 2 Wt, ек = 2 xi (ег, ек) = хк. . 1 = 1 / 1=1 Итак, как и в случае вещественного евклидова пространства, координаты произвольного элемента х относительно ортонорми- рованного базиса равны скалярным произведениям этого элемента на соответствующие базисные элементы. В полной аналогии с доказательством теоремы 4.4 устанавли- вается, что 'все комплексные евклидовы пространства одной и той же размерности п изоморфны между собой. § 4. Метод регуляризации для отыскания нормального решения линейной системы Снова возвратимся к рассмотрению общей линейной системы т уравнений с п неизвестными вида (3.1). Эту систему кратко за- пишем в матричной форме *) АХ=В. (4.26) Напомним, что в этой записи символ А обозначает матрицу А = ||а,у|| (1 = 1,2, ..., т; j = 1, 2, ..., п), а символы X и В обозначают столбцы (или векторы) вида первый из которых подлежит определению, а второй—задан. Будем рассматривать случай, когда значения элементов мат- рицы А и столбца свободных членов В заданы нам лишь прибли- женно**). Тогда естественно говорить лишь о приближенных *) См. формулу (3.6) из предыдущей главы. **). Такая ситуация будет иметь место в случае, если эти значения полу- чаются из физических измерений или если в процессе вычислений приходится округлять указанные значения до некоторого знака.
§ 4] МЕТОД РЕГУЛЯРИЗАЦИИ 103 значениях искомого столбца X. Изложенные в предыдущей главе и основанные на формулах Крамера алгоритмы вычисления столбца решений X в этом случае могут приводить к большим погрешно- стям и теряют практический смысл *). В этом параграфе мы изложим принадлежащий А. Н. Тихо- нову алгоритм, позволяющий находить так называемое нор- мальное (т. е. наиболее близкое к началу координат) реше- ние X с точностью, соответствующей точности задания элементов матрицы А и столбца В **). Введем в рассмотрение так называемые сферические нормы столбцов В и X и матрицы А, положив их равными Заметим, что нормы столбцов В и X определяются как обыч- ные нормы векторов—элементов пространств Ет и соответственно Норма матрицы А согласована с нормой n-мерного столбца X в том смысле, что норма m-мерного столбца АХ, равного произ- ведению матрицы А на столбец X, удовлетворяет условию***) || АХ || <||А || ||Х|]. (4.28) Будем считать, что вместо точных значений элементов матрицы A = ||az/|| и столбца правых частей В = ||6|-|| нам заданы прибли- женные значения А = ||а,у||, В = ||bz||. Матрицу А (столбец В) будем называть 6-приближением матрицы А (столбца В), если справедливо неравенство 6 2<6 . (4.29) *) Особенно это относится к случаю так называемых «плохо обуслов- ленных» матриц (для которых «малые» изменения элементов матрицы базисного минора ведут к «большим» изменениям элементов обратной матрицы). **) См. А. Н. Тихонов «О некорректных задачах линейной алгебры и устойчивом методе их решения», Доклады Академии наук СССР, том 163, № 3 (1965), стр. 591—594. ***) В самом деле, пользуясь определением произведения матрицы на стол- бец, соотношениями (4.27) и неравенством Коши — Буняковского для элементов евклидова пространства Еп, будем иметь п 12 т /=1 J 1=1 т мх ii2 = 2 J= 1 [п П ~ 2 J - i=l i=i J tn n п 2 «7-2 *?=1мнх|12‘ ,=i/=i /=1
(04 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 Назовем нормальным решением совместной системы (4.26) то ее решение норма ||Х°Ц которого является наименьшей среди норм || Х|| всех решений X этой системы. Заметим, что у всякой совместной си- стемы (4.26) (в том числе и у неопределенной) существует един- ственное нормальное решение. Введем в рассмотрение следующую функцию п переменных х1г хг, ..., х„ или одного столбца X — Fa(xl....хп, A, B) = F“(X, А, В) = ||ЛХ-В||2+а||Х|р, (4.30) зависящую как от параметров от элементов матрицы Л и столбца В, а также зависящую от некоторого числового параметра а. В по- дробной записи эта функция выглядит так: т F*(X, А,В) = ^ 1=1 п *12 п jSaf7xy—Ь,- +«5 4 L/=i /=1 (4.30') Фактически Fa(X, А, В) является функцией от элементов X евклидова пространства n-мерных столбцов Еп. Такого рода функ- цию, аргументом которой служат элементы некоторого линейного пространства, принято называть функционалом*). Легко убедиться в том, что при любом фиксированном а>0 неотрицательный функционалу .ЗЪ') достигает своего минималь- ного во всем пространстве £") значения в единственной точке Ха=? • • • пространства Еп. •у-СС В самом деле, дважды дифференцируя функцию (4.30'), по- лучим dxk dxt ~ 2 a^il + где = 1 при k = l, 0 при k=£l. ) Функционалы систематически изучаются в следующей главе.
S 41 МЕТОД РЕГУЛЯРИЗАЦИИ 105 Следовательно, второй дифференциал функции F“ имеет вид т п п п п d2Fa — ^ 2 2 аиРн dx^dxj+a ^S^dx^dXj — k=l'l=l ft=l/=! .......... т п......."1а = 2 2<W^] 4-aftS(dXfc)2. Из этого равенства вытекает оценка d!F“>a £ (dxft)\ Й=1 означающая, что функция Fa является строго выпуклой / п вниз. Кроме того, F“—► + оо при ||Х||=т/ 2 xl—»oo. Отсюда Г k=l очевидным образом следует, что Fa имеет и притом единственную точку минимума Ха*). Методы отыскания минимальных значений функционалов вида (4.30) хорошо разработаны**). Докажем следующую фундаментальную теорему, сводящую вопрос о приближенном отыскании нормального решения системы II Л1 (4.26) к отысканию того элемента Х“ = , на котором дости- <»0С 1| ЛП II гает своего минимального значения функционал (4.30). Теорема А. И. Тихонова. Пусть матрица Д и столбец В удовлетворяют условиям, обеспечивающим совместность системы А ‘ (4.26), Х° = —нормальное решение этой системы, А — 8-при- 4 ближение матрицы А, В—8-приближение столбца В, г (8) на (8)— какие-либо возрастающие функции 6, стремящиеся к нулю при 8—» 0 + 0 и такие, что б2 е (6) a (5). Тогда для любого е > 0 найдется положительное число б0 — = б0(е, ||Х0||) такое, что при любом б<б0(е, ||Х°|)) и при лю- бом а, удовлетворяющем условию —^гб2^а ig'a(б), е(о) ' ’ ’ (4.31) *) См., в частности, выпуск 1 «Основыматематического анализа», часть гл. 14, § 7. **) См. там же. I,
106 ЕВКЛИДОВЫ ПРОСТРАНСТВА [ГЛ. 4 элемент Ха — удовлетворяет х* II ... , доставляющий минимум функционалу (4.30), va лп И неравенству II Ха—Х°||<е. (4-32) Доказательство. Рассмотрим в линейном пространстве II и. Ет подмножество {t/д} всех элементов U = ... II представи- —произвольный элемент прост- Х1 мых в виде В=ЛХ, где Х= ... хп ранства Еп. Совершенно очевидно, что подмножество {t/д} пред- ставляет собой линейное пространство и поэтому является подпространством Ет. Обозначим через {Уд} ортогональное до- полнение {t/д} (до всего Ет) и разложим Ет в прямую сумму подпространств {t/д} и {Уд}*). Пусть Вд обозначает проекцию столбца В на подпространство {t/д}, так что В = Вд+(В—Вд), где (В—Вд)—элемент {Уд}. Тогда, поскольку для любого эле- мента X пространства Еп столбец АХ является элементом {Вд}, мы получим следующее разложение: Ах—в=(Ах—Вд) + (Вд—в), в котором элементы (АХ—Вд) и (Вд—В) ортогональны друг другу и принадлежат соответственно {Вд} и {Уд}. Пользуясь теоремой Пифагора (см. п. 2 § 1), мы получим (для любого элемента X пространства В") II АХ —вц® =|| Лх-в-А Г+ 11 в-Вд р. (4.33) Из (4.33) следует, в частности, неравенство \\В-Вд\\^\\АХ-В\\, (4.34) также справедливое для любого элемента X пространства Еп. Из (4.33) и (4.30) мы получим, что для любого X из Еп Fa(X, А, B)=\\B—Bjf + Fa(X, А, Вд), (4.35) т. е. функционалы, стоящие в левой и в правой частях (4.35), имеют общий элемент Ха, доставляющий им минимум. Установим теперь для любого а, удовлетворяющего условиям (4.31), следующее неравенство В“(Х“, Л, Вд) <ае(6) Са + а|]||а, (4.36) ) См. п. 3 § 2 этой главы.
МЕТОД РЕГУЛЯРИЗАЦИИ 107 § 41 в котором через С обозначена величина С = 2 (1+||Х°||), а Х°— нормальное решение системы (4.26). Так как столбец Х“ доставляет минимум функционалу, стоя- щему в правой части (4.35), то Fa(Xa, А, Вл)^Ра(Х0, А, Вд)=^АХ0 — В4||2+а||Х’||2. (4.37) Пользуясь соотношением АХ° = В и неравенством треуголь- ника, получим II АХ°-Ba II < II АХ»- АХ° II + |]В-ВII + И В-Ва [|. В правой части последнего неравенства воспользуемся соотно- шениями (4.28) и (4.29), а также неравенством (4.34), взятым при Х=Х°. Получим || ЛХ» - В а |)< 6 Ц X» |) + 6 +1| В— Л Х»||. (4.38) Еще раз учитывая, что АХй = В, и снова пользуясь нера- венством треугольника и соотношениями (4.28) и (4.29), полу- чим, что II В—ЛХ° II < II В—ВII + II АХ° — ЛХ0 IX б + 6 • || Х° Ц. - (4.39) Из (4.38) и (4.39) следует, что ||ЛХ°-Вл|Х2б(1+||Х“||) = С6, (4.40) где С =2 (1+|| Х° И). Для завершения доказательства оценки (4.36) остается под- ставить (4.40) в (4.37) и воспользоваться неравенством (4.31). Поскольку из определения функционала Fa сразу вытекает, что сс-||Х“|12 <+а(Х“, А, Ва), то из доказанного нами неравен- ства (4.36) вытекает также следующее неравенство: |X“|XWI + M6), (4.4-1) в котором 8Х (6)—>-0 при 6—>0 + 0. Из (4.41) вытекает, что при всех достаточно малых 6 множество {X01} точек Ха простран- ства Еп является ограниченным. Теперь уже нетрудно доказать теорему от противного. Предположим, что для некоторого е0 > 0 существует последо- вательность 6„ -> 0 + 0 и отвечающая ей последовательность чисел ап, удовлетворяющих условию * 6*<ап^а(6п), (4.31*) \Уп> такая, что для всех номеров п !|Х“п-Х»||>е0. (4.42)
108 ЕВКЛИДОВЫ ПРОСТРАНСТВА. [ГЛ. 4 Так как множество {Х“} ограничено, то в силу теоремы Больцано — Вейерштрасса из последовательности {Х“«} можно выделить сходящуюся подпоследовательность. Чтобы не менять обозначений, будем считать, что вся последовательность {Х“«} сходится к некоторому столбцу X’ — х? Хп то есть ||X“«— При п->оо. Убедимся в том, что ||АХ“п—АХ°||->0 при п->оо. (4-43) В самом деле, пользуясь неравенством треугольника, оцен- ками (4.28), (4.29), (4.36) и (4.40) и соотношением (4.31*), по- лучим || АХ“«— АХ° || < || АХа« — АХ“« || +1| АХ“п—В а || +1| Вд — а“х° || < 6Л || Х“"|| + /В“«(Х<Ч А, Вд) + < 6„ Х“п|| + С) + + /а„е (6„)С+ап ||Х° ||2 —> 0 при п—> оо Из неравенства (4.43) вытекает, что АХ° —АХ”, т. е. пре- дельный элемент Х° является решением системы (4.26), удов- летворяющим в силу соотношения (4.41) неравенству ||Х°||<С||Х®||. Так как по определению для нормального решения X® спра- ведливо обратное неравенство || Х° || ^ || X’||, то || Х° || = 1| Х° ||, т. е. Х° = Х°, а это противоречит неравенству (4.42), справедливому, для любого номера Полученное противоречие завершает доказательство теоремы.
ГЛАВА 5 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В этой главе исследуются так называемые линейные отображения линейных и евклидовых пространств, т. е. такие отображения, при которых образ суммы элементов равен сумме их образов и образ произведения элемента на число равен произведению этого числа на образ элемента. При этом мы будем рассматривать к ом п ле к с н ые линейные и евклидо- вы пространства. Результаты, относящиеся к вещественным про- странствам, будут оговорены специально. § 1, Понятие линейного оператора. Основные свойства 1. Определение линейного оператора. Пусть V и W — линей- ные пространства, размерности которых равны соответственно п и т. Мы будем называть оператором А, действующим и з V в W, отображение вида A:V->-W, сопоставляющее каждому элементу х пространства V некоторый элементу пространст- ва W. При этом будем использовать обозначение у = А(х) или у Ах. Определение. Оператор А, действующий из V в W, назы- вается линейным, если для любых элементов хг и х2 простран- ства V и любого комплексного числа X выполняются соотношения: 1 °. А (хх + х2) = Ахх+Ах2 (свойство аддитивности оператора). 2°. А(Хх)=ХАх (свойство однородности оператора). , Замечание 1. Если пространство W представляет собой комплексную плоскость, то линейный оператор А, действующий из V в W, называется линейной формой или линейным функционал ом._ Замечание 2. Если пространство W совпадаете простран- ством V, то линейный оператор, действующий в этом случае из V в V, называют также линейным преобразовани- ем пространства V. 2. Действия над линейными операторами. Пространство ли- нейных операторов. В множестве всех линейных операторов, действующих из V в W, определим операции суммы таких операторов и умножения оператора на скаляр.
но ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Пусть А и В—два линейных оператора, действующих из V в W. Суммой этих операторов назовем линейный оператор А + В, определяемый равенством (Л 4- В) х = Ах + Вх. (5.1) Произведением линейного оператора А на скаляр К назовем линейный оператор ХЛ, определяемый равенством (%Л)х = Х(Лх). (5.2) Назовем нулевым оператор, обозначаемый символом О и отображающий все элементы пространства V в нулевой элемент пространства W. Иными словами, оператор О действует по правилу Ох = 0. Для каждого оператора Л определим противополож- ный оператор—А посредством соотношения —Л = (—1)Л. Легко проверить справедливость следующего утверждения. Множество L (V, W) всех линейных операторов, действующих из V в W, с указанными выше операциями суммы и умножения на скаляр и выбранными нулевым оператором и противополож- ным оператором образует линейное пространство. 3. Свойства множества L(V, V) линейных операторов. Иссле- дуем подробнее линейные операторы, действующие из V в V, т. е. изучим подробнее множество L (V, V). Назовем тождественным (или единичным) операто- ром линейный оператор. Z, действующий по правилу 1х = х (здесь х—любой элемент V). Введем понятие произведения линейных операторов из множества L (V, V). Произведением операторов' Л и В из L(V,V) назы- вается оператор АВ, действующий по правилу (АВ) х= А (Вх). (5-3) Отметим, что, вообще говоря, АВ=^ВА. Справедливы следующие свойства линейных операторов из L(V,V): 1°. К(АВ) = (КА)В. 2°. (Л + В)С = ЛС+ВС. 3°. А(В+С) = АВ+ АС. * 4°. (АВ)С=А(ВС). (5.’4)
§ 1J ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА. ОСНОВНЫЕ СВОЙСТВА Ш Первое из свойств (5.4) следует из определения произйеде- ния линейного оператора на скаляр (см. (5.2)) и определения произведения операторов (см. (5.3)). Перейдем к обоснованию свойства 2°. Имеем, согласно (5.1), (5.2) и (5.3), ((4 + В) С) х = (4 + В) (Сх) = А (Сх) + В (Сх) = = (АС)х + (ВС)х = (АС+ВС)х. Сравнивая левую и правую части последних соотношений, мы получаем равенство (4 + Я)С = 4С+ВС. Свойство 2° установлено. Совершенно аналогично доказывается свойство 3°. Свойство 4° справедливо, поскольку, согласно определению (см. (5.3)), произведение линейных операторов заключается в их последовательном действии, и поэтому линейные операторы (АВ) С и А (ВС) совпадают и, следовательно, тождественны. Замечание 1. Свойство 4° позволяет определить произве- дение АВ... С любого конечного числа операторов из L(V,V) и, в частности, n-ю степень оператора А с помощью формулы Ап = АА. ..А. п сомножителей Очевидно, справедливо соотношение Дп + т_ АпА т Нам понадобится понятие обратного оператора для данного оператора А из L(V,V). Определение /. Линейный оператор В из Liy, V) назы- вается обратным для оператора А из L(V,V), если выпол- няется соотношение AB BA I. Обратный оператор для оператора А обычно обозначается символом Л-1. Из определения обратного оператора А~1 следует, что для любого x^V справедливо соотношение А~*Ах = х. Таким образом, если 4-14х = 0, то х=0, т. е. если опера- тор А имеет обратный, то из условия Ах = 0 следует, что х=0. Мы будем говорить, что линейный оператор А действует взаимно однозначно из V в V, если любым двум различным
112 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 элементам хл и х2 отвечают различные элементы ^1=Лх1 и = АХ2- Если оператор А действует взаимно однозначно из V в V, то отображение A:V->V представляет собой отображение V на V, т. е. каждый элемент у € V представляет собой образ неко- торого элемента x£V: у = Ах. Чтобы убедиться в этом, достаточно, очевидно, доказать, что п линейно независимых элементов хп х2, ..., хп пространст- ва V отображаются посредством оператора А в п линейно неза- висимых элементов Ах1г Ахг, . .., Ах„ этого же пространства. Итак, пусть х1,хг,...,х„—линейно независимые элемен- ты V. Если линейная комбинация а1Лх1+а2Лх2-|- ... +аяЛх„. представляет собой нулевой элемент пространства V: а1Ах1 + а2Ах2+ . .. +а„Ах„ О, то из определения линейнбго оператора (см. п. 1 этого пара- графа) следует, что А (агх2 + а2х2 + • • • + а„х„) = 0. Так как оператор А действует из V в V взаимно однозначно, то из последнего соотношения вытекает, что a1xl + a2x2 + .. • + a„x„ = 0. Но элементы х,, х2,..., хп линейно независимы. Поэтому а,= =а2 = ... =а„ = 0. Следовательно, элементы Axlt Ах2, ..., Ах„ также линейно независимы. Отметим следующее утверждение. Для того чтобы линейный оператор А из L(V,V) имел об- ратный, необходимо и достаточно, чтобы этот оператор дей- ствовал взаимно однозначно из V в V. Убедимся, что сформулированное условие необходимо. Пусть оператор А имеет обратный, но не действует взаимно одно- значно из V в V. Это означает, что некоторым различным эле- ментам Xi и х2, х2— Xt#=0 из V отвечает один и тот же элемент y = Axt = Ах2. Но тогда Л(х2—Xi) = 0’, и поскольку А имеет обратный, х2— xt=0. Но выше было отмечено, что х,—Xi#:0. Полученное противоречие доказывает необходимость условия утверждения. Докажем достаточность этого условия. Допустим, что оператор А действует взаимно однозначно из V в V. Тогда каждому элементу jrGV отвечает элемент. x£V такой, что у=Ах. Поэтому имеется оператор Л-1, обладающий тем свойством, что А~гу — Л-1 (Лх) = х. Легко убедиться, что оператор Л-1 лийейный. По определению Л-1—обратный опера-
$ 1] ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА. ОСНОВНЫЕ СВОЙСТВА 113 тор для оператора А. Достаточность условия утверждения так- же доказана. Введем понятия ядра и образа линейного оператора. Определение 2. Д д р ом линейного оператора А называется множество всех тех элементов х пространства V, для которых Лх = 0. Ядро линейного оператора А обозначается символом кет,Л. Если кегЛ=0, то оператор Л действует взаимно однозначно из V в V. Действительно, в этом случае из условия Ах —О вытекает х = 0, а это означает, что различным xt и х2 отве- чают различные _у1 = Лх1 и у2 = Ах2 (если бы JS =.у2, то Л (х2— х,) —О, т. е. хг—х2 и элементы xt и х2 не были бы различны). Таким образом, согласно доказанному выше утверждению условие кег Л = О является необходимым и достаточным для того, чтобы опера- тор А имел обратный. Определение 3. Образом линейного оператора А называ- ется множество всех элементов у пространства V, представимых в виде у = Ах. Образ линейного оператора Л обозначается символом im Л*). Замечание 2. Отметим, что если кет Л = 0, то 4тЛ = У, и наоборот. Поэтому наряду с отмеченным выше условием кегЛ= 0 условие im A = V также является необходимым и доста- точным, для того, чтобы оператор А имел обратный. Замечание 3. Очевидно, ядро кег Л и образ 1гпЛ—линей- ные подпространства пространства V. Поэтому можно рассмат- ривать размерности dim (кег Л) и dim (im Л) этих подпространств. Справедлива следующая теорема. Теорема 5.1. Пусть размерность dimV пространства V равна п, и пусть А—линейный оператор из L(V, V). Тогда dim (im Л) 4- dim (кег Л) = п. Доказательство. Так как кег Л представляет собой под- пространство V, то можно указать такое подпространство V, пространства V, что V будет представлять собой прямую сумму ♦) Символ im следует отличать от символа Im, используемого для обо- значения мнимой части комплексного числа.
114 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. Б Vi и кегА*). Согласно теореме 2.10 dim Vt + dim (ker A) = n. Поэтому для доказательства теоремы достаточно убедиться, что dim Vx = dim (imA). Пусть dimVx = p, dim(imA)=^ и yt, у2, ..., уч—базис в imA. Так как линейный оператор А действует взаимно одно- значно из Vt в'imA**), то каждому элементу у из im А мож- но поставить в соответствие единственный элемент x^Vt такой, что Ах—у. Поэтому в Ух определены элементы xlt х2, . .., xq такие, что Ахк=ук, k= 1, 2, ...,q. Элементы xlt лг2, ..., xq линейно независимы, ибо если а.1х1 + о2х2 + ... +авх? = 0, то А (а1х1 + а2х2 +•..-+ aqXg) = агyt + а2у2 + .. . + aqyq = 0, а так как элементы у±,уг, •,УЧ линейно независимы, то at== = а2 = ... =aq — 0, т. е. и х1( х2, .. ., xq линейно независимы. Таким образом, в Vj имеется q линейно независимых элементов. Следовательно, p~+q (напомним, что p = dimlz1). Предположим, что p~>q. Добавим к линейно независимым эле- ментам хи х2, • •xq элементы xqJrl, ж9+2, .... хр так, что xit х2, . . хр образуют базис в 1Д. Так как р > q и q = dim (imA), то элементы Ахг, Ах2, , Ахр, принадлежащие imA, линейно зависимы, и поэтому существуют не все равные нулю числа Х2, ..., \р такие, что ХхАхх + %2Ах24-• • • 4-KpAxp = Q. Отсюда следует, что А (Х1х1 + ^2х2 + ... + ^рхр) = 0. Так как А действует из Vi в imA взаимно однозначно, то из последнего равенства получаем ^±Xi 4- 4- • • • 4-^х^=О. Но х^ х2, ..., хр—базис в У*. Поэтому Xf = X2 = ... — 2^ = 0. Выше указывалось, что не все A,1, %2, ..., кр равны нулю. Сле- довательно, предположение р > q ведет к противоречию. Таким образом, p = q- Теорема доказана. *) Чтобы убедиться в этом, выберем в V такой базис et, е2, ...,еп, что первые г векторов е1г е2, ...,ег образуют базис в ker А, тогда линейная обо- лочка векторов er+i,..., еп представляет собой Vx (см. подробнее главу 4). *•) По аналогии с линейными операторами, действующими взаимно одно- значно из V в V, можно ввести понятие линейного оператора А, действую- щего взаимно однозначно из линейного пространства V в линейное простран- ство V7. Эти операторы характеризуются тем, что различным элементам Xi и Хк пространства V отвечают различные элементы уг — Axi и у2 = 4х2 прост- ранства 1Г. Таким свойством обладает рассматриваемый оператор А, действу- ющий из пространства Ух, в пространство imA. Действительно, если xxgV], x2gVx х2—Xi?$0, то х2—xx£Vi, и поэтому Ах2 Ахх (Axj £ im А, Ах20гпА), ибо если бы Ах2 = Ахх, то А (х2—Xi) = 0, т. е. х2—xx£kerA, что противоречило бы принадлежности х2—Xi£Vi и условию Xi—хх 7= 0 (Vx и ker А составляют прямую сумму и поэтому имеют общим лишь нулевой элемент).'
§11 ПОНЯТИЕ ЛИНЕЙНОГО ОПЕРАТОРА. ОСНОВНЫЕ СВОЙСТВА 115 Имеет место также следующая теорема, в определенном отно- шении обратная теореме 5.1. - Теорема 5.2. Пусть Vi и V2—два таких подпространства п-мерного пространства V, что dimV^ + dimV^dimK Тогда существует такой линейный оператор А из L (V, V), что =ч = im А и V2 = ker А. Доказательство. Пусть dimVi = p, dimV2 = ^. Выберем в пространстве V базис eit е2, ..., еп так, чтобы элементы е^+1, ер+2, ..., е„ принадлежали V2. Далее в пространстве выберем некоторый базис git g2, ..., gp. . . Определим теперь значения линейного оператора А на базис- ных векторах е2, ..., еп пространства V следующим образом: = Ae2 = g2....Aep = gp, Aep+i = 0, Aep+2 = 0, ..., Де„ = 0. Далее, если х =х&+х2е2 +... +xpep+xp+1ep+t+ ... +хпеп,то Ax = Xigi + x2g2+ ... Очевидно, оператор А линейный и обладает требуемыми свойствами. Теорема доказана. Введем понятие ранга линейного оператора А. Назовем рангом линейного оператора А число, обозначае- мое символом rang А и равное • rang А — dim (im Д). Отметим следующее очевидное следствие из теоремы 5.1 и из замечания 2 этого пункта. Следствие из теоремы 5.1. Для того чтобы оператор А из L(V, У)имел обратный Д^1, необходимо и достаточно, чтобы rang Д = dim V = п. Пусть А и В—линейные операторы из L (V, V). Справедлива следующая теорема. Теорема 5.3. Имеют место следующие соотношениям rang АВ rang А, rang АВ С rang В. Доказательство. Докажем сначала первое из отмеченных соотношений. Очевидно, im ABs im Д*). Поэтому dim (im АВ) <Jdim(inM), т. е. rangАВ^.rangД. Для доказательства второго соотношения воспользуемся сле- дующим очевидным включением**): кег В = кег АВ. *) Символ здесь и в дальнейшем обозначает включение, т. е. запись А ?= В обозначает, что А является подмножеством В. • *♦) Так как АВ и ВА различные, вообще говоря, операторы, то включе- ние im AB^im В может не ’иметь места, и поэтому для доказательства вто- рого соотношения rang АВ< rang В требуются специальные рассуждения.
116 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Из этого включения следует, что dim (ker В) dim (ker АВ). Из последнего неравенства в .свою очередь следует неравенство dimV—dim(ker ДВ)^dimV—dim(kerB), а из него, согласно теореме 5.1, получаем dim (im АВ) dim (im В),' т. е. rang АВ rang В. Теорема доказана. Докажем еще одну теорему о рангах линейных операторов. Теорема 5.4. Пусть А и В—линейные операторы иэ L (V, V) и п—размерность V. Тогда rang АВ~^ rang Д + rang В—п. Доказательство. Согласно теореме 5.1 dim (im ДВ)+ dim (ker ДВ) = и. (5.5) Так как rang ДВ = dim (im Д В), то из (5.5) получаем rang АВ=п—dim (ker Д В). (5.6) Поскольку, согласно теореме 5.1, dim (ker Д) + dim (кег В) = 2n— (rang A + rang B), (5.7) то для доказательства теоремы достаточно установить неравенство dim (ker ДВ) С dim (ker А) + dim (ker В). (5.8) Действительно, из этого неравенства и из соотношения (5.6) сле- дует неравенство rang АВ> п—(dim (ker Д) + dim (ker В)), из которого, согласно (5.7), сразу же вытекает справедливость утверждения теоремы. Итак, перейдем к обоснованию неравенства (5.8). Пусть dim (ker В) = р. (5.9) Согласно теореме 5.3 dim (ker АВ)^ q. Поэтому справедливо соотношение dim(ker АВ) = р + q, где (5.10) Так как ker В = ker ДВ, то в подпространстве кег ДВ можно выбрать базис xlt х2, .. , xp+q так, что элементы Хр+1, ..., xp+Q образуют базис в кег В. При таком выборе хи х2..xp+q эле- менты BXj., Вх2, ..., Вхр линейно независимы ^если линейная р / р \ р комбинация У, XftBxA = 0, то 3 =°, т- е. Л=1 V=1 / *=1 gkerB, а это может быть, в силу выбора х2, ..., хр, лишь
§2) МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ j 17 при = 0, k = 1,2,...» р). Поэтому элементы Bxit Вх3, .Вх принадлежат кег Л, т. е. J р dim (кег Л). Из этого неравенства и соотношений (5.9) и (5.10) вытекает тре- буемое неравенство (5.8). Теорема доказана. Следствие из теорем 5.3 и 5.4. Если rang Л — п. (п—раз- мерность V), то rang АВ = rang В А = rang В. Указанное следствие вытекает из неравенств rang АВ^. rang В (теорема 5.3), rang АВ rang В (теорема 5.4 при rangA = n). Из этих неравенств получим, что rang АВ = rang В. Аналогично доказывается соотношение rang В А = rang В. § 2. Матричная запись линейных операторов 1. Матрицы линейных операторов в заданном базисе линей- ного пространства V. Фиксируем в линейном пространстве V базис е2, ..., еп- Пусть х—произвольный элемент V и . x='£x’,e/t (5.11) fe=i разложение х по данному базису. Пусть Л—линейный оператор из L(V, V). Тогда из (5.11) получаем Лх=2 хкАеЛ. (5.12) k=i Полагая Ле*=£<4еу, (5.13) /=1 перепишем (5.12) в следующей форме: Ах= 2 хк 2 4е/ = 2(2 a’kxk) ej' fe=l /=1 /=1 \fc=T J Таким образом, если у — Ах и элемент у имеет координаты у\ Уг, •••. Уп, то yJ = 2 а’кхк> i =1 • 2....«• (5-14) /г=1
118 'ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Рассмотрим квадратную матрицу А с элементами ак: А = (4). Эта матрица называется матрицей линейного опера- тора в заданном базисе е1г е2, еп. Наряду с ранее указанным способом записи линейного опера- тора используется при заданном базисе е1, еа, .... е„ матричная форма записи: у = Ах, причем, если х = (х1, х2, ..., х"), то у = (z/1, г/2, ..., уп), где у>, / = 1, 2, определяются с помощью соотношений (5.14), а элементы a’k матрицы А вычисляются по формулам (5.13). Замечание 1. Если оператор А нулевой, то все элементы матрицы А этого оператора равны нулю в любом базисе, т. е. А—нулевая матрица. Замечание 2. Если оператор А единичный, т. е. А = 1, то матрица этого оператора будет единичной в любом базисе. Иными словами в этом случае А = Е, где Е—единичная матрица. В даль- нейшем единичнуюматрицу мы будем обозначать также символом I. Мы выяснили, что каждому линейному оператору А из L(V, V) при заданном базисе линейного пространства V отвечает матрица А этого оператора. Естественно возникает обратный вопрос—каж- дой ли данной матрице А при заданном базисе в V можно поставить в соответствие линейный оператор А, матрицей кото- рого будет дойная матрица. Важно также выяснить вопрос о единственности матрицы линейного оператора в заданном базисе. Справедливо следующее утверждение. Теорема 5.5. Пусть в линейном пространстве V задан базис eit е2, ..., и пусть А =(а{)—квадратная матрица, содержа- щая п строк и п столбцов. Существует единственный линейный оператор А, матрицей которого в заданном базисе будет матри- ца А. Доказательство. Докажем сначала существование опера- тора А. Для этой цели определим значения Аек этого оператора на базисных векторах ek с помощью соотношения (5.13), полагая в этом соотношении равными соответствующим элементам задан- ной матрицы А. Значение оператора А на произвольном векторе x£V, разложение которого по базисным векторам еи е2, . . еа дается формулой (5.11), определим по формуле (5.12). Очевидно, построенный оператор линейный и матрицей этого оператора является матрица А. Единственность оператора А, матрицей которого в базисе е2, ..., еп является матрица А, следует из соотношений (5.13): с помощью этих соотношений единственным образом определяются значения оператора на базисных векторах.
§21 МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ ) 19 Замечание 3. Пусть А и В—квадратные матрицы порядка п, А и В—отвечающие им линейные операторы в заданном ба- зисе пространства V. Из доказательства теоремы 5.5 следует, что матрице Д + АВ, где ^—некоторое число, отвечает линейный оператор А + кВ (напомним, что А, В и А + кВ при- надлежат L(V, V)). Докажем следующую теорему. Теорема 5.6. Ранг линейного оператора А равен рангу мат- рицы А этого оператора: rang А = rang А. Доказательство. По определению rang Л = dim(im Л), а йпЛ—линейная оболочка векторов gk: п g*=S4e/ (5.15) (см. матричную форму записи оператора и определение im Л). Поэтому rang Л равен максимальному числу линейно незави- симых векторов gk, Так как векторы eit е2, . . еп линейно неза- висимы, то, согласно (5.15), максимальное число линейно незави- симых векторов gk совпадает с максимальным числом линейно независимых строк (аА, ак, .... ак) матрицы А, т. е. с рангом А. Теорема доказана. - Пусть А и В — произвольные квадратные матрицы, содержа- щие п строк и п столбцов. Из теорем 5.3, 5.4, 5.5 и 5.6 выте- кают следующие следствия. Следствие 1. Ранг rang-ДВ произведения Д и В удовлетво- ряет соотношениям rang А В rang А, rang АВ rang В, rang АВ rang A +rang В—п. Следствие 2. Обратный оператор Л-1 для оператора Л существует только тогда, когда ранг матрицы А оператора Л равен п (n = dimV). Отметим, что в этом случае существует также и обратная матрица Л-1 для матрицы Д. 2. Преобразование матрицы линейного оператора при переходе к новому базису. Пусть V—линейное пространство, Л—линей- ный оператор из L(V, V), eit ег, ...» еп и eif ёг, еп—два базиса в V и ёА = 2 Л = 1, 2, ..., п (5.16) i=i
120 ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. 5 — формулы перехода от базиса {e,J к базису {ёА}. Обозначим Через U матрицу (4): 4/ = (4). (5.17) Отметим, что rang4/= и. Пусть Д-(4)иД = (4) (5,18) — матрицы оператора А в указанных базисах. Найдем связь между этими матрицами. Справедливо следующее утверждение. Теорема 5.7. Матрицы А и А оператора А в базисах {еА} и {eft) соответственно связаны соотношением a^u^Au, где U~1 обратная матрица*) для матрицы U, определенной равенством (5.17). Доказательство. Обращаясь к понятию матрицы линей- ного оператора, получим, согласно (5.18), ЛеА= 2 4е,-, Аек = 2 4е,- (5.19) /=?1 4=1 Из определения линейного оператора, из формул (5.16) ииз второй из формул (5.19) следуют соотношения / п \ п п Аек = А ( 2 4^), Аек — 2 4 2 и^е,. \i=l / i=l i=l Поэтому справедливо равенство 2 4Ле,- = 2(2 <&и{)е,. i=i j=i \i=i / Подставляя в левую часть этого равенства выражение Ае{ по первой из формул (5.19), найдем п / п \ п / п \ 2 ( 2 «И )ez = 2(2 )«/• /=1 \<=i ) /=1 \f=i / Так как {еу}—базис, то из последнего соотношения вытекают равенства 2 44 = 2 4«{. /> k = 1, 2, .... п. (5.20) <=1 i=l *) Так как rangt/ = n, то обратная матрица для матрицы U су- ществует.
S2] МАТРИЧНАЯ ЗАПИСЬ ЛИНЕЙНЫХ ОПЕРАТОРОВ . 121 Если обратиться к матрицам А, Л и {/ (см. (5.17) и (5.18)), то соотношения (5.20) эквивалентны следующему матричному равенству; UA=AU. Умножая обе части этого равенства слева на матрицу U~l, получим требуемое соотношение А = и-гАи. Теорема доказана. 3-амечание 1. Обратимся к формуле A = U~1AU. Умножая обе части этого матричного равенства слева на матрицу U и справа на £/~\ получим соотношение A — UAU'1, ' (5.21) представляющее собой другую форму связи между матрицами А и А линейного оператора А в разных базисах. Замечание 2. Пусть А и В—квадратные матрицы порядка п, А и В—отвечающие им линейные операторы в заданном базисе {ej. Как уже отмечалось (см. замечание 3 предыдущего пункта) матрице Л+1В отвечает линейный оператор Л + ХВ. Выясним вид матрицы этого оператора в базисе (ёА). Пусть А и В — матрицы операторов А и В в базисе {ej. Тогда, согласно (5.21), имеем Л={/Л{/-1, B = UBU-\ (5.22) Матрица линейного оператора А-{-кВ в базисе {ей} имеет, согласно (5.21), следующий вид: и(А+кВ)и-'. Используя распределительное свойство умножения матриц, пере- пишем последнюю формулу следующим образом (напомним, что эта формула представляет собой матрицу линейного оператора А + кВ в базисе {в*}): UAU-' + kfUBU-1). W Обращаясь к соотношениям (5.22), видим, что матрица опера- тора А-\-кВ в базисе записывается следующим образом: А-\-кВ. В частности, если В—единичная матрица, B—I, то В = 1 (см. замечание 2 предыдущего пункта и теорему 5.5), и поэтому
122 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 матрица линейного оператора Л + Х/ в базисе {еА} имеет вид л+х/. Следствие из теоремы 5.7. det А = det А. В самом деле, так как определитель произведения матриц равен произведению определителей этих матриц, то из равенства A = U~1AU следует, что det А = det U~ldet A det V. (5.23) Поскольку det U~l det U = 1, то из соотношения (5.23) получаем равенство det А = det А. Таким образом, определитель матрицы линейного оператора не зависит от выбора базиса. Поэтому можно ввести понятие оп- ределителя det Л линейного оператора Л, полагая det Л = det А, (5.24) где А—матрица линейного оператора Л в любом базисе. 3. Характеристический многочлен линейного оператора. Пусть Л—линейный оператор, а I—тождественный оператор из£(У, 7). Определение. Многочлен относительно к det (Л — X/) (5.25) называется характеристическим многочленом опера- тора А. Пусть в пространстве V задан базис и Л = (а£)—матрица оператора Л в этом базисе. Тогда, согласно (5.24), характери- стический многочлен (5.25) оператора Л запишется следующим образом: '1л 2 —л аг 01 det (Л — Х/) = i 2 л #2 — Л < • a” (5.26) On On s i „п \ an— Л, Запишем характеристический многочлен (5.25), обозначая через dh коэффициент при Л*: det (Л — X/) = 2 d^k. (5.27) *=о Замечание 1. Так как значение определителя det (Л—X/) не зависит от выбора базиса, то коэффициенты dk характеристи- ческого многочлена в правой части (5.27) также не зависят от выбора базиса. Таким образом, коэффициенты dk характеристик
5 3] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 123 ческого многочлена оператора А представляют собой инвариан- ты—величины, значения которых не зависят от выбора базиса. В частности, коэффициент dn_it равный, очевидно, аЦ-аЦ- •• • ... +а”, является инвариантом. Этот инвариант называется сле- дом оператора Л и обозначается символом tr А (от англий- ского слова trace—след): tr Л = а} + а?+• • •(5.28) Замечание 2. Уравнение det (Л — М) = 0 (5.29) называется характеристическим уравнением опера- тора А. § 3. Собственные значения и собственные векторы ' линейных операторов Пусть —подпространство п-мерного линейного простран- ства V и Л — линейный оператор из L(V, 7). Определение 1. Пространство Vx называется инвариант- ным подпространством оператора А, если для каждого х, принадлежащего Vt, элемент Ах также принадлежит 71. Примерами инвариантных подпространств оператора Л могут служить kerЛ и im Л. Определение 2. Число % называется собственным зна- чением оператора А, если существует ненулевой вектор х та- кой, что Ах = Хх. (5.30) При этом вектор х называется собственным вектором оператора А. Справедливо следующее утверждение. Теорема 5.8. Для того чтобы число А было собственным зна- чением оператора А, необходимо и достаточно, .чтобы это число было корнем характеристического уравнения (5.29) оператора А. Доказательство. Пусть X—собственное значение опера- тора Л и х—собственный вектор, отвечающий этому Х(хУ=0). Перепишем соотношение (5.30) в следующей форме: (Л —Х/)х = 0. Так как х—ненулевой вектор, то из последнего равенства сле- дует, что ker (Л—%/)М=0, т. е. dim (ker (Л—А/))>1. (5.31) Поскольку, согласно теореме 5.1, dim (im (Л —X/)) + dim (ker (Л — X/)) =n,
124 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 то из этого равенства и неравенства (5.31) получаем dim(im(A — Х/))^п—1. (5.32) По определению dim(im(4 — X/)) равняется рангу оператора А — X/. Поэтому из неравенства (5.32) следует rang (А — X/) < и. (5:33) Таким образом, если X—собственное значение, то ранг матрицы А—X/ оператора А—X/ меньше п, т. е. det (А — Х/) = 0 и, сле- довательно, X—корень характеристического уравнения. Пусть теперь X — корень характеристического уравнения (5.29). Тогда справедливо неравенство (5.32), а следовательно, и нера- венство (5.31), из которого вытекает существование для числа X такого ненулевого вектора х, что (Л —Х/)х=0. Последнее соотношение эквивалентно соотношению (5.30). Поэтому X —собственное значение. Теорема доказана. Следствие. Каждый линейный оператор имеет собственное значение. Действительно, характеристическое уравнение всегда имеет корень (в силу основной теоремы алгебры). Справедлива следующая теорема: Теорема 5.9. Для того чтобы матрица А линейного опера- тора А в данном базисе {ек} была диагональной *), необходимо и достаточно, чтобы базисные векторы ек были собственными векто- рами этого оператора. Доказательство. Пусть базисные векторы ек являются собственными векторами оператора А. Тогда Аек = ^кек, (5.34) и поэтому матрица А оператора А имеет вид (см. соотношения (5.13) и понятие матрицы линейного оператора) /Х1 о I О х2 \о о 0. ' о Хя. (5.35) т. е. является диагональной. Пусть матрица А линейного оператора А в данном базисе {ек} диагональна, т. е. имеет вид (5.35). Тогда соотношения (5.13) примут вид (5.34), а это означает, что ек—собственные векторы оператора А. Докажем еще одно свойство собственных векторов. ♦) Напомним, что матрица называется диагональной, если все ее элементы, расположенные не на главной диагонали, равны нулю.
§ 3J СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 125 Теорема 5.10. Пусть собственные значения %2, .... Хр оператора А различны. Тогда отвечающие им собственные век- торы elt ег, ..., ер линейно независимы. Доказательство. Применим индукцию. Так как ег—не- нулевой вектор, то для одного вектора (р = 1) утверждение справедливо (один ненулевой-вектор является линейно независи- мым). Пусть утверждение теоремы доказано для т векторов et, ег, .... ет. Присоединим к этим векторам вектор ет+1 и до- пустим, что имеет место равенство т + 1 (5.36) Тогда, используя свойства линейного оператора, получим (5.37) -Так как ек—собственные векторы, то Aek — hkek, и поэтому равенство (5.37) можно переписать следующим образом: т+1 ^акКкек=О. (5.38) 1 tn+1 Согласно (5.36) 2 ^m+iakek~ 0- Вычитая это равенство из k = 1 % равенства (5.38), найдем т 5(^й hm+1)akek = O. (5.39) fe = 1 По условию все кк различны, т. е. —Хт+15А0. Поэтому из (5.39) и предположения о линейной независимости векторов eit е2, ..., ет следует, что aj = a2 =... = am = 0. Отсюда и из (5.36), а также из условия, что ет+1—собственный вектор (em+1#=0), вытекает, что ам+1=0. Таким образом, из равенства (5.36) мы получаем, что ax = a2 = . .. = aOT+i = 0. Это означает, что векторы elt ег,..., em+i линейно независимы. Индукция проведена, и доказательство теоремы завершено. Следствие. Если характеристический многочлен оператора А имеет п различных корней, то в некотором базисе матрица опе- ратора А имеет диагональный вид. Действительно, в рассматриваемом случае, согласно только что доказанной теореме собственные векторы линейно незави- симы и поэтому могут быть выбраны в качестве базисных. Но тогда по теореме 5.9 в этом базисе матрица оператора А будет диагональной.
126 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 § 4, Линейные и полуторалинейные формы в евклидовом пространстве 1. Специальное представление линейной формы в евклидовом пространстве. Пусть У—евклидово пространство, а С — комплекс- ная плоскость (одномерное комплексное линейное пространство). В п. 1 § 1 этой главы мы ввели понятие линейной формы — линейного оператора, действующего из V в С. В этом пункте мы получим специальное представление произвольной линейной формы f из L(V, С). Лемма. Пусть f—линейная форма из L(V, С). Тогда суще- ствует единственный элемент h из V такой, что f(x)=.(x, h). (5.40) Доказательство. Для доказательства существования эле- мента h выберем в V ортонормированный базис е2, .... еп. Рассмотрим элемент h, координаты hk которого в выбранном базисе определяются соотношениями *) Л* =7® (5.41) Таким образом, h = 2 hkek. k=i Пусть х2 -произвольный элемент пространства V. Используя свойства линейной формы f и равенство (5.41), по- лучим f (х) = 2 xkf (<?А) = 2 (5.42) й=1 6=1 Так как в ортонормированием базисе {eft} скалярное произве- дение (х, й) векторов х=2]^ел и *=2^^ равно то из (5.42) получаем’/(х) = (х, К). Существование вектора h доказано. Докажем единственность этого вектора. Пусть и й2 —два вектора таких, что с помощью этих векторов форма f (х) может быть представлена в виде (5.40). Очевидно, для любого X спра- ведливо соотношение (х, hj) = (x, из которого следует равенство (х, й2-йх) = 0. Полагая в этом равенстве х = Л2—йх *) Черта над / (еф означает, что берется комплексно сопряженное зна- чение этого выражения,
$ 4] ЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФОРМЫ 127 и используя определение нормы элемента в евклидовом прост- ранстве, найдем 11*2-^11=0. Итак, Л2=йр Лемма доказана. Замечание. Очевидно, лемма справедлива и в случае, если V—вещественное евклидово пространство, a f £L(y, R), где R — вещественная прямая. 2. Полуторалинейные формы в евклидовом пространстве. Спе- циальное представление таких форм. Введем понятие полуто- ралинейной формы в линейном пространстве. Определение. Числовая функция В (х, у), аргументами кото- рой являются всевозможные векторы х и у линейного простран- ства L, называется полуторалинейной формой, если для любых векторов х, у и z из L и любого комплексного числа А выполняются соотношения В{х-\-у, z} = B(x, z) + B(y, z), \ В(х, y + z) = B(x, у)-\-В(х, z), I 5 (Ах, у) = КВ(х, у), f <5-43) В(х, '/.у) =ХВ(х, у). J Иными словами, полуторалинейная форма В{х, у) представ- ляет собой числовую функцию двух векторных аргументов х, у, определенную на всевозможных векторах х и у линейного про- странства L, линейную по первому аргументу х и антилиней- ную по второму аргументу у. Замечание 1. Если линейное пространство L является вещественным, то полуторалинейные формы переходят в так назы- ваемые билинейные формы, т. е. формы, линейные по каждому из аргументов (четвертое из соотношений (5.43) в силу вещест- венности А будет характеризовать линейность и по второму аргументу). Билинейные формы изучаются в главе 7. Обратимся к полуторалинейной форме, заданной в евклидо- вом пространстве V. Справедлива следующая теорема о спе- циальном представлении такой формы. Теорема 5.11. Пусть В(х, у)—полуторалинейная форма в евклидовом пространстве V. Тогда существует единственный линейный оператор А из L (V, V) такой, что В(х, у) = (х, Ау). (5.44) Доказательство. Пусть у — любой фиксированный эле- мент пространства V. Тогда В(х, у) представляет собой линей- ную форму аргумента х. Поэтому по лемме предыдущего пункта
128 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 можно указать такой однозначно определенный элемент h про- странства V, что >)=(х, Л). (5.45) Итак, каждому у из ‘V по правилу (5.45) ставится в соответ- ствие единственный элемент Л из V. Таким образом, определен оператор А такой, что h = Ay. Линейность этого оператора эле- ментарно следует из свойств (5.43) полуторалинейной формы и из свойств скалярного произведения. Докажем единственность оператора А. Пусть Лх и Л2—два оператора таких, что с помощью этих операторов форма В(х, у) может быть представлена в виде (5.44). Очевидно, для любых х и у справедливо соотношение (х, Л^у) — = (х, Л-jj), из которого следует равенство (х, А^у—Льу)=О. Полагая в этом равенстве х — А2у— А±у и используя определе- ние нормы элемента, найдем WA^-^y^O. Таким образом, для любого у из V имеет место равенство Л2у1 = Л1з>, т. е. A2--Ar. Теорема доказана. Следствие. Пусть В (х,у)— полуторалинейная форма в евкли- довом пространстве V. Тогда существует- единственный линей- ный оператор А из L(V, У) такой, что В (х, у) —(Ах, у). (5.46) Справедливость следствия вытекает из следующих рассужде- ний. Во-первых, форма В1(у, х) = В(х, у) является полутора- линейной (это следует из того, что В(х, v)—полуторалинейная форма и из определения такой формы). Далее, по теореме 5.11 получаем для 5Х (_у, х) представление в вцде ВЛу, х) — (у, Ах). (5.47) Так как сопряженное значение от В1(х, у) равно Вг (х, у), то, беря сопряженное значение левой и правой частей (5.47) и учитывая равенство B±(y, х) = В(х, у), получим В(х, «?) = (>, Ах). (5.48) Но (.у, Лх) = (Лх, у) (см. гл. 4, §3, п. 1). Поэтому из (5.48) получаем равенство (5.46). Следствие доказано. Замечание 2. Теорема 5.11 и следствие из этой теоремы справедливы и для случая вещественного евклидова простран- ства. В этом случае в формулировке теоремы и следствия тер- мин «полуторалинейная форма» надо заменить термином «били- нейная форма». См. также замечание 1.
5 4J ЛИНЕЙНЫЕ И ПОЛУТОРАЛИНЕЙНЫЕ ФОРМЫ ]29 Введем понятие матрицы полуторалинейной формы в данном базисе п п Пусть х, у принадлежат V и х= У _у= У Укеь~рзз- / = 1 А=1 ложения х и у по базису {ej. Из определения полуторалиней- иой формы следуют соотношения В(х,у)~в(2 х^е}, У = 2 2 xA/*S(e-, еА). (5.49) \/=l k=l j j=lk=l Полагая bJk = B(ej, ek), (5.50) запишем выражение (5.49) для В(х, у) в следующей форме: В(х,у)= 2 bJkxJyk. i, fc=i Матрица B = {bJk) называется матрицей полуторалинейной формы В{х, у) в базисе {ек}. Справедливо следующее утверждение: Пусть полуторалинейная форма В(х, у) представлена в виде (5.46) В(х, у) = (Ах, у). (5.46) Пусть далее элементы матрицы А оператора А в данном орто- нормированием базисе равны а}. Тогда в этом базисе bjk = ai • *7 Для доказательства обратимся к выражению (5.50) для коэф- фициентов bjk полуторалинейной формы. Преобразуем правую часть (5.50) с помощью (5.46). Получим, согласно (5.13), bJk = B(ej, ек) = (Ае}, ел)=( 2 a^eg, ек)= 2 а/(е9, еу). \0=1 / 9=1 Так как базис {ек} ортонормированный, то (еч, е7) = 0, если q=^=k и (ек, ек) = 1. Поэтому из всех слагаемых последней суммы отличным от нуля будет лишь то, которое получается при^ = /г. Таким образом, bJk = alj. Утверждение доказано. Замечание 3. Если полуторалинейная форма представлена в виде В (х, у) = (х, Ау) и элементы матрицы Л оператора А в данном ортонормированном базисе равны а), то в этом базисе
130 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. в § 5, Линейные самосопряженные операторы в евклидовом пространстве 1. Понятие сопряженного оператора. Мы будем рассматри- вать линейные операторы в конечномерном евклидовом прост- ранстве V. Определение 1. Оператор А* из L(V, У) называется сопря- женным к линейному оператору А, если для любых х и у из V выполняется соотношение (Ах, у) = (х, А*у). (5.51) Легко убедиться в том, что оператор Л*, сопряженный к ли- нейному оператору А, сам является линейным оператором. Это вытекает из очевидного соотношения (Ах, ayt + ₽_у2) = а (Ах, yj Д ₽ (Ах, у2) = = а(х, А*уг)+$(х, Л*у2)=(х, A*(ayi + ^yt)), справедливо для любых элементов х, yit у2 и любых комплекс- ных чисел аир. Докажем следующую теорему. Теорема 5.12, Каждый линейный оператор А имеет един- ственный сопряженный. Доказательство. Очевидно, скалярное произведение (Ллг, у) представляет собой полуторалинейную форму (см. гл. 4, § 3, п. 1 и определение полуторалинейной формы). По теореме 5.11 существует единственный линейный опера- тор А* такой, что эта форма может быть представлена в виде (х, А*у). Таким образом, (Ах, у) = (х, А*у). Следовательно, оператор А* — сопряженный к оператору А. Единственность оператора А* следует из единственности пред- ставления полуторалинейного оператора в виде (5.44). Теорема доказана. В дальнейшем символ А* будет обозначать оператор, сопря- женный оператору А. Отметим следующие свойства сопряженных операторов: 1°. /* = /. 2°. (Д+В)^=Д* + В‘. 3°. (U)‘=M’. 4°. (Д*)* = Д. 5°. (АВ)* = В*А*. Доказательства свойств 1°—4° элементарны, и мы предостав- ляем их читателю. Приведем доказательство свойства 5°. Согласно определению произведения операторов справедливо соотношение (АВ) х = А (Вх). С помощью этого равенства и
$ 5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 131 определения сопряженного оператора получаем следующую це- почку соотношений: ((АВ) х, у) = (А (Вх), у) = (Вх, А*у) = = (х, В*(А*у))=(х, (В*А*)у). Таким образом, ((АВ)х, у) = (х, (В*А*)у). Иными словами, оператор В*А* является сопряженным к оператору АВ. Справедливость свойства 5° установлена. Замечание. Понятие сопряженного оператора для вещест- венного пространства вводится совершенно аналогично. Выводы этого пункта и свойства сопряженных операторов справедливы и для этого случая (при этом свойство 3° формулируется так: (М)*’= М’). 2. Самосопряженные операторы. Основные свойства. Определение 2. Линейный оператор А из L (V, V) называ- ется самосопряженным, если справедливо равенство Д* = Д. Самосопряженный оператор в вещественном пространстве опреде- ляется аналогично. Простейшим примером самосопряженного оператора является тождественный оператор I (см. свойство 1° сопряженных опера- торов в предыдущем пункте). С помощью самосопряженных операторов можно получить специальное представление произвольных линейных операторов. Именно, справедливо следующее утверждение. Теорема 5.13. Пусть А—линейный оператор, действующий в комплексном евклидовом пространстве V. Тогда справедливо представление Д = Д/г + г'Д;-, где Ar и А,—самосопряженные операторы, называемые соответ- ственно действительной и мнимой частью оператора А. Доказательство. Согласно свойствам 2°, 3° и 4° сопря- женных операторов (см. предыдущий пункт этого параграфа) операторы AR = (Д + Д*)/2 и А, = (А — A*)/2i самосопряженные. Очевидно, A — AR + iAt. Теорема доказана. В следующей теореме выясняются условия самосопряжен- ности произведения самосопряженных операторов. Мы будем говорить, что операторы Д и В коммутируют, если АВ = ВА. Теорема 5.14. Для того чтобы произведение АВ самосопря- женных операторов А и В было самосопряженным оператором t необходимо и достаточно, чтобы они коммутировали.
132 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. Б Доказательство. Так как А и В—самосопряженные операторы, то, согласно свойству 5° сопряженных операторов (см. п. 1 этого параграфа), справедливы соотношения (АВ)* * = В* А* = В А. (5.52) Следовательно, если АВ = ВА, то (АВ)* = АВ, т. е. опера- тор АВ самосопряженный. Если же АВ—самосопряженный оператор, то АВ=(АВ)*, и тогда на основании (5.52) АВ — ВА. Теорема доказана. В дальнейших теоремах устанавливается ряд важных свойств самосопряженных операторов. Теорема 5.15. Если оператор А самосопряженный, то для любого x£V скалярное произведение (Ах, х)—вещественное число. Доказательство. Справедливость утверждения теоремы вытекает из следующего свойства скалярного произведения в комплексном евклидовом пространстве (Ах, х) = (х, Ах) и определения самосопряженного оператора (Ах, х) = (х, Лх)*). Теорема 5.16. Собственные значения самосопряженного опера- тора вещественны. Доказательство. Пусть к—собственное значение самосоп- ряженного оператора А. По определению собственного значе- ния оператора А (см. определение 2 § 3 этой главы) существует ненулевой вектор х такой, что Ах = кх. Из этого соотношения следует, что вещественное (в силу теоремы 5.15) скалярное произведение (Ах, х) может быть представлено в виде (Ах, х) = к(х, х) = Z||x|’**). Так как ||х|| и (Ах, х) вещественны, то, очевидно, и к — веще- ственное число. Теорема доказана. В следующей теореме выясняется свойство ортогональности собственных векторов самосопряженного оператора. Теорема 5.17. Если А—самосопряженный оператор, то соб- ственные векторы, отвечающие различным собственным значениям, этого оператора, ортогональны. Доказательство. Пусть к± и к2 — различные собственные значения (Zi=^X2) самосопряженного оператора А, а хг и х2— соответственно отвечающие им собственные векторы. Тогда имеют место соотношения Лх1 = А,1х1, Лх2 = Х2х2. *) Напомним, что если комплексное число равно своему сопряженному, то это число—вещественное. ♦*) Напомним, что символ || х || обозначает норму элемента х.
§5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 133 Поэтому скалярные произведения (Ах±, х2) и (xv Ах2) соответ- ственно равны следующим выражениям: (^^1» ^г) ~ (^1» ^г)» (^1> -^^2) = ^<2 (Xj, Х2)*). Так как оператор А самосопряженный, то скалярные про- изведения (ЛХц х2) и (хх, Ах2) равны, и поэтому из последних соотношений путем вычитания получаем равенство (Х2 х2) = 0. Поскольку Х2=^= А,*, то из последнего равенства следует равен- ство нулю скалярного произведения (Xj, х2), т. е. ортогональ- ность собственных векторов х2 и х2. Теорема доказана. 3. Норма линейного оператора. Пусть А—линейный оператор, отображающий евклидово пространство V в это же простран- ство. Введем понятие нормы оператора А. Определение 3. Нормой || А || линейного оператора А назы- вается число, определяемое соотношением **) ||Л||= sup [|Лх||. (5.53) IIх 11= 1 Из определения нормы линейного оператора вытекает сле- дующее очевидное неравенство: ]|Лх||<||Л||||х|| (5.54) (для доказательства достаточно воспользоваться соотношением Лх=^Л ||х||). Из соотношения (5.54) следует, что если |]Л|| = 0, то оператор Л является нулевым. Норму самосопряженного оператора А можно определить и другим способом. Именно, справедливо утверждение: Если А—самосопряженный оператор, то введенная выше норма || Л || оператора А равна sup |(Лх, х)|: II X 11= 1 sup |(Лх, х)1 = |)Л||. (5.55) 11*11=1 Доказател ьство. Для любого х из У справедливо нера- венство Коши — Буняковского (см. п. 2, § 3, гл. 4) |(Лх, х) |<|| Лх||||х||. *) Так как собственные значения самосопряженного оператора веществен- ны, то (Х1, Дх2)= ^2 (^1» Xi)= ^2 (Xi, ^2). *♦) Напомним, что || Ах ||= V (Ах, Ах). Отсюда следует, что || Ах || пред- ставляет собой непрерывную функцию х, которая на замкнутом множестве |)х||= 1 достигает конечного наибольшего значения.
134 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Из него и из неравенства (5.54) получаем следующее неравенство: |(ЛХ, х)|<||Л||||х||2. Поэтому число р = sup I (Ах, х)| (5.56) 11*11=1 удовлетворяет соотношению Р<||Л||. (5.57) Отметим, что из равенства (Az, 2Г) = (Лу^| , kll2> ^¥=0, и определения числа р (см. (5.56)) вытекает следующее неравен- ство: |(Лг, £)|<иИ2- (5-58) Обратимся теперь к следующему очевидному тождеству: 4Ие(Лх, >’) = (Л(х+у), х+_у)~(Л(х— у), х— у) (в этом тождестве символ Re (Ах, у) обозначает действительную часть комплексного числа (Ах, у)', само тождество легко вытекает из свойств скалярного произведения, см. п. 1 § 3 гл. 4). Беря левую и правую части этого тождества по модулю, используя свойство модуля суммы и неравенство (5.58), получим следующие соотношения *): 41 Re (АХ, у) К Ц || X + у ||2 + Р-1| X— у ||2 = 2р (|| X ||2 +1|у ||2). Отсюда при || X || = ||^ ||= 1 получаем неравенство |Ке(Лх, J)|<p. Полагая в этом неравенстве у = Лх/||Лх|| (очевидно, ||_у||=1) и учитывая, что число (Ах, Лх)=||Лх ||2 является вещественным (поэтому Re(?lx, Лх) = (Лх, Лх) = ||Лх||2), получим ||Лх|Кр, ||х||=1. Отсюда, согласно неравенству (5.53), найдем ||лкр. Для завершения доказательства остается сравнить полученное неравенство с неравенством (5.57) и воспользоваться определе- нием числа р (см. (5.56)). 4. Дальнейшие свойства самосопряженных операторов. В этом пункте мы докажем ряд важных свойств линейных операторов, связанных с понятием нормы. Сначала мы установим необходимое *) Мы использовали при этом определение нормы элемента в комплек- сном евклидовом пространстве.
§ 5] ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 135 и достаточное условие самосопряженности оператора. Докажем следующую теорему. Теорема 5.18. Для того чтобы линейный оператор А был самосопряженным, необходимо и достаточно, чтобы 1т(Лх, х) = 0*). Доказательство. По теореме 5.13 произвольный линей- ный оператор А может быть представлен в виде A = AR + iA/, где AR и А/—самосопряженные операторы. Поэтому (Ах, x) = (ARx, х)-Н(Л/Х, х)> причем, согласно теореме 5.15, для любого х числа (ARx, х) и (AjX, х) — вещественные. Следовательно, эти числа соответ- ственно равны действительной и мнимой частям комплексного числа (Лх, х): 1?е(Лх, х) = (Л^х, х), 1ш(Лх, х) = (Л7х, х). Допустим, что Л — самосопряженный оператор. По теореме 5.15 в этом случае (Ах, х) — вещественное число, и поэтому 1т(Лх, х) = 0. Необходимость условия теоремы доказана. Докажем достаточность условия теоремы. Пусть 1т(Лх, х) = (Л7х, х) = 0. Отсюда следует, что||Л/|| = 0, т. е. Л7= О. Поэтому A = AR, где AR—самосопряженный опера- тор. Теорема доказана. В следующих утверждениях выясняются некоторые свойства собственных значений самосопряженных операторов. Лемма. Любое собственное значение X произвольного линей- ного самосопряженного оператора А в евклидовом пространстве равно скалярному произведению (Ах, х), где х—некоторый век- тор, удовлетворяющий условию ||х|| = 1: Х = (Лх, х), |]х:|=1. (5.59) Доказательство. Так как X—собственное значение опе- ратора А, то существует такой ненулевой вектор Z, что Az^"/.z. (5.60) Полагая х = г/||г'|| (очевидно, [|х]]= 1), перепишем (5.60) сле- дующим образом: Лх = Хх, || х j| = 1. Отсюда получаем соотно- шения (Ах, х) — Л(х, х) = X|]х |[2 = X, т. е. (5.59) имеет место. Лемма доказана. *) Символ 1m (Дх, х) обозначает мнимую часть комплексного числа (Дх, х). Равенство Im (Ах, х) = 0 означает, что число (Ах, х) является вещественным.
136 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Следствие. Пусть А—самосопряженный оператор и к — любое собственное значение этого оператора. Пусть далее т = inf (Ах, х), М = sup (Ах, х). (5.61) 11*11=1 11*ц=1 Справедливы следующие неравенства: (5.62) Замечание 1. Так как скалярное произведение (АХ, х) представляет собой непрерывную функцию от х, то на замкну- том множестве Цх||=1 эта функция ограничена и достигает своих точных граней т и М. Замечание 2. Согласно теореме 5.16 собственные значе- ния самосопряженного оператора вещественны. Поэтому нера- венства (5.62) имеют смысл. Доказательство следствия. Так как любое собствен- ное значение % удовлетворяет соотношению (5.59), то, очевидно, каждое собственное значение заключено между точными гранями т V. М скалярного произведения (Ах, х). Поэтому неравенства (5.62) справедливы. Мы докажем, что числа т и М, определенные соотношениями (5.61) являются соответственно наименьшим и наиболь- шим собственными значениями самосопряженного оператора Л. Предварительно убедимся в справедливости следующего ут- верждения. Теорема 5.19. Пусть А—самосопряженный оператор и, кроме того, (Ах, х)^0 для любого х. Тогда\\А\\ равна наиболь- шему собственному значению этого оператора *). Доказательство. Мы уже отмечали (см. утверждение предыдущего пункта), что || Л || = sup | (Ах, х)|. Так как (Ах, х)> И*11=1 +г0, то IIЛ || = sup (Ах, х). Согласно замечанию 1 этого пункта ll*ll=i для некоторого х0, ||х0|| = 1, (Ах0, х0) =|| Л || = X. Обращаясь к определению нормы и используя только что написанные равенства, получим соотношения **) ||(Л—%/) х01|2 = || Ах0 ||2—2% (Лх0, х0) + Л2|| х. Ц2 = Ч ЛЦ2-2IIЛIHI л Ц + 11 Л||2-1 =0. Таким образом, (Л—Х/)хо=0, или иначе ______________ Лх^ХХо, *) Так как собственных значений конечное число и они вещественны, то из них можно указать наибольшее. ♦*) Мы также воспользовались равенством 1| Аха ||2 = || А ||2, которое сле- дует из соотношений |1 А [|=(Ах0, х0)=|| Дх0|| и IIЛ11 = SUP II Ах ||. II *11=1
§ 51 ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 137 т. е. А=||Л||—собственное значение оператора А. То, что А.—наибольшее собственное значение, вытекает из только что установленного следствия из леммы этого пункта. Теорема до- казана. Докажем теперь, что числа т и М (см. (5.61)) являются наименьшим и наибольшим собственными значениями самосопря- женного оператора А. Теорема 5.20. Пусть А—самосопряженный оператор, а т и М—точные грани (Ах, х) на множестве ||х|| = 1. Эти числа представляют собой наименьшее и наибольшее собственные значе- ния оператора А. Доказательство. Очевидно, достаточно доказать, что числа т и М—собственные значения оператора А. Тогда из неравенств (5.62) сразу же следует, что т и М являются соот- ветственно наименьшим и наибольшим собственными значениями. Докажем сначала, что М — собственное значение. Для этого рассмотрим самосопряженный оператор В = А—ml. Так как (Вх, х) = (Ах, х)—т(х, х)>0, то оператор В удовлетворяет условиям теоремы 5.19 и поэтому норма || ВЦ этого оператора равна наибольшему собственному значению. Имеем || В ||= sup (Вх, х)= sup (Лх, х)—т = М—т. II х ||=1 11*11=1 Таким образом, (М—tri)— наибольшее собственное значение оператора В. Следовательно, существует такой ненулевой вектор х0, что Вх0 = (/И—т) х0. (5.63) Так как В—А — mJ, то Вх0 = Ах0—т/хи = Ах0—тх0. Подстав- ляя это выражение Вх0 в левую часть равенства (5.63), полу- чим после несложных преобразований соотношение Ах 0 = Мх0. Таким образом, М — собственное значение оператора Л. Убедимся теперь, что число т также является собственным значением оператора Л. Рассмотрим самосопряженный оператор В=—А. Очевидно, —т— sup (Вх, х). Согласно только что проведенному дока- 11 *11=1 зательству число —т представляет собой собственное значение оператора В. Так как В=—А, то т будет являться собствен- ным значением оператора Л. Теорема доказана. В следующей теореме выясняется важное свойство собствен- ных векторов самосопряженного оператора.
138 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ- Б Теорема 5.21. У каждого самосопряженного линейного опера- тора А, действующего в п-мерном евклидовом пространстве V существует п линейно независимых попарно ортогональных и еди- ничных собственных векторов. Доказательство. Пусть —максимальное собственное значение оператора Л(А^= sup (Ах, х)). Обозначим через ег II а: ||=1 собственный вектор, отвечающий и удовлетворяющий усло- вию || gj || = 1 (возможность его выбора следует из доказательства леммы этого пункта). Обозначим через КДп—1)-мерное подпространство простран- ства V, ортогональное к Очевидно, — инвариантное под- пространство оператора А (т. е. если то и AxQVj). Действительно, пусть x^.Vt (т. е. (х, ех) = 0). Тогда *) (Ах, в1) = (х, Ле1) = Х1(х, = Следовательно, Ах—элемент V*, и поэтому — инвариантное подпространство оператора А. Это дает нам право рассматри- вать оператор А в подпространстве Vj. В этом подпространстве А будет представлять собой самосопряженный оператор. Следо- вательно, имеется максимальное собственное значение Х2 этого оператора, которое можно найти с помощью соотношения Х2 = шах (Ах, х). И-Н1=1 х X ег Кроме того, можно указать такой вектор в2, е2 J_ || е2!'= 1, что Ле2 = Х2е2. Обращаясь далее к (п—2)-мерному подпространству V2, орто- гональному векторам ег и е2 и повторяя проведенные выше рассуждения, мы построим собственный вектор е3, ||е31| = 1, ортогональный и е2. Рассуждая и далее таким же образом, мы последовательно найдем п взаимно ортогональных собствен- ных векторов е2, .... удовлетворяющих условию ||ez 1| = 1, i — 1, 2, .. ., п. Замечание 1. Договоримся в дальнейшем нумеровать соб- ственные значения самосопряженного оператора в порядке убы- вания с учетом повторяющихся, т. е. кратных собственных значений. При этом Ах^Л2^...^Х„ и отвечающие им соб- ственные векторы eit е2, ..еп можно считать взаимно орто- гональными и удовлетворяющими условию ||ez|| = l. Таким образом, (е. 1 ПРП 1’ = л 1 \ 0 при i =^= j. *) Мы использовали свойство самосопряженности оператора (Ах, «1) = = (х, Aej и то обстоятельство, что в! — собственный вектор оператора: Ае± —
$ 51 ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 139 Замечание 2. Из рассуждений в доказательстве теоремы 5.21 следует соотношение Vn== max x-‘-ek fc=l, 2, ... (Ах, х) (X, X) т Это соотношение можно также записать в виде + max х±Ет (Ах, х) (х, х) где Ет— линейная оболочка векторов е2, ..., ет. Справед- ливость замечания вытекает из того, что (х, х) = || х j|2, и поэтому (Ах, х) ( д х х А (х, х) ||х|| ’ ||х|| ) ’ причем норма элемента х/||х|| равна 1. Пусть —множество всех m-мерных подпространств про- странства V. Справедливо следующее важное минимаксное свойство собственных значений. Теорема 5.22. Пусть А—самосопряженный оператор и \it Х2, .... —его собственные значения, занумерованные в порядке, указанном в замечании 1. Тогда Ч+1 = min max . (5.64) EE.Gmx S.E V*> x> Доказательство. Пусть Em—линейная оболочка собст- венных векторов ei, е2, ...,ет оператора А (см. замечание 1). В силу замечания 2 max (Ах’х^ — 1 (Х.Х) "+I Поэтому для доказательства теоремы достаточно убедиться в справедливости соотношения m-Y (Ах,х)^ гпах (Ах,х) . ШаЛ -------------------г“ , п 7----Г" — А х±ЕСг (**) ХёЕп (Х’Х) (д.№) для любого Е£&т- Перейдем к доказательству соотношения (5.65). Обозначим символом £-*- ортогональное дополнение подпро- странства Е (см. п. 3 § 2 гл. 4). Из теоремы 2.10 следует, что размерность Е1- равна п—т. Следовательно, dim .E-L-j-dim Em+i = (п—tri) + (m+ 1) = n -f-1 > n. Это означает, в силу теоремы 2.9, что пересечение под- пространств и £т+1 содержит ненулевой элемент. Итак, существует элемент х такой, что Цлг|| = 1, х€Еп+1,
140 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 т+1 т. е. х = 2СЛ- Так как ||х|| = 1 и базис е1( е2, ..em+i орто- k— 1 нормированный, то в силу теоремы Пифагора (см. и. 2 § 1 гл. 4) т + 1 1Й12=£Ы2=1. (5.66) Л=1 m+1 т +1 Имеем далее Ах = А 2 ckek= S ckAek. Поскольку ek—собст- a=i k=i венные векторы оператора А, то из последних соотношений получаем т + I Ах = 2 c^keh. k=i Отсюда и из ортонормированности ek следует справедливость соотношения /т+1 т+1 \ т+1 (Ах, х) =( 2 ^кек, 2 Ср^р) = Skfe (5-67) \ А= 1 р= 1 / i= 1 Мы занумеровали собственные значения в порядке убывания с учетом возможной их кратности. Поэтому Ат+1^+А, А=1,2, Отсюда и из соотношений (5.67) и (5.66) получаем т+1 т+1 (АХ, X) = 2 I ck ^'т + 1 2 | ск |2 — ^т + 1- А=1 *=1 Замечая, что для любого х#=0 норма элемента Х/||х|| равна 1 и fix||= 1, а также учитывая, что х_]_£, имеем max = max f А -йД- , -тД-') (Ах, х) A +f. (Х’Х) л:1Е \ 11*11 11*11/ К ’ Л + 1 Итак, соотношения (5.65) установлены. Теорема доказана. 5. Спектральное разложение самосопряженных операторов. Теорема Гамильтона—Кэли. Рассмотрим самосопряженный опе- ратор А и собственные значения Ап этого опе- ратора. При этом «1, е2, ..., еп—ортонормированный базис, состоящий из собственных векторов, отвечающих {А.,}. Пусть xgV. Тогда п х=2(х, еА)еА (5.68) fe= 1 (см. п. 3 § 2 гл. 4), а так как АеА = ХАеА, то с помощью (5.68) получаем п Ах^^^х,е^ек. (5.69) А= 1
§ 51 ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 141 Оператор Рк, определяемый соотношением Ркх = (х, ек)ек, (5.70) называется проектором на одномерное подпространство, порожденное вектором ек. Из свойств скалярного произведения сразу же следует, что Рк—самосопряженный линейный оператор. Отметим следующие важные свойства проекторов: 1°. Pk = Pk(отсюда следует, что Рк=Рк, гдет—натуральное). 2°. PkPj = Q, где /г=И=/- Доказательство этих свойств следует из соотношений (PkPj) х = Рк (Pj-x) = Рк (х, е{) е, = , ч. J (*, ек) ек при k = /, = (х,еу)(е7,е.)в,= | д при Заметим также, что непосредственно из определения (5.70) следует, что Рк коммутирует с каждым оператором, который коммутирует с А. Из соотношений (5.68), (5.69) и (5.70) получаем следующие выражения для х и Ах: Х=^Ркх, (5.71) fe=i Лх = 2 ЧРкх. (5.72) п Из равенства (5.71) следует, что оператор 2 Рк является k = 1 тождественным: /= 2 Рк- (5.73) k=i Из равенства (5.72) получаем так называемое спектраль- ное разложение самосопряженного оператора: п А = 2 Ккрк. (5.74) fe=i Из свойств 1° и 2° проекторов и из соотношения (5.74) вы- текает следующее выражение для А2: А2 = 2 ЦРк. k=i Очевидно, вообще для любого целого положительного s Af = 2 ЧРк- (5.75) k = 1
142 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. S т Рассмотрим произвольный полином p(X)t= 2 СА'- По опре- 1 = 1 т делению считают Обращаясь к соотношению (5.75), легко получить следующее выражение для р(А): т p(A)=2p(W. (5.76) i = 1 Докажем следующую теорему. Теорема 5.23 (теорема Гамильтона—Кэли). Если А — самосопряженный оператор и p(X)=det(4 — л/)—характерис- тический многочлен этого оператора, то р(А) = 0. Доказательство. Действительно, если А—самосопря- женный оператор и X,-—собственные значения этого оператора, то, согласно теореме 5.8, X,- является корнем характеристичес- кого уравнения, т. е. р(Х,-) = О. Отсюда и из соотношения (5.76) следует, что р(Л)=0. Теорема доказана. 6, Положительные операторы. Корни т-й степени из опера- тора. Самосопряженный оператор А называется положитель- ным, если для любого х из V справедливо соотношение (Ах, х) > 0. (5.77) Если оператор А—положительный и из условия (Ах, х) = 0 следует, что х = 0, то А называется положительно опре- делен ным оператором. Положительные и положительно определенные операторы соответственно обозначаются символами А^О и А > 0. Отметим следующее простое утверждение. Каждое собственное значение положительного (положительно определенного) оператора неотрицательно (положительно). Это утверждение следует из простых рассуждений. Пусть X — собственное значение оператора А. Тогда, согласно лемме п. 4 этого параграфа, можно указать такой элемент х, Цх||= 1, что % = (Ах, х). Отсюда и из соотношения (5.77) получаем, что 1^0 для положительных операторов и К > О для положительно опреде- ленных операторов. Утверждение доказано. Введем понятие корня т-й степени (т — натуральное число) из оператора. Определение. Корнем т-й степени из оператора А назы- вается оператор В такой, что Впг=А.
$ 5J ЛИНЕЙНЫЕ САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ 143 Корень т-й степени из оператора А обозначается симво- лом 41/т. Естественно выделить какой-либо класс операторов, для ко- торых имела бы смысл операция нахождения корня т-й сте- пени. Определенный ответ на этот вопрос дается следующей теоремой. Теорема 5.24. Пусть А — положительный самосопряженный оператор, 4^0. Тогда для любого натурального т существует положительный самосопряженный оператор A1!"1, 41/т^0. Доказательство. Обозначим через ^ — собственные зна- чения оператора 4, и пусть {eft}—ортонормированный базис из собственных векторов. Обозначим далее через Рк—проектор на одномерное подпространство, порожденное вектором ек. Согласно предыдущему пункту имеет место спектральное разложение (5.74) самосопряженного оператора А: л = 2 k=t (5-74) Так как (см. только что доказанное утверждение), то можно ввести следующий самосопряженный оператор В: В=% /г=1 (5.78) Согласно (5.70) справедливо соотношение (Ркх, х)>0, из которого следует положительность операторов Рк и положи- тельность оператора В (см. (5.78)). Из свойств 1° и 2° проекторов Рк (см. п. 5 этого параграфа) вытекает, что Вт = 2 ^кРк. Сравнивая это выражение для Вя k= I с выражением (5.74) для А, получим Вт — А. Выше была уста- новлена положительность оператора В. Теорема доказана. Замечание 1. Отметим без доказательства, что сущест- вует единственный положительный оператор А1/т. Замечание 2. В ортонормированном базисе {ек} собствен- ных векторов оператора А матрица оператора А1/т имеет сле- дующий вид:
144 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ., 5 § 6. Приведение квадратичной формы к сумме квадратов В этом параграфе мы изучим вопрос о выборе такого бази- са, в котором квадратичная форма (инвариантная квадратич- ная функция координат вектора; точно это понятие определяет- ся ниже) имеет наиболее простой вид. Квадратичные формы подробно изучаются в главе 7. Там будут, в частности, рассмотрены различные способы приведения таких форм к сумме квадратов. Введем понятие так называемых эрмитовых форм. Определение. Полуторалинейная форма В(х,у) называется эрмитовой, если для любых х и у справедливо соотношение В(х,у) = В(х, у). (5.79) Согласно следствию из теоремы 5.11 любая полуторалиней- ная форма В(х,у) (в том числе и эрмитова) может быть един- ственным образом представлена в виде В(х,у) = (Ах,у), (5.80) где А—линейный оператор. Докажем следующие два утверждения, в которых выясня- ются условия, при которых полуторалинейная форма является эрмитовой. Теорема 5.25. Для того чтобы полуторалинейная форма В(х, у) являлась эрмитовой, необходимо и достаточно, чтобы оператор А в представлении (5.80) этой формы был самосопря- женным (Л = Л*). Доказате льство. Действительно, если А — самосопря- женный оператор, то, используя свойства скалярного произве- дения, получим в (х, У) = (Ах, У) = (х, Ау) = (Ау, х) = В (у, х). Таким образом, выполнено соотношение (5.79), т. е. форма В(х, у) = (Ах,у) является эрмитовой. Если же форма В (х, у) = (Ах, у) эрмитова, то, опять обра- щаясь к свойствам скалярного произведения, получим равенства (Ах, у) = В (х, у) = В (у, х) — (Ау, х) = (х, Ау). Таким образом, (Ах, у) = (х, Ау), т. е. оператор Л является самосопряженным. Теорема доказана. Теорема 5.26. Для того чтобы полуторалинейная форма В (х, у) была эрмитовой, необходимо и достаточно, чтобы функ- ция В(х,х) была вещественной. Доказательство. Форма В(х,у) будет эрмитовой в том и только в том случае, когда линейный оператор А в представ- лении (5.80) этой формы является самосопряженным (см. тео-
S 61 ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 145 рему 5.25). Согласно же теореме 5.18, для того чтобы опера- тор А был самосопряженным, необходимо и достаточно, чтобы для любого х скалярное произведение (Ах, х) было веществен- ным. Теорема доказана. Введем теперь понятие квадратичной формы. Пусть В(х, у)—эрмитова форма. Квадратичной формой, соответствующей форме В(х, у), называется функция В(х, х). Докажем следующую теорему о приведении квадратичной формы к сумме квадратов. Теорема 5.27. Пусть В(х,у)—эрмитова форма, определен- ная на всевозможных векторах х и У п-мерного евклидова про- странства V. Тогда в этом пространстве существует такой ортонормированный базис {ей} и можно указать такие вещест- венные числа что для любого х, принадлежащего V, квадра- тичная форма В (х, х) может быть представлена в виде сле- дующей суммы квадратов координат вектора х в базисе {еА}: п В(ж,х)=2ЧЫ2- (5-81) fe= 1 Доказательство. Так как форма В(х, у) эрмитова, то, согласно теореме 5.25, существует самосопряженный оператор А такой, что В(х,у)~(Ах, у). (5.82) Обратимся теперь к теореме 5.21. По этой теореме для опе- ратора А можно указать ортонормированный базис (ей) из соб- ственных векторов этого оператора. Если —собственные зна- чения A, a Ъ,к—координаты вектора х в базисе так что п х = 2 (5.83) А=1 то, используя формулу (5.12) и соотношение Аек = Ккек*), по- лучим следующее выражение для Ах: Ах= 2 (5.84) fe=i Из (5.83), (5.84) и ортонормированности базиса получим следующее выражение для (Ах, х): п (Ах, ж)=2Ч1^1г- fe=l *) Это соотношение следует из того, что ХА и ек—соответственно собст- венные значения и собственные векторы оператора А.
146 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. в Из этого выражения и из соотношения (5.82) получим (5.81). Теорема доказана. Докажем теперь важную теорему об одновременном приве- дении двух квадратичных форм к сумме квадратов. Теорема 5.28. Пусть Д (х, у) и В(х,у)—эрмитовы формы, определенные на всевозможных векторах х и у п-мерного линей- ного пространства V. Допустим далее, что для всех ненулевых элементов х из V имеет место неравенство В (х, х) > 0. Тогда в пространстве V можно указать базис {eft} такой, что квад- ратичные формы А (х, х) и В (х, х) могут быть представлены в следующем виде-. Д(х,*)=2ЧШ2, (5.85) к = 1 В(х,х)= S |Ь12, (5.86) k= 1 где Кк—вещественные числа, а —координаты вектора х в ба- зисе {ей}. Доказательство. Так как свойства скалярного произ- ведения и свойства эрмитовой формы В(х,у) при дополнитель- ном требовании о том, что В(х, х) > 0 при х=^6, формули- руются одинаково, мы можем ввести в линейном пространстве V скалярное произведение (х, у) векторов, полагая (x,j) = B(x,^). (5.87) Таким образом, V—представляет собой евклидово пространство со скалярным произведением (5.87). По теореме 5.27 можно указать в V такой ортонормирован- ный базис {еД и такие вещественные числа что в этом базисе квадратичная форма А (х, х) будет представлена в ви- де (5.85). С другой стороны, в любом ортонормированном базисе ска- лярное произведение (х, х), равное, согласно (5.87), В(х, х), равно сумме квадратов модулей координат вектора х. Таким образом, представление В (х, х) в виде (5.86) также обосновано. Теорема доказана. § 7. Унитарные и нормальные операторы В этом параграфе рассматриваются свойства важного класса операторов, действующих в евклидовом пространстве V. Определение 1. Линейный оператор U из L(V,V) называет- ся унитарным, если для любых элементов х и у из V спра- ведливо соотношение (Ux,Uy) = (x,y). (5.88)
S7] УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 147 В дальнейшем соотношение (5.88) будем называть условием унитарности оператора. Замечание 1. Из условия (5.88) унитарности оператора сле- дует, qfo для любого унитарного оператора U справедливо равенство т=1И1- Отметим следующее утверждение. Если X—собственное значение унитарного оператора U, то 1М = 1. Действительно, если А — собственное значение U, то суще- ствует такой элемент е, что || е || = 1 и Ue = Хе. Отсюда и из замечания 1 следуют соотношения |X[ = ||Xe|| = l|£Ze||=||e||= 1. Утверждение доказано. Докажем следующую теорему. Теорема 5.29, Для того чтобы линейный оператор U, дей- ствующий в евклидовом пространстве V, был унитарным, необхо- димо и достаточно, чтобы было выполнено соотношение U* = U~\ (5.89) Доказательство. 1) Необходимость. Пусть опера- тор U унитарный, т. е. выполнено условие (5.88). Обращаясь к определению сопряженного оператора U*, можно переписать это условие в следующей форме *) (U*Ux, у) = (х, у), (5.90) или, иначе, для любых х и у выполняется равенство ((U*U—l)x, 30 = 0. Фиксируя в этом равенстве любой элемент х и считая у произвольным, получим, что линейный оператор U*U—1 ствует по правилу (U*U—T)x = 0. Следовательно, U*U~l. Совершенно аналогично можно убе- диться, что UU* = I. Таким образом, U и U* — взаимно обратные операторы, т. е. соотношение (5.89) выполнено. Необходимость условия теоремы доказана. *) Напомним, что оператор U* называется сопряженным к оператору U, если для любых г и у выполняется соотношение (z, Uy) = (Ug, у). Полагая Z=Ux, получим (5.90),
148 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 2) Достаточность. Пусть выполнено условие (5.89). Тогда, очевидно, UU* U*U=I. Обращаясь к определению сопряженного оператора и используя только что написанные соотношения, получим при любых х и у равенства (Ux, Uy) = (х, U*Uy) = (х, /у) = (х, у). Таким образом, условие (5.88) унитарности оператора выпол- нено. Следовательно, оператор U унитарный. Теорема доказана. Замечание 2. В процессе доказательства теоремы уста- новлено, что условие (5.88) унитарности оператора U и условие U*U=UU* = I (5.91) эквивалентны. Таким образом, в основу определения унитар- ного оператора можно положить условие (5.91). Это условие также можно называть условием унитар- ности оператора U. Введем понятие нормального оператора. Определение 2. Линейный оператор А называется нор- мальным, если справедливо соотношение А* А = ЛЛ*. (5.92) Обращаясь к условию (5.91) унитарности оператора и к усло- вию (5.92), мы видим, что любой унитарный оператор является нормальным оператором. Нам понадобится следующее вспомогательное утверждение. Лемма, Пусть А — нормальный оператор. Тогда оператор А и оператор А* имеют общий собственный элемент е такой, что ||е|| = '1> и справедливы соотношения Ае~ Ке и А*е = \е. Доказательство. Пусть X—собственное значение опера- тора А, и пусть /?х = кег(Л — V). Иными словами, —мно- жество всех элементов х таких, что Ах—Хх = 0. Убедимся теперь, что если х принадлежит 7?;., то и А*х принадлежит Действительно, если Ах = кх (т. е. x£Rk), то, поскольку А — нормальный оператор, А (Л*х) = Л* (Лх) = Л* (Хх) = X (Л*Х). Иными словами, вектор А*х является собственным вектором оператора Л и отвечает собственному значению Л, т. е. при- надлежит Их-
§ 7] УНИТАРНЫЕ И НОРМАЛЬНЫЕ ОПЕРАТОРЫ 149 Рассматривая далее оператор А* как оператор, действующий из в и используя вывод следствия из теоремы 5.8 о том, что каждый линейный оператор имеет собственное значение, мы можем утверждать, что в R}. существует элемент е такой, что 1|е||=1 и справедливы соотношения Л*е = ре и Ле = Хе. Используя эти соотношения и условие ||е||=1, найдем (Ае, е) = (ке, е) = А ||е||2 = А/ (е, Л*е) = (е, ре) = р.|| е||2 = р. Так как (Ле, е) = (е, Л*е), то, очевидно, Х = р. Лемма доказана. Докажем теперь следующую теорему. Теорема 5.30. Пусть А—нормальный оператор. Тогда суще- ствует ортонормированный базис {ей}> состоящий из собствен- ных элементов операторов А и А*. Доказательство. Согласно только что доказанной лемме операторы Л и Л* имеют принадлежащий V общий собственный элемент eit причем || ег|| = 1. Собственные значения для операто- ров Л и Л‘, соответствующие ех, равны соответственно й Ар Пусть Ух—ортогональное дополнение элемента е2 до про- странства V. Иными словами, V\—совокупность всех х, удов- летворяющих условию (х, е1) = 0. Докажем, что если х принадлежит У1( то Ах и А*х при- надлежат Ур Действительно, если (х, то (Ах, е2) = (х, А*е1) = (х,^1е1) = К1(х, еу) = 0, т. е. Ax^Vp Аналогично, если (х, 6^ = 0, то (Л*х, е1) = (х, Ле1) = (х, А1е1) = А1(х, 6^ = 0, т. е. A*x^Vi. Таким образом, Vj—инвариантное подпространство операто- ров Л и Л*. Поэтому по только что доказанной лемме в под- пространстве Ух существует общий собственный элемент е2 опе- раторов Л и Л* такой, что ||е2||=1, Л^2 == ^*2^2» А @2 ^2^2* Далее мы обозначим через У2 ортогональное дополнение эле- мента е2 до Ур Рассуждая так же, как и выше, мы докажем, что в Уг есть общий собственный элемент е3 операторов Л и Л* такой, что ||е3Ц = 1. Продолжая аналогичные рассуждения, мы, очевидно, построим в пространстве У ортонормированный базис {ек}, состоящий из собственных элементов операторов Л и Л*. Теорема доказана. Следствие 1. Пусть А—нормальный оператор. Существует базис (еД, в котором А имеет диагональную матрицу.
150 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Действительно, по только что доказанной теореме сущест- вует базис {ей} из собственных векторов оператора А. Согласно теореме 5.9 в этом базисе матрица оператора А диагональна. Следствие 2. Унитарный оператор имеет полную ортонор- мированную систему собственных векторов. Следующая теорема является обратной для теоремы 5.30. Тебрема 5.31. Если у действующего в п-мерном евклидовом пространстве V оператора А имеется п попарно ортогональных собственных элементов eit е2, .... еп, то оператор А нормальный. Доказательство. Пусть — попарно ортогональные собственные векторы оператора А. Тогда Aek — hkek, и, соглас- но (5.69), имеет место следующее представление оператора А*): Ах= ek)ek. k= i Докажем, что сопряженный оператор А* действует по правилу п _ А*у — S Кк(у, ек)ек. (5.93) й=1 Мы убедимся в этом, если докажем справедливость равенства (х, А*у) = (Ах, у). (5.94) Подставляя в левую часть этого равенства выражение А*у по формуле (5.93), получим после несложных преобразований п п (х, А*у)= 5 (х, 1к(у, ек)ек)~ S Ч(У> ек)(х, ек)^ fe=l fe=l п = S К (х, ек) (ек, у) = (Ах, у). k= 1 Таким образом, равенство (5.94) доказано, и поэтому опера- тор А*, действующий по правилу (5.93), является сопряжен- ным к оператору А. Чтобы завершить доказательство теоремы, нужно убедиться в справедливости равенства (5.92): л*л=лл*. *) Представление (5.69) справедливо для любого оператора, имеющего п попарно ортогональных собственных векторов.
S 8] КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ Имеем, согласно (5.93)*), АА*х = S Хй(х,еА)ЛеА = 1 - S ЧМ*, ек)ек = 2 ек')ек = А*Ах. k=i k=i Итак, для операторов А и А* справедливо равенство (5.92), и, следовательно, оператор А является нормальным. Теорема дока- зана. § 8, Канонический вид линейных операторов В этом параграфе рассматривается вопрос о выборе для заданного линейного оператора специального базиса, в котором матрица этого оператора имеет простейший вид, называемый жордановой формой матрицы. Введем понятие присоединенного элемента опера- тора А. Определение. Элемент х называется присоединенным элементом оператора А, отвечающим собственному значению К, если для некоторого целого т~^Л выполняются соотношения (А—М)тх=£0, (Л — М)т+1х = 0. При этом число т называется порядком присоединен- ного элемента х. Иными словами, если х—присоединенный элемент порядка т, то элемент (А — КГ)тх является собственным вектором опера- тора А. В этом параграфе мы докажем следующую основную теорему. Теорема 3.32. Пусть А—линейный оператор, действующий в п-мерном евклидовом пространстве V. Существует базис {в/7}, k = 1, 2, ..., /; /и= 1, 2.пк, /71Ч-п2+ ... +nt = n, (5.95) образованный из собственных и присоединенных векторов опера- тора А, в котором действие оператора А описывается следую- щими соотношениями: Ael=bkel, /г =1,2..../; AeT = ^k+e^-\ k= 1, 2, ..., I; m = 2, 3, ..., nk. (5.96) Прежде чем перейти к доказательству, сделаем ряд замечаний. *) Мы воспользовались так же соотношениями Aek = \kek.
152 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Замечание 1. Очевидно, векторы el (k = 1, 2, ..., I) базиса (5.95) являются собственными векторами оператора А, отвечающими собственным значениям Xfe. Из определения присоединенных векторов и соотношений (5.96) следует, что векторы eg1 (fe= 1, 2, ..., I; т — 2, 3, ..., пк) явля- ются присоединенными векторами порядка пг, отвечающими собственным значениям соответственно. Замечание 2. Обращаясь к формулам (5.13) и (5.12), мы видим, что соотношения (5.96) действительно определяют дейст- вие оператора А в пространстве V при заданном базисе {е™}. Замечание 3. Матрица А линейного оператора А в базисе {е™} имеем следующий «клеточный» вид: fAj О Ла (5.97) VO AJ где клетка ЛА представляет собой следующую матрицу: 1 О ... О \ О X* 1 ... о \ (5.98) о о о ... 1 / о о о ... ЛЛ/ Замечание 4. Форма (5.97) матрицы А линейного опера- тора А называется жордановой формой матрицы этого оператора. При этом клетка Лй обычно называется жордано- вой клеткой матрицы А. Отметим, что теорему 5.32 о приве- дении матрицы оператора к простейшему виду (5.97) называют теоремой о приведении матрицы оператора к жордановой форме. Замечание 5. Жорданова форма матрицы (5.97) опреде- лена с точностью до порядка расположения клеток ЛА по диа- гонали матрицы. Этот порядок зависит от порядка нумерации собственных значений %ft. Мы дадим доказательство теоремы 5.32, предложенное А. Ф. Филипповым*). Доказательство теоремы 5.32. Для доказательства теоремы применим метод индукции. При п=1 утверждение тео- ремы очевидно. Пусть п > 1 и теорема верна для пространств размерности Меньше п. Докажем, что при этом предложении она верна и для пространств размерности п. Этим и будет завершено доказательство теоремы. *) А. Ф. Филиппов, Краткое доказательство теоремы о приведении матрицы к жордановой форме, Вестник Московского университета, №2, 1971.
§ 8J КАНОНИЧЕСКИЙ ВИД ЛИНЕЙНЫХ ОПЕРАТОРОВ 153 Пусть 1—собственное значение оператора А. Согласно тео- реме 5..8 это число является корнем характеристического урав- нения det (А — М) = 0. Следовательно, ранг г линейного опе- ратора *) В—A —XZ (5.99) меньше п, т. е. г < п. Линейный оператор В отображает пространство V на подпро- странство imB. Поэтому оператор В отображает подпространство imB размерности г<п в это же подпространство. По предпо- ложению индукции в imB есть базис {Л*}> k= 1, 2, ..., р\ т = 1, 2, ..., гй; гх + г2 + ... + гр = г, (5.100) в котором действие оператора В из im В в im В дается следую- щими соотношениями: = fe=I, 2, ..., р, I ВЛ^^р^ + ЛГ1- й=1,2, ...,р; т = 2, 3...rk. I { ’ Таким образом, в этом базисе матрица В оператора В, дейст- вующего из imB в imB**), имеет следующий клеточный вид: 'Mi 0 ‘ о MpJ (Pj, 1 о ... о 0 1 ... о ............... О О 0 ... 1 О О 0 ... щ (5.102) Пусть лишь первые /n1(/n1^0) собственных значений опера- тора В равны нулю. Так как ранг каждой клетки Mk (см. (5.102)), для которой pft = 0, равен rk—1, а ранг клетки, для которой 0, равен гк, р то, согласно (5.100), ранг матрицы В равен 2 гь—т^ — г—тк. k= 1 Поэтому размерность подпространства кег В равна тг ***) и кег В представляет собой линейную оболочку векторов Л), h}, ..hlme Эти векторы в силу линейной независимости образуют базис в кег В. Очевидно, кег В а кег В. Дополним базис Л}, h\.... в кегВ до базиса в кегВ векторами k—1, 2, ..., т0, *) Напомним, что ранг г линейного оператора В равен размерности imB; согласно теореме 5.6 ранг г равен рангу матрицы этого оператора. **) Символом В мы будем обозначать оператор В, действующий из im В в im В. ***) Ранг матрицы В равен dim im В. Согласно теореме 5.1 dim im/H- + dimker Д=г. Следовательно, dim кег В=т±.
154 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. Б т0~п—г — пц /размерность кег2? по теореме 5.1 равна п—dimimB, т. е. равна п — г). Так как gk g ker В, то Bgk = Q. (5.103) Обратимся теперь к векторам k = 1, 2, ..., тк. Поскольку эти векторы принадлежат im В, то существуют такие векторы что Bfk — hkk, *=1,2, .... mi. (5.104) Докажем теперь, что векторы ftj?(fe=l, 2, р; т=1, 2, ..., rfc), 1 - firft(*=l, 2, ...,/n0),/A(fe=l, 2, ...lffll) / линейно независимы. Рассмотрим следующую равную нулю линейную комбина- цию f этих векторов: Р rk т0 mt /= 2 2 + 2 4kfk = 0. (5.106) k = 1 m= 1 1 = 1 Рассмотрим действие оператора В на этот элемент f. Получим согласно (5.101), (5.103) и (5.104), следующее выра- жение 'р Р I гк mt Bf= 2 2! 2 W1) + 2 чМ = о. (5.107) & = 1 k— 1 т=2 k — 1 Соотношение (5.107) представляет собой равную нулю линей- ную комбинацию базисных векторов {Л™}; поэтому коэффициенты при этих векторах в указанной линейной комбинации равны нулю. Поскольку рА = 0 при то из (5.107) следует, что коэффициенты при hkk в точности равны ук, и поэтому yft = 0. Отсюда и из соотношения (5.106) получаем равенства g = 2 = — 2 2 (5.108) А=1 k—1т=1 из которых следует, что вектор g, представляющий собой линей- ную комбинацию векторов (g-Д, принадлежит ker В (напомним, что векторы {gft} составляют часть базиса в ker В). С другой стороны, из (5.108) вытекает, что g представляет собой линейную комбинацию векторов hk, т. е. принадлежит imZ?. Следовательно, g принадлежит ker В (напомним, что ker 2? есть пересечение imB и kerВ), и поэтому g= 2 &кЬк-
§9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 155 Так как линейные оболочки наборов векторов {g-J и {А*} имеют общим лишь нулевой элемент (эти наборы вместе обра- зуют базис в kerВ) и, как мы установили, gr принадлежит каж- дой из упомянутых линейных оболочек, то ^=0. Но тогда из (5.108) следует, что |Зй = О(/г=1,2...та) и aftCT = 0 (fe=l, 2, ..., р; т=1, 2, ..., rft). Итак, все коэффициенты в линейной комбинации (5.106) век- торов (5.105) равны нулю, т. е. векторы (5.105) линейно не- зависимы. Общее число векторов (5.105) равно г -\-та + ть Так как тЛ — п—г—tn-i (это было установлено выше в доказательстве при введении векторов gj, то общее число векторов (5.105) равно п и поэтому они образуют базис в V. Обозначим Д = /#+1 (5.109) и запишем векторы этого базиса в следующей последователь- ности серий: tei}; teJ; •••; tej; \ \h\, ..., hrb, A'*+1}, A= 1, 2..... I (5.110) {h\, ..., К*}, k = mi + l, .... p, ) Рассмотрим действие оператора В на векторы базиса (5.110) в пространстве V. Обращаясь к соотношениям (5.101), (5.103), (5.104) и (5.109), убедимся, что действие В в базисе (5.110) дается соотношениями Bgk = 0. k — 1, 2, ..., m0, Bti^1 = hrkk, fe=l, 2, . и соотношениями (5.101). Итак, в базисе (5.110) оператор В —А — XZ действует по пра- вилу (5.96), указанному в формулировке теоремы 5.32. Но тогда в этом базисе и оператор A = B + XZ действует по этому же пра- вилу. Теорема доказана. § 9. Линейные операторы в вещественном евклидовом пространстве В этом параграфе мы покажем, каким образом определения и результаты предыдущих параграфов переносятся на случай вещественных евклидовых пространств. 1. Общие замечания. Рассмотрим произвольное п-мерное вещественное евклидово пространство V и оператор А, дейст- вующий из V в V.
156 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Понятие линейного оператора для случая вещественного линейного пространства формулируется в полной анало- гии с соответствующим понятием для комплексного прост- ранства. Определение 1. Оператор А называется линейным, если для любых элементов x^V и и любых вещественных чисел аир выполняется равенство А (ах +PJ) = аАх + $Ау. (5.111) В полной аналогии с комплексным пространством вводится понятие собственного значения и собственного вектора оператора. Важно заметить, что собственные значения являются кор- нями характеристического уравнения оператора. Обратное утверждение в вещественном случае верно лишь тогда, когда соответствующий корень характеристического урав- нения вещественный. Только в этом случае указанный корень будет сообственным значением рассматриваемого линейного опе- ратора. В связи с этим естественно выделить какой-либо класс линейных операторов в вещественном евклидовом пространст- ве, все корни характеристических уравнений которых вещест- венны. В доказанной выше теореме 5.16 было установлено, что все собственные значения самосопряженного оператора вещественны. Кроме того, понятие самосопряженного оператора играло важ- ную роль в выводах § 6 настоящей главы о квадратичных фор- мах. Естественно поэтому перенести понятие самосопряженного оператора на случай вещественного пространства. Предварительно введем понятие оператора Л*, сопряженного к оператору А. Именно, оператор А* называется сопряженным к А, если для любых х и у из V выполняется равенство (Ах, у) = (х, АУ). Без затруднений на случай вещественного пространства пере- носится теорема 5.12 о существовании и единственности сопря- женного оператора. Напомним, что доказательство теоремы 5.12 опирается на по- нятие полуторалинейной формы. В вещественном случае вместо полуторалинейной формы следует воспользоваться билинейной формой В(х, у). По этому поводу в п. 2 § 4 гл. 5 сделано соответствующее замечание. Напомним в связи с этим определение билинейной формы в любом вещественном не обязательно евклидовом линейном пространстве L. Пусть В—функция, сопоставляющая каждой
$ Й ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 157 упорядоченной паре (х, у) векторов xgL и y^L вещественное число В (х, у). Определение 2. Функция В (х, у) называется билинейной формой, заданной на L, если для любых векторов х, у и г из L и любого вещественного числа % выполняются соотношения B(x + z, у) = В(х, y) + B(z, у), А В(х, y + z) = B(x, у) + В(х, z), 1 (5.112) В (Кх, у) = В (х, Ку) = КВ (х, у). J Важную роль в данном параграфе будет играть специальное представление билинейной формы В (х, у) в виде В(х, у) = (Ах, у), (5.113) где А — некоторый линейный оператор. Соответствующая теорема (теорема 5.11) об аналогичном представлении полуторалинейной формы в комплексном пространстве опиралась на выводы леммы п. 1 § 4 настоящей главы о специальном представлении линей- ной формы /(х). В конце указанного пункта отмечалось, что эта лемма верна и в вещественном пространстве. Заметим только, что в доказательстве леммы выбор элементов Л* нужно произ- водить не по формуле (5.41), а с помощью формулы hk = f(ek), где /(х)—данная линейная форма в вещественном пространстве. В § 6 настоящей главы были введены эрмитовы формы. Эрмитова форма—это полуторалинейная форма В(х, у) в комп- лексном пространстве, характеризующаяся соотношением В(х, у) = В(у, х) (черта над В означает, что берется комплексно сопряженное значение для В). В случае вещественного пространства аналогом эрмитовых форм служат симметричные билинейные формы. Такая форма характеризуется соотношением В(х, У) = В(у, х). (5.114) Билинейная форма В(х, у), заданная на линейном простран- стве L, называется кососимметричной, если для любых векто- ров х и у из L выполняется соотношение В(х, у) = — В(у, х). Очевидно, что для каждой билинейной формы функции В^х, у)=±[В(х, у) + В(у, х)] и Вг(х, У) = ^[В(х, у)—В (у, х)]
158 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ._5 являются соответственно симметричной и кососимметричной би- линейными формами. Поскольку В(х, = у) + В2(х, у), то мы получаем следующее утверждение: Любую билинейную форму можно представить в виде суммы симметричной и кососимметричной билинейной формы. Нетрудно видеть, что такое представление является единст- венным. Мы докажем следующую теорему о симметричных билиней- ных формах (эта теорема служит аналогом теоремы 5.25 об эрмитовых формах). Теорема 5.33. Для того чтобы билинейная форма В(х, у), заданная на всевозможных векторах х и у вещественного евкли- дова пространства V, была симметричной, необходимо и доста- точно, чтобы линейный оператор А, фигурирующий в представ- лении (5.113), был самосопряженным. Доказательство. Если А — самосопряженный оператор, то, используя свойства скалярного произведения, получим В(х, у) —(Ах, J) = (x, Ау) — (Ау, х) = В(у, х). Таким образом, выполняется соотношение (5.114), т. е. би- линейная форма В(х, у) = (Ах, у) симметричная. Если же форма В(х, у) = (Ах, у) симметричная, то спра- ведливы соотношения (Лх, у) = В(х, у) = В(у, х) = (Ау, х). Следовательно, оператор А самосопряженный. Введем понятие матрицы линейного оператора А. Пусть е,, е2, .... еп— какой-либо базис в n-мерном вещественном линей- ном пространстве L. Положим ЛеА = Тогда, как и в комплексном случае, нетрудно показать, что п если х = 2 то Для компонент вектора^ = Ах справедливо k-i представление У1 = 2 alkxk. k=\ Матрица А = (а1к) называется матрицей линейного оператора А в базисе Аналогично тому, как это было сделано в § 2 настоящей главы, можно доказать, что величина det А не зависит от вы-
§ 91 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ 159 бора базиса и, тем самым, корректно определяется определи- тель det Л оператора А. Характеристическим уравнением, отвечающим оператору А, называется уравнение det (А — Х/) = 0, а многочлен, стоящий в левой части этого уравнения, называется характеристическим многочленом оператора А. Докажем теперь теорему о корнях характеристического мно- гочлена самосопряженного оператора в вещественном евклидо- вом пространстве. Теорема 5.34. Все корни характеристического многочлена самосопряженного линейного оператора А в евклидовом простран- стве вещественны. Доказательство. Пусть Х = а-Н₽—корень характери- стического уравнения det (Л—М) = 0 (5.115) самосопряженного оператора Л. Фиксируем в V какой-либо базис {ек} и обозначим через afk—элементы матрицы оператора Л в этом базисе (отметим, что ajk—вещественные числа). Будем искать ненулевое решение следующей системы линей- ных однородных уравнений относительно £2, ..., п Ъ aJklk = M,j, /=1, 2, ...,п, (5.116) k= 1 где Х = а + $. Так как определитель системы (5.116) равен det (Л—1/) (напомним, что определитель матрицы линейного преобразова- ния не зависит от выбора базиса и, согласно (5.115), этот опре- делитель равен нулю), то система (5.116) однородных линейных уравнений имеет ненулевое решение lk = xk + iyk, /г= 1, 2, ..., п. Подставляя это решение в правую и левую части системы (5.116), учитывая при этом, что Л = а + ф и отделяя затем ве- щественную и мнимую части полученных соотношений, найдем, что наборы (хп х2, ..., х„) и (yit у2, уп) вещественных чисел *) удовлетворяют следующей системе уравнений: 2 ajkxk = a.xj — ₽г/у, 1 у (5.П7) 2 ==“«// + ₽*/» / = 1, 2...п. k= 1 ) *) Напомним, что не все эти числа равны нулю.
160 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 Рассмотрим в данном базисе elt е2, ..., еп векторы х и у с координатами (хх, х2, .... х„) и (ylt у2, . . уп) соответственно. Тогда соотношения (5.117) можно переписать в виде Ах = ах—$у, Ау = ау + &Х. Умножим первое из полученных соотношений скалярно на у, а второе — на х. Очевидно, получим равенства {Ах, j) = «(x, У), 1 (х, Ау)^а(х,у) + $(х, х). j Так как оператор А самосопряженный, то (Ах, у) = (Х, Ау). Поэтому путем вычитания соотношений (5.118) получим равенство ₽[(х, Х) + СУ, _у)] = о. Но (х, х) + (у, у) Ф 0 (если (х, x) + (j, j) = 0, то хл = 0 и yft = 0, k = 1, 2, .. ., п; следовательно, решение Z,k = xk-\-iyk было бы нулевым, тогда как по построению это решение ненулевое). Поэтому 0 = 0, а так, как 0—мнимая часть корня Х = а-Н0 характеристического уравнения (5.115), то, очевидно, 1 — веще- ственное число. Теорема доказана. Как и в комплексном случае, для самосопряженного опера- тора справедливо утверждение о существовании ортонормиро- ванного базиса, состоящего из собственных векторов этого опе- ратора (аналог теоремы 5.21). Докажем это утверждение. Теорема 5.35. У каждого самосопряженного линейного опе- ратора А, действующего в п-мерном вещественном евклидовом пространстве V, существует ортонормированный базис из соб- ственных векторов. Доказательство. Пусть — вещественное собственное значение оператора А, а ег—единичный собственный вектор, отвечающий этому собственному значению (11^11= 1). Обозначим через Vt (п—1)-мерное подпространство простран- ства V, ортогональное к е^. Очевидно, Vt— инвариантное под- пространство пространства V (т. е. если х£Уг, то ЛхСКх). Действительно, пусть х^УД тогда (х, ех) = 0. Поскольку опера- тор А самосопряженный и Лх—собственное значение А, получим (Ах, е1) = (х, Ае1) = ^1(х, е2) = 0. Следовательно, Ax^Vit и поэтому — инвариантное под- пространство оператора А. Поэтому мы можем рассматривать оператор А в подпространстве Ух. Ясно, что в Vx оператор А будет самосопряженным. По теореме 5.34 у оператора А, дей- ствующего в Vlt имеется вещественное собственное значение Х2,
5 9] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ которому отвечает собственный вектор e2£Vi оператора А, удов- летворяющий условию ||е21|=1. Обращаясь далее к (п—2)-мерному подпространству V2, орто- гональному векторам и е2 и повторяя рассуждения, мы по- строим собственный вектор е3 оператора А, ортогональный векторам и е2 и удовлетворяющий условию || е31| = 1. Рассуждая и дальше таким же образом, мы в результате найдем п взаимно ортогональных собственных векторов е2, е2, ..., еп оператора А, удовлетворяющих условию ||efc||=l, k~\, 2, ..., п. Очевидно, векторы {eft} образуют базис в V. Теорема доказана. Замечание. Пусть е±, е2, ..., е„—ортонормированный базис в n-мерном евклидовом пространстве V, состоящий из соб- ственных векторов самосопряженного оператора А, т. е. Тогда матрица оператора А в базисе (е*) является диагональ- ной, причем диагональные элементы имеют вид a| = X*. Отметим, что если {ек\ — произвольный ортонормированный базис в вещественном евклидовом пространстве V, то матрица самосопряженного оператора А будет симметричной, т. е. А' ~А. Верно и обратное утверждение, т. е. если в некотором ортонор- мированном базисе {ej матрица оператора является симметрич- ной, то оператор А—самосопряженный. Этим вещественный случай отличается от комплексного, по- скольку в комплексном случае оператор А является самосопря- женным тогда и только тогда, когда матрица А этого оператора в ортонормированном базисе является эрмитовой, т. е. элементы ак матрицы А удовлетворяют условию Gfe = (черта означает комплексное сопряжение). Указанное утверждение непосредственно следует из того, что если (аЬ)—матрица оператора А, то матрица сопряженного опе- ратора в вещественном случае равна (а*), а в комплексном слу- чае— (а*), что легко проверяется прямым вычислением. 2. Ортогональные операторы. В комплексном евклидовом пространстве важную роль играют унитарные операторы, вве- денные в § 7. Аналогом унитарных операторов в вещественном евклидовом пространстве являются ортогональные операторы. Определение 1. Линейный оператор Р, действующий в ве- щественном евклидовом пространстве V, называется ортого- нальным, если для любых х и у из V выполняется равенство (Рх, Ру) — (х,уу. (5.119) Таким образом, ортогональный оператор сохраняет скаляр- ное произведение. Отсюда непосредственно следует, что если et, е2, ..., ортонормированный базис евклидова.простран-
1$2 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. 5 ства V, то Pei, Ре2, • ••, Реп также является ортонормироваы- ным базисом. В дальнейшем условие (5.119) будем называть усло- вием ортогональности оператора Р. Справедливо следующее ’утверждение. Теорема 5.36. Для того чтобы линейный оператор Р был ортогональным, необходимо и достаточно, чтобы существовал оператор P~i и было выполнено равенство Р* = Р-*, (5.120) где Р*—оператор, сопряженный к Р, а Р~г— оператор, обрат- ный к Р. Доказательство. 1) Необходимость. Пусть Р—ор- тогональный оператор, т. е. выполняется условие (5.119). При- меняя сопряженный оператор Р*, это условие можно записать в виде (Р*Рх, » = (х, у). Таким образом, для любых х и у выполняется равенство ((Р*Р—1)х, у) = Ь< Фиксируя в этом равенстве любой элемент х, считая у про- извольным, получим, что линейный оператор Р*Р—I действует по правилу (Р*Р—/)Х = 0« Следовательно, Р*Р = Г, совершенно аналогично можно убе- диться, что РР* = 1. Таким образом, операторы Р* и Р взаимно обратны, т. е. условие (5.120) выполнено. 2) Достаточность. Пусть выполнено условие (5.120). Тогда, очевидно, Обращаясь к определению сопряженного оператора и исполь- зуя только что написанные соотношения, получим для любых х и у равенства {Рх, Ру)~(х, Р*Ру) = (х, /у) — (х, у). Мы видим, что условие (5.119) выполнено, следовательно, оператор Р ортогональный. Теорема доказана. Введем теперь понятие ортогональной матрицы Р. Определение 2. Матрица Р называется ортогональной, если P'P = PP' = It (5.121) где Р'—транспонированная матрица, а I—единичная матрица. Если eit е2, ..., е„—ортонормированный базис в евклидо- вом пространстве V, то оператор Р является ортогональным
5 91 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕЩЕСТВЕННОМ ПРОСТРАНСТВЕ J63 при R = l, при k=£l. [ространстве аналогом тогда и только тогда, когда его матрица в базисе {ej орто- гональна. Непосредственно из равенства (5.121) следует,, что если мат- рица Р = (р*) является ортогональной, то ” ( 1 о В комплексном евклидовом нальной матрицы является унитарная матрица. Именно, мат- рица U называется унитарной, если выполняется соотношение U*U = UU* = I, (5.122) в котором U*—эрмитово сопряженная матрица, т. е. U* = U', где штрих означает транспонирование, а черта — комплексное сопряжение. Нетрудно показать, что в ортонормированном базисе матрица линейного оператора U является унитарной тогда и только тогда, когда оператор U является унитарным. В заключение рассмотрим для примера ортогональные преоб- разования в одномерном и двумерном пространствах. В одномерном случае каждый вектор х имеет вид х = ае, где а—вещественное число, и е—вектор, порождающий данное пространство. Тогда Pe—'ke, и так как {Ре, Рё) = № {е, е) = = (е, е), то % = ±1. Таким образом, в одномерном случае существуют два орто- гональных преобразования: Р+х = и и Р_х =— х. В двумерном случае каждое ортогональное преобразование определяется в произвольном ортонормированном базисе орто- гональной матрицей порядка 2, т. е. матрицей р__________________________(а Ъ\ d) ’ Из условия РР' = Р'Р= I следует а2 + 62=1, a2 = d2, 62 = с2, ас + <й> = 0, а&-|-Ы=0. Полагая a = cos<p, й =— sin <р, получаем, что каждая орто- гональная матрица порядка 2 имеет вид р / cos<p —sin <р\ ± \±sinq) ±cosq)/* причем во второй строке в обоих случаях следует брать либо знак -|-, либо знак —. Отметим, что detP± = ±l. Ортогональная матрица Р+ назы- вается собственной, а ортогональная матрица Р_—несобственной. Оператор Р+ с матрицей Р+ в ортонормированном базисе eit е± осуществляет поворот в плоскости еъ ег на угол <р.
164 линейные операторы [ГЛ. 5 Для того чтобы выяснить, как действует оператор /*_ с мат- рицей Р_, введем матрицу совпадающую с Р_ при <р = 0, и заметим, что P_=QP+. Мат- рице Q отвечает отражение плоскости относительно оси eit сле- довательно, действие оператора Р_ заключается в повороте на угол и последующем отражении. Заметим, что векторы P+elt Р+е2 образуют в силу ортого- нальности Р+ ортонормированный базис и в этом базисе мат- рица оператора Р_ совпадает с Q, т. е. является диагональной. В общем случае, когда ортогональный оператор Р действует в «-мерном евклидовом пространстве, существует ортонормиро- ванный базис еи е2, ..., еп, в котором матрица оператора Р имеет вид 1 1 О —! —I cosq>i — sirups ' sin qpi cos <pt О COS <Pft —sin<pft sin <pA cos <p* . В этой матрице все элементы, кроме выписанных, равны нулю. Таким образом, в некотором ортонормированном базисе дей- ствие ортогонального оператора сводится к последовательным поворотам и отражениям относительно координатных осей.
ГЛАВА б ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ И ЗАДАЧ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ В настоящей главе изучаются различные методы решения систем линейных уравнений с вещественными коэффициентами относительно неизвестных, также принимающих вещественные значения. Все используемые на практике методы решения систем ли- нейных уравнений можно разделить на две большие группы: точные методы и итерационные методы. Под точным методом решения понимается метод, теорети- чески позволяющий получить точные значения неизвестных в результате проведения конечного числа арифметических операций. Примером точного метода может служить изложен- ный в главе 3 метод, основанный на применении формул Кра- мера *). Итерационные методы позволяют получить искомое ре- шение Лишь в виде предела последовательности векторов, по- строение которых производится с помощью единообразного процесса, называемого процессом итераций (последовательных приближений). Итерационные методы весьма удобны для исполь- зования современной вычислительной техники. Изложению наиболее употребительных итерационных методов решения линейных систем посвящен § 1 настоящей главы. Итерационные методы находят широкое применение и при ре- шении другой важной вычислительной задачи линейной алгебры— так называемой полной проблемы собственных значе- ний (так называют проблему отыскания всех собственных *) Практически метод, основанный на формулах Крамера, обычно не при- меняется, ибо он требует проведения очень большого числа арифметических операций и записей. Более удобным является точный метод, основанный на последовательном исключении неизвестных и называемый методом Гаусса (его изложение можно найти, например, в книге Д. К. Фаддеева и В. Н. Фад- деевой «Вычислительные методы линейной алгебры», Гостехиздат, 1963, гл. 2).
166 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 значений и отвечающих им собственных векторов заданной матрицы*)). В итерационных методах собственные значения вычи- сляются как пределы некоторых числовых последовательностей без предварительного определения коэффициентов характеристи- ческого многочлена. В § 2 настоящей главы разбирается один из самых важных и наиболее употребительных на ЭВМ итерационных методов решения полной проблемы собственных значений—так называ- емый метод вращений (или метод Якоби). Этот метод применим ко всякой симметричной (или к эрмитовой) матрице, легко реализуется на ЭВМ и всегда сходится. Он устойчив по отношению к ошибкам округления результатов промежуточных вычислений и обладает тем замечательным свойством, что на- личие кратных и близких друг к другу собственных значений не только не замедляет его сходимости, а, напротив, ускоряет ее. Метод вращений, предложенный Якоби и известный еще с середины прошлого века, долгое время не находил практи- ческого применений из-за большого объема вычислений, необхо- димых для его реализации. И лишь появление быстродейст- вующих электронных вычислительных машин сделало его са- мым эффективным методом решения полной проблемы собственных значений симметричных и эрмитовых матриц. § 1, Итерационные методы решения линейных систем 1. Метод простой итерации (метод Якоби). Рассмотрим квад- ратную систему линейных уравнений с вещественными коэффи- циентами (3.10) (см. п. 1 § 2 гл. 3), которую запишем в матрич- ном виде AX — F, (S.1) понимая под А основную матрицу системы аа ‘ ain л _ eai • ‘ • ain /а ani агл • • * апп а над X и F векторы-столбцы вида первый из которых подлежит определению, а второй задай. •) В отличие от этой проблемы, задачу отыскания некоторые (на- пример, наибольших по модулю) собственных значений заданной матрицы называют частичной проблемой собственных значений.
J и ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ }67 Предполагая однозначную разрешимость системы (6.1), заме- ним матричное уравнение (6.1) эквивалентным ему матричным уравнением Х = Х—xAX + tF, в котором через т обозначено вещественное число, обычно на- зываемое стационарным параметром. С помощью этого последнего уравнения составим итерацион- ную последовательность векторов {Хк}, определив ее рекуррент- ным соотношением Xk+i = Xk-xAXk + iF (fe = 0, 1, ...) - (6.3) при произвольном выборе «нулевого» приближения Хо. Метод простой итерации заключается в замене точного ре- шения X системы (6.1) &-й итерацией Хк с достаточно большим номером k. Оценим погрешность Zk = Хк—X метода простой итерации. Из соотношений (6.3) и (6.1) сразу же вытекает следующее матричное уравнение для погрешности Zk: Zk+i = (E iA)Zk, (6.4) где Е—единичная матрица порядка п. Введем в рассмотрение норму вектора в пространстве Еп и операторную норму квадратной матрицы порядка п. Как обычно, назовем нормой вектора X число ||X||, равное корню квад- ратному из суммы квадратов координат этого вектора. Назовем операторной нормой произвольной матрицы А число ||Л||, равное либо точной верхней грани отношения ||ЛХ||/||Х5 на множестве всех ненулевых векторов X, либо (что то же самое) точной верхней грани норм || ЛХ|| на множестве всех векторов X, имеющих норму, равную единице. Итак, по определению |Л|=£?ттг- м Напомним, что для любой симметричной матрицы Л*) опера- торная норма этой матрицы равна наибольшему по модулю собственному значению этой матрицы (см. п. 4 § 5 гл. 5), т. е. |Л||=гаах|Х,|. (6.6) S Из (6.5) вытекает следующее неравенство, справедливое для любой матрицы Л и любого вектора X: 1ИХК1И111Щ. (6.7) *) Матрица А называется симметричной, если А = А',
168 ИТЕРАЦИОННЫЕ, МЕТОДЫ [ГЛ. 6 Из матричного уравнения для погрешности (6.4) и из неравен- ства (6.7) мы получим, что для любого номера k |П,+1К||£-тЛ||||гл||. (6.8) Докажем теперь следующую простую, но важную теорему. Теорема 6.1. Для того чтобы итерационная последо- вательность (6.3) при любом выборе нулевого приближения Х9 и при данном значении параметра т сходилась к точному реше- нию X системы (6.1), достаточно, чтобы было выполнено условие р = ||£-тЛ||< 1. (6.9) При этом последовательность (6.3) сходится со скоростью гео- метрической прогрессии со знаменателем р. В случае, если матрица А является симметричной, условие (6.9) является и необходимым условием сходимости итерацион- ной последовательности (6.3) при любом выборе нулевого прибли- жения Х9. Доказательство. Для установления достаточности усло- вия (6.9) заметим, что из неравенства (6.8) вытекает следующее соотношение: (6.Ю) Из (6.10) очевидно, что условие (6.9) обеспечивает сходимость последовательности погрешностей Zft к нулю со скоростью гео- метрической прогрессии со знаменателем р. В случае, если матрица Л является симметричной, будет симметричной и матрица Е—тЛ, а поэтому в силу (6.6) условие (6.9) можно переписать в эквивалентном виде р = тах[1—тХД< 1 (6.11) S (здесь через {XJ обозначены собственные значения матрицы Л). Убедимся в том, что условие (6.11) является необходимым условием сходимости к нулю последовательности {ZJ при любом выборе нулевого приближения Хо. Предположим, что' условие (6.11) не выполнено. Тогда существует собственное значение Л,, удовлетворяющее неравенству 11—). Обозначим через Х(,) отвечающий этому собственному значению собственный вектор матрицы Л и выберем нулевое приближение Хй так, чтобы Ze совпало с Тогда, последовательно записывая соотношение (6.4) для номеров 1, 2, ..., k, мы получим, 4ToZft = (l—xlf)ftZe. Из последнего соотношения в силу неравенства j 1—тД, | 1 вы- текает, что ||Zfc|l не стремится к нулю при fe—>оо. Теорема 6.1 доказана. Сразу же заметим, что для практических целей недостаточно установить только факт сходимости последовательности итераций.
$ 11 ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ : 169 Центральной задачей численных методов является оценка ско- рости сходимости. Очень важно знать, как наилучшим сйособом распорядиться стационарным параметром т для того, чтобы по- лучить наиболее быструю сходимость. Остановимся на этом вопросе подробнее. Пусть задана е-точность, с которой нам требуется получить точное решение системы (6.1). Требуется найти итерацию Хк с таким номером k, для которого (6.12) Из (6.9) и (6.10) вытекает, что 1|, и, стало быть, (6.12) выполняется при р*О, т. е. при fe . Отсюда видно, чФо для уменьшения числа итераций k, доста- точных для достижения требуемой е-точности, следует выбрать параметр т так, чтобы получить минимум функции р=р(т) = = ||£-тД||. Считая матрицу А симметричной и положительно определен- ной, мы приходим к следующей задаче оптимизации: найти минимум функции min р (т) = min || Е—тА || = min {max 11 — тХ5 ]}. г т х s Решение этой и несколько более общей задачи, предложенное А. А. Самарским, излагается в следующем пункте. Там будет доказано, что указанный минимум функции р = р (т) достигается для значения т = 2/(у1 + у2), где и у8—соответственно мини- мальное и максимальное собственные значения матрицы А, при- чем минимальное значение функции р(т) равно ___Ya Ya—Yf . . Ti j -k.—— Ya 2. Общий неявный метод простой итерации; Снова обратимся к решении} линейной системы (6.1), но на этот раз заменим итерационную последовательность (6.3) более общей итерацион- ной последовательностью, определяемой соотношением (6.13) в котором В представляет собой некоторую «легко обратимую» квадратную матрицу n-го порядка, а т—стационарный па)раметр. Такой метод составления итерационной последовательности и называется неявным методом простой итерации. Рассмотренный в предыдущем пункте явный метод простой
170 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 итерации получается из неявного метода в частном случае В = Е, где Е—единичная матрица порядка п. Для того чтобы сформулировать в удобной для приложений форме условие сходимости общего неявного метода простой ите- рации, напомним некоторые понятия, введенные в предыдущей главе. Напомним, что матрица А называется положительно определенной, если (АХ, X) > 0 для любого ненулевого вектора X. В главе 5 было доказано, что необходимым и доста- точным условием положительной определенности симметричной матрицы А (или, что тоже самое, самосопряженного линейного оператора Л) является положительность всех собственных зна- чений этой матрицы (этого оператора). Если матрица А является положительно определенной, то мы договоримся писать неравенство Л > 0. Далее договоримся писать неравенство (В > А) (или А < В) в случае, если В—Л > 0 (т. е. если матрица В—А является положительно определенной). Докажем следующую замечательную теорему *). Теорема 6.2 (теорема А. А. Самарского). Пусть матри- ца А является симметричной и выполнены условия Л > 0, В>0 **). Тогда, для того чтобы итерационная последовательность (6.13) при любом выборе нулевого приближения Хо сходилась к точному решению X системы (6.1), достаточно, чтобы были выполнены условия 2В>тЛ, тЛ > 0. (6.14) При дополнительном предположении о том, что матрица В симметрична и коммутирует***) с матрицей А, условия (6.14) являются не только достаточными, но и необходимыми для схо- димости итерационной последовательности (6.13) при любом выборе нулевого приближения Хв. •Доказательство. 1)Достаточность. Оценим погреш- ность Zk = Xk—X. Подставляя Xk = Zk-(-X в (6.13) и учитывая (6.1), получим для погрешности Zk следующее уравнение: Bz^~z^ + AZk=0. (6.15) Установим для погрешности Zk так называемое основное энергетическое тождество. Умножая обе части (6.15) скалярно *) Эта теорема является частным случаем доказанного известным со- ветским математиком А. А. Самарским значительно белее общего утвержде- ния (см. А. А. Самарский, Введение в теорию разностных схем, «Наука», 1971). **) Матрица В симметричной не предполагается. •*♦) Напомним, что по определению В коммутирует с А, если АВ=ВА.
$ 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 474 на вектор 2 (Zk+1—Zk)=2rZk+1^ — , получим равенство 2т {BZ"+i~?-k, + 2т f AZk, Z*+i- \ T ’ T / \ T 0. Последнее равенство в силу соотношения*) 7 Zk+t-\-Zk Zk+t—Zk Zk+j-\-Zk T Zk+i—Zk к 2 2 2 2 т k можно переписать в виде т ((В — 2т Л) Z*+1^Z*, + + (A(Zk+i + Zk), Zk+1—Zk)—0. (6.16) В силу симметричности матрицы А (т. е. самосопряженности оператора А) (A(Zk+i + Zk), Zk+i—Zk)—(AZk+l, Zk+i)~(AZk, Zft).(6.17) Из (6.16) и (6.17) получаем основное энергетическое тождество т^(2В—тЛ)-й^~z*> + + (AZk+1, Zk+i)=(AZk, Zk). (6.18) Остается с помощью тождества (6.18) доказать сходимость к нулю последовательности {||Zfc||}. Из тождества (6.18) и из условий т > 0, 2В—тА > 0 вытекает, что (^k+i’ Zk+i) ^(AZk, Zk), т. e. вытекает невозрастание последовательности {(AZk, Zk)}. Из условия Л > 0 следует, что эта последовательность ограничена снизу нулем и поэтому является сходящейся. Но тогда из тож- дества (6.18) следует, что lim ((2B—rA)Zk^~Z*\ z*+t~z*] =0< (6.Ю) т « Т / Так как матрица С — 2В—тА является положительно опреде- ленной, то существует 6 > 0 такое, что для любого вектора X справедливо неравенство (СХ, Х)^6(Х, X), или, что то же самое, ||Х||4<-у (СХ, X). Из последнего неравенства, учитывая, что С — 2В—тЛ, и беря X — Zk+i~Zft t получим ^Zk+i-Zkr^^2B-xA)^i^, (6.20) *) С помощью этого соотношения преобразуется только вектор Zk в вы- ражении AZk.
172 ИТЕРАЦИОННЫЕ МЕТОДЫ , (ГЛ. 6 Из соотношений (6.19) и (6.20) вытекает, что >-0 при k—+оо. Остается заметить, что положительно определенная матрица А допускает ограниченную обратную матрицу Л-1 и что в силу (6.15) Zk=—A~l-^(Zk+i—Z^, а поэтому |]ZA||^ ||ZA+1-—ZA|| —>-0 при k—>-oo. Сходимость последо- вательности {XA} доказана. Достаточность условий (6.14) доказана. Прежде чем перейти к доказательству необходимости условий (6.14) (при дополнительных предположениях на матрицу В), докажем следующую лемму. Лемма. Пусть С—.некоторая симметричная матрица, а В—симметричная положительно определенная матрица, комму- тирующая с матрицей С. Тогда матрица С является положи- тельно определенной в том и только в том случае, когда являет- ся положительно определенной матрица ВС. Доказательство леммы. Заметим, что в условиях леммы существует обратная матрица В-1*), которая также яв- ляется симметричной и положительно определенной**). Эта матрица В-1 коммутирует с матрицей ВС, ибо В-1ВС = С и всв-^=свв~1=с. Поэтому для полного доказательства леммы достаточно до- казать, что из условия С>0 следует, что ВС > 0 (при этом из условия ВС > 0 в результате умножения матрицы ВС слева на В-1 мы получим, что С > 0). Итак, пусть С > 0. В силу теоремы 5.14 из п. 2 § 5 гл. 5 матрица ВС является симметричной, и поэтому для доказатель- ства того, что ВС > 0, достаточно доказать, что все собствен- ные значения матрицы ВС положительны. ‘ ' В условиях леммы (в силу теоремы 5.24 из п. 6 § 5 гл. 5) существует самосопряженный положительно определенный опе- ратор В1/2 такой, что для соответствующей ему матрицы В1/2 справедливо равенство В1/2В’/2=В. Из условия С > 0 вытекает, что симметричная матрица D = = Bl/2CB1!i удовлетворяет условию D > 0, ибо для любого ненулевого вектора X (DX, Х) = (В^2СВ^Х, Х)=(СВ^2Х, B1/2X)=(CY, У) > 0 (для такого вектора X и вектор Y = B1^2X будет ненулевым). *) Действительно, из условия В > 0 вытекает, что кегВ=0, а тогда (в силу результатов п. 3 § 1 гл. 5) существует обратный оператор Я-1. **) Симметрия и положительная определенность матрицы В-1 выте- кает непосредственно из ее определения. В самом Деле, (В-1Х, У) = = (В-1^, ВВ-1У) = (ВВ-1Х, B~1Y) = (X, B~lY) для любых X к Y. Далее отсюда же (В-1Х, X) — (В~1Х, ВВ~^Х) > 0 для любого X 0,
J IJ ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 173 Таким образом, все собственные значения матрицы D — = В^СВ1'* положительны. Теперь Остается заметить, что матрица D = В1!2СВ1/г и ма- трица Bxl^JdB~l12 =гВС *) имеют одинаковые собственные значе- ния (ибо задача £>Х = ХХ эквивалентна при У = В1?2Х задаче В1/2рВ-1/гу = ХУ), Стало быть, все собственные значения матрицы ВС положи- тельны, и лемма доказана» 2) Необходимость,. Докажем теперь, что при дополни- тельном условии о том, что матрица В в теореме 6.2 симмет- рична и коммутирует с матрицей А, условия (6.14) являются необходимыми для сходимости последовательности (6.13) при любом выборе нулевого приближения Хо. Пусть С—произволь- ная симметричная матрица, коммутирующая с В. Заметим, что две задачи на собственные значения СХ—^ВХ и В~2СХ ~КХ эквивалентны друг другу. В силу леммы В~2С > 0 тогда и только тогда, когда С > 0. Это означает, что если условие С > 0 не выполнено, то задача В~1СХ = КХ (а стало быть, и задача СХ = ЪВХ) имеет хотя бы одно неположительное собственное значение Ks. Предположим, что не выполнено первое из условий-(6.14), т. е. не выполнено требование 2В—хА > 0. Полагая в проведенных выше рассуждениях С — 2В—хА, мы получим, что задача на собственные значения (2В—тА)Х =i.BX имеет хотя бы одно неположительное собственное значение Обозначим через Xw отвечающий собственный вектор и вы- берем нулевое приближение Хо так, чтобы было выполнено условие Z0=XW). Тогда, переписав уравнение для погрешности (6.15) в виде — BZkA-(2B—xA) Zk, мы получим, последовательно полагая k равным 0, 1, Zt = (—1 + Хи>, Za=(-l+b,)2X“', zfe=(-i+i,)*x«>, Поскольку —1-f-X,^—1, то очевидно, что |]Zft|| не стремится к нулю при k—юо. Аналогично рассматривается случай невыполнения второго условия (6.14), т. е. условия хА > 0. В этом случае в проведенных выше рассуждениях следует положить С — хА. Мы получим при *) Через В-1^2 обозначена матрица, обратная к В1/2,
174 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. в этом, что задача тАХ — ).ВХ имеет хотя бы одно неположительное собственное значение с -собственным вектором X{s}. Выбирая нулевое приближение Хо так, чтобы было справедливо равенство ZO=X(S) и переписывая (6.15) в эквивалентном виде BZh+i=BZk— — xAZk, мы получим, что 22 = (1-^)2Х% 2A = (l-4)ftX<^>, Так как Xs^0, то очевидно, что ||Zft||He стремится к нулю при k—>оо. Теорема 6.2 полностью доказана. Перейдем теперь к оценке скорости сходимости общего неяв- ного метода простой итерации. Следуя А. А. Самарскому *), выяс- ним вопрос о выборе такого значения параметра т, которое обес- печивает наиболее быструю сходимость. Предположим, что матрица В является симметричной и поло- жительно определенной. С помощью такой матрицы естественно ввести так называемое «энергетическое» скалярное произведение двух произвольных векторов X и Y, положив его равным (ВХ, Y) = (X, BY). Такое скалярное произведение будем обозначать символом (X, У)в. ,С помощью матрицы В1^ это скалярное произведение можно записать в виде (X, Y)a = (B^B^X, Y) = (B^X, B^Y). С помощью последнего равенства легко проверяется справедли- вость для введенного нами скалярного произведения четырех аксиом скалярного произведения (см. п. 1 § 1 гл. 4). Далее естественно ввести э нергет и ч е с к у ю норму век- тора X, положив ее равной К(Х, X)a — ]/r(BX, X). Эту энерге- тическую норму мы обозначим символом || Х||в. Две различные нормы одной и той же совокупности векторов Д X ||, и ||X Цл называют эквивалентными, если существуют такие положительные постоянные й у2, что справедливы не- равенства YiHll.<llxi|1I<Ta||X||I. Заметим, что энергетическая норма вектора X и обычная его норма являются эквивалентными. В самом деле, справедливость нера- венства Ух||Х|К||Х||в, т. е. неравенства $(Х, Х)С(ВХ, X) *) См. А. А. Самарский, Введение в теорию разностных схем, «На- ука», 1971, А. А. Самарский, А. В. Гулин, Устойчивость разностных схем, «Наука», 1973.
S 1] ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 175 вытекает из положительной определенности матрицы В, а спра- ведливость неравенства ||Х ||в ^v2||X||, т. е. неравенства (ВХ, Х)^ вытекает из неравенства Коши — Буняковского и оценки (6.7) (достаточно положить у2=||В||). Установленная эквивалентность обычной и энергетической норм позволяет утверждать, что последовательность || Х*|| схо- дится к нулю тогда и только тогда, когда сходится к нулю последовательность ||Х*||Д. Для дальнейших рассуждений энергетическая норма является более удобной, чем обычная норма. Докажем следующую фундаментальную теорему. Теорема 6.3 (теорема Л. А. Самарского). Пусть мат- рицы А и В симметричны и положительно определены, Zk обоз- начает погрешность общего неявного метода простой итерации. Тогда, для того чтобы при р < 1 было справедливо неравенство достаточно, чтобы было выполнено условие -Ь£В<Д<1±£В. (6.21) Замечание. А. А. Самарским доказано, что условие (6.21) не только достаточно, но и необходимо для справедливости нера- венства ]|Zft||B ^pk|]Z0||B, но мы на этом останавливаться не будем. Доказательство теоремы 6.3. Для удобства разобьем доказательство на два шага. Г. Сначала докажем, что если симметричные и положительно определенные матрицы Л и В удовлетворяют условиям Самар- ского (6.14), то (BZk+i, Zk+l)^(BZk, Zk). Умножая равенство (6.15) скалярно на 2xZk+i = x(Zk+i + Zk)-\- + r(Zft+l— Zk), получим (B(Zk+i-Zk), Zk+l + Zk) + (B(Zk+i-Zk), zk+i-zk) + + x(AZk+1, Zk+1-{-Zk)A-t(AZk, Zk+] Zk) = 0. В последнем равенстве заменим AZk на разность 4-A(ZA+i + Zft)^-lA(Zft+1-Zfc). Тогда, учитывая вытекающее из симметрии матрицы А ра- венство (Zfe+i Zk), Zk+i + Zk) — (Zk+l Zk, A (Zk+i-j-Zk)),
176 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 мы получим тождество (B(ZA+1-Zft), Zft+1 + ZA)+((B-|M)(Zft+i-ZA), zft+1 + zft) + -f-y (тЛ (Zft+14-Zfc), Zft+1H-ZJ = 0. Учитывая, что (в силу условий Самарского (6.14)) операторы тЛ и В—являются положительно определенными, мы полу- чим из последнего тождества следующее неравенство: (•® (^fe+i 2Д Zft+1 + Zft)<0. Это неравенство эквивалентно доказываемому неравенству (BZk+1, Zk+1)^.(BZk, Zk) (в силу вытекающего из симметрии оператора В тождества (BZA+1, Zft) = (Zft+1, BZft)). 2°. Пусть теперь.при р<1 выполнены условия Самарского (6.21). Докажем справедливость неравенства ||Zft||a^p*||Z0|[B. Положим Zk = pkVk. Тогда, очевидно, A+l-^ = Pft+%+1-p% = Pft+1(Vft+1-VA)-(l-p)p^. Подставляя эти значения Zk и Zk+i—Zk в равенство (6.15) и производя сокращение на р*, получим для величин Ук следующее соотношение: BVft+1T~Vft+Л^ = 0, (6.22) в котором В = рВ, А —А—^~-В. В силу условий (6.21) операторы В и А удовлетворяют усло- виям тЛ > О, 2В>тЛ. Из этих условий и из того, что уравне- ние (6.22) для Vk совершенно идентично уравнению (6.15) для Zk, в силу первого шага вытекает следующая оценка для Vk: (BVk+1, Vk+1)^(BVk, Vk). Из этой оценки в свою очередь, учитывая, что В = рВ, получим неравенство (BVk+1, Vft+1)<(BVft, Vft). Последовательное применение указанного неравенства для номеров k = 0, 1, ... приводит нас к соотношению (BVk, Vk)^(BVt, Vo), а умножение последнего соотношения на р2А приводит к окон- чательной оценке *) (BZft, ZA)<p2Wo, z0). *) Мы учитываем, что = Zo—Vo.
5 11 . ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 177 Тем самым неравенство ||ZA||a р*]|Z„ ||в доказано. Доказательство теоремы 6.3 завершено. В заключение применим теорему Самарского 6.3 для выясне- ния вопроса о выборе такого значения параметра т, при котором скорость сходимости является максимальной. Из доказанной в теореме 6.3 оценки || Zft ||в р* || Zo ||в вытекает, что эта задача сводится к нахождению такого значения т, при котором дости- гается минимальное значение функции р = р(т). Так как обе матрицы А и В симметричны и положительно определены, то существуют положительные постоянные yi и у2 такие, что справедливы неравенства ^В^А^^В. Будем считать, что постоянные ух и у2 в этих неравенствах нам заданы *). Сопоставляя только что написанные неравенства с ус- ловиями (6.21), мы получим, что минимальное значение р дости- гается при условии (1—р)/т = у1, (1-|~р)/т = у2, откуда получаем оптимальное значение т = 2/(у1 + у2) и минимальное значение р, равное (Та—TO/CVe + Ti)- Частным случаем проведенного нами рассмотрения является явный метод простой итерации, изученный в п. 1. Для этого метода справедливы все полученные нами результаты. В следующих трех пунктах с помощью общего неявного ме- тода простой итерации и теоремы Самарского 6.2 мы рассмотрим несколько наиболее употребительных итерационных методов и установим условия их сходимости. 3. Модифицированный метод простой итерации. Этот метод получается из общего неявного метода простой итерации в том частном случае, когда стационарный параметр т равен единице, а матрица В представляет собой диагональную матрицу D, со- стоящую из элементов матрицы А, лежащих на главной диаго- нали, т. е. B = Dt где ' о •,. О т>_ О ^22 ... О (6.23) При этом, конечно, предполагается, что матрица А является симметричной и что все ее диагональные элементы аи, а22, ..., апп являются положительными (последнее требование необходимо и достаточно для положительной определенности диагональной матрицы B = D). *) Постоянные yf и у2 естественно назвать константами эквива- лентности матриц А и В. Для коммутирующих матриц А и В постоян- ные -ух и у2 соответственно равны наименьшему и наибольшему собственным значениям задачи АХ — кВХ.
т ИТЕРАЦИОННЫЕ МЕТОДЫ 1ГЛ. В Из теоремы 6.2 сразу же вытекает, что для сходимости моди- фицированного метода простой итерации при любом выборе нулевого приближения достаточно, чтобы были выполнены два условия 2D>A, А >0. Теорема 6.1 позволяет выразить достаточное условие сходи- мости модифицированного метода простой итерации и в другой форме: ЦБ—П-1Л || < 1 *) (6.24) (под нормой матрицы, как и выше, понимается операторная норма). Так как ЦБ—D-4|| = ||D-*(D—А)|| =||L>-i (Л —D)|[, то доста- точное условие сходимости (6.24) можно переписать в эквива- лентном виде (|£>-х(А—D)||< 1. (6.25) Неравенство (6.25) позволяет получить различные достаточ- ные условия сходимости модифицированного метода -простой итерации. Прежде всего заметим, что если наряду с операторной нормой матрицы (6.2) (которую мы, как и выше, будем обозначать сим- волом || A J) ввести так называемую сферическую норму этой мат- рицы, обозначаемую символом || ЛЦ и определяемую равенством Гл п 11/2 9 Л Неф — 1 S I [_с = 1 j = 1 J то, как доказано в § 4 гл. 4 (см. формулу (4.28)), для любого вектора X пространства Еп будет справедливо неравенство**) МХ||<||АЦ[|Х||. • (6.26) Из (6.26) и (6.5) сразу же вытекает, что операторная и сфе- рическая дюрмы матрицы связаны соотношением ||Л||г^|| А Ц. Таким образом, в силу (6.25) достаточное условие сходимости модифицированного метода простой итерации выражается нера- венством || D~l (Л—D) Цсф < 1, которое в развернутой записи *) Мы учитываем, что в рассматриваемом случае вместо матрицы А сле- дует взять матрицу А, определяемую формулой А=В~1А и положить B = D, т = 1. **) В этом неравенстве под нормой вектора X = понимается так называемая сферическая норма Ц X Ц =
$ и ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ СИСТЕМ 179 имеет вид ' п 1 1/2 равной || X || — 2 х? Заметим далее, что при определении операторной нормы (6.5) матрицы А мы исходили из обычной (так называемой сфери- ческой) нормы вектора X = > Хп И — * и Часто вводят еще две нормы вектора X: так называемую к у- бическую норму, определяемую равенством ||Х||ку6 = max |xj, и так называемую октаэдрическую норму, определяемую п равенством || X ||окт — 2 |х(|. Если в определении (6.5) оператор- ной нормы матрицы А понимать под нормой вектора соответст- венно его кубическую или октаэдрическую норму, то соотноше- ние (6.5) приведет нас к определению соответственно кубичес- кой и октаэдрической операторных норм матрицы А. Можно доказать, что кубическая и октаэдрическая операторные нормы матрицы (6.2) следующим образом выражаются через элементы этой матрицы *): 1И11куб= max М||окт = max Дословное повторение проведенных выше рассуждений с за- меной сферических норм соответственно кубическими и октаэд- рическими приведет нас к достаточному условию сходимости модифицированного метода простой итерации, выраженному соот- ношением (6.25), в котором под нормой матрицы следует пони- мать соответственно ее кубическую или октаэдрическую опера- торные нормы. Эго приводит нас к следующим двум условиям, каждое из которых является достаточным для сходимости модифицирован- ного метода простой итерации (для 1=1,2...и); (для /= 1, 2, .... л). *) См., например, книгу: В. И. Крылов, В. В. Бобков и П. И, Монастырский, Вычислительные методы высшей математики, том 1, изд-во «Вышэйшая школа», Минск, 1972, стр. ill—112,
180 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 4. Метод Зейделя. Представим симметричную матрицу (6.2) в виде суммы трех матриц A = D-\-L-\-U, где D—диагональная матрица (6.23), a L и U соответственно строго левая и строго правая матрицы, имеющие вид L = о о ... о a2i 0 ... О 0 аа и = 0 0 ».. 0 0 ... 0 ani ап2 * • • О и удовлетворяющие условию L' = U. Метод Зейделя получается из общего неявного метода простой итерации в том частном случае, когда стационарный параметр т равен единице, а матрица В равна сумме D+L. Таким образом, последовательные итерации в методе Зейделя определяются соотношением (D+L)(Xft+1-X*) + AXA = F. Докажем, что метод Зейделя сходится для любой симметрич- ной и положительно определенной матрицы А. В силу теоремы 6.2 достаточно доказать, что для любой такой матрицы А выполнено условие 2(D + L)>A. (6.27) Для доказательства (6.27) заметим, что для любого вектора X (2(D + L)X, X) = (DX, X) + (DX, X) + (LX, X) + (LX, X) = = (DX, X) + (DX, X) + (LX, X) + (X, £/X) = (DX, Х) + (ЛХ, X). Таким образом, для доказательства неравенства (6.27) доста- точно убедиться в положительной определенности матрицы £), но она сразу вытекает из того, что у положительно определенной и симметричной матрицы Л все элементы, лежащие на главной диагонали, являются положительными *). Сходимость метода Зейделя доказана. 5. Метод верхней релаксации. Этот метод получается из общего неявного метода простой итерации в том частном случае, когда т = со, В = Э4-<»Л а параметр со выбран так, чтобы являлось наименьшим наибольшее по модулю собственное значение мат- рицы Е—co(D-bcoL)-1 А, осуществляющей переход от fe-й ите- рации к (feH-l)-ft, Докажем, что если матрица А является симметричной и поло- жительно определенной, то для сходимости метода верхней релак- сации достаточно, чтобы было выполнено условие 0 < со < 2. В силу теоремы 6.2. для сходимости достаточно выполнение условий ®>0, 2(D + <oL)> со Л. *) Достаточно заметить, что если у вектора X k-я координата равна единице, а все остальные нулю, то (АХ, Х) = а^ > 0.
МЕТОД ВРАЩЕНИЙ >81 $ 21 Второе из этих условий для любого вектора X приводит к неравенству (2(D + ®Z,)X, Х)>(соЛХ, X). (6.28) Последнее неравенство эквивалентно каждому из неравенств в следующей цепочке: (2DX, X) + (®LX, X) + (<oLX, X) > (®ЛХ, X), (2—<о)(£>Х, Х) + (соГ>Х, Х) + (соЛХ, Х) + (Х, aUX) > (<оЛХ, X), (2—<o)(DX, Х)>0. Из последнего неравенства и из положительной определенности I) заключаем, что (6.28) справедливо при 2—« > 0, т. е. при <0 < 2. Итак, доказано, что условия 0 < w < 2 обеспечивают сходимость метода верхней релаксации. 6. Случай несимметричной матрицы А. В случае несимметрич- ной матрицы А мы можем умножить матричное уравнение (6.1) слева на матрицу А' и заменить уравнение (6.1) уравнением AX — F, в котором F = A'F, А —А'А, так что матрица А является симметричной и (как легко убедиться) положительно опреде- ленной. § 2. Решение полной проблемы собственных значений методом вращений Ради простоты сначала будем рассматривать вещественную симметричную матрицу А, определяемую равенством (6.2). Заме- тим, что отыскание всех собственных значений и собственных векторов этой матрицы сводится к отысканию такой ортогональ- ной матрицы Т, для которой произведение D = T'AT (6.29) представляет собой диагональную матрицу. В самом Деле, если такая ортогональная матрица Т будет найдена, то Диагональные элементы матрицы D будут являться собственными значениями матрицы А, а столбцы матрицы Т будут являться соответствую- щими собственными векторами матрицы Л*). Введем в рассмотрение сферическую норму матрицы Л: П П 1/2 ’ *) Для доказательства этого обозначим через Ai, Х2, ,.., кп диагональные элементы матрицы D и положим где элементы el столбца удов- летворяют условию: е! = 0 при i и е*=1. Тогда, очевидно, = т. е. Т’ATe^’kk^kt и так как Т’— Т~\ то АТе^'к^Твь- Следовательно, Tek являются собственными векторами матрицы А.
ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. 6 Тогда, очевидно, для диагональных элементов матрицы А будет справедливо неравенство п (б-зо) i=i причем это неравенство переходит в точное равенство только в случае, когда матрица А является диагональной. Заметим теперь, что при ортогональном преобразовании мат- рицы А (т. е. при преобразовании вида A = UAR, где U и R — ортогональные матрицы) сферическая норма этой матрицы не изменяется *). Отсюда следует, что от всех ортогональных пре- образований матрицы А преобразование (6.29) отличается тем, что это преобразование делает максимальной сумму квадратов диагональных элементов преобразованной матрицы и минималь- ной—сумму квадратов всех внедиагональных элементов этой матрицы. Методом вращения называется итерационный метод, при ко- тором указанная выше матрица Т находится как предел беско- нечного произведения элементарных матриц вращения, каждая из которых имеет вид 1 0 ! 1 СОЗф... —МПф . , (i-я строка), 1 sin ф.,, cos ф . . (6.31) (/-я строка). В целом метод вращений состоит в построении последователь- ности матриц Л, /12, ..., Ау> ^4у+1» •••» (6.32) *) В самом деле, если A = UAR, а символ trC обозначает сумму всех элементов матрицы С, лежащих на ее главной диагонали, тоЦД 0?ф=1г(Д'Л) = = tr(R'A'[/,VA^) = tr(^'AM/?)=||A7?&=||(A/?')fo=|]«'A'|^=tr(A/?Z?’A')= = [г(АА7=|А'||?ф=||Л||?ф.
§21 МЕТОД ВРАЩЕНИЙ 183 каждая последующая из которых получается из предыдущей при помощи элементарного шага вида 4V+1 = Т'цА^Т Если для упрощения записи опустить индекс v и рассмотреть один такой шаг А = ТцАТц, осуществляемый с помощью матрицы (6.31), то для элементов а1} преобразованной матрицы А мы получим следующие выражения через элементы aiy матрицы А: aki—aki ПРИ j, j, azz = o/z cos ф + flyj sin ф при l^i, j, afi =— au sin <p + a}4 cos <p при Z#=i, /, azz=azz cos ф+ aZy sin ф при l^i, j, atj— — oZl-sin<p4-aZyCosq>' при l=£i, j, ai{ = (aa cos ф + ttjj simp) cos <p + (a,7 cos <p 4- аи sin <p) sin <p, a}i = (— aa sin <p +'OyZ cos <p) cos q> + (— ai} sin <p + a/7 cos <p) sin <p, a„ — — (— aH sin <p + а;1- cos <p) sin <p + (— sin ф + aj} cos q>) cos <p, au = — (aa cos ф + a}i sin <p) sin cp + (az/cos <p + aj} sin <p) cos <p. (6.33) Из соотношений (6.33) и из условия симметричности матрицы А вытекает следующее легко проверяемое равенство: п п S 2 =- i=i k^i п п и It t J^aki—2а?, + -^[(а//—ai{) sin 2<p + 2a,y cos 2?]*. (6.34) Из этого равенства вытекает, что для максимального умень- шения суммы квадратов всех внедиагональных элементов необ- ходимо матрицу (6.31) выбрать так, чтобы были выполнены дв а требования: 1) номера i и / выбрать так, чтобы квадрат элемента ау был наибольшим среди квадратов всех недиагональных элементов матрицы А, т. е. выбор номеров i и / подчинить условию = max ам\ 1 < к < rt 1 </<» к =#= I 2) угол поворота <р в матрице (6.31) выбрать так, чтобы было справедливо равенство (ауу—о,7) sin 2ф + 2о,у cos 2ф = 0. (6-35)
184 ИТЕРАЦИОННЫЕ методы [ГЛ. 6 Равенство (6.35) однозначно определяет угол <р, удовлетво- ряющий условиям 2а;,- я Ф<Т. (6.36) Ull ujj * Это равенство позволяет вычислять cos <р и sin <р по формулам cos <р = |у[1 +(1 +Ра)“1/2]|1/2. sin<p = sgnp^y[l—(1 +р2)"1/2]|1/а, где р=2а,7/(ай— а/у). Заметим, что если матрица (6.31) выбрана так, что выполнены указанные выше требования 1) и 2), то равенство (6.34) пере- ходит в следующее соотношение: 2 2 ам ~ S 2 flW-—2at/, fe=l Z = 1 k-1 1=1 k^i k=^i (6.37) в котором <z,y представляет собой наибольший по модулю вне- диагональный элемент матрицы. Теперь мы можем более точно сказать, что метод вращений состоит в построении последовательности матриц (6.32), каждая последующая из которых получается из предыдущей посредством ортогонального преобразования Av+i — Тц-Ау 'Тв котором матрица Т if = T выбирается так, чтобы были выполнены указанные выше два требования *). Докажем сходимость метода вращений. Обозначим символомSJ сумму квадратов всех внедиагональных элементов матрицы Av, а символом a$v наибольший по модулю внедиагональный эле- мент этой матрицы. Тогда в силу (6г.37) справедливо равенство S:+1=S2-2[a(^v]2. (6.38) Далее, поскольку общее число внедиагональных элементов матрицы Av равно п(п—1), a a|$v — наибольший по модулю из этих элементов, то справедливо неравенство о2 - [<] > • <6-39> *) Номера i и / на каждом шаге выбираются такими, чтобы наибольшим по модулю являлся внедиагональный элемент матрицы с этими номерами.
$ 2] МЕТОД ВРАЩЕНИЙ 185 Из (6.38) и (6.39) вытекает неравенство (6.40) Последовательно используя неравенство (6.40), записанное для номеров 0, 1, ..., v, и обозначая через SJ = So(A) сумму квад- ратов всех внедиагональных элементов основной матрицы А, мы получим, что S*+1<S’(A)[1 2 Tv+i п(п — l)j * (6.41) Из неравенства (6.41) сразу же следует, что lim Sv+i =0, V * « что и доказывает сходимость метода вращений. В качестве приближенных значений собственных чисел мат- рицы А берутся диагональные элементы матрицы Av, а в каче- стве приближенных собственных векторов матрицы А берутся столбцы матрицы TiiA .. Т^. Более точные результаты получены В. В. Воеводиным *). Для случая, когда произвольная (не обязательно симметричная) матрица А не имеет жор- Дановых клеток и все ее внедиагональные элементы являются величинами порядка е и малы по сравнению с числом р = min | А(-—Kj |, В. В. Воево- дин получил следующие оценки: Ху а) для собственных значений оценку 1, = а„ + У ^-+О(е>) Р=1 (из указанной суммы исключаются значения р, принадлежащие множеству R( тех чисел / = 1, 2, ..., п, для которых Лу = %,•); б) если Т—матрица, столбцы которой являются собственными векторами матрицы А и Т = £-|-Я, где Е — единичная матрица, то для элементов й,у матрицы Н справедливы оценки : hiJ — 0, если А,- = Ау, Л/ / ----------НО(е2), если А,- / Az. ajj— аи *) В. В. Воеводин, Численные методы алгебры. Теория й алгорифмы, изд-во «Наука», 1966.
186 ИТЕРАЦИОННЫЕ МЕТОДЫ [ГЛ. в Если А — комплексная эрмитова матрица, то вместо матрицы (6.31) следует взять унитарную матрицу О 1 1 собф. .. — зтфе^ . 1 (i-я строка), Г/Дф, i|5) = (6.42) • 1 • sinфе"cosф . . (/-я строка). О 1 При этом вместо равенства (6.34) мы придем к равенству 2 215», Г = 2 21Р-2 la,71-+ л—1 4—1 л —1 / — 1 k I k I + 21 ] • | cos2 ф • е*“—sin2 <p • e* + (a/7—a17) cos ф sin I9, в котором через а обозначен аргумент комплексного числа а1}. Для максимального уменьшения суммы квадратов модулей внедиагональных элементов следует у матрицы (6.42) выбрать такие номера i и /, чтобы элемент а{/ был наибольшим по мо- дулю внедиагональным элементом матрицы А, а выбор углов <р и $ подчинить условию | а,71 (cos2 <р • 6*“—sin2 ср• е1 «’t’-oo + (а7Л—ан) cos ср. sin <р ef1t’) =0. Последнее условие приводит к соотношениям 2 | a;f | я ^ = arga/7, tg2<p=^=^, |<р|<7. Доказательство сходимости метода вращений проводится точно так же, как и для случая вещественной матрицы.
ГЛАВА 7 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ В этой главе изучаются билинейные формы, опреде- ленные в вещественном линейном пространстве, т. е. числовые функции двух векторных аргументов, линейные по каждому из этих аргументов. Подробно исследуются так называемые квад- ратичные формы, представляющие собой билинейные формы, определенные для совпадающих значений их аргументов. Рас- сматриваются также некоторые приложения теории билинейных и квадратичных форм. § lf Билинейные формы 1. Понятие билинейной формы. Понятие билинейной формы в произвольном линейном пространстве было введено нами ранее в главе 5. Однако для удобства изложения в этом пункте мы напомним некоторое определения и простейшие утверждения. Определение 1. Числовая функция А (х, у), аргументами которой являются всевозможные векторы х и у вещественного линейного пространства L, называется билинейной формой, если для любых векторов х, у и г из L и любого вещественного числа К выполняются соотношения A(x + z, у) = А(х, y) + A(z, у), 'I А(х, y + z)=A(x, у) + А(х, z), 1 (7 .. А(Кх, у) — 1А(х, у), Г ' ’ ' А {х, Ху) = ХА (х, у). J Иными словами, билинейная форма представляет собой чис- ловую функцию А(х,у) двух векторных аргументов х и у, опре- деленную на всевозможных векторах х и у вещественного линей- ного пространства L и линейную по каждому из этих аргумен- тов *). *) При этом часто говорят, что билинейная форма ^4 (х, у) задана на линейном пространстве L.
188 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Простейшим примером билинейной формы может служить произведение двух линейных форм /(х) и g(y), определенных на векторах х и у линейного пространства L. Определение 2. Билинейная форма А (х, у) называется сим- метричной (кососимметричной), если для любых векто- ров х и у линейного пространства L выполняются соотношения Л (х, у) = Л (у, х) ((Л (х, у) = — Л (у, х)). (7.2) Справедливо следующее утверждение: любую билинейную форму можно представить в виде суммы симметричной и косо- симметричной билинейных форм (см. п. 1 § 9 гл. 5). 2. Представление билинейной формы в конечномерном линей- ном пространстве. Пусть в n-мерном линейном пространстве L задана билинейная форма В(х, у). Выясним вопрос о представ- лении формы В(х, у) в случае, когда в L задан определенный базис e = (eit ег, ..., еп). Справедливо следующее утверждение. Теорема 7.1. Билинейная форма В (х, .у) при заданном в п-мерном линейном пространстве базисе е = (е1г е2, ..., е„) может быть однозначно представлена в следующем, виде: В(М)=2М(>1/. (7.3) где b^B^, ef), (7.4) а 1/ и т|у—координаты в базисе е векторов х иу соответственно. Доказательство. Пусть *=2^ и y = — разложения векторов х и_у по базису е. Так как форма В (х, у) линейна по каждому из аргументов х и у (см. (7.1)), то / п п \ п В(х, y) = B['2j liei, В(е,-, е7)^т)7. . \i= l ;=1 / I, /=1 Таким образом, для формы В(х, у) справедливо представ- ление (7.3) с выражениями (7.4) для коэффициентов bti. Чтобы доказать однозначность этого представления, предпо- ложим, что для В (х,у) справедливо представление (7.3) с не- которыми коэффициентами Ъ^. Беря в (7.3) x~el,y=ej, мы сразу же получим выражения (7.4) для коэффициентов Ьц. Теорема доказана.
5 11 БИЛИНЕЙНЫЕ ФОРМЫ 189 Определение. 'Матрица (*ii ... &i„\ *21 *22 ... Ьгп \ (7.5) *Л1 *п2 • • • Ьпп/ элементы bif которой определены с помощью соотношений (7.4), называется матрицей билинейной формы В(х, у) в дан- ном базисе е. Замечание 1. Обратимся к вопросу о построении всех билинейных форм в данном конечномерном вещественном прост- ранстве L. Ответ на этот вопрос следующий: любая квадратная матрица является в данном базисе e = (eit ег, е„) матрицей некоторой билинейной формы. Убедимся в справедливости этого утверждения. Определим в линейном пространстве L с данным базисом e = (en ег, •••, еп) с помощью матрицы (Ьц} числовую функ- п цию В (х, у) двух векторных аргументов х — 2 и i=i у = 2 ПА вида / = 1 в(х, ^) = j2iMiri/- Легко видеть, что эта функция удовлетворяет всем условиям определения билинейной формы. Но тогда, согласно теореме 7.1, элементы Ь,у заданной матрицы равны В(е{, е^, а написанная выше формула есть представление этой формы в виде (7.3). Согласно сделанному замечанию естественно называть пред- ставление (7.3) билинейной формы В(х, у) общим видом билинейной формы в n-мерном линейном прост- ранстве. Замечание 2. Если В(х, у)—симметричная (кососиммет- ричная) билинейная форма, то матрица (7.5) этой формы в ба- зисе е является симметричной (кососимметричной). Справедливо и обратное—если матрица (7.5) билинейной формы В(х, у) симметрична (кососимметрична), то и билинейная форма явля- ется симметричной (кососимметричной). Убедимся в справедливости этого замечания. Пусть В(х, у)—симметричная (кососимметричная) билиней- ная форма. Полагая в соотношениях (7.2) x = eh y — Cj, полу- чим, согласно (7.4), = (^у =-bji), (7.6) т. е. матрица (7.5) является симметричной (кососимметричной).
190 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Пусть теперь матрица (7.5) билинейной формы В \х, у) сим- метрична (кососимметрична), т. е. ее элементы удовлетворяют соотношениям (7.6). Тогда из соотношения (7.3) и соотношения в (у, х) = 2 I, j=i следует, что В(х, у) = В(у, х), (В(х, _у) = — В (у, х)), т. е. форма В (х, у) является симметричной (кососимметричной). 3. Преобразование матрицы билинейной формы при переходе к новому базису. Ранг билинейной формы. Рассмотрим в линей- ном пространстве L два базиса e = (eit е2, ...» еп) и ft............fn)- Пусть Л(е) = (а,7) и А (/) = (6/у)— матрицы данной билинейной формы в указанных базисах. Выясним вопрос о связи этих матриц, т. е. выясним вопрос о преобразовании матрицы ai}- билинейной формы при переходе от базиса е к новому базису f. Справедливо следующее утверждение. Теорема 7.2. Матрицы А (е) и А (/) билинейной формы Л(х, у) в базисах e=(eit е2, .... е„) и f = f2, -.-,fn) связаны соотношением Л(/) = С'Л (е)С, (7.7) где C — (cpq)—матрица перехода от базиса е к базису f, а С — транспонированная матрица С. Доказательство. Элементы fq нового базиса f выра- жаются через элементы ер старого базиса е с помощью матрицы С = (см) по формулам <7-8) р = 1 Так как blk = A(ft, fk), то, согласно (7.8), получим bit — A (f lt fk) — А Г 2 спеь S у 3 = £ Л (eb ej) c!tcJk = £ (7.9) /, / =1 *» / =1 Напомним, что элементы с’ц транспонированной матрицы С1 связаны с элементами са матрицы С соотношениями си ~сч-
КВАДРАТИЧНЫЕ ФОРМЫ 191 $ 21 Подставляя эти соотношения в правую часть (7.9), получим для b[k следующее выражение: bik~ 2 aijc'ii9jk— 2 с'ц( 2 aijcjk] • С-10) i, i = i t = i V = i / п Сумма 2 atjcjk (п0 определению произведения матриц) пред- / = 1 ставляет собой элемент матрицы А (е) С. Отсюда следует, что выражение в правой части (7.10) является элементом матрицы С’А(е\С. Но в левой части (7.10) стоит элемент матрицы A ([). Поэтому A(f)~C’А(е)С. Теорема доказана. Следствие. Ранг матрицы A ([) равен рангу матрицы А (е). Это сразу вытекает из соотношения (7.7), из того, что мат- рица С и, стало быть, матрица С являются невырожденными, и из теоремы о том, что ранг матрицы не изменяется при умно- жении ее на невырожденную матрицу. Это следствие позволяет ввести важный числовой инва- риант билинейной формы—так называемый ранг билиней- ной формы. Определение I. Рангом билинейной формы, заданной, в ко- нечномерном линейном пространстве L, называется ранг мат- рицы этой формы в произвольном базисе пространства L. Определение 2. Билинейная форма А(х, у), заданная в ко- нечномерном линейном пространстве L, называется невырожден- ной (вырожденной), если ее ранг равен (меньше) размерности пространства L. § 2. Квадратичные формы Пусть А(х, у)—симметричная билинейная форма, заданная на линейном пространстве L. Определение 1. Квадратичной формой называется числовая функция А (х, х) одного векторного аргумента х, которая по- лучается из билинейной формы Л (ж, у) при х=у. Симметричная билинейная форма А (х, jf) называется поляр- ной к квадратичной форме А(х, х). Полярная билинейная форма А (х, у) и квадратичная форма Л(х, х) связаны следующим соотношением: Л(х, j)=^-M(x+j!, X+.J0—А(х, х) — А(у,у)],
192; БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 которое вытекает из очевидного равенства А(х+у, х+у) = А(х, х) + А(х, у) + А(у, х) + А(у, у) и свойства симметрии формы А (х, у). Пусть в конечномерном линейном пространстве L задана сим- метричная билинейная форма А (х, у), полярная к квадратич- ной форме Л(х, х). Пусть, кроме того, в L указан базис ~(^1> ^2> •••» Согласно теореме 7.1 форму А (х, у) можно представить в виде (7.3) п А(Х, у) = 2 а^, (7.3) ». 7=1 где и ц,-—координаты в базисе е векторов х и у соответст- венно. При этом в силу симметрии А (х, у) ац = ал (7.11) (см. замечание 2 п. 2 предыдущего параграфа). Полагая в (7.3) х=у (т. е. ц7 = £7), мы получим следующее представление для квадратичной формы А (х, х) в конечномер- ном пространстве L с заданным базисом е: Л(х, х) = 2 a^lilj. (7.12) i, i = 1 Матрица (а^) называется матрицей квадратичной формы А (х, х) в заданном базисе е. Согласно (7.11) матрица (а,7) является симметричной. Очевид- но, каждой симметричной матрице (а/у) отвечает с помощью со- отношения (7.12) квадратичная форма Л (х, х), причем (7.12) бу- дет представлением Л (х, х) в пространстве L с заданным бази- сом е (см. также замечание 3 п. 2 предыдущего параграфа). Отметим, что матрица квадратичной формы при переходе к новому базису преобразуется по формуле (7.7). Поэтому ранг этой матрицы не меняется при переходе к новому базису. Обычно ранг матрицы квадратичной формы А (х, х) назы- вается рангом квадр атичной формы. Если ранг матрицы квадратичной формы равен размерности пространства L, то форма называется невырожденной, а в противном случае—вырожденной. В дальнейшем мы будем использовать следующую термино- логию. Определение 2. Квадратичная форма А (х, х) называется: 1) положительно (отрицательно) определенной, если для любого ненулевого х выполняется неравенство А (х, х) > О (Л (х, х) < 0) (такие формы называются также знакоопределенными);
$ 3] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 193 2) знакопеременной, если существуют такие хи у,что А (х, х) > О, А (у, у) < 0; 3) к в аз изн а к о on р е д е л е н н ой, если для всех х А (х, х)>0 или А (х, х)^0, но имеется отличный от нуля вектор х, для которого А(х, х) = 0. В дальнейшем мы укажем признаки, по которым можно су- дить о принадлежности формы А (х, х) к одному из указан- ных типов. Отметим следующее важное утверждение. Если А (х, _у) представляет собой билинейную форму, поляр- ную положительно определённой квадратичной форме А (х, х), то А (х, у) удовлетворяет всем аксиомам скалярного произведе- ния векторов в евклидовом пространстве. Обратимся к четырем аксиомам скалярного произведения (см. п. 1 § 1 гл. 4). Если число, называемое скалярным произведением векторов X и у, обозначить символом А (х, у), то эти аксиомы запи- шутся следующим образом: 1°. А (х, _у) = А(_у, х). 2°. A (x + z, у) = А(х, y) + A(z, у). 3°. А(Хх, ^) = АЛ(х, у). 4°. А (х, х)>0 и А (х, х) > 0 при х#=0. Так как билинейная форма А(х, у} полярная квадратичной форме А (х, х) симметрична, то аксиома 1° выполняется. Аксиомы 2° и 3° в сочетании с требованием симметрии выполнены в силу определения билинейной формы (см. п. 1 § 1 этой главы). Аксиома 4° выполняется, так как квадратичная форма А (х, х) положительно определена. Замечание. Очевидно, аксиомы скалярного произведения можно рассматривать как совокупность требований, опреде- ляющих билинейную форму, полярную положительно опреде- ленной квадратичной форме. Поэтому скалярное произведение в линейных пространствах может быть задано с помощью такого вида билинейной .формы. § 3. Приведение квадратичной формы к сумме квадратов В этом параграфе указаны различные методы приведения квадратичной формы к сумме квадратов, т. е. будут указаны методы1 выбора такого базиса / = (/lt /г, ..., /я) в линейном пространстве L, по отношению к которому квадратичная форма
194 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 представляется в следующем каноническом виде: А (х, X) = М? + Ml 4- • • • + Мп. (7.13) (Лх. Ла. •••> Лп)~~К00РДинаты х в базисе f. Коэффициенты k2, ..., в выражении (7.13) называются каноническими коэффициентами. Подчеркнем, что мы рассматриваем квадратичные формы в произвольном вещественном линейном пространстве. В § 6 будут изучены квадратичные формы в евклидовом пространстве и будет доказана возможность приведения каждой квадратичной формы к каноническому виду даже в ортонормированном базисе. Исходя из результатов главы 5 в том же § 6 настоящей главы будет получено новое доказательство теоремы о приведении квадратичной формы к каноническому виду в произвольном (не обязательно евклидовом) вещественном линейном прост- ранстве. Настоящий же параграф посвящен не только доказательству возможности приведения квадратичной формы к каноническому виду, но и описанию двух методов такого приведения, имеющих большую практическую ценность и широко встречающихся в приложениях. Так как каждому преобразованию базиса отвечает невырож- денное линейное преобразование координат, а невырожденному преобразованию координат—преобразование базиса, то вопрос о приведении формы к каноническому виду можно решать путем выбора соответствующего невырожденного преобразования коор- динат. 1. Метод Лагранжа. Докажем следующую теорему. Теорема 7.3. Любая квадратичная форма Л(х, х), задан- ная в п-мерном линейном пространстве L, с помощью невырож- денного линейного преобразования координат может быть при- ведена к каноническому виду (7.13). Доказательство. Проведем доказательство теоремы ме- тодом Лагранжа. Основная идея этого метода заключается в последовательном дополнении квадратного трехчлена по каж- дому аргументу до полного квадрата. Будем считать, что А (х, х) 0 *) и в данном базисе е — = (ех, е2, ..., еп) представлена в виде п А(х, х)= 2 «г/Ы/. (7-14) I, ! = 1 *) Если форма А (х, х)=-^0, то ее матрица в любом базисе состоит из ну- левых элементов, и поэтому такая форма по определению имеет канонический вид в любом базисе.
S з] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 195 Убедимся, во-первых, что с помощью невырожденного преоб- разования координат форму А (х, х) можно преобразовать так, что коэффициент при квадрате первой координаты вектора х будет отличен от нуля. Если в данном базисе этот коэффициент отличен от нуля, то нужное невырожденное преобразование является тождест- венным. В случае, если ац = 0, но отличен от нуля коэффициент при квадрате какой-либо другой координаты, то с помощью перену- мерации базисных векторов можно добиться требуемого резуль- тата. Ясно, что перенумерация является невырожденным преоб- разованием. Если же все коэффициенты при квадратах координат равны нулю, то нужное преобразование можно получить следующим способом. Пусть, например, а12=^0*). Рассмотрим следующее невырожденное преобразование координат**): — Ъ1 ?2> Вг = 11 + 12> & = £,-, 1 = 3, 4....п. После этого преобразования коэффициент при будет равен 2а12 и поэтому отличен от нуля. Итак, будем считать, что в соотношении (7.14) а21^=0. Выделим в выражении (7.14) ту группу слагаемых, которые содержат Получим п А(х, ж)=А11й + 2а1гиа+.-.+2О1Л1п+ 2 (7Л5) К 1 = 2 Преобразуем выделенную группу слагаемых следующим об- разом: «ий + 2а12£Л +... + 2аМп = «и (й + Й + • • • + ) - 2 2 «12 £2 «1Я £2 Г) «12«13 £ f» О «1П — 1«1П £ £ «11 2 «11 «п ”* «и Очевидно, выражение (7.15) можно теперь переписать так: А(х, х) = цп^1 + ^-^2 + ...+-^^У+ £ а’ДД/. (7-16) где а*ц—коэффициенты при полученные после преобразо- вания. *) Напомним, что А (х, х)^0, и поэтому хотя бы один коэффициент ац отличен от нуля. **) Определитель матрицы этого преобразования равен 2, и потому это преобразование невырожденное.
196 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Рассмотрим следующее невырожденное преобразование коор- динат: гк^ + ^+...+^U П2 = §2, = £«• С помощью этого преобразования и представления (7.16) для А (х, х) получим п А(х, х)=а11г]?+ 2 (7.17) i. i=2 Итак, если форма А(х, х)^0, то с помощью невырожден- ного преобразования координат эту форму можно привести к виду (7.17). п •Обратимся теперь к квадратичной форме 2 ^г/Л/'П/- Если эта «. /=2 форма тождественно равна нулю, то вопрос о приведении А(х, х) п к каноническому виду решен. Если же форма 2 а’/ПЛЬ О, i. i=2 то мы можем повторить рассуждения, рассматривая преобразова- ния координат г]2, ..., т]п, аналогичные описанным выше, и не меняя при этом координату т)1. Очевидно, такого типа преобразо- вания координат г]1, т]2, ..., будут невырожденными. Ясно, что за конечное число шагов мы приведем квадратич- ную форму А(х, х) к каноническому виду (7.13). Отметим, что нужное преобразование исходных координат |2, ..., можно получить путем перемножения найденных в про- цессе рассуждений невырожденных преобразований. Теорема доказана. Замечание 1. Базис, в котором квадратичная форма имеет .канонический вид, называется каноническим. Отметим, что канонический базис определен неоднозначно. Замечание 2. Если форма А(х, х) приведена к канониче- скому виду (7.13), то, вообще говоря, не все канонические коэф- фициенты X,- отличны от нуля. Оставляя в (7.13) лишь отличные от нуля X/ и перенумеровывая их заново, получим следующее выражение для А (х, х): А(х, х)=^ + ^1+...+^. (7.18) Ясно, что k^n. Так как ранг квадратичной формы по опре- делению равен рангу ее матрицы в любом базисе, то из (7.18) и условия Х(-У=0 при 1 = 1, 2, ..., k вытекает, что ранг формы
§ 3] ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К СУММЕ КВАДРАТОВ 197 равен k. Таким образом, число отличных от нуля канонических коэффициентов равно рангу квадратичной формы. 2. Метод Якоби. При некоторых дополнительных предположе- ниях о квадратичной форме А (х, х) можно указать явные фор- мулы перехода от данного базиса e==(ef, е2, ..еп) к канониче- скому базису / = (/1, /2, .... /„) и формулы для канонических коэффициентов Х;. Предварительно мы введем понятие треугольного пре- образования базисных векторов. Преобразование базисных векторов elt е2, .... еп называется треугольным, если оно имеет следующий вид: /i = en Уг =а21^1 ^2, =ct3l^1 ~)-сс32(?2 в3, (7.19) fn КЛ1®1 + • • • ~Ь вп. , Замечание. Так как определитель матрицы треугольного преобразования (7.19) отличен от нуля (равен 1), то векторы /1( /2, • • •> fn образуют базис. Введем в рассмотрение угловые миноры матрицы Л(е) = (а,-7) коэффициентов формы А (х, х) в базисе е, обозначив их сим- волами Да, Д2.....Дп-1: А2 —ап, Oil O12 а21 fl22 O-ri ... Ci, n-i On-i, 1 Сл-1, Л-1 (7.20) Справедливо следующее утверждение. Теорема 7.4. Пусть миноры Дх, А2, ..., An_j матрицы (а0) квадратичной формы А (х, х) отличны от нуля. Тогда сущест- вует единственное треугольное преобразование базисных векторов elt ег...е„, с помощью которого форму А (х, х) можно при- вести к каноническому виду. Доказательство. Напомним, что коэффициенты Ьц формы А (х, х) в базисе /1. /2...fn вычисляются по формулам ^(Д/Л Если форма А (х, х) в базисе /1. /2> > /л имеет кано- нический вид, то bij=O при i=£j. Поэтому для доказательства теоремы достаточно построить с помощью треугольного преоб- разования (7.19) такой базис flt f2, .... в котором будут выполняться соотношения Л (/,-, /,) = 0 при i #= j, или, что то же, при i < / (7.21) (при этом, конечно, надо убедиться, что искомое преобразова- ние единственно).
1&8- БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Если обратиться к формулам (7.19) для ft, то, используя линейное свойство квадратичной формы А (х, х) по каждому аргументу, легко заметить, что соотношения (7.21) будут выпол- нены, если будут выполнены соотношения *) A (elt ff) =0, А (ег, /у) = 0, ..., A (e^lt fj) =0, (7.22) j =2, 3, ..., п. Запишем формулы (7.22) в развернутом виде. Для этого подставим в левые части этих формул выражение fj +а/2е2 + • • • +а/, J-lfy-i + Су (7.23) для fj из соотношений (7.19). Используя далее свойство ли- нейности А(х, х) по каждому аргументу и обозначение A(eit ej) = = dij, получим в результате следующую линейную систему уравнений для неизвестных коэффициентов ajian +a/2ai2 + • • —0» i H~a/2a/-i. 2 + • • • • /-1П/-1, /-i +a/_i, / — 0., (7.24) Определитель этой системы равен Ay_v По условию Ду.^О. Следовательно, система (7.24) имеет единственное решение. Таким образом, можно построить единственное треугольное преобразо- вание базисных векторов, с помощью которого форма А (х, х) приводится к каноническому виду. Теорема доказана. Приведем формулы, по которым можно вычислить коэффи- циенты a,ji искомого треугольного преобразования, и формулы для канонических коэффициентов Ху. Обозначим символом минор матрицы (afy), располо- женный на пересечений-строк этой матрицы с номерами 1,2, ... ...,/ — 1 и столбцов с номерами 1,2.i — 1, i + 1, ..., j. Тогда, обращаясь к системе (7.24) и используя формулы Крамера, по- лучим следующее выражение для ау(-: a77 = (-l)/+z-^-. (7-25) Займемся вычислением канонических коэффициентов Ху. Так как ^j — bjj = A(fj, fj), то из выражения (7.23) для fj и формул (7.22) получаем Ху = A (fj, fj) = A (a/1e1 +a/2e2 + ... +ay. j-ft^ + Су, /у) = = A (Cj, fj) =A(6j, oi,j1€1 -\-cCj2c2 + ... +«y, y-i^y-j + Cj) = ==а/1й1/+а/2а2/+ • • ' +а/, *) Нетрудно убедиться, что из соотношений (7.21) следуют соотношения (7.22).
$ 4) ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ. КЛАССИФИКАЦИЯ Подставляя выражение (7.25) для в правую часть послед- него соотношения, найдем \’ = Д/-1 Числитель последнего соотношения представляет собой сумму произведений элементов строки с номером j в определителе Ду на алгебраические дополнения этих элементов в указанном определителе. Следовательно, этот числитель равен Ду. Поэтому А,- ^=д77-, 7 = 2, 3, .... п. (7.26) Так как Л.| = Л(/П fi) = A(eif е1)=аи = Д1, то отсюда и из (7.26) получаем следующие формулы для канонических коэффи- циентов: (7-27> ^*1 ^п~1 § 4. Закон инерции квадратичных форм. Классификация квадратичных форм 1. Закон инерции квадратичных форм. Мы уже отмечали (см. замечание 2 п. 1 предыдущего параграфа), что ранг квад- ратичной формы равен числу отличных от нуля канонических коэффициентов. Таким образом, число отличных от нуля кано- нических коэффициентов не зависит от выбора невырожденного преобразования, с помощью которого форма А (х, х) приводится к каноническому виду. На самом деле при любом способе приве- дения формы А (х, х) к каноническому виду не меняется число положительных и отрицательных канонических коэффициентов. Это свойство называется законом инерции квадратичных форм. Прежде чем перейти к обоснованию закона инерции, сделаем некоторые замечания. Пусть форма А(х, х) в базисе e = (elf е2, ..., е„) опреде- ляется матрицей Л(е) = (а,-у): Л(х, х) = 2 (7.28) i. /=1 где |1( |2, |в—координаты вектора х в базисе е. Допустим, что эта форма с помощью невырожденного преобразования коор- динат приведена к каноническому виду Л (х, х) — + А2р2 + ... + ^*[4, (7.29)
200 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 причем 1ц 12, —отличные от нуля канонические коэф- фициенты, занумерованные так, что первые q из этих коэффи- циентов положительные, а следующие коэффициенты — отрица- тельные: ^>0, Х2>0, .... Ха>0, 19+1<0, .... %ft<0. Рассмотрим следующее невырожденное преобразование коор- динат рг*): ^=7=^. ..... 71 1 U 71 =—1— (7.30) = .....Пп=рп- В результате этого преобразования форма А{х, х) примет вид Л(х, х)=П? + п1+---+т)* — т)*+1—Til, (7.31) называемый нормальным видом квадратичной формы. Итак, с помощью некоторого невырожденного преобразования координат g2, ..., вектора х в базисе е = {е1, е2, ..., еп) = +“,^2 + • • • +а.-Х. (7-32) i = l, 2, ..., п, det(a/7)=/:0 (это преобразование представляет собой произведение преобра- зований £ в р и |л в 7] по формулам (7.30)) квадратичная форма может быть приведена к нормальному виду (7.31). Докажем следующее утверждение: Теорема 7.5 {закон инерции квадратичных форм). Чис- ло слагаемых с положительными {отрицательными) коэффициен- тами в нормальном виде квадратичной формы не зависит от способа приведения формы к этому виду. Доказательство. Пусть форма А {х, х) с помощью невы- рожденного преобразования координат (7.32) приведена к нор- мальному виду (7.31) и с помощью другого невырожденного преобразования координат приведена к нормальному виду Л (ж, x)=^ + ^+...+S2P-S+1-...-Ct (7.33) Очевидно, для доказательства теоремы достаточно убедиться в справедливости равенства p = q. Пусть р > q. Убедимся, что в этом случае имеется ненулевой вектор х такой, что по отношению к базисам, в которых форма Л (ж, х) имеет вид (7.31) и (7.33) координаты т)п. т]2, ..., т]д и ^+1, ..., Сп этого вектора равны нулю: *11 = 0, 712 = 0, .... 7]<z=0, С,+1 = 0, ..., С„=о. (7.34) *) Легко видеть, что определитель этого преобразования отличен от нуля.
5 4] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ. КЛАССИФИКАЦИЯ 201 Так как координаты г,,- получены путем невырожденного преобразования (7.32) координат а координаты £,•— с помощью аналогичного невырожденного преобразования этих же координат то соотношения (7.34) можно рассмат- ривать как систему линейных однородных уравнений относи- тельно координат ......с,п искомого вектора х в базисе е — — (еп е2, ..., е„) (например, в развернутом виде соотношение т)! =0 имеет, согласно (7.32), вид а1г^+а12^+...+atng„ =0). Так как р > q, то число однородных уравнений (7.34) меньше п, и поэтому система (7.34) имеет ненулевое решение относительно координат £t, ..., искомого вектора х. Следовательно, если p>q, то существует ненулевой вектор х, для которого выпол- няются соотношения (7.34). Подсчитаем значение формы А (х, х) для этого вектора х. Обращаясь к соотношениям (7.31) и (7.33), получим А (ж, х) = ... - rife = Ct + □+••. + Последнее равенство может иметь место лишь в случае = = ...= r)ft = 0 и = £, — ... = £^ = 0. Таким образом, в неко- тором базисе все координаты £t, £2, ..., £„ ненулевого вектора х равны нулю (см. последние равенства и соотношения (7.34)), т. е. вектор х равен нулю. Следовательно, предположение р > q ведет к противоречию. По аналогичным соображениям ведет к противоречию предположение р <Zq. Итак, p = q. Теорема доказана. 2. Классификация квадратичных форм. В п. 1 §2 этой главы (см. определение 2) были введены понятия положительно опре- деленной, отрицательно определенной, знакопеременной и квази- знакоопределенной квадратичных форм. В этом пункте с помощью понятий индекса инерции, поло- жительного и отрицательного индексов инерции квадратичной формы мы укажем, каким образом можно выяснить принадлех<- ность квадратичной формы к тому или иному из перечисленных выше типов. При этом индексом инерции квадратичной формы мы будем называть число отличных от нуля канонических коэф- фициентов этой формы (т. е. ее ранг), положительным индексом инерции—число положительных канонических коэффициентов, отрицательным индексом инерции—число отрицательных кано- нических коэффициентов. Ясно, что сумма положительного и отрицательного индексов инерции равна индексу инерции. Итак, пусть индекс инерции, положительный и отрицательный индексы инерции квадратичной формы А (х, х) соответственно равны k, р и q (k=p-rq). В предыдущем пункте было доказано, что в любом каноническом базисе / = (/п /2, эта форма
202 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ.ФОРМЫ [ГЛ. 7 может быть приведена к следующему нормальному виду: А(х, х) = т)Л-т11+..-+'Пр—Л?н-1—•••—Пъ (7-35) где п1±» Пг» • ••, Ли — координаты вектора х в базисе f. 1°. Необходимое и достаточное условие знакоопределенности квадратичной формы. Справедливо следующее утверждение: Для того чтобы квадратичная форма А (х, х), заданная в п-мерном линейном пространстве L, была знакоопределенной, необ- ходимо и достаточно, чтобы либо положительный индекс инер- ции р, либо отрицательный индекс инерции q был равен размер- ности п пространства L. При этом, если р — п, то форма положительно определенная, если же q = n, то форма отрицательно определенная. Доказательство. Так как случаи положительно опреде- ленной формы и отрицательно определенной формы рассматри- ваются аналогично, то доказательство утверждения проведем для положительно определенных форм. 1) Необходимость. Пусть форма Л(х, х) положительно определена. Тогда выражение (7.35) примет вид Л(х, х)=п? + П2+---+Пр- Если при этом р < п, то из последнего выражения следует, что для ненулевого вектора х с координатами П1 = 0. Пг = 0..П, = 0. Пр+1=И=0, .... Пн5^0 форма Л(х, х) обращается в нуль, а это противоречит опре- делению положительно определенной квадратичной формы. Сле- довательно, р — п. 2) Достаточность. Пусть р = п. Тогда соотношение (7.35) имеет вид Л (х, х) = л! + + • • • +< Ясно, что Л (х, х) 0, причем, если Л = 0, то = т)2 = ... ... = т]п = 0, т. е. вектор х нулевой. Следовательно, Л(х, х) — положительно определенная форма. Замечание. Для выяснения вопроса о знакоопределенности квадратичной формы с помощью указанного признака мы должны привести эту форму к каноническому виду. В следующем пункте мы докажем критерий Сильвестра зна- коопределенности квадратичной формы, с помощью которого можно выяснить вопрос о знакоопределенности формы, заданной в любом базисе без приведения к каноническому виду. 2°. Необходимое и достаточное условие знакопеременности квад- ратичной формы.
$4] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ. КЛАССИФИКАЦИЯ 203 Докажем следующее утверждение: Для того чтобы квадратичная форма была знакопеременной, необходимо и достаточно, чтобы как положительный, так и отри- цательный индексы инерции этой формы были отличны от нуля. Доказательство. 1) Необходимость. Так как зна- копеременная форма принимает как положительные, так и отри- цательные значения, то ее представление (7.35) в нормальном виде должно содержать как положительные, так и отрицатель- ные слагаемые (в противном случае эта форма принимала бы либо неотрицательные, либо неположительные значения). Следова- тельно, как положительный, так и отрицательный индексы инер- ции отличны от нуля. 2) Достаточность. Пусть р#=0 и q=£0. Тогда для век- тора х, с координатами Я1 #= 0, ..., яР^0, Яр+1 = 0, •••. Лге=0 имеем A (xt, xj > 0, а для вектора х2 с координатами ях = 0, . .., ’1^ = 0, ..., г]„#=0 имеем А(х2, х2) < 0. Следовательно, форма А(х, х) является знакопеременной. 3°. Необходимое и достаточное условие квазизнакоопределен- ности квадратичной формы. Справедливо следующее утверждение: Для того чтобы форма А (х, х) была квазизнакоопределенной, необходимо и достаточно, чтобы выполнялись соотношения: либо р<_п, <7 = 0, либо р = 0, q < п. Доказательство. Мы рассмотрим случай положительно квазизнакоопределенной формы. Случай отрицательно квазизна- коопределенной формы рассматривается аналогично. 1) Необходимость. Пусть форма А(х, х) положительно квазизнакоопределенная. Тогда, очевидно, q = Q и р<_п (если бы р = п, то форма была бы положительно определенной). 2) Достаточность. Если р < п, q = 0, то А(х, х)2>0 и для ненулевого вектора х с координатами т],=0, ..., 1^ = 0, т]/>+1 =# 0, ..., Ял =^0 имеем А (х, х) = 0, т. е. А (х, х) — положи- тельно квазизнакоопределенная форма. 3. Критерий Сильвестра знакоопределенности квадратичной формы. Пусть форма Л (х, х) в базисе е = (е1, е2, ..., еп) опре- деляется матрицей А (е) = (а{/): п А(х, х)= S МЛ/» J. /= 1 и пусть — угловые миноры и определитель матрицы (а;/). Справедливо следующее утверждение:
2С4 билинейные и квадратичные формы [ГЛ. 7 Теорема 7.6 {критерий Сильвестра). Для того чтббы квадратичная форма А (х, х) была положительно определенной, необходимо и достаточно, чтобы были выполнены неравенства Дх > О, Д2 > 0, ..., Д„ > О. Для того чтобы квадратичная форма была отрицательно определенной, необходимо и достаточно, чтобы знаки угловых миноров чередовались, причем Д2 < О. Доказательство. 1) Необходимость. Докажем сна- чала, что из условия знакоопределенности квадратичной формы А (х, х) следует А,- #= 0, i = 1, 2, ..., п. Убедимся, что предположение Ай = 0 ведет к противоречию— при этом предположении существует ненулевой вектор х, для ко- торого А {х, х) = 0, что противоречит знакоопределенности формы. Итак, пусть Aft = 0. Рассмотрим следующую квадратную од- нородную систему линейных уравнений: Ч~ fli2^2 Ч- • •• Ч-аиЛь = ^21^1 Ч- «2 2^2 + • • • Ч- = (7.36) akl^l Ч- Ч- • • Ч- ^kk^k О' Так как ДА—определитель этой системы и Дй = 0, то система (7.36) имеет ненулевое решение |2, ..., Ц (не все равны нулю). Умножим первое из уравнений (7.36) на второе на |2, ..., последнее на и сложим полученные соотношения. В результате получим равенство k 2 М&=о, »> левая часть которого представляет собой значение квадратичной формы А {х, х) для ненулевого вектора х с координатами (Si, ?2> •••> 0, •••> 0)- Это значение равно нулю, что про- тиворечит знакоопределенности формы. Итак, мы убедились, что Af^0, : = 1, 2, ..., п. Поэтому мы можем применить метод Якоби приведения формы А (х, х) к сумме квадратов (см. теорему 7.4) и воспользоваться форму- лами (7.27) для канонических коэффициентов Af. Если А {х, х) — положительно определенная форма, то все канонические коэф- фициенты положительны. Но тогда из соотношений (7.27) сле- дует, что Ах > 0, Д2 > 0, ..., А„ > 0. Если же А (х, х)—отри- цательно определенная форма, то все канонические коффициенты отрицательны. Но тогда из' формул (7.27) следует, что знаки угловых миноров чередуются, причем Aj < 0. 2) Достаточность. Пусть выполнены условия, наложен- ные на угловые миноры Af в формулировке теоремы. Так как
ПОЛИЛИНЕЙНЫЕ ФОРМЫ 205 $ 5] Д,#=0, £=*1, 2, .п, то форму А можно привести к сумме квадратов методом Якоби (см. теорему 7.4), причем канониче- ские коэффициенты X, могут быть найдены по формулам (7.27). Если Д1 > 0, Д2 > 0, ..., Дге>0, то из соотношений (7.27) сле- дует, что все %f-> 0, т. е. форма А (х, х) положительно опре- деленная. Если же знаки Д; чередуются и Дх < 0, то из соот- ношений (7.27) следует, что форма А (х, х) отрицательно опре- деленная. Теорема доказана. § 5. Полилинейные формы Определение. Полилинейной формой A (xit х2, ..., хр) р векторных-аргу ментов называется числовая функция, опреде- ленная на всевозможных векторах xlt х2, ..., хр, линейного пространства L и линейная по каждому из аргументов, при фиксированных значениях остальных аргументов. Простейшим примером полилинейной формы может служить произведение линейных форм А (хх) А (х2).. .А (хр). Полилинейная форма A (xlt х2, .... хр) называется симмет- ричной (кососимметричной), если для каждых двух ее аргумен- тов хк и хг и для любых значений этих аргументов выполня- ется соотношение A (Xi.....xk......xz......хр) = A (xt, ...,Х[.....хк......хр) (А(хъ ...,хк......xt......хр) = — А (хх, ...,xt, . ..,хк,..., хр)). Пусть полилинейная форма A (xit Х2, ..., хр) задана в ко- нечномерном линейном пространстве L, и пусть elt е2, ..., еп — базис в L. Обратимся к разложению каждого вектора х(- по базисным векторам et, е2, ..., е„: Xi = li^i + g,.2e2 +... + linen = 2 Sue,, i = 1, 2..p. (7.37) i=i Подставляя выражения для xt по формулам (7.37) в поли- линейную форму A (Xj, х2, ..., хр) и используя свойство ли- нейности этой формы по каждому аргументу, получим А (х^ Хг, ..., хр) = А ( 2 51 /1^/1» 5г, .... 2 %PiBei„ \/i = i /г=1 Ур=1 р р = S ... £р{А (elt, е!г, ef). (7.38) н. /р = 1 р р Таким образом, значения полилинейной формы A (xit х2, .. .хр) в конечномерном пространстве с выделенным базисом ev ег, ..., еп определяются всевозможными значениями А (е/„ ej2, е, ) этой формы на векторах е,,, е,2, ..., е/ .
206 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Докажем следующее утверждение: Теорема 7.7. Любая полилинейная кососимметричная форма A (xit х2, ..., хп) заданная в п-мерном линейном пространстве L с выделенным базисом elt е2, ..., еп может быть представлена в виде A (xit х2, .... хп)=а £п £12 1 • £in £21 £22 • • £ги a s » • « 1 • £ni £п2 •;• £лп (7.39) где a — A(eit е2, .... е„), a (£п, £,2, ..., £in)—координаты вектора.х в базисе elt е2, еп. Доказательство. Так как форма A (xir х2, ..., хп) является кососимметричной, то для произвольной перестановки (/1> /2> •••» !п) индексов (1, 2, ..., и) имеем A(eh, eh, ..., е/я)=(—>/л)Л(Cf, е2, .... е„) = = (_1)"(А./2../п)а> (7.40) где N (Ji, j2, ..., /„) — число беспорядков в перестановке (/1> ^2’ ' • • > in)' В силу кососимметричности формы для двух одинаковых индексов jk и J;(/fc = /,) значение Л (ел, ..., eZft, ..., ei(, ... ..., в/) равно нулю. Отсюда и из соотношения (7.40) следует, что для рассматриваемого случая соотношение (7.38) примет вид Л(жх, х2, .... хп)=а 2 (_ 1)"'/>.• 'Л)^Л2й... U„- '*’«.'п~' (7.41) Сравнивая формулу (7.41) с формулой (1.28) гл. 1 для опре- делителя порядка п, мы убедимся в справедливости соотношения (7.39). Теорема доказана. § 6. Билинейные и квадратичные формы в евклидовом пространстве В предыдущих параграфах мы изучали билинейные и ква- дратичные формы в произвольном (не обязательно евклидовом) вещественном линейном пространстве L. В этом параграфе мы получим ряд сведений о билинейных и квадратичных формах, заданных в вещественном евклидовом пространстве. При этом мы будем широко пользоваться результатами § 9 гл. 5, посвя- щенными линейным операторам. В п. 3 настоящего параграфа будет показано, каким образом теория евклидовых пространств может быть применена для по-
$61 ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 207 лучения содержательных результатов в произвольных линейных пространствах. В частности, нами будет получено независимое доказательство теоремы о том, что каждая квадратичная форма в линейном пространстве может быть приведена к канониче- скому виду. I. Предварительные замечания. В этом пункте мы напомним некоторые понятия теории линейных операторов. Пусть V—/г-мерное вещественное евклидово пространство и А—линейный оператор, действующий из V в V. Оператор Л* называется сопряженным к А, если для всех х € V и у g V выполняется равенство (Ах, у) = (х, А*у). (7.42) Оператор А называется самосопряженным, если А = А*, т. е. если для всех х £ V и у £ V (Ах, у)~ (х, Ау). (7.43) Рассмотрим билинейную форму В (х, у), заданную в евкли- довом пространстве V. В главе 5 было установлено, что каждой такой форме В (х, у) однозначно соответствует линейный опе- ратор такой, что справедливо равенство В(х, у) = (Ах, у). (7.44) Кроме того, в теореме 5.33 было доказано, что билинейная форма В (х, у) является симметричной тогда и только тогда, когда оператор А, фигурирующий в (7.44), является самосопря- женным. Напомним также, что в теореме 5.35 для любого самосопря- женного оператора А было доказано существование ортонорми- рованного базиса из собственных векторов. Это означает, что существуют ортонормированная система elt es, ..., еп и ве- щественные числа Л2, ..., такие, что ЛеА = ЧеА. (7.45) Отметим, что в базисе {ек} матрица оператора А имеет диа- гональный вид. 2. Приведение квадратичной формы к сумме квадратов в ортогональном базисе. Пусть В(х, у)—симметричная билиней- ная форма, заданная в вещественном евклидовом пространстве V, а В(х, х)—определяемая ею квадратичная форма. Докажем следующую теорему о приведении квадратичной формы В(х, х) к сумме квадратов. Теорема 7.8. Пусть В(х, у)—симметричная билинейная форма, заданная в евклидовом пространстве V. Тогда в прост- ранстве V существует такой ортонормированный базис {eft} и
208 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ ГЛ. 7 можно указать такие вещественные числа Ал, что для любого х € V квадратичная форма В (х, х) может быть представлена в виде следующей суммы квадратов координат вектора х в ба- зисе {еА}; В(Х,Х)=Ш (7.46) k— 1 Доказательство. Так как В(х, у)—симметричная би- линейная форма, то существует самосопряженный оператор А такой, что В(х, ^) = (Лх, у). (7.47) По теореме 5.35 для оператора А можно указать ортонорми- рованный базис из собственных векторов этого оператора; пусть ^—собственные значения, отвечающие ек. Пусть вектор х имеет в базисе ек координаты x=^lkek. (1AS) k— 1 Тогда, очевидно, поскольку ек—собственные векторы опе- ратора А: п Ах= 2 \&кек. (7.49) Л= 1 Из соотношений (7.48) и (7.49) вследствие ортонормирован- нбсти базиса {ej получаем следующее выражение для скаляр- ного произведения (Ах, х): п (Ах, х)=2^- (7.50) /г= 1 Отсюда и из соотношения (7.47) получаем (7.46). Теорема доказана. 3. Одновременное приведение двух квадратичных форм к сумме квадратов в линейном пространстве. Докажем теперь важную теорему об одновременном приве- дении двух квадратичных форм к сумме квадратов в произволь- ном (не обязательно евклидовом) вещественном линейном про- странстве. Теорема 7.9. Пусть А (х, у) и В(х, у)—симметричные билинейные формы, определенные в вещественном линейном прост- ранстве V. Допустим далее, что для всех x£V, х=#=0, справед- ливо неравенство В (х, х) > 0 (т. е. квадратичная форма В(х, х)—положительно определенная}. Тогда в пространстве V можно указать базис {ек} такой, что квадратичные формы
§ 6] ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 209 А (х, х) и В (х, х) могут быть представлены в виде 4(x,x)=W (7.51) k=i В(Х,Х)=2У, (7.52) *=i где —координаты вектора х в базисе {еА}. Доказательство. Согласно замечанию в конце §2 этой главы скалярное произведение в конечномерном вещественном пространстве может быть задано с помощью билинейной формы В(Х, у), полярной к положительно определенной квадратичной форме В(х, х). Поэтому мы можем ввести в линейном пространстве V ска- лярное произведение (х, у) векторов хну, полагая (х, у)~В(х, у). (7.53) Таким образом, V представляет собой евклидово прост- ранство со скалярным произведением (7.53). По теореме 7.11 можно указать такой ортонормированный базис {еД и такие вещественные числа что в этом базисе квадратичная форма Л (х, х) представляется в виде (7.51). С другой стороны, в любом ортонормированном базисе ска- лярное произведение (х, х), равное, согласно (7.53), В(х, х), представляется в виде суммы квадратов координат вектора х. Таким образом, представление В(х, х) в виде (7.52) в базисе {eft} также обосновано. Теорема доказана. Замечание. Из доказанной нами теоремы непосредственно следует, что любую квадратичную форму в произвольном вещест- венном линейном пространстве можно привести к каноническому виду. Однако способ такого приведения является, вообще говоря, более сложным, чем способы, изложенные выше в § 3, поскольку он требует нахбждения всех собственных векторов некоторого самосопряженного оператора (см. по этому поводу гл. 6). 4. Экстремальные свойства квадратичной формы. Рассмотрим произвольную дифференцируемую функцию /, определенную на некоторой гладкой поверхности S (см. определение гладкой поверх- ности в гл. 5 Части 2 «Основ математического анализа»). Будем говорить, что точка х0 поверхности S является стационарной точкой функции f, если в точке х0 производная функции f по любому направлению на поверхности S равна нулю. В част- ности, точки экстремума функции f являются ее стационарными точками. Значение f(x0) функции f в стационарной точке х0 называется стационарным значением. Иногда стационарную точку х0 функции / называют ее критической точкой, а величину
210 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (ГЛ. 7 f (хо) — критическим значением. В этом пункте мы иссле- дуем вопрос о стационарных и, в частности, экстремальных зна- чениях квадратичной формы В (х, х) на сфере единичного радиуса в евклидовом пространстве V и о связи этих значений с собствен- ными значениями самосопряженного оператора А, с помощью которого симметричная билинейная форма В(х, у), полярная квадратичной форме В(х, х), представляется в виде В(х, у)=(Ах, у). (7.54) При этом единичной сферой в У мы будем называть множе- ство тех векторов X^V, которые удовлетворяют уравнению (х, х) = 1 или |]х|| = 1. (7.55) Для упрощения рассуждений мы воспользуемся выводами предыдущего пункта о приведении квадратичной формы к сумме квадратов. Итак, пусть В (х, х) — квадратичная форма, В(х, у) — поляр- ная этой форме билинейная форма, А — самосопряженный опера- тор, связанный с В(х, .у) соотношением (7.54). По теореме 7.8 в ортонормированном базисе {еА}, состоящем из собственных векторов оператора А, квадратичная форма В(х, х) имеет вид п В{Х, Х)=2М|, (7.56) /г = 1 где 5* — координаты вектора х в базисе {eft}, а — собственные значения оператора А. Мы договоримся нумеровать эти собствен- ные значения в порядке убывания: (7.57) Заметим, что в выбранном базисе единичная сфера, опреде- ляемая уравнением (7.55), в координатах вектора х задается уравнением 2У-1=0. (7.58) fe=i Докажем следующую теорему. Теорема 7.10. Стационарные значения квадратичной формы В(х, х) на единичной сфере (7.55) равны собственным значениям Xk оператора А. Эти стационарные значения достигаются, в частности, на единичных собственных векторах ек оператора А. Доказательство. Так как речь идет о стационарных зна- чениях функции В(х, х) при условии (х, х) = 1, т. е. об услов- ном экстремуме этой функции, то мы можем воспользоваться методом неопределенных множителей Лагранжа (см. «Основы ма- тематического анализа» часть I, п. 2, § 5, гл. 15). Составим для
$ 6J ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 211 функции В(х, х), используя ее выражение (7.56) в данном базисе (еА}, функцию Лагранжа ¥(£о £2, gft), учитывая при этом, что уравнение связи имеет вид (7.58). Получим п / п \ ¥ = 2 2 11-1 , (7-59) А=1 \*=1 / где X—неопределенный множитель Лагранжа. Напомним, что если X в (7.59) выбрано так, что при условии (7.58) выполняются соотношения лит -^ = 0, k =1,2.........и, (7.60) то в точках сферы (7.58), отвечающих этим значениям Л, функ- ция В(х, х) (квадратичная форма В(х, х)) имеет стационарное значение. Таким образом, вопрос о стационарных значениях В(х, х) на сфере (х, х) = 1 редуцируется к исследованию системы урав- нений (7.58), (7.60) относительно неизвестных Л и координат |2> •••> in вектора х. Отметим, что при этом Jj2, будут координатами того вектора х, на котором В (х, х) будет иметь стационарное значение. Так как ^- = 2(ХА— X) то интересующая нас система (7.58), (7.60) примет вид *?Л=1, | (7.61) (4-Mlfc = 0, k=l, 2, ..., п. ) Пусть система (7.61) имеет решение %=х, i=(ti, й •••, L). Умножая каждое из соотношений (ЛА— Л)|А = 0 на £k, сум- п мируя затем полученные соотношения и учитывая, что 2 0= 1. k= 1 получим, согласно (7.56), следующее значение для Л: £=2 Kll = B(x, х). k= 1 Таким образом, если~Х и х = (11, |2, .... gj —решение системы (7.61), то К равно значению квадратичной формы В(х, х) на век- торе x = (Ii, g2, ..., jn), «л котором эта форма имеет стацио- нарное значение.
212 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Легко видеть, что решениями системы (7.61) служат следую- щие значения неизвестных к и Л = Ч; ^ = 0..........= Bfe+i=0.....£„=0, k= 1, 2, ..., п. Очевидно, эти решения являются собственными значениями и координатами соответствующих собственных векторов ek. Тео- рема доказана. Замечание. Мы только что выяснили, что собственные зна- чения являются стационарными значениями квадратичной формы В (х, х) на сфере (х, х) = 1. Оказывается, числа и А.„ (при условии (7.57)) являются соответственно наибольшим и наименьшим значениями В(х, х) на сфере (х, х) = 1 (то, что эти значения достигаются, установ- лено выше). Чтобы убедиться в справедливости замечания, достаточно за- менить в (7.56) все сначала на а затем на и восполь- зоваться соотношениями (7.57) и (7.58). Очевидно, получим неравенства 1„<В(х, Х)<^. § 7. Гиперповерхности второго порядка В этом параграфе мы познакомимся с понятием и основными типами гиперповерхностей второго порядка. Кроме того, будут указаны способы исследования таких поверхностей. 1. Понятие гиперповерхности второго порядка. Пусть V — n-мерное вещественное евклидово пространство. Ради геометрической наглядности будем называть векторы х этого пространства точками. Гиперповерхностью S второго порядка будем называть геометрическое место точек х, удовлетворяющих уравнению вида А(х, х) + 2В(х)+с = 0, (7.62) где А (х, х) — не равная тождественно нулю квадратичная форма, В(х)—линейная форма, а с—вещественное число. Уравнение (7.62) будем называть общим уравнением гиперповерхности второго порядка. Выделим в пространстве V какой-либо ортонормированный базис {ek\. Координаты вектора х (точки х) в этом базисе обо- значим через (Xj, х2, .,,, хп). Тогда (см. п. 2 § 1 этой главы) квадратичная форма А (х, х) может быть представлена в виде А(х, х)= 2 OoiXjXk, (7.63) /, *= 1
§ 7] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 213 где = еА) (7.64) и А (еу, еА)—значение на векторах е} и ek симметричной били- нейной формы А (х, у), полярной квадратичной форме А (х, х). Линейная форма В (ж) в указанном базисе {еА} представля- ется в виде *) п в (X) = 2 Мл- (7.65) k — 1 Таким образом, общее уравнение гиперповерхности второго по- рядка в евклидовом пространстве V с выделенным базисом {еА} может быть представлено в следующей форме: п п 2 а-кХ;Хк 4-2 2 bkxk 4- с = 0. (7.66) /, А=1 А=1 Договоримся о следующей терминологии. п Слагаемое А(х, х) = 2 ajkxjxk будем называть г р у п п о й /• 1 старших членов уравнения (7.62) или (7.66). п Группу слагаемых В(х)4-с = 2 + с будем называть ли- нейной частью уравнения (7.62) или (7.66). Мы будем рассматривать в дальнейшем матрицы «п • • • «in bi ani • • • апп Ьп bi ... Ьп с и определители det А и det В этих матриц. Исследование гиперповерхностей второго порядка мы будем проводить с помощью метода, сходного с методом, применяемым в аналитической геометрии при исследовании кривых и поверх- ностей второго порядка, заданных общими уравнениями. Идея этого метода заключается в том, что путем выбора спе- циальной декартовой системы координат на плоскости (для кри- вых второго порядка) или в пространстве (для поверхностей вто- рого порядка) достигается максимальное упрощение уравнения кривой или поверхности. Затем путем исследования этого урав- нения выясняются геометрические свойства кривой или поверх- ности. Кроме того, перечисление всех возможных типов простей- *) Согласно лемме п. 1 § 4 гл. 5 линейная форма В(х) может быть пред- ставлена в виде В (х) = (х, Ь), где b—постоянный вектор. Обозначая blt Ь2, ... ..., Ьп координаты вектора Ь и учитывая ортонормированность базиса {ед}! мы получим представление В (х) в виде (7.65).
214 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (ГЛ. 7 ших (канонических) уравнений кривых или поверхностей второго порядка позволяет дать их классификацию. Чтобы использовать этот метод в многомерном случае, мы сна- чала должны изучить такие преобразования (отображения) п-мер- ного евклидова пространства, которые представляют собой аналоги преобразований декартовых прямоугольных координат в случае двух и трех измерений. Такими преобразованиями в n-мерном случае будут параллель- ные переносы и такие преобразования базисов, при которых ортонормированный базис переходит в новый ортонормированный базис. Точные определения этих преобразований будут даны в следующем пункте. Очевидно, гиперповерхность второго порядка, рассматривае- мая как геометрический объект пространства V, не изменяется, если производится преобразование указанного выше вида. Ниже мы убедимся, что для каждого уравнения вида (7.62) (или (7.66)) можно выбрать такое начало координат и выбрать такой орто- нормированный базис в V, что это уравнение, записанное в коор- динатах относительно нового базиса, будет максимально простого вида, и поэтому, как и в случае двух и трех измерений, можно будет указать геометрические характеристики таких поверхно- стей и дать им классификацию. 2. Параллельные переносы в евклидовом пространстве. Пре- образования ортонормированных базисов в ортонормированные. Параллельным переносом в евклидовом пространстве V мы будем называть преобразование, задаваемое формулами х = х' + х, (7.68) где х—фиксированная точка, называемая новым началом коор- динат. Пусть точки х, х' и х имеют координаты, соответственно равные (хп х2, ..., х„), (х^, х'2, ..., хп) и (хй х2.х„). Тогда в координатах параллельный перенос определяется формулами xk = x'k + xk, k — \, 2, .... n. (7.69) Отметим, что при параллельном переносе любой фиксирован- ный базис не изменяется. Перейдем теперь к выяснению характеристики преобразова- ния ортонормированного базиса в ортонормированный. Допустим, что ортонормированный базис (ej преобразуется в новый ортонормированный базис {е^- Разложим каждый
ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 215 $ 71 вектор е* по векторам {ей}. Получим ~ Pn^i 4~ • • • 4~Рп1^л> 'l = Р12&1 р2 2&2~1~ • • • ~hPn2^n< I (7 7Q) ®n = Pin^i ~Ь Р2П&2 4" • • • ~bPnn^n‘ J Обозначим буквой P матрицу преобразования (7.70): (Pit P21 * • < Pni \ P12 P22 Pn2 j (7 71) Pin Pzn i i * Pnn z Так как базисы {ek} и {e*} ортонормированные, то из (7.70) путем скалярного умножения е) и e’k получим ” (1 при j = k, (в/’ ek^ = m?i Pm'P'nft = б'* = { 0 при / #=*. <7,72> Рассмотрим теперь транспонированную матрицу Р', т. е. матрицу, полученную из Р перестановкой строк и столбцов. Очевидно, согласно (7.72), РР' = Р'Р = 1, (7.73) где I—единичная матрица. Равенства (7.73) показывают, что матрица Р' является обрат- ной для матрицы Р, т. е. Р~*=Р'. (7.74) Допустим теперь, что мы рассматриваем преобразование орто- нормированного базиса {eft} поформулам (7.70), причем матрица Р этого преобразования удовлетворяет условию (7.73) (или, что то же, (7.74)). Тогда, очевидно, элементы pJb матрицы Р удовлетворяют условию (7.72), что, согласно этим же соотношениям (7.72), экви- валентно условию ортонормированности базиса {е*}. Напомним, что в § 9 гл. 5 матрицу Р, удовлетворяющую условию (7.73), мы назвали ортогональной. Итак, для того чтобы преобразование (7.70) было преобразова- нием ортонормированного базиса в ортонормированный, необхо- димо и достаточно, чтобы матрица Р этого преобразования была ортогональной. Замечание. Обращаясь к формулам (5.14) преобразования координат вектора при преобразовании базиса (см. п. 1, § 2, гл. 5) и учитывая, что обратная матрица для ортогональной матрицы Р есть матрица Р', получим следующие формулы преобразования
216 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 координат точки х при переходе от ортонормированного базиса к ортонормированному: Xi = PilXj -ф- Pi2X2 4-... 4- pinxn, 'l ^2= Pnxi 4- Pnxi 4* • • • 4~ Pznxn> I 75) xn = PnX + Pnzx’i + • • • + Pnnxn- ) 3. Преобразование общего уравнения гиперповерхности вто- рого порядка при параллельном переносе. Рассмотрим параллель- ный перенос, который определяется как преобразование прост- ранства V по формуле (7.68) (или вкоординатах по формуле (7.69)). Левая часть (7.62) после подстановки вместо х его выраже- ния по формуле (7.68) в силу линейности квадратичной формы по первому и второму аргументу *) и свойств линейной формы примет следующий вид: Л(х', х') + 2[Д(х', х)+В(х')] +[Л (х, х)4-2В(х)4-с]=0. Итак, общее уравнение (7.62) гиперповерхности S при парал- лельном переносе (7.68) запишется в форме 4(х', х') + 2В' (х') + с' =Q, (7.76) где линейная форма В' (х') и постоянное число с' определяются соотношениями В’ (х') = А (х', х) + В (х'), (7.77) с’ =4(х, х) + 2В(х)4-с. (7.78) Запишем полученные формулы в координатах. Пусть координаты точек х' их равны соответственно х[, х'2, ... ..., х'п и х1( х2, ..., х„. Так как при параллельном переносе базис {ej не меняется, то квадратичная форма Д(х', х') запи- шется следующим образом: А(х', х')= 2 «/^/4 (7.79) Г, k=i (отметим, что коэффициенты а//г = A (ej, ek) не меняются, так как не меняются базисные векторы ек). Следовательно, мы можем сделать важный вывод: при парал- лельном переносе группа старших членов сохраняет свой вид. *) Квадратичная форма А (х, х) связана с симметричной билинейной фор- мой А (х, у), полярной к форме А (х, х). Билинейная форма А (х, у) линейна по аргументам х и у. Фигурирующее в дальнейшем тексте выражение Л (х',х) представляет собой значение формы А (х, у) на векторах х' и х.
S7J ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 217 Займемся теперь формулами (7.77) и (7.78). Так как п / п \ Д(х', х) = 2 2 +Л4. k=l \/ =1 J п В(х') = 5 bkXk, fe=l п А(х, х)=, '%ia/kx/xk, п В(х) = S Ькхк, ft=i то формула (7.77) примет вид л п Г п ”1 В'(И= 2 2 Sws+b* х’к, (7.80) k=i k=i L/=i J а формула (7.78) запишется следующим образом: с' = 2 а/кх/хк +2 2 Ь^ск +с. (7.81) У, Л=1 А = 1 Таким образом, уравнение (7.76) в координатах будет иметь следующий вид: п п 2 a/kx'iXk +22 b'kXk + с' = 0. (7.82) у, fe=l k=l Нам понадобится несколько иное, чем (7.81), выражение для с'. Запишем (7.81) в следующей форме: л Г п .1 .л с' = 2 2 + b J хк + 2 Ь^ск +с. *=iL/=i J *=i (7.83) Учитывая, что коэффициенты Ьк выражаются, как это сле- дует из (7.80), по формулам Ьк = 2 а}кх/~^Ьк, (7.84) /=1 мы получим из (7.83) нужное нам выражение для с': Л с' = 2 (b'k+bk)xk + c. k = 1 (7.85) 4. Преобразование общего уравнения гиперповерхности вто- рого порядка при переходе от ортонормированного базиса к орто- нормированному. Пусть ортонормированный базис {ej преобра- зуется в новый ортонормированный базис {е*} по формулам
218 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ \[ГЛ. 7 (7.70) и Р —ортогональная матрица этого преобразования (см. (7.71)). Тогда, согласно замечанию в п. 2 этого параграфа, координаты хк и x'k точки в базисах и (ejj связаны соот- ношениями (7.75). Подставляя выражение для хк из (7.75) в ле- вую часть уравнения (7.66) и учитывая, что вследствие одно- родности соотношений (7.75) группа старших членов и линейная часть уравнения (7.66) преобразуются автономно, получим сле- дующее выражение для общего уравнения гиперповерхности второго порядка в координатах хк точек в преобразованном ба- зисе 2 а'кх-хк+2 S b'kXk + c' =0. (7.86) /,k=i k-i Согласно отмеченной выше автономности преобразования группы старших членов, справедливы равенства п п S a'ikx-xk = 2 aJkXjXk, ]r /, Я= 1 п п 2 bkxk= S bkxk> k=l k=l c' = c. (7.87) Обращаясь к первой из формул (7.87), мы видим, что для определения коэффициентов a'jk можно воспользоваться правилом преобразования коэффициентов квадратичной формы при переходе к новому базису. Именно, если обозначим буквой Л' матрицу квадратичной формы А (х, х) в базисе {£&}, то, согласно теореме 7.2 и соотношению Р'—Р~1, получим следующую связь между мат- рицами А и А' формы Л(х, х) в базисах и (е*}: Л'=Р"МР (7.88) (напомним, что Р—матрица ортогонального преобразования). Будем рассматривать теперь матрицу А' как матрицу некото- рого линейного оператора А в базисе *), а матрицу Р~* как матрицу перехода от базиса к базису {еА}. Тогда, соглас- но теореме 5.7 (см. п. 2 § 2 гл. 5) матрицу А можно рас- сматривать как матрицу этого линейного оператора А в ба- зисе {ек}. Иными словами, матрица квадратичной формы при преобра- зовании ортонормированного базиса в ортонормированный изме- няется как матрица некоторого линейного оператора. Этот вывод мы используем в следующем пункте. *) Согласно теореме 5.5 (см. п. 1 § 2 гл. 5) любая квадратная матрица из п строк и п столбцов может рассматриваться как матрица некоторого ли- нейного оператора, действующего в «-мерном пространстве.
5 71 ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 219 Замечание. Отметим, что оператор А, матрица которого в ортонормированием базисе совпадает с матрицей квадратич- ной формы А (х, х), самосопряженный. Для доказательства проведем следующие рассуждения. Пусть А(х, х) — квадратичная форма и А (х, у)— симметрич- ная билинейная форма, полярная форме А (х, х). Согласно тео- реме 7.8 билинейная форма А (х, у) может быть представлена в виде А(х, у) = (Ах, у), где А—самосопряженный оператор. Поэтому квадратичная форма А (х, х) может быть представ- лена в виде Л(х, х) = (Дх, х). Докажем, что в ортонормированном базисе {ек} матрицы опе- ратора А и квадратичной формы совпадают. Этим будет доказано утверждение замечания. Пусть aJk—элементы матрицы формы А(х, х) и aJk—эле- менты матрицы оператора А в базисе {eft|. Согласно п. 2 § 1 этой гла!вы = ек), а элементы a/ft, согласно п. 1 § 2 гл. 5, формула (5.13), могут быть найдены из равенств п ACj- = 5 ajpep' р-1 Умножим обе части последнего соотношения скалярно на ек. Тогда, учитывая ортонормированность базиса получим {AeJt e^ = aJk. Так как A(eJt ек)~(Аеу-, ек), то aJk — ajk. Утверждение заме- чания доказано. 5. Инварианты общего уравнения гиперповерхности второго порядка. Назовем инвариантом общего уравнения (7.62) (или (7.66)) гиперповерхности второго порядка относительно парал- лельных переносов и преобразований ортогональных базисов в ортогональные такую функцию f(alit ai2, ..., апп, blt ,. ., bn, с) коэффициентов этого уравнения, значение которой не меняется при указанных преобразованиях пространства. Докажем следующее утверждение: Теорема 7.11. Инвариантами общего уравнения (7.62) (или (7.66)) гиперповерхности второго порядка являются коэффициенты характеристического многочлена матрицы А квадратичной формы
220 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 А (х, х) и определитель det В матрицы В в соотношении (7.67). В частности, инвариантами являются det А и след а114-а224-... ... +ап„ матрицы А. Доказательство. Очевидно, инвариантность перечислен- ных в условии теоремы величин достаточно доказать отдельно для параллельного переноса и преобразования ортонормирован- ного базиса в ортонормированный. Рассмотрим сначала параллельный перенос. В п. 3 этого па- раграфа мы установили, что при этом преобразовании группа старших членов сохраняет свой вид (см. формулу (7.79)). По- этому не меняется матрица А, а следовательно, и характери- стический многочлен этой матрицы. Докажем инвариантность det В. При параллельном переносе (7.68) (или (7.69)) матрица пре- образуется в матрицу В', определитель которой, согласно (7.82), имеет вид ^11 • • • а1п det В' — ........., ani • • • апп Оп bi ... Ьп с' (7.89) где величины b'k и с’ определяются по формулам (7.84) и (7.85). Вычтем из элементов последней (п-}- 1)-й строки определителя (7.89) элементы первой строки, умноженные на xit затем эле- менты второй строки, умноженные на х2, и т. д., наконец, эле- менты n-й строки, умноженные на х„. Так как при таких пре- образованиях определитель не меняется, то, используя (7.84) и (7.85), получим соотношение а11 • • а1п bi det В' = (7.90) Вычтем теперь из элементов последнего (п+1)-го столбца определителя (7.90) элементы первого столбца, умноженные на затем элементы второго столбца, умноженные на х2, и т. д., на- конец, элементы п-го столбца, умноженные на хп. Так как при таких преобразованиях определитель не меняется, то, используя соотношение ajk — akj, вытекающее из симметричности формы А (х, у), и формулу (7.84), мы получим в результате det В. Итак, равенство det В' = det В доказано. Следовательно, det В инва- риантен относительно параллельных переносов.
ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 221 $ 71 Рассмотрим теперь преобразование ортонормированного базиса в ортонормированный. Во-первых, убедимся, что коэффициенты характеристического многочлена матрицы А квадратичной формы являются инвариан- тами рассматриваемого преобразования. В предыдущем пункте мы установили, что при переходе к новому ортонормированному базису матрица А изменяется как матрица некоторого линейного оператора. Но в таком случае, как следует из замечания 1 п. 3, § 2, гл. 5, коэффициенты характе- ристического многочлена этой матрицы не меняются при пере- ходе к другому базису. В частности, определитель det А и след ап + а22 + ... матрицы А, как коэффициенты характеристического многочлена, являются инвариантами. Нам останется доказать инвариантность определителя det В при преобразовании ортонормированного базиса в ортонормиро- ванный. Приступим к этому доказательству. Применим следующий прием. Введем обозначения bk — ak, n+i, k—l, 2......п, с = ап + 1, п+1. Тогда уравнение (7.66) гиперпо- верхности можно записать следующим образом: 2* 0/^=0, (7.91) /, k= 1 гдех„+1=1. Рассмотрим преобразование переменных xit х2..хп, xn+i в переменные х[, х'г, ..., х'п, х’п+1, при котором первые п переменных преобразуются по формулам (7.75), а переменная хп+1 преоб- разуется по формуле %п + 1 - ^П+1» Ясно, что это преобразование переменных можно рассматри- вать как преобразование координат при преобразовании орто- нормированного базиса е2, ..., е„, en+i(n+ 1)-мерного евкли- дова пространства, причем матрица Р этого преобразования имеет вид (Pit • > Pnl О Pin • • Рпп О О ... О 1 (7.92) Легко видеть, что матрица Р удовлетворяет условию
222 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 и поэтому является ортогональной. Но тогда, согласно п. 2 этого параграфа, ортонормированный базис eit е2, ... ,еп,еп+1 пре- образуется с помощью матрицы Р в ортонормированный базис. Выше было выяснено, что при таком преобразовании матрицы В квадратичной формы определитель det В этой матрицы представ- ляет собой инвариант. Теорема доказана. Замечание. Из рассуждений в доказательстве теоремы сле- дует, что инвариантами общего уравнения гиперповерхности второго порядка будут также величины rang Л и rang В. 6. Центр гиперповерхности второго порядка. Попытаемся найти такой параллельный перенос, при котором общее уравнение (7.76) не содержало бы слагаемого 2В'(х') (или, если обратиться к п уравнению (7.82), то слагаемых 2 2 ^*4)- fe= 1 Иными словами, будем искать параллельный перенос (т. е. координаты xit х2, ..., хп точки х), при котором обратятся в нуль все коэффициенты b'k. Обращаясь к формулам (7.84), най- дем, что искомые координаты xit х2, ..., хп точки х представ- ляют собой решение следующей системы линейных уравнений: 2 О, А=1, 2, ..., п. (7.93) Уравнения (7.93) называются уравнениями центра гиперповерхности второго порядка, а точка х с коор- динатами (хй х2, ..., х„), где (х\, х2, ...,х„)—решение системы (7.93), называется центром этой поверхности. Поясним наименование «центр» гиперповерхности. Пусть на- чало координат помещено в центр х, т. е. произведен иско- мый параллельный перенос. Тогда уравнение поверхности S примет вид 2 a^x'jx'k + с’ = 0. (7.94) /, й= 1 Пусть точка х с координатами (xi, xi, ..., х'п) расположена на 5. Это означает, что ее координаты удовлетворяют уравнению (7.94). Очевидно, точка — х с координатами (—х{, —xi, ...,—х„), симметричная с точкой х относительно точки х, также распо- ложена на S, ибо ее координаты тоже удовлетворяют уравне- нию (7.94). Таким образом, если у гиперповерхности S есть центр, то относительно центра точки S располагаются симметрично парами.
s n ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 223 Замечание 1. Если гиперповерхность S второго порядка имеет центр, то инварианты det A, det В и свободный член с' в уравнении (7.94) связаны соотношением det В = с’ det А. (7.95) Действительно, для уравнения (7.94) получим det В = ®11 . • flln 0 ani • • апп 0 0 . .. 0 с' Из последней формулы и вытекает (7.95). Наличие центра у гиперповерхности второго порядка связано с разрешимостью уравнений центра (7.93). Если уравнения центра имеют единственное решение, то гиперповерхность S будем называть центральной. . Так как определитель системы (7.93) равен det А, а необхо- димым и достаточным условием существования единственного решения этой системы является отличие от нуля ее определителя, то мы можем сделать следующий вывод: для того чтобы гипер- поверхность S была центральной, необходимо и достаточно, чтобы det А#=0. Замечание 2. Если начало координат перенесено в центр центральной гиперповерхности S, то уравнение этой гиперпо- верхности будет иметь вид п £ (7-96) i.k=i Действительно, после переноса начала в центр уравнение гиперповерхности примет вид (7.94). Так как для центральной гиперповерхности detA#=O, то из формулы (7.95) найдем с' — — det B/det А. Подставляя это выражение для с' в формулу (7.94), мы и получим уравнение (7.96). 7. Стандартное упрощение любого уравнения гиперповерхности второго порядка путем преобразования ортонормированного базиса. По теореме 7.8 существует такой ортонормированный базис, в котором квадратичная форма А (х, х) записывается в виде суммы квадратов. Обозначим этот базис через {е£}, а координаты точки х в этом базисе обозначим через х[, x's, ..., х'п. Кроме того, бук- вами %2, ..., обозначим собственные значения самосопря- женного оператора А, матрица которого в ортонормированном базисе совпадает с матрицей квадратичной формы А (х, х) (см. замечание в п. 4 этого параграфа).
224 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Используя теперь выводы теоремы 7.8, запишем квадратич- ную форму А (х, х) в координатах (x'lf x's, х'п) точки х в базисе {е*} следующим образом: А(х, х)=%Цхкг. (7.97) k= 1 Итак, перейдем от базиса {еА} к базису {e'k}. Так как фор- мулы преобразования координат точек при таком преобразова- нии линейны и однородны (см. замечание п. 2 этого параграфа, формулы (7.75)), то группа старших членов и линейная часть уравнения гиперповерхности S преобразуются автономно. На основании этого и в силу (7.97) уравнение гиперповерхности S в базисе будет иметь следующий вид*): п п 2W + 2 2&^ + c = 0. (7.98) k=i k=i Приведение любого уравнения гиперповерхности S второго порядка к виду (7.98) будем называть стандартным упро- щением этого уравнения (путем преобразования ортонормиро- ванного базиса). 8. Упрощение уравнения центральной гиперповерхности вто- рого порядка. Классификация центральных гиперповерхностей. Выводы, сделанные в предыдущих двух пунктах, позволяют ре- шить вопрос о классификации всех центральных гиперповерхно- стей второго порядка. Решение этого вопроса мы проведем по следующей схеме. Во-первых, путем переноса начала координат в центр гиперповерхности (7.66) мы приведем ее уравнение к виду (7.96). После этого произведем стандартное упрощение урав- нения (7.96). В результате, очевидно, мы получим, согласно (7.98), следующее уравнение центральной поверхности второго порядка: МГ + Л2хГ+ . • • +«Я+-^| = 0, (7.99) в котором ‘кк—собственные числа матрицы А квадратичной формы А(х, х) в уравнении (7.62), а хк—координаты точки х в окон- чательном ортонормированном базисе {е^}. Отметим, во-первых, что все собственные числа %k, k = 1,2, ..., п, отличны от нуля. Действительно, подсчитывая det А для уравнения (7.99), по- лучим det А = ХГХ2 ... к„, *) Напомним, что при переходе от ортонормированного базиса к орто- нормированному свободный член с в уравнении поверхности S не меняется (см. третью из формул (7.87)).
§ П ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 225 а так как для центральной поверхности det Лу=0, то, очевидно, что все Договоримся далее все положительные собственные числа мат- рицы А нумеровать первыми индексами, а отрицательные—по- следующими. Таким образом, найдется такой номер р, что Х2>0, Х2>0, ..., X >0, 4+f <С 0, ^р+2 О, ..., < 0. Введем теперь следующие обозначения: det В , п если sgn т . =#= 0, то положим ° det А ’ I det А 1. 1 , * о — = — при * = 1, 2....р, det А 1 (7-100) |-эт|^ = —при*=р + 1, •••»«; det В _ если Sgn-; -, - = 0, то положим ° det Л Xs=4 ПРИ ^=1» 2, ..., р, ) ! > (7.101) =----- при k =р + 1, ..., п. I а* / Тогда, очевидно, уравнение (7.99) может быть переписано следующим образом (при этом мы заменим обозначение коорди- нат х"к на хЛ): 2 2 22 2 , , р 4 + 4+... +4-^±b-...-4+sgn-^4 = 0. (7.102) cii а,} ар ар+1 оп Qel Л Уравнение (7.102) называется каноническим уравне- нием центральной гиперповерхности второго порядка. Величины ак, k = 1, 2....п, называются полуосями Цент- ральной гиперповерхности второго порядка. Они могут быть вы- числены по формулам (7.100) и (7.101). С помощью канонического уравнения (7.102) дадим следую- щую классификацию центральных гиперповерхностей. 1°. р =п, sgn jet'Y~ — В этом случае гиперповерхность S называется (п — 1)-мерным эллипсоидом. Каноническое уравнение такого эллипсоида обычно записы- вают в виде 2 2 4+...+4=1. (7.103) Щ ая Если = а2 = ... =а„ =/?, то (п —1)-мерный эллипсоид пред- ставляет собой сферу радиуса в п-мерном пространстве.
226 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Замечание 1. В случае р=0, sgn 1 мы также по- лучаем (п—1)-мерный эллипсоид. Очевидно, в этом случае урав- нение (7.102) может быть записано в виде (7.103). 2°. р=п, jet д ’1 Гиперповерхность является мнимой и называется мнимым эллипсоидом. Замечание 2. Очевидно, в случае р = 0, sgn jgfjf — — 1 MbI также получаем мнимый эллипсоид. 3°. 0 < р < п, sgn fe* 0- Центральные гиперповерхности называются в этом случае гиперболоидами. Геометрические характеристики гиперболоида зависят от соот- „ det В ношении чисел р и пи значения sgn j . . . r ° det A 4°. sgn =0. Центральные гиперповерхности называются в этом случае вырожденными. Среди вырожденных гипер- поверхностей отметим так называемый вырожденный эллип- соид, отвечающий значениям р=0 и р=п. 9. Упрощение уравнения нецентральной гиперповерхности вто- рого порядка. Классификация нецентральных гиперповерхностей. Пусть гиперповерхность 5, заданная уравнением (7.62), не является центральной, т. е. det/l=O. (7.104) Произведем стандартное упрощение уравнения (7.62). В ре- зультате это уравнение примет вид (7.98). Подсчитаем det Л, используя (7.98) (это возможно, так как det Л — инвариант). Получим, учитывая (7.104), det Л = АХА2 ... = 0. Таким образом, по крайней мере одно собственное значе- ние матрицы А равно нулю. Подчеркнем, что не все собст- венные значения равны нулю, ибо иначе квадратичная фор- ма Л (х, х) была бы тождественно равной нулю, мы же пред- полагаем (см. п. 1 § 1 этой главы), что эта форма ненулевая. Оставим в выражении (7.98) лишь те слагаемые в первой сумме, которые отвечают ненулевым собственным значениям, а затем произведем такую перенумерацию базисных векторов, чтобы первым р базисным векторам е[, ..е'р отвечали все нену- левые собственные значения Ах, А2, ..., (отметим, что p = гangЛ). Очевидно, после этого уравнение (7.98) может быть переписано следующим образом: Р р п SW + 2S^4+2 2 ^4 + с = 0 (7.105) Л=1 fc=l k=p+l
ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 227 § 7] (здесь 0 < р < п, Xi#=0, ..%р=/=0; кроме того, мы специально выделили первые р слагаемых второй суммы в уравнении (7.98)). Проведем теперь следующие преобразования. 1°. Для каждого номера k, l^.k^.p, объединим слагаемые с этим номером из первой и второй суммы в (7.105) и затем проделаем следующие преобразования (при этом мы учитываем, что lfe^0): (, '2 \ '* / ' X а . а'2 x'k + = (4 + 4~) —Ть' Лк Л-fe / Л& \ Лк / Лк Очевидно, после этих преобразований (7.105) запишется сле- дующим образом: 2М4+-£)+2 2 b'kx'k+c' = Q, (7.106) где постоянная с' определяется равенством ' (7.107) k~ 1 Осуществим теперь параллельный перенос по формулам 4 = 4 + тт-, k=l, 2, ..., р, X'k = Xk, k~p + \, ..., п, В результате уравнение (7.106) перейдет в уравнение р п SW + 2 2 6й4 + с' = 0, (7.108) k—1 £=р + 1 причем с' определяется по формуле (7.107). 2°. Будем искать теперь такое преобразование ортонормиро- ванного базиса {4}, при котором первые р базисных векторов е[, ..., е'р не меняются, за счет же изменения базисных век- п торов вр+1, ..., е' попытаемся преобразовать слагаемое 2 2 b'kxl k=p+1 к виду 2р4', где х"„—n-я координата в новом базисе. Отметим, что при такого вида преобразованиях свободный член с' не меняется. Заметим, во-первых, что если все коэффициенты b’k в (7.108) равны нулю, то цель преобразования п. 2° достигнута—ела- П гаемое 2 2 &*4 имеет вид 2р4, гДе р = 0. k=p+1
228 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. 7 Итак, будем считать, что по крайней мере один из коэффи- п циентов b'k в сумме 2 b'kx"k отличен от нуля. Тогда мы можем t=p+i рассматривать эту сумму как некоторую линейную форму В” (х), заданную в подпространстве V", которое представляет собой линейную оболочку векторов е'р+1, ..., е'п. Согласно лемме п. 1 §4 гл. 5 эта форма в указанном подпространстве может быть представлена в виде В"(х) = (й, х), где й —некоторый вектор подпространства V". Если мы теперь в подпространстве V" направим единичный вектор е"п по век- тору й, так что h = pe'h, а векторы е'р+1, ..., е'п-i выберем так, чтобы система e;+i, .... е"п_х, е; была базисом в V", то, оче- видно, в этом базисе В"(х) = (Л, *) = н(е;, = поскольку (е„, х) — х'п'. Таким образом, выбирая в V базис п описанным выше способом, мы преобразуем к виду р.х„". k=p+1 Итак, можно указать такое преобразование базиса е[, ..., е'п в ортонормированный базис ех, ..., еп (при этом преобразовании векторы е{, ..., е'р остаются неизменными), что уравнение (7.108) примет вид (при этом мы заменим обозначение координат x'k' на xft) р 2 А,ах| 4- 2рх„ + с' = 0. (7.109) А= 1 Отметим, что в уравнении (7.109) не исключается случай р = 0. Уравнение (7.109) называется каноническим уравне- нием нецентральной гиперповерхности второго порядка. С помощью канонического уравнения (7.109) дадим следую- щую классификацию нецентральных гиперповерхностей. Возможны следующие случаи. Г. р=/=0, р=гап§Д = п — 1. В этом случае последние два слагаемых в уравнении (7.109) запишем в виде 2рх„ + с' = 2р + и сделаем параллельный перенос по направлению оси х„ на величину—с'/2р. Чтобы не осложнять запись, не будем при этом менять обозначение координат. В результате каноническое урав- нение (7.109) примет вид • • • +^я-1*л-1 + 2р.х„ = 0. (7.110)
ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 229 $ Л Гиперповерхности второго порядка, каноническое уравнение которых имеет вид (7.110), называются параболоидами. 2°. р. = 0, р = rang Л < п. В этом случае каноническое уравнение (7.109) перепи- шется так: м+---+м+с' = °- (7.Ш) Очевидно, в подпространстве, являющемся линейной оболоч- кой векторов е[, ..., ер, уравнение (7.111) представляет собой каноническое уравнение центральной поверхности S' второго порядка. Чтобы получить представление о гиперповерхности S во всем пространстве, нужно в каждой точке поверхности S' поместить плоскость, параллельную плоскости V" (линейная оболочка векторов е'р+1, ..., е„). Геометрическое место таких плоскостей образует поверхность S. Таким образом, поверх- ность 5 представляет собой центральный цилиндр с на- правляющей поверхностью S', определяемой уравнением (7.111), и образующими плоскостями, параллельными плоскости V. 3°. p = rang4<n— 1. Поступая так же, как и в случае Г, мы приведем канони- ческое уравнение (7.109) к виду + • • • + ^рХр + 2рх„ = 0. (7.112) Очевидно, в подпространстве, представляющем собой линей- ную оболочку векторов е[, ..., ер, е'п, уравнение (7.112) опре- деляет параболоид S' (см. случай 1°). Чтобы получить пред- ставление о строении гиперповерхности S во всем пространстве, нужно в каждой точке S' поместить плоскость, параллельную плоскости V" (линейная оболочка векторов е'р+1, ..., e«_i). Геомет- рическое место таких плоскостей образует поверхность S. Таким образом, поверхность S представляет собой параболоидаль- ный цилиндр с направляющей поверхностью S', определяе- мой уравнением (7.112), и образующими плоскостями, парал- лельными плоскости V".
Г ЛAB A 8 ТЕНЗОРЫ В этой главе рассматриваются важные объекты, называемые тензорами и характеризующиеся в каждом базисе совокуп- ностью координат, специальным образом преобразующихся при переходе от одного базиса к другому. Тензоры широко исполь- зуются в геометрии, физике и механике. Понятие тензора воз- никает при изучении различных анизотропных явлений (напри- мер, при изучении распределения скоростей распространения света в кристалле в зависимости от направления его распро- странения). § 1. Преобразование базисов и координат В данном параграфе, носящем вспомогательный характер, мы рассмотрим законы преобразования координат в произволь- ном вещественном евклидовом пространстве Еп. Возникающие при этом наводящие соображения делают более прозрачным понятие тензора, вводимого в следующем параграфе. 1. Определители Грама. В этом пункте мы укажем способ, с помощью которого можно выяснить вопрос о линейной зави- симости системы векторов eit е2...ек в евклидовом прост- ранстве Еп. Введем для этого так называемый определитель Грама ука- занной системы векторов. Определителем Грама системы векторов eit е2, ..., ек называется следующий определитель: («1, gj) (ei, е2) ... (ец ек) (е2> е1) (е2> ег) (е2> ek) /О 1\ (efe, <Ц) («А> «а) ‘ • (eft. ек) Справедливо утверждение: Теорема 8.1. Для того чтобы система векторов eit е2, ..., ek евклидова пространства Еп была линейно зависимой, необходимо
§ 1] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 231 и достаточно, чтобы определитель Грама (8.1) этой системы был равен нулю. Доказательство. 1) Н е об х од и м ост ь. Пусть векторы е2, ..., ек линейно зависимы. Тогда один из них, например ек, является линейной комбинацией остальных: ей==а1е1 + а2е2+ • • • +ak-iek-i- Умножая написанное соотношение скалярно на et, г = 1, 2, ..., k, мы получим, что последняя строка определителя Грама (8.1) является линейной комбинацией первых k— 1 строк. По теоре- ме 1.7 этот определитель равен нулю. Необходимость условия доказана. 2) Достаточность. Предположим, что определитель Грама (8.1) равен нулю. Тогда его столбцы линейно зависимы, т. е. существуют не все равные нулю числа pt, (32, ..., рА такие, что для 1 = 1, 2, ..., k выполняются соотношения ₽!(^, eJ + Рз(е,-, е2)+... +РДе,-, eft) = 0 (при i=l,2, .. ., fe). Переписывая эти соотношения в виде (е(-, + р2е2 + .. • -г Pfceft) = О (при i = 1, 2, ..., k), убеждаемся, что вектор р^ + Р2е2 + • • • +Р/А ортогонален всем векторам еи е2, ..., ек, т. е. ортогонален линейной оболочке L этих векторов. Так как этот вектор принадлежит L, то он равен нулю. Поскольку не все 0у равны нулю, то это означает, что векторы elt е2, ..., ек линейно зависимы. Теорема доказана. Следствие. Если векторы elf е2, ..., ек линейно независимы, то определитель Грама этих векторов отличен от нуля. Докажем, что в указанном случае определитель Грама по- ложителен. Пусть L—линейная оболочка векторов е2,... ..., ек. Очевидно, е2, ..., ек—базис в L. Рассмотрим били- нейную симметричную форму А(х, у), представляющую собой скалярное произведение (х, у): А (х, у) = (х, у). Соответствую- щая квадратичная форма А (х, х) = (х, х) будет, очевидно, знакоопределенной, и поэтому, согласно теореме 7.6 (критерию Сильвестра), определитель det(al7) ее матрицы (а,7) в базисе е1( е2, ..., ек положителен. Но этот определитель и представ- ляет собой определитель Грама (8.1) системы е1, е2, ..., ек, ибо oz/= (е,-, е}). 2. Взаимные базисы. Ковариантные и контравариантные координаты векторов. Пусть et, е2, ..., еп—базис в евклидовом пространстве Еп. Базис е1, е2, ..., еп называется взаимным для базиса elt
232 ТЕНЗОРЫ [ГЛ. 8 i = ], 2, .п, если выполняются соотношения {1 при i = i, n (8.2) О при i #= / v ' при i, j— 1, 2, ..., п. Символ 6'- называется символом Кронекера*). Возникает вопрос о существовании и единственности взаим- ного базиса. Ответ на этот вопрос утвердительный: для любого данного базиса ег, е2, еп существует единственный взаим- ный базис. Для доказательства поступим следующим образом. Пусть х[, xi, ..., х'п—координаты искомых векторов е1 в ба- зисе е[. = х[е1-}-xie2-\-... + x£en, /=1,2, .п. (8.3) Умножая екалярно обе части последних равенств на е{, полу- чим, используя (8.2), (е,-, ej + xi(eit e2)+...+xk(eh еп) = 6<, (8.4) i, 7=1, 2.....n. Соотношения (8.4) при фиксированном j можно рассматри- вать как квадратную систему линейных уравнений относительно неизвестных координат х[, xi, ..., х'п вектора е} в базисе е,. Так как определитель системы (8.4) представляет собой опре- делитель Грама базисных векторов еи е2, ..., еп, он, согласно следствию из теоремы 8.1, отличен от нуля, и поэтому система (8.4) имеет единственное решение х{, ..., х'п, которое будет нулевым, поскольку эта система неоднородная. Затем с помо- щью соотношений (8.3) строятся векторы eJ, которые, очевидно, удовлетворяют соотношениям (8.2). 'Мы должны еще убедиться, что векторы е1, е2, ..., еп обра- зуют базис. Пусть некоторая линейная комбинация этих векторов равна нулю: а^е1 + а2е2 -I- ... + сс„е" = 0. Умножая екалярно последнее равенство последовательно на elf е2, ..., еп и используя (8.2), получим а1 = 0, а2=^0, ... ..., а„ = 0. Следовательно, векторые1, е*, ..., е" линейно незави- симы, т. е. образуют базис. Итак, взаимный базис е1 для базиса существует и опре- деляется единственным образом. Замечание 1. В силу симметрии соотношений (8.2) отно- сительно е; и eJ, взаимным базисом для базиса е1 будет базис е(-. ) Л. Кронекер — немецкий математик (1823—1891).
$1] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 233 Поэтому в дальнейшем мы будем говорить о взаимных базисах eh &• Замечание 2. Если базис е2, .еп ортонормирован- ный, то взаимный базис е1 совпадает с данным базисом. Дей- ствительно, полагая в этом случае e] = ej, мы убедимся, что соотношения (8.2) выполняются. Используя свойство единствен- ности взаимного базиса, мы убедимся в справедливости заме- чания. Пусть et, е1—взаимные базисы, а х—произвольный вектор пространства. Разлагая вектор х по базисным векторам е{ и &, получим х = х.е1+х2ег + ... + хпеп, ) х = х1е1-гх2е2+...+xnen. J ^8'5^ Координаты (хп х2, ..., хп) вектора х в базисе е1 назы- ваются ковариантными координатами вектора х, а коор- динаты (х1, х2, ..., х") этого вектора в базисе et называются контравариантными координатами вектора х. Эти наименования будут разъяснены в следующем пункте. Для сокращения записи формул, в которых фигурируют однотипные слагаемые (примерами таких формул могут служить соотношения (8.5)), мы будем пользоваться в дальнейшем согла- шением о суммировании. Это соглашение заключается в следую- щем. Пусть имеется выражение, составленное из сомножителей, которые снабжены конечным числом индексов, часть из которых нижние, а другая часть—верхние. При этом договариваются все нижние индексы обозначать различными символами. Верхние индексы также договариваются обозначать различными симво- лами. Если в этом выражении встречаются два одинаковых индекса, из которых один верхний, а другой нижний, то счи- тают, что по этим индексам производится суммирование, т. е. индексам последовательно даются значения 1,2...п, а затем складываются полученные слагаемые. Например, х,е' = Xjg1 + х2е2 + ... + хпеп, $ = ${ + %+...+?%, gijXW = (gyXW) + (£2/Х2Х') + . . . + {gnJXnX>) = = (^11*1*1+^1!Х3Х2 + . . . +й/Х“) + + + ^22*2*2 + • • • + gin^Xn) + + teni*"*1+^H2*”*2 + • • + g™*"*")- С помощью соглашения о суммировании формулы (8.5) запи- сываются следующим компактным образом: х — х^1, х = х‘е(. (8.6)
234 ТЕНЗОРЫ [ГЛ. 8 Замечание 3. Верхние и нижние одинаковые индексы, о которых говорилось в соглашении о суммировании, обычно называются индексами суммирования. Ясно, что индексы сумми- рования могут обозначаться любыми одинаковыми символами. При этом не изменится выражение, в которых они фигурируют. Например, х(е! и XjgJ представляют собой одно и то же выра- жение. Получим теперь явное выражение для ковариантных и контра- вариантных координат вектора х. Для этого умножим скалярно первое из равенств (8.6) на е,-, а второе на еЛ Учитывая затем соотношения (8.2), найдем (х, е^ = х^е‘, е^х^х,, (х, &') = х((е1, e}') = xidil = xi. Итак, xj~{x, ef), V=(x, ef). (8.7) С помощью соотношений (8.7) запишем формулы (8.6) в сле- дующем виде: х = (х, e,)ez, х = (х, е‘)е{. (8.8) Соотношения (8.8) называются формулами Гиббса*). Обратимся еще раз к вопросу о построении взаимных базисов. С помощью формул (8.8) имеем e' = (ez, eJ)ejt ei = (eh ej)e'. (8.9) Введем обозначения gtj = («и е7), g” = « еД. (8.10) С помощью этих обозначений перепишем соотношения (8.9) следующим образом: ei=gi^eJ, ei = gi]e}. (8.11) Итак, для построения базиса е£’ по базису е{ достаточно знать матрицу (gij), а для построения базиса по базису е' доста- точно знать матрицу (gij). Докажем, что указанные матрицы взаимно обратны. Отметим, что так как элементы обратной матрицы могут быть вычислены через элементы данной матрицы, то ясно, что, с помощью соот- ношений (8.11) решается вопрос о построении взаимных базисов. Итак, установим, что матрицы (g'7) и (g,7) взаимно обратны. Умножая первое из равенств (8.11) скалярно на ек, получим (е'\ eft)=^7(ez, eh). *) Д. У. Гиббс —американский физик-теоретик (1839—1903).
§ 1] ПРЕОБРАЗОВАНИЕ БАЗИСОВ И КООРДИНАТ 235 Из этого соотношения, учитывая (8.2) и (8.10), найдем f 1 при i = k, gJgjk~ — | q При Таким образом, произведение матриц (g'y) и (g,y) представ- ляет собой единичную матрицу. Следовательно, матрицы (g'y) и (g,y) взаимно обратны. 3. Преобразования базиса и координат. Пусть е,- и е'—задан- ные взаимные базисы, а и е1' — некоторые новые взаимные базисы, элементы которых мы обозначим штрихованными индек- сами. Фактически это означает, что мы вводим новый натураль- ный ряд Г, 2', 3', ... и считаем, что индекс Г принимает зна- чения Г, 2'......п'. Таким образом, индексы i и I’ независимо принимают различные значения: i=l, 2, ..., п, i'=r, 2',..., п'. Используя введенное в предыдущем пункте соглашение о сум- мировании, запишем формулы преобразования базисных векто- ров. В результате получим: 1) формулы перехода от старого базиса е, к новому базису е{, и формулы обратного перехода et, = Ь\,в1, e^bi’e^, i= 1, 2...п, i’ = 1', 2', ..., п', (8.12) 2) формулы перехода от старого базиса е‘ к новому е*' и формулы обратного перехода е‘' = Ц'е‘, е‘ = bi,e‘', i~ 1, 2, ..., n, V = Г, 2', ..., п'. (8.13) Так как преобразования (8.12) (равно как и преобразова- ния (8.13)) взаимно обратны, то матрицы (Ь‘.) и (bi') (равно как и матрицы (Ц,) и (bf)) взаимно обратны. Докажем, что матрицы (bi,) (by) тождественны. Тем самым будет доказана-тождественность и матриц (by) и (bf). Для дока- зательства умножим скалярно первое из равенств (8.12) на ек, а второе из равенств (8.13) — на е^. Учитывая соотношения (8.2), получим (ег,, ek) = by (eh ek) = bi,8* = b*,, (е'ч ek,) = by (e('t ek,) = Ь},6£, = blk„ Из этих соотношений при k = i, k' = i' получим %, = (€<„ е‘), (8.14) bi. = (et,, е‘). (8.15) Поскольку правые части соотношений (8.14) и (8.15) равны, то равны и левые части. Иными словами, bj, = bj,, а это и означает
236 ТЕНЗОРЫ [ГЛ. 8 тождественность матриц (Ь‘-) и (Ьр)- Отметим, что элементы Ь? матрицы (Ь\-) могут быть вычислены по формулам (8.14). Итак, справедливо утверждение: Для перехода от базиса е{, е‘ к базису е?, е‘г достаточно знать лишь матрицу (Ь\-) перехода от базиса ег к базису е? (матрица ($) вычисляется по матрице (#-)). Приведем полную сводку формул преобразований базисных векторов: Перейдем к выводу формул преобразования координат век- тора х при переходе к новому базису. Пусть Xi-—ковариантные координаты х в базисе е?, е‘". То- гда, согласно (8.7), имеем Хс-—(х, е?}. Подставляя в правую часть этого соотношения выражение для вс- из формул (8.16), найдем xr = (x, bii-ei)—b'i-(xf e^bi-Xi. Мы приходим к следующему выводу: формулы преобразова- ния ковариантных координат вектора х при переходе к новому базису имеют вид Xi-= bli-Xi. (8-17) Следовательно, при переходе к новому базису ковариантные координаты вектора х преобразуются с помощью матрицы (Ь\-} прямого перехода от старого базиса к новому. Это согласование преобразований и объясняет наименование ковариантные*'} координаты вектора. Рассмотрим теперь преобразование контравариантных коор- динат вектора х. Подставляя в правую часть соотношения х1'= (х, е‘') выра- жение для е*' из формул (8.16), получим после преобразований x‘' — biX‘. (8.18) Мы видим, что при переходе к новому базису контравариантные координаты вектора х преобразуются с помощью матрицы (b‘i) обратного перехода от нового базиса к старому. Это несогласование преобразований и объясняет термин контравариантные **) координаты вектора. *) Ковариантный —согласованно изменяющийся. **) Контравариантный— противоположно изменяющийся.
ПОНЯТИЕ ТЕНЗОРА. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 237 § 2] § 2. Понятие тензора. Основные операции над тензорами 1. Понятие тензора. В этом параграфе мы рассматриваем произвольное (не обязательно евклидово) вещественное п-мерное линейное пространство L". Определение. Тензором А типа {р, q) {р раз ковариантным и q раз контравариантным) называется геометрический объект, который 1) в каждом базисе е, линейного пространства Ln опре- ki ..k деляется п?+ч координатами А^.'л 9 {индексы it, .. .,ip, kt, ..., kq независимо принимают значения 1,2......п, 2) обладает тем свойством, что его координаты Aky"k<} в базисе е? связаны k ...k с координатами А^,'..}9 в базисе е(- соотношениями Aki .tffb*1.. .bk« Ak,L "А, (8.19) Ч ‘Р к> -лр в которых be—элементы матрицы (b\>) перехода от базиса в; к базису ее, a bk—элементы матрицы обратного перехода от ее к е£. Число r~p + q называется рангом тензора. Замечание 1. Формулы (8.19) называют формулами пре- образования координат тензора при преобразовании базиса. Отметим, что ковариантные и контравариантные координаты вектора преобразуются по формулам (8.19) (при р = 1 и q =0 в первом случае и при р=0 и q = l во втором, см. п. 3 § 1 этой главы). Поэтому вектор представляет собой тензор ранга 1 (1 раз ковариантный, либо 1 раз контравариантный — в зави- симости от выбора типа координат этого вектора). Отметим, что рассматривают также тензоры ранга 0. Это тензоры, имеющие лишь одну координату, причем эта коорди- ната не снабжена индексами и имеет одно и то же значение во всех системах координат. Тензоры ранга 0 обычно называ- ются инвариантами. 3 а ме чание 2. Индексы t±, ... ,ip называются ковариантными, a kit ..., k9—контравариантными. Наименование объясняется тем, что по каждому из упомянутых индексов преобразование координат тензора производится в полной аналогии с преобра- зованиями ковариантных и контравариантных координат вектора (см. формулы (8.17) и (8.18)). Для того чтобы определение тензора было корректным, нужно убедиться, что последовательные переходы от базиса е,- к базису Се, а затем от базиса ее к базису ее- приводят к та- кому же преобразованию координат тензора, что и при непо- средственном переходе от е( к ее' .
238 .ТЕНЗОРЫ [ГЛ. 8 Пусть (br). (Ьг) и (bf") — соответственно матрицы перехода от базиса е,- к базису ер, от базиса et- к е? и от базиса в; к ер. Так- как при последовательных переходах матрицы преобразо- ваний перемножаются, то очевидны соотношения b^bfa1?, bT =b^bir. (8.20) После сделанных замечаний убедимся в корректности опре- деления тензора. Пусть Ак'"к«, Ak\-\ AkykS 1 - р 'х - ip ij. - lp — координаты тензора А в базисах е,-, et- и ер соответственно. По формулам (8.19), переходя последовательно от к е(-, а затем к ер> получим Ак'\ "'к« = Ь1',. ..b'?bki. ..bk< Ak'-.k9 (8.21) - ip \ ip kq ’ ft " t f n ft f f Лк ... 1 ii fe- f л к.. ... fe — i 4, = b },... b ?,b }.. . b ? A } ?. (8.22) ... i‘, in кч k„ Г ... £ ' ' 1 p 1 Pl Q 1 P Подставляя в правую часть (8.22) выражения координат k k А } " Ч из (8.21) и учитывая соотношения (8.20), получим ‘х •• • 1р (bk? ЬкЛ Ак* -k‘i = bi\...bip„ bki ...bk«Ak.l-kq. \ kq kqJ Ч-1Р \ ip \ kq " "'p Таким образом, последовательные переходы от базиса е,- к базису е,-, а затем к базису ez-< приводят к такому же преобразованию координат тензора, как и при непосредственном переходе от е(. к ер>. Корректность определения тензора установлена. Замечание 3. Любая система чисел А^1'"кч может ч ...ip рассматриваться в данном базисе е,- как координаты некоторого тензора А типа (р, q). Чтобы убедиться в этом, определим в про- извольном базисе ер с помощью формул (8.19) систему чисел k ' fe* A J" 5, которые будем рассматривать как координаты иско- ‘i ••• ‘р мого тензора А в базисе ер. Очевидно, при переходе от базиса е{ к базису вр эти координаты преобразуются по формулам (8.19). Как и выше, легко убедиться, что последовательные переходы от базиса е; к базису ер, а затем к базису вг приводят к та-
§ 2] ПОНЯТИЕ ТЕНЗОРА. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 239 кому же преобразованию полученных координат, как и при непосредственном переходе от к е^. Следовательно система чисел действительно представляет собой координаты некоторого тензора А типа (р, q). 2. Примеры тензоров. 1°. Нуль-тензор. Среди тензоров типа (р, q) следует вы- делитьтак называемый нуль-тензор. Это тензор, координаты кото- рого в любом базисе равны нулю. Очевидно, соотношения (8.19) выполняются. Отметим, что если координаты тензора А равны нулю в ка- ком-либо базисе, то, согласно (8.19), они равны нулю в любом базисе, и, следовательно, А — нуль-тензор. 2°. Символ Кронекера. Убедимся, что тензор А типа (1, 1), имеющий в базисе е,- координаты 6*, будет иметь в ба- зисе et> координаты б£. Итак, пусть А—тензор, имеющий в данном базисе е,- коор- динаты 6f. Для того чтобы найти координаты этого тензора в базисе вс, надо воспользоваться *формулами (8.19), т. е. ко- ординаты тензора А в базисе вс равны bl Ь\^к. Используя свой- ства символа Кронекера, получим ' ' ь1'ь№=ь1'ь1 = $. Итак, в новом базисе е,- координаты тензора А действительно равны 6?’. Поэтому символ Кронекера можно рассматривать как тензор типа (1, 1). 3°. Пусть А (х, у) — билинейная форма, заданная в конечно- мерном евклидовом пространстве Еп, a elt ег, ..., еп — какой- либо базис в этом пространстве. Тогда векторы х и у могут быть представлены в виде x = xiel, у = у’ег Используя линейное свойство формы А (х, у) по каждому аргументу, мы можем записать А(х, y) = A(xleb y^'ej') = A{ei, е^х‘у1. Обозначим А (е,-, е7) через аг7: а17 = Д(е(-, еу). ' (8.23) Тогда форма А (х, у) может быть записана следующим образом: А(х, у) = а^х‘уЕ (8.24) Убедимся, что коэффициенты а,7 матрицы формы А (х, у) при переходе к новому базису преобразуются по закону (8.19)
240 ТЕНЗОРЫ [ГЛ. 8 преобразования координаты тензора типа (2, 0), т. е. представ- ляют собой тензор типа (2, 0). Рассмотрим произвольный базис е^, е2-.........еп<. Запишем в этом базисе форму А (х, у) в виде (8.24) Д(х, = причем cifj' = А (ее, ер). (8.25) Перейдем от базиса е1( е2, ..., еп к новому базису вр, е2>, ... еп-. Обозначая матрицу перехода от базиса е( к базису ее через bi,, получим ei, = bi,ei, ej-^b^ej. Подставляя эти выражения для ее и е,- в правую часть (8.25) и используя линейное свойство формы А (х, у) по каждому аргументу, найдем ae/' = A(beeh tye,) = bi-tf-A (е,-, е}). Согласно формуле (8.23) последнее соотношение можно пе- реписать в виде aej' -b'i-b'j’aij. Следовательно коэффициенты ai} матрицы билинейной формы преобразуются по закону (8.19) преобразования координат тен- зора типа (2, 0) и поэтому могут рассматриваться как коорди- наты тензора такого типа. 4°. Каждому линейному оператору, заданному в конечно- мерном евклидовом пространстве Еп и действующему в то же пространство, можно поставить в соответствие некоторый тензор типа (1, 1), причем этот тензор будет вполне определять ука- занный оператор. Пусть y = Lx — линейный оператор, заданный в Еп и е2, ..., еп—базис в Еп. Так как x = xleit a y—yfej и L — линейный оператор, то i/^ = x'£(e,.). (8.26) Разложим вектор L (е,) по базису eit е2, ..., еп: L (<?,) = а{е}. Подставляя полученное выражение для L (е,} в (8.26) и ис- пользуя единственность разложения по базису, получим = /= 1, 2, ..., п. (8.27)
$ 2] ПОНЯТИЕ ТЕНЗОРА. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 241 Напомним, что соотношения (8.27) можно рассматривать как координатный способ задания линейного оператора. При этом матрицу (а{) коэффициентов а/ называют матрицей линейного оператора. Убедимся, что коэффициенты этой матрицы при переходе к новому базису преобразуются по закону (8.19) преобразова- ния координат тензора типа (1, 1) и поэтому представляют собой тензор типа (1,1). Рассмотрим произвольный базис еу, ву, ..., е„<. Запишем в этом базисе линейный оператор L в виде (8.27) у<'=а1',х‘', /' = Г, 2', ..., п'. (8.28) Перейдем теперь от базиса ех, е2, ..., еп к базису вг, ву, ... ..., вп.’. Обозначая матрицу перехода (6(,) (или, что то же са- мое, (60), получим *) (см. п. 3 § 1 этой главы) x‘=6j,x1', у’^Ь^у?. Подставим эти выражения для х‘ и у' в (8.27). Получим следующие соотношения: 0*'б£, = а/60/', / = 1, 2....п. (8.29) Нам нужно получить из (8.29) выражение для у1'. Для этой цели умножим обе части (8.29) на b’f и просуммируем по j от 1 до п. Учитывая, что 6£,6f = 6f,, получим = (6^6}'а/) х1'. Заметим/что г/*'6£' = У’'- Поэтому yi' = (bi,b'; а[)х‘'. Сравнивая это выражение для yj' с выражением для у’' по формуле (8.28), получим следующее тождество, справедливое для любых векторов х (для любых координат х1'): а{',х1' = (b^b'fa’i) х1'. Отсюда и из произвольности х1' следует, что коэффициенты о/ матрицы линейного оператора преобразуются по закону. а/; = Ь^Ц а[. Итак, коэффициенты а{ преобразуются по закону (8.19) пре- образования координат тензора типа (1.1) и поэтому представ- ляют такой тензор. 3. Основные операции над тензорами. Основными операциями над тензорами называются операции сложения и вычитания тензоров, операция умножения тензора на число, операция •) В формуле для yJ индекс суммирования мы обозначим через k',
242 ТЕНЗОРЫ £ГЛ. 8 умножения тензоров, операция свертывания тензоров, операция перестановки индексов, операции симметрирования и альтерниро- вания тензоров. Перейдем к определению этих операций. 1°. Сложенней вычитание тензоров. Операции сло- жения и вычитания определяются для тензоров одинакового типа. Пусть А и В—два тензора типа (р, q), А^'"^ и — 1 " р 1р одноименные координаты этих тензоров в базисе ez. Суммой А+В (разностью Л— В) этих тензоров назы- вается тензор, имеющий в базисе ez координаты Л*1 - W ( А*' "Ъ—В*' ~*<Л. Р 1 р X р ' Р ' Чтобы данное определение операций сложения и вычитания тензоров было корректным, необходимо проверить, преобразу- ются ли координаты суммы (разности) тензоров по закону (8.19) преобразования координат тензора. Для этого представим себе, что наряду с формулами (8.19) преобразования координат тензора А записаны аналогичные формулы преобразования коор- динат тензора В. Тогда путем сложения (вычитания) таких двух формул преобразования координат тензоров А и В мы убедимся, что координаты суммы (разности) преобразуются по закону преобразования координат тензора. 2°. Умножение тензора на число. Пусть А—тензор типа (р, q), имеющий в базисе координаты Л*‘”*<?, и а — ‘‘ — 1р произвольное вещественное число. Произведением а А тензора А на число а на- зывается тензор, имеющий в базисе е, координаты аЛ*1’"*?. k k l—lp То, что координаты аЛ? ".? преобразуются по тензорному 1 ••• закону, непосредственно усматривается из формул (8.19). 3°. Умножение тензоров. Операция умножения тен- зоров определяется для тензоров произвольного типа. Пусть Л—тензор типа (р, q), имеющий в данном базисе е{ координаты Л*1 а В—тензор типа (г, s)., имеющий в этом же 1 р базисе координаты "'™s. Для определения произведения D = AB тензоров Л и В составляются всевозможные произведения координат тен- зора Л на координаты тензора В. В каждом таком произведе- нии индексы llt ..., lr и ffij, ..., ms у координат тензора В заменяются новыми индексами. Именно, полагают lt = ip+1, ... • • •» ip+r И mi kq + i. * * * j Щ kq + s-
«21 ПОНЯТИЕ ТЕНЗОРА. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 243 Произведением D — AB тензоров А и В называется тензор типа (p + r, <? + s)> имеющий в базисе е{ координаты Dkl - k9k.^i - k4+s = Ак1 - k9 Bk9+i - k,q+*. (8.30) h p p+i'*'lp + r 1 ‘'*lp lp+i p+r Чтобы убедиться, что координаты Dk' "кякя+*.kq+s, onpe- 11 P F+1 p + r деленные соотношением (8.30), преобразуются при переходе к другому базису по закону преобразования координат тензора, т. е. действительно представляют собой координаты тензора, достаточно записать формулы преобразования (8.19) для коор- динат Akl '",kq и Bk,q+1 '"k.<i+s тензоров А и В и перемножить 1 *“ р р+1 *” р + г правые и левые части этих формул. В результате, обращаясь к соотношению (8.30), легко получаются нужные формулы пре- образования для координат D*1 ,?+1 ” кэ+з. ‘р + г Замечание. Операция умножения тензоров не обладает свойством перестановочности: вообще говоря, АВ^ВА. Это объясняется тем, что порядок следования индексов у координат тензора определяет «номер» этой координаты. Таким образом, хотя численное значение выражений Ак' "'kqBk.q+i "• и B^+i— 'k<i+s Ак’ “ kq 1 ' Р 1 JP+ 1 * ’* 1 р + Т р + 1 ‘ I р+ Г 1 1р одинаково, порядок следования индексов у этих выражений различен, и поэтому они отвечают координатам с различными «номерами». Это и означает, что АВ^=ВА. 4°. Свертывание тензора. Операция свертывания применяется к тензору типа (р, q), у которого р=#0 и (т. е. к тензору, у которого имеется по крайней мере один верхний и один нижний индекс). Пусть А—тензор указанного выше типа. Перейдем к описа- нию операции свертывания. Свертывание тензора А производится по каким-либо отме- ченным верхнему и нижнему индексам. При этом в результате свертывания получается тензор типа (р— 1, q—1). Пусть, например, у каждой координаты тензора А отмечен верхний индекс с номером т и нижний индекс с номером п: . ,т . я. 1п--1р Произведем суммирование (свертывание) координат тензора с одинаковыми выделенными индексами. Эта операция и дает следующие координаты тензора, полученного свертыванием по верхнему и нижнему индексам с номерами /пил: (8.31)
244 ТЕНЗОРЫ [гл. в (в выражении (8.31) мы использовали соглашение о суммирова- нии). Проверим, что величины (8.31) действительно образуют коор- динаты тензора типа (р—1, q—1). Для этого обратимся к фор- мулам (8.19). Перепишем эти формулы в следующем виде, вы- делив интересующие нас индексы (эти индексы мы подчеркнем квадратными скобками): < k k' i, = (8.32) Произведем теперь суммирование в правой и левой частях (8.32) по выделенным индексам k'm и Гп. Для этого достаточно положить эти индексы равными а' и воспользоваться соглаше- нием о суммировании. В результате мы получим некоторое равенство. Найдем выражения в левой и правой частях этого равенства. В левой части мы получим, очевидно, выражение Ak} •••“'•" V (8.33) ••• - ‘Р В правой же части произведение bkm на Ь*? равно б/", т. е. равно единице при km = in=a и равно нулю при km=£in. Таким образом, в правой части мы получим следующее выражение: 6** ... b^b*1, ... -“ • *?. (8.34) Сравнив выражения (8.33) и (8.34), мы убедимся, что вели- чины Д,,...а...г преобразуются при переходе к новому базису по закону преобразования координат тензора. Очевидно, этот тензор будет типа (р—1, q—1). Замечание. Термин «свертывание тензоров» употребляется еще и в следующем смысле. Рассмотрим два тензора А и В, у координат первого из ко- торых имеется по крайней мере один верхний индекс k, а у ко- ординат второго—по крайней мере один нижний индекс i. Составим произведение АВ. этих тензоров и затем проведем операцию свертывания тензора АВ по верхнему индексу k и нижнему индексу i. Для этой операции обычно употребляется терминология: «свертывание тензоров А и В по индексам k и I».
$ 2) ПОНЯТИЕ ТЕНЗОРА. ОСНОВНЫЕ ОПЕРАЦИИ НАД ТЕНЗОРАМИ 245 5°. Перестановка индексов. Эта операция заклю- чается в том, что в любом базисе индексы у каждой коорди- наты тензора подвергаются одной и той же перестановке. Это означает, что мы иным образом «нумеруем» координаты данного тензора. Читателю предлагается проверить, что в результате получается тензор (отличный, вообще говоря, от данного). 6°. Си мметр и р о ва н и е и а ль те р н и р о в а н ие. Пред- варительно введем понятия симметричного и кососим- метричного тензоров. Тензор А с координатами a...t (8.35) 1 т п р ' ' называется симметричным по нижним индексам im и in, если при перестановке этих индексов *) координаты тензора А не меняют своего значения, т. е. Ь Ь Ь Ъ v <8-36) 1 т п р 1 п т р '• •' Соотношение (8.36) называется условием симметрии тен- зора Л по нижним индексам с номерами тип. Тензор А. называется кососи мметр ич н ы.м • по нижним индексам im и in, если при перестановке этих индексов спра- ведливо соотношение Aki^:kiq...I ...i =-A^::.^...i . (8.37) Соотношение (8.37) называется условием кососимметрии тен- зора А по нижним индексам с номерами т и п. Аналогично вводится понятие симметрии й кососимметрии тензора по двум верхним индексам. Замечание. Если условие симметрии (кососимметрии) по нижним индексам im и in выполняется для тензора А в данной системе координат, то оно выполняется и в любой другой си- стеме координат. Перейдем теперь к описанию операции симметриро- вания. Пусть А—тензор типа (р, q) с координатами (8.35). Пере- ставим у каждой координаты нижние индексы с номерами т и п и затем построим тензор Ат< т с координатами ...{ +А^::У...г (8.38) 2 \ * т п р 1 п т р/ ' ' •) Напомним, что при перестановке индексов у координат тензора мы получаем координаты, вообще, говоря, другого тензора.
24й ТЕНЗОРЫ [ГЛ. 8 Операция построения тензора А(п, т называется опера- цией симметрирования тензора А по нижним индексам с номерами тип. Отметим, что координаты (8.38) тензора A(mi п) обычно обо- значаются символами k k (8-39) * X ТП п) р Очевидно, для тензора Л(т> т выполняется условие симмет- рии (8.36) по нижним индексам с номерами т и п. Операция симметрирования тензора по верхним индек- сам с номерами тип определяется аналогично. Построенный тензор обозначается символом «). Для координат тензора д(т, п) используется обозначение, аналогичное обозначению (8.39) координат тензора Л(т, я). Операция альтернирования тензора Л по нижним индексам с номерами тип производится следующим образом. У каждой координаты тензора Л переставляются нижние индексы с номерами т и п и затем строится тензор Л[„г, с координатами 41:г ...,• (вло) z \ 1 т п р lnm pJ Операция построения тензора А[т, П] называется опера- цией альтернирования тензора Л по нижним индексам с номерами т и п. Координаты (8.40) тензора Л[т, „] обычно обозначаются символами ‘ (8-41) 1 * т пл р Очевидно, для тензора А[т,выполняется условие кососим- метрии (8.37) по нижним индексам im и i„. Операция альтернирования тензора по верхним индек- сам im и in определяется аналогично. Построенный тензор обо- значается символом А^т-п\ Для координат тензора Al"1-"! используется обозначение, аналогичное обозначению (8.41) коор- динат тензора Л[т,«]. В заключение отметим очевидное равенство А = А(т, П) + Л[т, п]. § 3. Метрический тензор. Основные операции векторной алгебры в тензорных обозначениях 1. Понятие метрического тензора в евклидовом пространстве, В § 2 гл. 7 говорилось о том, что скалярное произведение в ко- нечномерном линейном пространстве может быть задано с по- мощью билинейной формы, полярной некоторой положительно
$ 3] МЕТРИЧЕСКИЙ ТЕНЗОР. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 247 определенной квадратичной форме. В этом параграфе мы будем считать, что в рассматриваемом конечномерном евклидовом про- странстве Еп скалярное произведение задано такого типа били- нейной формой А (х, у). В п. 2 предыдущего параграфа (пример 3) мы убедились, что коэффициенты матрицы билинейной формы могут рассмат- риваться как координаты тензора. Эти коэффициенты для били- нейной формы А(х, у), с помощью которой задается скалярное умножение в Еп, мы обозначим через g^. Таким образом, g;j— координаты некоторого тензора G в базисе е2, ..., еп. Этот тензор типа (2, 0) называется метрическим тензором пространства Еп. Напомним, что координаты g^ тензора G опре- деляются соотношениями gi}=A(jeh ej) ' (8.42) (см. формулу (8.23)). Заметим также, что так как форма А (х, у) симметрична (Л(х, _у) = Л(.у, х)), то, согласно (8.42), gij^gji, т. е. метрический тензор G симметричен по нижним индек- сам i и /. Пусть х и у—произвольные векторы в Еп, х‘ и у/—коорди- наты этих векторов в базисе е2, е2, ..., еп. Скалярное произведение (х, у) векторов х и у равно А (х, J). Обращаясь к выражению (8.24) для билинейной формы в дан- ном базисе и используя равенство (х, у) = А(х, у), получим следующую формулу для скалярного произведения (х, у) век- торов хну: (х, y) = guxiyf. (8.43) В частности, скалярные произведения (е,-, еу) базисных векто- ров е,- и 6j равны g,f. e/) = giJ (8.44) (это следует из равенства (е,-, е/) = A (eh е/) и из формулы (8.42); впрочем, формулу (8.44) легко получить и непосредственно из (8.43)). Рассмотрим теперь наряду с базисом е1, е2, ..., еп взаим- ный базис е1, е2, ..., е". Пусть х = х,е‘ и у = у^е}—разложе- ния векторов х и у по векторам взаимного базиса. Тогда для скалярного произведения (х, у) получим следующую формулу: (х, j) = 4(x, у) = А(х^, у^) = А(е1, eJ)xtyj.
248 ТЕНЗОРЫ [ГЛ. 8 Обозначая §‘7 = Л(е‘, eJ), (8.45) получим следующее выражение для (х, .у): (*, y)~giJxiyJ. (8.46) Как и в п. 2 предыдущего параграфа (см. пример 3), легко убедиться, что giJ представляет собой координаты тензора типа (О, 2) симметричного по индексам i и /. Этот тензор типа (0, 2) также называется метрическим тензором пространства Еп. Мы будем обозначать его тем же символом G, что и введен- ный выше метрический тензор типа (2, 0): в следующем пункте мы выясним, что координаты gy и giJ можно рассматривать как ковариантные и контравариантные координаты одного и того же тензора. В дальнейшем эти координаты g,7 и мы так и будем называть ковариантными и контравариантными координатами тен- зора G. В конце п. 2 § 1 этой главы, исследуя вопрос о построении взаимных базисов, мы ввели величины glf и giJ по формулам (8.10). Сравнивая эти формулы с формулами (8.42) и (8.45), мы приходим к выводу, что эти величины представляют собой кова- риантные и контравариантные координаты метрического тен- зора G. В этом же п. 2 § 1 мы доказали, что матрицы, элементами которых являются координаты g^ и gij, взаимно обратные. Эго означает, что справедливо соотношение (8.47) Таким образом, координаты giJ тензора G могут быть по- строены по координатам g,7 и наоборот (для этого надо обратиться к известному способу построения элементов обратной матрицы). 2. Операция поднятия и опускания индексов с помощью мет- рического тензора. Метрический тензор G используется для опе- рации поднятия и опускания индексов у коорди- нат данного тензора Л. Эта операция заключается в следующем. Пусть А—тензор типа (р, q) с координатами Л,^*” Д. Для примера покажем, каким образом проводится операция подня- тия индекса т\. Свернем тензоры G и Л по верхнему индексу / у первого тензора и по нижнему индексу у второго тензора, т. е. построим тензор с координатами
|3} МЕТРИЧЕСКИЙ ТЕНЗОР. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 249 и у координат полученного тензора индекс i обозначим через i\. Затем эти координаты обозначим символами Таким образом, f = (8.48) р р ин дексов Замечание 1. Так как порядок расположения у координат тензора определяет «нумерацию» его координат, то, вообще говоря, при поднятии индекса нужно отмечать место среди верхних индексов, на которое будет поднят данный ниж- ний индекс. Иногда в ряду нижних индексов нужно отметить место поднимаемого нижнего индекса. Эго делается с помощью точки, которая ставится на место поднятого индекса. Поэтому координаты тензора в левой части (8.48) следовало бы записать следующим образом: А‘'к‘кг',"кч. К примеру, если первый нижний индекс поднимается на вто- рое место среди верхних, индексов, то в результате мы получим тензор с координатами А^. ( ч. Замечание 2. Операция опускания индекса с помощью метрического тензора G определяется аналогично. Например, координаты тензора, полученного путем опускания у тензора А индекса на последнее место в ряду нижнцх индексов, имеют следующий вид: i* «а /,.../Vх = £МД,..л*-х • РЗамечание 3. Операцию поднятия или опускания индекса можно применять несколько раз, причем каждый раз по отно- шению к различным индексам данного тензора. Рассмотрим примеры поднятия и опускания индексов у тен- зоров. Пусть х—вектор, xt и хс—соответственно его ковариантные и контравариантные координаты (напомним, что вектор пред- ставляет собой тензор'ранга Г). Поднимем у координат х{ индекс i с помощью метрического тензора G. В результате получим тензор с координатами gia-xa. Так как ха--(х, еа), то giaXa=gi“ (x, еа) = (х, ^еа). Согласно (8.11) giaea = е‘, а (х, е') — х‘. Поэтому giaxa = Xе. Таким образом, контравариантные координаты х‘ вектора х можно получить как результат операции поднятия индекса у ко- вариантных координат х( этого вектора.
250 ТЕНЗОРЫ [ГЛ. S Ковариантные координаты х,- могут быть получены как ре- зультат операции опускания индекса у контравариантных коор- динат х‘. Выясним, результат двукратного применения операции подня- тия индекса у ковариантных координат gtJ метрического тензора G с.помощью контравариантных координат giJ этого же тензора. Иными словами, выясним, что представляет собой тензор с коор- динатами giagifig^- (8.49) Используя симметрию тензора G по нижним индексам и соот- ношение (8.47), найдем gi&ga» = g^g^ = ^a- Подставляя найденное выражение для g!® gap в (8.49) и используя свойства символа Кронекера 8!а, получим Совершенно аналогично можно убедиться в справедливости ра- венства giagi^ = gih Последние две формулы еще раз подчеркивают, что g,7 и gV естественно рассматривать как ковариантные и контравариант- ные координаты метрического тензора G. 3. Ортонормированные базисы в Еп. Мы уже выяснили, что скалярное произведение (х, у) в Еп может быть задано с по- мощью метрического тензора G, координаты g,7 которого пред- ставляют собой элементы симметричной положительно опреде- ленной матрицы (g17). Именно, согласно (8.43), (*. ^) = Я/Л‘У- Известно, что с помощью преобразования базиса матрицу билинейной формы gijX'xJ можно привести к диагональному виду. При этом, в силу положительной определенности матрицы, после приведения матрицы (g,7) к диагональному виду координаты метрического тензора будут равны нулю при i=£j и единице при i = j. Обозначая эти координаты прежним символом g,7, получим (8.50) J 0 при i j, i ПрИ i = j. Базис eit в котором координаты g,j метрического тензора удовлетворяют условию (8.50), является ортонормированный.
$ 31 МЕТРИЧЕСКИЙ ТЕНЗОР. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 251 Действительно, так как (е,-, е,) (см. (8.44)), то согласно (8.50), f 0 при /#=/, (е.-, £/) = {, ' ' 1 (1 при 1 = 1, а это и означает, что е;-—ортонормированный базис. В гл. 4 мы выяснили, что в ортонормированном базисе скалярное произведение (х, j) векторов х и у с координатами х‘ и yJ может быть вычислено по формуле п (х, J) = 2 х‘у1, (8.51) г= 1 а квадрат длины (х, х) вектора х — по формуле (X, х) = 2 (х'Г- (8.52) х = 1 Обратимся к так называемым ортогональным линейным преобразованиям, т. е. к таким линейным преобразованиям, при которых ортонормированный базис переходит в ортонормиро- ванный. Иными словами, если L—ортогональное преобразова- ние и е,—ортонормированный базис, то Le{ также образует ортонормированный базис. Исследуем действие преобразования L на произвольный век- тор x = x‘ei. Обозначим через X результат действия L на х: X = Lx. Используя свойство линейности L, найдем X=Lxiei = xiLei. Так как Le{—базис, то из последнего соотношения вытекает, что вектор X имеет в базисе £е(- такие же координаты, как и вектор х в базисе е(-, т. е. при ортогональном преобразова- нии сохраняют свое значение координаты вектора. Поскольку Le/—ортонормированный базис, то скалярное произведение (X Г) векторов X=Lx и Y=Ly может быть найдено по формуле (8.51), а квадрат длины (X, X) вектора X = Lx — по формуле (8.52). Мы выяснили, что при ортогональ- ных преобразованиях сохраняют свое значение координаты век- торов. Отсюда и из соотношений (8.51) и (8.52) получаем (X, Г) = (х, у), (X, Х) = (х, х). Таким образом, при ортогональных преобразованиях не меняются длины векторов и их скалярные произведения. Как известно, ортогональные преобразования L могут быть заданы с помощью ортогональной матрицы. Определитель detL
252 ТЕНЗОРЫ [ГЛ. 8 такой матрицы удовлетворяет условию det£ = ±l. Выберем один из ортонормированных базисов и договоримся называть этот базис правым. В этом случае будем говорить, что евклидово пространство Еп ориентировано. Все базисы в Еп, получающиеся из данного ортогональными преобразованиями с определителем, равным 4-1, назовем правыми, а все базисы, которые получаются из данного ортогональными преобразова- ниями с определителем, равным —1, —левыми. Легко убедиться, что преобразование правого базиса в правый характеризуется равенством 4-1 определителя преобразования, а левого в левый — равенством —1 этого определителя. Обозначим через О (п) — множество всех ортогональных преоб- разований в Еп, а через О+ (п) — множество ортогональных преоб- разований правых базисов. Эти множества будут рассмотрены в следующей главе. Замечание. В дальнейшем мы будем называть произволь- ный базис eit ег, ...,е„ правым (левым), если определитель матрицы перехода от выбранного ортонормированного базиса к базису Cj, е2, ..., еп положителен (отрицателен). 4. Дискриминантный тензор. Рассмотрим так называемый вполне кососимметрический тензор в/,,,...,- типа (р, 0), т. е. такой тензор, который кососимметричен по любым двум нижним индексам. Для того чтобы этот тензор не был нулевым, необходимо, чтобы число р не превышало п, т. е. удовлетворяло условию р^п, ибо, если р > п, то любая координата будет иметь по меньшей мере два одинаковых индекса, при перестановке кото- рых эта координата одновременно должна и изменить знак, и остаться неизменной. Это может быть лишь в том случае, когда указанная координата равна нулю. Следовательно, при р > п любая координата тензора равна нулю, т. е. тензор является нулевым. Особый интерес представляет вполне кососимметрический тензор, ранг р которого равен размерности п пространства. Любая координата .л такого тензора может быть най- дена по формуле ' 0, если среди индексов z\, i2, .... ia хотя =' бы два совпадают, (8.53) ” (— l)sigBCTe12.. „п, если все индексы различны. В формуле (8.53) sign о равно 0 или 4-1 в зависимости от чет- ности или нечетности перестановки о = («*, Ч» •••> in) (signо на- зывают также знаком.этой перестановки).
$ 3] МЕТРИЧЕСКИЙ ТЕНЗОР. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 253 Рассмотрим какую-либо правую ортонормированную систему координат и положим в ней (8.54) С помощью соотношения (8.53) в данной системе координат определяются все координаты вполне кососимметриче- ского тензора, а следовательно, и сам тензор, который в даль- нейшем мы будем называть дискриминантным тензо- ром. Координаты этого тензора в произвольном базисе е2, ..., еп обозначим через . Обозначим символом В матрицу перехода от выбранного правого ортонормированного базиса к некоторому базису е^, е2>, ..., еП', а через Ь\-— элементы этой матрицы. Согласно (8.53) для вычисления координат дискри- минантного тензора в базисе е^, е2-, ..., еп- достаточно знать значение координаты сг2'...Л'. Используя формулу (8.19) преобразования координат тензора и соотношение (8.54), получим, переходя от выбранного орто- нормированного базиса к базису е^, ..., ел<, Сц а'... п‘ = Ь1’ . - in~ = 812...n 2 (—i)sisn аь№-.. .tfy— a=(i,.i./„) = det (&9 = det В. (8.55) Пусть gi'j — координаты метрического тензора в базисе е2-, ..., еП'. Так как матрица G = {gt'j’) есть матрица билинейной формы gi-j’X1'#', представляющей собой скалярное произведение векторов х и у с координатами и у>', то при переходе от данного ортонормированного базиса (в котором матрица Е рас- сматриваемой билинейной формы является единичной) к базису вц, е2-, .. •, еП' справедлива формула G — B'EB. Отсюда следует, что det G = det В' det Е det В = (det В)2. Обозначая det G через g, получим из последнего соотноше- ния det В = ± Kg- Обращаясь к соотношениям (8.55), мы полу- чим, что сцг'..= ±Vg. Таким образом, в произвольном ба- зисе е1( с2, ..., еп выражение для координаты Ci3_. ,п дискри- минантного тензора имеет вид Ci2...n=±Ki, (8.56)
254 ТЕНЗОРЫ [ГЛ. в где g—определитель матрицы (g,;) метрического тензора в ба- зисе eif е2, ..., еп. Отметим, что в формуле (8.56) знак, плюс соответствует пра- вому базису, а знак минус — левому. 5. Ориентированный объем. Введем в ориентированном евкли- довом пространстве Еп так называемую аффинную систему координат, определив ее как совокупность фиксированной точки О с координатами (0, 0, ..., 0) и базиса ef, е2..еп. Координаты любой точки М в Еп определяются в этом случае как координаты в базисе et, е2, ..., еп вектора ОМ. Рассмотрим в Еп занумерованную систему из п векторов 1 2 п х, х, х (8.57) и рассмотрим всевозможные векторы ОМ, определяемые соотно- шениями ___ '12 п 0М = а1х + а2х+ .. . + «пх, (8.58) при всевозможных а;, удовлетворяющих неравенствам 0 1, »=1,2, ..., п. Множество всех точек М пространства Еп, определяемое соотношениями (8.58), образует так называемый n-мерный па- раллелепипед в Еп, натянутый на векторы (8.57). Ориентированным объемом V (х, х, ..., х) этого параллелепипеда называется число /12 п \ 12 П. У\х, х, ..., х) =ci,i2.. ,1пх1'Х^.. .х‘«. (8.59) При этом —координаты дискриминантного тензора в ба- ” 1. 2 п. зисе е,, е2, .... е„, ах‘',х‘>, ..?,хп—контравариантные коор- 1 2 п динаты векторов х, х, ..., х в этом же базисе. Термин «ориентированный объем» объясняется тем, что в слу- чае, если векторы (8.57) образуют правый базис, ориентирован- ный объем положителен (V >0), а в случае левого базиса — отрицателен (V < 0). Отметим, что при п = 3 ориентированный объем, вычисляе- мый для п = 3 по формуле (8.59), представляет собой обычный 1 2 з объем параллелепипеда, натянутого на векторы х, х, х, взятый 1 2 з со знаком +, если тройка х, х, х правая, и со знаком —, если эта тройка левая. 6. Векторное произведение. С помощью дискриминантного тензора можно записать в трехмерном пространстве £3 в тен-
5 31 МЕТРИЧЕСКИЙ ТЕНЗОР. ОПЕРАЦИИ В ТЕНЗОРНЫХ ОБОЗНАЧЕНИЯХ 255 зорном виде векторное произведение. Такая запись широко используется при различных вычислениях в так называемых криволинейных координатах. Пусть cijk—координаты дискриминантного тензора в данном базисе eit ег, е3 пространства Е3. Поднимем у этого тензора первый индекс i с помощью метрического тензора glm, т. е. рас- смотрим тензор 0*. Тогда координаты гВ * 1 вектора z = [xy] (т. е. векторного произведения векторов х и у) в базисе eit е2, е3 имеют вид г‘’ = с^хУ. (8.60) Так как с^х’у11 представляет собой тензор типа (0, 1), то zl можно рассматривать как контравариантные координаты век- тора. Поэтому, чтобы убедиться, что г‘ действительно пред- ставляют собой координаты векторного произведения, достаточно обратиться к какой-либо определенной системе координат и не- посредственно провести проверку. Эта проверка элементарна для ортонормированного базиса и предоставляется читателю. Соотношение (8.60) может служить основой для введения векторного произведения п—1 вектора в Еп. 1 2 п-1 Пусть х, х, ..., х—какие-либо п—1 вектор в Еп. Опре- Г 1 2 л-1-| делим координаты г1' векторного произведения £ = |_xx...xj с помощью соотношений 1 2 «-1 Z' • • X£n-i. (8.61) В соотношениях (8.61) cj[ia—координаты дискриминант- " 1 2. п-1 ного тензора с поднятым первым индексом, а х‘>, х'», ..., х‘п-1 — 12 п-1 контравариантные координаты векторов х, х, ..., х. 7. Двойное векторное произведение. Из векторной алгебры известна следующая формула для двойного векторного произ- ведения [a [bd]] векторов а, b и d [a [bd]] = b (ad)—d(ab). (8.62) Используя соотношение (8.60) и формулу (8.43) для скалярного произведения векторов, перепишем (8.62) следующим образом: ciktakclmnb'nd,n = b‘gklakd!—d‘gklakbl. (8.63) С помощью (8.63) мы получим формулу, связывающую тен- зоры clki и gik, которую в свою очередь используем для записи координат двойного векторного произведения.
256 ТЕНЗОРЫ [ГЛ. 8 Проведем следующие преобразования в формуле (8.63). В пер- вом слагаемом ^g^a^d1 в правой части (8.63) заменим Ь‘ на Ьт&т *) и индекс суммирования I заменим на п. Во втором слагаемом в правой части (8.63) положим d‘ =da6‘n и индекс суммирования I заменим на т. После этих преобразований формула (8.63) примет вид (44ш) akbmdn = (gA„6fn—gkm6‘n) akbmdn. (8.64) Так как соотношение (8.64) справедливо для любых векторов а, Ь и d, то оно представляет собой тождество относительно координат а*, Ьт и dn этих векторов, и поэтому для любых ин- дексов i, k, т, п имеет, место равенство (8-65) Обозначим через г'координаты двойного векторного произведения [а[М]]. Тогда, согласно (8.63), z‘= clkictmnakbmdn. Отсюда и из (8.65) получаем следующее выражение для координат г' двой- ного векторного произведения z' =(gftA—gkttfin)a*bmdn. " (8.66) Формула (8.66) удобна для различных приложений. § 4. Метрический тензор псевдоевклидова пространства 1. Понятие псевдоевклидова пространства и метрического тен- зора псевдоевклидова пространства. Рассмотрим n-мерное линей- ное пространство L, в котором задана невырожденная, симмет- ричная билинейная форма А (х, у), полярная знакопеременной квадратичной форме. Будем называть скалярным произведением (х, у) векторов х и у значение А (х, у) билинейной формы. Наиме- нование «скалярное произведение» условно, поскольку в рас- сматриваемом случае не выполняется четвертая аксиома скаляр- ного произведения. Именно, в случае, когда билинейная форма А {х, у) полярна знакопеременной квадратичной форме, выра- жение А (х, х) в зависимости от выбора х может иметь как положительное, так и отрицательное значение и обращаться в нуль для ненулевых векторов х. Все же мы будем пользо- ваться термином «скалярное произведение», так как это обще- принято. Сформулируем определение псевдоевклидова пространства. Определение. Псевдоевклидовым пространством называется п-мерное линейное пространство L, в котором задано скалярное произведение посредством невырожденной симметричной *) Соотношение b‘ = bmf>lm следует из свойств символа Кронекера.
s 41 МЕТРИЧЕСКИЙ ТЕНЗОР ПСЕВДОЕВКЛИДОВА ПРОСТРАНСТВА 257 билинейной формы А (X, у), полярной знакопеременной квадра- тичной форме. Число «называется размерностью псевдоевклидовапрост- ранства. Выделим в линейном пространстве L базис е2, еп и обозначим через (gzy) матрицу билинейной формы А (х, у>) вэтом базисе (напомним, что g,y=A(eit еу)). Если х‘ и у'—контрава- риантные координаты векторов х и у, то А(х, y)=gijX!yJ. (8.67) В полной аналогии с рассуждениями п. 2 § 2 этой главы доказывается, что gif представляют собой координаты тензора G типа (2,0). Этот тензор мы будем в дальнейшем называть мет- рическим тензором псевдоевклидова простран- ства. Так как скалярное произведение (х, у) равно А (х, у), то, согласно (8.67), имеем (х, y)=gijX‘yJ. Известно, что матрицу (g,y) билинейной формы А (х, у) можно привести к диагональному виду. При этом в силу невырожден- ности формы А (х, у) координаты gzy метрического тензора после приведения к диагональному виду будут равны нулю при i =И= j и единице или минус единице при i — j. Число р положительных и число q отрицательных диагональных элементов не зависит от способа приведения к диагональному виду, причем, в силу не- вырожденности формы А(х, у), p + q = n. Приведенные рассуждения поясняют обозначение для «-мерного псевдоевклидова. пространства. Естественно поставить "вопрос об измерении длин векторов в псевдоевклидовом пространстве. В евклидовом пространстве с метрическим тензором gzy квад- рат длины вектора хс координатами х‘ считается равным gijX‘xJ. Если определить квадрат длины $2 (х) вектора х с помощью соотношения ьЦх) ^gi/x'xf, (8.68) то, очевидно (поскольку форма А (х, х) знакопеременная), можно указать ненулевые векторы с положительным квадратом длины, с отрицательным квадратом длины и с нулевым квадратом длины. Поэтому, чтобы получить в качестве меры длины векторов лишь действительные числа, обычно за длину вектора принимают вы- ражение о (х) = (sgn s2 (х)) /| S2 (х) |. (8.69) В дальнейшем мы будем использовать следующую термино- логию, заимствованную из специальной теории относительности: мы будем называть ненулевой вектор х времениподобным,
258 ТЕНЗОРЫ [ГЛ. 8 если для этого вектора о (х) > О, пространственноподоб- ным, если о (х) < О, и изотропным, если ст(х) = 0. Справедливо следующее утверждение: Множество концов всех времениподобных (пространственно- подобных, изотропных) векторов, начала которых совпадают с произвольной фиксированной точкой М псевдоевклидова прост- ранства, образует конус. Для определенности докажем утверждение, рассматривая вре- мениподобные векторы. Очевидно, достаточно доказать, что если х—времениподобный вектор, то при любом вещественном Х=у=О вектор Хх также времениподобен. Так как координаты вектора Хх равны Хх‘, то, согласно (8.68), s2(Xx’) =X2s2 (х), т. е. sgn s2 (Хх) =sgn s2 (х). Отсюда и из (8.69) следует, что вектор Хх будет времениподобным. Для случая времениподобных векторов утверждение доказано. Рассуждая аналогично, убедимся в справедливости утверждения для случая пространственноподобных и изотропных векторов. Отметим, что конуе времениподобных векторов обозначается часто символом Т (от англ, time—время), а конус пространст- венноподобных векторов—символом S (от англ, space —прост- ранство). 2. Галилеевы координаты. Преобразования Лоренца. В теории псевдоевклидовых пространств важную роль играют те системы координат, в которых квадрат интервала (так обычно называют квадрат длины вектора $2 (х)) имеет вид Р п s2(x) =2 (х‘)2 — 5 (х1)2. (8.70) i=l i=p+l По терминологии, заимствованной из физики, такие системы координат называются галилеевыми. Преобразования координат, которые сохраняют для s2 (х) вы- ражение (8.70), называются преобразованиями Лоренца. В следующем пункте мы рассмотрим вопрос о преобразованиях Лоренца пространства Eflt 3), называемого пространством Мин к о в с кого. Это пространство представляет особый интерес для физики, ибо является пространством событий специальной теории относительности. Отметим, что обычно в пространстве Минковского нумерация координат вектора начинается с нуля. Таким образом, согласно (8.70), квадрат $2 (х) интервала в пространстве 3) записывается следующим образом: s2(x) = (х°)2 — (х1)2—(х2)2 — (х3)2. (8.71) Для удобства в физике координата х° отождествляется с вы- ражением ct, где с—скорость света, a t—временная переменная; х1, х*, х3 называются пространственными переменными.
$ 4] МЕТРИЧЕСКИЙ ТЕНЗОР ПСЕВДОЕВКЛИДОВА ПРОСТРАНСТВА 259 В пространстве Минковского конус Т времениподобных векто- ров распадается на две различные связные открытые компоненты Т+ (конус будущего) и Т~ (конус прошлого); конус S простран- ственно подобных векторов образует связное множество. Поясним структуру связных компонент Т+ и Т~. Для этого обратимся к физической интерпретации вектора х с координа- тами х1, 1=0, 1, 2, 3, в пространстве Ef1>3): этот вектор характе- ризуется величиной М=хй1с и вектором Дг = {х1, х2, х3}. Таким образом, рассматривая х как перемещение в E*lt 3), можно счи- тать, что это перемещение характеризуется временным Д/ и про- странственным Дг перемещениями. Времениподобные векторы х определяются условием s (х) > 0. В этом случае, очевидно, | Дг |/| Д/1 < с. Если при этом Ы > 0, то для перемещения х получим неравенство 0 < | Дг |/| Д/1 < с. Такое перемещение х принадлежит по определению Т+ и может рассматриваться как перемещение материальной частицы «в бу- дущее». Если Д/ < 0, то перемещение х принадлежит Т~ и может рассматриваться как перемещение частицы «в прошлое» (в фи- зике так интерпретируется движение античастиц). Очевидно, Т+ и Т~ представляют собой две связные откры- тые компоненты конуса Т. Проведенные рассуждения поясняют их наименования — конус будущего и конус прошлого. 3. Преобразования Лоренца пространства Е^, 3). Рассмотрим в псевдоевклидовом пространстве галилееву систему коор- динат с базисом ez. В такой системе координат квадрат интер- вала s2(x) имеет вид (8.71), а матрица (g/y) метрического тензора имеет вид /1 о О 0\ '=te‘7)=(2 _? ?). (8.72) \0 0 0 —1/ Перейдем к новой галилеевой системе координат с базисом eit и выясним условия, которым должны удовлетворять коэффи- циенты bf, матрицы В преобразования базисных векторов. Так как (8.73) и так как матрица (gt,j,) метрического тензора в базисе eit также имеет вид (8.72), то, используя формулы gi'i' ^beb'j'gij преобразования координат метрического тензора, получим сле- дующую систему уравнений для определения коэффициентов Ь}, матрицы В преобразования базисных векторов (см. (8.73); при
260 ТЕНЗОРЫ [ГЛ. в этом индексы /и I' пробегают значения 0, 1, 2, 3 (см. з (W2-2 W = i, а= 1 3 ад,-2 ь%,ь$,=о, а=1 3 ад, - 2 ь“.ь%. = а=1 т', 0' = 1, 2, 3. (8.71)): (8.7'4) —1 при у'=0', 0 при у' ^0', Соотношения (8.74) можно записать в матричной форме. Для этой цели рассмотрим наряду с матрицей В матрицу В*, кото- рая получается из В путем изменения знака у элементов послед- них трех столбцов и последующего транспонирования. Очевидно, соотношения (8.74) можно записать в следующей форме: - B*B = J, (8.75) где матрица J определяется соотношением (8.72) (для сравнения напомним, что матрица С ортогональных преобразований евкли- дова пространства удовлетворяет соотношению С'С = 1, где /—единичная матрица). Так как det В* = — det В, a det 7 =—1, то из соотношения (8.75) следует, что det В*В = det В* det В = — (det В)а ——1, т. е. detB = ±l. (8.76) Обозначим через L совокупность всех общих преобразований Лоренца пространства Минковского. Из этих общих преобразо- ваний выделим те преобразования, которые переводят каждый вектор из Т+ в вектор, также принадлежащий Т+. Совокупность таких преобразований обычно называется преобразова- ниями Лоренца пространства £?1я а) и обозначается символом £|. Общие преобразования Лоренца, для которых det В— -|-1, образуют класс £+ так называемых собственных п р е о бра- зов а н и й Л оре н ца. Класс £_ несобственных преобразований Ло- ренца характеризуется соотношением detB = —1. Примером такого преобразования может служить отражение относительно трех пространственных осей: х1^— х1, х2' = —х2, хя' = — х3. Пусть В—матрица произвольного несобственного преобра- зования Лоренца, а Р— матрица только что рассмотренного
$ 4) МЕТРИЧЕСКИЙ ТЕНЗОР ПСЕВДОЕВКЛИДОВА ПРОСТРАНСТВА 261 отражения. Очевидно, произведение произвольного несобствен- ного преобразования >и рассмотренного отражения будет собст- венным преобразованием с матрицей В' = РВ.. Так как P2 = P-P = f, где I — единичная матрица, то В = Р2В = Р(РВ) = РВ’. Таким образом, всякое несобственное преобразование Лоренца является произведением некоторого собственного преобразования с матрицей В' и отражения с матрицей Р. Пересечение множеств Z_t и L+ обозначают символом . Некоторые групповые свойства множеств £, L^,L+ и будут рассмотрены в следующей главе. В заключение найдем те преобразования , которые не ме- няют координат х2 и х3. Ясно, что это будут преобразования двумерного псевдоевклидова подпространства с координатами х9 и х1, в котором квадрат интервала вычисляется по формуле (х0)2— (х1)2. Запишем для рассматриваемого случая формулы (8.74). По- лучим m2-(^)2=i, у ЭДА°,_ад, = 0, > (8.77) ш2-т2=-п J Полагая &а,/Ь9,=$, найдем из (8.77) следующие выражения для коэффициентов bf, матрицы преобразования В базисных векторов е0, elt е2, е3 в базисные векторы е3,, е1Ч е2,, е3>: М, = ± -L= , Ь\, = ± -7^=. К' = ± Ь1' = ± ~7^=^ • 0 }<1 — рг /1 —р2 /Г—Р2 /1 — р2 В этих формулах знак выбирается из условия принадлеж- ности преобразования Лоренца классу . Не вникая в детали вычислений, запишем окончательные формулы преобразования координат: = = , х2'-х2 ,,х3'=х?. (8.78) К1 — Р2 К1 — р2 , Положим-в соотношениях (8.78) х° = с^,*х1==х, х2 — у, x3=z, x9' — ct', х1' =х', х2' — у’, xs'^=z'. Тогда формулы (8.78) перепи- шутся следующим образом: У= -Г х' = ~-^Ш-, у'=у, z' = z. (8.79) У 1-р2 ’ /1-Р2 .
262 ТЕНЗОРЫ [гл. а Выясним теперь физический смысл константы 0. Допустим, что точка Р неподвижна в системе координат (Р, х', у', г'). Это означает, что время V меняется, а пространственные координаты х', у', г' этой точки постоянны. Исследуем вопрос о поведении точки Р относительно системы (t, х, у, г). Дифференцируя по- следние три уравнения (8.79) и учитывая, что dx' = dy' = dz’ = О, получим 0==-§c£+rfr 0==J 0 = dz. /1 —pa * Поэтому •£=₽c, >=o, *=o. Следовательно, всякая точка P, неподвижная в системе коор- динат (/', х', у’, г') (а следовательно, и вся эта система коор- динат), движется относительно системы (t, х, у, г) с постоянной скоростью v = fic в направлении оси Ох. Итак, fi = v/c, где v—скорость движения системы (/', х', у', г') относительно системы (х, у, z, t). Отметим, что так как 0 < v < с, то 0 < р < 1. Перепишем теперь следующим образом формулы (8.79): t , f __ с2 %,__________ —vt-\-x V (8.80) у' = у, z' = z. Формулы (8.80) представляют собой формулы перехода от инерциальной системы (t, х, у, г) к другой инерциальной системе (Г, х', у', г'). Эти формулы называются формулами Лоренца. § 5. Тензор момента инерции Рассмотрим твердое тело, закрепленное в точке О. Пусть г =ОМ.—радиус-вектор точки М этого тела, v — скорость точки М. Как известно, момент импульса N определяется соотно- шением У = J [rv]dm, v где V—объем тела, dm=^pdV (р— плотность тела).
ТЕНЗОР МОМЕНТА ИНЕРЦИИ 263 S Б] Обозначая через N‘ — контравариантные координаты вектора V и используя формулу (8.60) для векторного произведения, получим = \clklrkvldm (8.81) (напомним, что. clki=giscskl, где csbl — координаты дискриминант- ного тензора в данном базисе пространства Е3, см. п. 6 § 3 этой главы). По теореме Эйлера существует мгновенная ось вращения тела. Обозначая через вектор мгновенной угловой скорости, получим ® = Снова обращаясь к формуле (8.60) для век- торного произведения, найдем vl = с1рп<аРгп. (8.82) Подставляя найденное выражение vl в правую часть (8.81) и учитывая независимость а>р от переменных интегрирования, получим следующее выражение для N‘: N1 = clkiCpnrkrn()>p dm = § (/k!Cpnrkrn.dm = aPJ^. (8.83) v и Тензор Jp = $ dm, (8.84) v фигурирующий в правой части соотношений (8.83), называется тензором момента инерции. Преобразуем выражение (8.84) для тензора момента инерции. Для этой цели обратимся к формуле (8.65). По этой формуле имеем — gbifip Поэтому Jp = $ (g*nSp—gkjM) r"rkdm. (8.85) v Если в выражении (8.85) опустить индекс i с помощью мет- рического тензора, то в результате получим часто используемую формулу для координат дважды ковариантного тензора момента инерции: = (r2giP— г(ГР) dm. (8.86) v Тензор момента инерции широко используется в механике твердого тела. Для примера запишем с помощью этого тензора
264 ТЕНЗОРЫ 1ГЛ. в выражение для кинетической энергии Т. Имеем = у ^gijvWdtn. V V Но поскольку = выражение для Т примет вид т = у у gij^pnciifaPr^r^m. = у соЛй* у gijClpnci!trnrldm. V ' V Отсюда, согласно (8.84), найдем Г = у ©/*©* Jp/t.
ГЛАВА 9 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП В этой главе будут изложены основные понятия теории групп и указаны некоторые приложения этой теории. Важность теории групп определяется многочисленными ее приложениями в физике. § 1. Понятие группы. Основные свойства групп 1. Законы композиции. Будем говорить, что в множестве А определен закон композиции, если задано отображение Т упорядоченных пар элементов из А в множество А. При этом элемент с из Л, поставленный с помощью отображения Т в соот- ветствие элементам а, Ь из А, называется к ом п оз и ц и ей этих элементов. Композиция с элементов а и Ь обозначается символом аТЬ: с = аТЬ. Для композиции элементов а, Ь множества А используются и другие формы записи. Наиболее употребительными являются аддитивная форма записи с =а-\-Ь и мультипликативная форма записи c —ab. В случае аддитивной формы записи композиции соответству- ющий закон композиции обычно называется сложением, а при мультипликативной форме — умножением. Закон композиции называется ассоциативным, если для любых элементов а, Ь, с множества А выполняется соотношение аТ(ЬТс) = (аТЬ)Тс. Закон композиции называется коммутативным, если для любой пары а, А выполняется соотношение аТЬ ~ЬТа. Элемент е множества А называется нейтральным отно- сительно закона Т, если для любого элемента а множества А
266 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ. 9 выполняется соотношение аТе = а. Примерами законов композиции могут служить обы